Skip to content

AI 十年浮沉,與改變命運的大模型

b69ce70987cecc56cb6883f20f80e87d

2019 年,前穀歌 CEO 埃裏克 · 施密特向白宮遞交了一份頗為 ” 詭譎 ” 的報告。這份長達 750
頁的文件,核心觀點其實隻有一句話:若美國再不加大投資,中國將徹底主導 AI 領域 [ 1 ] 。

施密特此舉其實有 ” 騙經費 ” 之嫌:一年前,穀歌曾迫於輿論壓力退出了一個政府 AI
項目,他一直對此耿耿於懷。但報告本身卻並非胡謅。同年,美國數據創新中心也發布了一份報告,聲稱中國 AI
實力全球第二,且在數據等層麵比美國更具優勢 [ 2 ] 。

在全民追趕 GPT 的今天,這則舊聞讀起來頗有幾分 ” 魔幻感 “。

3a7fc7362a8d18a35ffcd97127a72aaf

報告甚至上升到了 ” 國家安全 ” 的高度

然而,施密特口中的AI,與如今人們談論的GPT並非一個東西。

以 GPT 為代表的
AI,指的其實是大模型。它擁有生成圖像、音頻、視頻等內容的能力,像是個文藝青年。但彼時讓美國人深感威脅的,多指識別型
AI(小模型)。它擅長各類數據分析工作,如同一個木得感情的運算機器。

大模型走紅前,識別型 AI 曾被寄予了太多改變世界的厚望,在中國催生了一段群雄並起、熱錢湧動的黃金歲月。巔峰時期,中國 AI
初創企業的融資金額甚至超過了美國——李開複將其形容為 ” 有三個 AI 專家就能估值 7 億、靠 AI 概念就能忽悠投資人
“,也不怪美國人感到焦慮。

隻是好景不長:後來 VC 陸陸續續退出,曾經風頭無兩的獨角獸也褪去了身上的光環,殘暴的歡愉最終以殘暴終結。

對此,百度集團執行副總裁、百度智能雲事業群總裁沈抖曾打過這麽一個比方:大模型出現前的AI像是氧氣——本身很有價值,但自己不會燃燒,必須找到可燃物才能把價值給發揮出來。這裏的
” 可燃物 “,指的是落地場景。

AI 起起落落這十年,成也場景,敗也場景。

舊範式的困境

2016 年,穀歌 AlphaGO 不僅徹底顛覆了圍棋,也改變了當時的 AI
創業。一時間,VC、科學家、大學教授,乃到各路鄉鎮企業家,無一不在談論著 AI 商業化的可能性。短短一年時間,國內誕生了 528 家
AI 企業,催生 371 起 AI 投融資,同比漲幅達到了 38.9%;同一時間,中國 AI 企業申請了 9000 多項 AI
專利,幾乎是美國新增專利數的兩倍有餘 [ 3 ] 。

不過,整個行業閉眼狂奔的同時,鮮有人會注意到初冬的號角已經悄悄吹響。2019 年,繁榮戛然而止。

首先是融資遇冷:這一年的 AI 融資金額僅有 186 億元,相比 2018 年直接腰斬了一個 0。受此影響,AI
初創企業的數量也大幅縮水,僅有鼎盛時期的 1/20。至於那些從競爭中幸存、成功 ” 上岸 ” 的 AI
企業,其財務狀況仍舊慘不忍睹。據不完全統計,近九成 AI 企業都處於嚴重虧損的狀態 [ 4 ] 。

2bccdf09fe805884f149671435517f26

大起大落背後,是AI長期以來的產業化困境。

2021 年之前,業界三大主流 AI 技術分別是計算機視覺、語音識別、自然語言識別,本質都屬於識別型
AI。單從技術層麵來看,上述技術都具備著充分的下遊應用空間,想象力充足。

例如在 “AI+ 安防 ” 領域,2020 年時已有 453 億元的市場,且增速可觀,預計到 2025 年時市場規模將再翻一番
[ 6 ] 。

可下遊需求不斷擴大,並無法拯救虧錢的 AI 企業。識別型 AI
的技術特點,決定了它是一門技術、投入與產出不成正比的生意。

識別型 AI 采用的是小模型——這是一種專為特定任務而生的技術。在實際訓練小模型時,研究員隻需給 AI
灌入標注過的特定數據,便能讓 AI 獲得對應的能力。如果想要一個能抓 ” 闖紅燈 ” 的
AI,那麽無需教它語文數學,隻要讓它從小學習各種闖紅燈的視頻即可。

小模型的優點在於簡單、高效,專用向的 AI 能夠很好地完成對應任務。但其缺點同樣明顯:由於沒學過其他知識,一個 AI
隻能解決一個問題。譬如一個抓闖紅燈的 AI,顯然不會具備識別超速、違規變道的能力。

d8650f78b7ab7d72882cd3ae50c293ad

識別不同元素需要不同的標注數據

由於小模型不具備通用性,導致識別型AI隻能成為一門類手工作坊的定製生意。

且具體到實際應用中,一個需求有時還需要定製不止一個 AI。例如在工業領域,在製造冶金鋼卷時有缺陷檢測這一步驟。如果將這項工作交由
AI,定製起來其實相當麻煩。因為鋼卷分為冷軋、熱軋,所以 AI 企業需要同時用 ” 冷軋 – 合格 “” 冷軋 – 缺陷 “” 熱軋
– 合格 “” 熱軋 – 缺陷 ” 四組數據訓練四遍 [ 7 ] 。其繁瑣程度,與 ” 五彩斑斕的黑 ” 有的一拚。

定製需求繁瑣的同時,對人力要求還不低——這活兒可不是月薪三千的大學生能幹的。

出於業務需要,頭部 AI 企業都聘請了大批科學家、博士生與教授作為研究員,而 AI 研究員又是出了名的 ” 高薪崗位
“。2015 年,穀歌為了不讓知名研究員伊利亞(Ilya Sutskever)跳槽,曾開出過 200 萬美元 /
年的高薪——後來桑達爾 · 皮查伊繼任穀歌 CEO 時,其基本工資是同一個數字。

財新曾對國內 AI 企業招股書做過一筆測算,發現:它們每掙 1 塊錢,就要花掉 0.75 元的人力成本。再算上定製 AI
的算力、數據開銷、以及其他成本,幾乎做一單虧一單。

人們這才驚奇地發現,AI 這門生意似乎遠不如想象中那麽性感。

陷入死局後,AI 企業們隻能寄希望於一場 ” 推翻重來 ” 式變革。幸運的是,沒過幾年,暴風雨真的來了。

通用性的價值

紅杉資本率先嗅到了風雨欲來的氣息。2022 年 9 月,紅杉發表了文章《Generative AI: A Creative
New World》,預言一場全新的科技競賽即將來臨。投資人同行很快聞風而動,一度冷清的 AI 圈再度人聲鼎沸。

這篇文章發布僅半年,有頭有臉的科技公司們幾乎全部一頭紮進了 AI 浪潮之中,要用人工智能把每個行業都重新做一遍。

例如當下火熱的直播行業,大模型應用的空間就相當廣闊。對於那些養不起專業直播團隊的商家,如今隻需輸入商品信息,百度的文心一言能夠自動生成話術、配音以及數字人主播,直接包攬了整個流程。

企業無需再花錢雇主播、想話術、搞培訓,能輕鬆實現 7*24 小時直播,對中小企業而言無疑是個重大利好。

在沈抖看來,大模型創業帶來的眾多機會,將帶動數字化經濟更進一步,有機會在全球範圍內掀起一股產業再造的浪潮。

他認為,隨著大模型深入數字經濟,更多產業會出現新的改變。智能化不僅讓整個生產流程大幅提效,也改變了很多原有的生產關係,包括人和人、人和設備、人和係統的關係。以前沒有智能時,很多工作實際上是靠人來操作;有了智能以後,機器、設備、係統都可以按照人的思想去學習。

未來的工作模式,很有可能是一個聰明的人去指導一堆機器人。這些機器人執行人類的決定,重塑整個生產線。沈抖說道,” 生成式 AI
已經形成全球性的‘ AI 再造業務’趨勢,企業迎來‘智能化躍遷’的曆史機遇。”

AI 產業能夠二度迎來春天,背後其實是大模型技術邁向成熟。

這場變革的起點發生在 2017 年:彼時,穀歌幾位研究員公開了深度學習模型 Transformer。以此為基礎,OpenAI
等機構開始嚐試研究大模型,一種不同於識別型 AI 的全新技術。

其研究成果,正是如今備受關注的 GPT,即 Generative Pre-trained Transformer(生成式預訓練
Transformer)。

眾所周知,一個 AI 由模型、數據、算力三要素構成。相比於傳統的識別型 AI(小模型),以 GPT
為代表大模型在數據、模型等方麵均有不同程度的革新,賦予了大模型更強的通用性。這恰好改善了小模型時代的產業化痛點,AI
實現即插即用。AI 企業終於能擺脫手工作坊般的生產模式,有機會變成一門好生意。

大模型的這一價值,幾乎吸引了全球所有的目光。連早已退休、專心搞慈善的比爾蓋茨,都為此興奮不已。他在一篇文章中寫道,自己有幸親曆了人類可能最重要的兩場革命的開端:第一次發生在
Windows 萌芽、PC 市場剛剛興起的 80 年代,而第二次正是去年——大模型剛剛開始湧現的時候。

而沈抖認為,作為 ” 通才 ” 的大模型還催生一種全新的產業化路徑:MaaS(Model as a
Service),模型即服務。”
根據我們提供的文心一言的大模型服務,企業能夠以此為基礎,結合他們所在行業去微調出一個行業大模型,再用這個行業大模型去服務整個行業。”

未來,大模型可能會成為一個類似於安卓的 ” 超級底座 “,
每個行業都迎來AI再造的機會,並給應用端帶來大量的機會。

而在美國,已經誕生了依托於大模型開展業務的獨角獸。在德克薩斯州,一家初創企業憑借微調後的 AI 應用,在短短 18
個月時間做到了 15 億美元估值,年收入已有 3000 萬美元,比直接做大模型的企業還賺錢 [ 10 ] 。

不過,產業化潛力僅僅是大模型價值的一個方麵。不同於過去兩年流行的元宇宙、Web3
等概念,大模型帶來了實打實的生產力提升。

例如長安汽車在參與百度文心一言的邀測時,就體驗了一回大模型的生成 PPT 功能。過去,製作一份 PPT
通常要花費半天甚至一天時間;如今,隻需三分鍾即可做出一份內容齊全、格式精美的 PPT。未來,機械的重複性工作將完全可以交給
AI,員工可以集中於創造更大價值的工作,企業競爭力增加同時增加社會財富。

b7b87f2934980d9f2c1997043e495ba7

百度智能雲舉行的閉門溝通會上,現場演示文心一言生成 PPT

毫無疑問,大模型將是未來十年科技圈最重要的敘事之一。

百模大戰

” 百模大戰 ” 來了,一如當年的 ” 百團大戰 “。

國內大公司紛紛紮堆推出大模型,百度文心一言最先,360、騰訊、阿裏、商湯、科大訊飛、字節等紛紛緊追。大模型產品大多同時兼具對話問答、文章創作、代碼寫作等多項技能。市場上供給多了,但這些產品的
” 智力 ” 水平卻參差不齊,如何挑選成為了一個難題。

目前主流觀點認為,可以有以下兩個標準:

第一,從芯片到框架、模型再到應用的全鏈路環節都具備極為優秀的性能。

芯片決定了算力,這是 AI 訓練的基礎。OpenAI 曾做過一筆測算:2012 年開始,全球 AI 訓練所用的計算量平均每
3.43 個月便會翻一倍,遠超摩爾定律。在肉眼可見的未來,” 算力不足 ” 都將會是製約 AI
發展的最大因素。因此,芯片要做到性能過硬。

隻有製造出算力極強的高端芯片,才能滿足智算時代的計算需求,讓雲好用,這是基礎條件。

而在框架和模型層麵,軟件適配程度要更高,算法積累足夠,大模型能力要更強。深度學習框架需要做到全棧自主可控,推動大模型不斷迭代升級。在此基礎上,推出多樣雲服務使得大模型適應各產業的數字、智能化需求,做好模型即服務(MaaS)。

第二,能為大家提供全鏈路的服務保障。

服務商不僅要具備多元的能力,還需要將它們有機地結合起來:如此一來不僅能帶來更高的可靠性、幫助企業降本增效,還降低 AI
使用門檻,既易用,又好用。

好的智算基礎設施,就是要高效解決算力、算法、數據處理等多維度的問題,而且這些維度之間不是獨立存在的,而是互相依賴,相互優化、緊密耦合,從而提升整體基礎設施效能。

比如芯片解決算力問題,框架解決算法開發問題,大模型解決模型泛化問題,他們三者就猶如三人四足比賽中的團隊合夥人,隻有彼此心有靈犀、協調互補,才能打出完美的團隊配合,贏得比賽勝利。

百度的解決方案,是將文心一言大模型與百度智能雲服務結合起來,提供一種更便捷的一站式服務,即 ” 雲智一體 “。

該方案同時提供了算力與大模型服務,企業隻需提供自身行業的數據做微調,即可快速生產出符合市場需求的 AI
產品。不過,百度智能雲能做的還不止微調一項,它還額外集成了推理與托管服務。

推理是大模型所具備的一項能力,指利用訓練好的 AI
去進行結論推導的過程。如果說微調是將已有的房子重新裝修一遍,那麽推理則相當於給你空地和材料,搭建一個全新的房子。雖然推理的成本高於微調,但能讓大模型新增更多原本不具備的能力,滿足企業更深層次的開發需求。

至於托管,則能幫助較為早期的大模型創業者解決搭建團隊的難題。高薪的 AI
研究員一直是市場上最搶手的資源之一,初創企業不僅資金有限,且很難在人才競爭中獲得太多優勢。相比之下,托管服務則會提供一支高度專業的團隊,幫助第三方企業管理他們的
AI 解決方案。

由此可見,微調、推理、托管三大服務的功能各不相同,能夠滿足不同階段企業的需求。

如今,上述 ” 雲智一體 ” 服務已成為一種行業共識。百度智能雲作為這一概念的提出者,具備一些獨有的優勢。

2022 年,百度副總裁沈抖升級了原有的架構,正式對外官宣了 ” 雲智一體 3.0″。該架構的優勢在於,形成了 ” 芯片 –
框架 – 大模型 – 行業應用 ”
的智能化閉環路徑,百度是全球唯一在每一層都有自研產品的公司。比如芯片層有昆侖芯,框架有中國市場份額第一的飛槳。

沈抖認為,四層架構的高效協同,能實現更高的運轉效率,” 我們能在同等算力投入下,把某個應用的性能提高
100%,相當於讓算力需求降低了 50%。” 這是百度智能雲非常獨特的優勢,也使得百度智能雲成為國內第一個訓練出大模型的雲。

如今,” 雲智一體 ” 不僅僅隻是一項服務,更有可能成為數字時代的一種新基建。經濟學博士任澤平曾在 2023
年跨年演講中預測,智能雲將成為數字經濟的重要技術支撐,並在未來 20 年成為支撐中國經濟繁榮發展的新型基礎設施。

對當今社會而言,這些變化既是將來時,也是進行時—— AI
正在以肉眼可見的速度重塑這個社會。對此,輿論上充斥著許多不安的聲音。不過,當時代的浪潮撲麵而來,企業、個體最好的選擇,隻有擁抱它。

尾聲

不論是紅杉資本還是黃仁勳,都喜歡將當下稱為 “AI 的 IPhone 時刻 “。

初代 IPhone 發布於 2007 年。彼時,摩托羅拉、諾基亞才是手機市場的霸主,張小龍還在忙著做 QQ
郵箱,百度搜索的網頁訪問量每天都在增長,沒人知道世界上第一款智能手機到底會帶來些什麽。

然而,當喬布斯講出那句 ” 今天,蘋果將重新發明手機 ” 時,世界依舊為之沸騰,變革的伏筆已經埋下。相比於市麵上的其他產品,初代
IPhone
的革新之處其實隻有兩個方麵:一是取消了鍵盤,改用觸屏設計;二是借鑒了電腦的設計,嚐試在手機中加入瀏覽器、股票、天氣等應用。

10 年之後,初代 IPhone 的這兩大設計已然成為了智能手機的設計標準,以此構建的移動互聯網改寫了數十億人的生活。

沈抖曾在采訪時提到,初代 IPhone
的出現,將手機分成了兩類:智能手機與非智能手機,而非智能手機最終被淘汰了。大模型出來後,同樣會把企業分成兩類:一類是智能企業,一類是非智能企業——類似的故事有可能會再次上演。

關於大模型的未來,如今看來仍有些模糊,但唯有一點是確信的——新時代的序幕正緩緩拉開,一場重新定義時代的比賽已經開始。