Skip to content

百度文心一言:中國領頭的AI 到底實力如何?

文心一言,百度的新故事?- DoNews

2 月 23 日電 前 Google 高級資深研究員吳軍有一部著名的小說《浪潮之巔》,其中寫道,”
總有一些公司很幸運地、有意識或無意識地站在技術革命的浪尖之上,在長達十年甚至幾十年的時間裏,他們代表著科技的浪潮,直到下一波浪潮的來臨。”

這樣的公司,站在了浪潮之巔。

當眼下這波由國外 ChatGPT 引發的科技浪潮向中國席卷而來,人們也在 ” 眾裏 ”
尋找,誰能做出中國的大語言模型?誰會站在新的浪潮之巔?驀然回首處發現,百度具備這樣的綜合實力。

百度也積極地對市場關切給予了回應。2 月 7 日,百度確認生成式 AI 產品命名為文心一言 ( ERNIE Bot ) ,並將在
3 月份推出。很快,22 日,百度在 Q4 及全年財報發布當日宣布,計劃將多項主流業務與文心一言整合。

摘明珠的人

百度文心一言站在浪潮之巔,也在驀然回首處,對這句話的理解,要從兩方麵。

作為 AIGC ( 人工智能生成內容 ) 最成功的應用,ChatGPT 本身是一款自然語言處理 ( NLP ) 大模型。而
NLP 被稱為 ” 人工智能皇冠上的明珠 “,誰能實現自然語言處理技術的突破,誰就能在 AI 領域一騎絕塵。

百度已經摘到了這顆明珠,站在了浪潮之巔。

而之所以身處驀然回首處,則是因為百度這個 NLP 領域已經默默深耕了許多年。

早在 2000 年百度誕生之時,準確說從百度處理用戶的第一次搜索開始,NLP
技術就成為搜索技術的重要組成部分,並伴隨著百度的快速發展,同步甚至更快地發展壯大。

2010 年初,百度對 NLP
的工作進行了重新梳理與規劃,百度自然語言處理部正式成立,並不斷在語音、圖片等技術上布局,敲定了在知識圖譜技術上長期投入的戰略。

2019 年 3 月,百度提出知識增強的語義理解框架
ERNIE,在深度學習的基礎上融入知識,同時具備持續學習能力,曾一舉登頂全球權威數據集 GLUE 榜單,首次突破 90
分大關,刷新榜單曆史。

也就是從 2019 年開始,業界進入開放域對話大模型的研究,這個技術讓生成式對話有了質的提升。

2021 年 9 月,百度發布了 PLATO-XL,這是全球首個百億參數的對話大模型,一舉超過 Facebook
Blender、穀歌 Meena 和微軟
DialoGPT,成為全球首個百億參數中英文對話預訓練生成模型,再次刷新了開放域對話效果,打開了對話模型的想象空間。

當市場驚訝於百度能以如此快的速度向用戶推出文心一言時,知情者才知道百度這種底氣來自於強大的 NLP 技術實力。

你無我有,你有我強

除了強大的 NLP 技術實力加持,百度快速推出中國大語言模型文心一言,其他工作絕不是從零開始。

當人類進入人工智能時代後,IT
技術的技術棧就發生了根本性的變化。過去基本分為三層:芯片層、操作係統層和應用層。現在可以分為四層:芯片層、框架層、模型層和應用層。

而對於百度而言,其在芯片、框架、模型、應用四層技術棧均有布局,又得益於這四層技術棧,大語言模型相關技術,百度在中國乃至全球範圍均具有綜合優勢。

具體的,在芯片層麵,百度自研 AI 芯片 ” 昆侖 ”
已在多場景實際部署幾萬片,在百度搜索業務中也已形成較強工程化實踐,這讓文心一言底層算力有所保證。

在框架層,飛槳深度學習平台下接芯片上承應用,提供了從便捷開發、高效訓練到滿足多端多平台推理部署的全棧能力,大幅提升了 AI
深度學習模型的研發效率。

在模型層,百度的文心大模型和 Open AI 的 GPT 模型類似,並在 2019
年就已經推出,迄今已經迭代了多次,從單一的自然語言理解延申到多模態,包括視覺、文檔、文圖、語音等多模態多功能,且已在行業得到普遍應用。因此文心一言所基於的
ERNIE 係列模型也已經具備較強泛化能力和性能,足夠為用戶提供相應的服務。

在應用層麵,百度深度學習技術與場景融合創新,應用場景日漸豐富,人工智能技術與實體經濟也加速融合。此外,還催生了一批新業態新模式,有望深刻改變人類生產生活方式和思維模式,實現社會生產力的整體躍升。

其實不難發現,當科技浪潮席卷而來,百度之所以能站在浪潮之巔,很重要一個原因來自於超前布局,早期的投資奠定了百度在人工智能浪潮中的有利地位,也讓百度在市場競爭中掌握先機和主動權,成為中國人工智能市場長期增長的最佳代表。最新財報顯示,2022
年百度核心研發費用達到 214.16 億元,占百度核心收入比例達 22.4%。

3745ecb73e083262ce468102126c2ae2

看得最遠的地方

雖然這股科技浪潮由 ChatGPT 而起,但必須理性認識到,ChatGPT 並不是革命性的技術。直接點說,ChatGPT
並未實現底層模型的顯著突破,它基於人類反饋進行強化訓練,給人帶來了一種更加智能的感覺。

而百度實際上正在思考更遠方的問題,即如何把技術做成人人需要的產品,讓人們從中受益。

百度創始人李彥宏曾說:”ChatGPT 是 AI
技術發展到一定階段後的新機會。怎麽把這麽酷的技術,變成人人需要的產品,讓每天有幾億人從中受益?怎麽賦能千行百業,讓他們的生產效率大幅度地提升?這一步才是最難的,也是最偉大、最能夠產生影響力的。”

這也就預示了,實際上也是可期待的,百度文心一言,要走比 ChatGPT 更遠的路。

在發給百度全員的財報信中,李彥宏還重點介紹了將在三月份推出的生成式 AI 產品文心一言 ( ERNIE Bot )
,宣布計劃將多項主流業務與文心一言整合,包括搜索、智能雲、Apollo 自動駕駛、小度智能設備等。

以搜索業務為例,文心一言推出後,將與目前以 ” 知一 “” 千流 ”
為代表的搜索引擎相互協作,共同為用戶提供服務。可預見的是,與傳統的搜索引擎相比,接入文心一言後的百度搜索,可以提供更加智能化的答案,免去用戶從上到下依次點擊鏈接進行確認的步驟。而這一變化也有望為百度,甚至為整個互聯網行業帶來收入形式的革新,並擁有極大的想象空間。

此外,百度將開放文心一言大模型,支持更多企業構建自己的模型和應用,賦能交通、能源、製造等實體經濟領域,實現生產效率的大幅提升。

在不久的未來,因為文心一言,AI 市場將迎爆發式需求增長。

此外,還有一個容易忽視的細節是,文心一言所基於的文心大模型,是地地道道的本土化的 AI
模型,具備對中文、甚至中國文化的更深理解,這意味著文心一言會更適合中文和中國市場。

而且,隨著 ERNIE Bot
的公眾開放,有望建立起立真實的用戶調用和模型迭代之間的飛輪,模型將越來越聰明,給用戶帶來更加聰明的體驗。


探索更多來自 華客 的內容

訂閱即可透過電子郵件收到最新文章。