Skip to content

搜狗創始人王小川:失業算個啥?

劃重點

1.機器掌握語言後就跟人一樣了,因為通過語言我們才能建立對世界的認知,才能夠去思考,才能夠理解文化,也才能夠進行溝通,所以今天重大的突破就是反過來,不是讓機器脫離人去學習,而是向人類已經有的文明學習。

2.有了ChatGPT之後,可以接受把它當做人類文明的一部分,要有一種大我的想法,也許有一天人類從肉身裏麵已經消亡了,但機器文明很發達,那也是人類文明的一個延續,是我們自然的一個進化。

3.我更擔心的是未來巨頭因為用不好機器,使得機器帶來了文明的毀滅,這是我們需要擔心的事情,就像核彈毀滅了世界一樣的,大家可能最終聚焦在沒有控製它,之後不僅是人的滅亡,也是人類文明的滅亡。

4.中國AI大模型比美國大概晚了兩三年的樣子。追上ChatGPT3.5的話,我覺得今年內可能就能夠實現,但對於GPT-4,我認為可能需要3年左右的時間,應該不會低於兩年。

1000

作者丨葉蓁

編輯丨康曉

出品丨深網·騰訊新聞小滿工作室

王小川讀研究生的時候,就建立了以生物為基礎的思考模式。“一個DNA的雙螺旋結構,在變成人的過程當中經曆了無數多複雜變化,經過了混沌的過程,最後生命才能創造這種有序,但這個事情用傳統的數學物理還無法解釋。”

這個認知影響了王小川的世界觀。對王小川來說,看到生命的有序性後,再看其發展的軌跡,既有自由意誌,也有命中注定。王小川認為,在時間的先後裏麵,人們隻是看不見未來而已,也許結果早已注定。

“隨著量子力學的發展,人的生命到底是注定的,還是能夠被掌控的,有了一些新發展。ChatGPT把我們從日常繁瑣的勞碌中解放出來,使我們有更多的時間去回答‘我是誰’的問題,當工具越來越強大的時候,我們越能找到自己。”王小川告訴騰訊新聞《深網》。

離開搜狗的一年半時間,王小川主要在思考用數學模型研究生命科學的難題。“生命的複雜性遠超物理世界,牛頓把物理問題變成了數學問題,但生命科學領域至今做不到。”2021年,DeepMind發布了AlphaFold蛋白質結構數據庫(AlphaFold
DB) ,王小川認為,“生命科學領域這個突破隻是解決了一小段問題的數學化。”

ChatGPT的橫空出世為王小川打開了另一個路徑。難掩興奮感的王小川告訴《深網》,“當我發現語言可以變成數學問題,這個模型未來也能承接對生命的探索,會成為突破生命科學的一個支點。”

王小川認為,ChatGPT已經是一個初級的通用人工智能。“NLP自然語言處理是人工智能皇冠上的明珠,語言包含的內容要去理解它是個特別大的難題。ChatGPT巧妙的是找到了新方法,這個模型掌握了人類的語言,讓機器向人類已有的文明學習。當機器掌握語言之後,強人工智能可能就到來了。”王小川進一步解釋。

“有了ChatGPT之後,可以接受把它當做人類文明的一部分,要有一種大我的想法,也許有一天人類從肉身裏麵已經消亡了,但機器文明很發達,那也是人類文明的一個延續,是我們自然的一個進化。”王小川告訴《深網》。

在王小川看來,人活著的意義就是存在,AI能夠幫助人得到更大的永恒。“人類文明被機器取代了,我們早晚會接受這個事實,就像我們的孩子比我們強一樣;我更擔心AI巨頭因為用不好機器,使得機器帶來了人類文明的毀滅,就像之前核彈可能毀滅世界一樣。”

對於ChatGPT學習人類的創作能力,王小川認為,未來可能會創造一個太虛幻境,以遊戲和電影為核心場景,讓人非常舒服和享受的沉浸在裏麵,它雖然有很大的意義,但不是其追求的方向。“我更希望AGI有知識,讓人能夠更好的和世界連接,去解決真實的問題。當它去給人做服務的時候,就把人給解放出來,回到了人本主義。”

4月10日,王小川正式對外宣布開啟人工智能大模型領域創業,與前搜狗COO茹立雲聯合成立人工智能公司百川智能,旨在打造中國版的OpenAI基礎大模型及顛覆性上層應用。百川智能早前已獲得5000萬美元啟動資金,來自王小川與其業內好友的個人支持。

王小川認為,創業公司雖然在人才團隊、資金密度跟大廠沒有可比性,但是在麵對未來方向時候,有可能去做大廠做不到的這種顛覆性的大產品。

以下是《深網》對話王小川實錄,在不影響原意的基礎上有所刪減:

“機器掌握語言後,強人工智能就來了”

《深網》:全球這麽多科技巨頭,為什麽它們沒做出ChatGPT?

王小川:深度學習發明之後,阿爾法狗已經給我們巨大的信心,用深度學習方法可以讓機器產生一定的智能。之後我們開始追求通用人工智能(AGI,Artificial
General
Intelligence),不隻是下棋的問題,這方麵我們之前的探索路徑,在美國是Deepmind、OpenAI,以打遊戲的方式,使得機器通過遊戲中的輸贏來建立它的智能。

阿爾法狗最早的版本是讓它先學人類的棋譜,然後開始忘掉人類的棋譜,從零開始去學習這樣一種智能,這是科學家所追求的一種方式。那之後又讓他去學習打德州,打星際爭霸,也是沿用了一個讓機器自己產生智能的方式,這種方式的話確實在這麽多年裏麵還沒取得一個通向AGI的突破。

而另外一條道路,不是讓機器忘掉人之前的知識和經驗,是讓機器學習人類以前的知識經驗,就是通過語言的方式能夠學習世界上整個全球互聯網上優秀的語言內容,就走了一個截然相反的路線,以前的做法是讓機器忘掉人的智慧,然後超越人,今天的做法是讓機器學習人。今天這樣一個突破,我們稱為大模型或大語言模型突破,核心的關鍵詞就是語言AI。

自然語言處理是人工智能皇冠上的明珠,就是因為語言所包含的這樣一個內容去理解它是特別大的難題。不管之前我們做一個機器翻譯,還是去做一個取文本的摘要,還是做個情感分析,做一個問答都是非常困難的事情,更別說走向通用,OpenAl非常巧妙的是找到了新的一種方法,能夠把整個互聯網的語言都學會了,我們稱為叫語言模型,或者是用這個模型去掌握了人類的語言。

我大概在16年17年的時候就提到說,當機器掌握語言之後,強人工智能可能就到來了。今天也驗證了這樣一句話,那麽今天為什麽用語言能行,因為語言是我們去理解世界的一個重要的方法。之前圖靈也好,到馬克思恩格斯都講人跟動物的區別是在語言裏。

機器掌握語言後就跟人一樣了,因為通過語言我們才能建立對世界的認知,才能夠去思考,才能夠理解文化,也才能夠進行溝通,所以今天重大的突破就是反過來,不是讓機器脫離人去學習,而是向人類已經有的文明學習。

2017年,Google提出了Transformer(自注意力)神經網絡模型,開源之後大家開始研究大的語言模型,最後Google走的是一個雙向編碼的方式,而GPT恰巧就OpenAI走通了。

坦白來講,對於科學家的能力和使命感追求都是要求非常高的。

《深網》:OpenAI在團隊在組織框架設計上的一些獨特之處,是否對他們的成功產生了影響?你說OpenAI的成功,是技術理想主義的勝利。你怎麽看這家公司從最早的非盈利到後來成為微軟的盈利性公司?

王小川:我覺得OpenAI這麽大的一個技術突破,需要巨大的人才密度和算力,它其實是在理想主義的堅持和資本的幫助下,實現了研究上的突破。如果前期沒有一個非營利組織的幫助,挺難度過這麽一個生死線,最後也成功的轉向了商業行為,我覺得這是非常好的一種跨越。雖然有人在反對這件事,但這種商業組織後期在0~1突破之後,有利於他們去實現對世界的影響,還保留著原來研究的基因,這非常難得,也不可複製。

《深網》:開源會成為過去式嗎?

王小川:這是一個很自然的過程,從開源到閉源,也有從閉源到開源。你有領先的就先閉源,後麵再開源,這些都是發展中的一部分。

《深網》:ChatGPT能否發展為真正的通用人工智能?

王小川:我認為它已經是一個初級的通用人工智能,沒有懸念,目前已經是了。第一次破圈到C端用戶,還有資本市場都能理解這件事情。

《深網》:通用人工智能現在還缺哪些方麵的突破?

王小川:現在ChatGPT隻是把人類已經有的語言和知識做了一些交叉,還沒有新的發明和創造,接下來還有挺多的難題去攻克。

《深網》:通用人工智能,僅僅依靠統計模型就夠了嗎,未來會融入哪些新技術?

王小川:未來一定會用新技術的,目前基於統計模型,我認為今天通用人工智能在語言的表達,對世界的理解,已經超過大多數人了,但還缺少做決策和做執行的能力,這個維度需要去加強。

“機器文明也是人類文明的延續”

《深網》:ChatGPT在解構人類的創作能力,你怎麽看?

王小川:我覺得分兩部分,一個維度來看,文學或藝術方麵它承載了“我是誰”這樣的思考;另外維度是會創造一個太虛幻境,讓人非常舒服和享受的沉浸在裏麵,這是以遊戲和電影為核心的一個場景,它雖然有很大的意義,但不是我追求的方向。

《深網》:ChatGPT會不會消解人存在的意義?會不會瓦解傳統宗教哲學等思想體係?

王小川:我探討過這件事情,人存在的意義就是活著,甚至開始追求一種永恒,永恒可以通過生個孩子來實現,也可以通過藝術作品,也有可能跟宇宙產生連接,孔子說朝聞道夕死可矣,跟宇宙連接之後就融入到了一個更大的世界,這是我理解的意義,隻要有生命就有意義。有了ChatGPT之後,對於人類文明大體上是一個幫助,除非像核彈一樣互相被轟沒了。隻要它能夠成為人類文明的一部分,能夠幫助人類得到更大的永恒。

哲學思想是隨著技術文明的迭代一次次的產生變化。隨著量子力學的發展,人的生命到底是注定的,還是能夠被掌控的,也有一些新的發展。我一點都不消極,反而非常樂觀,ChatGPT能把我們從日常的繁瑣的勞碌中解放出來,使我們有更多的時間去回答一個問題——我是誰,當工具越來越強大的時候,我們越能找到自己。

《深網》:ChatGPT的未來就是一個工具?

王小川:當一種工具能幫到我們,這是一件事;更多的是ChatGPT未來還會成為超越工具的一種陪伴,它跟我們在心靈上是相通的,也是忠誠的,也能夠給我們更多的啟發,會由一個工具而變成一個陪伴。

《深網》:你並不強調AGI的創造力,而是更看重它在知識和推理方麵的能力?

王小川:我更希望AGI有知識,對世界本身的理解,讓人能夠更好的和世界連接,去解決真實的一些問題。當它去給人做服務的時候,這件事情就是把人給解放出來,回到了人本主義。

《深網》:ChatGPT對人類自身的認知能力會是一個災難嗎?

王小川:我覺得不是個災難,它能夠更好幫助我們去理解我是誰。認識我自己是我們必須要做的功課,因為原來我對於世界的理解是不夠的,我必須做好多事情才能生存,或者當我想成為誰的時候,會有很多困難。今天生存問題已經解決了,當我想成為誰的時候,這種機器能更好的幫到我。我認為是非常幸福的一件事情,人類文明會走到一個新的階段。

《深網》:有一種擔憂,ChatGPT不是成為我的工具,而是最後會取代我?

王小川:我覺得能取代“我”的東西多了,小孩、死亡都可以。有了ChatGPT之後,可以把它當做人類文明的一部分,要擁有一種大我的想法,也許有一天人類從肉身裏麵已經消亡了,但機器文明很發達,那也是人類文明的一個延續,我不覺得是取代這樣一個概念,而是我們自然的一個進化。

《深網》:既然如此,為什麽美國學界那麽擔憂?馬斯克認為,超級AI會像碾死螞蟻一樣摧毀人類,人類需要建立組織對AI進行監管,以確保AI技術的安全性。你怎麽看?

王小川:馬斯克講過他的很多擔憂,我們要看今天學界最擔心什麽,一方麵是人類文明被機器文明取代了,這是我們狹隘的一部分,我們早晚會接受這個事實,就像我們的孩子比我們強一樣的,這是人類的一個延續;我更擔心的是未來巨頭因為用不好機器,使得機器帶來了文明的毀滅,這是我們需要擔心的事情,就像核彈毀滅了世界一樣的,大家可能最終聚焦在沒有控製它,之後不僅是人的滅亡,也是人類文明的滅亡。

《深網》:機器可能會控製人類嗎?

王小川:我覺得給它設立一個目標,它就能很好的生存,怕的是本來就沒給它設目標,卻不知道它建立了這樣一種意識,這種失控可能使得它控製著人類,卻沒法控製好自己,那就會帶來文明的滅亡。

《深網》:這種失控的可能性大嗎?

王小川:我沒法判斷這個事情,但我覺得肯定是有的,即便是很小的概率,這是我們該擔憂的地方,所以我擔心的是失控,這種失控不是說把人類滅亡掉的問題,而是這個機器它帶來一種毀滅性的力量。

失控之後不一定最後機器就繁榮下去了,可能它也滅亡掉了。我們經常看不到外星人的一個原因,可能就是外星人自己把自己搞掛了。

《深網》:你怎麽看待ChatGPT會讓一部分人失業這個問題?

王小川:我覺得兩個層麵,一件事情是人的根本訴求就是存在。對吧?世界要拋棄我不要我了,這是我們擔心的一件事情,努力爭取我在這個世界上有我存在的意義。有人講人活著沒有意義,我是不認可的,如果說人生沒有意義,失業算個啥,我們要努力的不斷的去叩問我是誰。舉個例子,一個公司在經營上出現了嚴重問題,要掛掉了,如果你跟這個公司沒有聯係,不認識這個創業者,公司掛掉跟你有關係嗎?其實沒有關係,但公司創始人說我要活下去,大家都在尋求這樣的一個意義,我認為這就是生命的一部分。

在我心中來講,失業是可能發生的。但現在也有好多人找不到工作,大家拚命努力,其實這種恐懼人類與生俱來就沒有消亡過,我並不覺得ChatGPT到來之後讓人失業是個重要問題。

“ChatGPT距離研究生命更近了”

《深網》:卸任搜狗CEO這一段時間,你主要在忙些什麽,思考了哪些問題?

王小川:我更多的去關注生命相關的問題。我讀研究生期間,做的課題跟基因測序相關。牛頓通過萬有引力、牛頓三大定律,把物理問題變成了數學問題,我們可以用數學精確的去刻畫物理世界,但生命科學領域至今我們還做不到。ChatGPT把語言變成數學問題,這個模型能夠承接未來對生命科學的探索,這是我這次下場的主要原因。

《深網》:ChatGPT讓你看到了一個更大、更廣闊的未來?

王小川:ChatGPT代表了我們對語言的理解,用數學模型去理解語言,當下具有現實意義,我們是要把這步跟上。ChatGPT帶來了語言模型的變化,站在這樣一個高度看的時候,才能看清楚未來的演化。我不覺得ChatGPT比研究生命科學更大,我隻是覺得更近了。

《深網》:朋友大致是從什麽時候開始找你投資的?

王小川:從今年1月份到2月份,陸陸續續有朋友找到我,說小川你要不要做這個事情。

《深網》:這次創業你的優勢是什麽?

王小川:我恰巧前兩天還問了一下
ChatGPT,搜索引擎和無人駕駛哪個離語言大模型更近?ChatGPT給的答複就是搜索引擎會近很多,不管是從它數據處理後麵的算法,還是通過語言算法,到最後的評價係統,都是非常相關的一件事情。因此,我以前搜索公司的業務經驗,距離大模型是最近的。比無人駕駛更近。

《深網》:你現在整個人特別興奮?

王小川:的確是。我的興奮有一點來自於這次考慮下場的時候,有很多非常優秀的朋友加入,這個事情使得團隊可以凝聚更多優秀的人。

《深網》:這次創業會不會更純粹,堅持技術理想主義?

王小川:僅有純粹和理想其實是不夠的,需要與資本為伍,同時也要更好的去聯係學術界做基礎的研究,因此今天在中國創業做這件事情,需要技術圍牆,還需要一些其它能力的幫助。

《深網》:從資本的維度講,你被練出來了?

王小川:我認為既要滿足資本的需求,又要去發展理想,這是一個既要又要的過程。

《深網》:你有某方麵的短板要加強的嗎?

王小川:肯定會有,還挺多的。之前做搜狗的CEO要不斷的告訴世界我想的很清楚,然後工作的結果也是好的。這次我發現要連接很多優秀的資源,這是之前功課沒做足的地方,但另外一件事情要告訴世界,其實我有很多不足的地方,也不是每件事情都想的很清楚,要走出原來的那個表達路徑,對我來講就是一個巨大的突破。

《深網》:你現在所有精力和時間,都會花在研究這個事情上麵嗎?

王小川:我覺得讓自己有價值,一方麵是理解世界的規律,一方麵是通過理解世界的規律做對人類有用的事情。那麽,理解生命,讓人類更健康,是一個重要的工作。當下,讓機器理解語言,用語言和對知識的理解把它變成一個應用,這件事情也非常有意義。

《深網》:這次創業的使命是什麽?

王小川:通過相關的研發,去創造數字對語言的理解這樣的一種模型,它包含知識,在知識服務裏形成更多的普惠,使所有人獲取知識變得唾手可得。

我期待這次創業,所謂成功不隻是複現了一個大模型,而是能做到兩件事情,一件事情是在它的應用裏麵,能夠普惠剛才講的知識服務和幫助,是超越之前搜索和輸入法的一種幫助。另一方麵也是持續的在科研裏麵取得這種進步,國內其實大家都沒有勇氣做更多的科研,雖然有各種各樣的研究院,但研究院並沒有跟公司主產品形成連接,成功的把科研和產品做連接,真正實現中國的OpenAl。

“中國的AI大模型落後美國兩三年”

《深網》:ChatGPT是全世界最大的風口,現在下場晚不晚?

王小川:我覺得對於美國的領先,中國是需要迎頭趕上的。中國雖然前幾年大家都在進入大模型,但大廠也好,創業公司也好,開始發力,也是在ChatGPT去年底發布之後。大廠也是從今年年初才開始真正關注和認真做這件事情,現在出發我覺得也不算太晚。

《深網》:中國的AI大模型處於什麽階段?

王小川:在去年之前我們確實有些進展,大家其實都沒有意識到這件事情能湧現智能以及能夠變成一個商業應用,我們之前沒有信心,現在已經形成共識,這件事情我們比美國大概晚了兩三年的樣子。

《深網》:中國追上美國的話,按照中國市場的活力,大概需要多久?

王小川:追上ChatGPT3.5的話,我覺得今年內可能就能夠實現,但對於GPT-4,我認為可能需要3年左右的時間,應該不會低於兩年。

《深網》:現在很多公司和創業者在跟風大模型,你之前的工作和AIGC關聯大嗎?

王小川:其實今天我們在談兩件事情,一個是AIGC這種生成模型,但背後更大的通向AGI的主題其實是語言模型,這個事情是奠定了今天機器有智能的通向AGI的這麽一種模式。搜狗在之前做的工作,一個是搜索引擎,一個是輸入法,也都是以語言為核心,把整個互聯網的語言壓縮裝到一個產品裏去,成為一個超級的應用,所以這兩個關聯度是非常大的。

《深網》:你的創業也從大模型開始?

王小川:ChatGPT其實就是一個很明顯的載體,我們認為今天能夠做大模型或者人機對話產品,變成一個繞不過的路徑。我們希望把我們對搜索的理解加進去。我們知道ChatGPT隻能夠檢索2021年前的內容,以及在事實類問題裏麵有若幹的缺陷,new
bing其實做了一個相應的探索,以ChatGPT為核心做搜索增強,這也是我們努力的一個方向。

同時業界還有另外一條路徑,就是圖像的生成,在圖像裏麵也能夠創造出讓人覺得非常絢麗的生產力的提升或者滿足我們娛樂化的需求,這個應用可能會距離AGI更遠一些,但有現實的意義。在我們的選擇裏麵,我們可能會更專注於選擇語言模型,去讓語言討論知識上的獲取和推理,而不是討論圖像,這是我們的選擇,這更有利於我們去構造服務,而不是一個娛樂的引擎。

《深網》:這個產品大概什麽時候會上線?

王小川:6月份我們可能會開啟一個對標3.5一個更大規模的模型,預計在年底我們做到中國最好的大模型。

《深網》:通過對語言模型的重新認知,能找到人思維或者智能的本質?

王小川:今天還不能叫作找到智能的本質。人的思考有兩個係統,第一係統和第二係統稱之為快思考和慢思考,快思考就是通過一個像簡單神經網絡一樣的輸入,拍腦袋結果就出來了。這個方麵來講機器已經比人強了,但慢思考機器還沒學會。

《深網》:對於大模型,數據的投喂是非常重要的,優質數據從哪裏獲得?

王小川:數據訓練,會放大量中文數據,也會放很多的英文的數據,尤其是論文這種高知識含金量的數據,也是不可或缺的一部分。

《深網》:你做這個產品更強調它在知識和推理方麵的能力?

王小川:我認為語言的核心就是知識和推理,大模型產生智能最大的原因就是它通過語言承載了知識和推理。我更希望它有知識,對世界本身的一個理解,讓人能夠更好的和世界連接,去解決真實的一些問題。當它去給人做服務的時候,這件事情就是把人給解放出來,回到了人本主義。

《深網》:未來各巨頭都會有自己的大模型,所有大模型之間會不會趨同?如果有差異化,差異化在哪裏?

王小川:大廠在前期是比較接近的,大家都是跟ChatGPT和它的仿製性model學習,未來可能會出現分化。一種是服務於他們的主場景,當然有少數能夠超越做顛覆性的產品,這種變化可能還需要在半年或一年後才能展示出來。

《深網》:你覺得現在中國從業者和矽穀對ChatGPT的認知有什麽差別嗎,關注的點有什麽不同?

王小川:中國現在大家講理念的時候,是從美國吸收來的,畢竟人家比我們早了兩年,這個差距確實需要有更多的人下場來做,做出一些產品或者服務的時候,才能夠真實的跟上。大家今天從美國學點東西,或者零零散散做點討論,從認知上都不足以對齊。

《深網》:Transformer是穀歌最先提出來的,為什麽穀歌沒做出來ChatGPT?

王小川:大公司本身的底層人才去做一些原始的創新是有機會的。對於穀歌而言,雖然底層有這樣一個發明,但是我相信穀歌公司的老大,他並不把團隊裏麵AGI的實現當成整個公司的目標,因此下麵創新就會出現很多的掣肘,比如工程師團隊,各自有各自的考核,他們去做創新的時候申請大量資源及機器資源,涉及到數據的敏感性的時候,還會有來自於管理層的審查。因此,當你做這樣一個創新的時候,確實得從使命層麵再到目標層麵要做這樣一件事情,所以Google的技術是好的,但是目標並沒有定位在AGI,因此就會有很多的限製。

《深網》:有一種說法就是ChatGPT會取代搜索引擎,你怎麽看這個觀點?

王小川:這是兩件事情,一件事情搜索引擎自身也會升級,像New
bing是從一個傳統的搜索開始生成提問和回答,這是搜索引擎的一個提升,並不叫做ChatGPT取代他;另外ChatGPT自身也會發展,它跟搜索引擎未來會產生一種融合,就是以聊天為核心方式,加上搜索,它對於今天搜索引擎,就是一個升級後的新的產物,它不隻完成搜索,還可以完成其他的更多的事情。我覺得用取代這個詞本身不算特別的準確,用就像搜索引擎不是取代門戶一樣的。

《深網》:不會取代搜索,那ChatGPT會成為AI時代的操作係統嗎?

王小川:我完全認同會誕生一種新的係統,我認為它是操作係統和交互界麵的一個完整的融合,但用操作係統去描述它,反而讓大眾不一定能理解到它是什麽,我認為它就是你的助手,用陪伴這個詞可能比用係統準確。

這操作係統是一個特別技術化的詞,在操作係統上還長出很多應用,比如蘋果手機。我並不把它當成一個操作係統,我覺得它更像是一個帶有操作係統,但同時有和你溝通的一個完整的界麵,更像一個新物種,像一個朋友般的存在。