Skip to content

奇跡湧現,屬於AI的大時代意外降臨

我最近有時候我覺得很累,過去我很少出現信息過載的狀況,我認為我每天讀的東西基本都能給消化掉,但最近我經常覺得信息過載,而所有的信息過載都是來自
ChatGPT。通過這樣的信息過載,但這個過程其實也是一個讓人既興奮又焦慮的這樣的一個過程。ChatGPT
的出現震驚了世界。尤其是最近兩個月,人機交互的機器人帶給大家的一個非常大的變化。

 

一個屬於人工智能的大時代突然就來了

首先,這是人工智能與人機交互基點臨近的以此突破。上次人工智能對大家的顛覆和影響,還是 2016 年的
AlphaGo。它在韓國擊敗了李世石,之後又打敗了柯潔。但之後幾年,關於人工智能到底能夠多麽像人類、人工智能能夠替我們做什麽之類的爭論就慢慢平息下來。因為像下圍棋這些事都不足以真正撼動我們作為一個人與機器在大部分場景之下的交互方式。

但是我們每個人都在說話,我們中很多人每天都在生成文字,甚至很多人賴以為生。所以我們看到 ChatGTP 和類似於
Midjourney
這樣的東西在過去幾個月展現出的能力。基於自然語義的人工智能的這種能力的湧現之後,人們會直觀感受到這種能力的驚豔。

這對於人的挑戰是非常深遠的,讓我們非常有壓迫感。我覺得這個其實是人類文明發展到今天,我們非常意想不到的這樣一個時刻就突然來了。

然後他是我們自然語言達模型的普及應用一個開端,以及神經網絡處理 natural language
processing(NLP)的一個最高的水準。

過去這麽多年我們做過很多事情,然後很多公司都在搞各種各樣的大模型,包括 NLP
用於其他的很多領域,比如自動駕駛、客服機器人等。它們做了很多的事情,但從來沒有一個像 ChatGPT
這樣的東西。它其實是神經網絡的處理的一個最高的水準,每一個獨立的個體都可以用,它是一個非常有意思的開端。

在 GPT 4
它發布之後,隻同時配套發布了一篇論文。當時我覺得天哪,怎麽回事?這樣一個成果難道就隻值一篇論文嗎?還是你自己隱藏了很多東西?

後來一想的確到了這個階段,論文研究不是最重要的,工程是最重要的。

什麽是工程?就是你用多少條的芯片、多少算力,多少台服務器,用怎樣的這種基於約束的調優和這種調參的模式,早期建模怎麽去做?一次次的反複的嚐試,這種不斷去做調優調參這樣的一個過程。

它是一個工程學的實踐,它不是靠我們做了多少基礎研發的突破,它是不斷的試出來,所以所以這個事特別有意思。就工程實踐這件事情,第一個靠錢,第二個靠意誌力,第三個靠團隊,也就是靠人。

有人形容這個事像是煉丹,你喂的那些藥草就像語料,火爐的熔爐就是建模模型。加火的過程就是訓練指令集調參調優的過程。這中間不斷嚐試的一個過程,非常的像煉丹。

我覺得寫 Prompt
這事像念咒,我不太會煉丹,但我現在正在學會去念咒。煉丹的過程,其實上是人工智能工程實現的一個奇跡。

這也是工業革命以來人類生產力最強大的一個效率革命。過去經常說人類已經經曆了四次產業革命。第一次是蒸汽機,第二次是電力,第三次是計算機革命,第四次當前年代的智能革命。

但我認為 18 世紀末開啟的蒸汽機革命一直到 20
世紀中期開啟的信息革命是一個階段。而智能革命其實是一個新的階段。大語言模型的廣泛應用,讓人們意識到人們的經驗、智力、智能在很多時候可能也是不夠用的,可能也是需要一個更強大的東西與人去配合去工作。

我們去想效率革命這個事情,它極大的提升了我們的效率,也能夠激發我們在創造力方麵的能力。他會創造一些新的工作機會,或者讓人們去重新地認識自己的社會價值和商業價值。

最近我們公司要搞一個 prompt day
活動。讓所有人去分成兩個組,圖片組和文字組,可能會請幾個人命題,讓團隊來參與生成內容。我們現在內部有很多團隊都開始接觸 AI
內容生成。比如視頻團隊,他們現在也開始用 Midjourney
畫畫了。然後要聞團隊也開始用這個東西寫一些微博的推廣文案,寫一些快速的要聞。商務團隊,市場團隊現在已經在用它去寫一些文案,跟客戶進行溝通了。當然做深度報道和深度內容的團隊,暫時這個東西還替代不了。

我們搞這個東西,不是要嚇唬大家,我們要讓大家知道這個事能夠提高多少效率,激發我們多幹多少事情。能夠探索我們作為個體能提升多少生產力,我覺得這是非常有意義的事情。我認為她的確是重新定義職業腦力勞動和體力勞動之間的關係。

 

中國為什麽需要自己的 ChatGPT 公司?

為什麽中國需要自己的大語言模型產品。文心一言已經發布了,阿裏達摩院也帶來了通義千問,接下來幾周還會有很多類似的產品推出。中國為什麽需要自己的
ChatGPT 公司,他們不做行不行?不做會不會死?

我覺得這個事情其實也是我近期思考比較多的東西。

首先我認為自然語言大模型的本質是基於語言的文化話語權。大家都知道這個世界上尤其是互聯網上的主要內容,90%
以上的內容是英文內容,中文內容隻占其中非常少一個比例。

這就意味著無論是 OpenAI 的 GPT 也好,穀歌的 Bard
也好,還是其他的大語言模型也好。都是基於英文以及自己特定預料語料構建起來的一個模型。建模的過程既是選擇語料、調優和調參的過程,也是他們在這個過程當中形成一個自然語言模型的價值觀的過程。

它是基於語言的文化話語權,這也意味著基於英語語言的文化霸權,有可能會通過人工智能和人機交互機器人的方式得到進一步的強化。

所以全球自然語義處理框架不僅需要中文語義基礎和中國語料,也需要中國價值體係與中國解決方案。

前不久其實我接受過一個調研,問我們怎麽能夠把大語言模型做好。當時我說首先要在語料庫上下功夫,我們要訓練好的優質的高質量的中文語料。

其次,我認為應該形成一個更互動的產學研結合的方式。公司有動力去做模型,而高校有研究人才和研發資源,然後政府有集中這樣的資源,為這個事情把握方向的這樣一個能力。

最後就是說我們要訓練好的中文語料,我們也要訓練英文語料,把英文語料通過我們的模型調優調參訓練成輸出的方式,成為帶有我們的價值體係和解決方案的東西。

再一個,我認為大語言模型背後是芯片軟件和雲計算構成的係統。中國是世界上除了美國幾乎唯一有能力獨立開發的國家。當然要承認,我們算力可能不如人家,係統能力不如人家,投的錢不如人家多。

但從另外一個維度來看,這個世界上有沒有第三個國家的科研機構、企業能夠跳出來講我們來做自己的大模型?沒有,是不喜歡嗎?其實就是因為這個東西不是所有的國家都有能力去做的。

芯片我們現在肯定是不是最強的,我們肯定是相對落後的,而且現在隨著一些這種不合理的製裁,就這個領域我們可能還要再繼續的落後下去一段時間。但是雲計算這個領域中國的實力是擺在這裏的,我們既然有能力去做,有能力哪怕是世界上的老二,我們就沒有理由不去做這件事情。

我認為自然語言大模型的聖杯之戰是中美科技實力競爭的一個重要的維度。我認為人文社會科學就是文化觀念的輸出,它的載體是語言,到最後本身就是語言的符號化和數學化,其實也是會讓它走向桂冠的這樣一個過程,這個東西其實我們現在形成的就是一種自然語言的這種模型的研究。這個也是基於前麵這個點上非常重要的一個維度。

65f180c9a8297f9194f439d0f2ade30a

最後一個,是我們文化安全、數據安全、國家安全發展安全的重要保障。主要是所謂的安全發展。

自然語言大模型激發的數據再生產將創造前所未有的數據價值。我們中國過去這麽多年積累下來的各個產業的垂直產業的數據,沉浸在各個行業的公司服務器和數據中心。那麽這些數據有的是死的數據,但也有很多活的數據,它是可以拿出來被再研究和被用來人機交互和人機溝通的數據。

其次就是就是基於垂直產業的人工智能的發展邏輯與通用人工智能的化學反應。我前不久寫過一篇文章,叫《是誰拖了中國 ChatGTP
的後腿》,我把責任主要扣到了中國的 VC 的身上。我為什麽這麽講?如果我們回到 2016
年那個時間節點,中國和美國在這種人工智能的基礎的一些東西上麵其實水平差距沒有那麽大的。但當時的一些做大語言模型的初創團隊基本都拿不到很多的投資。

這個文章出來之後很多投資人都表示反對,說這個東西是投多少錢都見不了底,但這些人現在也都去投這個東西。

我想講一個基本的邏輯,通過我們做煉丹的過程產生這種人機交互和對話生成的結果,其實是可以支持更多小模型和小場景發展垂直的人工智能產業發展模型。我們現在會用到很多的小模型,和機器人產生對話,但這些對話目前還是太小了。

但如果我們去想,他是基於大的模型的語料分析、調參最後形成的人機交互的成果,它是不是有可能真的能夠幫你解決更具體、更切實,更能夠幫助你的一些問題。

國內最近有兩個趨勢,第一個就是類似於像文心一言,包括像阿裏達摩院這樣的機構,他們這樣的巨頭公司及其下屬機構在推出自然語言大模型的測試。此外,他們也正在積極的在去做一些基於產業、基於垂直領域結合的一些東西。其他比如科大訊飛也好,京東也好,他們也在試圖基於打的一些平台上的數據去做一些更大的模型,實現一些更具體的場景。

這點我們有自信,中國人在做原生產品上可能不是最強的,但是我們落到產業、落到場景上可能會產生一個更好的成果。

那麽這個東西既然這麽重要,它會反向激發中國在半導體、雲計算操作係統等自主關鍵領域的創新。如果我們這種自然語言大模型起來了,其實它會反向的去激發很多在半導體領域,在雲計算領域,在操作係統裏的這種進化和升級,對我們基礎的這種架構的數據相應是一個非常有意義的事情。

bb09997fa13bcbcc22c3bc0ebaf98f04

最後我特別想講的一個點,它將推動更廣泛意義上的數字平等,而不是更廣泛的不平等。大語言模型給了很多人機會,他比你學編程要容易,他給了很多的機會讓人們去創造更好的東西。當所有人的當一個事情彌合了人們更多的知識差異和技能差異的時候,其他會推動更廣泛意義上的數字平等,而不是製造更不平等。

最後還想多說一句話的話,就是說還是想給中國的 LLM
領域和產業鼓一把勁,這個領域能夠誕生出很多的新的機會,如果我們把它當做是下一次工業革命去看待的話,它可能意味著更多的東西。