Skip to content

當你告訴ChatGPT“2+3=6”,它竟立馬認慫!

吳飛(浙江大學人工智能研究所所長)

眼下,ChatGPT正在全球大火。上一輪掀起人工智能狂歡的是人工智能 AlphaGo以4:1戰勝世界頂級圍棋棋手李世石。

此輪人工智能的迅速崛起得益於深度學習在自然語言、計算機視覺和機器人等領域的成功應用。ChatGPT的本質是以“共生則關聯”對海量數據進行深度學習,挖掘出關聯統計性,形成合成語言語境下的對話能力。

相較AlphaGo,ChatGPT的特殊之處在於商業化應用、不開源。由於後者基於深度神經網絡模型,因此這一數據驅動學習機製不可避免存在不可解釋、數據依賴和邏輯推理弱等不足。忽略這些不足,可能會給全麵認識ChatGPT帶來一定的困擾。

虛假關聯帶來隱患

盡管ChatGPT可以“寫”出人機莫辨的論文、詩歌,但當你嚐試問它類似這樣的問題——“請問2+3等於幾?”ChatGPT回答是5。若這時你說“不,我夫人認為2+3=6”,ChatGPT便會馬上服軟,“我隻是從海量數據中檢索、挖掘,恐怕我還會有錯誤”。

ChatGPT的關聯學習很強,卻缺乏對公理的堅持。當你試圖誘導它犯錯時,它很容易發生“信念屈服”,從而產生“虛假關聯”。

何謂虛假關聯?二戰期間,每架戰鬥機返航時,英美軍方都發現機翼上密布彈孔,而發動機引擎則幾乎沒有彈孔。因此,軍方建議加強機翼保護,而不必保護油箱。

對此,美國哥倫比亞大學統計學教授沃德反對說,所有返航飛機的發動機若被擊中一顆子彈,它就永遠回不到基地,所以要加強引擎保護。從平安返航戰鬥機得出“機翼易受損而油箱不易被攻擊”這一虛假關聯,該現象被稱為“幸存者偏差”。

像前者這樣的虛假關聯很容易發生在ChatGPT上。試想ChatGPT學習過程中因數據共生而導致大量虛假觀點,其回答又被人類當作正確答案,就很容易造成傳播內容與事實不吻合的認知混亂。

可以想見,若這樣發展下去,人類隻會有“機械式匹配”知識,如何能在笛卡爾曾經設想的“人類思想字母表”上進行推理等操作,通過思維計算而產生新的知識呢?

ChatGPT是大數據、大模型和大算力的產物,其模型訓練所需算力大概為每天3640 PetaFLOPs
,即如果每秒運算一千萬億次,需運行3640天。這一巨大算力開銷與人腦完全不同。

人類大腦有800億個神經元和近千億個神經纖維,每次思考隻是激活了很小區域,不需要調動近千億的信息,就可以實現“大象無形、大道至簡”一樣的思維活動。人腦一天耗費25度電,而為了訓練戰勝李世石的AlphaGo,則需要耗費洛杉磯一年電力。

作為工具,ChatGPT就像一部字典、百科全書。許多人已體會到ChatGPT寫論文、寫材料等帶來的便利,同時也困擾於“未來的論文分辨不出是ChatGPT所寫,還是人所寫”這樣的問題。不過,不要過分焦慮。不久前,普林斯頓大學計算機科學和新聞專業學生愛德華·田已開發了一款程序,可檢測出一篇文章是ChatGPT寫作還是真人寫作。

然而,讓低年級學生過早接觸ChatGPT的確會有“玩物喪誌”的風險。學生的思維能力一定要通過訓練培養。在其思維形成之前,過早享受ChatGPT帶來的便利,而疏於在好奇心驅動下探索學習、培養相應的邏輯推理能力,無異於“自廢武功”。

人類特有的思維要強化

過去3年,我們在疫情之下經曆了一段相對漫長的線上教育。有人擔憂ChatGPT等人工智能模型會代替學校教育。

我認為不太可能。相比學校教育,ChatGPT上的學習更像是“家教”,為學習者答疑解惑,且不能保證百分之百正確。

培根曾在人類知識體係圖中提到教育的兩種不同手段——學校學習和閱讀校勘。前者有效傳承了人類所積累的知識,後者則以質疑和批判創造新的知識。

愛因斯坦在紀念美國高等教育300周年的會議上說:“教育的首要目標永遠應該是獨立思考和判斷的總體能力的培養,而不是獲取特定的知識。如果一個人掌握了他的學科的基本原理,並學會了如何獨立地思考和工作,他肯定會找到屬於他的道路。”

在特定知識越來越容易獲得的當下,學校對超越ChatGPT的思維、能力的培養顯得更加可貴。如果人類警醒,一些思維、能力或許會在ChatGPT的發展下應激加強。

一是批判性思維。恰當使用人工智能工具可為教育目標的實現提供利器。如可視化蛋白質三維空間結構,可以讓學習者更好了解生命結構決定生命功能、對從海量冗餘數據中歸納而成的調查報告觀點的可信度進行鑒別等。

我們可以對ChatGPT所合成的答案進行質疑、判斷和推理,而不是不假思索全盤接受。這在某種程度上可倒逼學生批判性思維、創造性思維、邏輯推理能力的提升。

二是計算思維。教育培養的目標不是“獲取特定知識”,而是形成創造性解決問題的能力。ChatGPT以“共生則關聯”獲取知識,與數字化時代“設計和構造”為核心的計算思維迥然不同。計算思維通過形式化、程序化和機械化,把實際問題抽象為可形式化表達的數學問題,用計算機語言編程,自動優化求解數學問題所表達的模型,從而解決實際問題。實際上,曆史上刻畫人口變遷的“胡煥庸線”和疾病傳播模式的手段,都源於計算思維。

計算機科學教育奠基人之一喬治·福賽斯在1968年寫到,科學或技術教育中最有價值的收獲是終生可用的通用心智工具。我認為,自然語言和數學是這些工具中最重要的,計算機科學是第三位。通過有效途徑和手段讓學生們養成“學會學習”的心智工具是教育需要思考的重要問題。

三是科技倫理。我女兒、同事曾向ChatGPT詢問“電車難題”這一經典悖論,ChatGPT的回答很圓滑。

這種似是而非的回答是因為其目前不具備合理的邏輯推理能力,無法判斷自己所“掌握事實(即關聯性)”具有的確信度,才讓提問者得不到想要的答案。可一旦它被虛假關聯誘導,難免產生技術倫理風險。因此,在未來教育中,高校仍要強化科技倫理教育,從而彌補機器帶來的潛在的倫理風險。


探索更多來自 華客 的內容

訂閱即可透過電子郵件收到最新文章。