說自己“牛”，GPT-4真不是王婆賣瓜

1f779de32a1b837e0ad84e88c08ad13a

本文來自微信公眾號：字母榜（ID：wujicaijing），作者：畢安娣，頭圖來自：視覺中國

扔給聊天機器人一張圖表，它不但能看懂，還能給你如此這般做一番運算，發來一段對圖表的解讀。

你不服氣，又扔過去一張無厘頭的梗圖，它不但能看懂這張圖裏有車有人，還能告訴你之所以好笑是因為 ” 這個男人在出租車上麵熨衣服
“。

a43b451a1d71687dccb24fa57c8745ab

這不是暢想，而是 OpenAI 最新發布的大型多模態 GPT-4 已經具備的能力。北京時間 3 月 15 日淩晨，OpenAI
正式發布了該模型。

c1d5fb92783bf13982c401fea60dbfe4

簡單來說，GPT-4
與前代相比可以接受的文本輸入上限更高，回答的準確性提高，能夠生成歌詞、創意文本等多樣化風格的內容。最最最令人振奮的是，GPT-4
有強大的識圖能力，可以解讀圖片。

過去 ChatGPT 能做到的，新模型做得更好了；ChatGPT 做不到的，新模型也可以做到了。

開通了 ChatGPT Plus 的付費用戶已經可以選擇 GPT-4 模型，其他用戶則可以加入候補名單等待。但目前 Plus
用戶隻能使用文本輸入，讀圖的功能尚未全麵開放。

98591aa04fcaecb2ec7a127a33524bb8

外界用極大的熱情迎接了 GPT-4。在消息公布之後，OpenAI 官網一度發生擁堵，很多用戶在社交媒體表示這下秒開了 Plus
服務。”GPT-4″ 登上推特美國、日本等地區熱榜，也登上了國內的微博熱搜榜、抖音熱榜社會榜等。

顛覆 ChatGPT 的，果然還是 OpenAI 自己。

一

GPT-4 究竟有多厲害？

在官方演示視頻中，OpenAI 總裁兼聯合創始人格雷格 · 布羅克曼（Greg Brockman）用筆和紙畫了個網站展示給
GPT-4，後者僅用 1 到 2 秒的時間，就生成了網頁代碼、製作出了幾乎與圖中一模一樣的網站。

83693f91b2f043202167d31b10c85795

9ee5b5eea4985b62dcda0288ac7832fe

GPT-4 可接受的文字輸入長度提升到了 2.5
萬個單詞，允許長內容創建、擴展對話以及文檔搜索和分析等。在高級推理能力上，GPT-4
也有提升。它可以更準確地解決難題，具有更廣泛的常識和解決問題的能力。

OpenAI 表示，GPT-4 在專業和學術方麵表現出接近於人類的水平。其給出的例子稱，在模擬律師考試中，GPT-4
的得分能排進前 10% 左右，而 GPT-3.5 的得分隻能排在倒數 10% 左右。

而且 GPT-4 不僅是能對文本或圖片進行單獨的識別，而是可以接受圖文混排的內容。

” 請記住，GPT-4 不僅僅是一個語言模型，它還是視覺模型。實際上，它可以靈活地接受如文檔中那樣任意散布的圖像和文本。”
演示視頻中出現包含各種圖片和文字的電腦屏幕截圖時，格雷格如是強調。

在 OpenAI 官方介紹顯示，GPT-4 可以對插入了多個圖表的論文進行解讀，並用精煉的語言總結論文的內容。

c707bff79253492b58da4de0e48c53a5

OpenAI 表示，公司花了 6 個月的時間，利用 ChatGPT 的經驗教訓以及對抗性測試調整
GPT-4，使其在真實性、可操縱性和拒絕超出設定範圍方麵取得了有史以來最好的結果。

” 至少對我們來說，GPT-4 訓練運行前所未有的穩定，成為首個能夠提前準確預測其訓練性能的大型模型。”

但 OpenAI 也表示，GPT-4 並非完美，仍然不能完全摒除人工智能的 ” 幻覺
“，而且訓練數據的時間依舊停留在 2021 年 9 月，可能會出現推理錯誤：”
有時會出現簡單的推理錯誤，會輕信用戶的虛假陳述，會像人類一樣解答不了難題。”

二

值得一提的是，GPT-4 在不同語種上的能力表現也大幅提升。

過去使用基於 GPT-3.5 的 ChatGPT
時，要特別注意中文的表達規範、流暢，即便如此它依然會時不時地突然用英文作答，好像一著急就要 ” 蹦母語 “。

根據 OpenAI 的技術報告，GPT-4 的中文準確度已經達到了 80.1%，這個數字比
GPT-3.5 的英文表現還要好，後者隻有 70.1%。

為了看看 GPT-4 的中文能力究竟如何，字母榜也簡單地問了幾個問題。

我們先將一段報道 GPT-4 推出的英文發給 ChatGPT，要其翻譯。這部分 GPT-3.5 和 GPT-4
的整體區別存在但是不明顯。如 GPT-4 翻譯為 ” 人工智能驅動的法語或西班牙語的對話 “，GPT-3.5 翻譯成了 ”
法語或西班牙語的 AI 驅動對話 “。

當我們進一步提出要求時，新模型的表現開始明顯好於前代。比如 ” 給年輕的朋友轉述這個消息 “，GPT-4 的回答很本土化：”
嘿，哥們 “” 得告訴你個牛 X 的事兒 “” 這貨還能識別圖片 “。

再讓它針對老年朋友編輯個信息，它的回答則有那種正經的味道，如 ” 親愛的朋友 “” 告訴你個好消息 “” 感歎時光荏苒啊
“。

23735db170fcbba7bfaff1341ecc468a

反觀
GPT-3.5，回答得就略顯生硬了，雖然也努力地加入了語氣詞等，但是整體文本還是欠缺重新梳理，依舊是對原文本的簡單複製。

5632ec4d05dd0391faf8f498a74afdd8

當我們讓 GPT-4 模仿莎士比亞轉達這個消息時，其回答頗為驚豔：” 哉！眾生皆驚，乃 OpenAI 新奇之作—— GPT-4
誕生矣！其智慧之光，如同破曉之陽，識圖問答皆無往不利…… ” 但 GPT-3.5
則顯示發來一大段英文，當我們要求用中文時，文本不能說和莎翁有什麽關係，最多是有點譯製片腔調：” 哦！快來聽聽這個消息…… “

e8c1c613edac5873665b54abb380c038

接下來，是社交媒體文案比拚。我們讓 ChatGPT 將之前的消息壓縮為 100
字左右的小紅書文案，GPT-4 直接給出了完整的標題、文案甚至是話題標簽。而且文本中插入了很多小紅書常見的 emoji
表情，達到了可以直接拿來用的程度。

495c30dc19215d1caa917ffd0c4f4edd

GPT-3.5 雖然也知道小紅書的風格是更親和的，但是文本簡潔度明顯差很多，也不懂得 emoji 的奧妙。

2fb2ded5b2929c9df575612bfc64c436

我們還讓 ChatGPT 為一款遊戲手機的新顏色起名字，GPT-3.5 給出的 10 個名字中，隻有 1 個不帶 ” 綠 ”
字，如翡翠光芒綠、草原之綠、碧海琉璃綠，和遊戲的聯係也不緊密。GPT-4
給出的名字則可以直接取用：極速碧輝、虛擬翠穹、綠焰戰魂、綠光戰神。

1669641aa2c75c9c57b6eda16060234e

bfc9babf76dece2127770d5609d513b6

為結束這段小小的測試，我們假設李白穿越到現代，並和 ChatGPT 進行了一場對話，讓它以李白的角色作一首詩：

仙人撫我頂，托我躍千年。一覺醒來世事變，靈犀探盡塵間塵。玉宇瓊樓矗立地，鐵馬火車踏空間。時光如夢，逐浪逝，李白驚歎人間情。

這 ” 仙人撫我頂，托我躍千年 ” 可比 GPT-3.5 開頭給出的 ” 深閨無物我獨來，相見 ChatGPT 意外來 ”
頂多了。

三

去年 11 月 30 日，ChatGPT 上線得靜悄悄，OpenAI
的官方推特賬號發布了一篇文章，宣布產品發布的好消息。

2179c52c6dcd8da861d14d365e6da959

短短不到三個月之後，當 OpenAI 發布新一代大型多模態模型 GPT-4 時，情況大有不同：

OpenAI 在推特、YouTube
等平台發布了宣傳短視頻、產品介紹短視頻，還由公司總裁兼聯合創始人格雷格親自進行了長達近半小時的直播。

9fa6d2fee48ba464ab9ac273366817aa

除此之外，OpenAI 還在官網發布了長達 98 頁的技術報告，並同步開放了 GPT-4 的
API（應用程序編程接口）以幫助開發人員構建應用和服務。

GPT-4 讓 OpenAI 的商業前景廣闊了起來。在針對 C 端每月 20
美元的訂閱使用以外，外部合作也有更多可能性。

已經有多個合作夥伴接入了 GPT-4。微軟確認了必應的聊天機器人使用的正是 GPT-4：”
如果您在過去五周內的任何時間使用過新版必應，那麽您已經體驗過 GPT-4 的早期版本。”

語言學習軟件多鄰國（Duolinguo）宣布將在其付費訂閱 MAX 版本中，為學習者提供 AI
驅動的新功能。比如學習者可以和軟件中的 ” 世界人物 ” 進行角色扮演，練習對話技巧。AI
會在對話後給出反饋，告訴學習者其回答的準確性和複雜性如何，還會對未來的對話予以提示。

另一款產品 BeMyEyes 也將搭載 GPT-4，而且側重的是其圖像識別和解讀的能力。BeMyEyes
不是一款新應用，它推出於 2015
年，為視障人士服務：沒有視力障礙的人可以申請成為平台誌願者，接聽視障人士的視頻通話，通過攝像頭遠程幫助視障人士識別物品、閱讀文本等。這款應用在中國也有使用者，小紅書、豆瓣等平台都有相關討論。

可以想見，有了 GPT-4 的讀圖能力，視障人士有望在平台獲得更及時、私密的幫助。

b2dfd4293fbeea9ad2c728444e576643

1d879554b2823cbe14b8202f096eaa84

對於其他想要合作的開發者，需要進入 GPT-4 的 API
接口申請頁麵，填寫姓名、郵件、公司組織編號以及使用計劃等問題。

已經有公司迫不及待。

人工智能公司 DoNotPay 的 CEO 喬舒亞（Joshua Browder）在推特上表示，正在致力於用 GPT-4
打擊騷擾電話，將其稱為 ” 一鍵訴訟 “。針對騷擾電話和自動撥號軟件起草起訴書，要求對方賠償 1500 美元：”
想象一下，你接了個電話，按了一個鍵，然後 1000 詞的起訴書就寫好了。”

05646d3efc23da4a0f1ab138b333cadc

此前，這家公司基於包括 ChatGPT 和 Davinci 在內的文本生成器，訓練和開發了 ” 全球第一個 AI 律師
“。本來有計劃今年 2 月在美國出庭辯護，卻因爭議不得不擱置。

有人興奮，有人發愁。穀歌此前以聊天機器人巴德（Bard）迎戰與 ChatGPT
深度合作的微軟，但還沒對外公開發布產品，就因為演示頁麵中的錯誤一夜蒸發千億市值。

而就在 GPT-4 發布之前，穀歌才宣布了一個新消息，稱將推出一係列 AIGC（人工智能生成內容）的功能，將 AI
應用到包括穀歌文檔（Docs）、郵箱（Gmail）等的生產力工具當中，並於月底提供給 ” 可信賴的開發人員
“。然而這個消息還沒掀起多大波浪，就被 GPT-4 的出世衝淡了。

另一邊，在國內，百度也將於 3 月 16 日舉行文心一言發布會。這是百度備受矚目的大語言模型產品。轉眼間，扳手腕的對象從
GPT-3.5 升級成了 GPT-4，實在不算是個好消息。

對於 ChatGPT 和微軟的競爭對手來說，GPT-4
再一次搶了先機。對於你我來說，究竟是應當興奮於科技的發展，還是恐懼於被替代，不妨先讓子彈飛一會兒。

探索更多來自華客的內容

訂閱即可透過電子郵件收到最新文章。

說自己“牛”，GPT-4真不是王婆賣瓜

分享此文：

相關

探索更多來自 華客 的內容

探索更多來自華客的內容