Skip to content

1.5萬次測試揭AI真相 人類“最後優勢”曝光

20260619 17818995844027

生成式AI進入職場第4年,越來越多人把寫作、分析甚至決策交給AI,卻也開始出現一種新的職場疲勞。據報道,研究人員對現今「7大主流模型」進行超過1萬5000次測試後發現,人工智能的建議全部正確卻毫無用處,不論如何調整題目、句型與分析框架,AI提出的建議最後往往陳詞濫調,最後只剩下一堆看似專業、實際上難以採用的漂亮話。

專家指出,過度依賴AI,不但未必能明顯提升工作成果,反而可能讓人的判斷力與創造力逐漸鈍化,其判斷力、創造力與專業直覺慢慢被掏空。早期採用者精心建構的工作流程往往會在一夜之間被下一代模式淘汰,但唯一無法撼動的競爭優勢是人類的判斷力和美感直覺。

據報道,研究人員針對ChatGPT、Claude、DeepSeek、Gemini、Grok、Mistral及GPT-5等7款主流大型語言模型,進行超過1萬5000次測試,讓它們回答不同行業的真實策略問題。結果發現,不論如何調整題目、句型與分析框架,AI提出的建議最後往往都會收斂到幾個熟悉字眼,例如「差異化」、「合作」、「長期思考」、「創新」及「集中管理」。

這些字眼聽起來正確、專業,也幾乎不會出錯,但問題正出在它們太過正確。它們本質上只是網路上最常見觀點的平均值,是一種經過統計計算後形成的陳腔濫調。對真正需要獨特切入角度的決策者而言,這種「正確卻沒用」的建議,不但無法解決問題,反而可能掩蓋真正值得深入思考的方向。

換句話說,AI生成的許多答案,往往不是最深刻或最有洞察力的答案,而是統計上最安全、最常見、最不容易出錯的答案。因此,當使用者因為不想面對棘手問題,把思考責任直接交給AI時,AI所做的,很可能只是把使用者原本模糊且表面的想法,重新包裝成一篇篇冗長、漂亮但空洞的文字,再交回使用者手上。

《哈佛商業評論》近期針對約1,500名美國專業人士進行的調查也顯示,科技焦慮與生產力悖論,正成為職場壓力的重要來源。許多人投入大量時間研究大型語言模型、測試提示詞及建立AI工作流程,但管理階層最後認為,他們的產出與從未使用AI的同事相比,實質上並沒有太大差別。

1.5萬次測試揭AI真相人類「最後優勢」曝光

1.5萬次測試揭AI建議的致命弱點。 (法新社)

投入與產出之間的嚴重失衡,讓原本「用更少資源完成更多工作」的職場壓力,變成一種披著科技與效率外衣的新型職業倦怠。工作者不僅要完成原本的工作,還得追蹤新模型、新功能與新工具,結果花在學習AI的時間不斷增加,工作品質卻不一定同步提升。

Axios共同創辦人、資深媒體人Jim VandeHei對此深有體會。他直言,懶惰地外包給AI,最後只會換來懶惰的思考與寫作。 AI並不會主動替人創造真正獨特的觀點,若使用者一開始沒有清楚的判斷與想法,再強大的模型也只能產出大量看似完整、實際上沒有靈魂的內容。

創意領域的測試也進一步證明,人類直覺仍難以被取代。研究人員以視覺藝術家的個人畫作訓練模型,再讓AI與藝術家進行創作比較。結果顯示,AI雖然能精準模仿藝術家的風格,卻在原創性、生命力與美感表達上明顯落敗。

AI可以掌握色彩、構圖、筆觸與形式,卻難以複製藝術家對世界的感受,以及長期生活經驗累積而成的美感直覺。模型擁有龐大資料,卻缺乏人類對細節、情緒與意義的敏銳感受。

這項限制在最新的AI影像產生工具上也十分明顯。有些使用者花數小時測試AI繪圖功能,最後發現,雖然模型可以產生接近想像的畫面,但前提是提示必須精確到近乎把所有創意概念都事先想清楚。

科技快速迭代,也正在無情地抹去早期使用者建立的優勢。 2023年時,許多AI愛好者熬夜打造客製化GPT、複雜提示詞與AI代理工作流程,但當下一代模型推出後,這些辛苦建立的系統,往往瞬間就被模型本身吸收。

專家指出,AI確實能幫助人們更有效率地生產內容,但卻無法告訴人們,究竟什麼東西值得被生產。大量由AI快速生成的文章、圖片、簡報與企畫,最後仍可能在沒有任何人真正閱讀或使用的情況下被丟進垃圾桶。

這也揭示了,人類最難被取代的競爭力: 「判斷力」。知道什麼值得追求、什麼應該完成、什麼又該果斷放棄,這種能力不是單靠資料量、運算速度或工程技術就能突破。

華客|新聞與歷史:1.5萬次測試揭AI真相 人類“最後優勢”曝光


探索更多來自 華客 的內容

訂閱即可透過電子郵件收到最新文章。