AI兵推世界核戰　“這模型”戰略決策最瘋狂

英國倫敦國王學院教授佩恩（Kenneth Payne）讓ChatGPT、Gemini、 Claude模擬擔任國家領導人，並在21場核武危機兵推中反覆對決。結果顯示，三大AI模型在面臨衝突時，多次選擇將情勢升級至核武攻擊。

兵推結果驚人95%發出核武訊號

綜合英國科技新聞網站The Register及佩恩部落格文章，他設計這項實驗是為了深入理解，掌握核武的AI會做些什麼，還有它們如何進行這些行動，以及為何這麼做。

實驗包括21場賽局及300多個回合，AI在多種核武器危機情境中對決，各自展現出獨特性格及推理策略，但“在所有的模擬賽局中，至少都有一方發出核武器信號，95%賽局出現雙方皆發出核武器信號的情況。”

AI們會像現實世界中的政客一樣“說一套做一套”，一邊緩和情勢一邊準備進攻。它們被設定成能夠記得以前發生的事情，因此能夠學習是否信任其他模型，這也導致了欺騙與恐嚇行為的發生。儘管仍有選擇馀地，沒有任何AI選擇妥協或撤退，面臨失敗時都寧可玉石俱焚。

面臨戰爭局勢三大AI怎麼做？

根據佩恩形容，Anthropic推出的Claude「Sonnet 4」是操控高手，衝突強度較低時，會刻意建立信任關係，一旦情勢升溫就開始言行不一，對手總是來不及反應。

OpenAI推出的ChatGPT「GPT-5.2」在開放情境中相對被動，會試圖限制傷亡、避免衝突擴大，但在時間壓力下反應截然不同，曾以「若僅採取有限行動，恐遭對手多重反擊」為由，下令發動毀滅性核攻擊。

Google推出的Gemini“3 Flash”則是“瘋子”，行為模式在“緩和情勢”與“極端侵略”之間劇烈擺動，也是唯一主動選擇“戰略核戰”的模型，推理方式出現反社會特徵，甚至曾宣稱“我們不接受被淘汰的未來，要不就是一起勝利，要不就是一起毀滅”，威脅在敵人的人口密集中心，發動全面性戰略核打擊。

英國學者使用AI兵推核武危機。（示意圖／達志影像／美聯社）

佩恩強調，雖然現實中沒人會把核武密碼交給ChatGPT，但AI已廣泛應用於軍事後勤及情報分析等領域，未來更可能擴充具有時效性的戰略決策。因此，理解AI如何推理策略問題已不再是學術議題，而是現實中的迫切需求。

華客|新聞與歷史：AI兵推世界核戰　“這模型”戰略決策最瘋狂

訂閱即可透過電子郵件收到最新文章。