成立兩年的小公司，被黃仁勛炒到1728億

「你不能指望僅僅通過prompt設計，就讓一個Agent變得穩定、可靠。你需要的是能夠’犯錯-糾正-在交互中持續改進’的模型，並在這個過程中發展出真正的推理能力。”

這句話出自Striker Venture Partners的合夥人Brian Zhan。 2025年初，當AI市場都在聚焦Transformer的Scaling Law、熱議參數與算力時，他領投了一家當時估值還不到6億美元的小公司——Reflection AI。

在接受Z Potentials採訪時，他表示他的判斷依據很簡單：這支團隊把世界上最優秀的一群強化學習研究者聚到了一起，而強化學習（RL）才是讓Agent基礎模型真正「好用、可靠」的關鍵突破口。

十個月後，Reflection AI成為了2025年最耀眼的AI獨角獸之一。再過去五個月，它的估值又增加了整整三倍。

2026年3月26日，《華爾街日報》爆料：Reflection AI正在進行新一輪融資，投前估值250億美元，預計融資25億美元。 JPMorgan Chase計劃透過其新成立的Security and Resiliency Initiative參與本輪投資，其早期投資者Disruptive也計劃繼續跟投。

而就在十天前，這家公司也剛成為英偉達Nemotron Coalition的創始成員——這是一個由英偉達牽頭、旨在推動開源前沿模型發展的全球AI聯盟。

從2024年3月成立至今，Reflection AI花了兩年時間走完了從0到250億美元（約1728億元）的估值躍遷。 2024年它的收入還是0，2025年收入已經有2000萬美元，而它的團隊只有79個人。

同時，它也被譽為“美國版DeepSeek”，肩負著西方開源AI陣營對抗中國模型的“戰略使命”。黃仁勳不僅為它投了8億美元，還派出了工程師幫它優化晶片性能。前Google CEO Eric Schmidt、Zoom創辦人Eric Yuan、光速創投、紅杉資本……一眾矽谷頂級資本也悉數入場給它投了錢。

Reflection AI，到底是一家怎樣的公司？

從AlphaGo到Gemini：這支團隊做過AI史上“最酷的事”

Reflection AI的故事要從兩個人說起。

Misha Laskin，Reflection AI的創始人兼CEO，俄羅斯裔以色列人，耶魯本科學的物理，同時也是芝加哥大學的理論物理學博士。 2017年，他入選福布斯30 under 30，那時他剛結束第一段創業——一家做零售庫存預測的Y Combinator公司，Claire。在與Manifold的採訪中，他回憶起那段創業經歷時坦言：“我學到了很多，但主要是明白了自己不想要什麼。”他發現自己對零售業並沒有“深層的共情”，而他職業生涯真正的轉折點是在2016年——當他看到了AlphaGo。

「那改變了我的人生軌跡，」Misha說，「我當時就覺得，這是我這個時代最重要的科學。」他放下一切，自學編程，去UC Berkeley做博士後研究深度學習和強化學習。後來加入了Google DeepMind，領導Gemini專案的獎勵模型開發。

在Manifold採訪中，他回憶起ChatGPT發布的那天，他正在新奧爾良的一個會議上做演講，“我突然有一種抽離感——我為什麼要說這些話？”

那一刻他意識到，語言模型已經解決了AI的「泛化問題」。在此之前，強化學習演算法雖然強大，但只能在非常狹窄的領域工作──AlphaGo下圍棋無敵，但換個遊戲就要重新訓練。而ChatGPT展示了一種前所未有的通用性：你可以向它提問任何問題，它基本上都能給出合理的答案。

“這是一個從0到1的時刻，”Misha說，“歷史學家們回頭看，就會看到那是一個斷層。”

Reflection AI的另一位創辦人Ioannis Antonoglou的來頭更大。他是DeepMind的創始工程師，AlphaGo的核心開發者之一。 2016年那場震驚世界的圍棋“人機大戰”，李世石輸掉的四局棋，背後就有他的手筆。

Misha回憶AlphaGo那手被驚呼“非人類下法”的“第37步”棋時說：“那一步太壯觀了……它展示了系統對遊戲有深刻的理解，它有創造力，它能想到人類從未想到過的東西。”

在AlphaGo之後，Ioannis進一步推進了AlphaZero——完全透過自我對弈學習、無需人類指導就能掌握遊戲的AI；還有MuZero——連遊戲規則都不需要被告知，就能征服圍棋、國際象棋、將棋、Atari遊戲的更高級突破。

Misha與Ioannis是在DeepMind相識的，一個專注強化學習，一個深耕大語言模型。 2024年3月，他們離開Google，創立了Reflection AI。

這個團隊的其他成員同樣星光熠熠：Deep Q Networks、PaLM、Character AI、ChatGPT、Gemini……這些AI史上最重要的突破，都有Reflection團隊成員的參與。用紅杉資本合夥人Stephanie Zhan的話說：“這不是一群想做AI的人，這是一群已經做過AI領域最酷的事的人。”

他們的融資歷程堪稱火箭速度：

2025年3月，彭博社曝出Reflection AI共完成了1.3億美元融資，當時估值5.8億美元，其中包含紅杉資本和CRV領投的2500萬美元天使輪，以及光速創投（Lightspeed Venture Partners）和CRV領投的1.05億美元A輪融資；

2025年10月，B輪融資20億美元，估值80億美元，Reflection AI正式成為了獨角獸；本輪融資英偉達領投8億美元，DST、1789 Capital（Donald Trump Jr.，特朗普的小兒子為合夥人的機構）、前CEO Eric Schmidt、Zoomoom都加創了投資，

2026年3月，Reflection AI正在新一輪融資洽談中，投前估值達到了250億美元，JPMorgan Chase和Disruptive等機構計劃參與本輪融資。

從5.8億到80億再到250億，估值漲幅超過40倍，Reflection AI只花了兩年的時間。

圖源：Reflection AI官網

開源還是閉源？ AI世界的“路線之爭”

Reflection AI選擇了一條與OpenAI、Anthropic截然不同的路－開源。

什麼是開源？簡單說，就是把AI模型的權重和架構公開，任何人都可以下載、使用、修改、再分發。與之相對的閉源，就是把模型當成“黑盒”，用戶只能透過API調用，看不到內部結構，更無法修改。

目前大模型主要分為開源與閉源兩大陣營，開源陣營包括Meta的Llama系列、以及中國的DeepSeek、阿里的千問系列等；閉源陣營有OpenAI的GPT系列、Anthropic的Claude、Google的Gemini，還有字節跳動的豆包等。產業中也存在部分介於開源與閉源之間的混合開放形態模型。

為什麼Reflection AI要開源？ Misha Laskin在英偉達官宣它得開源聯盟Nemotron Coalition時給出了答案：“技術進步是由開放和協作的價值觀驅動的。Reflection正在確保智能基礎保持開放——不被少數人控制——並在全球範圍內可及。”

這背後的真實原因還有一個：在開源AI領域，美國正在輸給中國。

根據Hugging Face的數據，2024年中國開源模型的下載份額達到17%，超過了美國模型的15.8%。 DeepSeek憑藉著免費、高效能、可自訂的策略，在全球南部市場快速擴張。而在LMArena的AI模型排行榜上，截至2025年8月，前30名開源模型中無一款來自美國公司。

Misha Laskin在《紐約時報》的專訪中直言：「美國在開源領域，正存在著一個DeepSeek式的空白。」他認為，如果西方世界沒有自己的開源前沿模型，其他國家最終會選擇中國技術。

開源模型的優點在於：成本更低、可自訂性更強、資料安全可控。企業可以針對自己的業務場景進行微調，而不必把敏感資料寄給第三方API。對政府和大型企業來說，「主權AI」的概念越來越重要——他們希望AI基礎設施掌握在自己手裡，而不是依賴某個美國或中國公司的封閉系統。

Reflection AI的核心技術叫做Reflection-Tuning，它讓模型能夠偵測並修正自己的推理錯誤。這種技術的本質是讓AI具備「自我反思」能力－當模型發現自己犯了錯誤時，能夠主動修正並從中學習。這與傳統的監督學習不同，後者只是讓模型模仿人類標註的數據，而Reflection-Tuning則讓模型在互動中持續改進。

他們開發的自主程式Agent叫Asimov，能夠直接接上企業的程式碼庫，自動完成重構、測試、部署等工程任務。與GitHub Copilot等程式碼助手不同，Asimov的目標不是輔助程式設計師寫程式碼，而是完全自主地完成工程任務。它可以理解整個程式碼庫的架構，自動發現bug、最佳化效能、產生測試案例，甚至部署到生產環境。

2025年10月，Asimov開始為Reflection AI產生收入；到2025年底，它的年收入達到了2000萬美元。對於一個當時成立不到兩年的公司來說，這個商業化速度相當驚人。

2026年3月16日，英偉達官宣Nemotron Coalition，Reflection AI與Black Forest Labs、Cursor、LangChain、Mistral AI、Perplexity、Sarvam、Thinking Machines Lab成為了創始成員。這個聯盟的目標是共同開發開源前沿模型，第一款模型將由Mistral AI和英偉達共同開發，聯盟成員貢獻數據、評估和領域專業知識。

Reflection AI在這個聯盟中的角色是：貢獻建構可靠開放系統的專業知識。換句話說，它要幫英偉達打造一個「可信的開源生態」。英偉達在這個聯盟中扮演的角色不言自明：提供算力基礎設施。聯盟開發的第一款模型將在NVIDIA DGX Cloud上訓練，並作為NVIDIA Nemotron 4系列模式的基礎開源發布。

黃仁勳在官方聲明中說：“開放模型是創新的生命線，是全球參與AI革命的引擎——對學生、科學家、新創公司和整個行業都是如此。”

「美版DeepSeek」背後，中美AI正在互相「偷師」

Reflection AI被稱為“美國版DeepSeek”，這個標籤既是一種讚譽，也是一種焦慮。

讚譽在於，它代表了西方開源陣營；焦慮在於，這個標籤本身就說明DeepSeek已經定義了開源AI的標準。

DeepSeek做了什麼？ 2024年底，這家中國公司發布了DeepSeek-V3和R1系列模型，性能接近OpenAI的GPT-4，但訓練成本只有後者的十分之一，而且是完全開源的。它用工程創新打破了“堆算力”的“迷信”，證明了中國公司在前沿AI領域的競爭力。

但中國AI大模型的崛起，也引發了西方業界的警覺與焦慮。 2026年2月23日，Anthropic在官方部落格發布聲明，指控DeepSeek、月之暗面（Moonshot AI）和MiniMax對其Claude模型發起了「工業級蒸餾攻擊」——簡單說，就是涉嫌用Anthropic的模型輸出來訓練自己的模型。而這類蒸餾行為在AI領域本就十分普遍，馬斯克甚至還公然嘲諷了Anthropic的這一表態。

諷刺的是，僅僅一個月後，劇情反轉。 2026年3月20日，矽谷程式設計工具巨頭Cursor發表了一款「自研突破」產品，卻被扒手出核心模型來自中國AI公司月之暗面的Kimi K2.5。 Cursor的宣傳文案裡，隻字未提Kimi的名字。

這是當下中美AI競爭的真實寫照：互相參考、互相警惕、互相超越。

Reflection AI的因應策略是「主權AI」。 2026年初，它與韓國新世界集團（Shinsegae Group）達成協議，投入數十億美元開發韓語定制模型，數千塊英偉達晶片將支撐這個項目的數據中心。 Reflection的計畫是：與全球美國盟友合作，成為各國「主權雲端」的預設開源選擇。

這種模式的優勢在於他們的雙贏：各國獲得了AI主權，Reflection獲得市場和收入，英偉達賣出更多晶片。正如Misha Laskin所言：“開放模型是其配套基礎設施的特洛伊木馬。”

Reflection AI與英偉達的關係遠比一般投資關係更緊密。根據《華爾街日報》報道，英偉達不僅給它投了8億美元，還派出多名工程師與Reflection AI合作，幫助優化其最新一代AI晶片的性能。這種「投資+技術賦能」的模式，讓Reflection AI在算力競爭中佔了獨特優勢。

但挑戰同樣巨大。 Reflection AI能否真正成為“西方的DeepSeek”，也要看它接下來的模型表現和商業化進展。

更重要的是，Reflection AI需要證明開源模式能夠支撐起一個永續的商業模式。目前它的收入主要來自企業客戶訂閱，但2,000萬美元的年收入相對於250億美元的估值來說仍然微不足道。投資人押注的是未來－當AI Agent成為企業標配時，Reflection AI能否佔有一席之地？

更宏觀地來看，中美AI競爭正在進入一個新階段。第一階段是比誰參數多、算力強；第二階段是比誰成本低、效率高；現在進入了第三階段──比誰生態開放、誰盟友多。開源vs閉源、主權AI vs全球雲、中國模式vs美國模式……這些路線之爭將定義未來十年的AI格局。

從全球視野來看，AI競爭已經不只是技術層面的較量，更是地緣政治博弈的延伸。美國政府正積極扶持本土開源AI企業，以因應中國大模型的崛起。白宮科技政策辦公室主任Michael Kratsios在2026年2月表示：「政府的目標是創造一個讓開源模型能夠蓬勃發展的生態系統。」根據《金融時報》報道，美國政府甚至考慮與Reflection AI簽訂合約，將其作為OpenAI和Anthropic閉源模型的替代方案。

這種戰略考量背後，是美國對AI主權的深層焦慮。閉源模型雖然性能強大，但企業或政府無法完全控制自己的資料；而開源模型允許本地部署、自主定制，對於重視資料安全的主權國家更具吸引力。 Reflection AI正是看準了這個趨勢，將自己定位為「西方開源陣營的領導者」。

Misha Laskin在接受《紐約時報》採訪時放話：「我預計我們有望成長為比當下超大規模雲服務商更具規模的公司。」兩位見證過AlphaGo擊敗李世石的AI先行者，正以Reflection AI為支點，對開源AI的未來發起新的下注。

結語

Reflection AI，是一個關於「信念」的故事。

Misha Laskin在博士畢業時放棄了自己深耕近十年的理論物理，因為「很難想像要等幾十年才能知道自己做的東西是否有成果」。

直覺式的判斷，最終讓他和Ioannis Antonoglou一起，在2024年3月創立了Reflection AI。他們的信念很簡單：強化學習+大語言模型=超級智慧Agent，而開源是讓這項技術惠及世界的最佳方式。

兩年過去，這支79人的團隊從0做到250億美元估值，從默默無聞到成為英偉達戰略版圖的核心一環。他們的投資人名單裡，既有矽谷最激進的創投資本，也有傳統金融巨頭，甚至還有川普家族的身影。

它代表著開源AI陣營的崛起，代表著美國對中國AI的焦慮，也代表著AI產業未來或將從「閉源壟斷」走向「開放生態」。

正如Misha Laskin所說：“AlphaGo從未停止進化。若投入十倍、甚至百倍的資源，就能得到一個智能水平更高的超級AlphaGo。本質上，這類系統的學習潛力沒有上限，完全取決於你願意投入多少資源。”

Reflection AI的旅程，才剛開始。

華客|新聞與歷史：成立兩年的小公司，被黃仁勛炒到1728億

探索更多來自華客的內容

訂閱即可透過電子郵件收到最新文章。

成立兩年的小公司，被黃仁勛炒到1728億

分享此文：

相關

探索更多來自 華客 的內容

探索更多來自華客的內容