「你不能指望僅僅通過prompt設計,就讓一個Agent變得穩定、可靠。你需要的是能夠’犯錯-糾正-在交互中持續改進’的模型,並在這個過程中發展出真正的推理能力。”
這句話出自Striker Venture Partners的合夥人Brian Zhan。 2025年初,當AI市場都在聚焦Transformer的Scaling Law、熱議參數與算力時,他領投了一家當時估值還不到6億美元的小公司——Reflection AI。
在接受Z Potentials採訪時,他表示他的判斷依據很簡單:這支團隊把世界上最優秀的一群強化學習研究者聚到了一起,而強化學習(RL)才是讓Agent基礎模型真正「好用、可靠」的關鍵突破口。
十個月後,Reflection AI成為了2025年最耀眼的AI獨角獸之一。再過去五個月,它的估值又增加了整整三倍。
2026年3月26日,《華爾街日報》爆料:Reflection AI正在進行新一輪融資,投前估值250億美元,預計融資25億美元。 JPMorgan Chase計劃透過其新成立的Security and Resiliency Initiative參與本輪投資,其早期投資者Disruptive也計劃繼續跟投。
而就在十天前,這家公司也剛成為英偉達Nemotron Coalition的創始成員——這是一個由英偉達牽頭、旨在推動開源前沿模型發展的全球AI聯盟。
從2024年3月成立至今,Reflection AI花了兩年時間走完了從0到250億美元(約1728億元)的估值躍遷。 2024年它的收入還是0,2025年收入已經有2000萬美元,而它的團隊只有79個人。
同時,它也被譽為“美國版DeepSeek”,肩負著西方開源AI陣營對抗中國模型的“戰略使命”。黃仁勳不僅為它投了8億美元,還派出了工程師幫它優化晶片性能。前Google CEO Eric Schmidt、Zoom創辦人Eric Yuan、光速創投、紅杉資本……一眾矽谷頂級資本也悉數入場給它投了錢。
Reflection AI,到底是一家怎樣的公司?
從AlphaGo到Gemini:這支團隊做過AI史上“最酷的事”
Reflection AI的故事要從兩個人說起。
Misha Laskin,Reflection AI的創始人兼CEO,俄羅斯裔以色列人,耶魯本科學的物理,同時也是芝加哥大學的理論物理學博士。 2017年,他入選福布斯30 under 30,那時他剛結束第一段創業——一家做零售庫存預測的Y Combinator公司,Claire。在與Manifold的採訪中,他回憶起那段創業經歷時坦言:“我學到了很多,但主要是明白了自己不想要什麼。”他發現自己對零售業並沒有“深層的共情”,而他職業生涯真正的轉折點是在2016年——當他看到了AlphaGo。
「那改變了我的人生軌跡,」Misha說,「我當時就覺得,這是我這個時代最重要的科學。」他放下一切,自學編程,去UC Berkeley做博士後研究深度學習和強化學習。後來加入了Google DeepMind,領導Gemini專案的獎勵模型開發。
在Manifold採訪中,他回憶起ChatGPT發布的那天,他正在新奧爾良的一個會議上做演講,“我突然有一種抽離感——我為什麼要說這些話?”
那一刻他意識到,語言模型已經解決了AI的「泛化問題」。在此之前,強化學習演算法雖然強大,但只能在非常狹窄的領域工作──AlphaGo下圍棋無敵,但換個遊戲就要重新訓練。而ChatGPT展示了一種前所未有的通用性:你可以向它提問任何問題,它基本上都能給出合理的答案。
“這是一個從0到1的時刻,”Misha說,“歷史學家們回頭看,就會看到那是一個斷層。”
Reflection AI的另一位創辦人Ioannis Antonoglou的來頭更大。他是DeepMind的創始工程師,AlphaGo的核心開發者之一。 2016年那場震驚世界的圍棋“人機大戰”,李世石輸掉的四局棋,背後就有他的手筆。
Misha回憶AlphaGo那手被驚呼“非人類下法”的“第37步”棋時說:“那一步太壯觀了……它展示了系統對遊戲有深刻的理解,它有創造力,它能想到人類從未想到過的東西。”
在AlphaGo之後,Ioannis進一步推進了AlphaZero——完全透過自我對弈學習、無需人類指導就能掌握遊戲的AI;還有MuZero——連遊戲規則都不需要被告知,就能征服圍棋、國際象棋、將棋、Atari遊戲的更高級突破。
Misha與Ioannis是在DeepMind相識的,一個專注強化學習,一個深耕大語言模型。 2024年3月,他們離開Google,創立了Reflection AI。
這個團隊的其他成員同樣星光熠熠:Deep Q Networks、PaLM、Character AI、ChatGPT、Gemini……這些AI史上最重要的突破,都有Reflection團隊成員的參與。用紅杉資本合夥人Stephanie Zhan的話說:“這不是一群想做AI的人,這是一群已經做過AI領域最酷的事的人。”
他們的融資歷程堪稱火箭速度:
2025年3月,彭博社曝出Reflection AI共完成了1.3億美元融資,當時估值5.8億美元,其中包含紅杉資本和CRV領投的2500萬美元天使輪,以及光速創投(Lightspeed Venture Partners)和CRV領投的1.05億美元A輪融資;
2025年10月,B輪融資20億美元,估值80億美元,Reflection AI正式成為了獨角獸;本輪融資英偉達領投8億美元,DST、1789 Capital(Donald Trump Jr.,特朗普的小兒子為合夥人的機構)、前CEO Eric Schmidt、Zoomoom都加創了投資,
2026年3月,Reflection AI正在新一輪融資洽談中,投前估值達到了250億美元,JPMorgan Chase和Disruptive等機構計劃參與本輪融資。
從5.8億到80億再到250億,估值漲幅超過40倍,Reflection AI只花了兩年的時間。

圖源:Reflection AI官網
開源還是閉源? AI世界的“路線之爭”
Reflection AI選擇了一條與OpenAI、Anthropic截然不同的路-開源。
什麼是開源?簡單說,就是把AI模型的權重和架構公開,任何人都可以下載、使用、修改、再分發。與之相對的閉源,就是把模型當成“黑盒”,用戶只能透過API調用,看不到內部結構,更無法修改。
目前大模型主要分為開源與閉源兩大陣營,開源陣營包括Meta的Llama系列、以及中國的DeepSeek、阿里的千問系列等;閉源陣營有OpenAI的GPT系列、Anthropic的Claude、Google的Gemini,還有字節跳動的豆包等。產業中也存在部分介於開源與閉源之間的混合開放形態模型。
為什麼Reflection AI要開源? Misha Laskin在英偉達官宣它得開源聯盟Nemotron Coalition時給出了答案:“技術進步是由開放和協作的價值觀驅動的。Reflection正在確保智能基礎保持開放——不被少數人控制——並在全球範圍內可及。”
這背後的真實原因還有一個:在開源AI領域,美國正在輸給中國。
根據Hugging Face的數據,2024年中國開源模型的下載份額達到17%,超過了美國模型的15.8%。 DeepSeek憑藉著免費、高效能、可自訂的策略,在全球南部市場快速擴張。而在LMArena的AI模型排行榜上,截至2025年8月,前30名開源模型中無一款來自美國公司。
Misha Laskin在《紐約時報》的專訪中直言:「美國在開源領域,正存在著一個DeepSeek式的空白。」他認為,如果西方世界沒有自己的開源前沿模型,其他國家最終會選擇中國技術。
開源模型的優點在於:成本更低、可自訂性更強、資料安全可控。企業可以針對自己的業務場景進行微調,而不必把敏感資料寄給第三方API。對政府和大型企業來說,「主權AI」的概念越來越重要——他們希望AI基礎設施掌握在自己手裡,而不是依賴某個美國或中國公司的封閉系統。
Reflection AI的核心技術叫做Reflection-Tuning,它讓模型能夠偵測並修正自己的推理錯誤。這種技術的本質是讓AI具備「自我反思」能力-當模型發現自己犯了錯誤時,能夠主動修正並從中學習。這與傳統的監督學習不同,後者只是讓模型模仿人類標註的數據,而Reflection-Tuning則讓模型在互動中持續改進。
他們開發的自主程式Agent叫Asimov,能夠直接接上企業的程式碼庫,自動完成重構、測試、部署等工程任務。與GitHub Copilot等程式碼助手不同,Asimov的目標不是輔助程式設計師寫程式碼,而是完全自主地完成工程任務。它可以理解整個程式碼庫的架構,自動發現bug、最佳化效能、產生測試案例,甚至部署到生產環境。
2025年10月,Asimov開始為Reflection AI產生收入;到2025年底,它的年收入達到了2000萬美元。對於一個當時成立不到兩年的公司來說,這個商業化速度相當驚人。
2026年3月16日,英偉達官宣Nemotron Coalition,Reflection AI與Black Forest Labs、Cursor、LangChain、Mistral AI、Perplexity、Sarvam、Thinking Machines Lab成為了創始成員。這個聯盟的目標是共同開發開源前沿模型,第一款模型將由Mistral AI和英偉達共同開發,聯盟成員貢獻數據、評估和領域專業知識。
Reflection AI在這個聯盟中的角色是:貢獻建構可靠開放系統的專業知識。換句話說,它要幫英偉達打造一個「可信的開源生態」。英偉達在這個聯盟中扮演的角色不言自明:提供算力基礎設施。聯盟開發的第一款模型將在NVIDIA DGX Cloud上訓練,並作為NVIDIA Nemotron 4系列模式的基礎開源發布。
黃仁勳在官方聲明中說:“開放模型是創新的生命線,是全球參與AI革命的引擎——對學生、科學家、新創公司和整個行業都是如此。”
「美版DeepSeek」背後,中美AI正在互相「偷師」
Reflection AI被稱為“美國版DeepSeek”,這個標籤既是一種讚譽,也是一種焦慮。
讚譽在於,它代表了西方開源陣營;焦慮在於,這個標籤本身就說明DeepSeek已經定義了開源AI的標準。
DeepSeek做了什麼? 2024年底,這家中國公司發布了DeepSeek-V3和R1系列模型,性能接近OpenAI的GPT-4,但訓練成本只有後者的十分之一,而且是完全開源的。它用工程創新打破了“堆算力”的“迷信”,證明了中國公司在前沿AI領域的競爭力。
但中國AI大模型的崛起,也引發了西方業界的警覺與焦慮。 2026年2月23日,Anthropic在官方部落格發布聲明,指控DeepSeek、月之暗面(Moonshot AI)和MiniMax對其Claude模型發起了「工業級蒸餾攻擊」——簡單說,就是涉嫌用Anthropic的模型輸出來訓練自己的模型。而這類蒸餾行為在AI領域本就十分普遍,馬斯克甚至還公然嘲諷了Anthropic的這一表態。
諷刺的是,僅僅一個月後,劇情反轉。 2026年3月20日,矽谷程式設計工具巨頭Cursor發表了一款「自研突破」產品,卻被扒手出核心模型來自中國AI公司月之暗面的Kimi K2.5。 Cursor的宣傳文案裡,隻字未提Kimi的名字。
這是當下中美AI競爭的真實寫照:互相參考、互相警惕、互相超越。
Reflection AI的因應策略是「主權AI」。 2026年初,它與韓國新世界集團(Shinsegae Group)達成協議,投入數十億美元開發韓語定制模型,數千塊英偉達晶片將支撐這個項目的數據中心。 Reflection的計畫是:與全球美國盟友合作,成為各國「主權雲端」的預設開源選擇。
這種模式的優勢在於他們的雙贏:各國獲得了AI主權,Reflection獲得市場和收入,英偉達賣出更多晶片。正如Misha Laskin所言:“開放模型是其配套基礎設施的特洛伊木馬。”
Reflection AI與英偉達的關係遠比一般投資關係更緊密。根據《華爾街日報》報道,英偉達不僅給它投了8億美元,還派出多名工程師與Reflection AI合作,幫助優化其最新一代AI晶片的性能。這種「投資+技術賦能」的模式,讓Reflection AI在算力競爭中佔了獨特優勢。
但挑戰同樣巨大。 Reflection AI能否真正成為“西方的DeepSeek”,也要看它接下來的模型表現和商業化進展。
更重要的是,Reflection AI需要證明開源模式能夠支撐起一個永續的商業模式。目前它的收入主要來自企業客戶訂閱,但2,000萬美元的年收入相對於250億美元的估值來說仍然微不足道。投資人押注的是未來-當AI Agent成為企業標配時,Reflection AI能否佔有一席之地?
更宏觀地來看,中美AI競爭正在進入一個新階段。第一階段是比誰參數多、算力強;第二階段是比誰成本低、效率高;現在進入了第三階段──比誰生態開放、誰盟友多。開源vs閉源、主權AI vs全球雲、中國模式vs美國模式……這些路線之爭將定義未來十年的AI格局。
從全球視野來看,AI競爭已經不只是技術層面的較量,更是地緣政治博弈的延伸。美國政府正積極扶持本土開源AI企業,以因應中國大模型的崛起。白宮科技政策辦公室主任Michael Kratsios在2026年2月表示:「政府的目標是創造一個讓開源模型能夠蓬勃發展的生態系統。」根據《金融時報》報道,美國政府甚至考慮與Reflection AI簽訂合約,將其作為OpenAI和Anthropic閉源模型的替代方案。
這種戰略考量背後,是美國對AI主權的深層焦慮。閉源模型雖然性能強大,但企業或政府無法完全控制自己的資料;而開源模型允許本地部署、自主定制,對於重視資料安全的主權國家更具吸引力。 Reflection AI正是看準了這個趨勢,將自己定位為「西方開源陣營的領導者」。
Misha Laskin在接受《紐約時報》採訪時放話:「我預計我們有望成長為比當下超大規模雲服務商更具規模的公司。」兩位見證過AlphaGo擊敗李世石的AI先行者,正以Reflection AI為支點,對開源AI的未來發起新的下注。
結語
Reflection AI,是一個關於「信念」的故事。
Misha Laskin在博士畢業時放棄了自己深耕近十年的理論物理,因為「很難想像要等幾十年才能知道自己做的東西是否有成果」。
直覺式的判斷,最終讓他和Ioannis Antonoglou一起,在2024年3月創立了Reflection AI。他們的信念很簡單:強化學習+大語言模型=超級智慧Agent,而開源是讓這項技術惠及世界的最佳方式。
兩年過去,這支79人的團隊從0做到250億美元估值,從默默無聞到成為英偉達戰略版圖的核心一環。他們的投資人名單裡,既有矽谷最激進的創投資本,也有傳統金融巨頭,甚至還有川普家族的身影。
它代表著開源AI陣營的崛起,代表著美國對中國AI的焦慮,也代表著AI產業未來或將從「閉源壟斷」走向「開放生態」。
正如Misha Laskin所說:“AlphaGo從未停止進化。若投入十倍、甚至百倍的資源,就能得到一個智能水平更高的超級AlphaGo。本質上,這類系統的學習潛力沒有上限,完全取決於你願意投入多少資源。”
Reflection AI的旅程,才剛開始。
華客|新聞與歷史:成立兩年的小公司,被黃仁勛炒到1728億
探索更多來自 華客 的內容
訂閱即可透過電子郵件收到最新文章。