Skip to content

97年的MIT輟學青年,五年成73億美元獨角獸

從團隊到業務,Scale 擁有一切矽穀寵兒的標簽:AI、API、YC、野心勃勃、年輕、才華橫溢、大學輟學創業、行業洞察。

作者 | 江江

編輯 | 蔓蔓周

這幾年,矽穀有一家 SaaS
公司的表現非常亮眼,光看下圖的增長曲線,剔去我們熟悉的Slack、shopify、twillio,誰最橫?

97年的MIT輟學青年,五年成73億美元獨角獸

圖片來源:CapIQ

無疑是那條陡峭的橙色曲線——Scale。從 0 到估值 73
億美元隻用了五年,ARR 從 0 到 1 億美元隻用了四年,Scale 幾乎是 SaaS
公司裏最快達到這些數字的。

髒活累活起家,Scale 是無名之輩嗎?

Scale 所在行業無疑是當下最 fancy
的行業之一,人工智能(AI)和機器學習(ML)。想到人工智能,我們腦子裏可能都是科幻電影中那些能夠與人爭天下的機器人,但事實上,這個景象還離我們很遙遠,離身處於這個行業的
Scale 更是遙遠。

Scale
最初做的是這個行業最不性感、最接地氣、最能被稱為髒活累活的事情,即數據標注。

所謂數據標注,就是企業客戶,比如自動駕駛汽車公司,給到 Scale 一些圖片、視頻等等,Scale
找一群人,給這些圖片和視頻打上標簽的過程。

這裏的打標簽,不是我們理解的命名那麽簡單。舉個例子,Toyata 和 Lyft 給 Scale
發送一張馬路上的圖片,如下圖,Scale 就得找人把這些汽車圈出來,並且標注為 ” 汽車 “。

97年的MIT輟學青年,五年成73億美元獨角獸

圖源:Scale Pandaset

這個過程其實大家都很熟悉,我們經常在登陸驗證的時候被要求指出某些物體,比如下圖要求指出所有帶有船的圖片,即標注這些圖片:

97年的MIT輟學青年,五年成73億美元獨角獸

你也許不會相信這世界上最性感而又高端的行業裏,有如此鼓噪的一環, 而這才是開頭那個具有靚麗增長曲線的 Scale
起家的業務。

Scale 由Alexandr Wang和聯創Lucy
Guo
創立於 2016 年的 YC,當時這個公司還叫做 Scale API,隻是一家有 API
的土耳其機器人。

土耳其機器人指的是亞馬遜的一個眾包平台,研究人員在網站上發布瑣碎任務,比如給圖像加標簽、進行調查、抄錄收據等,用戶領取任務,在完成後能賺取少量現金。這聽起來是個人力驅動的公司,需要大量來自發展中國家的外包團隊,依靠經濟發展的不平等獲利。

但目的比手段重要。

塵埃裏的資本寵兒

Scale 的創始人Alexandr Wang出生於 1997 年,父母都是 Los
Alamos National Lab 的物理學家。他的名字從 Alexander 去掉了一個 e,因為父母想讓他的名字剛好有 8
個字母,8 在中國代表著好運。他本身非常優秀,大學被麻省理工錄取,大一滿績,之後輟學。輟學之後,他先去了 Addepar 和
Quora 工作,也在 Hudson River Trading 也工作過一小段時間。

2016 年,他和另一名來自卡內基梅隆大學的輟學生Lucy Guo和 Thiel
的一名同事一起組隊,進入了YC2016
春季營
,其實當時的他也不清楚自己創業具體要做什麽,隻是對市場痛點有一定的洞察。

他曾描述道:” 盡管麻省理工有數百名才華橫溢、天資過人的學生,但是沒有人用 AI
成功地構建任何東西。我們都在研究人工智能,卻都遇到了一大瓶頸——沒有好的數據。盡管如此,市麵上也沒有可以解決這個問題的標準化工具,我們有
AWS、Strip 和 Twillio,卻沒有任何人係統性地解決數據問題,這導致 AI 和 ML
的發展止步不前。”

具體來說,他每天打開冰箱的時候,都會想在冰箱裏安裝一個攝像頭,攝像頭會告訴他什麽時候需要補充哪些雜貨,這聽起來並不難,但他根本做不到,因為沒有適用的數據工具。

因此,他們決定做 Scale。

Alexandr 確實精準地擊中了市場痛點,因此 Scale 發展地順風順水:

2016 年 6 月,Scale 正式成立,YC 投資了 12 萬美元換取公司 7%
的股份。

2017 年 7 月,Accel 領投 450 萬美元 A 輪。

2018 年,完成 1800 萬美元 B 輪,同年,Scale
進軍自動駕駛領域,並且拿下了許多行業內赫赫有名的客戶,比如 GM、Cruise、Lyft、Zoox 和
nuTonomy,標注的數據超過 20 萬英裏。

2019 年 8 月,完成 Founders Fund 的 Peter Thiel 領投的 1
億美元 C 輪,跟投包括 Accel、Coatue Management、Index Venture、Spark
Capital、Thrive Capital、Instagram 的創始人 Kevin Systrom 和 Quora 的 CEO
Adam d ’ Angelo。此時的 Scale 正式邁入獨角獸行列,估值十億美元。同年,Scale
宣布擴展行業領域,拿下了 OpenAI 和 Lyft 這種其他行業的頭部用戶。

2021 年 1 月,以 35 億美元估值完成老虎基金領投的 1.5 億美元 D
輪融資,同時宣布進軍標注之外的新業務,發布 Nucleus。

2021 年 4 月,以超過 70 億美元估值完成來自 Greenoaks
Capital,Dragoneer 和 Tiger Global 的 3.25 億美元 E 輪融資

至此,可以說,Scale 是個徹頭徹尾的資本寵兒。

從團隊到業務,它擁有一切矽穀寵兒的標簽:AI、API、YC、野心勃勃、年輕、才華橫溢、大學輟學創業、行業洞察。

Scale 一掃早期的包工頭形象,儼然已經是一家性感的 AI/ML 公司。而相比其他 AI/ML 公司,它又不受 ” 紅顏薄命
” 的詛咒,就連Peter Thiel都說:” 在激烈的競爭中,AI
公司們會出現又消失,但是 Scale 會一直存在。”

那麽這樣的轉變原因是什麽呢?

Peter Thiel 一語中的:” 因為 Scale 提供的是整個 AI/ML
行業的基礎設施,數據是這個行業最重要的東西。”

AI/ML 的基礎是數據,所謂的機器學習就是機器輸入並學習數據,從而輸出正確的編碼。沒有數據也就不會有 ML 或者
AI,並且,不好的數據比沒有數據更加糟糕。學習一堆垃圾隻會導致機器產出另一堆垃圾。

可以說,數據標注是個普適性的需求,隻要一個公司存在,它就有數據標注的需求。

這個領域的領頭人 Andrew Ng 曾發推說:“AI 係統 = 代碼 + 數據
,大多數的學術型競爭對手都不會去碰數據,而是在代碼上埋頭苦幹,但試想一下,如果有一個 team
可以不動代碼,光在數據上下功夫。” 而這剛好就是 Scale 在做的事情。

97年的MIT輟學青年,五年成73億美元獨角獸

既然數據如此重要,為何沒有更有實力的巨頭躬身下場,拿下這塊香餑餑?

前文也提到,數據標注是份髒活累活,受過良好教育的精英們寧可在代碼堆裏狂卷也不願意碰數據標注。巨頭不太可能在這個領域費心,他們的員工都太優秀了,不太可能把時間浪費在注釋上。這一點剛巧給到了早期的
Scale 足夠大的成長空間。

始於數據標注,不止於數據標注

當然,如果一直沉迷於數據標注,Scale 無疑隻是一家利用發展中國家便宜人力牟利的外包公司,何談科技?

其實不然,盡管 Scale
的商業模型最初看起來更像是服務業,通過人工支撐起業務,但是隨著它自身數據的積累和模型的成熟,有些標注工作正在被機器取代。

相比於最初的純人力驅動,現在 Scale
能讓算法和人工配合著去做數據標注。算法會先把視頻切成一幀一幀,並且粗略標注這些圖片,在這之後,人工會接過來做更精細的標注。由此,Scale
在服務價格降低的同時,利潤率也在升高。

同時,Scale
在戰略上頗有遠見,他們從很早就計劃著從數據標注起家慢慢開發出一整套產品,讓這些產品協同作用,以更快的速度創建更好的模型和更好的結果。

Alexandr Wang 認為,數據是 ML 和 AI 領域的基礎設施,因此數據標注隻是個開始。Scale
的存在就為了通過建造最以數據為中心的基礎設施平台來加速 AI
應用的開發,它的核心信念是,數據就是新一代的代碼。Scale 想做 AI 領域的 AWS,支付領域的
Stripe,數據分析領域的 Snowflake。

97年的MIT輟學青年,五年成73億美元獨角獸

圖源:NotBoring.co

2020 年 1 月,在完成 D 輪融資之後,Scale
宣布除了標注之外的新業務Nucleus。Nucleus 是一個用於數據調試的 SaaS
工具,具體包括解讀數據、數據可視化、清洗數據和數據合作,從而幫助公司們建立更好的 ML 模型。

97年的MIT輟學青年,五年成73億美元獨角獸

圖源:Scale

Nucleus 的推出使 Scale 開始得到一些長尾客戶,並且拓展到更多行業。同年 5 月,Scale
發布文檔產品Scale Document

Scale 在完成了前五年數據標注積澱之後,一步一步把觸角伸向整個 AI 的生命周期,畢竟,數據標簽和數據生成隻占整個
AI/ML 基礎設施圖譜中的 1/20。按照 Scale 的劃分(如下圖),AI
的生命周期包括標注、管理、自動化、評估、搜集、產生數據,這其中的每一步,Scale 都要漂亮地拿下。

97年的MIT輟學青年,五年成73億美元獨角獸

AI 的生命周期,圖源:Scale

在 E 輪融資過後,Scale 正式宣布其願景為” 讓每個行業都能實現 AI 的應用。Scale 為公司提供管理
AI 的整個生命周期的基礎,無論他們是否有自己的 AI 團隊,我們都會幫助他們建立 AI
策略,保證他們能夠擁有產出高效模型基礎設施。”

這是一副極其宏偉的藍圖,回憶一下互聯網如何從一個小圈子擴展到如今萬物互聯,我們就可以想象,Scale 的野心有多麽大。

AI/ML 基礎設施市場將在未來幾年內達到 3000 億美元。到 2024 年,預計 Scale
的數據標注的潛在市場份額能達到 200 億美元,光是 Document 和 Nucleus 的潛在市場份額就可以達到 100 億美元和
80 億美元。

除了戰略遠見之外,Scale 的內功也夠硬。

和 Stripe 一樣,Scale 很受程序們的喜愛,它把細節做得很好,“API
非常好,有開源數據集、文檔很幹淨。”

許多大客戶用 Scale 也不單單是因為不想幹數據標注的活兒,而是因為 Scale 的人才密度更高,Scale
的推特有一半都是在欣喜若狂地宣布從哪兒挖了大牛,或者是組織了什麽集聚大牛的行業盛會。

97年的MIT輟學青年,五年成73億美元獨角獸

圖源:Twitter

Scale 的 CTO 就是從 Amazon 挖過來的 AI 專家,而戰略負責人則是前美國國家首席技術官。

97年的MIT輟學青年,五年成73億美元獨角獸

圖源:Twitter

財務 SaaS 公司Brex也是 Scale 的客戶,而在問及為什麽 Brex
不直接自己雇傭一個 AI 團隊時,其 CEO Dubugras 說:” 他們擁有許多 AI
市場上最優秀的人才,而我不能隻是打個響指就雇好一個優秀的團隊。AI 工程師們也希望可以在解決領域內最難的問題的公司工作,Scale
就是其中之一。”

回望 Scale
短短的五年,它的故事像極了灰姑娘,看似毫不起眼,卻一路逆襲,骨子裏是對商業極度敏銳的純正血液。

我們期待著 AI/ML 領域的 AWS,Twillio,Stripe,Snowflake 的誕生。

華客新聞 | 時事與歷史:97年的MIT輟學青年,五年成73億美元獨角獸