Skip to content

AI訓練師:曾月入過萬,如今麵臨學曆天花板

1000

九派財經記者 黃夢琪 郭梓昊

兩張路況照片把電腦屏幕填滿,主角是圖片裏的路標。賀傑要做的,是對比出兩張圖片的路標變化,然後做上相應的標記。判斷、打標簽、提交……賀傑一秒就能完成,一天下來,她要為14000組左右的圖片打上標簽。

在賀傑身邊,32名員工坐在電腦前,屏幕上不斷閃動著新圖片,敲擊鍵盤的聲音此起彼伏,他們共同身份是“人工智能訓練師”,負責數據標注工作。而在辦公室窗外,則是典型的陝北鄉村光景,春天到來之前,植被稀疏,黃土裸露,成排的窯洞清晰可辨,偶爾,拉貨的驢車從縣城的柏油馬路上走過……

2019年12月開始,一家名為“愛豆科技”的公司坐落在陝北小城——榆林市清澗縣。超過170多名縣城員工在這裏上班,在此之前,他們是縣城上的寶媽、農民、甚至是政府職工。隨著AIGC領域競爭越發激烈,這些身處供應鏈最前端的縣城AI訓練師們,成為互聯網熱議的焦點。

而在另一方麵,通過這家數據標注公司,縣城的人與全世界最前沿的技術產生了聯係。縣城電視台的廣告裏,清澗縣城形容為榆林“矽穀”,號召在外打工的人回鄉就業,喊出了“初中學曆也能幹高科技”“隻有你才能拯救它”的口號。

在刀削麵店老板娘眼裏,愛豆是縣城裏少數“敲敲電腦就能完成”的工作,非常時髦;一位在縣政府工作人員稱,愛豆公司當地納稅大戶,年營收一千多萬;甚至大馬路邊賣水果的攤販們,都能為你指明公司的方位……

談起所在數據標注行業,愛豆公司負責人魚濤略帶驕傲,“有多少人工,就有多少智能。中國甚至世界上新的技術,像ChatGPT,社會上可能還沒出現,我們(標注員)已經在為它做準備了。”

改變發生的背後,這家依托於縣城的AI公司,如今也麵臨來自縣城的限製。貧瘠的人才現狀、脆弱的產業環境、越來越難的數據標注項目……在真正與外部世界發生碰撞之前,縣城AI公司遭遇了現實的瓶頸。

一、縣城的AI初印象

與清澗縣城其它公司相比,愛豆公司幾乎是標準企業的模板。一切幾乎都是嶄新的——剛建起的辦公大樓、粉刷白亮的牆體、整齊劃一的電腦辦公桌,管理模式也向大公司學習,上班打卡、彈性下班,甚至還有專供女性職工的婦女角。

可這樣一家AI公司的到來,起初並沒有在這座陝北小城掀起什麽水花。2020年2月以前,清澗縣還是國家級貧困縣,產業發展仍依賴紅棗、小米、土豆等傳統種殖業。對於當地人來說,“人工智能訓練師”完全是陌生的詞匯。

魚濤麵對的第一個問題是,如何盡可能讓縣城人知道“AI”。

易拉寶從廣場等公共區域,擺到年輕媽媽聚集的學校門口;電線杆上的廣告位也被愛豆公司占上;就連縣長都在朋友圈都發出了招聘通知,要求“初中學曆以上,會計算機”……大力宣傳下,前兩次的招聘結果卻有些慘淡。

轉機發生在2020年4月,疫情稍稍緩和的那個春天,一則“爆炸性”新聞在縣城傳開:一位名叫楊彥軍的愛豆公司員工,拿到了超萬元的月薪。

1000

(清澗愛豆公司 黃夢琪/攝)

在當時,想在小縣城裏找份體麵工作並不容易。對當地女性而言,月薪在兩三千元的服務員、售貨員是最為普遍的選擇;男性則多從事體力活,做電焊、搞裝修、下地開荒,收入也勉強夠溫飽。有人在縣城“玩玩電腦”就能拿到上萬的月薪,無疑突破了清澗人的認知。

消息一傳十、十傳百,愛豆公司一下子成了當地的明星企業——三四百人向清澗縣愛豆科技有限公司投去了簡曆,求職者包括帶娃寶媽、回鄉待業大學生、前政府員工等,年齡跨度從八零後到零零後。公司一層的走廊也被擠得滿當,魚濤把三百多人分成好幾撥,花兩三天時間才完成麵試。

來公司參觀的縣市政府人員絡繹不絕,魚濤常常從早上接待到晚上。“幾個領導出門還在納悶,說玩電腦怎麽掙錢”。更有人向魚濤發出邀請,“能不能也在我們縣城搞一個AI公司?”

這也在無意間點醒了魚濤。彼時,呂梁山區發展標注業務的隻有清澗,無論從業務體量還是品牌知名度,都難以和東南部其他數據標注公司競爭。

“如果能把清澗愛豆公司的模式複製到其他縣市,形成一個產業帶,是不是更有競爭力?”魚濤覺得可以一試。2020年8月,在距離清澗93公裏的山西永和縣,孵化下一個AI公司——永和縣數字就業中心。

二、打開了一扇窗

比起清澗,地處呂梁山脈南端的永和縣更為閉塞。在當地人的印象裏,十幾年前,永和縣城還是灰蒙蒙的,馬路沒有鋪上柏油、塵土飛揚。由於沒通鐵路,上學、打工的永和縣人習慣坐兩個半小時的大巴,到200公裏外的臨汾市轉車。按照永和就業中心總經理李林峰的說法,“正常的企業都不會願意來永和這樣的地方。”

這也導致當地缺乏提供就業崗位的產業。幾年前,永和中小學附近密集分布著麻將館,縣城裏的女性沒有別的事情幹,送孩子上學後就去打麻將。發展到後來,連同孩子的午餐也在麻將館裏解決。

AI公司的到來正在悄無聲息地改變永和縣城。數字就業中心成立不到一年,吸納了不少待業女性,麻將館一家跟著一家黃了。“現在身份變了,公司女員工們都是老公帶孩子、做飯,自己上班工作。”用魚濤的話說,無論是在永和還是清澗,AI的工作都給縣城人“打開了一扇窗”。

1000

(清澗愛豆公司業務欄 郭梓昊/攝)

在來到數字就業中心前,33歲的白雪將所有精力都撲在孩子身上。要喂奶、飯打翻,孩子的無時無刻不在觸動這位寶媽的敏感神經,麵向丈夫傾訴時,白雪漸漸不能控製自己的脾氣,吵架成為家常。“在家待得越久,越是壓抑。”白雪說。

如今,通過金融風險事件的標注業務這個窗口,白雪第一次認識到了外部世界。

密密麻麻文字占滿了電腦屏幕,一周內的公司新聞,都會出現在需要標注的文本裏。財務信息造假、實際控製人涉嫌違法、稅務非正常戶、延期信息披露、偷稅漏稅……白雪能一口氣背出這串名詞。

朋友們常常驚訝於白雪的見聞——在標注中,白雪了解胡鑫宇事件的前因後果,她甚至清晰記得新聞發布會召開時間;不怎麽追劇的她也知道了近期大熱的《狂飆》,明白了“風浪越大魚越貴”的道理。“高啟強犯了罪,涉嫌違法的是公司實控人還是公司高層,這就是我要思考的內容。”白雪說。

同樣被AI喚醒的,還有魚濤。接管愛豆公司時,魚濤對AI業務毫無概念,直到訓練機器的數據標注工作擺在他麵前,困惑越發濃烈,為什麽AI需要人工?

關於數據標注是怎麽回事,魚濤是從書中看來,辦公室裏,他買來的書擺滿了兩個櫃子。書中的世界給魚濤帶來了衝擊:測試機器是不是具備人類智能的圖靈測試、擊敗頂尖棋手柯潔的阿爾法狗、爆火網絡的ChatGPT,魚濤驚歎於世界的改變。

1000

(魚濤為了解“數據標注”買來的書 郭梓昊/攝)

“以後是不是好多人被AI取代了”魚濤很長時間一直在想這個問題,但有限的知識很難提供獲得一個答案。他隻能寬慰自己,“火車出來後,趕馬車的人沒了嗎?這是一種時代的進步,如果工作都被機器取代了,人類就坐下來享受。”

三、“我隻是一個標注工”

麵對AI公司的到來,兩地政府、愛豆公司的員工都曾寄予了希望。在公司落地之處,政府提供了辦公場地、電腦等辦公設備;員工們紛紛把待業的家人、朋友介紹到公司裏。清澗公司也很爭氣,2年時間,公司員工來到了170人,辦公區從兩層擴充到三層。

可AI公司能在多大程度上改變縣城貧瘠現狀?就連魚濤也說不準。說到底,這份工作的本質仍是流水線上的螺絲釘。

到愛豆公司工作前,惠卓覺得AI標注工作很“高大上”,而上手一段時間後,她逐漸發現數據標注的另一麵——門檻低、且需要忍受不斷循環。在上一個任務裏,惠卓一天要給數千張甚至上萬張圖片打標簽,判斷它們是否涉及暴力。

由於左手腕輕微挪動時會與桌麵產生摩擦,工作半年後,賀傑的手腕內側就起了繭,需要在左手腕下墊一條毛巾。她形容,這就像農民幹活,每天都拿著鐵鍬,手也會起繭,歇一段時間“護理”一下,繭子就能消下去一點。

枯燥、機械……不可否認,數據標注是一份重複性強的工作,也是消磨人的。“如果整個人工智能領域是一顆雞蛋,我們連雞蛋皮都沒碰到。”惠卓說。

1000

(永和縣城裏的“人工智能訓練師” 黃夢琪/攝)

對著電腦屏幕,惠卓有過一閃而過的念頭:“我做的東西到底有什麽用”“數據標注以外,上下遊到底是怎麽回事”“自動駕駛的汽車,難道不怕撞到人”“機器越來越聰明,未來會不會統治人類,像電影裏一樣?”

偶然的瞬間,這些數據標注員負責過的業務會與他們的生活發生映照。一次,員工王慧收到花唄平台的催款電話,聽著客服用生動語氣報出了欠款數目,王慧感到莫名的親切,“我就是喂養AI客服催款,它的問題、回答是怎麽形成的,我都清楚。”

但“一閃而過”也就過去了,循環反複的勞動中,期待也日複一日消失。“你試試坐在電腦跟前,做一天任務。”惠卓說,目前都是照貓畫虎,也沒有機會接觸更多的內容。在提及這樣一家AI公司給自己帶來什麽時,員工們的答案更多是“養家糊口”。

這一切,魚濤都看在眼裏,但作為公司負責人,他有著更為緊急的事情。過去三年裏,辦公場地、設備都由政府提供;接到的業務訂單大多來自起初合作的互聯網大廠。魚濤始終有一層隱憂:“一旦這些資源都撤了,愛豆公司是不是垮了?好不容易開啟的窗戶是不是就關上了?”

四、縣城的束縛與解放

魚濤所在的數據標注行業無疑還很年輕。2017年,伴隨無人駕駛與阿爾法狗帶來的AI浪潮,數據標注開始真正走進大眾視野。如今,經曆過一波洗牌之後,京東、阿裏等頭部公司相繼組建自己的數據標注部門和工具,標注業務也更向龍貓數據、Testin雲測等頭部企業靠攏。

相較之下,除了扶貧標簽帶來的屬性外,小縣城的AI公司在商業競爭上顯得毫無競爭力。

很長一段時間,像縣城AI公司較低端的數據標注業務,隻能存活於產業鏈底層,生存艱難。李林峰坦言,很多業務都需要幾千人的標注平台,體量小的公司能接到的業務可能已經被外包了好幾層。大部分時候,數據標注團隊都會麵臨兩個選擇——要麽無訂單可做,要麽接受虧本價。

為了公司的運轉,魚濤和李林峰都曾寄希望於尋求更多的訂單。

2023年3月,魚濤離開黃土高原,輾轉來到江南水鄉杭州,這裏有著最為濃厚互聯網氛圍以及最前沿的人工智能領域技術,魚濤此行的目的是,給公司拿下更多訂單。但很顯然,簽下訂單並非易事,推杯換盞間的兩天後,魚濤空手而歸。

魚濤感受到了一定落差。在清澗,魚濤有一定號召力,但到了更大的世界,這份優勢消失了。“我大專畢業,雖然也願意看一些書,但是眼界沒那麽開闊,很多專業上的問題未必能說得清楚。在商業談判上也會吃很大的虧。”魚濤說。

來不及多想,更大的危機已經到來。AI正以可感知的速度替代掉了曾經培育他們的數據標注師——如今,AI算法從“有監督學習”升級為非監督學習或強化學習,這意味數據標注門檻越來越高了。

縣城AI公司的業務,從最開始聽語音標注文字的基礎轉換,到需要培訓才能上手的醫療、法律等專業領域標注。再到現在,麵對陌生的英語文本,員工們隻能一個一個字母去核對,不少人因為幹不來,自行選擇了離開。

業務的改變對AI公司提出了人才要求。初中以上、高中、大專……最新一期招聘,清澗愛豆公司要招本科以上學曆的人。但這談何容易,“如果有能耐,誰不想往外走。”魚濤說。經過三年的運營,兩家公司把縣城裏能招的人都招了一遍,火爆的招聘場景也沒再出現。

依托於偏遠縣城廉價勞動力發展起來的數據標注產業,目前正陷入缺乏高學曆人才而止步不前的困局。這扇窗戶能開多大、開多久,沒人知道,但至少現在,有人從中找到了自己的價值意義。

身處縣城,白雪覺得自己是人工智能產品背後的一個“奉獻者”。他和同事們不知道ChatGPT到底是這麽回事,隻聽說這款產品很厲害、在美國很火,聊到最後總結一句話:“它再偉大,也需要我們這樣的人在背後做標注。”

通過AI工作,更多縣城人擁有了自己的生活和世界。永和縣城沒有公園,到了周末,數字就業中心的同事們就開著車,帶上孩子,去臨汾,或者是黃河對岸的陝西,一塊去旅遊。這很日常,卻已經是從前的她們不曾想到的生活。