Skip to content

機器人開始進工廠:為什麼難成優秀員工?

641

「機器狗會不會追壞人?現在的機器狗肯定不會,這就不是一項預設的任務。」4月10日,智元酷拓董事兼首席營運官邱恆對第一財經記者表示。

現在四足機器人已經應用於倉庫巡邏、電力線巡檢等場景。邱恆提到的這個案例,揭示了機器人面臨的現況:它們已經能執行預先規劃的特定任務,但智慧化程度還不足以使其自主完成一些工作,還遠遠不足以成為優秀的員工。

4月10日,兩家機器人公司同時公佈新技術進度。智元酷拓推出新一代四足機器人,靈初智能則發表大模型Psi-R2與Psi-W0,並開源首批1000小時人類手部操作資料集。中國科技企業快步推進創新,但這些企業的管理階層也指向共同難題:高品質數據的稀缺,阻礙了機器人「大腦」的發展。

“真機數據一定很難Scale-Up”

對於固定路線的巡邏任務,四足機器人已經游刃有餘。

四足機器人在巡檢過程中,如果遇到人員闖入倉庫,可以臉部掃描並辨識人員是否合法。如果非法的話,它可以語音警告,同時把照片或視訊訊息發送到雲端,發送給保全公司進一步處理。

目前四足機器人只有中國企業在大規模研發製造。根據IDC報告,2024年全球四腳機器狗市場出貨量約2萬台。中國廠商憑藉性價比和規模化能力重塑了產業格局,宇樹科技和雲深處的市場份額分別為32.4%、18.9%,排名第三的美國企業波士頓動力份額12.2%。

「巡邏巡檢、定點拍照,這是單步固定流程。」邱恆說。實際作業場景,是有自主規劃、即時異常處理需要的,但機器人還不能自主地去追擊竊盜犯。 「這就不是一項預設的任務。要追壞人,肯定無法先把路線設好,無法讓壞人按照路線跑。”

智元酷拓是智元集團旗下的子公司,專注於四足機器人開發。就人形機器人而言,宇樹科技與智元是中國出貨量排名前幾名的企業。

人形機器人以站立作業為主,移動為輔。例如在工廠的工位上的人形機器人,工作主要由手臂來完成;四足機器人則以移動為主,手臂作業為輔,它更適合移動及較長距離的搬運工作。

中國企業已經把人形機器人送上了春晚舞台,送到了手機生產線做物料箱的搬運,但人形機器人和四腳機器人當下面臨相似的境況。

圖片

「機器人按照什麼樣的路線去走,這是提前編程編好的。如果沒有提前編程設計,讓機器人獨立完成任務,比如給它一個指令,把某個東西送到某個地方,它以前沒做過,要自己看地形往哪走,判斷哪裡要上台階,哪裡要拐個彎。目前能做到這種能力的公司還不存在。」邱恆說。

中國有成熟的製造業基礎,因此機器人的硬體能力容易補足。雖然現在機器人的執行器、靈巧手等零件還有待完善,但隨著時間的推移,硬體會更加成熟。

「大腦」能力的突破則更難。

所謂機器人“大腦”,是業界形象的表述,它指的是掌管機器人智慧的模組。相對應的,小腦一般指掌管人形機器人運動的模組。

「大腦」的發展需要好的環境,就如嬰兒需要在真實環境中認知世界。但現在機器人「大腦」的培育所需的高品質數據有限。

「我還是認同,最終智能其實來自數據。」靈初智能聯合創始人陳源培在4月10日的一場直播中表示。

當晚,靈初智能推出大模型Psi-R2和Psi-W0,以及總規模近10萬小時的人類手部操作資料集,並開源了1000小時的資料。靈初智能這些數據是依靠人類戴上高性能手套,在實際作業場景中採集而來。這有別於操作機器人採集的數據。

網路上存在大量的語言、視訊類數據,它們成為大語言模式的燃料。而機器人的操作、運動方面的數據保存得非常少。而且,什麼是可行的資料發展路徑,業界也搖擺不定。

「最早的時候,大家都是用真機數據,直接拿機器人去採採。後面發現,真機數據的樣本效率太低了,所以又用了仿真數據。但是仿真又會有Sim2Real(模型從模擬域遷移到真實域時,由於數據分布不一致而產生的性能退化)的問題,所以現在大家又回到了真機。

圖片

在工廠進化

「雖然看得到一些東西,但是我覺得具身智能還沒到GPT-3的時候。」陳源培表示。

GPT-3是OpenAI於2020年推出的參數為1750億的大模型,它的出現令科技界看到了大語言模型的智慧曙光。

在大語言模型,縮放定律(Scaling Law)已經證明了有效性:模型效能會隨著模型規模、資料量和算力的增加而改變。高品質數據的稀缺,阻礙了縮放定律在機器人領域發揮作用。

「我對於機器人的商業化,是比較有信心的。但是對於機器人技術的進展是偏保守的。」陳源培表示,雖然技術瓶頸會突破,但是進度不會像大家想像的一下子就達到非常高的地步。

這意味著在相當長時間裡,機器人都難以進化出令人滿意的智力。不管是四足還是人形,機器人現在能完成的是部分特定任務,不能期待它變成一個通才。

這也是為什麼眾多機器人公司選擇在產業場景,而非家庭場景落地。

「我們的選擇很簡單,不會上來就做家庭場景,因為家庭產品的功能需求太多了。比如機器人擦桌子,碰到一張紙巾,要把它扔到垃圾桶裡;碰到一個手機,就不能扔垃圾桶裡,而需要把它放到旁邊。」陳源培表示,靈初智能更傾向於先在一些工業場景裡尋找機會,「我認為家庭場景內肯定是進不去的短期內肯定是進不去的短期內。

智元、宇樹科技等也有類似的考量。

「我們暫時沒有計劃做To C應用程式。」邱恆對記者說。智元的人形與四足機器人,選擇應用場景的時候有相似的邏輯。現在四足機器人已經在做安防巡邏、工業巡檢、消防等。 「先ToB再ToC,原因是跟技術成熟度有關係的。行業應用環境比較限定,業務容易閉環。但一旦到了人和家庭中,面對多元化的環境,它需要的智能更加複雜。我們想先把電網幹好,把煤礦幹好,把安防干好,然後再看要不要去裡面幹活。」

相對於其他國家,中國這樣體量龐大,場景多元化的經濟體有獨特優勢。那些已經有一技之長的機器人,不難找到施展的空間。例如宇樹科技在2025年已經出貨了5,500台人形機器人,近3萬台四腳機器人。智元在今年初,也已經累積下線了萬台人形機器人,部分機器人已經在手機產線上打工了。

一家研究機構的分析師先前對記者表示,現在一些整機廠商短期會交付一些工業場景的人形機器人,但仍需觀察這些機器人落地後的真實回饋,例如效率提升、下游客戶對於經濟性的考量,以及試用3-6個月之後,同一個客戶是否重複購買。

這些進入製造業流水線的機器人,會向開發企業回饋它們所遇到的問題。手臂操作精度不夠以至於出現偏差,電池管理不善以至於頻繁死機,這些都會時不時發生,但故障是機器人在工廠裡進化迭代的最佳起點。更重要的是,倉庫和變電站裡巡邏的四足機器人,生產線上組裝手機的人形機器人,會收集和回饋寶貴的真實世界數據,從而幫助機器人大腦的發展。

「一旦有了智慧化大腦,舊場景也會有新範式。以前單純做工業巡檢、資料收集的機器人,將會變成設備診斷專家;遙控探路的機器人,就會變成應急的尖兵」邱恆表示。

機器人還處於非常早期的階段,整個市場的滲透率連1%都沒到。邱恆認為,四足機器人比人形機器人更簡單一些,隨著智慧提升,成本下降,它會比人形機器人更早實現商業閉環。

華客|新聞與歷史:機器人開始進工廠:為什麼難成優秀員工?


探索更多來自 華客 的內容

訂閱即可透過電子郵件收到最新文章。