Skip to content

馬斯克機器人招群嘲,學者:先像人手一樣抓取吧

矽穀“鋼鐵俠”馬斯克又放大招:Tesla
Bot——身高1.72米,體重56公斤,身材苗條,外形優美。馬斯克在PPT上說,Tesla
Bot的原型機(prototype)明年就要來了。不過,外界的群嘲來得更快——知名科技媒體The
Verge對此標題便是:《別想太多,馬斯克的Tesla Bot就是個笑話》。

當下,從真實應用場景出發設計的機器人,執行抓取任務的看起來像機械臂,能跑起來的四足機器人看起來像狗。即使強如波士頓動力,設計出來的機器人Atlas也是手長腿短,頭重腳輕——它身高150cm,體重86公斤,與其說像人,不如說像黑猩猩。

530a84739417TpgNtFl5

波士頓動力家族機器人合影

波士頓動力的Atlas可以5.4km/h的速度移動。而Tesla Bot可以8km/h速度運動,這意味著Tesla
Bot不僅更好看,運動性能還更好。另外,波士頓動力的機器人是沒有手指的。而Tesla Bot則有一雙“美手”。

不僅外觀像人,馬斯克還想讓這個機器人像人一樣具有“通用智能”。一位卡內基梅隆大學的人工智能和機器人學博士接受澎湃新聞(www.thepaper.cn)采訪時表示:“現代的人工智能基於學習算法,但是目前在機器控製領域這些算法的效果還難以令人滿意,從這個角度說,一個可以在明年發布的‘通用’機器人肯定不會像人們期待的和終結者一樣先進。”

這位卡內基梅隆大學的人工智能和機器人學博士表示,“從另外一個角度說,機器人領域的硬件和算法是高度相關的,在關節控製、手部精細操作、視覺信息理解等幾乎所有的技術細節上,現在的硬件層麵上也有太多要攻克的難題。在現在的學術界和業界發展狀況下,‘特斯拉能否在明年發布一個通用人形人工智能機器人’還不應該是一個可以被嚴肅討論的問題。除非特斯拉重新定義了‘通用人形人工智能機器人’。不過在嚴肅的科研攻關和學術討論之外,馬斯克把這些技術領域的願景帶入公眾的視野,從星鏈計劃、完全自動駕駛到移民火星,都是如此。我覺得長期來看這種技術討論的大眾化是有它的正麵作用的。”

其實,就運動能力來說,要在一年內做出已經很難。工程類知名學術期刊 IEEE Spectrum 的Evan
Ackerman表示,“像波士頓動力公司和敏捷機器人公司這樣的公司幾十年來一直在研究可以在人類環境中導航的機器人,但這仍然是一個非常困難的問題。我不知道為什麽馬斯克認為他可以突然做得更好。”

530a84739430OZHNA8wT

CNN(美國有線電視新聞網,Cable News
Network)稱伊隆·馬斯克又向其長長的“明年”就發布清單中增加了一項(標題為《Elon Musk just added a
robot to his list of things always coming ‘next year.’ For now he’s
got a guy in a
suit》)。報道中指出,雖然馬斯克在特斯拉和SpaceX中的工作顛覆了汽車和航天業,但他也以錯過最後期限和過度承諾聞名。

530a847394457qMlOBSM

彭博社分析,馬斯克常常在僅僅有原型的時候就公開產品——基本是在一個想法成為實際產品前就售賣它。2017年的11月,特斯拉公開了他們的Semi卡車,但該車最早要被推遲到2022年上市,部分原因是製造更大的電池麵臨挑戰。華爾街風投機構Loup
Ventures知名分析師Gene
Munster表示,“伊隆有遠大的願景。對投資者來說,特斯拉機器人是他們可以發揮想象的新事物,D1芯片更具實質意義,但對於大多數投資者來說卻很無聊。”

當天現場,特斯拉CEO馬斯克通過幾張PPT介紹了Tesla
Bot的基本情況:機器人麵部是一個顯示屏,顯示屏背後是多個攝像頭,手部達到人類水平(Human-level hands)。

機器人麵部配備了特斯拉在自動駕駛中使用的Autopilot攝像頭充當感知係統,胸腔裏內置FSD自研芯片。Tesla
Bot可以8km/h的速度運動,提起約20公斤的重物,有約68公斤的硬舉能力。特斯拉已有的多攝像頭神經網絡、規劃能力、標記能力都會應用到Tesla
Bot中。

馬斯克在8月20日的特斯拉AI日上稱,Tesla
Bot將用來處理“無聊、重複和危險的工作”,比如讓機器人幫忙跑雜貨店拿東西,目標將是用於通用機器人的人工智能技術。在他們的計劃中,Tesla
bot將會達到和人類的尺寸以及重量相近的物理特性,並且會具有用於自動駕駛的相機係統和計算單元。

馬斯克簡短介紹完Tesla
bot不久之後,一位形似日本超級變變變的演員穿著緊身衣就在舞台上尬舞起來,除了開頭登台是機械舞,之後不知道是什麽舞蹈。馬斯克笑著說,“演員不是真正的機器人,但特斯拉機器人將是真實的。”

對於特斯拉所稱的將於明年發布Tesla
Bot的前景如何,上海交通大學副教授馬道林在接受澎湃新聞(www.thepaper.cn)采訪時表示,發布機器人硬件樣機本身,一定可以實現。真正的難度在於這個機器人能做什麽,而對於這方麵特斯拉並沒有承諾什麽。“我個人覺得他們是開了一條嶄新的任務線,馬斯克口中承諾的是一年後拿出Tesla
Bot樣機(Prototype)。通常樣機的核心功能是做概念驗證,並不會期待它能真的去執行多麽複雜的任務。在前期積累的基礎上經過未來一年的持續研發,我猜測,他們拿出來的應該是一款可以慢慢走並和觀眾招招手、點點頭和顯示笑臉的產品。”

馬道林進一步解釋,特斯拉的技術長處除了硬件製造之外,很大程度在於基於人工智能的導航(Navigation)能力,特斯拉會將自動駕駛汽車所具備的對周圍環境的三維重建和感知以及決策能力移植到機器人上。

“在能做什麽方麵,我估計他們一定會突出導航和移動能力,比如說通過讓機器人所在的房間或商店很複雜來展示他們強大的導航能力,而弱化甚至於不展示操作能力。”馬道林預計,“理想情況下,明年的demo會正如馬斯克所舉例的那樣,演示人員說‘去某某地方把某某物品拿給我’,Tesla
Bot通過語音識別理解了這一任務,導航並走到那裏,以簡單的方式拿到物品並送到演示人員麵前。演示結束。”

一位在機器人和人工智能領域發表了多篇高影響力論文的機器人抓取和操控(Grasping and
manipulation)領域的資深研究者向澎湃新聞(www.thepaper.cn)表示:“從物體抓取操作(grasping /
manipulation)的角度來說,基於五指的算法都還不成熟,機器人領域的算法都是跟機械結構適配的,連硬件都沒有的時候,對相關算法的討論是沒法進行的。我不認為Tesla在明年可以發布人們期待的通用人形機器人,馬斯克的這個項目很可能會一直擱置下去。”

“隻能說那是一種願景,人類覺得一個足夠智能的機器人應該可以被造的和人外觀類似,但是為了實現這個目標,需要做的還有很多。另外,為了讓他‘像人’有時候需要付出額外的努力,現在在傳感器、感知算法、控製算法、機器人硬件等領域的差距還很遠。馬斯克在發布會上沒有介紹相關細節,我隻能從我了解的情況判斷,明年發布的機會應該是不大的,或者說可以發布的東西和一些公眾基於科幻做出的想象是有很大落差的,”一位美國頂尖大學機器人領域教授表示。

雖然對於特斯拉所說的能在明年發布通用人形機器人並不看好,但馬道林認為,“不管怎麽說,更多的大型科技公司進入機器人領域,利用其強大的工程和製造能力刷新硬件製造的海平麵,對這一領域的研究和發展都是很好的事情,讓我們拭目以待吧!”

馬道林本科和博士畢業於北京大學,後進入麻省理工學院進行博士後研究,並於去年加入上海交通大學船舶海洋與建築工程學院擔任副教授。馬教授的論文“基於觸覺測量的相對運動跟蹤和外部接觸感知”
(Extrinsic Contact Sensing with Relative-Motion Tracking from
Distributed Tactile Measurements)於今年的機器人領域頂級會議ICRA上獲得最佳論文獎。

以下為馬道林接受澎湃新聞采訪實錄:

澎湃新聞:周五的Tesla AI
Day中,馬斯克表示,將“自動駕駛”和其他技術結合,遷移到人形機器人身上是順理成章的。您認同這個通往通用人形機器人的路徑麽?相較於自動駕駛等技術,實現人形機器人的獨有的難點有哪些?

馬道林:特斯拉,是一家智能設備硬件科技公司,這個通往通用人形機器人的路徑,我的理解,一是特斯拉有優秀的硬件工程師和一流的加工工廠,他們擅長去製造機器人所需的電池、驅動電機、傳感器等硬件,這些公司運用已知技術做起硬件迭代來可以遠遠比大學實驗室更強大;二是,特斯拉有在自動駕駛領域積累的強大的人工智能計算硬件和算法基礎,特斯拉自動駕駛汽車所具備的基於視覺對周圍環境的重建和感知能力,可以輕鬆地移植到機器人上,去輔助機器人的導航和決策。三是,技術之外,特斯拉現在很有錢,而且在全球新能源政策走向的支持下,未來也十分看好,不差錢,對他們來說,燒點錢做些高風險但有很大媒體關注度的事情,應該挺劃算。

從學術界的進展來看,人形機器人的難點還是很多的。一方麵是硬件設計方麵,雖然波士頓動力已經展示了很強大的硬件設計,但世界上似乎還沒有另外一家公司的人形機器人能接近波士頓動力。雖然人們早就知道如何去實現幾十個關節的運動結構設計,但是在驅動方麵,有著大量的工程和技術挑戰,這幾十個關節所需要的驅動器有多種不同大小或規格,在許多關節處的驅動結構在結構體積受到限製的情況下還要滿足扭矩和速度方麵的苛刻需求,難度不小。波士頓動力在液壓驅動方麵的造詣恐怕是其他公司所望塵莫及的。而另一方麵是運動平衡。和四足機器人不同的是,人形機器人兩條腿在運動中需要兩條腿交替支撐,一旦其中一條腿的節拍跟不上就會摔倒。因此人形機器人更多地要在運動中實現自身的動態平衡,而在移動或執行操作任務中保持如此複雜多體係統的動態順滑的自平衡,是很有挑戰性的規劃和控製問題。2015年DARPA機器人挑戰賽中機器人屢屢跌倒的現狀給許多人留下了深刻的印象。

澎湃新聞:目前對人形機器人一個很重要的期待是手部的精細操作,這和馬老師你在機器觸覺領域的研究息息相關。今年您在ICRA上獲得的best
paper也是這個領域的成果,請問這個領域目前的困難有哪些呢?

馬道林:前麵還隻是說了人形機器人的移動或運動問題,要讓人形機器人對人類有用,很大程度上要依賴於解決機械手精細操作或者說靈巧操作問題。把機械手靈巧操作作為一個獨立的機器人子係統來理解的話,要解決的問題要包含硬件驅動,傳感與感知,以及規劃與控製這三個方麵。其中,硬件設計是基礎,也是相對來說最容易理解並進行仿生設計的部分;但另外的兩個方麵則還困難重重。

對於傳感和感知部分。我們今年在ICRA上發表的工作,是解決了觸覺傳感和感知方麵的一個重要問題,實現了對手中物體運動狀態的精確跟蹤和對物體外部接觸的定位感知,我們期待在未來的工作中將觸覺感知和與現在業已取得巨大進展的視覺傳感和感知相結合,為機器人操作提供較為完備的感知信息。

而對於精細操作所需的規劃和控製,相對於人們的期待,目前大家的研究還隻是嬰兒階段,有相當長的路要走。這裏麵的挑戰既有硬件不完備帶來的研究限製,更有來自於操作問題本身的難度。首先,機器人操作要解決的問題是通過對機械手自身的控製,調節手中物體與外界(各種並不規則的)環境的接觸行為,以實現物體位姿或物體與環境相互關係的改變,在問題複雜度上顯著高於機器人行走問題。其次是機器人操作的任務包羅萬象,從研究的角度也很難找到一個操作任務去代表所有任務,難以找到理想的benchmark問題並攻關解決。最後,機器人操作,非常關鍵的是各種操作中接觸行為的理解和利用。多關節的手指、手掌以及外部環境,甚至於胳膊和身體等,處處都可以和物體發生接觸,需要理解和預測這些接觸行為對物體運動狀態的影響並妥善加以合理利用,這是非常複雜和困難的規劃任務。而且,在這些規劃和控製中,還要與我們前麵提到的觸覺傳感和感知能力以及視覺傳感和感知能力相結合,才可以形成完整的控製閉環。

澎湃新聞:特斯拉給出了在一年內發布“通用人形機器人”Tesla
bot的時間表,您覺得這麽短的時間內完成這個目標是可能的麽?

馬道林:我個人覺得他們是開了一條嶄新的任務線。馬斯克口中承諾的是一年後拿出Tesla
Bot樣機(Prototype)。通常樣機的核心功能是做概念驗證,並不會期待它能真的去執行多麽複雜的任務。在前期積累的基礎上經過未來一年的持續研發,我猜測,他們拿出來的應該是一款可以慢慢走並和觀眾招招手、點點頭和顯示笑臉的產品。特斯拉的技術長處除了硬件製造之外,很大程度在於基於人工智能的Navigation能力,也就是導航,特斯拉會將自動駕駛汽車所具備的對周圍環境的三維重建和感知以及決策能力移植到機器人上。我預計,理想情況下,明年的demo會正如馬斯克所舉例的那樣,演示人員說“**,去某某地方把某某物品拿給我”,Tesla
Bot通過語音識別理解了這一任務隻會,導航並走到那裏,以簡單的方式拿到物品並送到演示人員麵前。演示結束。

所以,發布機器人硬件樣機本身,是一定可以實現的。因為問題的真正難度在於這個機器人能做什麽事,特斯拉也沒有承諾什麽。在這方麵,我估計他們一定會突出導航和移動能力,比如說通過讓機器人所在的房間或商店很複雜來展示他們強大的導航能力,而弱化甚至於不展示操作能力。但不管怎麽說,更多的大型科技公司進入機器人領域,利用其強大的工程和製造能力刷新硬件製造的海平麵,對這一領域的研究和發展都是很好的事情,讓我們拭目以待吧!

華客新聞 | 時事與歷史:馬斯克機器人招群嘲,學者:先像人手一樣抓取吧

相关推荐: 新任AIT處長孫曉雅會晤蕭美琴 談擴展美台關係動能

AIT台北辦事處處長孫曉雅(左)即將在夏天履新,7日先與駐美代表蕭美琴(右)在華府會晤。   圖:取自twitter.com/TECRO_USA 新任美國在台協會(AIT)台北辦事處處長孫曉雅即將在夏天履新,赴任前昨天先與駐美代表蕭美琴在華府會晤。駐美代表處表…