現階段將波士頓動力的核心定位於人工智慧和機器學習是不合適的

新聞 11-04

雷鋒網 AI 科技評論按，就在上個月，波士頓動力在 YouTube 上刷了一波 Atlas 2 的新技能。從視頻中可以看到，相比今年五月在跨越障礙時還得停頓片刻，這次 Atlas 2 可以直接奔跑著跨越了。

Atlas 2 這次秀出的技能分為兩段，跨越障礙+三級跳，這次的技能銜接和釋放更為流暢，也受到了眾多媒體的一致好評。一方面，大家感嘆技術越來越成熟，另一方面，卻由於報導在專業性上失實而引得相關研究人員反感。

比如如下言論：

硬體方面其實已經成熟，最難的就是演算法，從機器人設計來看，每一種動作背後是一個演算法，像是跑步、蹲、跳躍等，要把各種演算法軟體結合，進而協調雙足自由度的運作，其中人工智慧在此扮演了關鍵角色。

從這可以看到他做到了讓演算法快速迭代，人工智慧在此顯然扮演了重要角色。

波士頓動力需要用到複雜的人工智慧演算法，以保證機器人的平衡以及定位和導航功能。

來自義大利技術研究院（IIT），研究方向為仿人機器人的博士生任賾宇，近日就針對此言論發表了非常不同的觀點。他認為，現階段 Atlas 2 只是在極佳性能的硬體平台上使用傳統的運動控制方法去實現了這一系列令人震撼的高爆發力的跑跳運動，並沒有使用任何與人工智慧相關的機器學習演算法。

以上言論在他看來都有些「可笑」。「不知道這類信口開河的自信是從何而來」，他如是說道。他也表示，雖然一些做腿足式機器人相關的同行也都義正辭嚴對以上言論進行了留言和批評，但總的來說，保持頭腦清晰、客觀理智的人還是少數，大部分人還都在跟風鼓吹人工智慧和機器學習。

他進一步談到，大約從 17 年開始，很多研究人員嘗試將機器學習的理念應用於腿足式機器人，尤其是雙足機器人的行走（locomotion）控制中，取得了很好的成果。但大方向上，還是體現了當前機器學習類方法在雙足機器人硬體平台上落地的局限性，包括訓練周期長，可供採集的樣本少，機電系統不穩定性帶來的 corner case ，設置 Reward 難度大，模擬模型和實際模型相差太大等等，還有相當長的道路要走。

現在機器人界對機器學習這類新的方法和可能是非常開放的，但對於把現階段將波士頓動力的核心定位於人工智慧+機器學習，是極其不合適的。初衷也很簡單：

一方面，明明是一群做機電液壓系統實現+傳統運動控制的硬體和控制工程師辛勤工作的成果，憑什麼要被人工智慧收割？

另一方面，還原事實真相，找准現階段的差距和發展方向，我們才能儘可能縮短和別人的差距，否則只能被瘋狂收「智商稅」。

任賾宇進一步解釋，波士頓動力創始人 Marc Raibert 已經在很多場合公開聲明「目前沒有使用到機器學習相關的演算法，仍是基於傳統的運動控制去做實現，但並不否認未來使用的可能性」。

在今年馬德里 IROS 的 Planetary Talk 上，他也和朋友在會場又親耳聽 Marc Raibert 重複了一次，並且今年他的導師（Nikos G. Tsagarakis）被邀請為 Marc Raibert 的 Planetary Talk 的介紹人，和 Marc Raibert 私下聊了很多，再三確認過現階段 Atlas 2 仍然是基於傳統的運動方法。

從 Marc Raibert 在 IROS 整場 Plantary Talk 傳遞的觀點來看，任賾宇認為波士頓動力 Atlas 2 的核心是在於其：

獨一無二性能極佳的硬體平台 +「飽經錘鍊」的運動控制演算法（QP+RHC）

獨一無二性能極佳的硬體平台

Atlas 2 相關的集成結構與液壓系統

這類高能量密度、高集成緊湊度、高結構強度的液壓元件與機電系統，很難在地球上找到第二家。Raibert 在今年 IROS Planetary Talk 也提及：Atlas 2 的動力源液壓泵是做到了極小尺寸的高能量密度（5kw/5kg）——「You can not find it anywhere else in the world.」Raibert 相當自豪地說到。

對於「硬體方面已經成熟」這種言論，任賾宇表示，不知這樣的自信從何而來。另外，更不要談擁有硬體平台之後，後續相應的優化，維護和調試工作了。

「飽經錘鍊」的運動控制演算法

具體來說，Atlas 2 的運動控制大方向是基於 QP+RHC (Raibert 2018 IROS 口頭敘述)：

Quadratic Programming（QP）二次規劃；

Receding Horizon Control（RHC）= Model Predictive Control（MPC）模型預測控制。

QP 與 RHC（MPC）是做運動控制的同行比較熟悉的，但把這類大家都熟知的控制方法應用在 Atlas 2 這個大人型上，實現最近我們看到的後空翻、三級跳與跑酷相當困難——需要一個漫長而複雜的基於實際硬體系統（考慮單個驅動器存在的超調、滯後與誤差與多個驅動器誤差的疊加與耦合）的調試和優化。

任賾宇舉了如下兩個小例子去簡單闡述當前實驗室中做的運動控制與波士頓動力的差距:

模擬環境中的運動控制 ≠ 實際硬體平台的運動控制；

小尺寸雙足人形（諸如 Nao）的運動控制 ≠ 大尺寸仿人雙足人形的運動控制。

他表示，真正好的運動控制演算法需要在實際的硬體平台上花心思精力去調試，也即他所指的「飽經錘鍊」！

「Marc Raibert 也再次著重提及要大膽在硬體平台上做調試的重要性——『People nowadays are afriad of breaking robots, the right way is building it, breaking it and fixing it!』也希望大家不要以訛傳訛，多和國際交流，找准正確的方向，腳踏實地去追趕。」

雷鋒網雷鋒網

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 雷鋒網 的精彩文章:

※人工智慧高峰論壇——從研究到產業
※IJCAI 理事會主席楊強：IJCAI 19 要與社會議題做「強關聯」，讓 AI 學術會議走近大眾

TAG:雷鋒網 |