當前位置:
首頁 > 知識 > 能自主學習的機器人是怎樣實現仿人的?

能自主學習的機器人是怎樣實現仿人的?

使機器人具備智能,目前對人類來說還是一項巨大挑戰,甚至「智能的本質是什麼?」這個問題都還沒有確切的答案。但是以人的智能行為能力為藍本,從機器人環境知覺組織、交互與協作、知識獲取與 推理、自主認知與高級決策等角度展開機器人的智能性研究,正成為現階段機器人領域研究的主題。


設計和製造機器人並使之具有類人的智能,是人類文明進步與科技發展的目標之一。自上世紀中葉第一台可編程機械手及工業機器人問世以來,機器人的研究取得了豐碩的成果,並在包括工業、醫學、農業、建築業、軍事等領域得以廣泛應用。由於機器人技術綜合了多個學科的研究成果,代表了高科技發展的前沿,因此機器人成為體現各國科技實力的一項重要指標,引發了全球研究的熱潮。


探索的步伐從未停歇

綜觀機器人研發的歷程,從最早我國西周出現的「歌舞伶人」、古希臘人發明的「自動機(Automata)」,到當下各國研發的各類先進的機器人,人類對機器人的研究經歷了從探索概念原型、面向程式控制機械、注重自主功能到強調高智能水平等發展階段。


1954年,第一台可編程機器人(機械手)和1959年第一台工業機器人相繼問世,標誌著真正意義上的機器人誕生;1968年美國斯坦福研究所研製出名為Shakey的第一台自主移動機器人,機器人以獨立可移動個體的身份出現在世人面前;1969年日本早稻田大學加藤一郎實驗室研製了第一台以雙腳走路的人形機器人,與人們長期期待的真正像人一樣的機器人夢想實現了接軌。


機器人學涉及眾多學科的技術革新以及來自人們生產生活的大量實際需求,促使機器人技術飛速發展。然而,重中之重是機器人行業巨大潛在價值引發了各國政府的強大支持、各大公司及科研院所的產學研整合。正是這些力量的匯聚,架構了一個前景廣闊的機器人產業。


隨著與機器人學緊密相關各學科的不斷突破和迅猛發展,機器人的研發有了堅實的基礎。20世紀末,一系列各種各樣各具特色的機器人井噴式地湧現。在2015年6月份由美國國防先進項目研究局(DARPA)舉辦的挑戰賽上,登台亮相了一批來自世界各國的先進機器人。幾乎每一款先進機器人的研製都有其相對應的強大力量作支撐——美國國防先進項目研究局(DARPA)支持下的波士頓動力研究所(Boston Dynamics)大狗(BigDog)機器人、Petman機器人、美國麻省理工學院(MIT)Atlas機器人與獵豹(Cheetah)機器人、歐盟框架計劃(EUFP6, EUFP7, Horizon 2020)支持下的iCub 、日本產業技術綜合研究所(AIST)HRP系列機器人、日本本田公司的ASIMO機器人,以及韓國高等科技研究院的HUBO機器人等。

能自主學習的機器人是怎樣實現仿人的?



儘管機器人的研發取得了長足的進展,然而,如何使機器人具備智能仍然是一項具有極大挑戰的課題。而首先要回答的問題便是:機器人能否具備智能?這是一個哲學性質的命題,對這一命題的完美解答,是以另一個問題的回答為基礎的,那就是「智能的本質是什麼?」(該問題與物質、宇宙、生命被學者並列為自然界的四大奧秘)。目前看來,在包括腦科學與認知科學在內的眾多相關學科取得更大的根本性突破進展之前,該問題是無法予以完美解答的。


與人工智慧領域的研究及發展類似,如何使機器人具備智能這一課題的研究,並未因其根本問題未予完美解答而停滯。相反,研究機器人具備高智能性正成為現階段機器人領域研究的主題。研究者以人的智能行為能力為藍本,從強調機器人環境知覺組織、複雜場景適應、交互與協作、概念形成與整合、知識獲取與推理、自主認知與高級決策、類人智能行為等角度,展開機器人的智能性研究。


雙足才是最優選

與輪式、履帶式和多足式機器人不同,雙足的仿人機器人(Humanoid Robot)作為結構複雜、高度集成的機器人家族成員,由於外形與人相似,不僅更適合於在人的生活和工作環境中與人協同工作,而且更適宜借鑒來自人的智能行為能力的啟示,從而成為研究機器人智能性的最佳選擇。最典型的代表是在歐盟第6及第7框架計劃(EUFP6, EUFP7)以及Horizon 2020計劃支持下的iCub機器人。iCub由歐洲10所大學組成的歐洲創新大學協會聯合研製,他們認為「仿人的操作是人類認知能力至關重要的因素」。基於這一「具身認知(Embodied Cognition)」思想,研究人員盡最大可能地模仿人的各類感測及結構,歷時6年(2004年至2010年)開發了一個外形像2歲兒童iCub。iCub強調「認知能力的學習」,並將其作為開源平台,通過與環境交互和與人交互來獲得各類行為能力和認知能力。日本本田公司研發的ASIMO機器人以其移動能力和能實現複雜動作的特點而聲名大噪。隨後在其版本不斷更新的過程中,ASIMO對環境的認知能力不斷加強,如複雜辦公室環境下靈活避障、與人交互的基本智能行為等。

能自主學習的機器人是怎樣實現仿人的?



由於雙足機器人是一個固有的非線性不穩定系統。現階段,複雜多變路面環境下的穩定、快速雙足行走,仍然是一個挑戰。韓國高等科技研究院HUBO仿人機器人,在2015年6月舉行的美國DARPA機器人挑戰賽上一舉奪魁,其主要技術策略正是對雙足行走的規避。HUBO機器人利用在其膝蓋和腳踝處裝置的滾輪,通過一個跪下行為很容易地實現了,由雙足行走到輪式行走的切換,極大地提升了移動速度。這為研究機器人智能行為借鑒其他優勢模式的有益性,提供了例證。


自主學習不可或缺

學習能力是系統智能性的必要條件,一個不具備學習能力的系統,當然談不上「智能」二字。學習的本質是指系統能根據過往經驗提升自身性能。機器學習作為人工智慧領域的核心內容,是一個持續受到高度關注的熱點,特別在「深度學習(Deep Learning)」取得巨大成功之後。


在探索機器人智能性的過程中,強調學習的特性是自然而然的事情。然而,我們想要強調的是,這種學習更應是機器人的自主學習。以機器人獲得識別人臉的能力為例,自主學習指的是這樣的情形:機器人自己通過自己的眼睛(安裝在機器人頭上的攝像頭),不斷觀察呈現在它面前的人臉圖像,最終形成能正確識別人臉的策略,而且這一過程是增量式的,亦即識別的性能可隨著觀察的增多而不斷地提升(Incremental Learning);這一過程也是終生性的,像人類一樣,在機器人生命期內一直持續(Life-long Learning),而並非僅僅將一個事先訓練好的人臉識別模型,裝載在「機器人的大腦」(機器人的主機)中便萬事大吉了。儘管後一種處理方式可能省時省力,也可能暫時性地具備更好的識別性能,但忽略了機器人在「習得」這一能力過程中所擁有的豐富「副產品」——其他各種可能會在以後轉化為知識的有用圖像信息。

能自主學習的機器人是怎樣實現仿人的?


機器人智能的體現不應是在代替人從事單一工作時的表現,更應是像人類那樣能智能地從事各類工作,並應對多種情況。工業機器人引發了社會的「重要」變革,極大地提高了生產力。但那僅僅是「重要」,並不是「徹底的」、「顛覆性的」。真正能夠使人類的生產生活發生深刻變革的,只可能是具備「通用智能」(General Intelligence)的機器人。儘管這極具挑戰,甚至可能無法實現,但有關機器人智能性的研究正朝著這個目標邁進,而強調機器人的自主學習方式,無疑是一個很好的出發點。


自主學習的三大特點


智能機器人自主學習的基本場景,體現在其各項技能的具體獲取過程中。前面提到的機器人自主學習識別人臉正是機器人獲得人臉識別這項技能的一個例子,另一個更直接的例子是機器人獲得各項運動行為能力的過程。根據機器人系統的構造方式,理論上,在其工作空間內的任意穩定運動行為(不僅包括靜態穩定,也包括動態穩定),都可以通過設計一組多關節運動軌跡來實現。比如雙足仿人機器人的起立、行走,甚至跳舞、打太極拳等。如果這些行為是根據專家經驗事先設計調整而成的,那麼這些行為便毫無智能性可言,頂多是個耗時耗力極難維護的體力活。只有這些行為是在自主學習框架下獲得的,並且具備前述增量學習(Incremental Learning)和終生學習(Life-long Learning)的特點,才算是機器人具有智能性的一種體現。


智能機器人自主學習的另一個特點,是對過往經驗或已有知識的再利用,正如人類那樣。這一思路與發展學習(或發育學習,Developmental Learning)的思想是相吻合的。它是對人的學習成長過程的借鑒,因為利用已有經驗或知識,學習新事物是人類提升認知能力和行為能力的一個基本特徵。


「機器人能否像小孩一樣學習?」


事實上,機器人基於自主學習思想獲得智能行為能力的過程,正是借鑒了兒童認知發展的過程。早在1950年,以阿蘭·圖靈(Alan Turing)為代表的許多先驅學者已提出「機器人能否像小孩一樣學習?」等類似問題。然而針對這些問題的系統性研究,直到20世紀末才得以展開,以Weng等人於2001年在美國《科學》雜誌上發表的「機器人或動物的自主心智發展」為代表。在機器人的已有研究中,有不少工作借鑒了人的行為方式並取得成功,如基於人體運動捕獲數據(Human Motion Capture Data, HMCD)的一系列研究、機器人穩定行走研究中的膝蓋拉伸(Knee Stretched)及支撐腳橫滾策略(Rolling Foot)、抗推搡研究中的踝關節策略(Ankle Strategy)、臀部策略(Hip Strategy),以及邁步策略(Stepping Strategy)等。


在探索「機器人能否像小孩一樣學習?」這個問題之前,首先要弄清楚的問題是「小孩是如何學習的?」。著名心理學家皮亞傑(J. Piaget)關於兒童認知發展理論的重要思想,被公認為20世紀發展心理學上最權威的理論,他將兒童的認知發展分為四個階段:感知運動階段 Sensorimotor Stage(0歲至2歲左右)、前運算階段 Preoperational Stage(2歲至6或7歲)、具體運算階段 Concrete Operations Stage(6或7歲至11或12歲)、形式運算階段 Formal Operations Stage(1 1或12歲及以後)。該思想為機器人自主學習各項行為能力,特別是運動行為能力,提供了理論依據和實施借鑒。


從兒童認知發展的過程,我們能夠得到一系列智能機器人構建其自主學習框架的重要啟示。


第一,完全自主性。我們完全做不到像對待機器人那樣,對嬰兒各關節賦以角度序列,使其完成某些動作;


第二,家長示教。儘管不能直接干預嬰兒的運動行為,家長仍可通過間接輔教,協助嬰兒完成特定的運動行為;


第三,主觀模仿。無論是家長刻意重複特定運動行為過程,還是嬰兒自己的主觀觀察,都更有助於嬰兒獲得該運動的行為能力;


第四,環境交互學習。嬰兒獲得的每一項特定運動行為能力,都是在與實際環境不斷交互後才逐漸真正掌握的;


第五,試錯模式。在與環境的不斷交互過程中,嬰兒總能根據環境的反饋對自身行為能力不斷加以調節。


如何管理已獲得的行為能力


智能機器人自主學習還要面對的一個問題是,如何合理高效地利用已獲得的各項行為能力。智能機器人研究的根本目標之一,歸根結底是在人類生產生活的實際環境中更好地服務於人類自身。這就需要機器人不僅擁有多項行為能力,而且在任務改變或環境變化時能實時做出恰當響應,即在線改變其運動行為。


一個直觀的方法便是「記憶-回調」法。仿人機器人將其已獲得的各項特定行為能力,以某種方式記憶存儲,當遇到特定任務或環境時,它會迅速地切換或回調出相應的應對行為與能力。然而,由於任務的多樣性以及環境的複雜多變性,對於機器人而言,意味著其面臨過多項不同的運動行為能力的選擇。比如,沿不同坡度的坡面行走可能對應著不同的運動技能(要麼是不同的控制模型,要麼是同一模型的不同參數),那麼,簡單的記憶回調便遠不能滿足要求了。因此,智能機器人如何自主學習獲得對已有經驗的知識抽取和表示,也成為一個重要的研究課題。知識抽取表示的過程是對已有經驗的分析提煉,不僅是智能機器人更好地管理和應用包含這些經驗的行為能力的重要途徑,同時,也為其進一步基於前文提及的發展學習思想,獲得複雜行為能力提供了有力支撐。


智能機器人通過自主學習獲得具有切實的類人的智能行為能力,是一個長久的目標,絕非一日之功。然而,前進道路上的每個階段性進展,在當今機器人技術研發和應用的大熱潮下,都可能引發巨大的市場效益,對推動我國乃至世界機器人科技的進步,都將發揮重要的作用。


本文作者系北京大學機器感知與智能教育部重點實驗室副教授,羅定生


關注機器人圈微信:jiqirenchanye


請您繼續閱讀更多來自 機器人圈 的精彩文章:

「無人駕駛+深度學習=?」看看這家美國初創公司吧
您可能感興趣

男人的那種夢想,又讓機器人先實現了
科幻電影里的殺人機器人將成為現實?人類還能做些什麼
這個有意識的人工智慧機器人!真的能夠自主選擇
那些關於機器人的電影,只是人們把自己的情感放在了機器人身上?
機器人真的能代替人類嗎?
搞怪老爸的潛能都是熊孩子們激發的,能造機器人
究竟何為機器人?AI時代下的智能機器人又會是什麼樣子?
現在的機器人,都學會發射無人機了
科學家正讓AI自己做實驗,想要機器擺脫人類的直覺
現實中的機器人,真的會與人類產生感情嗎?比如變形金剛
人與智能機器人,誰更懂禮貌?
科幻不等於現實 機器人或難聽懂你的話
可愛的美女機器人還能做出這樣令人意外的事情?
機器人給人類做手術,靠譜嗎?醫療機器人的過去現在和未來
智能電視功能匯總,讓您「真正的」成為機器的主人!
機器人真的能成為終結者嗎?事實可能遠非我們想像
別傻了,你真的能肯定自己不是機器人!
如果機器貓的任意門真實存在,那現實社會會有怎樣的混亂?
用動物肌肉造出的機器人,它們能幹些什麼?