當前位置:
首頁 > 最新 > 增強現實技術研究現狀及發展趨勢

增強現實技術研究現狀及發展趨勢

增強現實(augmented reality,AR)技術是將計算機生成的虛擬信息疊加到用戶所在的真實世界的一種新興技術,是虛擬現實技術的一個重要分支。它提高了用戶對現實世界的感知能力,提供了人類與世界溝通的新的方式,近年來受到研究者的廣泛關注。

增強現實的定義有兩種,一種是由Milgram P和Kishino F提出的:將真實環境與虛擬環境放置在兩端,其中靠近真實環境的叫增強現實,靠近虛擬環境的叫增強虛擬,位於中間的叫混合現實;另一種是Azuma定義的:以虛實結合、實時交互、三維註冊為特點,利用附加的圖片、文字信息對真實世界進行增強的技術。

與虛擬現實不同,增強現實技術利用三維跟蹤註冊技術來計算虛擬物體在真實環境中的位置,通過將計算機中的虛擬物體或信息帶到真實世界中實現對現實世界的增強。近年來隨著科技的發展,增強現實技術被廣泛應用於工業、軍事、醫療、教育等多個領域。

本文從跟蹤註冊技術、顯示技術和人機交互技術3個方面概述增強現實系統中的關鍵技術,對增強現實技術在各領域的應用進行總結,並展望未來發展趨勢。

增強現實的關鍵技術

跟蹤註冊技術

對於增強現實系統來說,一個重要的任務就是實時、準確地獲取當前攝像機位置和姿態,判斷虛擬物體在真實世界中的位置,進而實現虛擬物體與真實世界的融合。其中攝像機位姿的獲取方法即為跟蹤註冊技術。從具體實現上來說,跟蹤註冊技術可以分為3類:基於感測器的跟蹤註冊技術、基於計算機視覺的跟蹤註冊技術及綜合視覺與感測器的跟蹤註冊技術。

1)基於感測器的跟蹤註冊技術

基於感測器的跟蹤註冊技術主要通過硬體感測器,如磁場感測器、慣性感測器、超聲波感測器、光學感測器、機械感測器等對攝像機進行跟蹤定位。

磁場感測器根據磁發射信號與磁感應信號之間的耦合關係獲得被測物體的空間方向信息,根據接收器的磁通量獲得接收器和信號源之間的相對位置信息。這類設備一般較為輕巧,但環境中的金屬物質會對磁場感測器產生干擾,進而影響跟蹤註冊的準確性。慣性感測器一般包括陀螺儀和加速度計等。陀螺儀可以用來測量物體的運動方向;加速度計可以用來測量物體的加速度。兩者相結合就可以獲得物體的位置和方向。超聲波感測器跟蹤根據不同聲源發出的超聲波到達目標的時間差、相位差和聲壓差實現跟蹤註冊。這類方法受外界環境影響較大。光學感測器通過分析接收到的反射光的光信號實現跟蹤註冊。機械感測器根據機械關節的物理連接來測量運動攝像機的位姿。綜合來看,基於感測器的跟蹤註冊技術演算法簡單,獲取速度快,但設備較為昂貴,且容易受外界環境的影響。

2)基於計算機視覺的跟蹤註冊技術

近年來圖像處理與計算機視覺發展較快,一些較為成熟的技術已被應用於增強現實系統的跟蹤註冊中。基於計算機視覺的跟蹤註冊技術通過分析處理拍攝到的圖像數據信息識別和定位真實場景環境,進而確定現實場景與虛擬信息之間的對應關係。該方法一般只需要攝像機拍攝到的圖像信息,對硬體要求較低。

在實現方式上,基於計算機視覺的跟蹤註冊方法可分為基於人工標誌的方法和基於自然特徵的方法。

基於人工標誌的方法一般將包含有特定人工標誌的物體放置在真實場景中,通過對攝像機採集到的圖像中的已知模板進行識別獲得攝像機位姿,之後經過坐標系的變換即可將虛擬物體疊加到真實場景中。基於人工標誌的方法最具代表性的是ARToolkit和ARTag。ARToolkit通過使用人工標誌實現了快速準確的跟蹤註冊,但其在遮擋敏感;ARTag採用數字編碼的方式在一定程度上增加了對遮擋的處理能力。圖1展示了ARToolkit中人工標誌示例。圖2展示了ARTag中的人工標誌示例。

圖1 ARToolkit人工標誌示例

圖2 ARTag人工標誌示例

基於自然特徵的方法通過提取圖像中的特徵點,並計算場景中同一個三維點在二維圖像上的對應關係,優化獲得三維點在世界坐標系中的位置以及攝像機的位姿。近年來,隨著計算機視覺與人工智慧的發展,同時定位與地圖構建(simultaneous localization and mapping,SLAM)受到了人們的廣泛關注。這類方法在跟蹤註冊的同時構建場景地圖,具有運算速度快、精度較高的優點。基於自然特徵的方法不需要人為地在真實場景環境增加額外的信息,只需要跟蹤視頻中捕獲的場景中的自然特徵,並經過一系列幾何變換即可實現場景的跟蹤註冊。相比基於人工標誌的方法,這類方法更簡單、方便,但自然特徵數目與跟蹤效果的不穩定將對系統的運算速度和精度造成較大影響。

3)綜合視覺與感測器的跟蹤註冊技術

在一些增強現實的應用場景,基於計算機視覺與基於感測器的方法均不能獲得理想的跟蹤效果,因此,研究者綜合考慮二者的優缺點,將二者結合起來,以獲得更優的跟蹤註冊效果。香港科技大學沈劭劼課題組提出的視覺慣性導航(visual-inertial navigation system,VINS)系統將視覺與陀螺儀和加速度計信息深度融合,在無人機和手持移動設備上均獲得了較好的跟蹤註冊效果;蘋果公司推出的ARKit和Google公司推出的ARCore增強現實軟體平台分別支持iOS和Android操作系統,為移動端智能設備上的增強現實應用提供了無限可能。圖3展示了在ARKit和ARCore平台上開發的移動設備上的增強現實應用示例。

圖3 增強現實應用示例

顯示技術

增強現實技術的最終目標是為用戶呈現一個虛實融合的世界。因此,顯示技術是增強現實系統中的重要組成部分。目前,常用的顯示設備有頭戴式顯示設備、計算機屏幕顯示設備、手持式移動顯示設備及投影顯示設備等。

1)頭戴式顯示設備

由於增強現實系統要求用戶可以觀察到現實世界的實時影像,頭戴式顯示設備主要是透視式頭盔顯示器。這類設備的主要功能是將用戶所在環境中的真實信息與計算機生成的虛擬信息融合,按真實環境的表現方式可將其分為視頻透視式頭盔顯示器和光學透視式頭盔顯示器。

視頻透視式頭盔顯示器通過頭盔上一個或多個攝像機來獲取真實世界的實時影像,利用其中的圖像處理模塊和虛擬渲染模塊進行融合,最終將虛實融合後的效果在頭盔顯示器上顯示出來。

微軟推出的Hololens增強現實眼鏡採用全息技術,結合多個感測器,將虛擬內容投射成全息影像,實現虛實融合。這款眼鏡內部集成了中央處理器(CPU)、圖形處理器(GPU)和全息處理器(HPU),不需要連接任何其他設備就可以實現與現實世界的交互。Meta公司推出的Meta2同樣是一款高沉浸感的增強現實眼鏡,其較Hololens具有更大的視場角,但追蹤保真度仍有待優化,且在使用過程中需要連接電腦進行計算。圖4為Hololens增強現實眼鏡與Meta2增強現實眼鏡外觀。

圖4 Hololens增強現實眼鏡(a)與Meta2增強現實眼鏡(b)

光學透視式頭戴顯示器根據光的反射原理,通過多片光學鏡片的組合,為用戶產生虛擬物體和真實場景相互融合的畫面。與視頻透視式頭盔顯示器相比,光學透視式頭盔顯示器在顯示增強畫面時,不需要經過圖像融合的過程,用戶看到的影像就是當前的真實場景與虛擬信息的疊加。

Google公司推出的Google Glass是一款光學透視式頭盔顯示器,其經過光學放大後將數據通過稜鏡顯示給用戶(圖5(a))。Google Glass可以通過聲音控制,實現拍照、視頻通話、全球定位系統(GPS)定位、文字處理、收發郵件等多種功能。Magic Leap公司發布了一款基於光場的頭戴式增強現實設備Magic Leap One(圖5(b))。這款設備利用外部攝像頭和計算機視覺處理器實時追蹤用戶位置,同時在追蹤過程中可以不斷調整雙眼的焦距,並將包含有深度信息的圖像通過光場顯示器顯示出來。

圖5 Google Glass(a)與Magic Leap One(b)

2)計算機屏幕顯示設備

計算機屏幕顯示設備作為傳統的輸出設備一般具有較高的解析度,且體積較大。在增強現實應用中,這類設備更適用於將精細虛擬物體渲染併疊加於室內或大範圍場景中。由於這類設備沉浸感較弱,但價格較低,一般適用於低端或多用戶的增強現實系統。

3)手持式移動顯示設備

手持式移動顯示設備是一類允許用戶手持的顯示設備。近年來智能移動終端發展迅速,現有的智能手持設備大都配備了攝像頭、全球定位系統(GPS)和陀螺儀、加速度計等多種感測器,更具備了高解析度的大顯示屏,這為移動增強現實提供了良好的開發平台。與頭盔式顯示設備相比,手持式移動顯示設備一般體積較小、重量較輕,便於攜帶,但沉浸感較弱,同時由於硬體的限制,不同設備的計算性能參差不齊。目前,隨著iOS系統下的增強現實平台ARKit和Android系統下的增強現實平台ARCore的發布,後續的多數新款智能移動終端將支持增強現實技術。

4)投影顯示設備

投影顯示設備可以將增強現實影像投影到大範圍環境,滿足用戶對大屏幕顯示的需求。由於投影顯示設備生成圖像的焦點不會隨用戶視角發生變化,其更適用於室內增強現實環境。微軟研究院的RoomAlive項目將Kinect、投影儀、攝像機和計算機結合起來,通過構建房間的三維圖像將虛擬影像投影到整個房間,同時通過定位用戶位置實現與虛擬世界的交互。

人機交互技術

增強現實系統的目標是構建虛實融合的增強世界,使用戶能夠在現實世界中感受到近乎真實的虛擬物體,並提供人與這一增強的世界交互。在這一過程中,人機交互方式的好壞很大程度上影響了用戶的體驗。一般來說,傳統的交互方式主要有鍵盤、滑鼠、觸控設備、麥克風等,近年來還出現了一些更自然的基於語音、觸控、眼動、手勢和體感的交互方式。

1)基於傳統的硬體設備的交互技術

滑鼠、鍵盤、手柄等是增強現實系統中常見的交互工具,用戶可以通過滑鼠或鍵盤選中圖像中的某個點或區域,完成對該點或區域處虛擬物體的縮放、拖拽等操作。這類方法簡單易於操作,但需要外部輸入設備的支持,不能為用戶提供自然的交互體驗,降低了增強現實系統的沉沒感。

2)基於語音識別的交互技術

語言是人類最直接的溝通交流方式。語言交互信息量大,效率高。因此,語音識別也成為了增強現實系統中重要的人機交互方式之一。近年來,人工智慧的發展及計算機處理能力的增強,使得語音識別技術日趨成熟並被廣泛應用於智能終端上,其中最具代表性的是蘋果公司推出的Siri和微軟公司推出的Cortana,它們均支持自然語言輸入,通過語音識別獲取指令,根據用戶需求返回最匹配的結果,實現自然的人機交互,很大程度上提升了用戶的工作效率。

3)基於觸控的交互技術

基於觸控的交互技術是一種以人手為主的輸入方式,它較傳統的鍵盤滑鼠輸入更為人性化。智能移動設備的普及使得基於觸控的交互技術發展迅速,同時更容易被用戶認可。近年來,基於觸控的交互技術從單點觸控發展到多點觸控,實現了從單一手指點擊到多點或多用戶的交互的轉變,用戶可以使用雙手進行單點觸控,也可以通過識別不同的手勢實現單擊、雙擊等操作。

4)基於動作識別的交互技術

基於動作識別的交互技術通過對動作捕獲系統獲得的關鍵部位的位置進行計算、處理,分析出用戶的動作行為並將其轉化為輸入指令,實現用戶與計算機之間的交互。微軟公司的Hololens採用深度攝像頭獲取用戶的手勢信息,通過手部追蹤技術操作交互界面上的虛擬物體。Meta公司的Meta2與Magic Leap公司的Magic Leap One同樣允許用戶使用手勢進行交互。這類交互方式不但降低人機交互的成本,而且更符合人類的自然習慣,較傳統的交互方式更為自然、直觀,是目前人機交互領域關注的熱點。

5)基於眼動追蹤的交互技術

基於眼動追蹤的交互技術通過捕獲人眼在注視不同方向時眼部周圍的細微變化,分析確定人眼的注視點,並將其轉化為電信號發送給計算機,實現人與計算機之間的互動,這一過程中無需手動輸入。Magic Leap公司的Magic Leap One在眼鏡內部專門配備了用戶追蹤眼球動作的感測器,以實現通過跟蹤眼睛控制計算機的目的。

AR技術應用

近年來,增強現實技術被應用廣泛應用於工業維修、影視娛樂、醫療手術、教育培訓等多個領域,並逐漸成為下一代人機交互技術發展的主要方向。

工業製造與維修領域

在工業領域,製造與維修流程一般較為複雜,往往包含成百甚至上千個步驟。操作過程一旦發生錯誤,將會造成巨大的損失。增強現實技術能夠將已知的數據信息正確的發送給流水線上的工人,如在用戶指向某一部位時系統顯示該部位的名稱、功能等,從而減少錯誤的發生,提高生產與維修效率。

在工廠中,增強現實系統還能從工業系統中捕獲信息,獲得每台設備與操作流程的檢測和診斷數據並可視化,幫助維修人員找到可能出現問題的源頭,並提醒工人進行預防式維修,減少因設備損壞導致停工帶來的損失。Iconics公司將增強現實技術引入工業自動軟體上,通過在理想位置投射相關信息,提高檢測設備或流程的效率。

市場營銷和銷售領域

增強現實技術重新定義了產品展廳和演示的概念,並且完全顛覆了傳統的客戶體驗。在購買之前,用戶可以看到虛擬產品在真實環境下的狀態,促使他們做出更符合實際預期的購買決策,進而提升客戶的滿意度。

EasyAR與汽車之家聯合推出了AR看車軟體,用戶可以通過手機App將虛擬的車輛放置在真實場景中,在購車之前預覽其在道路上賓士的效果(圖6)。瑞典宜家集團推出了一款名為IKEA Place的傢具類應用,用戶可以選擇自己喜歡的傢具疊加上現實場景中,避免在裝修過程中出現的傢具尺寸不合適,風格不統一等問題(圖7)。

圖6 「AR看車」手機應用軟體效果

圖7 「IKEA Place」手機應用軟體效果

醫療領域

醫學手術導航是增強現實技術的重要應用之一。由於很多醫學手術具有較高的風險,任何小操作誤差都可能帶來嚴重的後果。增強現實技術對CT或醫學磁共振成像(MRI)進行三維建模,並通過將構建的模型與病人身體精確的配准,為醫生提供現實與虛擬疊加的影像,進而實現對醫療手術的導航作用。

Surgiceye公司在很多外科手術案例中引入了增強現實技術,如在外科手術中,醫生可以直接通過增強現實技術「查看」病人身體內部、骨骼等信息。在實際應用中,將增強現實與常規診斷的顯示方式相結合,幫助醫生精確的找到病理位置。

軍事領域

由於增強現實技術可以將真實世界與虛擬世界融合起來,同時允許用戶實時交互,其被應用于軍事領域的多個方面,在數字化戰場上發揮了巨大作用。

在戰場上,增強現實技術能夠增強戰場環境信息。根據輸入的部隊位置信息,增強現實系統不僅能向部隊顯示真實的戰場場景,同時能夠疊加額外的環境信息以及敵我雙方的隱藏力量,實現多種戰場信息的可視化。

在軍事訓練中,對戰場的真實性有很高的要求;同時,很多環節需要反覆多次,對裝備消耗大。增強現實技術的引入不僅可以提供更為真實的戰場環境,達到實戰訓練的效果,還允許士兵在進行反覆操作,增加訓練次數的同時減少對裝備的消耗。

此外,考慮戰場上指揮員對信息的掌握的重要性,引入增強現實技術可以使各級指揮官同時觀看戰場的實際情況以及疊加的各種信息,並與之進行交互,進而實現指揮中心與各級戰鬥人員之間的信息的快讀傳輸與高度共享。指揮員在快速下達指揮命令的同時了解各個作戰單元的情況,將地理上分散的小組聯合成一個協同合作的整體。

影視、娛樂、遊戲領域

在電視、電影製作方面,增強現實技術可以在真實拍攝的場景上,加入現實中不存在的虛擬景象或人物,如汽車爆炸、恐龍、科幻世界等。這種基於增強現實的「所見即所得」的拍攝方式,大大簡化電視、電影製作中動畫特效帶來的工作量,降低製作成本。

在娛樂、遊戲方面,增強現實技術可以用來提供各種體驗項目,如將遠古時代的恐龍、深海中的鯊魚等不可能出現的動物放置到現實場景中,滿足人們的好奇心;也可以將現實場景變身為戰場,使用戶能夠在虛實融合的世界裡與別的玩家進行對抗。近年來最具代表性的就是任天堂公司開發的增強現實遊戲Pokeman Go,打開攝像頭用戶就可以捕捉現實世界中出現的小精靈並進行戰鬥。

教育領域

增強現實技術作為一種沉沒式的學習方式,可以將豐富的資源信息和其他數據整合到用戶能夠觀察到的現實場景中,為師生提供身臨其境的學習環境,激發學生的學習興趣,提升主觀積極性。同時,增強現實技術能夠構建目標對象的三維建模並顯示,學生可以通過從不同視角觀察模型,並與虛擬的模型進行交互,增強對目標對象的理解。此外,增強現實系統實時交互的特點削弱了位置、空間的限制,教師可以在課上或遠程指導學生,彌補了現實環境中設備的不足,實現資源共享。

美國Z-Space公司開發出了一系列面向普通教育的應用軟體,實現了老師、學生及三維場景之間的交互。

古迹復原與數字化遺產保護領域

增強現實技術的一個重要應用場景是室內博物館導覽,它通過在文物上疊加虛擬的文字、視頻信息,為遊客提供更多的文物導覽解說。此外,增強現實技術還可以利用採集到的數據復原再現文物古迹,將極具真實感的虛擬影像展現在遊客眼前,為遊客提供身臨其境的視覺體驗。

Archeoguide是一款基於增強現實的文物遺迹嚮導,通過GPS粗定位,能夠為遊客展現古迹復原後的希臘奧林匹亞神廟。由北京理工大學王涌天課題組研究的基於增強現實的圓明園景觀數字重建技術將部分圓明園遺址做很好的還原,真實感很強,遊客可以從圓明園廢墟前看到重建後的皇家園林。

結 論

近年來,增強現實技術受到了研究人員的廣泛關注。在計算機視覺與人工智慧技術的推動下,增強現實技術表現出了強勁的發展勢頭,無論是跟蹤註冊精度、顯示設備性能,還是人機交互自然性上都有很大提高,但也可以看出,增強現實技術尚有許多問題有待解決。從跟蹤註冊技術上來說,目前的跟蹤註冊方法只能對場景中少量的信息加以利用,如特徵點信息,這造成系統對環境的理解不完整;從顯示技術上來說,能夠為用戶提供高沉沒感的增強現實眼鏡在體積和價格上還不能滿足大眾的需求;從交互方式上來說,更為自然的、支持多用戶的增強現實交互技術仍有待研究。

雖然增強現實技術還有許多瓶頸,但大量的應用研究分析表明,它具有巨大的應用前景。在未來幾年裡,增強現實技術的應用,特別是在移動智能終端上的應用,將會大量湧現。雖然與頭盔顯示設備相比,移動設備沉沒感不強,但其具有很高的普及性;同時,ARKit、ARCore開發平台的推出,從技術上實現了增強現實與智能移動設備的結合。在未來的發展中,更能發揮增強現實技術優勢的智能穿戴設備將為人類創造更為真實的虛實融合世界,人們可以通過更自然的人機交互方式與系統進行交互。未來增強現實技術將在很大程度上改變人類生活,是科技發展的必然趨勢。

參考文獻(略)

本文作者:王宇希,張鳳軍,劉越

作者簡介:王宇希,中國科學院軟體研究所發展研究部,博士,研究方向為增強現實、目標跟蹤;張鳳軍(通信作者),中國科學院軟體研究所發展研究部,研究員,研究方向為人機交互、軟體工程。

本文發表於《科技導報》2018 年第10 期,敬請關注。

(責任編輯 劉志遠)

《科技導報》

中國科協學術會刊


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 科技導報 的精彩文章:

重複使用航天運輸系統發展與展望

TAG:科技導報 |