增強現實技術面臨的問題與未來發展
增強現實技術面臨的問題與挑戰
(一)增強現實的內容素材建設
增強現實與虛擬現實一樣,處於發展的初期階段,不但面臨著硬體、軟體技術的革新與發展,同樣在內容上面臨著巨大的缺失。優秀的內容能夠給增強現實生態帶來巨大用戶流量,反過來會推動技術的發展。截至2017年12月,APPLE應用商店上共上線1000個AR應用,這個數量相較手機APP的數量,差距顯著。所以,增強現實應用的市場潛力巨大。
隨著技術的標準化,增強現實內容製作的規範也會逐漸地標準化。隨著物聯網和大數據的發展並與之整合,其內容數量會遠超現有視頻量級,增強現實內容平台會將人們生活周邊的物體、環境都變成數據和三維模型存儲在數據中心,便於終端隨時調用。平行於現實世界的另一個數字世界是增強現實所需要的,也是增強現實的終極發展。現在,所有的商品都有自己的條形碼,人們也已經習慣了掃碼模式,這也為增強現實的發展提供了良好的用戶基礎。
(二)增強現實的標準化與監管機制建設
虛擬現實發展初期,各類硬體層出不窮,做出來的內容也參差不齊,2016年開始我國啟動標準化工作,並於2017年發布了一系列虛擬現實、增強現實相關規範、標準和徵求意見稿,包括硬體設備規範、標準和內容評級機制。這對虛擬現實的發展起到良好的促進作用。對於增強現實的發展,我們面臨著同樣的問題亟需解決:終端設備標準化,內容製作標準化。
增強現實技術的未來
增強現實技術經過了多年的沉澱和發展,已經從企業級應用走向消費級市場,並逐漸釋放其商業價值,構建其獨特的商業模式。然而作為圖形圖像技術的集大成者,增強現實技術更多的作為一個顯示終端出現,在其顯示技術和終端設備完善的同時仍需要大量內容支撐,同時也需要其他領域的技術支撐。這樣的生態結構非常類似智能終端,手機與APP應用相互支撐、相互影響、相互發展。在目前主流發展的技術中,有兩個技術領域會在未來與增強現實技術實現這樣的相互支撐結構。
(一)增強現實技術與大數據的整合
大數據技術近些年發展得如火如荼,龐大的數據帶給我們足夠多的信息,我們在享受數據帶給我們便利的時候,也被數據的篩選過程所困擾。如何將數據有條理地進行分類、快速呈現在使用者眼前成為一個難題。增強現實技術恰恰具有解決這一難題的可能性,一方面增強現實技術可以將數據可視化,帶給人們最直觀的體驗,人們在觀看數據時可以依託數字、形狀、顏色等外觀的變化對一個事物進行基本的判斷,同時數據可視化顯示的內容將更加豐富,現在是圖片、視頻、三維模型,未來包括聲音、地點和內容都能成為我們獲取信息的方式;另一方面,增強現實頭戴式顯示器作為最接近人眼的一塊屏幕,無疑具有天生的顯示優勢。人們可以實現數據的實時提醒和顯示,一切呈現都是實時的,在正確的時間、正確的地點獲得正確的信息;最後,增強現實技術作為一個可交互的雙向溝通機制,使用者在獲取數據信息後可快速與信息進行互動,隨著技術的發展,互動可能是一段語音、一個眼神、一個手勢或者是大腦思考的一個想法,隨時隨地將使用者的數據信息與數據中心進行交互。通過增強現實技術,一個與我們現實世界互相融合、交織的數據世界正在逐步形成。
當然,數據整合的過程並非一蹴而就,埃森哲戰略董事總經理TomasKandl認為:「企業的增強現實需要按步驟、有計劃、循序漸進地實現。第一階段,需要聚焦在那些容易實現的部分,比如像可穿戴、簡單的信息展示;第二階段就是信息整合,將數據從ERP、物聯網中抽取出來,並能夠進行實時的整合;第三階段,就是有一些虛擬物體能夠接入到現實社會之中;第四階段則是完全的進入,數據世界和現實世界充分融合。」[1]
(二)增強現實技術與人工智慧技術的整合
人工智慧對增強現實關鍵技術的推動集中在渲染能力處理、深度學習和感知交互領域。渲染能力處理主要體現在快速的三維場景構建,無論是虛擬現實還是增強現實,三維場景的構建始終是無法繞開的重要環節。現有技術條件下,大多數採用預製模型場景的模式,這種模式耗時長,效率較低。人工智慧技術的發展可以大幅提高生產效率,並且在數據傳輸的過程中降低對網路帶寬的消耗。現在已經研發成熟的技術可以使用人工智慧技術將360P的視頻還原渲染至1080P,對帶寬的消耗則節省了近8倍。
深度學習是人工智慧的又一個重要體現。深度學習是人工智慧中發展迅速的領域之一,可幫助計算機理解大量圖像、聲音和文本形式的數據。目前增強現實技術的主要環節是對目標圖像進行識別。主要包括基於視覺標記、基於自然特徵和SLAM三種識別方式。在SLAM技術尚未成熟前,主要是將所識別物體轉化為2D平面圖像,這就給增強現實的圖像識別帶來巨大挑戰。現實世界中,我們識別的物體不具備可快速識別的二維碼等信息或者識別點,需要對複雜的物體和環境進行識別。這不單對物體的識別特徵有要求,在光照條件不一致的情況下,同樣會對識別的效果和速度產生致命的影響。通過人工智慧的機器學習,可以分辨物體的不同角度、不同顏色、不同形狀、不同動作,從而快速識別出不同環境。
交互作為增強現實技術的主要特徵,目前仍然處於發展的初級階段。以HoloLens為例,目前採用的手勢識別和語音識別技術都尚未成熟,人們在使用的過程中會有明顯的疲勞感,其交互效率相比PC和智能終端的交互方式都很不成熟。這也受制於通用AI技術的發展,無論是VR還是AR都沒有更加高效的符合人機工程學的交互方式。在VR環境下高效的文字輸入仍然是有待攻克的難題,隨著語音輸入方式的成熟,這些問題都會被解決。其他的交互方式包括眼動檢測、面部表情檢測、人體生理特徵檢測、腦電波檢測等等在未來都會成為增強現實交互的主要方式。
The Ghost Howls的作者Antony Vitillo認為,只有將AR與人工智慧和腦機介面(BCI)相融合,我們才能挖掘出AR真正的潛力。「人工智慧可以幫助用戶理解他所看到的這個世界,並且通過AR技術直接在他感興趣的物體對象身上展示。BCI可以實現大腦與人工大腦之間的完美融合,AI可以直接從我們的大腦中讀取信息,也可以將信息插入到我們的大腦之中。」[2]
[1]埃森哲戰略董事總經理TomasKandl在2016百分點數據與價值國際論壇的報告內容節選http://www.cbdio.com/BigData/2016-06/21/content_5007167.htm
[2]源自Yitzi Weiner對AR行業的趨勢調查,節選自Antony Vitillo的調查內容(https://journal.thriveglobal.com/39-ways-ar-can-change-the-world-in-the-next-five-years-a7736f8bfaa5)。


TAG:移動互聯網藍皮書 |