加速AR對象分類，Facebook開源計算機視覺演算法Detectron

科技 01-25

文章相關引用及參考：roadtovr

（映維網 2018年01月24日）Facebook今天正式開源基於深度學習框架的計算機視覺對象檢測演算法平台Detectron。Facebook表示，開源項目是為了加速計算機視覺的研究。目前Facebook內部團隊正把Detectron平台用於一系列的研究，比如增強現實。

在2017年9月30日的一篇文章中，映維網曾介紹過實時對象分類是AR面臨的一大挑戰：

令計算機視覺能夠理解「杯子」，而不僅僅只是看到一個形狀，這是一個非常重要的問題。所以這麼多年來，我們在AR演示作品中看到人們把基準標記附加到對象身上，以實現更細緻的追蹤和交互。
為什麼如此困難呢？第一個挑戰在於分類。杯子有數千種形狀，大小，顏色和紋理。部分杯子擁有特殊的屬性和特殊的用途（如燒杯），這意味著不同的杯子被用於不同的場景和背景。
你可以想像編程這麼一個可以幫助計算機了解所有上述概念的演算法的挑戰；你也可以想像編寫一個向計算機解釋杯子和碗之間區別的代碼的挑戰。

延伸閱讀：遠落後於VR，AR面臨三大挑戰：視場、分類、自適應設計

文章同時指出「深度學習」有可能是實時對象分類的其中一種解決方案。現在，Facebook已經正式開源了他們的對象檢測演算法，而這可能會加速開發能夠進行實時對象分類的系統，從而賦予增強現實真正的功效。

如果沒有對特定環境進行預編程，與我們周圍世界進行交互的增強現實將需要粗略了解我們附近的情況。比方說，如果你正穿戴一款AR眼鏡，然後你希望將烤箱溫度投影到烤箱上方，同時在冰箱上方呈現出已經將近吃完的食物，這時AR眼鏡將需要了解烤箱和冰箱的形狀。考慮到烤箱和冰箱涵蓋一系列不同的形狀和樣式，而且其擺放位置的不盡相同，這將成為一項極具挑戰性的任務。

加速AR對象分類，Facebook開源計算機視覺演算法Detectron

Facebook的人工智慧研究團隊與其他相關團隊一直在研究如何通過深度學習來幫助計算機解決對象檢測的問題，而這一基於Caffe2深度學習框架的對象檢測演算法名為Detectron。在正式託管至GitHub後（點擊前往），現在任何人都可以自行實驗。Facebook希望開源Detectron後將能幫助世界各地的計算機視覺研究人員嘗試並不斷改進最新的技術。

他們在GitHub頁面上寫道：「Detectron的目標是為對象檢測研究提供高質量，高性能的代碼庫。Detectron十分靈活，能夠支持新研究的快速實現與評估。」

演算法可以檢測視頻輸入，並能夠猜測構成場景的離散對象。「Detecting and Recognizing Human-Object Interactions (Gkioxari et al)」等研究項目已經在應用Detectron，將其作為了解人類在環境中的行為的基礎。

加速AR對象分類，Facebook開源計算機視覺演算法Detectron

除了AI研究之外，諸如增強現實這樣的其他內部團隊同樣在使用Detectron。Facebook在開源Detectron的聲明中寫道：「各支團隊正在利用這個平台來為各種應用訓練定製模型，包括增強現實…」

目前尚不清楚具體是哪支團隊正在把Detectron用於增強現實，但一個可能答案是Oculus。早在F8大會期間，Oculus的首席科學家邁克爾·亞伯拉什就曾探討過增強現實將如何和將於何時改變我們的生活。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 Yivian虛擬現實 的精彩文章:

※傳微軟重組VR-MR部門，並設立全新MR部門

TAG:Yivian虛擬現實 |