曠視發布3D感知全棧解決方案！現在，AI＋3D只差殺手級應用了

最新 08-09

李根發自凹非寺

量子位報道 | 公眾號 QbitAI

曠視者，大視覺之謂也，現在更能顯出這家AI獨角獸的抱負和野心了。

就在昨天(8月8日)，曠視發起了一場「3D視覺產業先鋒研討會」，並正式對外推出了「軟硬一體」的移動端3D感知全棧解決方案。

從演算法、應用開發、晶元、攝像硬體、感測設備到解決方案，現在萬事俱備，只待AI加速下的3D視覺迎來殺手級應用的爆發。

自深度學習「開天闢地」以來，自2D圖像、視頻被AI結構化解析以來，視覺領域已有天翻地覆的變化。

但曠視雄心不止於此，新世界、新方向是什麼？

3D視覺。

曠視移動端產品矩陣架構

全棧方案

在曠視推出的解決方案中，包含了3D視覺發展的一整套所需。

首先是演算法。

曠視會集中於識別和重建2個大類。

識別即機器感知、理解世界的能力，這是曠視的強項，基於曠視自研的MegBrain深度學習引擎，之前曠視在人臉識別、人體識別、活體檢測、注意力檢測追蹤及其他圖像識別的演算法層面，已有業界公認的技術基礎。

重建是把識別出的物體進行三維重建，是開發針對人、針對物的3D視覺應用核心所在。曠視稱，目前已在人像3D建模、人體3D建模及物體幾何測量演算法研發方面走在世界前列，並與Bellus 3D、Altizure等3D視覺企業開展了聯合研發合作。

其次是解決方案。

毫無疑問，不同應用場景需要不同的3D視覺解決方案，基於此，曠視根據不同應用場景中對深度計算、深度修復、深度優化、標定、畸變校正等能力的需求，設計出了基於雙攝、三攝、深攝的解決方案，而且之前在整合結構光、TOF、雙目等不同的攝像、感測系統架構上，都有成熟應用經驗。

第三是硬體模組。

硬體製造處於移動端3D產業鏈最底層，包含攝像頭、感測器、晶元等硬體模組的研發。

結構光、TOF和雙目方案涉及到高清攝像頭、IR投射器、IR接收器、激光發光器等設備的搭配組合，曠視目前與艾邁斯半導體等3D硬體模組廠商展開合作。

此外，還將聯合主要晶元廠商合作研發演算法適配性更強的晶元，進一步優化手機3D應用能力。

最後，基礎條件兼具，應用其實已如雨後春筍。

3D視覺究竟能做什麼？怎麼實現價值？曠視認為，目前曠視在3D人臉識別解鎖和3D人像光效應用方面，已經實現了大規模的應用，並且還開發出全面可用的安全支付、3D 美顏、3D 整形等應用。

下一步，AR遊戲、虛擬試穿等應用上，還能持續有3D賦能手機的更多應用。

所缺的是更多合作夥伴和開發者。

創新應用開發

整個研討會上，有種工具已齊備，但創新性應用還只是潛力初現之感。

作為此次「AI+3D」研討的召集人，曠視也請到了幾家合作夥伴及開發者，分享了具體實踐。

Bellus 3D創始人Eric Chen

Bellus 3D，一家來自於矽谷的移動端3D面部掃描企業，其創始人Eric Chen是蘋果公司Quicktime VR 項目的創建者之一。

2015年，Eric Chen創建Bellus3D，專註於為手機等移動設備提供高解析度的3D人臉掃描、建模技術和產品。

Eric Chen針對Bellus 3D的實踐分享是：「Bellus 3D 是最早採用『active stereo』（主動式立體）深度感測技術打造3D面部掃描相機的企業，通過將 Bellus3D研發的3D面部掃描相機與智能手機或平板電腦連接就可以檢測人臉上的50萬個3D點，在幾秒鐘內創建出高解析度和高精確度的面部模型，同時掃描後的面部模型可以進一步應用於人臉的識別、分析和動畫製作。」

Eric Chen認為，當前3D產業的技術和硬體研發進入快速發展期，研發3D掃描器不再像以前一樣昂貴、難做，3D應用或許現在還不能完整清晰的面貌，但未來人手一台三維掃描器後每個人都將成為應用的開發者，可能性無限。

Altizure聯合創始人兼CEO方天

Altizure，深圳珠科創新技術有限公司，是三維重建技術應用系統集成商和網路解決方案提供商。

Altizure平台主要通過計算機視覺技術來識別圖片中的信息，加以人工智慧以及深度學習技術來實現二維圖像到三維模型的建立工作。目前該平台已擁有來自全球各地成千上萬個3D重建模型。通過一架無人機，就能實現某個建築、地點的3D模型繪製，打造的是一個眾包版的Google Earth.

Altizure聯合創始人兼CEO方天說：「自2015年上線以來，Altizure已經和眾多大型工程企業合作為其提供項目工程的三維建模服務，幫助提高建築效率和質量。今後Altizure將在戶外運動、旅遊、遊戲、影視、三維列印，自動駕駛、高精度地圖等領域，聯合行業合作夥伴一起繼續三維建模技術和應用的創新研發。」