當前位置:
首頁 > 最新 > 清華計算機博士走出實驗室 用單台iPhone實現三息人物重建

清華計算機博士走出實驗室 用單台iPhone實現三息人物重建

左邊是張煜,右邊趙維凱。

「普羅米修斯是古希臘是跟人類帶來火種的神,他創造了人類,而我們所做的三息人物影像也相當於一個造人的過程。」張煜說道。今年5月,他創立「普羅米修斯」,提供動態三維人物重建雲服務。

「普羅米修斯」利用單台消費級RGBD攝像機,便可實現33毫秒單幀人物實時重建,其常見的應用場景有全息視頻會議、遠程教育和充當電影特技的替身。

目前,張煜正在籌劃天使輪融資,預計金額150萬,出讓比例5%,估值3000萬,資金主要用於人員擴張產品研發。團隊已經於上月獲得睿鼎資本105萬的種子輪融資,出讓比例7%。

註:張煜承諾文中數據無誤,為內容真實性負責。鉛筆道作客觀真實記錄,已備份速記錄音。

早在在2016年,張煜所在的清華實驗室,首次實現了使用單台RGBD攝像機,實時三維動態重建技術,這讓該技術有了從大型實驗室或者工作室走向普通大眾的可能性。而在最新的iPhone X中已經配置了RGBD攝像頭,可以完成彩色深度圖像的採集工作。

張煜認為風口已來。博士畢業後,他便毫不猶豫選擇創立「普羅米修斯」,將這項技術推向民用。此前,他擔任過清華所在實驗室的項目負責人,研究方向是三維成像系統架構設計和實時性。

經過市場調研發現,張煜認為有兩個痛點。第一,成本太高,去年天貓雙11晚會,范冰冰的AR全息影像耗資300萬;第二,對場地要求太高,市場需要8台彩色深度攝像機將人全方位圍起來,需要2~3台伺服器,才能模擬出全息通訊捕捉功能。

「普羅米修斯」demo,圖中是張煜本人的成像。

張煜介紹,在三維重建技術中,最為關鍵的參數有兩個。一是效果,分為主觀參考量和客觀參考量,前者是動作和面部表情的視覺合理性,後者是與標準的偏差;二是速度,目前團隊能夠做到的重建速度是33毫秒每幀,這是人眼識別物體運動的臨界值,處理和傳輸速度越快圖像便越是流暢,不會有卡頓的結果。

三維全息技術關鍵分為四步,分別是採集、重建、傳輸和呈現。

「普羅米修斯」當前的技術攻堅分為兩個方向。一方面重建環節,優化演算法,進一步提高重建速度,其目標是16毫秒每幀;另一方面,在研發中,團隊使用人工智慧技術,通過單攝像頭信息得到人的骨骼姿態信息。

當前,「普羅米修斯」正在對接AR眼鏡生產商。張煜坦言,這裡最大的挑戰是在呈現介質,AR眼鏡會跟不上前三步的發展,同時,團隊也將考慮使用替代產品,比如採用iPad作為呈現介質。

早在創業之初,張煜就遭受到不少質疑。「已經有語音和視頻通話了,為什麼還要做三息人物全景影像通訊呢?」

面對質疑,張煜並不動搖。「我們解決的不是通訊問題,而是出行難題,讓用戶足不出戶就可以完成很多以前必須面對面進行的溝通,因為人們在溝通中有55%的信息需要通過面對面的身體語言來表達。」

任何一種技術,能夠從實驗室走向民用才是有生命力的技術。張煜談到,以照相為例,以前有照相館,專門的攝影師,而現在大家每天在朋友圈曬自拍,手機隨時隨地都能拍照。在不久之後,全息成像技術也是如此。

目前,「普羅米修斯」團隊共有3人。張煜本人主攻系統的架構和實時性傳輸方面;趙維凱是連續創業者,有11年的信息工程管理經驗,負責市場和運營;黃秀峰是張煜清華的師弟,獲得過清華大學2018人工智慧挑戰賽一等獎,主攻重建演算法方面。

資金到位後,張煜計劃建立6人的核心技術團隊,並依託清華和深圳大學建立學生興趣團隊社區,培養潛在的人才。

在未來,「普羅米修斯」預計今年底,開發出跑通採集、重建、傳輸和呈現這四個步驟功能雲,並在明年5月上線APP,正式商業運行。

/The End/

編輯 | 薛婷  校對 | 劉晶榮

如需轉載文章請聯繫鉛筆道微信客服號鉛筆道小鉛筆(微信號:qianbidao2018)獲取授權資質,否則我們將依法追究相關責任。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 實驗 的精彩文章:

幼兒園都在教這5種最火爆的科學實驗!必須收藏!
蘋果6賣了四天就下架了,庫克是不是在做實驗,看看中國人喜歡啥?

TAG:實驗 |