當前位置:
首頁 > 新聞 > 曠視科技成立 6 周年,我們和孫劍聊了聊

曠視科技成立 6 周年,我們和孫劍聊了聊

曠視科技成立 6 周年,我們和孫劍聊了聊

2011 年曠視(Face++)成立,成為國內最早一批在計算機視覺領域的創業公司,此後三年間,曠視科技一直致力於打造自己的人工智慧開放雲平台,提供人臉識別、圖像識別的開放服務。

期間,它開始聚焦在兩個行業方向:一個是互聯網金融,以提供人臉識別認證服務為主,另外一個是泛物聯網,具體來說是將線下的攝像頭在端上或雲上智能化。

截止目前,曠視的 Face++ 人工智慧開放平台的 API 已經服務了近 7 萬開發者,已被調用 60 多億次;身份認證平台在 2016 年為 2.1 億多人提供了刷臉服務,覆蓋了 85% 的金融市場智能化應用,智慧安防和智能商業產品也覆蓋到 20 多個省。

2016 年 7 月,它迎來了首席科學家孫劍的重磅加盟,後者曾在微軟亞洲研究院工作 13 年,其主要研究方向是計算攝影學、人臉識別和基於深度學習的圖像理解。

在曠視的這一年,由孫劍領導的礦視研究院主要在集中研究圖像分類、物體檢測、語義分割、和序列學習四個視覺理解核心問題。研究的技術路線則是深度學習:使用使用端到端(end-to-end)的深度神經網路。

今年 9 月,蘋果新品宣布 iPhone X 嵌入人臉識別解鎖功能,與此同時,國內一些手機廠商也同時布局了該項技術,其中一些手機廠商的人臉解鎖功能則由 Face++ 提供技術解決方案,但它們之間有何差異?人臉識別技術在手機上落地狀況是怎樣的?同時,恰逢曠視成立 6 周年,它在技術上的發展思路是否有新變化,這些我們都跟孫劍聊了聊。

曠視科技成立 6 周年,我們和孫劍聊了聊

「其實網上有非常多對這項技術的解讀,我不知道我再解讀有沒有太大的意義。」當雷鋒網試圖想得到對蘋果的人臉識別技術是否會有不同的解讀內容時, 在曠視的小會議室里,孫劍如是回應。

不過,他也並未完全回絕,反而拿起筆在白板上畫草圖做了一番講解。

在他看來,Face ID 最重要的還是它產生的兩個技術變革,一個是新的 3D 感測器,另一個是神經網路加速晶元,它有強大的演算法,可以適配最先進的深度感測器,新變革也由此產生。

有人臉識別技術不止蘋果一家,從這項技術在今年以來變得像一個熱詞來看,它很有可能會成為手機廠商用來裝點「門面」的墜飾,三星、vivo、小米已然嵌入了這項技術,加入先行者陣營。

但它們與蘋果有何不同?

孫劍表示, 主要還是光學模組,體現在供應鏈上,蘋果可能會通過收購的方式在前期控制一下供應鏈,或者簽一些排他的協議,而安卓廠商要想在這方面有所作為,就需要找到合適的技術提供商。

而對於神經網路處理晶元,他認為在速度上其他廠商要想追趕並不是特別大的問題,比如華為推出的麒麟 970 晶元,「如果說高端手機的話,就是 iOS 之後,也會有別的家,其實現在手機 GPU 也在加速,肯定不會有蘋果這麼快的速度,但也是很快就能追上。」

實際上,小米和 vivo 兩家國內手機廠商的人臉識別技術就是 Face++ 提供的,與蘋果不同的是,這兩者應用普通 RGB 前置攝像頭來進行解鎖,比如米 UI 通過升級用戶就可使用。

「蘋果的紅外攝像頭可以在黑暗中解鎖,這對 RGB 普通攝像頭挑戰很大,去年我們覺得只用 RGB 攝像頭很難做到實用。但我們現在很好的克服了這個難題:一方面是現在感測器發展比較快,暗光環境下的成像質量也不錯;另一方面我們用了很多暗光數據來訓練,效果超過了我們的預期。」

而在實際應用中的效果,孫劍表示,不需要像蘋果那樣的 3D 感測器也能達到好的效能。「基本上屋子裡全黑著燈時,如果你點亮屏幕,只要大於 0.5 個流明的微弱光亮就已經足夠實現解鎖了。」

當然,手機廠商選擇 RGB 攝像頭也是考慮到成本控制問題。「總是有一個高、中、低端,蘋果也沒有應用到它們的所有機型,iPhone 8 就沒有人臉識別。」因此,像 RGB 攝像頭則更多使用在中低端手機產品中。

成本問題之外,產能的不確定性也是其他手機廠商暫時不會跟風使用 3D 感測器的一大緣由,而 RGB 攝像頭也有各種「防護層」做防範,所以對大多手機廠商而言,後者是現階段更優的解決方案。

以下為雷鋒網與孫劍的部分對話內容:

雷鋒網:Face++ 現在有在做硬體嗎?

孫劍:我們現在正在做的是 FPGA 晶元,它是一種可編程的成品晶元,可以把自己的神經網路演算法放上去。我們也已經發布了一個 FPGA 的智能相機,我們內部叫做 MegEye-C3S。

我們這個相機是業界第一款全幀率、全畫幅(1080P)智能人像抓拍機。全幀率的意思就是說,每秒 30 幀每幀都去抓取,在業界這個指標是最高的。在FPGA 的晶元上可以運行,這證明你這個東西是可以設計晶元,在ASCI晶元上運行。

當然是否回去設計這個晶元,是取決於這個應用的量是不是能達到百萬級。從技術上來說,現在是可以做的,但從應用上來說,需要掌握好時間點 。

曠視科技成立 6 周年,我們和孫劍聊了聊

雷鋒網:如果用軟體跟晶元等硬體相結合,跟其他的一些晶元廠商進行合作,主要是做哪些工作?

孫劍:一個是軟體優化,一個是網路設計。一般在這個晶元上,它需要網路的大小不能太大,精度都是低精度的,正常情況下我們網路的表示都是 32 位的 float,在這裡面需要用 8 位或者是更低位的來表示,這樣才有利於硬體來發揮它的計算能力,所以要去做定製化的。當然,也存在一些開放的問題需要解決,比如到底怎麼樣才能讓這東西實現低精度,同時精度不要損失太大,這是一個非常大的挑戰。

雷鋒網:現在其實可能安卓廠商,很多都想做人臉識別解鎖,還有像華為做了 970 神經網路加速晶元,您覺得為什麼會在現在這個節點一下爆發了?

孫劍:AI 變革真來了,不管是演算法的可能性,還是硬體需要突破,包括感測器的成熟,我們現在正在經歷著多維度的技術變革,這也讓計算機視覺有了更多可以應用的場景。

對於一家手機廠商,其實跟每一個創業公司都一樣,需要去找突破,新的這些技術能帶來更好的產品和體驗,因為手機市場的競爭是非常激烈的。

所以說只要大家覺得某個技術方面有可能突破,大家就會特意來做這件事情。其實蘋果早在三年前就開始收購一些 3D 硬體和軟體的公司,這是對一個技術方向的投資,然後到今天才有一個突然的爆發。

雷鋒網:在這個爆發的過程中,Face++ 給自己的角色是什麼?

孫劍:我們是兩種角色都會參與,我們既會輸出一些核心的技術,包括神經網路、計算機視覺的能力,也會有構建我們自己的計算平台,來做我們自己新的產品,直接服務客戶。

雷鋒網:有報道說,你們在做一套適配整個手機平台的智能視覺解決方案?

孫劍:手機方案的話,目前我們比較關心的,一個是手機安全,另外一個是手機影像、圖像、照片是不是能夠通過人工智慧做的更好。

我自己博士畢業後,也做過大概五六年這方面的研究,這個方向叫做計算攝影學。當然那個時候還沒有深度學習,基本靠拍腦袋想各種演算法來解決問題。

今天神經網路、深度學習復興了以後,很多問題又可以重新思考和研究。比如我們有一張照片,可能 1200 萬像素,這就需要一個加速晶元來幫你美化照片。因為其實手機在今天除了發微信,就是拍照片,這是用得最多的兩個功能。發微信很多時候也是發你自己拍的照片,這個是非常重要的,所以我們會做這方面的工作。

手機是一個很大的驅動力,像感測器對嵌入式設備的推動是非常大的,因為這樣感測器的成本就會降下來。應用手機來驅動,這對於我們做一些非手機的功能或自己推出產品也是非常有力的。不管是商業應用,還是做出智能硬體,只有計算力更高、成本更低才能推出來。

雷鋒網:現在基本上人臉識別這一塊都是做前置攝像頭,如果說要做後置攝像頭的一些深度信息的獲取,其實也可以做到很好的?

孫劍:蘋果的 iPhone 7Plus 是雙攝的,後置有兩個攝像頭,通過立體匹配的方式,也可以獲取深度信息。蘋果的 AR Kit 可以讓你把手機的 3D 姿態和周圍的 3D 環境實時恢復出來,這個其實是計算機視覺研究了幾十年的一個問題。在安卓上, Google 也推了一個叫 AR Core的技術,當然還有不少第三方公司,主要看和硬體的適配是不是更好、精度是不是更高。

雷鋒網:能簡單介紹一下您在年初時候發表過一篇有關 ShuffleNet 的論文?

孫劍: ShuffleNet 就是為手機這類計算能力有限的移動設備而專門設計的卷積神經網路模型,它可以讓因為運算需求過大而無法在手機上運行的模型能高效運行。神經網路設計目前仍然是一個研究重點,在不同計算量下,可能需要不同的結構。ShuffleNet 的設計最優計算量大概在 5-50 M Flops,這個範圍內目前性能最優。關於 ShuffleNet 的技術細節,我們在今年 7 月公開發表在了我們的研究論文中。

這裡提一下,我們曠視研究院鼓勵公開發表我們的研究進展,例如我們今年在計算機視覺年會 CVPR 上共有 5 篇被接受的論文。我們相信開放的研究環境才能讓我們更強大,才能吸引更優秀的人才。

雷鋒網:今天是 Face++ 成立六周年,有什麼新目標嗎?

孫劍:我們會回顧一下過去,展望一下未來,打好現在的基礎。雖然已經六年了,但我們還是一個小創業公司,還需要不斷探索,做更好的東西出來。我最近在朋友圈講三件事情對一個創業公司最重要:第一是必須創新;第二是必須不斷創新;第三是必須不斷高速創新。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

阿里雲密集發布數款新產品,留給其他玩家的時間還多麼?
螞蟻金服副總裁胡喜:金融科技進入2.0時代,拼的是基礎技術升級
姚期智:這是一個「前所未有」的金融科技與計算機科學的黃金時代

TAG:雷鋒網 |