當前位置:
首頁 > 新聞 > 曠視科技孫劍:不只是人臉識別,我們要讓機器看懂圖像

曠視科技孫劍:不只是人臉識別,我們要讓機器看懂圖像

6 月 27 日,《麻省理工科技評論》「2017 年度全球 50 大最聰明公司」榜單在北京國貿大酒店發布。此次榜單中共有9家中國公司(兩家台灣地區)的公司上榜,分別是科大訊飛(第6位)、騰訊(第8位)、曠視科技(第11位)、大疆(第25位)、富士康(第33位)、阿里巴巴(第41位)、HTC(第42位)、螞蟻金服(第49位)、百度(第50位)。

在榜單發布現場,曠視科技首席科學家孫劍發表了獲獎感言,以下為演講全文,內容有刪減:

各位好,相比於曠視科技,大家可能更熟悉Face++這個名字,Face++是曠視科技做的一款產品。我們是第一批在中國用人工智慧做圖像識別、人臉識別的公司,在2012年就開始了。而人工智慧深度學習在圖像領域最大突破發生在在2012年,當時,其實還有很多人不相信深度學習真正能改變圖像理解,但是Face++就把人臉識別做得非常成功。然後到今天為止,我們在互聯網金融和AI領域都取得了非常豐碩的商業成果。

其中最有名的就是人臉識別,今天我們有世界最大的基於人臉識別的身份認證平台,在2016年為超過兩億人實現了在線身份認證。在今年被MIT Technology Review評選為十大突破性技術。

我們這個公司雖然做人臉識別,但是從創立之初我們卻一直都在思考怎樣讓計算機看懂一張圖片或者看懂一段視頻,這就是我們講的對應的計算機視覺,或者相對於人工智慧而言叫做視覺智能。

為了實現這樣的視覺智能,我們的基本路徑是做相應的產品,收集真正的場景數據來不斷地走向正循環。

核心技術就是我們的Face++曠視研究院圍繞著核心演算法、大規模計算平台、數據和團隊來打造。具體來說,我們最關心圖像的分類檢測和分割。其中分類裡面最重要的應用就是人臉識別。

2014年Facebook第一次用了深度學習的方法做人臉識別,而Face++在2012年就用了這樣的方法,而據稱,2014年用深度學習的方法嘗試確認人的身份的精度已經遠高於人工的效果。

當然我們不局限於人臉識別,我們還關心萬物識別:比如說有一個衡量圖象識別的資料庫,上面大概有2萬多種物體,目的是需要訓練機器。隨著這幾年技術的發展、深度學習的引入、錯誤率不斷地下降。尤其是2015年,我當時在微軟和同事一起做了一個殘差學習的網路,第一次在這個數據上超越了人在這個數據上做分類的效率。回想一下2009年,這個資料庫建立的時候,完全不能想像機器可以做到比人還好。但是這樣的東西雖然非常好,作為一家創業公司我們還是需要將之更多、更廣泛的應用。雖然競賽非常好,如果想把它用在一些低功耗的設備上,還是非常困難的。我們Face++就做了這樣一系列的工作。

有了這樣的技術,我們自然可以構造各種各樣的智能相機,把這些智能的計算直接放到相機中去,構造不同的智能相機或者是一些視覺模組,用於機器人或者是各種場景。

當然要想訓練這樣的演算法,最核心還是需要有NVIDA強大的GPU進行支持,我們也是長期的NVIDA的客戶。NVIDA提供了這樣的底層硬體和非常重要的軟體平台,使大家可以非常容易地提升存儲硬體的計算能力。

在這個之上,還有兩層非常關鍵,一個是深度學習平台,一個是深度學習演算法。我們雖然是一家小創業公司,我們也有自己非常驕傲的平台,叫做Brain++,內部有一個核心的東西叫做Megvii Brain,它可以被看作是谷歌的Tensor Flow。據我所知,這麼多創業公司裡面,唯一一家自研的深度學習的平台只有我們,且全公司研發人員每天都在使用這個平台。這個平台大概研發了兩年。所以我想分享的是說,雖然我們是一家小公司,但是我們有非常強的技術實力和非常深厚的技術底蘊可以做這樣的事情,可以保證我們在各個產品線上保持領先。

有了這樣的技術自然可以構造不同的產品,比如說我們Face++開放人工智慧平台。我們是最早一批構建這樣的雲計算的視覺服務,而且我們會把這個核心的數據計算能力開放出來。

我們還有身份認證服務,叫做FaceID,解決的是在網上如何證明「你是你」的過程。你可以非常簡單的拍一張照片,拿出你的身份證,做一些OCR識別,把這些信息直接傳到雲上,我們會經過活體監測和身份比對驗證,判斷「你是不是你」。今天這樣的服務已經服務於非常多的互聯網金融公司或Uber、滴滴這樣的出行公司。

如果我們有這樣的智能相機,就可以做非常有意思的社會與城市的建設。比如在電影中,有人臉識別和展示兩個技術——首先看到一個很小的人臉就把這個臉不斷地放大,然後開始在整個資料庫搜,識別出目標——這樣的科幻電影的東西,今天第一部分還是不能實現的,因為如果拍攝看不清楚確實是無能為力。但是第二部分真的已經發生了,我們今天已經可以在上億級的人臉資料庫中,可以在準確率非常高的情況下里做這樣的人臉識別搜索。

另外我們講的物體識別檢測,不僅局限於人臉,還對人、車等視頻中出現的任何內容進行檢測、跟蹤和分析這些人和車的屬性,車的牌照,人的行為。這都是我們用NVIDA的GPU上可以從事很多路視頻同時進行計算的系統。

另外還有一些比較有趣的智能商業的應用,比如說我們構建的自動開會的註冊系統,也是用人臉識別就可以構建非常簡單有趣的系統。

還有更廣闊的一些商業應用都可以用計算機視覺來幫助完成,這是我們一部分現在用人工智慧技術服務的企業,最終核心是說,我們有這樣的業務的話,可以有很多真正的場景數據,有這麼多數據,我們有現在最大的人工智慧人臉識別平台,希望能夠建立一個良性循環,做到從視覺智能到產品、到數據的這樣一個不斷地正反饋。

作為創業公司,我們的初心就是解決人臉識別或物體識別的問題。區別只在於,給一張照片或者是一段視頻,我們今天能做什麼,明天能做什麼。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 DeepTech深科技 的精彩文章:

健康人群是否應該接受基因檢測?
DeepMind發最新研究:人類認知心理學開啟AI「黑盒子」
英偉達劉念寧:我們CEO非常聰明,他十多年前就關注了自動駕駛
螞蟻金服張家興:我們是一家技術公司,探索如何用科技改變金融
想要玩轉自動駕駛汽車?得先搞定自動駕駛輪椅

TAG:DeepTech深科技 |

您可能感興趣

迷你世界黑科技,你可能都沒有看見過哦!
腦洞打開的冷兵器!看得我一臉懵!真不知道他們的科技樹到底是歪了還是倒了!
科技使人懶惰?不!你只是沒有找到正確的使用方法
對於這些科技小知識,你是不是很疑惑,但是卻很感興趣
針孔攝像頭無處不在,大家可不要小看這個高科技產品!
科技:科技的強大讓你不知不覺的就落後了,不敢想像!
是噱頭還是神器?看毒壇燒友如何看待耳機黑科技
黑科技:是誰把你的流量偷走了,是否有想過?
看臉猜體重,看看人臉識別「黑科技」覺得你多重!
不止人臉識別,機場還有這些黑科技!
科技感爆棚的動態冷知識,仔細盯著蠟燭圖片有沒有驚喜給到你呢?
往天鷹號里注入了水泥?義大利:你們不懂,這是我們的黑科技!
傳說中的「讀心術」來了?不張嘴這款黑科技就知道你想說啥!
豬臉識別,用科技養豬致富不再是夢
夾心唇膏已經一不做二不休了,要科技還是要顏值都隨便你
是不是真正的「好友」?科技能為你解答人與人之間的玄妙關係
科技有愛:視障用戶也能「看到」圖片了
連筷子都不「放過」的小米科技,簡直讓人不敢想像!
這可不是科幻:未來我們將被科技「全副武裝」
論科技我大概只服任天堂了!以後我們也可以說自己是硬盒玩家了