當前位置:
首頁 > 最新 > AI煉「火眼金睛」:秒秒鐘100張圖以上,準確度達99.5%

AI煉「火眼金睛」:秒秒鐘100張圖以上,準確度達99.5%

廣州創新英雄

李明強

圖普科技創始人,碩士畢業於華中科技大學。原騰訊T4技術專家,騰訊資深項目經理,QQ郵箱項目負責人,微信立項創始人之一。後創立圖普科技,成為國內首屈一指的圖像識別雲平台。

創業方向

圖像內容審查

物體、場景識別

人臉識別

文字識別

創新感言

我一直信奉喬布斯那句話「Stay hungry. Stay foolish」(求知若渴,虛心若愚)。我們是人工智慧領域創業,一直在技術研發和產品上不斷突破和積累,一直奔波在路上,實現一個目標後,又朝著下一個目標前進。

技術突破無止境,支撐我們堅持去做這件事情的原因,一個是新鮮感,另一個就是成就感。我們征服了很多困難,也給社會和國家帶來價值,這是我的初心。

截至2015年底,人類在互聯網上上傳的照片已經超過9000億張,一天上傳到網上的照片數量就超過了18億張。如何鑒別並過濾掉其中的不良信息?依靠傳統的人工肉眼識別,一天最多能鑒定5000張不良照片。

在廣州,有這麼一家國內頂尖圖像識別的企業——廣州圖普網路科技公司,作為國內最大的圖像識別雲平台,每天處理圖片超9億張,依靠人工智慧識別技術,色情、暴力、恐怖、小廣告等不良內容通通逃不過計算機的「火眼金睛」。

目前圖普科技對單個視頻處理時間小於1秒,100張圖片處理時間小於1秒,識別準確度達99.5%。

創業逐夢:「夫妻檔」投身人工智慧

原騰訊T4技術專家、QQ郵箱項目負責人、微信立項創始人之一……創業之前,李明強的職業頭銜個個耀眼,不過,深藏於心中的人工智慧夢,讓他放棄安逸的工作,出來「搞事情」,加入人工智慧、視覺識別的創業大軍之中。

2012年,李明強正式離職創業,年終獎沒拿,即將到手的期權也放棄了。因為「心裡燒起一把著急創業的火,越燒越大」。而身處事業單位的妻子對他的決定,除了支持還是支持,連一句「要不要再想一想」都沒多說。甚至兩年後,妻子辭去工作,加入圖普科技,「夫妻檔」雙雙扎進人工智慧的「海洋」。

2014年4月,廣州圖普網路科技公司正式成立。李明強的人工智慧夢最終落地,將圖像識別技術應用於企業服務領域,並很快推出基於圖像識別技術的第三方內容審核服務以代替傳統的人工識別、審核。識別範圍包括色情、暴恐、小廣告等不良圖片和視頻。

但將人工智慧應用於圖像識別絕非易事,更非簡單地給計算機裝個軟體、寫個程序。說起圖像識別,最早可以追溯到起源於1966年的計算機視覺技術。彼時,現代人工智慧之父馬文·明斯基給他的本科學生布置了一道暑假作業:在電腦前面連攝像頭,然後寫一個程序,讓計算機描述它看到了什麼。

60年前人工智慧之父眼中的一道暑假作業,在今天,仍有無數科學家絞盡腦汁去鑽研、破解。畢竟,在計算機眼裡,所有圖片都只是一串它能理解的代碼,它無法按照人類的思維來「看」或「理解」用戶上傳的視頻和圖片,更別提是否涉及不良信息,諸如色情、涉恐等。面對空前的難題,走在創業路上的李明強,偏偏要向「險峰」行。

初試牛刀:訓練計算機審圖

2014年,快播公司被舉報涉嫌傳播淫穢信息被查,讓李明強意識到海量的互聯網信息亟須對不良信息的過濾。得益於此前近兩年的技術積累,在極短的時間內公司便做出了樣本軟體。

李明強帶著樣本軟體,找到了提供用戶上傳和下載視頻服務的迅雷,彼時的迅雷對不良圖片和視頻的識別有著迫切的需求——「鑒黃師」的工作強度苦不堪言,用傳統方法肉眼識圖,一天最多處理數千到上萬張,根本跟不上爆炸性增長的信息量。

為了讓計算機從頭學起,李明強也曾經歷「老眼昏花」的過程:圖普科技一眾「鑒黃師」挨個給幾萬個黃色視頻貼上內容標籤,教會計算機模型初步判斷能力。「我們把大量的色情、性感、正常屬性的樣本灌入深度學習模型,通過人工糾正計算機對圖片的誤判,從而得到不斷修正、迭代的演算法模型。」李明強介紹道。計算機通過累積的海量數據,去分析每種類型照片具備的數據特徵,並對照片做出正常、性感或色情的歸納。

隨著海量的數據對計算機識別模型的訓練,目前圖普科技對單個視頻處理時間小於1秒,100張圖片處理時間小於1秒。相較於人工審核98%的準確度,在這種處理速度下圖普的準確度是99.5%,日處理量「數以億計」。

更進一步:以AI助力新零售

與迅雷的合作讓圖普科技「一炮而紅」。圖普科技迅速佔據了國內圖像審核市場份額第一的位置,和酷狗、今日頭條、唱吧、秒拍等數百個互聯網平台達成合作,並牽頭設立了相關行業標準。

打開了市場知名度,度過了最初創業期,成為國內最大的圖像識別雲平台後,李明強仍在思考公司的下一步轉型。新零售,成為他眼中的下一座「險峰」。

每一個走進商店的人,其實不只是「消費者」一個籠統的概念,通過分析相關視頻,比如「哪些商品前停留的人最多,我們可以畫出熱區,這些最具有吸引力的商品可以擺放在最顯眼的位置,將人臉識別技術結合購買支付行為,可分析用戶偏好,精準營銷、會員服務及促銷活動。」李明強解釋道。

此外,通過視頻可以提取出用戶的軌跡、熱區、客流量及員工行為等數據,而諸如性別、體型、衣著等信息則可以描繪出不同類型消費的個性化需求。接著便可以依此精準調整門店商品布局,「以消費者體驗為中心」將不再是一句空洞的口號。

在李明強看來,提升對客戶的識別度、提高消費者線下門店體驗,將成為新零售未來的制勝法寶。

鏈接

圖普科技現有員工100多名,其中研發人員佔70%。

每年招聘季圖普科技都會出一道以人工智慧、深度學習等知識為背景的謎題,不設問題和特定答案。去年超過10萬人參與破解,但最終通過該測試的只有68人。通過測試的人,可獲得圖普科技實習或直達招聘終面機會。

此外,李明強特地給每個部門都設置主題學習庫,平常工作日讀書半小時,休息日讀書一小時。「員工在工作時間外讀書,都算是加班,給加班費」,李明強說,人才引進和培養是公司發展的頭等大事。

文/廣州日報全媒體記者黃斌、何瑞琪

圖/廣州日報全媒體記者王維宣

專題統籌:劉文亮、湯新穎、羅樺琳


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 廣州日報 的精彩文章:

男子結婚5年才發現不育!竟和小時候這個病有關……家長們要留意!
1.3噸!廣東破獲建國以來全國最大可卡因走私案

TAG:廣州日報 |