為了治好你的臉盲,這家表情包網站開源了一個明星識別器
郭一璞 發自 凹非寺
量子位 報道 | 公眾號 QbitAI
小鮮肉太多,讓人分不清,需要AI替我識別,這又是誰家的愛豆。
現在,有一家公司來拯救臉盲了,不是你熟悉的矽谷/後廠村大公司,而是一家動圖表情包網站:GIPHY。
GIPHY開源了一個表情包識別器,可以分清楚超過2300個名人,而且它識別的還是動圖,準確率超過98%。
這效果,可以的
良心的是,GIPHY不僅把這個工具開源了,而且還直接用在了自己的網站上,不是Demo,已經是成品。
那我們來測驗一下這個功能好不好用~
第一張,泰勒·斯威夫特,傳上去試試效果
認出來了,匹配度84.92%。
換個人,安妮·海瑟薇~
這次認還是認出來了,就是AI心裡不太有譜,它的把握不到6成,甚至還覺得可能是另一個妹子。
我們加大難度,看艾瑪·沃森這張魔性的動圖能不能認出來。
Emma覺得不行
笑成這樣,估計識別起來有點難了吧?
還真是,AI雖然認出來這是Emma,但是,它覺得還有4個妹子笑得跟Emma一樣魔性
另外,這個AI還對一位明星表現出了迷之鐘愛:
赫本的匹配度,高達100%
這讓人懷疑AI的心理年齡……
模型原理
模(mei)型(zi)測評就先到這裡了,我們來看看這個模型是怎麼訓練出來的。
擺在GIPHY團隊里的第一個問題,就是識別誰,以及用什麼數據集。
作為一個表情包網站,秉持著自己動手豐衣足食的精神,先把自己家的熱搜TOP 50000盤點了一下,找到了裡面的所有人名,接著又用同樣的方法去Facebook、Twitter等網站搜了一遍,湊齊了一個2300多名人的人臉資料庫。
識別的過程則包括兩部分,第一部分是人臉檢測,使用MTCNN(arxix: 1604.02878)預訓練模型來找動圖中所有幀里的人臉;第二部分是人臉識別,用前面的那個DIY的數據集在基於Resnet-50的深度卷積神經網路上訓練,以識別MTCNN模型發現的每一張人臉。
最後,還需要對人臉進行聚類,給出預測結果。
模型訓練完成後,在Labeled Faces in the Wild數據集上的準確度達到了96.8%。之後GIPHY還做了一個眾包驗證集,在這個驗證集上的準確度達到了98%,覆蓋度達到75%。
最後,這個模型已經在GitHub上開源了,如果想自己用的話,需要Python 3.6及以上的版本,用Linux的話則需要安裝好libsm,libxext,libxrender。
進入下面傳送門體驗一下吧~
傳送門
在線使用
https://celebrity-detection.giphy.com/
開源地址
https://github.com/Giphy/celeb-detection-oss
—完—
訂閱AI內參,獲取AI行業資訊
購買AI書籍
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。
喜歡就點「好看」吧 !


※超強幹貨!TensorFlow易用代碼大集合,請盡情複製粘貼
※老牌國產晶元公司國芯為AI再出發!獲國投創合+創新工場1.5億元融資
TAG:量子位 |