當前位置:
首頁 > 科技 > 為了治好你的臉盲,這家表情包網站開源了一個明星識別器

為了治好你的臉盲,這家表情包網站開源了一個明星識別器

郭一璞 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

小鮮肉太多,讓人分不清,需要AI替我識別,這又是誰家的愛豆。

現在,有一家公司來拯救臉盲了,不是你熟悉的矽谷/後廠村大公司,而是一家動圖表情包網站:GIPHY

GIPHY開源了一個表情包識別器,可以分清楚超過2300個名人,而且它識別的還是動圖,準確率超過98%

這效果,可以的

良心的是,GIPHY不僅把這個工具開源了,而且還直接用在了自己的網站上,不是Demo,已經是成品。

那我們來測驗一下這個功能好不好用~

第一張,泰勒·斯威夫特,傳上去試試效果

認出來了,匹配度84.92%。

換個人,安妮·海瑟薇~

這次認還是認出來了,就是AI心裡不太有譜,它的把握不到6成,甚至還覺得可能是另一個妹子。

我們加大難度,看艾瑪·沃森這張魔性的動圖能不能認出來。

Emma覺得不行

笑成這樣,估計識別起來有點難了吧?

還真是,AI雖然認出來這是Emma,但是,它覺得還有4個妹子笑得跟Emma一樣魔性

另外,這個AI還對一位明星表現出了迷之鐘愛:

赫本的匹配度,高達100%

這讓人懷疑AI的心理年齡……

模型原理

模(mei)型(zi)測評就先到這裡了,我們來看看這個模型是怎麼訓練出來的。

擺在GIPHY團隊里的第一個問題,就是識別誰,以及用什麼數據集。

作為一個表情包網站,秉持著自己動手豐衣足食的精神,先把自己家的熱搜TOP 50000盤點了一下,找到了裡面的所有人名,接著又用同樣的方法去Facebook、Twitter等網站搜了一遍,湊齊了一個2300多名人的人臉資料庫。

識別的過程則包括兩部分,第一部分是人臉檢測,使用MTCNN(arxix: 1604.02878)預訓練模型來找動圖中所有幀里的人臉;第二部分是人臉識別,用前面的那個DIY的數據集在基於Resnet-50的深度卷積神經網路上訓練,以識別MTCNN模型發現的每一張人臉。

最後,還需要對人臉進行聚類,給出預測結果。

模型訓練完成後,在Labeled Faces in the Wild數據集上的準確度達到了96.8%。之後GIPHY還做了一個眾包驗證集,在這個驗證集上的準確度達到了98%,覆蓋度達到75%。

最後,這個模型已經在GitHub上開源了,如果想自己用的話,需要Python 3.6及以上的版本,用Linux的話則需要安裝好libsm,libxext,libxrender。

進入下面傳送門體驗一下吧~

傳送門

在線使用

https://celebrity-detection.giphy.com/

開源地址

https://github.com/Giphy/celeb-detection-oss

訂閱AI內參,獲取AI行業資訊

購買AI書籍

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。

喜歡就點「好看」吧 !

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 量子位 的精彩文章:

超強幹貨!TensorFlow易用代碼大集合,請盡情複製粘貼
老牌國產晶元公司國芯為AI再出發!獲國投創合+創新工場1.5億元融資

TAG:量子位 |