利用OpenCV實現人臉識別應用案例

最新 04-17

在人工智慧時代，人臉識別是一種非常前沿的技術，最近支付寶、騰訊、百度都推出了刷臉支付、刷臉過閘、刷臉簽到等看起來非常酷的技術服務，因此也研究了一段時間，百度AI開放平台有人臉識別API可以用，但是只開放給企業用戶，而且收費很高，個人用戶是沒有辦法玩一玩了，並且數據安全有些令人擔心。

由此，產生一種想法，就是利用Python的開源類庫來實現人臉識別，在百度和Google搜到了不少案例，但是要研究明白了拿來用也不簡單，搞了兩周了才基本搞明白了OpenCV這個開源類庫裡面的道道，開發了一個簡單的人臉識別應用，用來識別攝像頭拍攝的實時視頻流或者從視頻文件讀取到的視頻流，圖像人臉識別要簡單多了，很快就搞懂了，但是就是這個視頻流不好搞，在開發中遇到很多技術問題，請教了一些專家又查了很多資料才搞懂了。

人臉識別的根本在於自動在圖像中檢測和跟蹤人臉，進而對檢測到的人臉進行臉部的一系列相關技術，例如，比對圖像庫里的圖片識別人物啦，美顏啦，更高端一些的換臉啦等等，因此首先要把人臉的特徵信息標註出來，包括眼睛、耳朵、嘴巴等等——這個就是所謂的哈爾特徵（HAAR），OpenCV提供了很多的訓練好的HAAR特徵模型文件（XML），載入這些模型的核心方法是cv2.CascadeClassifier()，只有成功載入了模型才能通過模型來提取人臉區域。

OpenCV的網上教程一堆（讀下來挺花時間的），不說廢話，上代碼：

我寫的這個簡單的利用CV2實現人臉識別Python程序的運行效果：

GIF

在研究人臉識別這種技術的同時，我也在不斷思考，這種技術的應用場景非常之多，除了前面提到的刷臉支付、刷臉過閘、刷臉簽到等，在現實生活中其實還有更多的應用場景可以應用到人臉識別技術，提高用戶體驗和效率。

（一）此前一篇文章《眾籌項目手機APPTimeless（永恆）背後的故事》里提到的美國一位14歲的小朋友Emma Yang正在眾籌開發的Timeless手機APP，利用的也是這種人臉識別技術，幫助老年痴呆症患者記起親人的名字，只要拍個照片，然後做人臉識別，在資料庫里比對，找到正確的人，然後將其姓名、關係、此前的一些雙方互動事項等提示出來，利用技術手段幫助老年痴呆症患者和親屬，這就是humanityFirst（人性至上）。

（二）虛擬辦公已經在很多公司推行了，例如老闆不到辦公室也想知道公司里的員工的工作情況，就可以將人臉識別技術和視頻會議系統結合起來，然後裝在一個可以遙控的機器人身上，在辦公區域移動，識別出每一個員工，然後和其對話，就如同老闆身臨其境一樣。這就是真正的在家+虛擬辦公！

（三）視頻會議，是現代科技公司的常態工作模式了，但是是參加視頻會議的每一個人都是誰呢？他/她的姓名、頭銜、簡介呢？利用人臉識別技術就可以做到這一點，快速跟蹤是識別是誰在講話，然後通過convert speechto Text的技術將語音同步記錄下來，然後同步翻譯，實現無縫溝通！這在過去只能是科幻電影里才有的場景，而現在，就可以通過這些技術手段實現出來。

（四）在線診斷，醫院裡專家很忙的，到處出差跟定不行，因此就有了很多遠程在線診斷系統，而目前這些診斷系統並沒有加入人臉識別的元素，加入人臉識別之後，可以非常快速地識別出病人，同步調出病例，不需要其他操作直接顯示在屏幕上便於查詢瀏覽，提高診斷效率。

（五）銀行業務，昨天我到招商銀行辦理一個業務，發現在過去地密碼確認之後又多了一個人臉識別驗證，在線採集我地臉部特徵，然後確認「我」就是「我」！在未來，這個人臉識別驗證在進一步發展，用來出行，酒店，購物，辦事等等，這就是科幻電影里里展現出來的未來科技時代（大數據、人工智慧、機器人）了。

在以上這些之外，人臉識別還有更多的應用場景去發掘和應用，更加不要說騰訊公司都開始用這種人工智慧技術去貴州養鵝了，開發了鵝臉識別（^_^）。

在年前我的團隊給客戶提了一個案例，convert speech to text，在視頻會議中自動將語音轉化為文字，這個提案加上人臉識別功能，那就厲害了！除了將開會記錄自動轉為文字保存起來，自動翻譯成各種文字，而且還能在線提示是誰說的，他/她的姓名、頭銜、簡介在屏幕上顯示出來，保存會議記錄的時候說話人的名字都可以實時記錄下來，功能會特彆強大而amazing！研究一下，做個Demo，值得期待！

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 韓思工作室 的精彩文章:

※推薦一本書：時間簡史

TAG:韓思工作室 |