當前位置:
首頁 > 最新 > 利用OpenCV實現人臉識別應用案例

利用OpenCV實現人臉識別應用案例

在人工智慧時代,人臉識別是一種非常前沿的技術,最近支付寶、騰訊、百度都推出了刷臉支付、刷臉過閘、刷臉簽到等看起來非常酷的技術服務,因此也研究了一段時間,百度AI開放平台有人臉識別API可以用,但是只開放給企業用戶,而且收費很高,個人用戶是沒有辦法玩一玩了,並且數據安全有些令人擔心。

由此,產生一種想法,就是利用Python的開源類庫來實現人臉識別,在百度和Google搜到了不少案例,但是要研究明白了拿來用也不簡單,搞了兩周了才基本搞明白了OpenCV這個開源類庫裡面的道道,開發了一個簡單的人臉識別應用,用來識別攝像頭拍攝的實時視頻流或者從視頻文件讀取到的視頻流,圖像人臉識別要簡單多了,很快就搞懂了,但是就是這個視頻流不好搞,在開發中遇到很多技術問題,請教了一些專家又查了很多資料才搞懂了。

人臉識別的根本在於自動在圖像中檢測和跟蹤人臉,進而對檢測到的人臉進行臉部的一系列相關技術,例如,比對圖像庫里的圖片識別人物啦,美顏啦,更高端一些的換臉啦等等,因此首先要把人臉的特徵信息標註出來,包括眼睛、耳朵、嘴巴等等——這個就是所謂的哈爾特徵(HAAR),OpenCV提供了很多的訓練好的HAAR特徵模型文件(XML),載入這些模型的核心方法是cv2.CascadeClassifier(),只有成功載入了模型才能通過模型來提取人臉區域。

OpenCV的網上教程一堆(讀下來挺花時間的),不說廢話,上代碼:

我寫的這個簡單的利用CV2實現人臉識別Python程序的運行效果:

GIF

在研究人臉識別這種技術的同時,我也在不斷思考,這種技術的應用場景非常之多,除了前面提到的刷臉支付、刷臉過閘、刷臉簽到等,在現實生活中其實還有更多的應用場景可以應用到人臉識別技術,提高用戶體驗和效率。

(一)此前一篇文章《眾籌項目手機APPTimeless(永恆)背後的故事》里提到的美國一位14歲的小朋友Emma Yang正在眾籌開發的Timeless手機APP,利用的也是這種人臉識別技術,幫助老年痴呆症患者記起親人的名字,只要拍個照片,然後做人臉識別,在資料庫里比對,找到正確的人,然後將其姓名、關係、此前的一些雙方互動事項等提示出來,利用技術手段幫助老年痴呆症患者和親屬,這就是humanityFirst(人性至上)。

(二)虛擬辦公已經在很多公司推行了,例如老闆不到辦公室也想知道公司里的員工的工作情況,就可以將人臉識別技術和視頻會議系統結合起來,然後裝在一個可以遙控的機器人身上,在辦公區域移動,識別出每一個員工,然後和其對話,就如同老闆身臨其境一樣。這就是真正的在家+虛擬辦公!

(三)視頻會議,是現代科技公司的常態工作模式了,但是是參加視頻會議的每一個人都是誰呢?他/她的姓名、頭銜、簡介呢?利用人臉識別技術就可以做到這一點,快速跟蹤是識別是誰在講話,然後通過convert speechto Text的技術將語音同步記錄下來,然後同步翻譯,實現無縫溝通!這在過去只能是科幻電影里才有的場景,而現在,就可以通過這些技術手段實現出來。

(四)在線診斷,醫院裡專家很忙的,到處出差跟定不行,因此就有了很多遠程在線診斷系統,而目前這些診斷系統並沒有加入人臉識別的元素,加入人臉識別之後,可以非常快速地識別出病人,同步調出病例,不需要其他操作直接顯示在屏幕上便於查詢瀏覽,提高診斷效率。

(五)銀行業務,昨天我到招商銀行辦理一個業務,發現在過去地密碼確認之後又多了一個人臉識別驗證,在線採集我地臉部特徵,然後確認「我」就是「我」!在未來,這個人臉識別驗證在進一步發展,用來出行,酒店,購物,辦事等等,這就是科幻電影里里展現出來的未來科技時代(大數據、人工智慧、機器人)了。

在以上這些之外,人臉識別還有更多的應用場景去發掘和應用,更加不要說騰訊公司都開始用這種人工智慧技術去貴州養鵝了,開發了鵝臉識別(^_^)。

在年前我的團隊給客戶提了一個案例,convert speech to text,在視頻會議中自動將語音轉化為文字,這個提案加上人臉識別功能,那就厲害了!除了將開會記錄自動轉為文字保存起來,自動翻譯成各種文字,而且還能在線提示是誰說的,他/她的姓名、頭銜、簡介在屏幕上顯示出來,保存會議記錄的時候說話人的名字都可以實時記錄下來,功能會特彆強大而amazing!研究一下,做個Demo,值得期待!

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 韓思工作室 的精彩文章:

推薦一本書:時間簡史

TAG:韓思工作室 |