今日芯聲 | 拒絕大眾化！不整容也能讓你得到一張獨一無二的臉

科技 11-04

原標題：今日芯聲 | 拒絕大眾化！不整容也能讓你得到一張獨一無二的臉

「今日芯聲」是讀芯術推出的一檔簡讀欄目，匯聚每日國內外最新最熱的AI應用資訊，敬請關注。

1. 萬聖節，用巧妙的「魔法」幫你合成一張臉

萬聖節剛過不久，小編在一直被 Cos的過程中感到瑟瑟發抖......在鬼面具，小丑面具，各種驚悚面目的突襲氛圍中剛回神兒，就在公眾號被種草了一個大膽的想法：

要是所有兇惡的臉，用CV給合成為一張臉，是不是就能出現一張獨一無二、天下第一兇惡的臉呢？

解決方案

通過 Image Morphing 技術，給定兩張圖片 I 和 J ，就可以疊加（或者叫做混合）I 和 J 來獲得一張中間狀態的圖片 M。I 和 J 的疊加由一個參數[0,1]區間內的參數 alpha 來控制。

當 alpha=0時，M 就等同於 I，而 aphla=1時，M 就為 J。換言之， M 中的每一個像素 M(x,y)，都可以通過這樣一個公式來得到它的值：

M(x,y) = (1 – alpha)·I(x,y) + alpha·J(x,y)

當 alpha=0.5的時候，I 和 J 就五五開，平均貢獻了 M。如果 I 和 J 是兩張人臉照片的話，M 自然也就成了它們的「平均臉」。

看起來好容易哦，那我們趕緊找兩張照片來試試吧！就用這兩張：

這兩張照片alpha=0.5後直接疊加的結果：

媽耶，重影圖是什麼意思？？差強人意。那假如我們把兩個人的眼睛和嘴對齊，看看是什麼效果。（Show time！）

對齊人臉

要想對齊兩張人臉，需要建立兩張照片中像素的對應關係。對 I 中的某一個像素點(xi,yi)，找到它在 J 中的對應點 (xj,yj)，進一步找到 M 中這兩個點疊加之後所處位置(xm,ym)。再用下面算式1（記住這個標號，後面有用）計算出 M 中對應點的像素值：

xm = (1-alpha) · xi + alpha · xj

ym = (1-alpha) · yi + alpha · yj

將上面的過程運用到整幅畫每一個像素點上算式2（記住這個標號，後面有用）：

M(xm,ym) = (1 – alpha)·I(xi,yi) +alpha·J(xj,yj)

接下來，可以把一張人臉分割成若干三角形的區域，疊加兩張臉上對應的三角區域。

具體方法如下：

1. 獲取人臉特徵

我們先在每張面孔上獲取68個面部基準點??。

2. Delaunay 三角剖分

在獲得了68個面部基準點之後，我們結合人臉所在的矩形的四個頂點和每條邊的中心點，將人臉所在的矩形分割成如下圖所示的三角形的組合。

3. 基於Delaunay剖分三角形的仿射變換

得到這些Delaunay剖分三角形後，再分別對齊各個區域，對其中像素值進行平均。

使用前述的算式1，根據圖像I和圖像J中已經獲得的76個點，在疊加的結果圖像M中找到76個點(xm, ym），從圖像I中選取一個三角形 ti，在 M 中找到對應區域 tm，通過 ti 三個頂點到 tm 三個頂點的映射關係來計算 ti 到 tm 的仿射變換。同理計算出tj到tm的仿射變換。

重複這個過程，處理圖像 I 中的每一個三角形，得到一個扭曲的（warped）圖像 I"。用同樣的方法處理圖像 J，獲得扭曲的圖像 J"。得到了扭曲的圖像 I"和圖像 J"。這兩個圖像就可以直接使用算式2進行疊加了。最後得到疊加結果：

疊加人臉

算式2用於疊加2張人臉，在alpha=0.5時求取的是兩張臉的平均。

那麼我們把算式推廣一下，從圖像I和圖像J推廣為圖像I_1, I_2, I_3, ..., I_n；令 alpha=1/n；則算式2變形為如下：

M(xm,ym) = 1/n · [I_1(xi_1, yi_1) + I_2(xi_2, yi_2) + ... ... + I_n(xi_n, yi_n)]

由此，我們也就得到了n張臉的平均。

用這個方法，我們可以得到6位美國總統的平均臉：

他們平均之後的樣子是這樣的：

萬聖節上演一出「變臉」好戲！種草種草，cos了我的小怪們要不要出來戰鬥？（無敵是多麼多麼寂寞~~~）

2. 神器：準兒GO翻譯機

出國旅遊，語言是最大障礙。雖然現在手機上也有很多翻譯軟體，但是從小編的使用經歷來看，卻是賊不！靠！譜！

手機的翻譯軟體，在家安安靜靜的環境，有時候都可能翻譯錯誤，更何況到了旅遊景點，人來人往嘈雜的環境，收音不清，翻譯半天也沒出個結果……

每次對話，都要對著手機大喊，結果翻譯出來的內容風馬牛不相及，整天舉著手機翻譯，電量唰唰唰就沒了，等真要用到手機聯繫人的時候才發現已經開不了機了……

準兒GO翻譯機是由來自清華大學的團隊研發一款主打旅遊服務的翻譯機，針對不同地域的語言之間存在的口音差別，通過搭載深度學習，口音修復，解決不同國家的口音識別。

所以準兒GO不僅僅是機械的翻譯標準口音，而在遭遇「方言」時也能輕鬆的應對。在旅遊的時候使用翻譯機，最怕的就是周邊環境最嘈雜，而這個準兒GO也幫你想到了。它採用的是四麥降噪技術，可以有效的抑制環境噪音，對人聲的識別更準確。

57種語言

從語言的掌握程度來看，這款準兒GO可以說是翻譯機界的翹楚了，絕對秒殺市面上大部分的翻譯機。它包含了45種語言之間的互譯，不僅支持中文對外語的互譯，同時支持外語對外語的互譯，這樣強大的功能，雖然是一款專門針對旅遊研發的翻譯機，但是放在商務場合也是非常合適的。

另外，準兒GO還貼心考慮到了方言的問題，擁有9種英語口音、2種法語、2種西班牙語……在內的57種口音，面對「口音重」的英語也不擔心出現聽不懂的問題。

離線翻譯

出門在外，不可能隨時都有網路，如果網路不通的地方需要用到翻譯機怎麼辦？有了準兒GO離線照樣溝通不誤。

它內置了離線翻譯引擎，支持中英日韓俄法6國離線翻譯，採用TZ-NMT神經遞歸離線演算法，將翻譯模型壓縮到1/50，提升離線雙向翻譯準確率及響應速度。以後再也不用擔心，出門在外網路差或者沒網路時，翻譯機不能用啦~

AI拍照翻譯、AI識物

出國旅遊，到餐廳吃飯翻菜單的時候看著那密密麻麻的外文是不是又要頭疼了，準兒Go，它的AI拍照翻譯，文章、菜單、路牌、商品標籤都難不倒它，可以支持15 語種言的對中/英的拍照翻譯。

一路上有任何看不懂的路牌，一拍就翻譯出來，那些奇特的建築、美麗的畫作、城市的雕塑，拍一下就知道其歷史和典故，不但悠閑的一路看風景，還能預防路痴在同一個地方來迴轉。

神奇的AI識物功能，強大的OCR識別技術，只要你將動物、植物拍攝下來，就可以通過AI識別圖像，並且看到這個圖像的詳細介紹哦~

景點講解、語音助手

景區導覽功能讓你在遊玩的同時，不再是走馬觀花，大字不識的狀態。比如你在法國巴黎，盧浮宮是必去之地吧，只要你問AI語音秘書，它就能給你科普這個景點的歷史、故事，讓你成為移動的百科全書。

SOS給予安全感

在看過那麼多女孩在國外遭遇不測的新聞之後，我們才意識到，關鍵時候的自保能力是一件多麼重要的事情。

這款準兒GO貼心的考慮到了旅途中可能出現的任何狀況，開啟它的SOS功能，準兒羅列了N多個國家的國家區號、報警電話、急救電話、中國領事館地址、電話等，有了準兒GO，單身妹紙在國外旅遊是不是更有安全感了呢？

世界那麼大，小編我也想去看看啊！

3. Airbnb 用神經網路增強搜索引擎

家庭 / 公寓租賃服務公司 Airbnb 發表論文，公布了他們如何將 AirBnB 的主要列表搜索引擎轉換為基於神經網路的系統的詳細信息。

本文重點強調了在產品和研究中部署AI系統的不同，並表示這是繼谷歌在 2015 年用「RankBrain」增強其搜索引擎之後的另一大突破。

「RankBrain」是一個基於神經網路的系統，發布之後幾乎在一夜之間成為選擇向用戶顯示搜索結果的最重要因素之一。「這篇論文面向的是那些擁有機器學習系統並開始考慮使用神經網路（NN）的團隊，」研究人員寫道。

AI 研究的其中一個秘密之一，就是前沿研究於生產用例之間的鴻溝，研究人員偏愛在樣本任務中的新方法，而行業和大企業卻偏愛可以大規模泛化的簡單技術。

該研究的目的就是解決這樣的問題，研究人員從開始使用單層神經網路模型，之後使用更複雜的系統，再選擇擴大規模的解決方案作為最終產品。「通過簡單地將訓練數據縮放 10 倍並移動到具有 2 個隱藏層的 DNN，這並不複雜。」

Airbnb的主要搜索引擎採用深度學習進一步表明，深度學習已進入工業化階段，大型公司將會採用該技術並將其整合到最重要的產品中。

小編已然感受到了AI「潤物細無聲」地不可缺少之處，「寒冬將至」這種言論當然也不攻自破。

4. PowerVR PVRIC4新一代強大的圖像壓縮技術

想像力技術公司(Imagination Technologies)推出了PowerVR PVRIC4，這是該公司新一代強大的圖像壓縮技術，能夠在平板電腦和智能手機上實現更好的圖像質量。

總部位於倫敦的想像力技術公司(Imagination Technologies)表示，採用這種技術的客戶正瞄準數字電視、智能手機和平板電腦等設備以降低成本，同時又不會明顯降低圖像質量。

PVRIC4實現了隨機訪問的視覺無損圖像壓縮，確保了至少50%的帶寬和內存佔用，並使系統能夠克服性能帶寬限制。

想像力使PVRIC4成為一個系統晶元(SoC)製造商集成到他們的多媒體管道的獨立知識產權塊。

這一區塊已經被包括Chips & Media在內的Imagination合作夥伴所使用，這些合作夥伴可以訪問PVRIC4，這是最近的一項合作的一部分，目的是為一個利用PowerVR GPU和WAVE5視頻編解碼器的系統提供一個最佳的解決方案。

公司在加利福尼亞聖克拉拉的處理器會議上公布了這項技術。

「想像力(ImaginationTechnologies)的PVRIC4是GPU壓縮技術的重要進展，」Linley Group首席分析師Linley Gwennap在一份聲明中說。

「對內存帶寬和佔用空間的日益增長的需求是SoC製造商真正關心的問題，因此結合無損壓縮和視覺無損壓縮的能力可以節約成本和帶寬。」

PVRIC4的特點是雙管道框架緩衝壓縮引擎。一種新的有損管道，僅在無損管道不能達到50%壓縮的情況下使用，可以確保即使難以壓縮的「雜訊」圖像也能以最高的保真度進行壓縮。

一個決策邏輯塊決定應該使用哪個輸出來保證壓縮比，由於高度調優的演算法，圖像質量的變化是難以察覺的。

由於這種混合解決方案，PVRIC4為SoC製造商提供了兩種方法中最好的一種，最高的保真度確保了在圖形和視頻內容上節省帶寬和幀緩衝分配。這都是在硬體中執行的，實現時沒有任何性能開銷。

PVRIC4帶寬的儲蓄轉化為更好的電池壽命為消費者和成本節約系統製造商,使更多的內存和帶寬被釋放為其他用途,如啟用同步快5 g下載在GPU使用或減少系統中使用的內存晶元數量。

想像力公司PowerVR執行副總裁奈傑爾·利德(Nigel Leeder)在一份聲明中表示:「隨著更高解析度4K和8K顯示器的需求不斷增加，以及降低系統成本的願望，將內存帶寬最小化的需求一直是我們客戶的首要任務。

他們需要一個能降低成本、降低電力的解決方案。通過在我們的GPU中引入視覺無損壓縮，我們現在可以保證減少內存帶寬和使用。」

PVRIC4將作為下一代PowerVR GPU的一個特性被使用，現在可以作為一個獨立的IP塊獲得授權。

留言點贊發個朋友圈

我們一起探討AI落地的最後一公里

素材來源：搜狐科技、機器之心、人工智慧頭條、ofweek等

如需轉載，請後台留言，遵守轉載規範

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 讀芯術 的精彩文章:

※AI被人類「虐殺」？大師尚遠！

TAG:讀芯術 |