為什麼手機廠商都稱自己為 AI 手機

最新 08-07

科技大爆炸的時代，計算機技術創新給帶來的互聯網與智能硬體帶來的發展，很巧妙的通過物質、精神和時間侵蝕著、影響著、推動著人們的生活。

繼10年前喬布斯帶領蘋果重新定義手機之後，加以AI晶元的誕生，令人工智慧手機有了跨越式的進步，人們通過它能夠體驗到更豐富的功能。智能手機就像個人電腦一樣，具有獨立的操作系統，可以由用戶自行安裝軟體、遊戲等第三方服務商提供的程序，通過此類程序來不斷對手機的功能進行擴充，並可以通過移動通訊網路來實現無線網路（Wi-Fi）接入的這樣一類手機的總稱」。智能手機橫空出世，空前的跨越年齡、性別、種族、地域、國家等多個大維度，這個高科技的「大玩具」成為人們生活和工作的必需品。

人們基本上任何場景和時間下都離不開手機，手機市場也隨著人們需求的增加而繁榮。越來越多的智能手機廠商加入到了「AI」大軍之中，他們的宣傳內容基本是給用戶灌輸一個思想：由於我們的手機加入了AI，所以能力會更加強悍。這其中宣傳看多了之後我們容易形成一個觀點：AI的作用，就是增強。

一個不算太恰當的比喻，手機不再只是一個機械的工具，而是一個開始有自己思想的僕人。

各大手機廠商產品研發運用了哪些創新性人工智慧技術：

當人工智慧入駐手機後，AI科技給手機帶來的智能化功能變革：

手機智能助理

以語音助手的形式出現的自然語言處理，從最早蘋果的Siri，微軟的Cortana和小冰，這些都是最早出現在手機上的AI智能語音助手。AI語音助手對於我們使用體驗的提升是顯而易見的，更智能的Siri，Bixby等語音助手，對於我們的幫助都是看得見的，而且通過反覆教語音助手還可以讓手機按照你的意願回答問題。

三星的 Bixby 語音助手功能則更是 AI 對 App 整合的一個典型代表。比如語言邏輯很複雜的「用第一張照片發朋友圈並說開會了」，Bixby 能快速識別，並按照這句話的內容配上圖庫第一張照片，發朋友圈狀態「開會了」。

通過語音控制手機，有可能是一個媲美iPhone觸屏控制手機的殺手級交互應用，這意味著開創出新一代計算中心的可能。誰能將這一塊用戶體驗做好，一方面將大大降低使用門檻，另一方面將極高提高用戶效率和用戶體驗，其成就或許不亞於喬布斯在蘋果公司的創新。

相機特效

·人臉識別：被提到最多的就是手機的攝像頭方面，利用先進的機器學習識別用戶樣貌的變化，即使用戶戴著帽子，留起鬍鬚，或者佩戴眼鏡，用戶也一樣可以使用面部識別功能。人工智慧就會自動識別場景，然後將相機自動調節到最合適的參數上。

以榮耀 V10 為例，它的 AI 拍照能力可以自動識別出 13 種場景，系統會匹配專業攝影師拍攝這種場景時的參數，從而幫助用戶拍出更出色的照片。用戶在使用這項功能的時候，並不會明顯感知到，但在無形中，普通用戶與專業人士的差距得到了一定程度上的減小。

舉個例子，如今的智能手機將面部識別作為 AI 功能的展示方式。而早在 Android 4.X 時代，Google 就在系統中加入了人臉識別。

但實際上，且不論兩種識別方式的雲泥之別，在邏輯上，兩者就有根本不同。Android 4.X 時代的「人臉識別」過程中，用戶的臉只是一把用來開鎖的鑰匙，稍有異樣便不能被識別；如今 AI 時代的人臉識別則是，手機通過學習記住了用戶的面部特徵，然後手機自動為用戶打開。

· 場景優化：通過視覺信息的採集，運用人工智慧對圖形圖像做精準地比對分析，讓機器進行深度學習、理解和思考，從而以立體顯示方式，在手機上創造出更完美、更真實的圖像信息。（局部效果增強、局部小草變的更綠）

AI進行拍照風格化和人像深度處理，已經並不新鮮。接下來用AI進行圖像增強，處理光影拍攝和動態捕捉會成為新的亮點。

就好比：使用圖像語義分割與分區調效的AI技術，使得藍天更通透，綠草更鬱鬱蔥蔥，畫面層次更加分明，隨手拍出大師級作品；AI智能檢測，多人合影亦能精準虛化，智能構圖提醒幫你拍住大家都稱讚的合影；圖像識別的智慧美顏，人景分離帶來唯美虛化分區調優令細節更清晰，膚白貌美，拍出自然精緻；AI智能補光，讓膚色保持一致，給你專屬打光師的極致效果。

照片分類

人臉識別帶來的新功能，是「人物」相冊。蘋果會自動按照照片中的不同人物，分成不同相冊，用戶還可以為每個相冊添加名字，便於查找。

而對物體和場景的識別，帶來的是「強大的搜索」。比如說一張有山有水有人有馬的照片，以後就可以根據其中的場景（山、河）和物體（人、馬）搜索出來。

這三者結合起來，就有了新「照片」應用中的「回憶」功能。蘋果會根據照片的拍攝時間地點、其中的人、物體和場景，將它們以「回憶」的形式組織起來，還附贈蘋果幫你配了背景音樂的視頻，比如說某次全家出門旅行的照片，就會被自動放在同一個「回憶」中。

AI手機特殊功能背後的技術：

人臉識別

人臉識別系統主要包括四個組成部分，分別為：人臉圖像採集及檢測、人臉圖像預處理、人臉圖像特徵提取以及匹配與識別。

而人臉識別需要積累採集大量人臉圖像相關的數據，用來驗證演算法，不斷提高識別準確性，這些數據諸如A Neural Network Face Recognition Assignment(神經網路人臉識別數據)

龍貓數據，為諸多手機廠商採集標註了大量的人臉數據，包括人臉輪廓，五官位置，和人臉關鍵點等特徵提取，數據準確率在行業內首屈一指！

強大的人臉識別功能通過Face ID 打開您的手機，再也不用擔心指紋解鎖出現的指紋不清晰時反覆按鍵最後不得不只能輸入密碼的尷尬情況，同時也不需要擔心Face ID 支付失敗或者被盜取，等危急情況發生。

NLP自然語言處理

自然語言處理(NLP)是人工智慧和語言學的一部分，它致力於使用計算機理解人類語言中的句子或詞語。NLP 以降低用戶工作量並滿足使用自然語言進行人機交互的願望為目的。因為用戶可能不熟悉機器語言，所以 NLP 就能幫助這樣的用戶使用自然語言和機器交流。

NLP應用於各種領域：

拼寫檢查

關鍵字搜索

查找同義詞

從網站提取信息，例如：產品價格，日期，地點，人員或公司名稱

機器翻譯

口語對話系統、

複雜的問答系統

作為人工智慧的一個分支，深度學習及大量的數據訓練仍是決定NLP的主要因素：

一條基礎語料最終將被處理為所歸屬領域、目的意圖、和基礎分詞，然後將其輸入至NLP演算法，基於大量的數據訓練，最終貢獻於各個應用場景。

語音識別

語音識別，語音轉文本，簡稱ASR（Automatic Speech Recognition）。應用ASR技術的常見產品包括語音輸入法、語音錄音工具等，幫助用戶快速將語音信息記錄為文本。

龍貓數據了解到的中文語音識別產品主要有：搜狗輸入法、訊飛輸入法、Apple Siri、Google Now（被牆了）和出門問問，微軟小冰等，然後還有各種智能音響，吃瓜群眾肯定都想知道他們是怎能實現的，其實最重要的兩個步驟就是訓練和識別：

訓練（Training）：預先分析出語音特徵參數，製作語音模板，並存放在語音參數庫中。

識別（Recognition）：待識語音經過與訓練時相同的分析，得到語音參數。將它與庫中的參考模板一一比較，並採用判決的方法找出最接近語音特徵的模板，得出識別結果。

那麼你一定很好奇，訓練什麼數據，訓練的數據是怎麼來的。龍貓數據在ASR 數據標註上下足了功夫，為各行業的客戶採集了大量的音頻數據，包括小孩哭聲，車內場景下的對話，家庭場景下的對話等，並可以對語音進行分類，語音的文本轉寫、校對、發音人的角色，噪音，語音內容進行標註等。

圖像識別

圖像語義分割可以說是圖像理解的基石性技術，在自動駕駛系統（具體為街景識別與理解）、無人機應用（著陸點判斷）以及穿戴式設備應用中舉足輕重。我們都知道，圖像是由許多像素（Pixel）組成，而「語義分割」顧名思義就是將像素按照圖像中表達語義含義的不同進行分組（Grouping）／分割（Segmentation）。

語義分割需要的圖形樣本數據應該是機器學習中比較複雜的一種，也是非常難標註的一種，因為圖片中的物體多重多樣，場景尤其複雜，龍貓數據針對語義分割類型的數據處理，特意投入大量研發人員，開發了魔法筆，多邊形標註和超像素分割等標註工具，大大提供了標註效率和數據的準確性！

AI手機智能的程度取決於數據質量和效率：

2018年人工智慧生態逐漸成熟，而智能手機就是一個重要的「邊界」，AI手機的體驗也會產生天差地別的變化，最終全能競賽已然上演，同時第一梯隊的AI手機也會和後來者拉開越來越大的距離。

龍貓數據認為，AI手機的研發需要大量的知識和邏輯對其進行學習、訓練，數據樣本產出的質量與效率直接影響AI手機的「智能」程度。因此，人工智慧產品方與數據服務方是相輔相成緊密配合的關係，不斷的生產大數量、高質量和高效率的數據樣本，幫助人工智慧企業提高機器學習和訓練的正確性和規模性。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 龍貓數據 的精彩文章:

TAG:龍貓數據 |