十分鐘了解人工智慧AI的基礎運作原理

寵物 09-05

人工智慧是如何運作的

人工智慧企圖了解智能的實質，並生產出一種新的能以人類智能相似的方式做出反應的智能機器，該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統等。人工智慧從誕生以來，理論和技術日益成熟，應用領域也不斷擴大，可以預見未來幾年將會進入「人工智慧時代」。

目前AI已經在日常生活中產生了巨大的變化。這些AI並不是科幻電影中的那些有自我意識，計劃摧毀地球的機器人。而是像我們的智能手機、智能家居、銀行信用卡管家和智能汽車這些圍繞我們每天生活的產品和服務都在使用AI。

AI將通過推動自動駕駛汽車的發展、改善醫學圖像分析、促進更好的醫療診斷和個性化醫療，從而帶來社會的重大轉變。AI也將是支撐未來技術發展的基礎資源，就像電力和網路一樣。但對大部分人來說，AI還是很詭異而且充滿神秘感。

那麼我們今天就來聊一聊AI最重要的功能——模式識別的工作原理。希望通過簡明扼要的介紹幫助大家了解這個領域。

AI是一門嚴謹科學而不是無所不能神話故事，有些媒體過分誇大報道AI的功能，鼓吹威脅論都是不負責任的。AI目標是設計具有智能的機器，其中的演算法和技術部分借鑒了當下對人腦的研究成果。今天許多流行的AI系統使用人工神經網路來模擬由非常簡單的互相連接單元組成的網路，有點像大腦中的神經元。這些網路可以通過調整單元之間的連接來學習經驗，這個過程類似人類和動物的大腦通過修改神經元之間的連接來進行學習。神經網路可以學習模式識別、翻譯語言、學習簡單的邏輯推理，甚至創建圖像或者形成新設計。其中，模式識別是一項特別重要的功能，因為AI十分擅於識別海量數據中的隱藏的模式，而這對於依賴經驗和知識的人類來說就沒有那麼容易。這些程序運行的神經網路具有數百萬單位和數十億的連接。我們現在所能創造出來的「智能」就是由這些電子神經元網路組成的。

機器不像人類具有感知器官和大腦，並且能夠很好地協調工作，比如當我們看到一隻狗的時候，就會很快的判斷出來這是什麼動物，並且具體什麼種類。這個看似簡單的過程對於機器來說都是十分困難的。而人類獲得這樣的能力，也是源自於生物上億年的進化過程。而機器認識世界的方式是通過模型，需要通過複雜的演算法和數據來構建模型，從而使機器獲得很簡單的感知和判斷的能力。

下面介紹一下深度學習系統中一個最重要演算法——卷積神經網路。如果你之前對AI相關知識有所了解的話，那你一定聽說這個概念。這種演算法參考了生物學研究人類和其他動物大腦視覺皮層的結構。簡單介紹一下這種特定類型的人工神經網路，它使用感知器、機器學習單元演算法，用於監督學習分析數據。適用於圖像處理、自然語言處理和其他類型的認知任務。與其他類型的人工神經網路一樣，卷積神經網路具有輸入層、輸出層和各種隱藏層。其中一些層是卷積的，使用數學模型將結果傳遞給連續的層。這過程模擬了人類視覺皮層中的一些動作，所以稱為卷積神經網路，也就是CNN。

舉例子來看，當我們人類看到一隻貓和一隻狗時，儘管它們的體型很類似，但我們還是馬上能夠區分它們分別是貓和狗。對計算機而言，圖像僅僅只是一串數據。在神經網路的第一層會通過特徵檢測物體的輪廓。神經網路的下一層將檢測這些簡單圖案的組合所形成的簡單形狀，比如動物眼睛和耳朵。再下一層將檢測這些形狀組合所構成的物體的某些部分，例如貓和狗的頭或者腿。神經網路的最後一層將檢測剛才那些部分的組合：一隻完整的貓、一隻完整的狗等等。每一層的神經網路都會目標進行圖像組合分析和特徵檢測，從而進行判斷和組合，並將結果傳遞給下一層神經網路。實際使用的神經網路的層次深度會比這個例子多很多，所以神經網路能夠以這種分層的方式進行複雜的模式識別。

只要有大量被標記的樣本資料庫，就可以對神經網路進行特徵訓練。它對於識別圖像、視頻、語音、音樂甚至文本等信息特別有用。為了很好地訓練AI的機器視覺，我們需要提供給這些神經網路被人標記的大量圖像數據。神經網路會學習將每個圖像與其相應的標籤並相互關聯起來。還能將以前從未見過的圖像及其相應的標籤配對。這樣的系統可以梳理各種各樣的圖像，並且識別照片中的元素。同時神經網路在語音識別和文本識別中也非常有用，自動駕駛汽車和最新醫學圖像分析系統中也是關鍵組成部分，所以你可以看到神經網路的運用是非常廣泛而且有效的。原來需要依賴人工標記大量有效數據來完成知識的輸入，現在通過運行海量數據，讓神經網路進行自我學習。大大提升的人工智慧的應用範圍，降低了使用的門檻。

人類大腦與動物遠遠不同，在進化過程中高度特化並且具有明顯的適應性。而當前的AI系統遠遠不具有人類擁有的看似一般的智能。人工智慧更高級的發展將會在後面進行討論，我們這裡還是關注現在實現的AI的基本原理。

AI最常見的三種學習方式

強化學習這是關於機器應該如何行動以獲得最大化獎勵的問題，它受行為心理學理論的啟發。在特定場景下，機器挑選一個動作或一系列動作並獲得獎勵。機器行為每一步驟都會被標記，並且記錄結果和賦予權重。強化學習通常用於教機器玩遊戲和贏得比賽，比如國際象棋、圍棋或簡單的視頻遊戲。強化學習的問題是，單純地強化學習需要海量的試錯，才能學會簡單的任務。好處是只要你提出一個有價值的問題，提供足夠的數據輸入，理論上來說強化學習最終會找到那個最優解。

監督學習就是需要我們告訴機器特定輸入的正確答案：這是一幅汽車的圖像，正確答案是「汽車」。它之所以被稱為監督學習，是因為演算法是從帶標籤數據學習的。這個過程類似於向年幼的孩子展示圖畫書。成年人預先知道正確的答案，孩子根據前面的例子做出推測。這也是訓練神經網路和其他機器學習體系結構最常用的技術。

無監督學習人類和大多數其他動物的學習過程，特別是剛生下來的時候，是以沒有人監督的方式來進行學習的：我們通過觀察和認知我們行動的結果來了解世界如何運作。沒有人告訴我們剛開始所看到的每一個物體的名稱和功能。但我們仍然學會非常基本的概念，當前我們還不知道如何在機器身上實現這一點，至少無法達到人類和其他動物的水平。缺乏用於無監督學習的AI技術，也是當前AI發展問題之一。

概括來說當前AI技術原理是：將大量數據與超強的運算處理能力和智能演算法三者相結合起來，建立一個解決特定問題的模型，使程序能夠自動地從數據中學習潛在的模式或特徵，從而實現接近人類的思考方式。下面補充介紹三個AI研究領域重要的理論方法和技術以便理解：

一、機器學習自動化分析建模

它使用來自神經網路、統計、數學和物理學的方法來發現數據中的隱藏模型，並且無需明確編程查找具體目標和範圍。理論基礎是這樣的：假如我們為了研究某個複雜的科學問題，需要創建海量的機器學習模型、使用大量的演算法、使用不同的參數配置，在這種情況下，我們就可以使用自動化的方式進行建模。發展自動化機器學習是為了向科學家提供幫助，而不是代替他們。這些方法使數據科學家擺脫了令人厭煩和複雜耗時的任務（比如詳細的參數優化和調試），機器可以更好地解決這些任務。而後面的數據分析與結論的工作仍然需要人類專家來完成。在未來，理解行業應用領域的數據科學家，也就是數據業務架構師，仍然極其的重要。而這一項人工智慧技術，將會輔助數據科學家建立模型並且加速驗證的速度，從而減輕科學家的壓力，讓他們將精力放在那些機器無法完成的任務上面，通過更加合理的分工協作，大大加快科學技術研發速度。

二、深度學習領域

這是應用非常廣的技術，它使用具有多層處理單元的巨大神經網路，利用強大計算能力和改進的訓練技術來學習大量數據中的複雜模式。原理是計算機在學習特定問題時，需要大量輸入這個問題相關的學習材料也就是數據，然後在計算機通過演算法和模型來構建對這個具體問題的認知，也就是總結出一個規律，那麼在以後遇到相似問題時，計算機會把收集的數據轉成特徵值，如果這個特徵值符合這前面規律裡面的特徵值，那麼這個事物、行為或者模式，就可以被識別出來。常見的應用太多了，這裡大概舉一些例子：

計算機視覺，這就像是機器的「眼睛」。依賴於模式識別和深度學習來識別圖片或視頻中的內容。當機器可以分析和理解圖像時，他們可以實時捕捉圖像或視頻並解讀周圍環境。感知周圍環境、識別可行駛區域以及識別行駛路徑，這也是無人駕駛的基礎技術。其中圖像識別原理是通過識別圖片中的對象，然後建立標籤，實現對海量圖片進行分類，也可以對圖像中的人臉或者其他目標進行識別，運用在安防監控等領域；

自然語言處理中語音識別技術就像是機器的「耳朵」：這是計算機分析、理解和生成人類語言和語音的能力。運用語音採集的技術和方法，對音頻中的語言內容進行提取和識別，實現語音實時轉文字的功能；下一階段將會是自然語言交互，人們將可以使用普通的日常語言與計算機進行交流和執行任務。這也是AI語音助手和語音控制交互技術的基礎。

機器翻譯：模仿人腦理解語言的過程，形成更加符合語法規則同時更加容易被人理解的翻譯，谷歌在線翻譯功能就是運用了深度學習技術，讓機器的翻譯水平大大提升；

情感識別：通過識別新聞、社交媒體、論壇等文本內容中所包含的情感因素，及時了解網路用戶對新聞的；

醫療診斷：比如通過對各個階段的腫瘤診斷這類醫療圖像數據進行學習，總結出惡性腫瘤形狀、紋理、結構等「特徵」模型，從而使機器可以進行判斷。

可以看到深度學習在神經元網路的基礎上，發展出了非常多的應用案例，並且當下各個行業的人工智慧輔助工具和軟體都在大力開發中，各種數據都在大量採集、清洗、輸入模型訓練，一旦訓練成功就可以大規模部署，帶來巨大的商業價值。具體有多大呢？參考一下人臉識別領域的獨角企業估值和號稱千億的市場規模就知道了。如果這樣的市場再乘以百倍、千倍呢，這裡面的蘊含商業機會有多少呢？

三、認知計算

這也是人工智慧的子領域，目標是與機器進行自然的、類似人類的交互。使用人工智慧和認知計算，最終目標是讓機器獲得理解圖像和語音的能力，模擬人類交流過程，從而實現與人類的自然對話。也是根據神經網路和深度學習來構建的，應用來自認知科學的知識來構建模擬人類思維過程的系統。它涵蓋多個學科，包括機器學習、自然語言處理、視覺和人機交互。IBM Watson就是認知計算的一個例子，在美國答題競賽節目上Watson展現了它先進的問答交互能力，並且打敗了人類。與此，同時Watson這些服務應用介面也進行了開放，可提供其他組織用於視覺識別、語音識別、語言翻譯以及對話引擎等等。

就像AI的產生是多學科發展的綜合成果一樣，當下AI的快速發展也是多方面技術進步綜合起來取得的成果，總結裡面重要的三個方面：

1.硬體方面：

直到本世紀初研究人員才意識到，為視頻遊戲設計的GPU圖形處理單元可以被用作硬體加速器，以運行比以前更大的神經網路。這要歸功於這些晶元能夠進行大量並行計算，而不是像傳統CPU那樣按順序處理它們。這對於同時計算構成深度學習神經網路的數百個神經元的權重特別有用。

2.通用演算法：

AI這麼快就流行起來，在很大程度上是因為開放的軟體工具也稱為框架，使得構建和訓練一個神經網路實現目標應用程序變得容易起來，即使是使用各種不同的編程語言。對於已知的識別目標，可以離線定義和訓練一個神經網路。一旦訓練完成，神經網路可以很容易地部署到嵌入式平台上，也可以遷移到各種軟體程序和硬體平台中。這是一個聰明的架構，允許藉助PC或雲的能力訓練神經網路，而低功耗的嵌入式處理器只需使用訓練好的數據來進行識別。人體和物體的能力與流行的應用密切相關，比如工業機器人和自動駕駛汽車。

3.其他技術支持：

圖形處理單元是AI的關鍵，因為它們提供了迭代處理所需的大量計算能力。訓練神經網路需要大數據和計算能力。而物聯網從連接的設備生成大量數據，其中大部分未經分析。使用AI自動化模型將允許我們使用更多的物聯網數據進行分析，將物流和信息流更好的結合起來。還有就是AI應用程序介面，可以將AI功能添加到現有產品和軟體中。比如它們可以為安防視頻中添加圖像識別功能；也可以在我們觀看網路視頻時，自動創建翻譯和字幕；或者是在相機中識別人物性別和年紀甚至是表情和狀態等等，應用將會非常廣泛。

總之，這都是AI經常使用的方法，即使我們創造了單個項目擁有超越人類智慧的機器，這些機器仍然能力有限。短期來看，人工智慧將提供接近人類交互體驗，並為特定任務提供輔助支持，但它還不能成為人類的替代品，有自我意識的AI還不會很快出現。

本篇是老張創作的課程《人工智慧進化論課程》基礎篇內容，轉載需授權。

覺得有幫助的話請轉發和評論~

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 人工智慧進化論 的精彩文章:

※基礎篇：問題1.人工智慧的發展簡史是怎樣的？1993-至今 3/3
※人工智慧AI最新案例和趨勢，看這一篇就夠了

TAG:人工智慧進化論 |