淺析：人工智慧與機器學習

科技 04-18

標題：人工智慧/機器學習知多少？

原文:Artificial Intelligence: Here』s What You Need To Know To Understand How Machines Learn

來源:http://dataconomy.com/2017/03/artificial-intelligence-heres-need-know-understand-machines-learn/

導讀：

我們似乎已經進入了人工智慧發展步伐迅速加快的時代。但就目前而言，我們還無法讓機器具有完整的感知能力，使其電子「大腦」通過合理的道德判斷，完成複雜的認知任務。

數據有兩個重要因素，即樣本和特性。前者代表了群體中的個體因素；後者則是個體因素共有的特點。我們似乎已經進入了人工智慧發展步伐迅速加快的時代。但就目前而言，我們還無法讓機器具有完整的感知能力，使其電子「大腦」通過合理的道德判斷，完成複雜的認知任務。

完成對數據的解讀後，就要決定如何運用得到的這些信息。分類就是一種最常見、最直觀的機器學習程序。系統會學習如何根據參照數據集把數據分成不同的類別。

原文翻譯：

從在智力競賽節目和圍棋人機大戰戰勝人類，到推送廣告時表現出種族偏見而備受抨擊，我們似乎已經進入了人工智慧發展步伐迅速加快的時代。但就目前而言，我們還無法讓機器具有完整的感知能力，使其電子「大腦」通過合理的道德判斷，完成複雜的認知任務。

當前的發展走向讓人們對人工智慧的未來普遍生出了畏懼之心。這種情緒近來在流行文化中的表達顯示出了我們對這項技術有多麼謹慎和悲觀。問題在於，畏懼可能產生嚴重後果，有時更會成為無知的溫床。

了解人工智慧的內在機制是緩解這些憂慮情緒的良方，有助於人們負責、放心地參與其中。

人工智慧的核心基礎是機器學習，一種巧妙且相當普及的工具。但想要了解機器學習，我們需要先弄清楚機器學習為什麼利大於弊。

數據是關鍵

簡單來說，機器學習是指教電腦如何分析數據，通過演算法來解決特定的任務。例如，就手寫識別而言，分類演算法會根據人的筆跡辨認文字。住房數據集則會利用回歸演算法，以可量化的方式估算房產的賣價。

於是，機器學習便要歸結到數據上來。幾乎每一家企業都在以某種方式生成數據，比如市場調研、社交媒體、學校調查和自動化系統。機器學習程序試圖在看似雜亂無章的龐大數據集中找到隱藏的模式和關聯，建立可以預測行為的模型。

數據有兩個重要因素，即樣本和特性。前者代表了群體中的個體因素；後者則是個體因素共有的特點。

以社交媒體為例。用戶就是樣本，他們的使用習慣則是特性。比如，Facebook就把「點贊」活動的不同方面（不同用戶各有不同）作為投放用戶定向廣告所依據的重要特性。

Facebook好友也可以作為樣本，他們與其他人的連接則是特性，從而建立起一個人際網路，可以用來研究信息的傳播。

淺析：人工智慧與機器學習

Facebook好友網路：每個節點是一位好友，他與其他好友相連或者不相連。節點越大，說明連接越多。同樣的顏色表示同樣的社交圈。

除了社交媒體以外，在工業化作業中用作為監控工具的自動化系統，則把整個作業的時間快照作為樣本，特定時刻的感測器測量值作為特性。如此，系統便可實時檢測作業中的異常現象。

所有這些不同的解決方案都要靠向機器輸入數據和教它們在策略性地評估過給定信息後自行作出預測來實現。這就是機器學習。

以人類智能作為出發點

任何數據都可以轉換成簡單的概念，包括人工智慧在內的任何機器學習程序則會將這些概念作為自身的基石。

這種程序能讓人直接聯想到我們每天所作的各種決策，不管是給產品分類（比如哪些是廚具，哪些是美容產品），還是根據以往經驗選擇觀看哪部影片。這兩個例子或許看似完全無關，但它們都依賴於分類的一個基本假設：被定義為既定類別的預測。

例如，在拿起一瓶保濕霜時，我們會根據特定的一組特性（比如容器的形狀或者產品的氣味），準確預測它是美容產品。同樣的策略也適用於電影的選擇，通過評估一組特性（比如導演或者演員），預測電影屬於兩個類別中的哪一個：好看或者不好看。

通過了解樣本特性之間的不同關係，我們可以預測電影是不是值得觀看，甚至可以開發出一款計算機程序，替我們作出預測。

但想要掌握這些信息，我們就需要一位數據科學專家，他必須精通數學和統計學，並且擁有嫻熟的編程技能，對不對？其實未必如此。

我們都對自己的母語非常了解，足以應對日常生活，但其中只有少數人才學過語言學和文學。數學也是如此，它始終伴隨我們左右，買東西時計算找零金額或者根據食譜衡量食材，都不是什麼難事。同理，無需精通機器學習技術，也照樣能有效地使用它。

沒錯，世間確實有那種造詣深厚的專家級數據科學家，但只要下點功夫，任何人都能掌握這方面的基礎知識，改進自己理解和利用信息的方式。

將所有設計思路轉換為演算法

再說回分類演算法。假設有一種分類演算法能模仿我們作決策的方式。我們是社會性動物，不如就以社交來往為例？第一印象很重要，我們心裡都有一個模型，在和某人相遇的最初幾分鐘里，用來判斷我們喜不喜歡他。

這可能產生兩個結果：好印象或者壞印象。對每一個人，我們都會根據已有的幾次相遇（樣本），考慮（哪怕是潛意識地）不同的特點（特性），無論是聲調、外向性、整體態度還是禮節表現。

對於我們遇到的每一個陌生人，我們心裡的那個模型都會把上述特徵作為輸入數據，並據此作出預測。我們可以把這個建模過程分解成一組輸入數據，按照它們與最終結果的相關性確定其權重。

對有些人來說，吸引力很重要，而對其他人來說，幽默感或者喜歡狗更重要。每個人都有自己的模型，完全取決於自身的經歷，或者說數據。

不同的數據會產生不同的模型，得出不同的結果。我們的大腦機制會自行確定這些因素的權重，雖然我們對於這套機制的具體原理還不是完全明了。

機器學習所做的，就是建立嚴格的數學方法，讓機器可以計算出相應的結果，尤其是在我們無法輕鬆處理大量數據的情況下。現在，數據比以往任何時候都要多，既然擁有主動利用這些數據來解決實際問題的工具，比如人工智慧，我們所有人就都應該去了解和使用它。這不僅是為了創建有用的應用，也是為了讓機器學習和人工智慧不再令人不安。

這並不是說，我們應該對「機器具備類人思維」這樣的概念放任自流。但更多地了解人工智慧的內在機制，會讓我們能夠掌握實現良性改變的主動權，讓我們可以控制人工智慧，而不是反過來被人工智慧控制。

【end】

車品覺簡介

暢銷書《決戰大數據》作者；國信優易數據研究院院長；紅杉資本中國基金專家合伙人；

全國信標委大數據標準工作組副組長；貴陽市大數據委顧問；上海市司法局大數據實驗室專家；CCF大數據委副主任；烏鎮智厙理事；

浙江大學管理學院兼職教授；清華大學（大數據項目）教育指導委員；Advisory Committee of Big Data institute - HKUST；

原阿里巴巴集團副總裁；原阿里健康（00241）獨立董事；原阿里數據委員會會長。

更多相關知識請回復：「月光寶盒」；

數據分析（ID :ecshujufenxi）互聯網科技與數據圈自己的微信，也是WeMedia自媒體聯盟成員之一，WeMedia聯盟覆蓋5000萬人群。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！