AI 初學者必須要了解的術語盤點

知識 09-14

本文為 AI 研習社編譯的技術博客，原標題 The Artificial Intelligence dictionary for beginners，作者為Heuritech。

翻譯 | nick李、Reidw 整理 | 凡江

在人工智慧的領域下，有許多經常被公眾所錯誤理解並且誤用的概念。

本術語詞典的主要目的是用一種簡單精確的方式來解釋人工智慧的術語。

A

人工智慧(AI)

從這個開始可能顯得有點複雜，因為關於人工智慧沒有一個一致的定義。我們諮詢了我們的R&D團隊，他們也激烈地辯論了很久。這是他們討論出的結果：

現如今，我們可以將AI定義為能夠完成人類經常解決的任務的智能程序。

在未來，AI可能是由程序自動生成的人類智能。

一個大家都同意的定義：AI是一個包括機器學習*，深度學習*，自然語言處理*，視覺識別*等的研究領域。

演算法(Algorithm)

演算法是指一串能夠完成某個既定目標的簡單指令序列。讓我們看一個比較接地氣的例子：每天早上穿衣服（因為每個人都會穿衣服啊）。穿衣服時你會遵循一個嚴格的流程：首先穿內衣，然後穿衣服，最後才穿鞋。這就是演算法所做的工作：遵循指令來回答一個問題。

屬性(Attribute)

某個對象(object)的特徵：它可以是從顏色到紋理、形狀的任何東西。例如，下圖中Jeanne Damas穿了什麼？你可以在圖旁邊找到她的穿著的所有屬性。

根據Heuritech的模型，Jeanne Damas穿著一條有異國鮮花圖案的半開叉

C

分類(Classification)

分類是指將零散的數據組織成類。在Heuritech的案例中，這些零散的數據就是圖片，而類別就是不同的服飾(例如背包，鞋子，裙子和褲子)。數據科學家需要有標記的數據以訓練分類模型。

聚類（Clustering）

聚類模型自主地將有相似特徵的圖片歸為一組。有趣的是，這些模型不需要訓練就可以對圖片進行聚類。

一個聚類的實例

計算機視覺（Computer Vision）

計算機視覺是一個人工智慧的分支，它著重於圖片與視頻，又稱為視覺識別*

D

識別(Detection)

識別模型能夠對圖像中的一個或多個物體進行定位並分類。為了可視化表示識別模型的輸出，長方形（也稱包圍盒）被畫在識別出的物體周圍。

數據集(Data set)

是指一個整理在一起的數據列表，可以被用來訓練模型或評估一個模型的效果。在我們的案例中，數據集由圖像組成，其中大部分都是和時尚有關。更多的解釋，詳見標記數據(labelled data)*。

深度學習(Deep Learning; 機器學習的一個分支)

深度學習是機器學習*的一個子領域，它的出現使得近十年的人工智慧*發生了劇變。

視覺識別*尤其收益於深度學習。深度學習讓識別、檢測並且分割圖像中的物體成為可能，並且具有較好的表現。一個深度學習模型學習去識別對人類有意義的概念，例如風景、手包、笑臉等。

為了完成這些任務，深度學習模型找到最重要的基礎輪廓和形狀，並且將它們結合在一起組成複雜的模式，而這些模式又將組合起來形成更複雜的模式，以此類推。在這個多層的過程最後，模型能夠對它訓練過的類別進行預測。

來源：Analytics Vidhya

G

泛化(Generalization)

指的是一個機器學習演算法能在它從未見過的圖像也表現良好的能力。如果模型在一個具有1000個圖像的數據集上訓練，它能否在每個其他圖像上都具有較好的表現呢？

H

啟發式(Heuristic)

指的是進行發現的科學藝術。它來自於希臘詞"eurisko"（我相信)，並引申到"Eureka"（我找到）。這個辭彙由阿基米德在洗澡時發現Pi的概念而推廣。啟發式方法包括排除其他方法來獲得一個可用的解決方式以此來推動進展。

Heuritech

有兩個名字組成：啟發式和科技。有25位團隊大腦組成，Heuritech作為一個初創公司的使命是建立消費行業最好的視覺識別系統。通過獨特地應用頂尖水平的技術於數百萬計的Instagram圖片，我們能夠對商品和趨勢進行監控。這要感謝由35%的人工智慧PhD組成的Heuritech團隊持續5年的研究與開發。

L

標籤數據(Labelled data)

機器學習*模型*的目標是根據一個輸入預測正確的輸出。例如，我們在Heuritech所使用的某些模型能夠根據一個圖像（輸入）來預測具體的手包類別（輸出）。這些模型在有標籤的數據上訓練，比如，一些有標籤的圖片。

訓練一個模型是耗費巨大的，一部分是因為它需要數以千計的標籤數據，而這些數據通常需要人工來逐一標記。在Heritech的例子中，標籤數據主要是一些標記好時尚方面屬性的圖像。

M

機器學習（Machine Learning）

首先，人工智慧技術研究的是如何通過程序來自動完成那些通常需要人工處理的任務。實現它的一種方式就是使用機器學習模型，這些模型可以在打好標籤的數據中自主學習特徵。舉個栗子，如果你想使用機器學習模型來自動識別照片中的裙子的種類，就需要將成百上千的帶有種類標籤的裙子照片輸入模型進行訓練，直到模型能夠正確識別照片中那些訓練集中不包含的裙子種類為止（詳見泛化能力一章）。

模型（Model）

一個數學模型就是通過方程來理解世界的一種方式。但是，組成現實世界的數據種類是非常有限的，我們可以使用模型來讀取這些數據（比如圖像、聲音、文本、股價......）。

給定一個輸入，訓練模型來得到一個合適的輸出。在下面的例子中，輸入就是這張圖像，輸出的就是局部物品的種類。例如手提袋。

在機器學習領域，所有的模型都是針對某一具體領域中的數據進行訓練的。

Heuritech公司的模型：

輸入：來自Instagram的一張照片

輸出：圖中的手提包

N

神經網路（Neural network）

想像一下，大腦中有一個龐大的神經網路，它由數以百萬計的神經元組成，它們通過層級運算實現決策。這就像我們實際思考時，我們的大腦的工作方式一樣。

自然語言處理（NLP）

人工智慧領域的一個分支主要把文本作為研究對象。技術的名字就做出了明確的解釋：讓機器處理自然（人類）語言。例如，這就是為何垃圾郵件會出現在郵箱的垃圾箱中：因為你的電子郵件使用了訓練過的自然語言處理系統來識別和篩選垃圾郵件。

P

模式(Pattern)

數據*中自我重複的結構。模型*能夠自動地學習如何提取、識別並描述模式。

準確率&召回率(Precision&Recall)

準確率和召回率是用以評測一個模型*表現好壞的度量標準。

準確率：在你的模型預測出的所有結果中，正確結果的百分比。

召回率：在你的模型試圖找出的類別(數據集中)里，被模型成功找出的百分比。

讓我們看個更具體的例子。

如下是一個有6個蘋果和3個桃子的籃子。我們需要模型找出所有蘋果。這個表現不是很好的模型，挑出了5個蘋果。但實際上這是3個蘋果和2個桃子。

這個模型的準確率是 3/5 = 60%。簡而言之，挑出的5個蘋果中有3個挑對了。

這個模型的召回率是 3/6 = 50%。簡而言之，在籃子里所有的6個蘋果中，挑出來了3個蘋果。

S

分割(Segmentation)

圖像分割可以自動地將圖像中物體的輪廓描畫出來。分割在實際中有許多使用，例如色彩提取和衣物識別。

在下圖這個gif中，你能看到包圍盒(物體周圍的長方形)和圖像分割(物體本身的輪廓圖)。這些都是由機器學習*模型*自動生成的。

來源: Mask-RCNN 在4K視頻中的開源應用，由Karol Majek開發。

T

標記(Tagging)

標記之於人工智慧*如同主題標籤之於Instagram。每一個圖像都可以被打上標記，例如，#T恤，#紅色，#短款等。

另見：分類

V

視覺識別（又稱作計算機視覺；Visual Recognition)

人工智慧*的一個分支著重於圖像，因此也被稱為視覺+識別。一個模型經過訓練，可以識別出圖片中的具體物體：例如在Heuritech的例子中，就是對衣物進行識別。

我們由衷希望你喜歡這個人工智慧術語詞典。

這個術語詞典會定期更新。如果你希望收到最新的消息，請訂閱我們關於人工智慧與時尚的簡訊。

https://medium.com/heuritech/the-artificial-intelligence-dictionary-for-beginners-514019ec9f36

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 AI研習社 的精彩文章:

※攻擊 AI 模型之 FGSM 演算法
※CVPR18 最佳論文演講：研究任務之間的聯繫才是做遷移學習的正確姿勢

TAG:AI研習社 |