什麼是機器學習
歡迎點擊「演算法與編程之美」↑關注我們!
本文首發於微信公眾號:"演算法與編程之美",歡迎關注,及時了解更多此系列博客。
人工智慧最近幾年可謂是異常的火爆,國家人工智慧的人才缺口相當大,因此很多高校該專業的應屆畢業生的薪資也高的離譜,下面就是2018屆互聯網校招的高薪清單:
面對如此之高的薪資,很多人都急於投入人工智慧的學習,而機器學習則是人工智慧的基礎,因此有必要先了解什麼是機器學習,並學習機器學習的相關演算法。
1 引言
在介紹機器學習的相關概念之前,我們先來看幾個簡單的案例。
首先我們來看一個小學的數學填空題,題目如下:
請在空白處填上正確的數字。
2 4 ( ) 8 10
這個題目應該只有小學數學的水平,相信各位同學一定毫無壓力,我們會快速的得到答案是:6。
那麼問題來了,為什麼答案是6呢?
我們將上述的形式,換一種寫法,如下:
x 1 2 3 4 5
y 2 4 ? 8 10
其中x表示當前是第幾個數,如第1個數就是2,第2個數是4,以此類推,而我們要計算的就是第3個數是多少。通過對上表的觀察,我們得到y和x之間存在某種映射關係,即y = f(x) = 2·x,有了這種映射關係之後,我們就能夠很快的計算第3個位置的數是多少,即將x=3代入到函數中,即可得到y = f(3) = 2 · 3 = 6。
通過上面的案例介紹,我們可以得出這樣的結論,當我們知道了自變數x和因變數y之間的映射關係之後,就可以很快的預測其他自變數x所對應的因變數y的值。因此映射關係顯得格外重要,如果通過觀察我們不能快速的得到這種關係,那麼此題做起來將會變得非常麻煩。
但是很多時候,我們並不能通過簡單的觀察就能準確的知道這個映射關係是什麼?
接下來我們來看另外一個稍微複雜的案例。
這是一個關於房價和面積之間的數據,其中x表示的是平方英尺,y是價格。如果此時要讓你去填500平方英尺對應的房價是多少,相信你此時會比較猶豫,這個題目就沒有上面那個題目容易計算了,原因就在於我們不知道這個映射關係是什麼。
我們想要去計算結果,那麼前提就是要知道這種映射關係,但是我們又不知道這種映射關係是什麼,因此只有靠機器自己去學習到這種函數是什麼,當有了函數之後,就可以計算結果了。
世間有千千萬萬的函數,那麼本題應該是什麼函數呢?機器的目的就是要從這些千千萬萬的函數中,學習到本題所對應的函數。這將是一個漫長的過程,但是機器一旦學習到了這種函數,將會變得異常的強大,此時你任意給一個自變數,都會得到對應的因變數的值。
接下來我們再看一個文本的案例。
我們平時在看一些新聞網站的時候,經常都會根據新聞所屬的分類來閱讀自己感興趣的新聞。
假如我們現在要讓計算機去做新聞分類這件事,給你一個新聞,然後計算機告訴我當前新聞屬於哪個類別?
【歷史】《清明上河圖3.0》:一朝步入畫卷 一日夢回千年
【歷史】1978年對越作戰在即 許世友卻為何每日沉迷打獵
【軍事】距中國"最後通牒"僅20天 印度迅速變卦配合要求
【軍事】美軍購買俄羅斯超音速反艦導彈 研究如何對抗中俄
【軍事】海軍052B驅逐艦進塢引發聯想 要改成大號054A?
根據上面的這些信息,此時再讓你來做一道填空題
"蔣經國送張學良何物 張堅持服用50年活過百歲" 所屬新聞類別是:( )
這種填空題如果人類來做的話,應該還是比較簡單,但是如何讓機器來做呢?
按照之前的思路,如果機器來做的話,就一定要知道這種新聞標題和新聞類別之間的映射關係,即:
f("新聞標題") = 新聞類別。
而一旦這種映射關係有了之後,我們需要做的只是簡單的代入到這個函數,就可以得到結果:
f("蔣經國送張學良何物 張堅持服用50年活過百歲") = "歷史"
f("如果96年武統 解放軍面臨的最大威脅是什麼") = "軍事"
最後,我們來看一個關於圖片的例子。
我們想要讓計算機來進行動物分類,如:
這是一隻貓。
此時就需要計算機去學習到這種圖片的映射關係,即:
f(圖片) = 動物類別
有了這種映射關係之後,你再給機器任何的圖片,它都能根據這種關係進行計算,如:
f(
) = 狗
f(
)= 貓
2 傳統演算法和機器學習演算法的區別
傳統的演算法是我們人類直接告訴計算機應該遵守什麼樣的規則,應該按照什麼樣的映射函數進行計算,但是非常遺憾,很多時候我們人類並不清楚這些映射關係是什麼?而機器學習的魅力就在於我們人類事先並不知道這種映射關係是什麼,需要讓機器自己來學習這種映射關係,有了這種關係之後,就可以進行計算,進行預測了。
3 總結
通過上面的介紹,大家應該了解了什麼是機器學習,機器學習和傳統演算法的區別是什麼,以及機器學習的魅力所在。在我們現實世界中,人類不可能了解所有的自然界的規則,不可能知曉所有的函數映射關係,因此我們需要計算機來幫助我們更好的理解世界,發現世界的規律,發現世界的映射關係。因此機器學習的核心就是學習到自然界的各種映射關係,即學習到各種函數。這才是機器學習的核心所在。
那麼機器如何從千千萬萬的函數中,找到正確的函數呢?預知後事如何,歡迎持續關注。


TAG:機器學習 |