機器學習很陌生?你從小學就開始接觸了……
***本文共計1945字,看完需要6分鐘***
記得新司機小時候,還是一隻正版的學霸,每天的日常就是拿著一堆練習冊刷題。
每當刷完題之後,他都會用參考答案來檢查一遍:做對的題目能加深印象,做錯的題目就改正過來。這樣刷過很多題後,每看到一道新的題目,腦海里就會浮現出一些似曾相識的習題;然後利用已經總結出的解法,十有八九都能順利搞定。
(說的就是我們刷題黨)
本以為往事如煙,當年的一幕幕會繼續塵封下去;然而這兩年自己接觸了機器學習之後,突然覺得當時的回憶越來越親切……
#監督學習#
你猜得沒錯,學生刷題的場景正是監督學習的真實寫照。
所謂監督學習,就是用標記過後的樣本來訓練模型。如果把模型比作學生的解題方法論,樣本就是學生所做的題目,樣本的標記就是參考答案。
訓練過程中,模型的每一次預測都會受到標記(習題參考答案)的「指導」,自然會較快地學到訓練樣本中「正確」的規律(有效的解題方法論)。遇到未知樣本(新的題目)時,就能比較好地進行預測(解題)。
(看了這個,還敢說監督學習很陌生么)
監督學習的一個典型應用是分類任務。所謂分類,就是利用模型,把樣本正確地歸為幾種已知的類別。
比如我們希望有一個模型,可以將喵和汪的照片自動分為「喵類」和「汪類」,那麼可以收集一堆喵的照片與一堆汪的照片,並做上標記(告訴機器每一張照片是喵還是汪),然後進行模型訓練。
訓練好之後,模型就通過大量的有標記樣本學到了喵與汪的特徵以及區分它們的辦法,之後遇到新的喵汪圖片,也就可以自己作出判斷了。
(喵汪分類模型的訓練與預測)
#無監督學習#
監督學習可以高效地讓模型獲得訓練樣本中蘊含的規律,但樣本的標記成本其實很高。標記往往通過人工完成,儘管很多標記工作本身並不複雜,但在樣本量龐大的時候仍然十分可怕。
(不服就來標記一下吧)
正如我們曾經做過不少沒有參考答案的習題,互聯網上的數據絕大部分也是沒有標記的。如果能將這些海量的沒有標記的數據很好地利用起來,對於模型的訓練將是一筆巨大的財富。未經標記的樣本用於模型的訓練,一般通過無監督學習與半監督學習。
所謂無監督學習,就是提供一堆完全未經標記的樣本,讓機器自己去發掘其中的內在規律。它的一個典型應用是聚類任務。聚類是指將樣本分為若干個不同的類,它所依據的標準往往由人通過聚類演算法來刻畫。
比如有一堆未標記的動物照片,其中有汪有喵還有一些別的物種,通過某種聚類演算法,機器就可以發掘圖片間的內在規律,自動將它們分為幾類。
有意思的是,機器聚類的結果有可能是按照物種區分,也有可能是按照別的一些標準(比如大小、顏色)。至於是不是我們所想要的,很大程度上就取決於聚類演算法的好壞了。
聚類從技術原理層面可以看作用某種指標,來刻畫樣本間的「相似程度」;相互間相似程度大的樣本就會被聚為一類,相似程度不大的樣本則不會出現在同一類中。好比對於一些沒有參考答案的習題,我們往往也能夠根據題目本身的信息大致為它們進行歸類一樣。
#半監督學習#
半監督學習與無監督學習的差異在於,除了利用大量未經標記的樣本,還利用了少量的有標記樣本。
這就如同學生在參考答案的指導下做過少量的習題過後,已經對題目的規律有一定認知,之後再做一些沒有參考答案的題目自己練習,依然可以起到不錯的訓練效果。
半監督學習既可以用於分類任務,也可以用於聚類任務。對於分類任務,在判斷樣本類別時,不僅可以像監督學習那樣利用有標記樣本的類別信息,大量的無標記樣本也可以通過揭示樣本的分布情況來為分類提供參考。對於聚類任務,少量的有標記樣本則可以作為聚類的約束條件或初始條件。
(無標記樣本可以為分類提供參考)
#強化學習#
與刷題不同,人們對生活經驗的學習往往通過另外一種方式:趨利避害,使外界的反饋變得最優。
小時候我們都很任性,結果往往就是被別人吐槽。然後我們發現,如果稍微「懂事」一點,則會收到外界更好的反饋。逐漸地,我們遇到事情都會盡量採用懂事的做法。
上面的現象反映了我們根據外界反饋調整自身行為的本能,這個思想用到機器學習領域中就是強化學習。
強化學習設定了機器執行任務過程中外界環境的各種狀態,並為這些狀態設定了相應的獎賞值(正或負);各種狀態間通過機器的不同「動作」進行轉換。
強化學習的目標是讓機器獲得某種策略(在什麼狀態下做什麼動作),使得任務執行所獲得的總獎賞值最大(代表最優的任務執行結果)。
(泡麵任務中的環境狀態與轉換)
強化學習非常適用於需要機器根據外界環境進行自主決策的場景,比如無人駕駛、機器人等等。據說AlphaGo在訓練時也應用了強化學習。
#總結#
監督學習、無監督學習、半監督學習以及強化學習是目前應用較多的幾種機器學習方式。它們雖然被應用於機器,卻都和我們自己學習知識技能的方式非常相似。
有時甚至會覺得,人何嘗不是一種先進的機器,機器先進到一定程度也未嘗不能具有人的特性。
老規矩,一圖勝千言。
*******我****是****昏****割****線*******
了解一點AI,擁抱一個時代
※機器學習決策樹的分裂到底是什麼?這篇文章講明白了!
※「回歸分析」真的算是「機器學習」嗎?
※機器學習奠基人Thomas Dietterich:人類將如何受到AI威脅
※數據科學家、機器學習工程師與普通的軟體工程師有什麼不同
※如何解決機器學習中的數據不平衡問題?
TAG:機器學習 |
※慢慢的,我們就陌生了!
※終於,我們還是陌生了……
※我們就這樣陌生了,想想就心酸
※原來,我們真的陌生了……
※宇宙比我們想像的更加陌生,甚至有科學家已經產生了迷茫!
※從來都沒有朋友的流浪狗,當看到陌生人的時候,竟然……
※家裡突然闖進一隻陌生的貓,二話不說就吸狗媽的奶……
※兩口子在家睡覺,門被陌生男子打開了?租房最害怕的事情發生了…
※想不到到最後,我們還是陌生了
※那些不小心聽到的陌生人對話…段子手都不敢這麼編啊!
※主人帶狗狗候機,狗狗突然跑向陌生男子,接下來的事很暖心!
※我發了瘋的在想你,你卻已陌生的很徹底
※中衛一小伙上班時接了一個陌生電話,結果卻惹來了麻煩……
※搭訕陌生妹子,學會這三個技巧,讓她主動靠近你
※從你結婚的那一刻開始,我們就註定了陌生
※黑鷹直升機是最先進的通用直升機嗎?並不陌生,但很難說最先進
※那些從你生命中匆匆而過,卻讓你覺得暖心的陌生人,你還記得嗎?
※你明白吧,當我對你越來越禮貌時,我們就越來越陌生了
※生了雙胞胎,卻感覺對老二很陌生,好像他不是我的孩子…
※「很失望」壁紙火了:我們都很陌生,你不了解我,我不了解你