當前位置:
首頁 > 知識 > 如何用 MOOC 組合掌握機器學習?

如何用 MOOC 組合掌握機器學習?

今天學習不努力,明天努力找工作。

學習

2017 年 1 月,人類在智力領域數萬年積攢下來的囂張氣焰遭到了若干次無情的打壓。

咱們不提 CES 2017 上激動人心的自動駕駛產品(估計七八年之後你的駕駛證就可以扔掉了),也不細講《最強大腦》節目里人類精英在圖像識別環節被碾壓(這曾經是人類可以嘲笑人工智慧的典型領域),就說說圍棋界的海嘯吧。

數十位人類圍棋界頂尖高手,用人類圍棋對弈的千年智慧結晶,歷經艱苦卓絕的奮鬥,依然被 Master 用快棋打了個一塌糊塗——60:0。

別人輸棋以後都很茫然,唯獨古力九段戰後的話最為耐人尋味——「人類與人工智慧共同探索圍棋世界的大幕即將拉開」。

這話我聽著,覺得韻腳極為熟悉。突然想起來王朔的《頑主》中描述過類似情節。

馬青興沖沖地走到了前面,對行人晃著拳頭叫喚著:「誰他媽敢惹我?誰他媽敢惹我?」 一個五大三粗,穿著工作服的漢子走近他,低聲說:「我敢惹你。」 馬青愣了一下,打量了一下這個鐵塔般的小夥子,四顧地說:「那他媽誰敢惹咱倆?」

玩笑歸玩笑,不過人類精英終於學會謙遜,並對人工智慧表達了合作的誠意,這也是好事兒。人工智慧的崛起讓很多人自以為認識到了一個現實:

你今天有工作的時候不學習人工智慧,明天人工智慧會取代你的工作。

你同意嗎?

其實這話錯了,它不是現實。

人和機器不會發生競爭。人掙錢吃飯,機器有電就行。

現實是:

你今天有工作的時候不學習人工智慧,明天就有人利用人工智慧取代你的工作。

人和人永遠免不了競爭。這場軍備競賽裡面,人工智慧已經成為了個體可以掌握的核武器。別人懂了,你不懂,結果會很美妙。

?!……

當然我說的是別人的結果。

人工智慧領域中,目前最火的技術是機器學習 (machine learning),尤其是近年來伴隨大數據產生而崛起的深度學習 (deep learning)。不論是 AlphaGo 還是百度大腦,其實都是使用了(深度)機器學習,才變得如此厲害。

想不想學習一下 「機器學習」 呢?

途徑

要了解和掌握機器學習,路徑有很多。你可以選課、報班,甚至自己看書。但是我更推薦的,是 MOOC。

對於大多數人來說,MOOC 資源更容易獲得。只要你有一台能上網的電腦,就可以開始學。

因為這幾年機器學習很火,因此相關 MOOC 很多。有好事者就開始進行梳理總結,把數十門課程分成初級、中級、高級,每一部分都有十餘門課程。然後羅列出來,供讀者按部就班來學習。

我的評價是,他們用非常認真負責的態度幹了一件糟糕透頂的事兒。

為什麼?

因為你一股腦羅列數十門課程,不會絲毫降低學習的門檻,反而迅速減少了 「從入門到放棄」 的時長。

沒錯,看完了你的清單,讀者就放棄了。他的結論是 「機器學習這事兒看來跟我這輩子沒關係」。

本文嘗試做一件與眾不同的事兒——精選少數課程,組合一個易於入門和快速應用的路徑。

要達到這個目標,就需要從許許多多的 MOOC 里選擇 「最好的」 課程。所謂 「最好的」 課程,需要滿足以下條件:

授課教師自身是牛人;

講授用心;

課程設計符合學習規律。

有了這個標準,許多課程立即被排除掉了。我們精選了數門課程,分別帶領初學者完成入門、進階、應用和補課等過程。組合起來,就是一個完整的機器學習了解和掌握路徑。

因為眾口難調,所以我們不可能找出所有人都公認的 「最好」 課程。如果你覺得我列出的課程或者組合方式還不夠好,不要直接開罵。因為這不是一場 PK。歡迎你推薦心目中更好的課程給我們大家,謝謝!

入門

入門課程推薦吳恩達 (Andrew Ng) 教授 Coursera 平台上的《機器學習》。

吳恩達教授,就是《最強大腦》裡面帶著人工智慧來砸場子的這位仁兄。

他是斯坦福大學教授,Coursera 的聯合創始人之一。

如果你在 MOOC 論壇上發問,網友們給你推薦的第一門機器學習課程八成也是這門。

原因是門檻低,天花板很高。

所謂門檻低,是指不要求你多麼熟練掌握某種語言編程技術,也不需要你的數學知識達到做完若干冊《吉米多維奇數學分析習題集》的水平。

所謂天花板很高,是指該課程全面介紹了機器學習中的核心知識,並且擴展到若干不同應用領域。其實我真是覺得這種課程設計方式非常值得我國大學來學習。在保證覆蓋面的同時,只在幾個關鍵知識點著力反覆練習,使得學生學起來輕鬆,卻真的掌握到了精髓。

我覺得這才是真正的大師水平。

之前為這門課程專門寫過一篇文章《機器學習,你也行》。這裡就不再贅述了。感興趣的同學歡迎出門左轉去看看。

學完這門課,你就可以自豪地宣稱自己了解機器學習了。

進階

獲得了吳恩達教授課程證書之後,千萬要趁熱打鐵,掌握現今最為熱門的深度學習。

所謂深度學習,就是利用深度神經網路進行機器學習。如下圖就是利用深度社交網路辨別一張圖片究竟是車、人,或是動物。

此處推薦的課程是 Geoffrey Hinton 教授的《神經網路與機器學習》。(AI研習社按:我社有這門課全網獨家的漢化版視頻匯總,點擊這裡抵達)

為什麼推薦這門課?

首先,你會發現這門課使用的軟體工具與上一門課程一樣,都是易於安裝、便於掌握的 Octave。你不需要去了解編程環境的各種配置,拿過來直接用就行。框架代碼都已經提供,你只需要在重點環節進行修改和補充。

其次,課程默認你學過吳恩達教授的課程作為前導。因此二者沒有什麼重疊,避免重複勞動。直接高屋建瓴,繼續向縱深推進。

第三,Hinton 教授是深度學習領域公認的權威。

這位大叔最大的本領就是對事業有自己的思考和見解,不人云亦云。當年人工智慧領域遭遇寒冬,資助都沒了,實驗室都維持不下去了。許多有才華的人都跳到其他領域去了,唯獨他老人家總是覺得不斷改進與發展中應該有機會,就留了下來。

事實證明這種堅持帶來的收穫是顯著的。他比別人提早深耕了數十年,如今的學者在深度學習領域無論寫什麼新論文幾乎都繞不開引他的文獻。:-P

所以,聽這樣泰山北斗級別的人物給你授課,真的是一種幸福。對別人來說一種非常高深莫測的演算法,讀起來要麼如同天書,要麼擊節讚歎,可在他嘴裡無非是 「哦,那一年我試了一下這個,不成;後來突然開竅了,在這裡改變了一點點,然後就……」

有些人在討論區留言說他的笑話講得太有趣了。這是真的。不過你學起來的時候對這個事兒期望不要太高——作為外國人,你的生活環境和文化底蘊不同,笑話就別指望都能聽懂了。

學完這門課,別人要是再想拿深度學習的概念來忽悠你,就很困難了。

這話你聽懂了嗎?

學完這門課,如果你拿深度學習的概念去忽悠別人……

咳咳。

實踐

通過前面兩門課,你理解了什麼是機器學習和深度學習。但是你可能不願意只停留在概念理解上,卻很想做出些東西來實踐。實踐應用一方面可以檢驗你學習的效果,另一方面可以幫助你積累經驗,同時還可以帶來成就感。

不好意思,在應用實踐環節這裡,路徑上有個分支。

第一種選擇是 Udacity 上面的課程」Intro to Machine Learning」(ud120)。授課人是 Sebastian Thrun,前幾年他一直是 Google 自動駕駛技術的負責人。

這門課採用的函數庫是 Scikit-learn,構建於 Python 之上。課程設計得很吸引人,利用一些數據集,讓你熟悉如何用別人構造好的功能(函數調用),加上你自己的理解(參數調整)來完成一些小型項目。

我對這門課程總體上很滿意,吐槽在於對免費學慣用戶而言,因為缺乏必要輔助,最後的大項目難度陡然提高。一般人難以適應,很容易中途放棄。當然,如果你是付費用戶,會有專人帶領你一步步前行,並且提供必要的幫助,感覺就好多了。

第二種是選擇 Coursera 平台上華盛頓大學的機器學習課程專項系列 (specialization),課程名稱為 「Build Intelligent Applications」。

先吐槽一下,我覺得這個課程明顯體現出資本市場對於學術活動的干擾。課程系列包含了 6 門課。但是到目前為止只推出了前 4 門。第 5 門一直在不停跳票。從 2016 年的 9 月份一直推遲到了 2017 年 1 月底。

為什麼?因為主講人兩口子的公司 Turi 被蘋果收購了。於是他們只好暫緩手頭的課程製作,處理收購的各項事宜。

不過從已經推出的 4 門課來看,水平非常高,而且設計巧妙。

課程採用案例教學,就是每一個模塊都依照具體問題給定數據集進行處理。第一門課是總覽,讓用戶體會每一部分的重要內容,並且動手運行嘗試,增加趣味和信心。

然後從第二門開始,每門分別介紹一個機器學習類型。每一周的課程由淺入深,逐漸加碼。利用 Jupyter Notebook 保存練習的結果,將來可以直接用到實踐中。

兩口子還非常大方地開放自己公司的產品免費給學生使用。他們的產品對於學術界也是相當於免費(每年需要手動免費更新一次證書),很慷慨。不過被收購以後,這個政策的事兒就不好說了。

有的章節題目很有一些難度。作為學習者,你得做好遠離舒適區,不停在學習區遨遊的準備。

上述這兩門課程選擇一門聽完,你應該可以具備自己動手處理一些小型數據集的能力了。對於學習、工作和科研應該會有很大的助益。

你很不滿意,想要處理大規模數據?這個事兒需要兩個條件支撐:

你需要能得到大規模數據;

你得有相應的硬體條件。

實話實說,目前絕大部分人不具備相應的條件。所以這個問題有空咱們再深入聊。

補課

你可能對自己的知識基礎沒有什麼信心——我不是數學或者計算機相關專業的,也能學會機器學習嗎?

從剛才的課程介紹,你應該不難看出。現在機器學習的門檻已經很低了。但是為了達成目標,你還是需要掌握一些非常基礎的知識,主要包括:

數學(初級微積分、概率論與統計、線性代數);

編程語言(例如 Python)

如果你缺乏相應的知識,沒關係,補就是了。缺哪裡補哪裡,反覆補充,這樣學習勁頭和效率都有保障。

Python 語言的補課方式我建議採用密歇根大學的 Coursera 課程系列《人人都能學編程》。

這是目前我見到過的最適合數據科學初學者的 Python 語言入門方法。學了這門課程,你不僅掌握了一門語言,還可以掌握數據挖掘的基礎知識。包括資料庫操作、API 和爬蟲等。跟前面的實踐類課程直接可以對接,嚴絲合縫。

至於數學知識的補充,我推薦的是 Bill Gates 一直讚不絕口的可汗學院。

可汗學院起家的本領就是幫助學生輔導數學功課。因此在 MOOC 領域,該平台的數學課程是積累最為豐富的,對學生來說也是最無痛的。

看到可汗學院這麼多數學課程類別了嗎?別猶豫,抓緊學吧。你不會重溫大學一年級的噩夢的,因為講授方式真的很生動、很有趣。

討論

你還上過哪些講解機器學習的好 MOOC?它的獨特之處在什麼地方?能否替換本文列出的部分課程,形成更好的組合?歡迎留言分享,我們一起討論。

如果本文可能對你身邊的親友有幫助,也歡迎你把本文通過微博或朋友圈分享給他們。讓他們一起參與到我們的討論中來。

新人福利

關注 AI 研習社(okweiwu),回復1領取

【超過 1000G 神經網路 / AI / 大數據,教程,論文】

DL 到 Hinton 到 GANs 再到 PyTorch,這裡全都有了!| 國慶特輯巨無霸


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 唯物 的精彩文章:

UC Berkeley 博士:端到端自動駕駛與自動駕駛前沿研究內容
從DL到Hinton到GANs再到PyTorch,這裡全都有了!
PyTorch 合輯 國慶特輯
GANs合輯 國慶特輯
入門合輯,不知道該怎麼入門的可以看這裡

TAG:唯物 |