為什麼即使不做程序員,你也需要了解一點深度學習
編者按:與其擔心未來,不如創造未來。開智部落聚集起一群有創造者氣質的小夥伴,他們偏愛輸出勝於輸入,偏愛知識源頭勝於雞湯碎片,偏愛動手創造勝於一旁觀望。同樣好奇、擔憂或是困惑與人工智慧是什麼,部落的周瑞珍不止步於好奇觀望,直接上手學習。上周,她在開智部落分享,闖入深度學習世界,她學到了什麼。
人類對於人工智慧一直抱有無限遐想。
古希臘神話中,火神赫菲斯托斯用金子製造機器人女工,她們不僅可以幫他幹活,還可以同他交流。瑪麗雪萊筆下的科學怪人,和普通人一樣擁有好奇心,追求美好情感。除了出於提高勞動效率,改善生活等考慮,人類痴迷於人工智慧,還因為人類也渴望成為造物者,像女媧那樣,看著泥土在自己手中幻化成有智慧的生命。
也許這一天還很遙遠,人類的探索從未停止。過去幾年,人工智慧快速增長,前所未有的浪潮洶湧而來。深度學習作為人工智慧的一個子領域,在解決複雜學習問題領域的成功已經有目共睹。亞馬遜語言助理 Alexa、人工智慧圍棋程序 AlphaGo、Google 自動翻譯,這些技術背後都離不開深度學習。
我也十分好奇,計算機是如何具備學習能力的。相關科普文章、八卦新聞、媒體報道無法滿足我的好奇,於是我直接參加了開智學堂第一期深度學習課程。作為一個深度學習小白,我想跟你分享探索路看到的風景。
機器學習,學什麼
機器學習把計算機看做黑盒子,接收輸入,處理後反饋結果;把處理過程表徵為一個模型,或一個函數 f()。
對於圖像識別程序,
對於AlphaGo,
對於語音識別程序,
這個函數有可能非常複雜,計算機的任務就是把它模擬出來。
假設有這樣一組數據,記錄了一門課程的結業成績,a1 是學生的平時分,a2 是期末考試的分數,y 是老師給出的最終得分。這組數據稱為樣本集,a1,a2 稱為特徵,y 稱為標籤。
把數據交給計算機,讓它從中學習打分的模型。也就是說,我們期望它能夠獲得這樣一個函數f(a1,a2),儘可能地滿足這一系列等式
f(60,90) =80
……
f(50,65) =75
假如計算機學習到的模型是正確的,或者準確率可以接受,我們就可以給這個函數一系列新的輸入,讓它預測這些學生的分數。
看看如何用深度學習來解決這個問題。深度學習是機器學習的一個分支,基於人工神經網路技術。在理解神經網路之前,要先理解什麼是神經元。神經元其實就是一個能夠接收輸入,對輸入進行線性疊加,運算並輸出結果的單元。
為了簡化問題,假設神經元直接把線性疊加的結果輸出,沒有經過其他的運算。 即 f(a1,a2)=a1W1+a2W2+b,W1,W2 是平時分和期末分數分別所佔的權重,但它們是未知的。神經網路的任務就是把這三個未知數 W1,W2 和b 算出來。
怎麼算呢?答案是:猜。當然不是漫無目的的猜,而是按照特定的策略,一邊猜一邊進行修正。參考下面的流程圖。
先給權重和常數賦一個隨機的值,假設是 W1=0,W2=1,b=2。把樣本集里的第一行數據交給神經元進行計算。 把計算結果和第一行數據里的真實值進行比較,算出誤差。再根據誤差修改權重。具體怎樣修改權重,有很多種方法,都是基於特定的數學理論,能夠保證不斷的迭代之後,誤差會越來越小。這個基於誤差修改權重的過程,就稱為學習。學習方法歸根結底就是網路連接權重的調整方法。接下來不斷地循環以上過程,直到誤差變得最小,就獲得了最合適的 W1,W2 和 b 的組合,也就得到所需的函數。
以上是最簡單的,只有一個神經元的網路,它只能表達簡單的函數。假如有兩個老師給學生打分,他們的意見不一致,各自都有自己的一組權重。那就在網路中增加一個神經元。權重增加為四個。每個老師算出的分數再交給一個神經元進行計算,同樣也要添加不同的權重。
假如輸入的特徵增加,例如上課次數,平時分,期末得分共同決定總成績,網路就變為
當許許多多神經元按一定規則連接起來,構成深度神經網路,就具備了強大的功能。深度學習的「深度」一詞指的是層數比較多的神經網路。
以上就是神經網路的工作原理。
人工神經元與大腦神經元
神經元的學習過程令我想起曾經在科學館裡走過的鏡子迷宮。當你進入迷宮後,眼前層層疊疊,分不清虛實,前進的方法是用手裡的泡沫軸敲一敲,看看是鏡子還是路,如果路就往前走,如果是鏡子就換一個方向,當走到了死胡同就退回來。
人類大腦做決策也是類似的:不斷的接收輸入,做出判斷,再根據現實與自身判斷的差距進行調整。人類的學習是對自我的修正,人工神經元的學習則是對它擁有的一系列權重係數的修正,只是在計算機上精確的量化了這一過程。
1943 年,邏輯學家 Walter Pitts 和神經生理學家 Warren McCulloch 提出神經元模型,其後神經網路研究起起伏伏多年,一度被淡忘,直到 2010 年前後才重新崛起,獲得廣泛應用。事實上人工神經網路的發明正是受到中樞神經系統的啟發。研究大腦認知機理,再把它運用到計算機上,是實現人工智慧的一個重要途徑。下圖是大腦神經元的構造。
樹突是神經元的輸入通道,軸突是神經元的輸出通道。一個神經元通常具有多個樹突,而軸突只有一條,軸突尾端有許多軸突末梢跟其他神經元的樹突產生連接,從而傳遞信號。這個連接的位置在生物學上叫做「突觸」。
1977 年諾貝爾物理學獎得主安德森在論文《多者異也》中指出,物質在不同的尺度會遵從不一樣的規律。單個神經元的功能十分簡單,當神經元多達數百億個,心智自然湧現。大腦神經網路之所以具有思維認識等高級功能,正是因為無數神經元之間的聯結構成了一個龐大而複雜的系統。
我前面所介紹的內容,都只是簡單的,淺層次的理解,可能有些知識也屬於「司機知識」。深度學習是一個融合了數學,計算機技術和特定領域知識的多學科交叉領域。在數學理論的指導下,才能保證模型的學習是朝著正確的方向,能夠獲得最優的結果;在理解了神經網路的原理之後,必須通過編程技術才能真正實現;如何用來解決現實中的問題,計算機怎樣理解圖像,我們使用的語言文字要怎樣轉換成計算機可以處理的數字,這些都是需要沉下心來,投入時間才能夠掌握的。下一階段的計劃是深度學習「深度學習」。
學習如織網
新生兒大腦中約有 860 億個神經元。對大腦的運行而言,神經元數目只是一方面,神經元之間的連接才是決定性的。怎樣建立神經元之間的連接呢?通過學習。
神經可塑性(Neuro-plasticity)是指的由於經驗原因引起的大腦的結構改變。神經可塑性是近期的發現,過去往往認為在嬰兒關鍵期後,大腦結構往往不發生變化。大腦有神經元細胞和神經膠質細胞構成,這些細胞互相連接,通過加強或削弱這些連接,大腦的結構可以發生改變。
大家都有這樣的體會,第一次讀到一段文字,往往不會有深刻印象。後來,在某個觸動你的故事中再次看到這段文字,或某個具體場景令你聯想到它,才在腦海中留下鮮活印象。
中學時很喜歡讀詩詞,大部分都是過目即忘。某天放學路上,我望著天邊的落日,一句話從腦海里湧出:浮雲遊子意,落日故人情。完全記不起這是誰寫的,什麼時候讀過,甚至有種錯覺,似乎是自己想出來的。查書才知道來自李白的《送友人》,這時我才是真正的「記住」了這首詩。
生物學家埃里克·坎德爾(Eric R. Kandel)研究原始動物海兔的神經細胞,發現記憶就發生在神經元的突觸上。短期記憶形成時,突觸連接的強度增加,長期記憶形成時,不僅是突觸強度增加,神經迴路中的突觸數目也發生了變化。
因此,坎德爾寫道:「對需要長期保持的記憶而言,輸入的信息必須經過徹底而深入的處理。要完成這樣的處理過程,就得留意這些信息,並把這些信息跟記憶中已有的知識有意義地、系統化地聯繫起來。」
古人云,學而時習之。學習是一個反覆印證,互為佐證的過程,也是在不斷地增強大腦中神經元之間的連接。深度學習的計算部分,通過線性代數中的矩陣來實現。每列代表一個神經元,也就是它所擁有的權重。一個公式簡潔的表達了前面所說的一系列運算步驟。
這是我和線性代數的第三次相遇。
讀大學時它是令我頭疼的一門課,各種矩陣變換令人暈頭轉向,完全不明白為什麼要定義這些奇怪的規則。考研時弄懂了,後來工作中不常用到,又漸漸遺忘。在深度學習課程中,我才明白,原來矩陣可以用在這裡。
我們接受的教育有一個奇怪的特點,把知識灌輸到了腦海,卻沒有與現實生活聯繫。彷彿有一塊孤零零的區域,專門用來考試。學生在考試的指揮棒之下趕路,無法領略其中的奧妙。直到多年以後,為了理解新的知識去重溫,才明白,原來它是這樣使用的。把過去的記憶提取到大腦中,與新的記憶連接,我們同時在織著兩張網,一張是虛擬的知識網路,一張是大腦中神經元的網路。
洞穴外的光
到目前為止,我參加了開智學堂的四門課程,坦白說,開智的課程信息密度都很大,稍不注意就會掉隊。每期課程都有一些特別優秀的同學,在我還沒看懂演算法內容的時候,他已經可以和老師討論演算法的性能了。我的狀態就是一直在追趕,從來都追不上,但是這樣一次又一次「被虐」,我卻樂此不疲。
大家可能聽說過柏拉圖的洞穴隱喻,設想有一個深邃幽暗的洞穴,人被完全禁錮,只能看到前方牆壁上刻意製造的幻象,他就以為這是真實的世界。當其中一人的枷鎖被解除,能夠自由行動,看到洞穴里的一切,他會開始思考何者為真何者為幻,產生困惑與痛苦。當他走出洞穴,逐步看清事物真相,適應了刺眼的陽光,便不願意再回到黑暗之中生活。
我們都生活在自我構建的洞穴之中,它可以是你所處的環境,也可以是人生的不同階段。假如你觀察一個孩子,會發現他的喜怒哀樂、行動都是出於本能,是不自知的。隨著心智成熟,有一天他會能夠意識到自己的情緒,從而調節和控制。這便是一個走出洞穴的過程。留在已知世界中會令我們感覺安全,而探索新知,開拓思維的疆域,則有機會來到更寬廣更精彩的世界。對我而言,這就是光。
其實學習的這些課程,在短期內都和我的工作沒有多大關聯,但是並不意味著它們對我的生活不具備現實意義。在我看來,最好的教育不是僅僅提供知識和答案,而是給你更多疑問,讓你對現狀產生質疑。
相信很多小夥伴都和我一樣,面臨這個問題:想做的事情太多,時間不夠用,怎麼辦?在學習認知科學,了解大腦怎樣做決策後,開始嘗試著簡化生活, 把一些不那麼重要的事情儘可能地簡單化,自動化,減少對認知能量的消耗。在陽志平老師的生活十二問和童牧晨玄老師的分享中都有提及,我就不再贅述。
簡化生活,最重要的是處理好與身邊人的關係。遠方的戰爭會令我們動容,慨嘆過後,生活照舊。但是假如和身邊的人,尤其是家人產生矛盾,則會帶來一整天的心神不寧。而我們往往更在意自己面對外人時的形象,而忽略了家人的感受。意識到這一點,帶來的是行動上的改變。相比兩年之前,我能感受到自己能夠以一種更平和的心境面對工作和生活。
陶淵明筆下,武陵人穿越山中小口,遇見桃花源。當我們跨出自我的疆域,踏進未知世界,或許會感覺豁然開朗,另有一番天地?▉
— End —
作者:周瑞珍
編輯:張高峰
參考資料:


TAG:開智部落 |
※綜合鼻整形不是那麼簡單,想要達到想要的效果,這些你需要了解!
※即使你只走了一步,但你所需要的正是這一步
※打造馬思純娜扎無辜妝容,只需要注意這一步就夠了
※寫書法作品,難道真的需要刻意去整嗎?我有點不會了
※想讓痛風不再發作需要這樣做,現在知道還不遲!
※要想假期不挨罵,你需要
※怎樣選擇更適合自己的員工,你需要了解一下幾點!
※做再多運動也瘦不下來?你需要注意這些飲食習慣
※胃總是不舒服怎麼辦?不需要你忌諱太多,只要做到這2點
※如果需要的時候他不在,那麼以後他也不必在了
※濕疹怎麼辦?您需要先改掉這幾個惡習,就可以輕鬆解決了
※不需要代價的學習或者生活,您想要嗎?任何人都可以看一看
※牙醫是否需要再學習,看這三個問題就夠了
※麵食這樣做不需要擀,不需要煮,不需要炒,一上桌就被搶光
※如果感情不深,也請你們不要放棄,家庭需要共同經營
※對這三大星座來說,最需要你的時候你不在,以後都不需要你了!
※他們不是不需要,只是愛你而已
※助攻第一!你需要做的不僅是傳球,還需要學習這些基本功!
※不要等他們需要時找不到你,不要讓自己留有遺憾
※不想輕易被擊垮,你需要多一點「心理彈性」