卷積神經網路與深度學習演算法與應用
顧建文,解放軍306醫院
深度學習是一項比較複雜的機器學習演算法,在圖像識別方面和語音識別方面,深度學習均取得了一定的效果,深度學習被人們看作是一種先進、新穎的技術。深度學習在個性化技術、語音、自然語言處理、機器翻譯、多媒體學習、機器學習、數據挖掘、搜索技術等諸多方面都取得了很好的成果。通過深度學習,機器可以對人類活動進行模仿,例如思考活動和視聽活動等,從本質上解決了複雜模式識別等難題,使人工智慧技術等相關技術都在一定程度上獲得了進步,把各種實際應用研究與深度學習有機結合起來是一項不可或缺的工作。
卷積神經網路
卷積神經網路事實上是多層感知器的一種變種,著名生物學家通過對貓的視覺皮層進行觀察而發展得來,在視覺皮層細胞里有比較複雜的結構,這些細胞對於視覺的輸入空間的子區域比較敏感,我們將其稱作感受野,用這樣的方式來對整個視野區域平鋪覆蓋。將這些細胞進行有效區分,將其分成複雜細胞和簡單細胞這兩種類型。複雜細胞的接受域更大,如果確切位置對複雜細胞進行刺激,則複雜細胞具有局部的不變性,而簡單細胞對於來自感受野範圍裡邊緣刺激的模式產生最大程度響應。
卷積神經網路的稀疏連接
BP神經網路里每一個神經元節點都是一個線性的一維排列結構,層和層的各個神經元節點之間都是全部連接。在卷積神經網路里,層和層之間神經元節點並非全連接形式,對層間的局部空間相關性進行充分利用,進而將相鄰每一層神經元節點與上層神經元節點相連接,這便是局部連接。卷積神經網路結構從此得來。將輸入層設置為m-1層,在BP神經網路里,m-1層所有神經元節點與m層神經元節點相連接。在卷積神經網路里,m層神經元節點和其相接近三個節點有效連接,這樣便從本質上將神經網路架構參數規模降低。
卷積神經網路的權重共享
在卷積神經網路里,卷積層每一種卷積濾波器在整個感受野中進行重複作用,對於輸入圖像實時卷積,卷積結果會構成輸入圖像特徵圖,將圖像局部特徵進行提取。每一個卷積濾波器實現相同參數共享,包括相同偏置頂以及權重矩陣。m層的特徵圖像主要包括三個神經元,將不同連接線之間權重參數實施共享,仍然可以運用梯度下降法來實施權重參數的共享,只要原有梯度下降法開展小小改進,共享連接參數的梯度之和就是共享權重梯度。共享權重的優勢就是在提取圖像特徵的過程中,不用對局部特徵位置進行充分考慮,並且權重共享可以從本質上降低卷積神經網路模型的參數數量。卷積神經網路的整體架構作為一種多層監督學習的神經網路,在卷積神經網路中,深度學習從本質上促進了機器學習的不斷發展,並且受到了世界各國研究人員的青睞,各個國家的高科技公司也越來越重視深度學習。在深度學習演算法應用的過程中,自然語言處理、圖像以及語音這三個領域是重要的研究領域。
自然語言處理領域的應用
在深度學習應用過程中,自然語言處理領域是十分重要的領域。經過了數十年的時間,統計模型仍然是處理自然語言的主流方法,在統計方法模型中,人工神經網路是重要的模型,但是,人工神經網路在自然語言處理領域中並沒有引起充分的重視。最早運用神經網路而實施自然語言處理的標誌就是語言建模,美國NEC研究院,是最早在自然語言處理中應用深度學習的機構,NEC研究院的研究人員從2008年開始,便通過多層一維卷積結構以及將辭彙映射到一維矢量空間的方法,來對自然語言問題進行處理,例如詞性標註、語義角色標註、命名實體識別、分詞等問題。NEC研究人員通過進行同一個網路模型進行構建,進而將其用於解決四個不同問題之中,並且均取得了十分準確和精確的結果。
圖像識別領域的應用
在深度學習演算法的應用過程中,最早嘗試的領域就是圖像處理領域。1989年,加拿大的知名大學教授便和其同事共同研究,進而提出卷積神經網路這一概念。人們還將卷積神經網路稱之為CNN,卷積神經網路是一種深度神經網路模型,該模型包括卷積層。通常情況下,一個卷積神經網路的架構要包括兩個非線性的卷積層,這兩個非線性的卷積層主要通過訓練而產生,兩個子採樣層是固定的,並且和一個全連接層相同,通常情況下,還包括五個以上的隱藏層數量。通過生物學家對於動物視覺模型的研究而設計了卷積神經網路架構,特別是對動物視覺皮層里複雜細胞以及簡單細胞進行模擬,在小規模應用的過程中,卷積神經網路取得了良好的效果。但是,該成果在很長一段時間都處於停滯狀態,沒有重大的突破。原因就在於,一直無法取得在大尺寸圖像上應用卷積神經網路的理想結果。例如對於自然圖像內容的理解,由於自然圖像的像素很大,卷積神經網路無法對其進行很好地理解,這便導致其無法引起相關研究領域和研究人員的高度重視。一直到2012年,研究人員通過卷積神經網路模型在ImageNet問題中取得了良好的成果,這個時候,其對於圖像識別的程度更深,其研究工作也前進了一大步。自從卷積神經網路問世以來,並沒有在圖像識別領域中取得進步,直至2012年,深度神經網路的構建才取得了一定的成果。這一成果的取得,得益於改進其演算法,在網路訓練過程中,運用權重衰減的相關概念,從本質上將權重幅度減小。再加上計算機計算能力不斷提升,計算機的GPU得到了快速發展,這便使其在訓練的時候,可以收集比以前更多的訓練數據,使網路能夠對訓練樣本進行更好地擬合。2012年,百度公司把與其相關的最新的技術成果,運用到自然圖像識別領域和人臉識別領域中,取得了成功,並且推出了與之相應的產品。現如今,深度學習的網路模型已經能夠對一般自然圖像進行識別和理解,深度學習模型的構建,不僅從本質上將圖像識別精度提升,更有效避免了人工特徵提取,由於人工特徵提取工作需要消耗太多的時間,因此,深度學習模型的構建從本質上提升了在線運算的效率。此外,深度學習還有可能會成為主流的圖像識別技術,進而取代機器學習和人工相結合的形式。
語音識別領域的應用
在很長一段時間內,大多數語音識別系統都運用混合高斯模型,進而對每一個建模單元統計概率的模型進行有效描述,因為這樣的模型估計十分簡單,所以,為運用大模型數據實施訓練提供了便利。混合高斯模型擁有訓練演算法,該演算法具有較好的區分度,這便從本質上為混合高斯模型可以被有效的訓練提供保障,因此,混合高斯模型在一定時期內,在語音識別應用領域中,具有很強的主導地位。但是,縱觀混合高斯模型的實質,我們會發現,該模型其實是一種淺層學習網路的建模,不能夠將其特徵狀態空間分布充分地描述出來。同時,運用混合高斯模型建模需要幾十維的特徵維數,便導致無法描述特徵之間相關性。最後,雖然可以通過分度訓練模擬得到一些模式分類之間區分性,但是,該模型的建模本質就是似然概率的建模方式,所以,其效果十分有限。在國際方面,谷歌運用深層神經網路來針對聲音開展建模,谷歌是最早突破深度神經網路工業化應用領域的一個企業,但是,谷歌所生產的產品里,只有四層至五層使用了深度神經網路架構。和百度公司相比較,百度公司深度神經網路架構達到了九層,正因為這樣的結構差別,使在線學習過程中,運用深度神經網路計算難題,能夠很好地解決難題。這也使百度公司線上產品運用神經網路模型更加複雜,通過這樣的結構差異核心,使百度公司對在線計算技術難題進行更好的解決。所以,百度公司的線上產品能夠運用的網路模型更加複雜。這可以從本質上幫助深度神經網路模型的訓練,對大規模語料數據進行拓展。
在機器學習領域中,深度學習是重要的分支領域。通常情況下,機器學習已經成為了代替人工智慧的概念。通過機器學習演算法,能夠使計算機從大量的數據中,對潛在特徵和規律進行學習,以便對新樣本實施智能識別,還可以對未來的某件事情可能性進行預期。使機器像人類一樣思考,這已經成為很多科學家的夢想,而深度學習的產生和發展,為實現這一夢想奠定了基礎。雖然現階段仍然是對深度學習開展研究的最初階段,但是,深度學習在數據挖掘、語音識別、圖像等諸多領域都取得了成功和進步,促進相關領域的進步和發展。


※什麼叫日間手術 Ambulatory Surgery?
※老年人高血壓的特點
※帕金森患者的家庭護理
※臂叢神經解剖及臨床應用
TAG:醫學顧事 |
※深度學習與神經網路概述
※深度學習神經網路方法獲改進
※從網路設計到實際應用,深度學習圖像超解析度綜述
※面嚮應用的深度神經網路圖說
※應用於實時視頻通信的深度學習演算法研究
※深度神經網路實戰技巧,來自一名演算法工程師的經驗!
※應用深度學習技術 讓網路威脅無處遁形
※深度全解卷積神經網路
※機器學習、深度學習、神經網路、深度神經網路之間有何區別?
※基於深度神經網路的點雲孔洞修補演算法的並行化研究
※3D列印深度學習神經網路用光子而不是電子進行計算
※深度學習在視頻分析中的架構、演算法及應用
※用淺度學習訓練深度網路:避開端到端深度學習難題
※理解卷積神經網路的利器:9篇重要的深度學習論文
※自己動手寫深度學習模型之全連接神經網路
※神經網路圖靈機:深度學習中與內存進行交互的基本方法
※基於交錯組卷積的高效深度神經網路
※淺析深度神經網路遷移方法
※基於深度學習的目標檢測演算法綜述
※腦洞不保!日本深度神經網路演算法重建人腦中圖像