適合初學者學習的神經網路:流行類型和應用
AiTechYun
編輯:Yining
目前,神經網路被用於解決許多商業問題,如銷售預測、客戶研究、數據驗證和風險管理。更進一步講,我們能夠使用神經網路進行時間序列預測、數據中的異常檢測和自然語言理解。
在這篇文章中,我們將對初學者解釋神經網路是什麼,神經網路的流行類型,以及他們的應用。我們還將介紹如何在不同的行業和部門中應用神經網路。
神經網路是如何工作的?
最近,在計算機科學領域,「神經網路」這個詞引起了廣泛的關注,引起了許多人的注意。但這到底是什麼,它們是如何起作用的,而且它們真的是有益的嗎?
從本質上說,神經網路是由一層叫做神經元的計算單元組成的,在不同的層之間有連接。這些網路轉換數據,直到它們可以將其歸類為輸出。每一個神經元都通過一些權重來增加一個初始值,並將總數結果與其他的值傳入同一個神經元,根據神經元的偏差調整產生的數量,然後用激活函數使輸出恢復正常。
迭代學習過程
神經網路的一個關鍵特徵是一個記錄每次提供給網路的(行「hang」)的迭代學習過程,並且每次都調整與輸入值相關的權重。在所有的情況出現之後,這個過程常常被重複。在這個學習階段,網路通過調整權重來預測輸入樣本的正確的類標籤。
神經網路的優勢包括它們對雜訊數據的高耐受性,以及它們對未經過訓練的模式進行分類的能力。最受歡迎的神經網路演算法是反向傳播演算法(backpropagation algorithm)。
一旦為某個特定的應用程序構建了一個網路,那麼這個網路就準備好接受訓練了。為了啟動這個過程,初始權重(在下一節中描述)是隨機選擇的。然後訓練(學習)就可以開始了。
網路使用隱藏層中的權重和函數在「訓練集」中處理記錄,然後將結果輸出與所期望的輸出進行比較。然後,錯誤會通過系統傳播,導致系統將應用程序的權重調整到下一個記錄中。當權重被調整時,這個過程會重複發生。在網路的訓練過程中,當連接權重不斷被細化(refine)時,相同的數據集會被多次處理。
那麼它包含什麼困難呢?
對於初學者來說,學習神經網路的一個挑戰就是了解每一層的具體情況。我們知道,在訓練之後,每一層都提取數據集(輸入)的更高級的特性,直到最後一層對輸入特性所涉及的內容來作出決定。那麼該怎樣做呢?
我們可以讓網路做出這個決定,而不是確切地規定我們希望網路來放大特徵。假設我們只是給網路一個任意的圖像或照片,讓網路來分析圖片。然後我們選擇一個層,讓網路加強它檢測到的任何東西。網路的每一層都處理不同抽象級別的特徵,因此我們所生成的特徵的複雜性取決於我們選擇哪一層來加強。
受歡迎的神經網路及其用法
在這篇針對初學者學習神經網路的文章中,我們將研究自動編碼器(autoencoder),卷積神經網路(convolutional neural network),以及遞歸神經網路(recurrent neural network)。
自動編碼器
這種方法是基於這樣的觀察:隨機初始化是一個壞的想法,並且預先訓練每一層使用無監督學習演算法可以獲得更好的初始權重。這種無監督演算法的例子是深度信念網路(Deep Belief Network)。最近有幾項研究試圖復活這一領域,例如,為基於概率的自動編碼器使用變分的方法。
它們很少在實際應用中使用。最近,批量標準化開始允許更深層的網路,我們可以利用殘差學習來從頭開始任意訓練深度網路。在適當的維度和稀疏約束的條件下,自動編碼器可以學習比PCA或其它基本技術更有趣的數據投影。
讓我們來看看自動編碼器的兩個有趣的實際應用:
在數據降噪中,利用卷積層來表示一個降噪的自動編碼器,有效地用於降噪醫學圖像。
一個崩潰過程隨機地將一些輸入設置為零,迫使降噪的自動編碼器為隨機選擇的丟失模式的子集預測丟失的(損壞的)值。
數據可視化試圖利用主成分分析(PCA)和t-SNE演算法等方法來進行降維。它們與神經網路訓練相結合,提高了模型預測的準確性。同時,MLP神經網路預測的準確性在很大程度上依賴於神經網路的結構、數據的預處理以及網路開發的問題類型。
卷積神經網路
卷積的主要目的是為了從輸入圖像中提取特徵。卷積通過使用小的輸入數據來學習圖像特徵,從而保持了像素之間的空間關係。在以下域,卷積神經網路已經取得了成功:
面部識別
在面部識別的工作中,他們使用了卷積神經網路級聯(cascade)來快速地進行人臉檢測。該檢測器以低解析度對輸入圖像進行評估,以快速拒絕非人臉區域,並仔細處理具有較高解析度的區域,以便進行準確的檢測。
在級聯中也引入了Calibration net,以加速檢測和改善包圍盒(bounding box)的質量。
自動駕駛汽車
在自動駕駛汽車項目中,深度圖估計(depth estimation)是自動駕駛的一個重要考慮因素,因為它能對乘客和其他車輛的安全做出保障。卷積神經網路使用的這些方面已經被應用於英偉達的自動駕駛汽車項目中。
卷積神經網路的層通用性極強,因為它們可以通過多個參數處理輸入。這些網路的子類型(subtype)還包括深度信念網路。卷積神經網路傳統上用於圖像分析和對象識別。
遞歸神經網路
遞歸神經網路可以通過對實際數據序列的處理來進行序列生成,並預測接下來會發生什麼。
假設這些預測是有概率的,那麼通過從網路的輸出分布中重複地採樣,就可以從一個經過訓練的網路中生成新的序列,然後在接下來的步驟中輸入樣本作為輸入。
語言驅動的圖像生成
我們能學會將指定的文本變成手寫的嗎?為了完成這一挑戰,窗口與文本字元串進行了卷積,並將其作為預測網路的額外輸入。窗口的參數是由網路在進行預測時同時輸出的,因此它動態地確定文本和筆的位置之間的對齊。簡單地說,它學會了決定接下來要寫哪個字元。
預測
在給定一個特定的輸入的情況下,一個神經網路可以被訓練來產生預期的輸出。如果我們的網路能夠很好地模擬已知的值的序列,那麼就可以使用它來預測未來的結果。一個很明顯的例子就是股市預測。
將神經網路應用於不同的行業
神經網路廣泛用於當前社會的業務問題上,如銷售預測、客戶研究、數據驗證和風險管理。
市場營銷
目標市場營銷涉及到市場細分,我們將市場劃分為不同的消費者群體。
神經網路可以根據用戶的基本特徵,包括人口、經濟狀況、地點、購買模式和對產品的態度來進行細分。無監督的神經網路可以根據其特徵的相似性自動對客戶進行分組和分類,而受監督的神經網路可以根據一組客戶的需求來學習不同的客戶段之間的邊界。
零售&銷售
神經網路有能力同時考慮多種因素,比如產品的市場需求、客戶的收入、人口和產品價格。超市銷售的預測在這裡有很大的優勢。
如果兩種產品之間存在一段時間的關係,比如在購買印表機的3-4個月之內,客戶會打算買一個新的墨盒,那麼零售商就可以使用這些信息聯繫客戶,從而降低客戶從競爭對手那裡購買產品的可能性。
銀行與金融
神經網路已成功應用於衍生證券定價和對沖、期貨價格預測、匯率預測和股票表現等問題。傳統上來說,統計技術推動了軟體的開發。然而,神經網路是推動決策的根本技術。
醫學
神經網路在醫學領域是一項趨勢研究,並且在未來的幾年裡,它們將會廣泛應用於生物醫學系統。目前,這項研究主要集中在人體的建模部分,並從各種掃描中識別疾病。
總而言之,神經網路使計算機系統變得更有用,使它們更人性化。


TAG:ATYUN訂閱號 |