關於在虛擬世界構建人工智慧分層網路的思考
現在大家都要研究人工智慧,要建設神經網路(neural network)。就像人的大腦是從最原始的大腦進化來一樣,它分為好幾層,每層的作用是不同的。神經網路現在是分層的,但這種分層主要用於中間信息的處理隱含層。從人類認知的角度,我們是否還可以引入其他意義上的分層?使得每一個層次實現一次類人的抽象,逐步實現高層次的智能。
第一章:網路層次劃分
我們需要對神經網路可以劃分的大的層次進行研究。在這裡不進行推論,提出四個層次的假設。從下至上分為:
一、數據網路(DN:Data Network)
1、釋義
數據是最原始的東西,直接來自於各種採集設備或原始介質。他主要體現了數據存儲的拓撲結構。
2、建設目的
實現異構海量數據的存儲,建立數據之間的關聯,作為數據應用的基礎。數據可以是文本、視頻、照片、二進位數據等各種形式。我們需要建立這些數據存儲、檢索的規則,並建立數據之間的聯繫。在存儲空間有限的情況下,還需要建立數據老化、降低精度的規則;如果數據存在不同介質上,也需要根據介質的訪問特性建立多級存儲規則。
3、示例
1)現在的互聯網。數據存儲在不同的網站、頁面、路徑,通過URL互相關聯、引用。
2)HDFS(Hadoop Distributed File System)。實現非結構化數據的大量存儲。
二、信息網路(IN:Information Network)
1、釋義
信息是加工後的東西,被結構化,可自描述,能夠被理解和處理。信息網路應遵循實體世界的概念模型,否者是很難擴展的。
2、建設目的
將數據進行結構化和量化,形成細粒度的信息,並且建立信息之間的關聯關係。並且對基礎數據類型進行梳理,確立不同類型數據最基本的規則和內在關係。這些規則和關係物理世界一些基本約束的體現,即定律、規則或者常識。
3、示例
1)關係資料庫。關係資料庫將數據分解成表、記錄和屬性,並且通過主外鍵建立記錄之間的關聯關係。通過基本的數據類型,隱患了一些業務規則。關係資料庫能夠被用於加工。
2)知識圖譜(Knowledge Graph)。知識圖譜基於最細粒度的屬性,建立了信息之間的關聯關係,實現了信息的推導和傳遞。
三、知識網路(KN:Knowledge Network)
1、釋義
知識是被抽象、加工過的信息,並且其隱含了知識抽取的規則。
2、建設目的
將業務邏輯、領域知識等處理模型固化下來,實現對同類信息的反覆處理,達到不斷提取知識的目的。
3、示例
1)專家系統。將領域知識固化到系統中,根據輸入信息動態的確定輸出。
2)報表系統/BI工具。將數據匯總邏輯固化到代碼或配置中,根據選擇的數據集合(是結構化的信息,不是原始的非結構化數據),產生需要的輸出。
四、智能網路(NN:Neural Network)
1、釋義
基於信息和知識,具備推理、預測的能力,類似於傳統意義上的神經網路。
2、建設目的
實現系統的自學習、自完善、自演化,具備可通過圖靈測試的表徵。智能網路在處理問題的同時,能夠對底層的知識網路、數據網路進行調整、優化。智能網路的實現不會是當前演算法固化的AI晶元,可能是基於能夠自我調整硬體電路連接的FPGA或者是代碼可以動態演化的軟體虛擬機。
3、示例
1)語音與語義識別。當然現在的語音和語音識別還不是真正的人工智慧,很大程度上是基於統計學的。
2)視頻識別與行為分析。在這個領域,現在也真正的人工智慧,針對某一個具體應用,還需要建立模型並進行樣本訓練。
第二章:仿生學解釋
從不是非常嚴謹的角度,概要的講:
1、智能網路
相當於大腦新皮層,就是第6層。它能控制下面5層的運行。
2、知識網路
相當於大腦皮層的1-5層,這些層存儲了諸多的模式。這些模式是不斷學習的積累。現在人工智慧領域的深度學習,更大程度上對應的是這個知識網路。
3、信息網路
在人腦中,信息是存儲在神經突出中的,和神經元在一起。也就是說,數據和計算單元是一體的。這和我們現在的馮·諾依曼體系結構是不同的。如果我們可以沿用馮·諾依曼體系結構來人工智慧,就有必要構建信息網路,否者信息會分散存儲,但即使這樣,它也會滿足對信息的基本約束。
4、數據網路
在人腦中, 存儲的都是結構化、量化的數據和模式,不存在非結構化的大塊數據。但要實現人工智慧,考慮到數據的存儲和計算資源的有限性,是必須要實現數據網路的,作為信息的原始。
第三章:關於四層網路的實現
這四層網路如果能夠實現,會把目前在信息技術領域的研究成果都圍繞人工智慧整合起來。
現在因為沒有信息網路和知識網路的支撐,神經網路深度學習後的結果都是人無法理解的,很難對學習和處理過程進行分析。
當務之急,是把信息網路建立起來。
為了支持神經網路的初步有效運行,達到自演化的效果,預計最小範圍內也需要建立一個比較大的信息網路,這個初始工作量是很大的。至少要把人出生時,基於DNA中的遺傳信息構建的生物學大腦所具備的基礎網路建立起來。
尤其是在商業場景中,我們會基於主機實現「雲+端」的模式,智能個體的部分計算會在雲端進行,而在雲端考慮到各種數據許可權,信息網路的實現預計是比較複雜的,甚至其本身就可能是一個多層的網路。
TAG:智慧數據 |