當前位置:
首頁 > 最新 > 用AI創建AI用的知識圖譜

用AI創建AI用的知識圖譜

在人工智慧技術蓬勃發展的背後,人們或許會有這樣的疑惑,人工智慧是如何進行學習的?如何讓機器更加聰明?微軟認為,要讓機器更好地理解人類交流並且進行語義計算,知識圖譜技術扮演了不可或缺的重要角色。對此, 微軟(亞洲)互聯網工程院常務副院長張晧勇在微軟創新實踐論壇上進行了分享。

什麼是人工智慧?

什麼是人工智慧,相信大家可以從各種媒體渠道那裡獲得足夠的信息,我在這裡想用圖靈測試和中文屋進行概括和總結。對於圖靈測試,相信很多人都不會陌生。圖靈在1950年為人工智慧下了一個定義。圖靈認為,如果一個測試者無法區分電腦的回復是人工回復的還是一段程序自動回復的,我們就認為這段程序有了智能。

30年後,也就是1980年,美國一個哲學家希爾勒以「中文屋「的思維實驗,對類似圖靈測試這樣的人工智慧定義的一種反駁。他假設有一間對外只有一個小孔的房間,外面的人可以通過把中文寫的小紙條放到小孔里問問題,屋裡有一個不會說中文的人,但是他有很強大的處理中文信息和回復的手冊,他通過這個手冊找到相應的中文字元組合的回復,再通過小孔把答案給回去。外面的人會以為屋裡的人真的懂中文,但是屋裡的人並不懂。他以這個例子映射即使計算機能夠通過程序模擬人的行為,也不是真正的智能。這種例子在現在的一些人工智慧應用上其實很常見。當然了,希爾勒是從一個哲學家角度在看這個問題,其實他更多的是指討論「意識」而不是「智能」。不過他這個例子也引起了很多科學家的思考,衍生了像強人工智慧和弱人工智慧的說法。換一個角度考慮,大家設想一下,如果在做的各位是科學工作者,其實真的寫出這麼一屋子複雜的能以假亂真的中文回復手冊其實也是非常困難的,而且如果屋子裡面的人能懂一點中文,那他的工作肯定會做的更好更高效。這就意味著,如果我們做一件事情,不光知其然,更知其所以然,那麼我們的做事效率一定會更高。對人來說如此,對計算機而言也是如此。我們今天講的知識圖譜,就是一個能幫助人工智慧更知其所以然的工具。

什麼是知識圖譜?

知識圖譜,顧名思義,就是以圖譜的形式表達知識。每一個節點都是現實生活中一個概念的映射,每一條鏈接兩個節點的線,代表這兩個節點的關係。圖譜是一種靈活、延展性強而且效率高的表現知識的結構。古希臘哲學家帕拉圖對知識是這麼定義的:「Justified true belief」, 翻成中文就是「合理的真實信念」。「合理」和「真實」這兩點非常重要。所以我們想要的知識圖譜,不光覆蓋率要高,即知識要多,還要有根有據,並且要保證正確性。當然,由於新知識在不斷被創造,因此,知識圖譜的及時性也顯得相當重要。

我這裡用一個比較形象的方法幫助大家理解知識圖譜的重要性。其實我們可以把知識圖譜比喻成為計算機做的百科全書。人類很久以前就認識到了把知識收集,歸納,總結,去偽的重要性。所以明朝會有人編永樂大典,有人編大英百科全書,還有人利用利用互聯網的人多力量大編維基百科。當然我舉的這三個例子,還有很多別的百科全書,都是為人類寫的。而我們現在說的知識圖譜,是為計算機編的。

當然,為計算機編的百科全書,本身也需要人工智慧去編寫。就像明成祖組織了成千上萬的人去收集、歸納、總結、去偽而編寫出永樂大典,微軟也有一套複雜的人工智慧系統進行收集、歸納、總結、去偽來建造和維護微軟的知識圖譜。

在這裡,我可以給大家舉一個具象一點的例子。例如大家看過一部電影叫「港囧」。

在我們的知識圖譜里,就有一個節點,我們把這種節點叫Entity。在我們的知識圖譜里還有很多別的節點,譬如主演的演員「徐崢」,「趙薇」,再譬如香港的維多利亞港,這些都是我們的知識圖譜里的節點 – Entity。我們在知識圖譜裡面把它們連接起來,每一個鏈接代表一種關係。譬如徐崢是這個電影的導演和演員,趙薇是這個電影的演員,維多利亞港在這個電影中出現過。而所有的這些信息,都會以一種適於計算機使用的模式呈現。

如何使用知識圖譜?

在這裡,我想通過兩個例子來說明知識圖片的使用。首先是在搜索方面的應用。例如,用戶想知道蘋果和桔子的熱量哪個高。

如果是傳統的網頁搜索,我們要指望有這麼一個網頁來專門回答這個問題。然而在現實中,類似蘋果,桔子,熱量,這樣的辭彙在這個網頁里出現,然後我們將這個網頁找出,最後將搜索結果呈現給用戶。但是如果當我們的搜索引擎有了微軟知識圖譜這樣的百科全書呢?它就可以直接把蘋果桔子的熱量列出給到用戶。

知識圖譜在語義理解方面同樣起著重要的左右。如果沒有知識圖譜,人工智慧與人類的語言交互,就只能模擬聊天。而一旦加入了知識圖譜,就可以幫助人類解決具體問題。例如用戶使用自然語言詢問人工智慧的旅行助理相關信息,由於知識圖譜裡面包含城市和景點的信息,人工智慧就能很快解決用戶需求。

企業知識圖譜的應用

當然,除了基於公共知識建立的知識圖譜之外。還有很多屬於企業自己,非公共的知識。對一個企業來說,這些知識當然也很重要。在這裡,我們引入一個辭彙「桶倉壁壘」。

什麼是筒倉壁壘呢?筒倉就是很多工廠農場的倉庫。一般工廠農場不會弄一個超大的倉庫裝所有東西,而是建很多統一規格的筒倉。這樣便於管理,維修。筒倉對儲存貨物是個好事。但是數據筒倉,就不是好事了。一個企業會有很多部門,很多數據來源,這些數據很容易就分成很多獨立的單位,互相之間很難溝通。就算有人想把它們合在一起,由於數據收集的方式,各部門之間的不統一,這種數據合成並不是一件容易的事情。而企業知識圖譜就是用編寫知識圖譜上的技術積累去幫助一個企業建立它自己內部的知識圖譜,打破這些數據筒倉,同時把這些數據轉化成圖譜的形式。這樣更利於一個企業做它自己想要的敏捷開發和使用,例如建立一個以企業知識為基礎的人工智慧助理,或者其它深度應用。

例如在歐洲的一個大型能源公司內部,傳統情況下,客戶或者內部員工,都會通過他的網站進行一系列點擊去做他們想做的事情。但是當我們把它的數據建成一個知識圖譜後,就可以更好的運用這些數據了。例如當一個員工希望找到這樣的數據:「最近3個月用電超過X度並且沒有收到我們發的關於節能裝置和電器廣告的客戶「。除非開發網站時就預判到了會有人提這樣的問題,一般很難用傳統的網站回答這樣靈活的問題。但是這種問題用知識圖譜就非常容易回答。而有了這樣的工具,這個員工就能夠更加高效的進行工作。

人工智慧越發展,應用越廣泛,知識圖譜的核心基礎地位就越凸顯。用AI創建AI用的知識圖譜,就是我們從目前的知其然,不斷邁向知其所以然的一個必經之路。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 微軟蘇州 的精彩文章:

TAG:微軟蘇州 |