當前位置:
首頁 > 最新 > 小數據學習對 AI 究竟有著怎樣的影響?

小數據學習對 AI 究竟有著怎樣的影響?

近幾年來,得益於大數據的積累、計算能力的提升,深度學習從學術到工程領域均取得了非常顯著的發展與突破,尤其是諸如圖像識別、語音識別等實際場景應用。但是,依賴于海量的訓練數據、靈活的模型、足夠的運算能力以及足以對抗維度災難的先驗經驗,從很大程度上來講妨礙了深度學習技術更為廣泛的運用。為此,在全球範圍內,眾多人工智慧領域的學術大師及業界專家上下求索,也由此催生了小數據學習(Learning from limited information),通過更少的數據以及更確定的方法讓 AI 學習更加高效。

然而什麼是小數據?機器怎樣從小數據中學習?小數據學習將從哪些方面改變人工智慧的研究與應用?在即將於 7 月 22 - 23 日舉行的中國人工智慧大會(CCAI 2017)上,特別邀請到日本理化學研究所先進智能研究中心主任 Masashi Sugiyama,現場為所有參會者一解小數據學習之惑,並分享其團隊在監督弱化分類方面的最新研究進展在會前,CSDN 記者特別採訪了 Masashi Sugiyama 教授,接下來,讓我們一起先睹為快。

Masashi Sugiyama 是日本理化學研究所先進智能項目組主任( Director of RIKEN Advanced Intelligence Project)。RIKEN 成立於 1917 年,是日本最大的綜合研究機構,其中,由 Masashi Sugiyama 領導的先進智能項目組成立於 2016 年,主要著眼於研發下一代 AI 技術,如小數據學習、因果推理(Causal inference)、不確定性學習(Learning with uncertainty)以及假設檢驗等,同時,還有加速醫學、材料科學、製造業的科研進程,解決基礎設施管理、社會抗災能力、老年醫療保健等社會問題。而 Masashi Sugiyama 教授本人的研究領域則包括機器學習的理論和演算法(如協變數適應、密度比預估和強化學習等),及其在實際問題中的應用。

CSDN:什麼是小數據學習?為什麼要使用小數據學習?如何實現?

Masashi Sugiyama:雖然現在大數據學習仍是主流,但在很多應用領域,收集到足夠機器用來學習的龐大的數據是非常昂貴的。在這種情況下,使用小數據進行學習是一個理想的解決方式。但也有它的弊端,因為當進行小數據學習時,我們需要目標領域中強大的先驗知識作為支撐,過多先驗知識的介入意味著犧牲掉機器學習的靈活性。所以使用有限信息進行學習的精髓在於,使用領域知識之外的相對便宜的數據進行學習。

CSDN:若小數據學習能夠成功,將對哪些 AI 領域造成改變,進而對哪些行業產生影響?

Masashi Sugiyama:利用小數據進行學習是大數據學習的母集,所以說它一方面可以解決大數據學習不能解決的問題,另一方面在大數據學習已經得以應用的領域也能有所發揮,因為使用小數據學習能夠在避免使用昂貴數據的同時達到更優的效果。

CSDN:您和您的團隊在小數據學習方面已經取得了哪些進展?

Masashi Sugiyama:多樣性對於小數據學習至關重要,因為對於不同的應用場景,收集數據的局限性是不同的。我們正在研發一種通用的演算法使其解決機器學習過程中的不同問題,例如將很多不同種類的未標註數據集進行分類、將標註與未標註數據進行分類、半監督學習中的分類問題、充分標註的數據的分類問題等。

CSDN:日本的科研機構更傾向於哪些 AI 技術及應用的研究?哪些 AI 應用在日本已經落地?

Masashi Sugiyama:日本的機器學習研究人員更多地關注基礎研究,當然,同時也會有一些人在科學及工程領域從事應用科學相關的研究工作。在基礎研究與應用之間存在很大的鴻溝,如何搭建鴻溝上的橋樑至關重要。所幸,這些建橋的工作在一些領域已經逐漸展開,例如對癌症及老年痴呆的研究、再生醫學、製造業、基礎設施管理以及抗災能力提升的研究等方面。

CSDN:您認為當前 AI 技術發展的瓶頸在那?並請展望 AI 未來的發展方向。

Masashi Sugiyama:私密性、安全性、以及倫理問題會成為人工智慧系統發展的瓶頸。在 AI 技術發展之外,如何分析及管理 AI 可能帶來的社會問題也是需要重視的方面。

CSDN:在本屆 CCAI 現場,您將帶來的演講主要關於哪些方面?希望觀眾從中收穫怎樣的啟發?

Masashi Sugiyama:我的演講題目是《弱監督學習的最新研究進展》,在演講中我將介紹我們對於弱監督學習下的分類問題的研究成果,包括將兩種類別的無標籤數據進行分類、將有標籤與無標籤數據進行分類、一個對於半監督分類問題的通用方法、以及對於有標籤數據的分類。最後,我將簡單介紹日本理化學研究所先進智能項目組(RIKEN AIP)。

關於 CCAI

中國人工智慧大會(CCAI),由中國人工智慧學會發起,目前已成功舉辦兩屆,是中國國內級別最高、規模最大的人工智慧大會。秉承前兩屆大會宗旨,由中國人工智慧學會、阿里巴巴集團 & 螞蟻金服主辦,CSDN、中國科學院自動化研究所承辦的第三屆中國人工智慧大會(CCAI 2017)將於 7 月 22-23 日在杭州召開。

作為中國國內高規格、規模空前的人工智慧大會,本次大會由中國科學院院士、中國人工智慧學會副理事長譚鐵牛,阿里巴巴技術委員會主席王堅,香港科技大學計算機系主任、AAAI Fellow 楊強,螞蟻金服副總裁、首席數據科學家漆遠,南京大學教授、AAAI Fellow 周志華共同甄選出在人工智慧領域本年度海內外最值得關注的學術與研發進展,匯聚了超過 40 位頂級人工智慧專家,帶來 9 場權威主題報告,以及「語言智能與應用論壇」、「智能金融論壇」、「人工智慧科學與藝術論壇」、「人工智慧青年論壇」4 大專題論壇,屆時將有超過 2000 位人工智慧專業人士參與。

目前,大會 8 折優惠門票正在火熱發售中,掃描火速搶票。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 搜狐新聞 的精彩文章:

最貴不過10萬 這4款SUV也受歡迎
拆遷方喜歡這樣做,您最常見卻沒有發現的「騙局」
離異再婚並不能讓你找到對的婚姻
他們或許不懂愛情,但他們更知道什麼是家

TAG:搜狐新聞 |

您可能感興趣

「大數據」究竟是什麼?
對於數據採集,我們是認真的——如何做好AI數據採集
有監督相似性學習:基於相似問題數據的對稱關係學習
對於大數據開發的學習,正確的學習路線是什麼?
中國有幾人進入NBA打球,他們的數據是怎樣?薪水又是怎麼樣?
那些NBA巨星也曾刻意刷數據,看看都有誰
如何根據位次選大學?教你最實用的一招,還給你最權威的數據!
YOU UP 丨哪一刻讓你真實地感到大數據的可怕?
蘋果大數據殺熟究竟是誰的鍋?
Facebook數據泄露、大數據殺熟,還有哪些AI危機在等著我們?
原子彈的存在究竟是好還是壞?看完這組數據就全明白了!
在這個連開源標註數據集都沒有的領域,AI該如何落地?
子彈也有保質期?這組數據讓你明白子彈的造價究竟是多少
實測數據話你知,一台好的DSP專用功放應該是怎樣?
AI時代的智能家居用戶數據屬於誰?BAIC給出這樣的答案
美國空軍究竟有多強大?這些數據一目了然,中國差距還很大
有了這個數據集,AI有望揪出變種勒索軟體
這些大數據,你敢看嗎?
從概念到應用:一文搞定數據科學和機器學習的最常見面試題
NBA巨星們生涯末期的數據都是怎樣的