當前位置:
首頁 > 新聞 > 谷歌強力推出數據集搜索!Dataset Search神器重磅來襲

谷歌強力推出數據集搜索!Dataset Search神器重磅來襲

新智元AI WORLD 2018世界人工智慧峰會

倒計時13

新智元將於9月20日在北京國家會議中心舉辦AI WORLD 2018世界人工智慧峰會,南京大學計算機系主任、人工智慧學院院長周志華教授屆時將親臨會場做《關於機器學習的一點思考》主題演講。周志華教授是AI領域會士「大滿貫」得主,AAAI 2019程序主席、IJCAI 2021程序主席,《機器學習》一書的作者。

活動行購票二維碼:

新智元報道

來源:blog.google

編輯:三石

【新智元導讀】繼Google學術搜索之後,谷歌又一神作——Dataset Search重磅來襲!

千呼萬喚始出來!Google Dataset Search騰空出世了!

還記得曾經的你,在做科研的時候,為了得到一份兒數據集,絞盡腦汁各種百度、各種google,但結果往往一無所獲。從今兒起,再也不用擔心這個問題了!

谷歌超級重磅神器來也:

Dataset Search——數據集搜索領跑者

數據,可以說是當今世界眾多科學家與工作人員賴以生存的一片沃土。而在網路中存在成千上萬個數據存儲庫,科研人員亦可以訪問及使用這些數據集。

為了方便科學家和數據相關研究、工作人員能夠輕鬆訪問這些數據,谷歌啟動了「數據集搜索(Dataset Search)」。

與谷歌Scholar工作方式類似,不論數據集是託管、發布在哪個網站、數字圖書館或個人網站,都可以輕鬆的查找與訪問。

為了創建數據集搜索,谷歌為數據集提供了一套指南,以便谷歌(和其他搜索引擎)能夠更好地理解其頁面的內容。

這套指南主要突出了數據集以下方面的信息:

數據集的創建者

數據集發布時間

數據集搜集方法

數據集使用條款

......

然後,谷歌收集並且鏈接這一信息,對不同版本的同一數據集做分析,並找到描述或討論數據集的出版物。

谷歌的方法基於一個開放標準(schema.org),任何發布數據的人都可以採用上述方式對他們的數據集做描述。

在這個新版本中,用戶可以找到有關環境和社會科學的大多數數據集的引用,以及來自其他學科的數據(包括政府數據和新聞機構提供的數據)。隨著越來越多的數據存儲庫使用schema.org標準來描述它們的數據集,用戶在數據集搜索中發現的數據集的多樣性和覆蓋範圍將繼續增加。

Dataset Search——搶先體驗!

數據集搜索支持多種語言,當然也包括中文。只需輸入你要查找的內容,這款神器便將幫助你在存儲庫提供者的站點上找到已發布的數據集。

例如,如果你想分析每天的天氣記錄,你可以在數據集搜索中嘗試輸入daily weather:

正如搜索結果所示,你可以看到來自NASA、NOAA的數據集,同時也是可以看到來自學術存儲庫的數據,例如哈佛的Dataverse和ICPSR。

正如NOAA的首席數據官Ed Kearns所說:「這種類型的搜索長期以來一直是科學界許多研究人員的夢想!」

但是谷歌方面也表示,像這樣的搜索工具只有在數據發布者願意提供的元數據的基礎上才能發揮作用。並呼籲廣大數據提供者能夠採用schema.org標準來描述數據。

心動不如行動,大家趕快動手去試試吧:

https://toolbox.google.com/datasetsearch

新智元AI WORLD 2018世界人工智慧峰會

倒計時13

門票已開售!

新智元將於9月20日在北京國家會議中心舉辦AI WORLD 2018世界人工智慧峰會,邀請機器學習教父、CMU教授 Tom Mitchell,邁克思·泰格馬克,周志華,陶大程,陳怡然等AI領袖一起關注機器智能與人類命運。

大會官網:

http://www.aiworld2018.com/

活動行購票鏈接:

http://www.huodongxing.com/event/6449053775000

活動行購票二維碼:

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

「超算較量」美國時隔六年重回榜首,中國超算如何前行
「馬化騰和錢穎一攜手啟動」清華-青騰未來科技學堂第二期開始報名!

TAG:新智元 |