當前位置:
首頁 > 科技 > 麻省理工新型AI技術 融合了語音和物體識別技術

麻省理工新型AI技術 融合了語音和物體識別技術

本文由騰訊數碼獨家發布

麻省理工學院的研究人員已經創建了一個新的人工智慧程序,它不僅能夠同時識別圖像和語音中的物體,而且還能積極地將兩者結合起來,從而更有效地理解和利用兩者。這個人工智慧程序可以分析帶有音頻標題的圖像,然後把這兩個資源放在一起,然後找出哪個對象對應於標題的哪些部分。它在測試中通過突出顯示圖像區域和對象來演示這一點,而它們是由標題描述的。根據該項目的研究人員的說法,這比傳統的語音識別或圖像識別訓練更自然、更有機。從本質上講,人工智慧正在像人類一樣學習,這將使它更加靈活,從而在未來更有能力。

這個人工智慧程序實際上是一個以前的模型的擴展,它能夠將單詞和短語與圖像的主題集合相匹配,比如顏色和原型。該模型使用兩個卷積神經網路,分別處理語音輸入和圖像輸入,然後一個更高的層組合這些神經網路並構建關聯。研究人員向模型展示了正確和不正確的關聯,以幫助它學會識別或缺乏聯繫。

這個項目的意義是相當大的,而且是顯而易見的。這一發現不僅可以在未來的模型中實現更快的語音識別和圖像識別AI訓練,還將為基於卷積神經網路的人工智慧鋪平道路,這種神經網路不僅在結構上模仿人類的大腦,而且在學習方法上也是如此。理論上,這將打開通往諸如人工智慧與常識,知道它是不好開車的懸崖,或人工智慧識別和適當應對人類情感,如知道一個哭泣的孩子可以通過做或說一些安慰孩子變成破涕為笑。改進的基於人工的翻譯也是一種可能,因為人工智慧有可能在同一時間內,在相同的材料上學習單詞和其他語言的對等物,即使在沒有足夠的語言轉錄語言來進行傳統的語音識別或翻譯訓練時也是如此。

來源:androidheadlines

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 犀利懟數碼 的精彩文章:

三星已經開始研發可以理解用戶情緒的人工智慧技術
英特爾如何贏得人工智慧處理器的競爭

TAG:犀利懟數碼 |