當前位置:
首頁 > 最新 > 打字員要失業了!谷歌前工程師開發實時語音APP AI迎來又一大突破

打字員要失業了!谷歌前工程師開發實時語音APP AI迎來又一大突破

在2018年移動世界大會上擁有三層展台的數十億美元技術巨頭中,有一對企業家在談論人工智慧方面的突破,他們剛剛把一款名為Otter.ai的新應用程序在iOS和Android中推出。

當他們坐下來在Fira Barcelona 2號展廳后角的一個小會議室里談論時,Sam Liang將他的iPhone放在桌子上,並點擊了Otter應用程序中的記錄按鈕。作為Otter.ai背後公司Alexense的首席執行官,Liang開始講述了加州15人創業小公司如何採用不同的方法來理解音頻數據,不同於亞馬遜Alexa,谷歌助理和其他公司在語音識別上的努力。

在Liang發表講話時,Otter開始吐文,大概延遲了2-3秒。而且,由於Liang事先在應用程序中設置了會議,所以當他的隊友Seamus McAteer提出自己的評論時,軟體會自動識別,或者會因其他人的後續問題而中斷。

儘管Otter的自然語言處理方式並不完美,標點缺失,詞語被誤解,說話人有時被錯誤識別,但它已經非常接近了,特別是考慮到速度和應用程序是免費的。

「我們的技術完全不同。」 Liang在接受ZDNet採訪時說。 「我們稱之為"Ambient Voice Intelligence"(環境聲音智能),我們使用ambient這個詞來表示這是在後台工作......你的大腦只能記住10-20%的(會議)信息......所以我們認為我們可以幫助人們捕獲這些信息,然後快速搜索。」

搜索是最好的功能。錄製完成後,應用程序的機器學習會自動創建約10個關鍵字,以便用戶了解會議的內容。你可以馬上開始搜索全文。同樣有用的是,一旦你熟悉關鍵字,可以點擊播放按鈕來收聽發生的音頻部分。

該應用程序的下一個最佳功能是可以共享記錄的會議。所以,如果你有一個會議,而一個同事不能參加,你可以隨後向他們發送記錄和音頻,以便他們找到與之相關的東西。

如果你將谷歌帳戶連接到應用並導入聯繫人,那麼所有這些高級功能都是非常簡單的。因此,如果你的企業使用Google Apps,它可以非常順利地運行。跟谷歌的整合併不令人意外,因為Liang是谷歌前工程師。

McAteer從事移動和數據分析工作已有20多年。團隊的其他成員由前谷歌,Facebook,雅虎和Nuance員工以及麻省理工學院、斯坦福大學和其他頂尖科技計劃的博士和計算機科學家組成。

自2016年1月起,該團隊一直致力於研究Otter背後的技術。他們擁有在過去一年中授權給其他合作夥伴的API - 主要是在錄製完成後提供音頻文件的轉錄。 AISense利用所有的合作夥伴數據來調整和訓練演算法。

今年1月,他們宣布與快速增長的視頻會議服務公司Zoom簽署了一項許可合作夥伴關係,現在該公司提供了一個錄製視頻會議的選項——由AISense提供支持。

隨著推出實時錄音的免費應用程序,該公司正在進入下一個階段。它最終計劃推出其應用程序的高級版本,該版本將建立在免費版本的功能上。例如,免費版本將允許你搜索過去90天的會議。高級版本將進一步擴大。

「能夠記住,搜索和分享你的語音對話是合作的下一個前沿。」 Liang說,「Otter授權用戶使用AI進行日常對話,因此他們可以專註於所說的內容而忘記記筆記。」

可以在Otter.ai,Apple App Store和Google Play Store找到該應用程序。 iOS版本在這一點上更加精細一些,但都值得關注這款應用程序隨著時間的推移如何發展和提高。

IBM Watson提供實時的文本到語音服務,但它背靠超級計算機。因此,AISense使用應用程序和智能手機取得了令人印象深刻的成就,而且它可以說是2018年世界移動通信大會上宣布的最重要突破之一 ,儘管它一直以來十分低調。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 前瞻網 的精彩文章:

2018年全球「堵城」排行榜出爐:美國城市佔半壁江山 中國居然沒露臉

TAG:前瞻網 |