當前位置:
首頁 > 新聞 > 【清華AI公開課】NLP的現狀、應用以及未來的發展機會

【清華AI公開課】NLP的現狀、應用以及未來的發展機會

【清華AI公開課】NLP的現狀、應用以及未來的發展機會

【新智元導讀】4月4日,清華大學《人工智慧前沿與產業趨勢》系列講座第三講,由百度七劍客之一雷鳴、清華大學計算機系教授朱小燕、昆仲資本創始&管理合伙人王鈞一起討論NLP的發展、落地和局限。

首先由清華大學海峽研究院大數據AI中心專家委員、百度七劍客之一、酷我音樂創始人雷鳴老師對音頻和NLP領域的技術和落地場景,做了一個綜合的介紹。

語音識別已經接近人類水平,還可以用於身份識別

雷鳴提到,目前的語音識別在噪音不大的情況下,基本已接近人類水平。在一些特定場合,甚至比人類更好。 在音頻識別、哼唱、音頻指紋方面有很多的應用場景。

音樂的識別僅僅通過歌曲的一小段,就能知道歌曲作者、版權歸屬等。而一些音樂軟體,甚至可以通過人們哼唱一段曲調,就能找出對應的歌曲。除了音樂識別,還可以直接創作音樂,偶爾也可以做到以假亂真。

身份識別也可以用到音頻,直接按照提示說幾個字,就可以識別出是否機主本人。雷鳴提到,視頻+音頻的組合將來會身份識別起到非常大的促進作用,相當於多了一部校驗,進一步降低錯誤率。

在檢測一段音頻是否為無損壓縮的場景中,人耳基本是很難分別出來的。但是通過分析這段音頻的頻譜圖,用計算機視覺就可以進行檢測。

語音合成雖然剛剛興起,也已經有了長足的進展。為此雷鳴舉了一個例子,今年315也保管改了利用語音合成技術撥打騷擾電話,不論是聲調還是上下文,當事人都很難發現對方根本不是一個人。

目前NLP應用的場景還包括了智能助理、智能客服系統、語言翻譯、專家系統、推薦系統等。


語音是一維信號,圖像是二維信號,語言是E的平方

清華大學計算機教授、博導朱小燕提到,語音是一維信號,圖像是二維信號。所以語音處理相比圖像處理更容易。但是同樣是處理自然信號,語言表達後就會產生不同的效果。

比如說Apple,會英語的知道說的是蘋果,如果不懂英語聽起來就不知所云,所以相比前兩者,語言的維度可以看做的E的平方。

在可用性上,朱小燕提出一個詞叫「糙快猛」。目前機器學習能夠把一維和二維處理的很好,比如日常翻譯。但機器目前還不能翻譯小說,因為涉及到語義。

針對深度學習的黑盒屬性以及強健性不足的問題,朱小燕指出其實很好解決,只要用在不需要解釋或者不怕攻擊的地方即可。落地應用需要考慮的問題,第一是場景,第二是產品,第三才是技術。沒有最好的技術,只有最適合的技術。


NLP領域的產業機會

昆仲資本創始&管理合伙人王鈞認為,找到好的應用場景很重要,比如人臉識別應用在抓壞人這個場景,並不需要特別高的精準度,也不需要可解釋,只要能夠抓住壞人就可以。

供給有限的情況下,能找到好的應用場景、好的商業模式,把這些有限的供給能夠在這個行業應用中創造出比較大的價值。

課程直播鏈接:深度學習與自然語言處理:評析與展望(清華場)

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

華為或銷售5G晶元,但只賣給蘋果?
為什麼黑洞是紅的?為什麼愛因斯坦又對了?答案是黑洞背後的超算

TAG:新智元 |