當前位置:
首頁 > 科技 > 靈隆科技首席科學家湯躍忠博士:人工智慧幫助傳統行業升級換代

靈隆科技首席科學家湯躍忠博士:人工智慧幫助傳統行業升級換代

1月17日,由IT耳朵主辦的IEIC·IT耳朵智能創新大會暨智能行業創新企業頒獎盛典在亞洲大酒店隆重開幕。大會主題是「萬物皆有AI」,各人工智慧領域菁英從多個角度探討了如何推動中國智能 產業的蓬勃發展。

靈隆科技首席科學家湯躍忠博士解釋了為什麼2017年以來智能音箱類產品特別火爆的原因。他把人工智慧的學習過程分為四步,信號拾取、信息認知、理解和決策、執行和反饋,這四個環節學習的比較好就可以是人工智慧,而音箱恰恰是集合了這幾個特點。從語音識別、語義理解,到搜索識別匹配的資源,再到最終執行播放恰好是一個完整的過程。雖然現在中國和美國智能家居大的環境不台一樣,但是都有智能家居入口的市場需求,所以才會有人工智慧音箱空前火爆的情況發生。

以下為湯躍忠演講實錄:

這一次人工智慧的高潮和以前不同,當時90年代經歷過人工智慧的高潮和低潮,經歷過2000年左右語音識別的高潮和低潮,這一次高潮和以往最大的不同是什麼?這次高潮是人工智慧和產業結合最緊密的一次。那是各行各業都在人工智慧當中,都在運用人工智慧,而且各種提出的軟硬體條件和網路,以前在90年代、2000年左右是不可想像的,所以我很看好這一次人工智慧高潮會帶給我們的一些進步。

因為我們是做智能音箱的,而且大家知道目前智能音箱比較火,但是很多人可能不太清楚智能音箱,為什麼加上智能?智能在哪裡?今天的演講主要是介紹這一塊的。

大家現在都在說PC時代到移動時代和AI時代來臨,這一塊過一下就完了。AI時代剛剛說了智能音箱,大家第一個認識上是說Alexa,亞馬遜也沒想到Alexa會成為爆款,成為爆款有偶然和必然性原因在裡頭,形成了國際國內智能大爆發。國際上美國2016年大爆發,國內從去年2017年開始爆發起來。最近參加工信部組織的制定人工智慧產品的標準,其中第一個選定的人工智慧產品就是智能音箱,說明從上到下都很認可智能音箱。


智能音箱智能在哪?

回到這次的主題,什麼是智能音箱?智能在哪裡?那就要回到最初的什麼是人工智慧?其實人工智慧就是模仿。我們來把人的整個過程,可以把它分解成為四個環節,信號拾取、信息認知、理解和決策、執行和反饋,這四個環節模擬比較好都可以是人工智慧。

信號拾取,聽聲音、攝像頭、看拍圖像、麥克風聽聲音這是比較好的,還有一些感知幻覺做得不好的,比如說嗅覺、觸覺還有很大的空間需要提升。信息認知,大家都知道語音識別、圖像識別,包括物體識別,有很多的工作要做。理解和決策,其實前邊提到的Alpha Go,Alpha Go的時候應該主要是這個環節,做一些理解和決策性的工作。

最近Alpha Go比較火熱,其實在大概20年前在IBM的時候,IBM當時做的是深藍下國際象棋,那個應該是Alpha Go的鼻祖,我們當時是他們那個小組的人,我們在一起交流也是做類似的領域。然後是執行和反饋,剛才嚴博士舉的波士頓動力的機器人和機器狗怎麼控制和怎麼翻閱障礙,包括剛才說的自動駕駛都是很多是執行和反饋的領域。

為什麼說智能音箱是人工智慧比較典型的產品?因為在這四個環節裡面智能音箱都有所體現。所以它是集大成的產品,比如說在信號拾取,智能音箱目前用了麥克風貞烈,它是軟硬體綜合的解決方案,它要能夠感知原廠的聲音,能夠去除噪音的影響。信息認知這裡面應用了語音識別、喚醒、聲紋識別。理解和決策用到了自然語言理解、對話、個性化推薦。執行和反饋用到了語音合成,如何有情感的聲音,帶有個性化的聲音是我們現在在研究的範圍。智能電聲,研究怎麼樣出的聲音能夠自動根據周圍房間的布局、房間的大小、房間別的家居物質不同自動的進行適應發出更好的效果,其實這都是屬於執行和反饋環節。


AI演算法的三大流派

前面說到了很多的AI演算法,可以把它分成三大流派:經驗主義、連接主義、符號主義。經驗主義在機器學習、統計主義比較多。連接主義大家很熟悉了,神經網路,深度學習。符號主義是邏輯、知識、知識圖譜。其實這些方法沒有好壞之分,它們各有特色,在我們自己的智能音箱裡面,比如說在我們語義理解的環節,這三個方法全部都用了,同時在用,其實沒有什麼好壞之分。

除了剛才前面說到的四個環節以外,其實還要提一些別的智能。比如說安全智能,最近國家也在提要注重互聯網產品的安全,其實智能音箱作為互聯網產品它也是有安全的問題,而且現在我們也碰到了。所以說我們有專門的安全小組,每天都在檢查我們的音箱安全是否會被黑客攻破。比如說安全涉及到幾個方面,設備和網路的安全,數據加密,我們的手機和音箱之間,音箱和網路雲之間,甚至音箱和設備之間都有數據的加密。數據加密,智能音箱還是智能家居的入口,現在它有很多的不同的應用,對安全的要求是不同的,如果用智能音箱來購物涉及到支付對安全是最高的,如果只是拿來控制一個電視,安全性的要求不高,如果是來控制大門呢?它的要求就比較高了。所以說,這個時候我們要設定不同的安全等級,然後給予不同的測定。剛才說了音箱不是一個獨立的產品,它是智能家居或者是生態的部分和入口。

以Alexa為例,現在應該是有8萬多種應用,在它的應用商店裡頭可以供大家使用,有遊戲、娛樂、信息查詢。通過音箱來完成,和以往根據手機來完成給了用戶不同的體驗,給用戶新的體驗以後,讓用戶可以很完美的達到自己的要求,這是給我們提出了新的要求。

另外賦能,有很多的應用服務商能夠提供大家很多服務,但是他的能力是有缺陷的。比如說天氣預報,可以提供很多的信息給你,但是如何查詢天氣預報?需要自然語言理解的能力和IOP的能力,這時候我們給他賦能能力。

智能家居入口,現在有各種各樣的智能家居平台,當然中國和美國智能家居大的環境是不一樣的,各有特色,但是都有智能家居入口的需要。所以目前從我們的試驗來說,用戶的應用越來越多,對這個需求越來越強烈。

隱私保護,隱私保護的問題,其實以前不太重視,現在有很重要的一個問題。我們通過智能音箱可以查詢很多信息,比如說銀行的賬號,我說銀行里剩多少錢,這個時候錢數是通過銀行的系統傳到我的音箱。在這過程當中,銀行知道你的餘額,音箱播放出來也沒問題,但是在中間過程當中,我們是中間的傳遞者,這個時候對我們來說信息是不應該讓我知道的。如何能給用戶、給銀行保密?把信息保證它的安全?這是我們現在正在實現的一個方面。這些因素都應該考慮進來,讓信息是透明,對於中間環節是不透明,不可知的。

開發者友好,這是我們生態要完成非常重要的一點,就是說要吸引越來越多的開發者,尤其是那些個人開發者,然後讓它形成一個完整的生態。開發者越多,生態越完整,整個行業才能欣欣向榮。

這裡面就是我們自己的一個開放平台的大概介紹,這兒不用詳細的介紹。這裡面包括剛才前面提到的安全管理、賦能、開發者界面這些都有了,現在我們已經大概有700多個個人開發者在裡面開發。


智能的未來

最後,我介紹一下下一代(產品)和思考。現在智能音箱大概的形式已經知道了,外表上跟傳統的差不多。下一代智能音箱會是什麼樣的?下面列了一張圖,今年剛剛在CES合作推出的一款產品,我們認為是下一代的智能音箱。首先是帶了屏幕,會支撐新的應用,比如說視頻通話、視頻點播,而且會用到新的技術,比如說人臉識別和AR、VR,現在也在上面運行,然後它會有一些新的體驗。既然帶了屏,也就意味著音頻和視頻同時支持,這時候給用戶帶來新的體驗同時,也給我們帶來了新的挑眼。如何在視頻和音頻同時支撐的情況下,能夠讓用戶得到無縫的體驗。

所以說,我們覺得未來的展望是什麼?智能音箱行業,第一是開放平台的發展,開放平台是智能音箱生態的一部分,開放平台是搭建整個智能生態,所以說開放平台的發展是未來肯定要做重點發展的一個事情。

還有是用戶體驗,剛剛前面提到了,尤其是帶屏,帶了有視頻交互以後,怎麼樣視頻和音頻之間能夠完美的結合在一起,這其實給我們提出了很大的考驗。最近和大學和一些企業都在合作,一起來做用戶體驗。以及多種技術的融合,大家知道生物識別現在用的比較多,聲紋識別,人臉識別都在用,如何把這兩個結合起來?而且結合起來以後可能是誰的權重更大,在於不同的環境下面權重是不一樣的,這融合起來也是我們要研究的一個話題。然後是個性化服務,大家都知道現在用戶的需求越來越高,都有個性化的需求,尤其是今年要開始嘗試一些收費的服務。

如果沒有個性化用戶是不買賬的,剛剛前面也提到的個性化服務就需要用戶的畫像,對AI的要求也會越來越高。低成本的解決方案,我們和AR、VR不一樣是智能硬體的領域,所以就意味著有成本的問題。用戶當然是希望越便宜越好,如果保證在低成本下實現方案也是目前我們的挑戰。最後是幫助傳統行業的升級換代,這也是我們現在正在做的。

舉兩個現在正在做的例子。第一是幫助了傳統的音箱行業,像現在已經做的和索尼合作,他們是做傳統音箱的,把他們的傳播音箱改造成智能音箱,這是一個例子。第二最近和康佳電視合作,現在很多的電視用智能電視,用過的人都有體會,查幾千上萬個台很困難就是用搖控器,我們的音箱和他們合作起來用語音迅速查找內容,這是強需求。所以說通過這個我們的合作能幫助傳統的行業、傳統的產品提高用戶的體驗,這也是未來我們會做的一些事情。

iterduo.qiniudn.com/wp-content/themes/yunce/images/weixin-code.jpg" />

微信掃碼關注IT耳朵


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 IT耳朵 的精彩文章:

跨領域融合 或許是人工智慧帶來的最大機遇

TAG:IT耳朵 |