當前位置:
首頁 > 最新 > AI技術專利研究系列:SoundHound,智能語音巨頭賽道上的奔跑者

AI技術專利研究系列:SoundHound,智能語音巨頭賽道上的奔跑者

「專利資產是商業、技術和法律的集合,創業公司必須理解並熟悉專利的遊戲規則,也應該制定適合自己的專利戰略。由於創業公司常常面臨著特別高的專利風險,因此在關注市場發展和競爭格局的同時,更需要在有限的預算內挖掘有價值的專利組合,優化自身的專利資產配置。」

SoundHound,智能語音巨頭賽道上的奔跑者

by

缸砸司馬光


智能語音領域的賽道

智能語音技術作為人工智慧的數據入口之一,具有較高的技術壁壘,所涉及的學科包括語言學、聲學、信號處理、雲計算技術等,在全球的智能語音市場中基本形成巨頭公司壟斷的競爭格局,比如Google、Apple、Microsoft、IBM、Amazon、Nuance、及中國的科大訊飛等巨頭公司,這些公司佔據了絕大部分的市場份額。

其中,一直以來專註語音識別技術(Automatic Speech Recognition,簡稱ASR)的Nuance自2005年與ScanSoft公司合併後,成為全球最大的智能語音廠商,憑藉自身先進的語音識別、自然語言理解技術以及成熟的語音解決方案,已經成為這個賽道上的領跑者。Nuance也是在這一領域擁有專利數量最多的公司。

近些年,隨著半導體晶元技術及無線網路技術的快速發展,以及基於人工智慧的應用在多個領域的突破,語音識別領域吸引了一些創業者進入,這些創業者從語音領域的垂直市場出發,競相進入了這條巨頭公司的賽道。


語音垂直領域的參賽者:SoundHound

本期我們介紹一家語音垂直領域的參賽者,即總部位於美國加州Santa Clara的創業公司,SoundHound。

相信不少人有過這種困惑:耳邊縈繞著一種熟悉的旋律,就是想不來歌曲的名字;或者突然想找一首歌,但不知道演唱者,僅憑隻言片語的歌詞在網路上檢索,如果運氣好的話,也能夠得到熱心網友的幫助,比如,

SoundHound就是為了解決這一用戶需求應運而生的。其創始人兼CEO是Keyvan Mohajer,他在斯坦福電氣工程學院期間的研究方向就是語音識別技術,並於2005年創辦了 SoundHound,專註音樂識別這一垂直領域,致力研發使人們能夠通過播放或哼唱找到歌曲名稱的技術。這雖然看起來是一個冷門的應用,但的確迎合了一部分音樂愛好者的訴求。

美國的創業者通常有著較強的知識產權意識,技術在不能作為技術秘密保護的情況下,專利保護幾乎是創業者不二的選擇:

在公司成立的前幾年,儘管Keyvan Mohajer把他們早期研發的蟄伏期稱為「矽谷隱藏得最深的秘密」,但他們還是圍繞著音樂識別技術積極地在全球申請專利。從這些專利中可以看出Keyvan Mohajer作為主要發明人參與了早期的研發,這些公開的專利包括,

音樂檢索(US7698254B2/US8805686B2)

高音識別(US20080167862A1)

顫音檢測(US8494842B2)

噪音消除(US8452586B2)

音樂列表處理(US8856148B1)等;

專利分布的市場包括美國、加拿大、中國、歐洲、香港、印度、日本、韓國等國家和地區。

厚積薄發的技術優勢:「speech-to-meaning」技術組合

基於上述技術,SoundHound於2009年前後推出了可用於iPhone上的應用程序:SoundHound?,該應用程序可以使用聲音識別技術查找有關歌曲的信息。也就是說,它不僅可以根據歌曲的原聲來識別曲目,還可以根據用戶哼唱來辨識,並且具有很高的精準度,這款APP很快受到了音樂愛好者的青睞。

2012年9月,SoundHound宣布他們已經擁有超過1億名用戶。根據iTunes的統計,截至2017年6月,SoundHound的音樂應用下載量已超過3億次。

良好的用戶反饋得益於SoundHound厚積薄發的技術優勢:

大多語音識別方案使用語音到文本(speech-to-text),然後處理文本以表達含義的技術,這使得在語音處理中引入了一個額外的轉錄步驟,這一過程會導致錯誤增加並且延遲,而錯誤和延遲非常影響用戶體驗。

SoundHound另闢蹊徑地採用 「speech-to-meaning」技術組合,該技術組合採用非文本檢索系統來檢索預先存儲的音樂,能夠理解用戶輸入的深層含義。相較於例如Apple的Siri或Amazon的Alexa這類系統,SoundHound的技術更能夠處理複雜的語法。

圍繞這一核心技術,SoundHound在全球布局了多個專利組合,已公開的專利有34件。

在資本的追逐下快速奔跑

投資人敏銳的目光幾乎不會放棄任何一個有潛力的創業者。SoundHound的成長似乎也是一路由投資人伴隨。SoundHound先後在2008年和2009年完成了兩輪總計一千萬多美元的融資;他們最近的一筆融資發生在2017年初,投資額度高達7500萬美元,該筆資金由圖形晶元廠商巨頭Nvidia領投,三星催化劑基金(Samsung Catalyst Fund)等公司跟投。

充盈的運營資金使得SoundHound加快研發和商業拓展的速度,SoundHound不再局限於在音樂搜索及歌曲識別等方面創造更好的用戶體驗,而是基於其掌握的「speech-to-meaning」技術組合,向語音識別平台和語音虛擬助理等方向進軍,為這一技術拓展更為廣闊的應用空間。

2015年底,SoundHound發布了基於雲引擎的語音識別平台Houndify及其相應App Hound,該平台為開發者提供了上百個自然語言處理的應用領域,包括本地搜索、天氣預測、財務信息和旅遊協助,也包括車聯網和智能駕駛等,而這些領域正是語音識別巨頭公司的賽道。

創業路上不可預知的專利風險

市場的認可及投資人的熱捧並不能保障創業者在賽道上暢通無阻地奔跑,尤其是在巨頭們的賽場上。因為巨頭們在競賽中總是喜歡相互推搡和爭吵,而且巨頭們豐厚的收入和高額的利潤也總是吸引專利NPE(Non-Practicing Entities,非執業實體)的關注,作為創業者總是不可避免地在巨頭之間的博弈中被殃及。

從2012年8月開始,一家設立於美國德州的專利運營公司Blue Spike, LLC(下稱Blue Spike),以其持有的「signal abstracting」技術的相關專利,先後向美國德州東區聯邦地院提起總計超過70起的專利侵權訴訟:

Blue Spike持有的4項系爭專利(US7346472B1、US7660700B2、US7949494B2與US8214175B2)的名稱均為「Method and device for monitoring and analyzing signals」。

Blue Spike在這些訴狀指出,其signal abstracting技術可用於分類、識別、監控與比對分析數字信號,應用場景包括圖像、聲音、影像、多媒體信息、生物辨識信息等領域。

在Blue Spike獵獲的被告中,有像Google、Adobe Systems、Facebook、Sage Software等這樣的巨頭,也包括像SoundHound這樣的創業公司。

無獨有偶,在同為專利運營公司的Global Interactive Media,Inc.(簡稱GIM)發起的一系列訴訟中(訴訟對象包括Hubbard, ReelzChannel, TuneIn, Scripps Interactive, Viggle and TimeWarner Cable等公司),SoundHound也是訴訟目標之一。而在此之前,SoundHound在音樂識別領域的直接競爭對手Shazam公司已經與GIM達成了協議。

這些當然不是偶然的事件,在一個創業公司快速發展的過程中,如果產品暢銷且財務健康或者正在融資或快速擴充的關鍵時機,當然是NPE或者直接競爭對手的訴訟目標。實際上從2011年開始,SoundHound就不斷地被拖入專利侵權的訴訟中。

巨頭公司有健全的應急機制和豐富的應對經驗,在面對風險時能夠從容不迫地調用各種資源,可以遊刃有餘地去化解各種障礙。但對創業者而言,尤其是在公司的初期階段,有限的時間和精力更需要兼顧研發和市場,創業者在面對突如其來的專利風險時,很難顯得從容和淡定,但又不得不應對。

就像SoundHound的知識產權負責人Jonah Probell所說的:「Not playing the game is not an option」。


重新認識專利遊戲

重視專利在市場競爭中的作用

Jonah Probell是一名具有研發背景和專利組合管理經驗的美國專利代理人,他於2016年2月入職SoundHound,在此之前,Jonah Probell先後在七家公司從事研發,市場營銷和專利組合管理工作,在其中一家晶元公司Arteris期間,Jonah Probell曾起草過大約45個專利家族,其中大部分專利組合以5000萬美元價格出售。

Jonah Probell一直研究創業公司的專利戰略和專利組合管理,他認為專利資產是商業,技術和法律的集合,創業公司必須理解並熟悉專利的遊戲規則,也應該制定適合自己的專利戰略。

由於創業公司常常面臨著特別高的專利風險,因此,在關注市場發展和競爭格局的同時,更需要在有限的預算內挖掘有價值的專利組合,優化自身的專利資產配置。

Jonah Probell在他的《Patenting for the Small Company》一書中詳細地闡述了上述觀點,並認為創業公司的管理者需要緊密地跟蹤內部研發,要從忙碌的研發中挖掘真正有價值的創新,並應該高效地完成創新成果的權利化。Jonah Probell還認為保持與外部法律顧問的溝通頻率也十分重要。

目前,SoundHound正在組建自己的專利團隊,他們正在招募更多經驗的專利律師加入,希望在知識產權,數據開源,和用戶隱私等方面積累更多的專業經驗,以及挖掘更有價值的專利組合。

開發專利組合併優化專利資產的配置

自2012年始,SoundHound隨著商業拓展或受專利糾紛的影響,專利的申請數量明顯增加,申請專利的技術點也呈現了多樣化的特點,比如照相時識別聲音以將聲音和圖像關聯、用於廣告的語音識別技術、藉助語音識別向旅行者提供實時援助、無人駕駛中的自然語言處理、通過語音建立用戶檔案等偏嚮應用場景的專利。

在2016年的下半年,SoundHound回溯了其在語音識別中的核心優勢,特別重新梳理了其一直以來宣稱的「speech-to-meaning」技術組合中的創新點,相繼提出了例如連續音頻匹配,自然語言庫的擴展,以及雙模語音識別等一些更為底層技術的發明專利。在這些專利中,文本的撰寫風格也發生了微妙的變化,尤其是對權利要求中技術特徵的描述,也一改早期的對技術方案的直白描述的方式,呈現了語言更加精準、用語更加概括的特點,說明企業更加重視專利文本撰寫質量。


和巨頭公司結隊奔跑

創業公司和巨頭公司們在同一個賽道上競爭,在保證快速奔跑的同時還能保持公司成長的獨立性實屬不易。

SoundHound在這一領域中最直接的競爭對手Shazam公司已於2017年12月賣身Apple。2015年,SoundHound與韓國現代汽車(Hyundai Motor)展開合作,共同研發 「Intelligent PersonalAgent」 智能語音識別系統。

隨著Nvidia與Samsung兩家巨頭對SoundHound的戰略投資,使得SoundHound找到了一種與巨頭們結隊而行的發展模式:一邊將自己的語音識別軟體與Samsung的硬體產品進行整合布局物聯網(IoT)業務;一邊將其智能語音識別系統與Nvidia的車載信息娛樂系統相結合,趁著Nvidia的東風涉獵自動駕駛領域。

十幾年的成長,SoundHound逐漸成熟,並在這個巨頭公司競爭的賽場上找到了一條屬於自己的跑道。

* 以上文字僅為促進討論和交流,不構成法律意見或諮詢建議。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 TiPLab 的精彩文章:

AI技術專利研究系列:Butterfly Network,醫療影像的明星公司

TAG:TiPLab |