當前位置:
首頁 > 最新 > AI技術專利研究系列:NetBase,自然語言處理領域的資深玩家

AI技術專利研究系列:NetBase,自然語言處理領域的資深玩家

AI領域的專利在維權中通常會遭受專利適格性或創造性的挑戰,在專利權人抵禦了確權階段的圍攻之後,又常面臨雖專利權有效卻不能維權的尷尬,其中相當一部分原因是,在專利的撰寫階段未能在說明書中清楚定義功能術語或充分解釋技術特徵,導致法院無法清晰地劃定權利要求的保護範圍而維權失敗。

NetBase,社交媒體分析領域的領導者

by

TiPLab砸光司馬缸

對企業而言,及時獲取客戶滿意度(Consumer Satisfaction)對調整運營策略是相當重要的。在追蹤和調查客戶滿意度的手段中,傳統的做法例如電話訪談,通過街訪或電子郵件等形式徵集調查問卷等形式。

隨著互聯網信息和移動通信技術的發展,更多的消費者已經習慣使用在線工具(比如FaceBook,Twitter,Yelp,TripAdvisor,微博,微信、大眾點評等社交平台)來表達他們對各種產品和服務的看法。因而,利用文本分析工具追蹤客戶滿意度的技術應運而生,比如社交媒體分析技術,該類技術的核心是自然語言處理(NLP)。


自然語言處理領域的專家:NetBase

本期我們講一家利用自然語言處理技術幫助企業客戶實時發布、指導、分析、跟蹤企業/產品信息的公司:NetBase,這是一家位於美國加州Santa Clara的自然語言處理技術開發商。該公司於2004年由Ariba(現為SAP Ariba)公司的兩名工程師Jonathan Spier和Michael Osofsky創立,早期名為Accelovation,於2008年更名為現在的NetBase。

NetBase利用社交分析技術,協助市場研究人員及品牌經理分析比較消費者的愛好,了解產品在網路上的品牌價值,並發掘消費者對產品喜好背後真正的原因,進而幫助他們的客戶在數字營銷、公共關係、品牌管理、客戶服務、產品研發等方面獲得提升。

NetBase最近的一輪(E輪)融資發生在2015年初,由Spring Lake Equity Partners、ORIX Ventures等投資機構領投。

NetBase的融資歷史

大數據給NLP技術的發展提供了肥沃的土壤

文本自然語言處理是人工智慧的重要方向,是繼圖像識別處理和語音處理技術(感知技術)突破之後的一個令人期待的關涉認知技術的核心環節。

在今天發達的社交網路產生了海量的文本數據,這些大數據文本給自然語言處理提供了肥沃的土壤和應用領域,包括智能搜索,情感分析,數據挖掘,問答系統和智能助理等。NetBase更早地探索了這些領域,尤其在智能搜索和情感分析方面進行了多年的研發。


NetBase的核心專利家族及產品

NetBase在自然語言處理中有一個核心的專利家族,即以專利US8046348B1(Method and apparatus for concept-based searching of natural language discourse)為代表的包括6項發明的專利組合,專利US8046348B1於2006年5月29日提交申請,在2011年10月25日獲得授權,發明人之一正是NetBase的聯合創始人Michael Osofsky,該專利披露的是 「concept-based」搜索技術,旨在解決如何在檢索中獲得更為精準的搜索結果問題。

基於上述技術和應用場景,NetBase於2011年3月發布了一款名為NetBase Insight Workbench的產品,該產品用於分析社交媒體和其他網頁內容,為企業的市場研究人員和社交營銷人員提供圖表分析和研究。NetBase在其專利US9390525B1(Graphical representation of frame instances)、專利US8935152B1(Method and apparatus for frame-based analysis of search results)以及專利US9047285B1(Method and apparatus for frame-based search)中披露了該產品中涉及的部分技術。

NetBase Insight Workbench儀錶板

其中,專利US8935152B1的第一發明人李維博士是Simon Fraser University的計算語言學博士,曾在Netbase任首席科學家,在Netbase期間,負責設計開發新一代搜索引擎和輿情挖掘系統。2017年3月,李維博士任京東矽谷研究院(jd-silicon valley research center)主任研究員, 領導 Y 事業部矽谷 NLP 團隊,研發自然語言深度解析(deep parsing)平台及其 NLP 應用,涉及大數據情報和輿情挖掘,以及電商智慧供應鏈的應用等方面。

在NetBase的多項核心專利中,還包括例如為旨在通過基於網路用戶的陳述來分析用戶的情緒表達以獲得該用戶對某個品牌的認知的專利US8949263B1(Methods and apparatus for sentiment analysis);以及旨在通過網路用戶在不同時間段內的表達來創建語料庫並進行消費者意見分析的專利US9135243B1(Methods and apparatus for identification and analysis of temporally differing corpora)等。這些專利中公開的技術在NetBase的產品NetBase Pro、NetBase Enterprise中得以體現。


演算法類專利特點及文本撰寫探討

作為本AI領域隱形冠軍系列研究目的,討論演算法類專利文件撰寫也是議題之一,本期我們結合NetBase的專利討論一下演算法專利文件尤其是說明書撰寫中的一個問題:

我們知道,一項發明要想獲得專利保護必須清楚的描述技術方案以及劃定其要求保護的範圍,而在現實中,當所述的發明創造涉及計算機演算法或程序時,描述一個邊界清晰的保護範圍是不容易的,這是因為,該領域專利的權利要求中普遍採用功能性限定的手法描述技術特徵,即Functional Claiming的描述方式。

這是由演算法專利的特點決定的,在撰寫專利文件時,專利律師並不能用計算機程序代碼描述一項發明,演算法專利的創新在於實現其思思和邏輯過程,而這一過程在具體的實施中通常是抽象且不可見的,因此專利代理人或專利律師很多情況下不得不採用功能加手段(means plus function claim)的語言和術語描述主張保護的技術。

另外,在專利申請文件中,一項發明的權利要求應該清楚、簡明地記載主張保護的技術方案,其體現了對要求保護的發明的高度概括,由於文字的高度概括,在理解或解釋其含義時經常會出現超出或不同於專利文件中技術方案的內容。

因此,在確定專利的權利要求保護範圍時,首先需要對權利要求中高度概括的文字進行解讀,也就是對權利要求中描述的內容進行理解。再考慮到文字在不同語境下可能有不同的含義,對不同含義的理解導致對權利要求保護範圍的不同。

以上這些原因,都需要專利說明書能夠給每項權利要求一個統一且充分的解釋,對每一個功能模塊或步驟給予清楚無歧義的定義,進而對專利律師的撰寫經驗和水平提出了相當高的要求。


專利文件中的術語定義直接影響專利維權

筆者認為,之所以在演算法相關的專利中普遍採用功能性描述,一則是因為採用物理結構的描述方式並不能體現這類專利的創新,再則是因為計算機軟體或演算法的主要特點是其邏輯或功能與實現該功能的具體硬體是分開的,因為軟體開發人員在編寫這些程序的代碼時,通常不會也並不考慮計算機的硬體細節,相應的,對一個具有計算機編程能力的人員而言,實現一個程序或演算法的功能也並不必然採用相同的編程語言,編程方法和代碼。

另外,還有一個不容忽視的原因,就書面語言或術語而言,在演算法創新的計算機領域中,用自然語言描述一個演算法或軟體程序時,很難像機械領域、者化工或醫藥領域那樣採用標準辭彙或用語,也就是說,對演算法或者計算機程序的創新而言,大部分情況下並無標準可循。

由於專利說明書對權利要求具有解釋作用,即,在法官劃定一個演算法或軟體專利的保護範圍是往往求助於專利說明書中的描述和舉例,因此在說明書中對權利要求中採用的術語或描述進行充分的解釋和必要的說明就變得十分重要。例如在NetBase專利US8046348B1的文本中,針對「concept-based」的術語定義,對自然語言話語單元進行分類的過程,執行句子分類的示例性偽碼程序,概念特徵資料庫,語義單元的示例結構,從量詞類型到基值映射過程的示例以及各種應用示例做了充分的解釋和說明。

專利US8046348B1的說明書截圖

上述維權失敗的案例中無一不是存在權利要求中採用的術語得不到說明書充分解釋和說明的情況,這個問題幾乎已成為被訴侵權一方防禦的首選策略。成功案例比如華為訴三星案,雙方當事人爭議焦點之一就是在對專利CN101763270B權利要求中「組件」及「容器」這些術語的理解,給力的說明書對這些術語進行了充分解釋和舉例使得法院的判決有據可依。


AI領域的專利維權處境尷尬

AI領域的專利在維權中通常會遭受專利適格性(這是演算法專利另外一個重要的話題)或者創造性的挑戰,在專利權人抵禦了專利確權階段的圍攻之後,又常面臨手握一項有效的專利權卻難以維權的尷尬:

正如我們前面所述的,其中相當一部分原因是在專利的撰寫階段,未能在專利文本中清楚定義功能術語或者充分解釋技術特徵,導致法院無法清晰地劃定權利要求的保護範圍而維權失敗。再究其原因,又多是專利律師或代理人在撰稿階段對技術缺乏系統深入的理解以及倉促地撰寫而造成的,而倉促撰寫是與專利律師或代理人的投入時間和精力密切相關的。

* 以上文字僅為促進討論和交流,不構成法律意見或諮詢建議。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 TiPLab 的精彩文章:

囊獲多個第一的抗HIV新葯Trogarzo
AI技術專利研究系列:Next IT,虛擬助理領域的另類玩家

TAG:TiPLab |