當前位置:
首頁 > 科技 > 普強信息何國濤:在語音分析和車載語音市場,我們要比科大訊飛跑得更快

普強信息何國濤:在語音分析和車載語音市場,我們要比科大訊飛跑得更快

在成為語音數據分析市場的NO.1之後,何國濤的下一個戰場,是800億的車載語音市場。他不甘心等待行業大佬們的分割,他想拼盡全力跨越金字塔的塔尖。把這套系統作為入口,將更多的數據收入囊中。再通過大數據分析,徹底改變整個汽車服務生態及周邊行業。

車載語音市場,將要迎來一位挑戰者。普強信息已進入語音數據分析和車載語音並行的時代。

作者|崔艷

採訪、編輯|小魚

微信公眾號ID|Xtecher

「繼續做,幹嘛要停?」

接觸計算機30年,做語音20年的何國濤,並不想停止他在語音分析領域的腳步。他在2009年創立的普強信息科技有限公司現在已經坐穩中國市場語音大數據分析行業第一的寶座,接下來,他瞄準的是車載語音的戰場。

數據顯示,語音交互的市場規模預計將超過200億美元。國內外IT巨頭,包括車廠都在想盡辦法涉足這個領域,搶奪語音交互的賽道。亞馬遜開放Echo音箱的語音識別技術;Facebook創始人扎克伯格去年自己花100小時完成AI管家Jarvis的開發;而在國內, 除了BAT們在抓緊時間謀篇布局,思必馳、雲知聲、聲智科技、Rokid等創業公司也在發力這個領域。

2015年,普強切入車載場景,聯手四維圖新和騰訊,共同開發出「雲+端+晶元」的智能車聯網大數據系統。

何國濤知道,這一戰,他要跑得比科大訊飛更快。

不斷膨脹的夢想

何國濤思索了一下,說:「我發現,我開始欠他們一個夢想」。

這個名為「普強信息」的夢想包含了太多人的期待。2009年創立普強信息的時候,何國濤只想當好一個程序員,和喜歡的人一起做有價值的事情,花兩年時間寫程序,然後賣掉。

「誰知道,兩年過後,程序寫完了,為了證明程序有用,需要自己回國找客戶。找了之後發現確實賣不掉,又要重新在上面加一層再加一層,加人、加錢,又要去找投資人。到最後,終於有了客戶。」

但是程序員何國濤不知不覺間已經轉身成為普強信息CEO何國濤。

他要完成投資人和員工們的夢想。把普強信息做成語音數據分析市場的第一,做出世界最好的人機交互系統,讓員工能在北京買得起房子……

這個不斷膨脹的夢想起源於何國濤9歲時。當時的他和澳門其他孩子沒有什麼區別,愛做大他3歲的哥哥後面的跟屁蟲。唯一不一樣的地方,可能就是兄弟倆早早就表現出對數學異乎尋常的天賦。

因為家庭經濟拮据,兄弟倆想用其他方法賺零花錢。當時澳門對於童工的各項規範尚未健全,哥哥就帶著弟弟出去打暑期工。整個暑假都在制衣廠里剪線頭,把賺到的錢偷偷存起來。攢了兩年,一數,竟然有3000多元。

這筆巨款最後變成了一台蘋果電腦。兄弟倆就在這部電腦上玩遊戲,玩膩了就考慮能不能把遊戲修改一下,於是哥哥又帶著何國濤,靠著一本書自學編程。

在興趣作為源動力的時間裡,兄弟倆靠著這台電腦,寫編程參賽。1989年,何國濤被保送到華僑大學,選擇了計算機專業。「也沒有什麼高大上的理由,只是覺得計算機容易找工作」。

大學的前兩年,何國濤迷失了方向。在學生會、辦酒會、做兼職,他知道這樣的狀態不能延續,但是又不知道該往哪走。

這時,在北京大學物理系讀研的哥哥問他:「北大還不錯,要不要過來試一下?」

本科畢業,何國濤考上了北京大學的網路研究室。在北大,何國濤開始深入接觸計算機網路,跟著導師為廣東建設銀行寫一個基於TCP-IP的銀行網路中間件,對方非常滿意,以一套100萬的價格購買,產品非常成功,後來還賣給了多家銀行。

何國濤所在的網路實驗室, 就是著名的北大「天網」項目成立的地方,北大天網是國內第一個基於網頁索引搜索的搜索引擎。在這個被譽為國內中文搜索領域一面旗幟的天網項目中,培養出一批國內早期的互聯網搜索領域人才。何國濤的師兄,劉建國、雷鳴、周利民,後來跟隨當時名不見經傳的李彥宏,成為了「百度七劍客」。

何國濤沒有留下,他再次選擇跟隨哥哥的步伐,來到美國雪城大學(Syracuse University)。3年後,身處矽谷的哥哥再次問他:「矽谷這邊還不錯,要不要過來試一下?」

何國濤點了點頭。

語音數據分析市場的NO.1

在矽谷,何國濤做了很多次嘗試。他曾在HP、Aruba networks等公司從事Opencall、Voice XML、無線網關等產品的研究和開發,HP多媒體伺服器的語音識別技術,就是他所在的小組研發的。他對創業公司情有獨鍾,精兵、高效、靈活,非常符合何國濤的追求。

「決定創業的時候,我本想著做兩年,把產品做好了就夠了」。沒想到,光是語音識別引擎,何國濤的團隊就寫了5年。

這對何國濤來說,是異常艱辛的5年。整個普強信息團隊整天寫演算法,方向從一開始的圖像識別轉移到語音識別,他們唯一的產出就是代碼,但是這些代碼能不能變成真金白銀,還是一個未知數。

語音識別是底層技術,可以與口語教育、安防、監聽,甚至機器人完美結合。何國濤也探索過移動APP,做過訂票系統和在線教育的產品,但是始終達不到標準。

「如果你做一兩年完成的產品,別人花一兩年也能做出來,產品就沒有太大的價值。所以他一直要求我們要做到很深很深,做出一件別人需要花十年才能做出的東西。」

何國濤口中的「他」就是黃炎松。這位矽谷華人圈裡最成功的創投家,成為何國濤創業道路上的引路人,同時,也是普強信息的天使投資人。

當時的黃炎松已經60多歲,成功帶領4家公司在美國上市,他沒有像其他投資者一樣急於求成,反而提高了對普強信息技術實力的要求。

有了產品,何國濤把公司從美國加州矽谷轉移到國內運營。找客戶,何國濤找到了當年在北大的師弟雷鳴,此時的雷鳴已經離開百度,自創門戶建立了酷我音樂。而另一位師弟劉建國,身份也從百度的CTO轉換成了生活搜索網站愛幫網的CEO。

後來,酷我音樂和愛幫網,開始嵌入普強智能的語音搜索引擎。慢慢地,何國濤發現,和這些移動互聯網APP的合作,很難找到贏利點。這讓他陷入焦慮。

此時,普強信息遇到第一個大客戶,聯想。負責的是呼叫中心的數據分析和語音識別。這次合作,讓何國濤見識到了大公司對語音識別的巨大需求以及背後雄厚的利潤回報。

何國濤開始分析科大訊飛的財報,他發現,作為語音技術領域當仁不讓的老大,科大訊飛在語音數據分析上每年能獲得3000萬的收入,而在系統集成、安防、教育領域的盈利以億的規模計算。作為盈利能力最強的雲數據分析,卻沒有被放在最受重視的位置。何國濤發現了其中隱藏著的機會。他決定,「打他的弱項」。

於是何國濤決定專註於語音數據分析領域。

2010年,普強科技推出了「千語語音識別引擎系統」和「千語千尋語音分析系統」。

這款引擎的開發應用了深度神經網路技術,通過語音切分技術和對識別結果的演算法,進行語速探測、情緒識別等,以及對講話對象、時間邊界等進行分割,不僅提高了語音識別結果,也可以輔助企業進一步挖掘和分析海量語音數據。

千語千尋語音分析系統面向呼叫中心,在客服與顧客通話過程中,將不同方言的來電轉換成文字,還能根據不同的系統用戶需求,標註出關鍵用詞,並針對其進行統計和專業化分析,挖掘客戶需求。

「快」和「准」,是語音分析市場顛撲不破的標準。千語千尋語音分析系統的全文識別率可達85%以上,關鍵詞識別率達95%以上。中文語音分析速度國內最快,它擁有的文本分析引擎和索引處理技術,能夠實現分析操作在秒級以內完成,而業內多數語音公司的產品則要半小時甚至更久。

「當時我就跟客戶說,我們現在的分析系統就分析這塊,15秒出結果,而其他競爭對手需要2個小時。」目前普強在業界公開招投標的項目中,中標率能達到70%。「我們拿什麼打敗科大訊飛那種積澱和實力雄厚的大企業,只有產品、服務和口碑。」

隨著2014年底與保險電銷的龍頭企業招商信諾開始深入合作,經過三年的發展, 普強已經和數十家大型保險、銀行和互聯網金融公司進行合作,佔據了金融行業語音分析市場的80%份額。

2017年FINTECH金融科技的概念,也無意間驗證了何國濤當年的判斷。

隨著語音數據分析市場的領先地位確立,何國濤又開始思考起人機對話主要剛需場景:車載語音。

看準800億的車載語音市場

800億的車載市場,就是何國濤對準的阿喀琉斯之踵。

2015年,何國濤帶領著普強信息切入車載場景,聯手四維圖新和騰訊,共同開發出「雲+端+晶元」的智能車聯網大數據系統WeDrive。

四維圖新是國內領先的綜合地理信息服務提供商,其數字地圖一直主導中國前裝車載導航市場,合作品牌幾乎囊括國內各大主流車廠。近年來,在四維圖新CEO程鵬的領導下,採取創新+戰略投資的「雙輪驅動」策略,由傳統地圖轉向車聯網和自動駕駛。正是何國濤對四維這一戰略的強烈認同,最終接受了四維的投資。

在這次聯姻中,四維負責導航,騰訊負責內容,普強提供語音交互技術。相對於群雄逐鹿的後裝市場,市場份額更穩定、價值收入更高的前裝市場更具吸引力。全球老大Nuance佔了較大的份額,國內龍頭科大訊飛也躍躍欲試。但在另一方面,出品周期長和對接流程複雜也擋住了吃螃蟹者的腳步。

何國濤的智能車載語音系統,是由「雲+端+晶元」組成的。普強自主研發的雲+端語音交互系統能有效的避免車內網路不通對語音識別的影響。另外方案中的陣列麥克風可抑制噪音迴音,進行聲源定位。車載降噪DSP晶元可進行車載降噪去回聲。

此外,為了極致的用戶體驗,普強會針對不同車輛本身的胎躁、風噪、發動機噪等噪音特性,量身定製屬於該款車輛的聲學模型演算法,提高行駛過程中的語音識別率。

何國濤想要的不僅是這塊市場,更是想把這套系統作為入口,將更多的數據收入囊中。

百度首席科學家吳恩達曾說過,「語音識別從95%的準確度到99%的準確度帶來的不是量變而是質變,是從你偶爾使用語音變到常常使用。做到99%準確,將徹底改變人與設備的交互。」

當時,吳恩達正在百度負責「百度大腦」項目,而作為基礎的就是百度的語音技術。BAT也有意涉足語音分析領域,他們最大的優勢在於海量的數據。

沒有人會比何國濤更了解數據的價值。但是如何以道德的方式收集數據,更好地運用數據為用戶服務,何國濤想了很多種方法。比如車險。

「中國的車險市場是大概6000億,現在的車險大多採用平均主義,與你的駕駛時間和習慣無關。我可以把車機系統免費送給駕駛習慣良好的司機,在這一年內,通過系統記錄到的數據證實沒有違規行為,年底用戶買車險就可以減免一大塊費用。

對於用戶來說,這是看得見摸得著的好處。激勵司機追求更好的駕駛行為,對於社會的交通狀況有益。對於普強信息來說,這一年積累下來的駕駛數據,能夠讓他們看得更深更遠。

另一方面,何國濤還想過,針對暴雨等惡劣天氣,推出短時間的保險。「你從家裡到公司是五公里,半個小時就到了,你害怕這段路車子會被暴雨沖走,就可以通過車機系統買一個半小時的保險,系統實時監控,結束之後自動計算金額,可能兩毛錢,你只需要在車裡面點了一下說:「好,同意。」

把這些數據通過符合法律和道德的方式挖掘出來,通過數據分析和模擬,可能會在不遠的未來徹底改變整個汽車服務生態及周邊行業。

越過塔尖的勇氣

「大客戶將從目前70左右擴展到100個,在車載系統方面,樹立至少兩個標杆客戶。」

這是何國濤給普強信息定下的年底目標。離線的語音識別和語義理解,是普強信息的優勢所在。做雲端的雲識別引擎,在世界市場上有谷歌、微軟、亞馬遜和蘋果這些巨頭,國內有科大訊飛和雲知聲,中文的在線語音識別引擎加起來超過50家。但能實現中文車載嵌入式引擎加起來不超過5家。

「如果再努力一下,我們就是第一。」

「我們要先把中文的車載系統做到國內最好, 然後是全世界最好!」

何國濤坦誠地表達他對普強信息未來的期望,但橫亘在他面前的,是人才和技術的難關。「語音分析市場其實並不熱,只是最近才比較熱」。市場熱鬧起來,人才也就更加難求。

「所以我現在最大任務就是穩住這幫兄弟」,普強信息的核心團隊很穩定,創立時的第一個員工現在還在團隊內,何國濤認為這是最值得自豪的事情之一。

其次,要加快技術和客戶端匹配的速度。每次合作一個客戶,團隊都要花1~3個月時間對接,隨著市場的蘇醒,普強信息的客戶群體越來越大,但為了保證用戶滿意度,讓他們不敢接單。

為解決以上問題,普強將在今年下半年引進最新的神經網路技術,用神經網路去自動建模,這樣將會加快用戶產品的適配速度,從而加速市場布局,也為明年年底實現千個客戶的市場規模做好準備。

萬事俱備,何國濤耐心地等待著東風的到來。他把創業形容為綵排,「需要一個節點一個節點地去完成,如果直接跳到結局就沒意思了」。

下一個節點,將會在三到四年之後。何國濤透露,明年年中將會進行下一輪融資,下一步,就是上市。

「每一步都要有階段性成果,唯一的驗證就是在這個領域做到最好」。何國濤在心裡計算著普強信息與行業金字塔塔尖的距離,完成超越的油門,就在他的腳下。

━━━━━

封面設計:楊帥先 排版:陳光 校對:陳光

━━━━━

如果您有國內外科技行業新鮮資訊或獨到見解,歡迎與Xtecher聯繫

Xtecher官網平台現開通認證作者,

(添加好友請註明公司、職位、事由)

點擊展開全文

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 Xtecher 的精彩文章:

ICO,金融科技的另一種爆發
科恩實驗室再次攻破特斯拉;超融合廠商SmartX獲近億元B輪融資
中科院趙地博士:用深度學習分析醫學影像,提早篩查老年痴呆症
Facebook收購AI創企Ozlo;三星推支持6CA技術的基帶晶元

TAG:Xtecher |

您可能感興趣

科大訊飛「實時變聲」,讓人們重新認識AI語音技術的魅力
科大訊飛:教你用「語音滑鼠」控制電腦
四大智能電視語音交互大戰:這樣的才能叫智能!
智能語音快速發展需跨越三座「大山」
聯手可口可樂打造AI語音偶像 科大訊飛布局萬物互聯語音交互
喜大普奔!三星電視將搭載最好用語音助手
科大訊飛飛鼠智能語音滑鼠將「懶」進行到底
強大語音功能 海美迪視聽機器人滿足多場景應用
小米小愛也要認輸,電視盒子與語音二合一的智能音響,要不要這麼強大!
小度語音車載支架發布:支持語音交互、無線充電,價格真香
海爾電視遠場語音黑科技:離5米都可用嘴遙控,海量內容一「說」便播
國內外智能語音助手大比拼,生態和交互哪個更重要?
黑科技語音滑鼠!語音打字上網、26國語言翻譯!科大訊飛再出黑科技!
羅永浩:錘科已經不虧損,嘲笑語音交互的都是傻X
滑鼠也玩智能語音?科大訊飛即將推出滑鼠新品
普強信息聯合傑發科技,發布車載語音方案
智能語音技術如何切C端市場,科大訊飛交出這樣一份答卷
華為再發大招!強勁續航+AI語音操控,黑科技太有實力
劉聰:聽懂方言的AI,科大訊飛中文語音識別背後推手
大王視樂:下次再有人語音喊你「小哥哥」,直接拉黑吧!