百度AI開發者大會:阿波羅正式開源,全資收購語音公司KITT
陸奇用全新的思路帶來了一場誠意十足的開發者大會,百度整個公司的AI戰略和架構有了新的調整
新智元報道
作者:胡祥傑
【新智元導讀】2017年7月5日,北京,百度首屆AI開發者大會在國家會議中心召開。百度最新的AI 領軍人陸奇擔任主持人。陸奇用全新的思路帶來了一場誠意十足的開發者大會,百度整個公司的AI戰略和架構有了新的調整。但是,正如許多觀察者指出,對於AI公司來說,僅看技術是遠遠不夠的,具體的應用落地、市場佔有情況才是生存和壯大的關鍵。陸奇是否力挽狂瀾,為百度帶來新生,我們將繼續觀察。
2017年7月5日,北京,百度首屆AI開發者大會在國家會議中心召開。
百度董事會副主席、集團總裁兼首席運營官陸奇在會上宣布,百度無人駕駛的「阿波羅計劃」正式開源。百度度秘事業部總經理景鯤宣布,百度全資收購語音技術公司Kitt.AI。
百度創始人、董事長兼首席執行官李彥宏發表演講。
阿波羅1.0 正式開源
百度4月19日發布自動駕駛開源平台,稱為阿波羅計劃。在本次開發者大會上,陸奇宣布,7月5日,阿波羅1.0正式發布。
阿波羅計劃整體分成了雲服務、開放的軟體平台、硬體平台和汽車平台四個層面來解讀。
陸奇說:「Apollo 1.0是一個重要的里程碑。百度開放了封閉場地循跡自動駕駛能力、自定位能力和端到端等非常有價值的數據。更為重要的是,Apollo會快速地開放越來越多的能力,每周都會更新,每兩個月左右都有新的版本和總體能力的提升。」
上圖:紫色部分的技術現在已經對外開放,在Github上可看到
接下來百度的具體計劃是,到今年9月份,Apollo將會開放固定車道自動駕駛能力和開放部分的模擬引擎數據;到今年年底,Apollo將開放一系列新的能力,使車輛能夠在簡單城市路況下,完成自動駕駛任務,同時會開放更多的數據及數據上傳的介面;2018、2019、2020年,Apollo會加強開發能力,加速開放速度,直到最後實現完全自動無人駕駛。
陸奇在現場說:「Apolo是最強的自動駕駛生態」。目前的阿波羅生態已經囊括50家機構和企業。
陸奇說,中國是Apollo的誕生地,是Apollo的主戰場。中國是世界最大的汽車市場,擁有良好的政策環境,Apollo給中國汽車工業帶來了最好的創新生態。「我們有信心也有能力,在將來的3-5年內,讓中國的自動駕駛站在世界前沿。相信我們一起努力,一定能領先世界汽車工業!」
全資收購語音技術公司Kitt. AI
景鯤在百度開發者大會現場宣布:百度將全資收購KITT.AI,把KITT.AI的語音能力和自然語言處理能力融入到百度平台中,全面免費向百度的合作夥伴賦能開放。
KITT.AI 專註語音喚醒和自然語音交互技術,是世界上唯一獲得亞馬遜Alexa和微軟聯合創始人Paul Allen投資的公司,併入選了CB Insights人工智慧創業一百強。
KITT.AI 的四名關鍵人物
KITT.AI聯合創始人、CTO陳果果先生現在演示了如何使用KITT.AI語音喚醒技術快速打造一個語音喚醒設備。根據陳果果先生演示,進入Snowboy的喚起詞庫並新建喚起詞「你好景鯤」後,接著只需要說三遍「你好景鯤」,即可完成喚起詞的訓練。在測試環節,設備只會對喚起詞「你好景鯤」進行響應。
此前,度秘事業部宣布在美國矽谷設立研發團隊,旨在吸引全球頂尖的智能語音對話交互人才,專註於智能語音對話領域的科學研發以及創新應用。
當時百度的官方說法是:「度秘事業部美國矽谷研發團隊負責人近期也已經正式到崗,其曾經在谷歌供職10餘年並且也是Google Assistant智能語音助手的核心員工和創始成員。」
KITT.AI是位於美國西雅圖的AI初創企業,專註語音喚醒和自然語音交互技術,去年5月,它發布了Snowboy人工智慧軟體工具包,通過這個軟體,開發人員可以在一些硬體設備上添加「語音熱詞探測」功能。
KITT.AI最初是作為艾倫人工智慧研究所(AllenInstitute for Artificial Intelligence,簡稱AI2,由PaulAllen創辦)的一個內部孵化項目在去年正式成立。2016年1月,KITT.AI獲得西雅圖風險投資公司Founders』Co-op與Amazon Alexa項目的種子輪投資,之後它又收到了來自創投機構Madrona Venture Group的一大筆錢。
Kitt.AI 聯合創始人兼CEO姚旭晨本科畢業於南京大學,並在約翰霍普金斯大學獲得計算機科學博士學位。
景鯤發布DuerOS軟硬體一體化產品:四個版本
除了宣布全資收購新的語音公司外。百度在本場開發者大會上還發布了另一個關於語音技術的重磅消息——軟硬體開發平台DuerOS,將為開發者提供最容易上手的軟硬體一體化解決方案,包括多樣化的開發套件和完全開放的參考設計:
1、搭載樹莓派,利用科勝訊技術的個人版。即刻申請就可以搭載一個個人可以對話的語音設備。
2、輕量版。把一元錢大小的晶元放在任何一個設備裡面,設備就可以對話。
3、標準版。兩麥、四麥、六麥、八麥的標準版都可以即可申請。
4、完整一體化的參考設計。如開放電路板設計、開放結構設計、開放麥克風陣列等等。
景鯤介紹結束後。陸奇對景鯤給了極高的評價。他說,做AI 的,誰是AI產品做得很牛的,看口袋裡能不能拿出晶元來。景鯤就是隨時能從口袋裡拿出晶元的人。
來自度秘的百度工程師羅興現場演示了「如何將百度DuerOS的能力接入搭載Alexa的Anker音箱」,展示了智能設備開放平台的便捷性。羅興通過十七行代碼,用1分鐘的時間,讓原本只會英文的音箱馬上變得能聽懂中國話。
百度AI開放生態架構全面曝光
加入百度半年以來,陸奇對百度進行了大刀闊斧的改革,而這次的開發者大會,陸奇也正式將自己的構想對外進行了全面的展示。
端上,百度提供DuerOS、Apollo兩大開放平台。
雲端,百度提供百度大腦和智能雲,為每一位開發者提供其所需的能力,幫助他們搭建自己的知識體系和行業解決方案。
百度大腦加智能雲是中國最完整、最全面、最前沿、最有活力和最具生命力的AI平台,其中核心的是百度大腦。基於百度大腦卓越的技術實力,百度有能力把代表未來的智能雲提供給中國開發者。
在本次大會上,陸奇宣布開放60項百度AI能力(演算法層、感知層、認知層、平台層),包含語音、視頻、增強現實、機器人視覺、自然語言處理五大類14項新開放能力,並開放百度雲基礎能力(智能開發平台、AI Stack)。
百度大腦架構
平台層:百度宣布開放60項AI開放能力,在使用量方面,語音API外部在線使用量半年增長300%,圖像API調用量保持月增長大於200%。
認知層:百度擁有業界領先的自然語言處理能力,基礎演算法、語義理解、機器翻譯技術處於行業領先地位;擁有上億級別具有多個屬性的實體,有著強大的知識圖譜,以及十億用戶畫像和千萬級細分標籤。
感知層:百度有全面的語音識別、圖像識別、視頻理解、增強現實和虛擬現實能力。
演算法層:PaddlePaddle是國內首個深度學習開放平台。
李彥宏:競爭對手從來不收購技術公司,只有百度願意為技術付費
李彥宏壓軸出場,他在演講中說,不久前,百度內部在討論是否要收購一家美國技術公司,內部有人說,如果競爭對手支付更多的價格去競價怎麼辦。對此,李彥宏的說法是,百度的競爭對手不會為技術去付費,他們會為產品付費,為流量付費,但百度願意為技術付費。
談到開發,他說,每隔一千年,輪子都會在世界不同的國家被重新發明一遍。在古代,人和人之間的溝通是非常低效的,相隔萬里的人無法共享成果。今天是一個完全不一樣的時代,我們沒有必要每個人再「重新發明一遍輪子」。AI大潮到來的時候,我們可以把所有的東西放進「聚寶盆」,只要你去共享、參與,你就能獲得更多。AI是通往未來的必由之路,開放會讓我們所有人獲得更多。
百度首屆AI開發者大會,發布了兩個「安卓」
陸奇在公布阿波羅計劃時說,阿波羅是汽車行業的安卓,但是比安卓更開放,能量更大。而景鯤在介紹百度Duer OS是也說,Duer OS是人工智慧時代的安卓。
百度在這次被稱為「歷史上首屆AI開發者大會」上,發布了兩個「安卓」。
提到開發者大會,科技界的人士都不會陌生。國外有著名的四大「春晚」——Facebook的F8、微軟Build、谷歌I/O、蘋果WWDC。
近年來,開發者大會越來越多地從技術範圍擴展,成為各大公司展示自己戰略和產品的盛會,面向的人群也遠遠超過了開發者,擴展到全行業。
無一例外,2017年,國外著名的四大開發者大會所強調的主題都離不開AI,但是像百度這樣專門召開一個「AI開發者大會」的,目前還沒有。
一方面,這一舉動反映了百度在AI上發力的強大決心。另一方面,這也正是百度AI 的關鍵先生陸奇的聰明之處。
1月份加入百度後,陸奇主抓的兩項AI業務——語音交互平台和自動駕駛,即上文提到的Duer OS 和阿波羅計劃,均採取了開放的戰略。
今年4月發布阿波羅計劃後,陸奇就曾表示,百度通過 Apollo 計劃開放自動駕駛平台,將拉大與同行業競爭對手的差距。他認為,開放的生態系統將超越其他封閉系統,引領行業發展。
現在看來,陸奇到百度以後的最大改變,可能就是「開放」這兩個字。
撇開情懷,開放其實更是一種策略。以自動駕駛為例,真正實現無人車的量產,僅有技術是遠遠不夠的,與傳統車廠的合作已經成為一種必然選擇,這一點在最早開始無人駕駛研究並長期堅持獨立研發、自主造車的谷歌無人駕駛上體現得最為明顯——其最早的自主研發無人駕駛汽車「螢火蟲」上個月正式宣布退出歷史舞台,同時,在無人駕駛上投入多年的谷歌無人駕駛也從谷歌剝離,成立獨立的子公司Waymo,並聲稱自己是一家無人駕駛技術提供商,會選擇與車廠合作而不是自主造車。
谷歌的轉型讓更多的無人駕駛玩家認清了現狀,百度的開放戰略更是一絕。根據百度此前的介紹,「Apollo」平台的結構包括一套完整的軟硬體和服務體系,包括車輛平台、硬體平台、軟體平台、雲端數據服務等四大部分。將開放環境感知、路徑規劃、車輛控制、車載操作系統等功能的代碼或能力,並且提供完整的開發測試工具。
百度稱,會在車輛和感測器等領域選擇協同度和兼容性最好的合作夥伴,共同組成協作聯盟,推薦給項目參與方使用,進一步降低無人車的研發門檻,促進技術的快速普及。
利用先發優勢和多年的技術積累,百度的這種開放對於競爭對手來說無疑是一個重大打擊,特別是一些以提供技術解決方案為主的小公司來說更是如此。
通過開放來迅速獲得合作夥伴和開發者,進而阻斷後來者的追趕道路,這種從軟體開源平台的思路現在已經轉換到了全平台生態開放的思路。
陸奇用全新的思路帶來了一場誠意十足的開發者大會,百度整個公司的AI戰略和架構有了新的調整。但是,正如許多觀察者指出,對於AI公司來說,僅看技術是遠遠不夠的,具體的應用落地、市場佔有情況才是生存和壯大的關鍵。陸奇是否力挽狂瀾,為百度帶來新生,我們將繼續觀察。
點擊閱讀原文查看新智元招聘信息


※迄今最精密大腦連接圖:「哈伯望遠鏡」首次看清神經網路所有連接
※「Bengio領銜」DeepMind、谷歌大腦核心研究員2017深度學習最新報告(PPT)
※「NLP2005年以來大突破」語義角色標記深度模型,準確率提升10%
※「AI作畫真假難辨」Facebook 創意生成網路 CAN,比 GAN 更有創造力
※Facebook 創意生成網路CAN,比 GAN 更有創造力
TAG:新智元 |
※IBM宣布正式開源POWER處理器ISA
※IBM將收購開源雲軟體公司Red Hat
※NVIDIA推出RAPIDS開源GPU加速平台,瞄準數據分析和機器學習市場
※超越 BERT 和 GPT,微軟亞洲研究院開源新模型 MASS
※對話 CTO〡和 PingCAP CTO 黃東旭聊開源資料庫新藍海
※超越 BERT和GPT,微軟亞洲研究院開源新模型 MASS!
※GOSINT:開源智能(OSINT)方面較新的一款工具
※MIPS CPU架構宣布開源:龍芯的機會來了
※龍芯的好機會:MIPS CPU架構完全開源
※令人意外!MIPS正式開源 矛頭直指RISC-V
※微軟開源之路:近鄰搜索演算法SPTAG開源啦
※IETF推出用來取代IMAP的現代開源電子郵件協議JMAP
※PHP7 JIT 相關開源項目
※NVIDIA開源GPU硬體文檔:Linux開源驅動可獲大幅提升?
※浪潮與Odoo成立合資公司 ERP廠商開始走向開源?
※NVIDIA發布PhysX SDK 4.0下載,物理加速引擎正式開源
※OURS譚章熹:開源RISC-V指令架構與AI晶元
※ARM 授權費用太貴,科技巨頭欲轉向開源架構 RISC-V
※上海交大盧策吾團隊開源PointSIFT刷新點雲語義分割記錄
※NSA 官方開源反彙編工具 GHIDRA