當前位置:
首頁 > 科技 > 訊飛華為聯手:國產大模型只有基於自主創新算力底座才有大未來

訊飛華為聯手:國產大模型只有基於自主創新算力底座才有大未來

楊凈 夢晨 發自 凹非寺

量子位 | 公眾號 QbitAI

訊飛華為,竟悄然已在大模型上聯手?!

一個演算法軟體,一個硬體晶元,兩個國產代表性公司已經選擇強強聯合。

事情是醬嬸的。

我去世界人工智慧大會(WAIC)逛展來到華為展區,結果卻看到了科大訊飛的星火大模型

一開始還以為是展台擺錯了,了解之後才知道是華為和科大訊飛聯手了。

這下雙廚狂喜。

而且不光他倆,現場還發現了很多這樣的合作夥伴……


來到國產大模型主場

此次世界人工智慧大會,簡直可以說是來到國產大模型主場。

從底層晶元到前端應用,從互聯網大廠到初創公司,基本上全都是大模型產業鏈上的小夥伴。

甚至於你到一家晶元公司展區,一眼望去都全是是大模型產品展示……

而來到一眾大模型展台(P.S.據稱現場來了30多款大模型),也已經不再是基礎功能的展示,反倒是直接快進到各種行業應用:

大模型 醫療、大模型 金融、大模型 汽車、大模型 教育、大模型 辦公、大模型 工業……

今年也就不過幾個月時間,大模型這麼快地就在行業應用落地了?!

從模型層來劃分,可以大致分為三類:通用大模型、多模態大模型、垂類大模型

通用大模型自然不必多說,諸多此前被冠以國產ChatGPT之稱的大語言模型,已經在各個代表性行業中應用,與企業展開合作。

相較於後兩者而言,產品形態更加成熟,比如網頁端、APP、小程序,用戶也能輕易感知到。

其中,訊飛星火APP是目前唯一全渠道上線的國產大模型產品——

已在蘋果、華為、小米、OPPO、vivo、騰訊應用寶等手機應用商城上架,以及網頁端、小程序和H5等

其推出的助手中心,涵蓋1000 智能應用,包括職場、營銷、點評、創作、學習、出行等場景。用戶可選擇特定場景發出指令處理任務。

多模態大模型方面,作為大模型一種基礎能力,更多體現在與人交互的行業應用上,比如首個機器人多模態大模型RobotGPT、還有各種虛擬人、數字人等。

就是在線上看到那個AI新聞官,背後也是大模型的能力。

至於垂類大模型,成為了此次主場一道亮麗的風景線。更多看似「跨界」玩家在這裡,直接給出了面向特定場景的行業大模型,為客戶提供定製化、私有化服務。

像中國電信給出面向通信政務司法等場景的千億參數語翼(TeleChat)大模型;星環科技給出的大數據和金融行業的兩個大模型:大數據分析大模型SoLar「求索」、星環無涯金融大模型,還有針對像創意寫作、消費、企業服務、直播帶貨等大模型的亮相。

而如果從行業劃分,至少從現在來看,多個行業已經有了成熟並已落地應用的典型場景。(我們以科大訊飛為例)

大模型 醫療

主要是輔助醫療場景,以診後管理為例,在患者走出醫院那刻開始,大模型就將根據患者信息生成為其90天的康復計劃。包括醫生提醒、用藥指導、康復運動、健康知識、健康檔案等,並且可以隨時與主治醫生交流。

患者只需要通過小程序就可以查看。據現場工作人員介紹,目前這套解決方案正在與安徽某醫院合作落地。

大模型 金融

目前主要落地場景是智能客服,解決以往複雜問題難理解、專業知識更新不及時,應用不準確,多輪交互複雜場景等問題。

據介紹,下半年科大訊飛將擇機發布人保大模型星火智能客服規模應用、金融行業信息服務平台及證券行業智能助手、星火語音客服及星火智能數據分析系統。

大模型 工業上則是以企服助手為典型應用。

根據不同企業,結合專有行業數據,大模型可以解決橫跨研、產、供、銷、服、管等整套工業流程各個複雜問題,給員工給出專業解答。

當然這也還不是全部,如果更為細分,像大模型 教育,在WAIC現場竟然已經看到了最小面向3歲小孩的AI學習機。

這些都是大模型應用落地提速的一些直觀展現。

短短半年時間,國產大模型從誕生到應用落地,背後究竟是怎樣的一個方法論?


背後是怎樣的方法論?

距ChatGPT問世已有7個多月,業界對大模型落地的探索也初步分化出不同路線。

最簡單直接的,就是AI公司研發大模型並對外提供應用產品或API,按使用量收取費用。

還有一種谷歌模式,從底層TPU晶元,到谷歌雲基礎設施,再到LaMDA、PaLM基礎大模型,最終到Bard產品全都自研。

OpenAI則在此基礎上還多了一層與微軟的聯盟,一方面讓自家大模型在Office、Windows這樣的全民級產品上大展拳腳,又能獲得強大的Azure雲基礎設施和算力支持。

哪種模式更值得看好,當下似乎並不明晰,但如果回看歷史,就不難發現一些規律。

如果說大模型最終能成為AI時代新的操作系統,那麼OpenAI與微軟的聯盟就很容易讓人想起計算機史上另一個聯盟——

Wintel聯盟,個人計算機歷史上的一大里程碑。

上世紀80年代末開始,微軟的Windows操作系統和英特爾的處理器成為了PC標準的關鍵組成部分,這個聯盟的成功之處至少可以分成以下3個方面:

兼容性和標準化

Wintel聯盟使硬體和軟體開發者可以圍繞統一標準做開發,降低了成本提高了效率。對於消費者來說,這意味著他們購買的產品能夠與大多數軟體和硬體同時兼容。

優勢互補

微軟的軟體和英特爾的硬體相互配合,形成完整的解決方案佔領市場的同時,兩家公司可以集中精力做自己擅長的事。

相互推動規模效應和創新

軟體功能越來越複雜,需要更強大的硬體支持;硬體的性能提升反過來也給下一代軟體設計提供更多空間和想像力。

如此一來,Wintel聯盟幫助兩家公司在過去的幾十年里在個人計算機市場中取得了顯著的成功。

如今這一幕再次上演,只不過微軟成了提供硬體基礎設施的那一方。

而且以現在的行業形勢,競爭更加激烈,很難再復刻當年的壟斷結局了。

雲計算一哥亞馬遜與HuggingFace、StabilityAI等開源新勢力達成合作,大數據巨頭Databricks豪擲13億美元收購大模型初創公司MosaicML等都是這個思路下的產物。

這一點在此次WAIC上也得到了印證:


每個企業的展區已不單展示自家的產品,更多產業合作聯盟相繼成立。

科大訊飛與華為率先牽手合作,就是一個行業示範。

訊飛星火大模型之所以表現良好,是因為紮根在其研發的訊飛火石平台這個底座上,實現了大模型數據稀疏化、低精度量化等技術突破。

之所以能取得這樣的突破,也是在充分利用華為昇騰算力平台,在運算元優化、並行優化以及信息化等一系列優勢基礎之上完成的。

同時星火大模型與昇騰AI高效適配,也加速了大模型的行業落地應用和迭代。

現在距星火大模型推出不過兩個多月,我們在世界人工智慧大會現場已經能找到不少它的身影。

而且不僅如此,科大訊飛與華為的合作還多了一層含義。

讓國產大模型架構在自主創新的軟硬體基礎設施之上,一方面國產化平台給大模型提供自主可控的保障,另一方面大模型落地帶來的大量使用、測試,也給國產硬體改進、提高規模效應提供了寶貴機會。

關於這一點,科大訊飛高級副總裁、認知智能全國重點實驗室主任胡國平也在大會的昇騰智能產業高峰論壇上進行了更詳細的解讀。


通用智能的新底座

往年世界人工智慧大會,參與者主要還是相關行業內人士為主,今年卻悄悄發生一些有趣的變化。

受這半年多來AI熱潮的帶動,不少科技愛好者特別是AI繪畫愛好者、以及各行各業的職場人也都會來看看。

AI消費級應用與產業級應用都來到了風口浪尖。

而這其中原因,胡國平歸結到大模型的通用性上,並提出科大訊飛要搶抓通用人工智慧帶來的歷史新機遇 。

胡國平介紹到,科大訊飛在外界看來是語音起家,但語音和語言其實是不分家的。

早在2014年,科大訊飛就提出超腦計劃,目標是在能聽會說的基礎上更進一步,讓機器能理解會思考。

這一輪通用人工智慧大浪潮來的時候,科大訊飛在去年12月15號緊急啟動1 N認知智能大模型的專項攻關。

我們看到的訊飛星火就是其中的「1」——通用認知大模型,5月6日正式發布,6月9日火速升級到1.5版本。

10月24號,也就是科大訊飛的1024全球開發節的時候,訊飛星火會發布全新版本,到時能夠全面對標ChatGPT,並且在中文上實現超越。

之所以能有這樣的進化速度,胡國平認為,一方面來自大模型與大腦原理層類似,預示著大模型無限潛力。

人工智慧歷史上經過四次起伏,不斷迎來熱潮又陷入寒冬,有可能終於找到正解

也就是大模型的湧現能力,真正有可能支撐機器的智能真正走向通用人工智慧。

而另一方面與合作夥伴之間的強強聯合離不開關係。

模型的研發強烈依賴高端AI晶元集群和生態。除了晶元算力指標以外,帶寬、顯存,晶元之間集群的方式都是關鍵。

對國產大模型來說,要持續的安全和發展的關鍵,要靠國產AI晶元和配套軟體整個生態的快速發展。

訊飛星火就充分利用了昇騰的國產化算力的平台的基礎之上,通過高效適配的來加速了整個AI的落地工作。

雙方合作之下也實現了訓練和數據閉環的全流程的設計,以及大模型的訓練和推理的一體化設計等等相關創新,有效的支撐了科大訊飛的訊飛星火一步一個腳印的持續的進步。

胡國平提出,未來對算力的需求又持續不斷的增長,對訓練數據的消耗也非常大。


如果未來每個人類都有一個自己的專屬大模型,算力的消耗可能至少又要翻幾千萬倍,肯定會對極低功耗的晶元和系統的解決方案提出新的要求,也是未來我們特別需要去考慮和關注的技術攻關方向。

而搶抓這個歷史新機遇的關鍵基礎,就是要全力打造我國通用智能的新底座

— 完 —

量子位 QbitAI · 頭條號簽約

關注我們,第一時間獲知前沿科技動態

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 量子位 的精彩文章:

馬斯克當場解僱推特首席工程師,只因被指「人氣下降」