當前位置:
首頁 > 科技 > 數據要素市場專題研究:政策頂層發力 產業供需共振

數據要素市場專題研究:政策頂層發力 產業供需共振

(報告出品方/作者:廣發證券,曠實,葉敏婷)


一、數據要素的產生和發展:第五大生產要素,政策密集發布引領產業鏈發展提速

(一)數據升級為新型生產要素,賦能經濟發展

數字經濟時代數據重要性提升,與土地、資本、技術、勞動力並列為第五大生產要 素。數據已成為數字經濟發展不可或缺的重要元素,在社會經濟發展的各個方面發 揮愈發重要的作用。隨著數據重要性的提升,國家層面也正式將數據列為生產要素 之一: 2019年10月,黨的十九屆四中全會將數據與土地、勞動力、資本、技術並列, 首次明確作為重要生產要素。2020年4月中共中央、國務院發布的《關於構建更加 完善的要素市場化配置體制機制的意見》中正式將數據作為生產要素單獨列出, 成為社會經濟生產活動所需要的基本資源之一。數據要素有望與AI等前沿數字科技 結合,進一步賦能更多產業,驅動數字經濟加速發展。

數據要素是原始數據經過資源化處理後形成的數據資產,類似將原油加工提煉成石 油資源,使其具備應用價值。從狹義視角理解,數據要素是原始數據經過初步處理 後形成的初級形態,已具備可參與生產活動或深度使用的基礎,但具體的應用方向 和開發方式需根據數據使用方的需求來確定,可類比土地作為生產要素,需要由政 府及房地產開發商決定土地的具體用途。從廣義視角理解,數據要素的範疇進一步 擴大,包括以各種方式參與經濟活動並發揮作用的各類數據資產,可類比勞動要素, 任何參加社會勞動(並獲取報酬)的勞動人口均為勞動要素。

數據要素是數字經濟的底層核心資源,有望推動宏觀經濟發展,提升微觀企業經營 效益。數字經濟的發展本質上是通過對數據要素更充分、更智能、更精細的運用,賦 能產業發展提效,具體落腳在數字產業化和產業數字化兩個主要方向。產業數字化 目前是數字經濟發展的主導推動力,2021年產業數字化增加值 (37.2萬億元)、佔GDP比重(32.5%)和增長速度(17.4%)均快於數字產業化, 體現出現階段數據要素主要通過賦能傳統產業的數字化轉型升級,促進數字經濟快 速發展,從而推動宏觀經濟發展。根據《中國數據要素市場發展報告(2021-2022)》, 以726家數字化轉型上市公司為樣本的調研數據顯示,樣本公司ROA顯著高於上市 公司近30年平均水平(2.27%),且數據要素應用水平高的企業ROA顯著高於應用 水平低的企業,數據要素對企業經營效益的提升發揮重要作用。

隨著數據要素在數字經濟發展中的重要性逐步凸顯,政策層面的支持力度也不斷加 大,相關支持性政策相繼出台,推進數據要素產業規範、健康發展。

(二)政策出台加速,政策重心由基礎設施轉向流通和使用

梳理政策層面對數據要素產業發展的態度,我們認為可以分為三個階段:(1)第一 階段(2014-2019年):國家「大數據」戰略正式提出,數據成為國家基礎戰略性資 源,大數據基礎設施建設穩步推進;(2)第二階段(2020-2021年):數據資源正 式被確立為第五大生產要素,戰略地位穩固,逐步開始探索數據確權、數據交易等 環節;(3)第三階段(2022-至今):數據要素相關政策高頻出台,數據要素產權制 度、流通和交易制度、收益分配製度等推進完善,數據要素市場加速規範化發展,數 據生產、數據應用等環節的潛力得到進一步釋放。

復盤政策具體方向,22年來數據要素市場建設重視程度提升。2020年開始數據要素 市場的提法開始出現,進入2022年後,關於數據要素市場建設的多項政策不斷出台。 2022年1月,國務院發布《「十四五」數字經濟發展規劃》,提出要加快數據要素市 場化流通、創新數據要素開發機制,加快構建數據要素市場規則,到2025年初步建 立數據要素市場體系。2022年12月,國務院發布《關於構建數據基礎制度更好發揮 數據要素作用的意見》,提出要建立合規高效的數據產權制度、數據要素流通和交 易制度、數據要素收益分配製度、數據要素治理制度,為數據要素規範化發展提出 指引,激活數據要素潛能。

23年來,國家層面從經濟全局發展的高點出發,在多份文件中強調數字經濟的重要 性,進一步提升數據的戰略地位。2023年2月,中共中央、國務院發布《數字中國建 設整體布局規劃》,強調要促進數字經濟與實體經濟深度融合,暢通數據資源大循 環,構建國家數據管理體制機制,健全各級數據統籌管理機構。3月發布的《政府工 作報告》進一步強調了數字經濟的重要性,指出要加快完善數據基礎制度體系。二 十屆二中全會通過的《黨和國家機構改革方案》提出組建國家數據局,負責協調推 進數據基礎制度建設,統籌數據資源整合共享和使用,並再次強調數字經濟、數據 要素的戰略意義,加速推動數字經濟產業規範化發展和數據基礎制度完善。數據要 素及市場有望規範發展,數據要素潛力有望得到進一步釋放。

總結來看,數據要素政策「縱向深入 橫向拓寬」,聚焦數據要素市場的培育和發展。 我們認為,國家針對數據要素產業的政策布局符合產業發展規律。一方面,政策重 心在產業鏈內部從上游向下游轉移,前期政策更多關注數據基礎設施建設,在數字 經濟已具備良好發展基礎後,將重心轉向中下游的數據流通和應用環節,通過政策 加強引導數據要素市場的規範化建設,縱向深入推進產業鏈向下游延伸。另一方面, 數據產業對經濟全局發展的重要性提升,數字中國戰略將以數字產業為核心,統領 協調各行業發展,設立數據局為產業自身發展和外部協作夯實基礎,橫向拓寬數據 產業對經濟發展的滲透領域和影響範圍。


二、數據要素產業鏈:供需形成共振,驅動產業進入高速向上周期

(一)生產→流通→使用三大環節,產業鏈初步形成

數據要素市場各環節協同發展,潛在空間有望加速釋放。根據國家工信安全中心數 據,2020年我國數據要素市場規模達545億元,同比增長45.33%;2021年同比增長 49.54%至815億元,預計2025年數據要素市場規模將增長至1749億元,2022-2025 年的CAGR達25%,整體將保持快速增長。細分環節看,2021年,產業鏈各環節健 康增長,其中,數據生產環節的數據採集、數據存儲、數據加工市場規模分別達45、 180、160億元,數據流通和分析環節的數據交易、數據分析、數據服務市場規模分 別達120、175、85億元,未來隨著國家政策支持力度繼續加大,數據要素市場各環 節的潛在市場空間有望得到加速釋放。

2022年1月12日,國務院印發《「十四五」數字經濟發展規劃》(後稱《規劃》), 提出為充分發揮數據要素的作用,要(1)強化高質量數據要素供給;(2)加快數 據要素市場化流通;(3)創新數據要素利用機制。基於《規劃》的思路,數字要素 產業鏈可劃分為:數據要素生產環節、數據要素流通環節及數據要素使用環節。

產業鏈上下游參與者看,上游主要是數據生產方,提供政府數據、企業數據、個人數 據等,中游由數據服務商和數據交易所組成,連接了下游包括政府、金融、醫療等不 同行業的需求方。在產業鏈環節中,原始數據經過採集、整理、聚合、分析等一系列 處理,成為可以被利用的數據資源(即數據要素)。數據資源經過登記確權,以及進 一步分析處理後,成為可交易的數據產品。需求方企業在購買數據產品後深入挖掘 並分析應用,充分發揮數據價值。數據在以上過程中實現了資源化、資產化及價值 化的迭代。

(1)從生產環節來看,數據採集是數據要素生產的首要環節,採集的原始數據通過 數據整理、聚合和分析,成為可利用的數據資源。根據數據類型可劃分為政府(公 共)數據、企業數據和個人數據採集,其中政府(公共)數據的供給規模最高。通常 數據生產水平需要從數據供給規模和質量兩個維度進行評估。 數據要素生產環節的產值規模提升需要量價提升共同驅動,數字經濟建設推進 數商 技術進步,帶動數據供給規模和質量的提升。在大力發展數字經濟的大背景下,數 據要素對全產業的應用滲透有望加速提升,從而有效帶動數據供給規模快速增長。 數據生產環節參與數商的技術持續進步,則將有效促進數據質量提升,拉高數據產 品的附加值。長期來看,我們預計數據生產相關服務的收費水平將呈現行業性提升 態勢。數據生產環節的量價提升,或將成為行業長期增長的核心驅動力。

(2)從流通環節來看,數據資源通過數據確權登記、定價、交易和交付,實現從生 產方向需求方的轉移。數據流通環節的核心參與主體是數據交易所,主要為數據產 品提供登記確權服務,搭建交易場所,承擔交易合規監管,以及部分數據相關增值 服務等功能。除數據交易所外,數據交易服務商也為相關主體提供合規評估、資產評估、交易撮合、數據交付、爭議仲裁、知識產權、數據安全等一系列服務。

(3)從數據產品使用環節看,下游應用場景有望廣泛滲透,AI賦能下帶來使用新范 式。數據需求方涉及公共服務、影視娛樂、交通、醫療、金融、廣告營銷等眾多領域。 我們認為,數據的使用是數據真正發揮價值的階段。在AI等技術加持下,數據要素產 業鏈有望價值重塑,主要體現在高質量數據需求有望快速增長,並且數據使用的門 檻也有所降低。一方面,隨著AI進入大模型時代,大模型的湧現能力依賴於數據處理 量和模型參數量的指數型增長,將顯著提升上游數據需求。另一方面,AI大模型的訓 練和應用模式,可以實現對廣泛下游數據使用細分場景的泛化,顯著降低數據使用 成本和門檻,更好滲透和賦能千行百業。

當前來看,下游應用對高質量數據的潛在需求和使用場景有待充分挖掘,AI等技術 的迭代進步有望催生更多對高質量數據的需求,同時降低數據使用門檻,加速場景 滲透。我們認為,數據使用的需求廣泛,且在AI催化下仍有提升潛力,重點關注兩類 受益公司:一是具備數據服務輸出能力,並融合AI技術,更好助力客戶數據開發運用 的數據服務提供商;二是擁抱和使用數據服務的下游應用廠商,數據使用效果有望 在AI助力下進一步提升,並有效降低數據使用的門檻,進一步提升業務的數字化和 智能化水平。

(二)數據生產環節:數據規模和附加值增長,驅動行業量價齊升

數據生產環節看,按數據所屬的行業劃分,數據產量的行業分布集中度高,數據生 產規模有望受益於主要行業數據的進一步開放。我國2021年數據產量6.6ZB,同比增加29.4%,其中個人數據產量為 1.4ZB,各類行業機構產生數據5.2ZB。行業分布看,數據產量排名前五位的行業分 別為政府、互聯網、媒體、公眾服務及專業服務、交通,前五大行業數據產量佔全國 行業機構數據總產量的65%。近年來政府公開的數據集質量不斷提高,上海、北京、 天津、廣西開放的有效數據集總數超過1000個,各省份開放數據集動態更新平均比 例達到20.59%。其餘頭部行業同樣具備數據進一步開放的空間和動力:互聯網平台 間的「互聯互通」趨勢下,平台間數據的交互融合程度有望進一步提升;媒體融合平 台的打造,將助力地方媒體整合資源,加速不同媒體平台間的信息互相開放融合。

按生產/供給數據的形式劃分,傳媒互聯網領域文學/論文、影視和圖片等行業頭部公 司深耕多年,均積累種類豐富、數量眾多且具備商業價值的數據資源。大規模優質 網文、IP、圖片、影視等資料庫的開放,將成為下游數據使用的重要資源。隨著下游 應用場景的進一步豐富,對上游數據資源的需求提升,例如AI大模型需要大量良好 數據資源進行模型訓練,有望進一步釋放數據資源的商業價值。從海外來看,目前 已有公司對提供數據資源進行收費的案例,如4月18日Reddit宣布將對使用API調用 其用戶聊天數據收費,而此前Shutterstock已對其圖片數據向OpenAI收費,推特也推出通過API使用推文數據收費的計劃。我們認為數據收費將成為趨勢,海外探索實 踐為國內產業發展提供有益借鑒。

細分來看,數據生產環節可分為數據採集、數據整理、數據聚合和數據分析等環節: 1.數據採集:為後續整理、聚合及分析環節打牢基礎 採集方式看,數據採集可分為線下採集和線上採集。線下採集適用於採集主觀數據, 通過問卷調查、用戶訪談、實地調研等方式進行人工採集,採集效率較低且採集成 本較高,但對於深入研究個體行為數據較為合適。線上採集根據採集對象不同,又 可分為開放數據、第三方平台數據、物理數據、APP數據等,針對數據類型採用不同 的採集技術。

參與主體看,主要包括採集設備提供商和數據採集解決方案提供商。數據採集設備 提供商為數據採集提供感測器、採集器等專用採集設備和智能設備,主要包括海康 威視、大華股份、富士康等廠商。數據採集解決方案提供商通過人工採集服務、系統 日誌採集系統、網路數據採集系統等為客戶提供解決方案,如拓爾思和易華錄等廠 商。例如,每日互動的開發者服務業務通過SDK採集用戶數據後,為App開發者提供 消息推送、用戶運營和一鍵認證等服務,持續採集積累的海量動態用戶數據,並通 過App自有標籤和個推標籤融合後得到各產品用戶畫像,基於此為客戶提供開發者 服務。根據公司22年半年報,截至22H1,每日互動開發者服務SDK累計安裝量突破 900億,其中智能IoT設備SDK累計安裝量已超2億,開發者服務SDK日活躍獨立設備 數(去重)達到4億。

2.數據整理:將原始數據轉換為易使用、可操作信息。數據整理可大致分為數據清洗、標註、脫敏及標準化治理四個環節。我們認為,數 據要素市場建設中,應重點關注數據脫敏脫密環節。數據整理中數據標註、清洗和 標準化等環節,已具備良好的發展基礎。隨著數據安全重視程度的提升,數據脫敏 或將更加受益。基於我國數據要素市場的建設構想,以數據隱私為首的數據安全問 題受到充分重視。由於數據確權相關立法尚未明晰,做好數據的脫敏脫密工作,成 為數據流通交易的必要條件,能夠在部分場景率先實現流通。

相關廠商圍繞數據脫敏脫密正積極做出技術嘗試。每日互動推動發起建設溫州數安 港的大數據聯合計算中心。其主要模式是,參與方將數據匿名化或去標識化,加密 上傳至中立安全計算區後(「中立國」),可在聯合計算平台上完成數據的挖掘、加 工和提取,計算結果經過嚴格審核和驗證後輸出,之後平台將銷毀各方原始數據, 從而在原數據未流轉的前提下,實現數據價值的流轉。一方面,大數據聯合計算中 心能為公司數據應用層的商業服務業務賦能,緩解品牌廣告主等客戶對數據安全合 規風險的顧慮,保障業務繼續順利推進。另一方面,為數據要素流通的安全問題,提 供全新的解決範式和思路,促成更多數據交易。

3.數據聚合和數據分析:關注數據聚合上量帶動數據中心IDC需求邊際提升。數據聚合可再細分為數據傳輸、數據存儲、數據集成匯聚等環節。我們認為,在數 據規模增長的催化下,數據聚合和數據分析的市場規模有望進一步提升。數據中心 (IDC)作為數據計算、存儲和交換等集中管理的場所。隨著數據分析業務增長,將 帶動IDC數據計算的需求。同時,數據存儲也是數據聚合中的關鍵環節。因此,在數 據聚合和數據分析需求的增長下,IDC有望邊際受益。 浙數文化將IDC業務作為數據科技板塊的核心,2016年開始就已布局IDC產業,目前 已在杭州和北京建設數據中心,截至22年底已累計建成機櫃數量超10000餘組,杭州 富陽數據中心運營良好,北京數據中心達到交付標準,杭州大江東數據中心進入籌 建階段,預計IDC業務對公司業績的貢獻度將進一步提升。

世紀華通也將雲數據業務 作為四大業務板塊之一,已在長三角和珠三角等地區投建多座大型數據中心。長三 角地區,公司深度參與和投資「騰訊長三角人工智慧先進計算中心」,已在22H1完 成近萬組機櫃交付。珠三角地區,公司的深圳市數據中心項目22年開始動工,計劃 部署機櫃達12000台,今年2月9日已正式封頂,預計今年4月完成首批交付。目前, 公司已獲得騰訊雲、華為雲等國內重要雲廠商的訂單。歌華有線基於自身掌握的核 心大數據資源構建多媒體數據中心(IDC),為政府、金融企業等客戶提供計算、存 儲、網路服務和增值服務等優質服務,主要優勢在於按需定製的優質服務和豐富的 服務經驗,同時公司過去在奧運票務、重要政府和金融客戶方面積累豐富服務經驗, IDC服務質量得到有效保證。

(三)數據流通環節:現階段重點推進環節,強化數據交易所中心地位

數據流通環節可進一步細分為數據確權、數據定價、數據交易和數據交付等環節。 參與主體來看,如前所述,交易所是數據確權的審批登記方和數據交易的平台搭建 方,而第三方數商則參與剩下的數據定價、數據交付、以及數據確權和數據交易中 的其他增值服務。

1.數據確權:數據流通基礎環節,探索解決數據確權難題。針對數據權屬問題,目前國內尚未形成明確法律規定,現有政策或文件對數據確權 的表述呈現框架性和方向性,但未有具體 立法落地。事實上,數據確權問題影響和制約的不僅是數據流通環節,還包括數據 資產入表。《數據二十條》提出三權分置相對弱化「所有權」概念,鼓勵各地積極試點。《數 據二十條》中提出 「探索數據產權結構性分置制度」,按數據生產、流通、使用 過程中的各參與方所享有權利的不同,建立數據資源持有權、數據加工使用權、數 據產品經營權等分置的產權運行機制,其中並未提到數據所有權概念。

我們認為, 「確權難」的本質原因在於信息主體和數據主體的不一致,導致數據所有權在信息 主體和數據主體之間存在模糊,如果將確認數據的所有權規定作為數據流通的必要 前提,反而可能制約了數據流通的發展。國家選擇轉換思路,淡化數據所有權,轉 而關注數據生產、流通和使用等數據產業鏈相關環節,將確權的範疇更多聚焦在持 有權、加工使用權、經營權等與數據產業鏈相關性更高的權利,則更有利於推動數 據流通的快速發展。《數據二十條》中提出的確權授權機制的建立,也進一步減少 了數據流通的阻礙。

目前,數據確權服務工作主要由國企搭建的平台承擔。典型平台包括新華網旗下新 華智雲打造的數字資產中心,以及人民網旗下的人民數據確權流通平台和人民數保 平台。 新華網持股新華智雲打造數字資產中心,運用區塊鏈技術提供數據確權服務。根據 投資者互動平台,新華網通過持有新華智雲39%股份,布局數據確權建設。新華智 雲作為首批取得網信辦境內區塊鏈信息服務備案的企業之一,基於區塊鏈技術,提 供版權確權、存證、維權等服務。

2.數據定價:數據流通時的價值衡量階段。我國已初步形成數據資產定價的基本模式,可分為數據評價和價值評估兩個環節。 數據評價主要是從數據的質量、成本和應用維度,衡量數據產品的價值。價值評估 則是具體為數據產品定價的過程,主要方法包括成本法、收益法和市場法。 目前,國家發改委已與地方數據交易中心共研數據價格形成機制。

4月10日,貴陽 大數據交易所與國家發改委價格監測中心簽署合作協議,共同開展數據價格形成機 制的聯合研究。此前,3月17日,發改委價監中心與上海數據交易所達成戰略合作,研究方向包括數據要素價格形成和估值機制等。我們認為,數據要素定價是交 易流通的重要環節,合理的定價機制將推動市場交易效率提升。發改委價監中心與 各地交易所的密集合作,側面反映國家對數據登記備案、定價、交付等全環節規範監管的重視,在市場培育初期引導數據要素市場良性健康發展,預計交易所也將在 定價過程中承擔更重要職責。

3.數據交易:場內交易佔比有望提升,推動交易所成交額增長。數據二十條提出,構建促進使用和流通、場內場外相結合的交易制度體系,規範引 導場外交易,培育壯大場內交易。從目前各地政府出台的政策來看,進一步明確數 據場內交易的具體要求,特別是要求公共數據進場交易成為主要共識。如廣東4月4 日發布《廣東省數據流通交易管理辦法(試行)》,其中明確進場交易清單,公共 數據等應進場交易。我們認為,在公共數據的引領下,數據場內交易佔比的提升是 明確的發展趨勢,數據交易所的業務發展有望迎來加速。

4.數據交付:靈活交付為主,交付形式較為多元。根據《中國數據要素市場發展報告(2021-2022)》,目前我國交易所或交易中心 的交易/交付形式主要可分為「場內交易、靈活交付」和「場內備案,靈活交付」 兩類。(1)場內交易、靈活交付:數據買賣雙方在數據交易所達成交易合約,交 易所提供交易憑證,但對交付過程不做時空限制,允許雙方協商。國內典型為上海 數據交易所。(2)場內備案,靈活交付:數據交易所開展多種形式的數據產品上 架、登記、備案、交易,支持場內交易交付 場外交付後登記備案。國內典型為北 京國際大數據交易所。

5. 數據交易所為中心推動第三方數商生態建設。《數據二十條》明確提出要建立數據交易場所與數據商相分離的市場運行機制。其中,數據交易所定位為公益性機構,由政府事業單位或者國資企業承擔相關職能,突出交易過程的公共屬性和金融平台屬性,側重交易的公平與安全,通過自律管理,實現標準化數據產品的交易撮合、價格生成、清結算等核心交易環節和功能。現階段國內數據交易所主要的商業模式,大致包括傭金、會員制和增值服務三 類:

(1)傭金模式:即對每一筆交易收取固定比例的交易手續費。其優勢在於簡單易行, 操作門檻低,劣勢在於過高的傭金比例會抑制場內交易主體的積極性與交易需求, 從而轉向場外交易。傭金制的典型代表為早期的貴陽大數據交易所,其在成立之初 對每一筆交易收取10%的傭金,但隨著實踐探索,貴陽數交所於2016年4月宣布取消 交易傭金制,改為增值式交易服務模式。(2)會員制模式:即對在場內交易的數據交易主體與服務商收取會員費。會員制模 式有利於推進企業之間的長期數據合作,交易安全性和交易質量更容易獲得保障。 代表為華東江蘇大數據交易中心,目前對其擁有的6000多家會員收取年費,實現平 台盈利。

(3)增值式交易服務模式:增值服務制下,數據交易平台已跳出「中間人」的身 份,部分承擔了數據清洗、數據標識、數據挖掘、數據融合處理等數據服務商的職 能和角色。當前大部分數據交易平台都提供相應的數據增值服務模式,且佔據一定 的營收比例。以上海數據交易所為例,需方數商採用一次性收費方式收取9980元會 員費,第三方數商每年繳納19980元的年費,供方數商需繳納交易額的2.5%作為數 據產品交易服務費。

從產業鏈視角,我們認為數據交易所將是數據流通環節的核心受益方。一方面,在 政策支持 產業發展的雙重推動下,市場流通交易的數據量將加速提升。另一方 面,基於對數據安全和監管的要求,數據交易將更多往場內轉移。兩者疊加推動下,交易所內數據交易量將得到進一步提升,交易所業務發展將得到更好發展。 從數據交易所內部視角,關注浙數文化旗下浙江大數據交易中心等主要數據交易所 發展。浙江大數據交易中心成立於2016年5月,目前主要提供數據流通服務及配套 數據增值服務,以金融科技、營銷和公共治理為核心應用場景。股權結構看,浙數 文化、安恆信息參股比例分別為48.2%、46.8%。隨著國家對數據交易安全的重視 程度提升,交易所作為數據流通的關鍵場所,履行數據交易監管等重要職能,預計 未來國資持股比例仍將進一步提升。

(四)數據使用環節:AI結合數據服務能力輸出,賦能數據使用新範式

數據的使用是數據要素真正發揮價值的重要環節。我們認為,數據的使用和數據生 產和流通相輔相成、互相促進:一方面,數據的生產和流通,為數據需求方對數據 的下一步更深入使用做好鋪墊;另一方面,數據需求方的數據使用,將形成結構更 加豐富、信息密度更大的新增數據,為數據生產和流通又提供了原始的數據素材, 同時數據使用過程中產生新的問題,進而催生新的數據生產和流通需求。此外,數 據使用也能為生產和流通提供使用反饋,幫助生產和流通環節的優化和改進。因 此,數據使用既是數據生產和流通的最終落地應用環節,也是生產和流通的效果評 估、需求反哺和數據再生產的協同共生環節。

AI推動高質量數據需求提升,降低數據使用門檻,並提升數據使用的效果。實現人 工智能的技術支撐之一,就是處理數據方法的變革(如當前AI大模型的數據處理 量、參數量大幅提升)。隨著AI技術的持續滲透,AI大模型的訓練和實踐均對數據 規模和質量提出更高要求,有望帶動數據要素產業鏈整體需求的提升。同時, ChatGPT API的發布、New Bing接入GPT4、微軟 365 Copilot融合GPT4、 ChatGPT plugins第三方插件的開放等密集事件,凸顯大語言模型在用戶交互方面 的效果提升,顯著降低用戶的使用難度,有望進一步降低數據使用門檻。數據使用 服務功能和AI緊密集成和融合,通過數據服務商向下遊行業輸出,原有數據功能更 新升級,使用效果、服務能力和用戶體驗有望提升。

建議關注AI賦能下,業務和業績發生邊際變化的兩類公司:(1)一是已具備較強 的數據服務輸出能力,有望在融合AI後,強化服務能力和用戶體驗,鞏固和加強業 務優勢的公司,如百度、阿里、騰訊等頭部互聯網公司,均已自研布局AI大模型, 結合已有雲服務對外輸出;以及每日互動等第三方數據服務商,探索核心服務能力 在AI加持下的進展和突破。(2)二是公司AI賦能下使用數據,實現收入增厚或降 本增效的下游數據需求方,如AI 遊戲(數據挖掘、智能投放等生產力輔助工 具)、AI 營銷(用戶數據分析實現精準營銷)、以及AI 教育(教學數據智能診斷 分析等)等典型應用領域。

1.數據服務商:AI集成下提升服務效果,降低使用門檻。數據服務商具備AI技術的承載和輸出能力,承擔AI助力數據使用的「賣鏟人」角 色。百度文心一言是百度在AI長期技術研發的體現,是百度推動「AI 雲」有機融 合、相互賦能的的成果之一。以文心一言為例,其對外服務的窗口是百度智能雲, 其底層基座支撐則是百度自研的晶元崑崙芯,以及AI中台百度飛槳深度學習平台, 共同構成了百度國內首個全棧自研AI基礎設施「百度AI大底座」。通過對算力-框架 -模型-應用的封裝,實現端到端智能化閉環,既有效提升百度智能雲的服務能力和 服務質量(包括數據使用相關服務),也大幅降低AI技術的使用門檻,提升下遊客 戶的開發效率並節約客戶開發成本。在智能算力的布局上,百度通過建設智算中心 和崑崙芯,為下遊客戶輸出高性能算力支撐。

我們認為,百度將AI技術集成封裝進 百度AI大底座中,提供層次豐富且隨用隨取的AI研發運營一體化(MLOps)能力,助力企業在數據使用等多元場景實現降本增效。在百度AI大底座的賦能下,企業資 源利用率提升至70%,開發效率提升100%。

阿里和騰訊等大廠均在AI領域深度參與和布局,共同推動高質量數據使用。阿里方 面,4月11日的2023阿里雲峰會上推出類ChatGPT的大語言模型「通義千問」及其 應用規劃。而阿里在AI大模型方面早已有深厚的研發積累和應用實踐,2022年9月 發布「通義」大模型系列,搭建了統一底座-通用模型-行業模型的層次化AI基礎設 施服務體系,成為國內首個AI統一底座,其包含的M6-OFA模型可同時處理多項單 模態和跨模態任務。智能算力方面,2022年8月阿里推出智能計算解決方案平台 「飛天智算平台」,計算資源利用率、AI訓練效率和AI推理效率的提高幅度在3倍 /11倍 /6倍 。「通義」大模型的服務場景已超過200 ,應用效果的提升幅度在 2%-10%,我們認為數據使用將構成「通義」大模型重要的應用領域,並將在「通 義」大模型助力下實現更好的使用效果。

騰訊方面,2022年4月騰訊首次披露混元AI大模型,覆蓋自然語言處理(NLP)、 計算機視覺(CV)和多模態等基礎模型以及行業模型,並不斷推進文本生成、文 生圖等AIGC領域的迭代升級。AI技術已對騰訊內部業務實現賦能,如AI有效提高 騰訊的廣告、遊戲、短視頻和雲等業務效率,同時有望在未來為市場提供大模型能 力。 其他數據服務商將自身服務能力與AI有機結合後輸出,提升服務效率和服務質量。 每日互動的數據治理層(M層)和數據應用層(P層)能夠為客戶提供從數據治理 平台搭建到具體數據分析應用服務。(1)數據治理層面,公司將原本對內服務的數據中台「每日治數平台」數據智能 操作系統(DiOS)轉為對外輸出服務,客戶可將自己的數據放到數據中台上,進 行數據清洗、加工和分析等數據治理活動,每日治數平台提供相關治理能力的支 撐。

(2)數據應用層面,由商業服務和公共服務兩塊組成。商業服務主要包括品牌服 務、增長服務和增能服務等業務,其中品牌服務的客戶主要為品牌廣告主、4A公司 及媒體平台等,每日互動為其分析識別目標客戶,幫助客戶實現精準投放(第三方 DMP服務);增長服務主要針對App開發者,每日互動根據對用戶使用情況的分 析,為客戶提供相應的用戶拉新、促活、留存、拉回、變現等針對性服務;增能服 務主要為互聯網媒體平台的聯盟流量增強用戶畫像,提升媒體平台廣告轉化率。公 共服務則主要面對政法類客戶以及非政法類的城市數字治理服務等,其中政法類客 戶主要為其提供SaaS類產品,而數字城市則為城市規劃、智慧文旅、公共管理等 領域提供全面數據解決方案。

AI與自身業務的結合方面,根據公司投資者關係平台,公司自身業務開展都會使用 AI相關技術,特別是數據治理層面,例如深度學習、神經網路等,同時AI技術的持 續進步也推動公司業務場景的技術戰略迭代。公司通過投資併購元凡視覺布局視覺 智能領域,AI技術的深入演進或將提升其圖片美化和視頻剪輯等核心智能視覺解決 方案的質量。

眾多數據使用下遊行業中,優選邊際效應明顯的場景,即AI賦能數據使用實現邊際 收入增厚和降本增效。傳媒板塊中,我們建議關注遊戲、營銷和教育等典型場景。 (1)遊戲:AI通過對遊戲用戶數據進行深度挖掘和學習後,歸納總結出不同用戶和 遊戲間的相關關係,運用於在遊戲研發(AIGC針對不同用戶偏好生成千人千面的游 戲內容)和遊戲發行(AI結合不同遊戲特點和目標玩家群體,協助精細化運營,實現 遊戲個性化營銷)全生命周期,並提升玩家遊戲體驗。

(2)營銷:AI主要從用戶洞察和廣告投放等維度結合數據進行分析,提升營銷效果。 用戶洞察方面,AI支持下能夠對更廣泛的多維度數據進行分類和處理,並實現對用 戶行為和習慣的高頻跟蹤,因而可以更好實現目標用戶的精準定位和長期運營,並 有效降低投放成本。廣告投放方面,在用戶互聯網內容消費平台愈發多元的背景下, 通過AI對大量互聯網用戶數據進行分析和學習後,可得到最適合廣告主的投放平台 和投放方式。 (3)教育:基於AI對教學數據的全面分析,有望實現對教學質量的全程把控以及教 學策略的動態調整,實現對不同學生的因材施教,助力學生學習效果的提升。

(本文僅供參考,不代表我們的任何投資建議。如需使用相關信息,請參閱報告原文。)

精選報告來源:【未來智庫】「鏈接」

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 未來智庫 的精彩文章:

2023家電行業策略:冬去春來三條主線把握戰略性配置機會