當前位置:
首頁 > 科技 > 從雲、CDN、AI到架構 重走短視頻技術的長征路

從雲、CDN、AI到架構 重走短視頻技術的長征路

在網上,爆款產品的出現往往意味著其背後技術也會受到大眾的關注。而近期火爆的短視頻也不能例外,其背後技術如雲、AI、CDN等也一樣成為了引人矚目的焦點。在 QCon北京 2018全球軟體開發大會上,第一天的晚上便上演了這樣的一幕好戲,極客邦科技 InfoQ聯合 Intel共同策劃主辦了以「短視頻崛起背後的技術支撐」為主題的晚場活動,從多個角度入手,深度剖析了短視頻崛起的技術秘密。

此次活動中,愛奇藝技術總監邢常亮、Intel資深解決方案架構師慕延峰先後登場,先為到場的技術人提供了兩個主題分享。而後,新浪網視頻運維平台負責人馬根蕾、熊貓直播技術專家盧永菁、陌陌高級研發工程師龔清華、愛奇藝演算法高級技術經理方非等四位業內專家擔任了四個小組的組長,帶領到場人員就「短視頻技術選型」「如何讓技術跟上業務的發展腳步」「短視頻及直播的體驗優化」和「AI賦能短視頻」等四個主題分別展開討論。

主題分享:聊聊短視頻背後技術那些事

愛奇藝技術總監邢常亮提到,從 2016年中期開始到現在,短視頻的百度熱搜指數便一路飆升,在資本市場上也變得炙手可熱。短視頻的爆發是很多因素聚合在一起所引發的爆點。客觀來看,短視頻爆發的主要因素來源於三個方面,商業變現模型逐漸完善、用戶碎片化消費習慣養成、短視頻內容製作門檻降低等,都是短視頻爆發的推動力。而技術的創新和規模化應用在背後起到了催化劑的作用,促成了短視頻的大爆發,涉及的技術包括:智能手機,4G/WIFI,視頻拍攝,視頻合成,機器學習,AI,推薦演算法,大數據,雲計算,編解碼,CDN,廣告等等。

如果深入剖析短視頻的商業閉環,發現其與其他以內容為主的商業模式極為類似,都會涉及創作、上傳、生產、發現到變現等若干環節。但同時,短視頻也有自己的獨特性,比如:創作中拍攝、加工、合成等並不都是專業人士,這意味著普通用戶也可以很容易地參與其中,直接導致內容量級的飛躍,用戶興趣點的分散化,這使得原本的以人工運營為主的內容推送方式不得不轉向以機器演算法為主,進而為後台推薦系統提出了更高的挑戰。另外,用戶入門門檻的降低也意味著內容質量會參差不齊,如何有效地進行內容審核以及優質內容的篩選,也是個要解決的問題。

愛奇藝最近推出了愛奇藝號開放平台,積極的構建短視頻的內容生態。利用 AI、大數據等技術手段來解決短視頻業務發展中的相關問題,比如:利用 AI技術來進行封面圖質量檢測 /軟色情內容檢測,來保證平台內容的質量;利用 NLP技術對視頻評論數據進行感情分析和標註,進而對優質內容和高質量作者進行有效的篩選;利用大數據技術對用戶行為和上傳內容進行全方位的分析計算,從而得到愛奇藝號用戶指數,該指數反映了作者的創作能力和受歡迎程度,並以此為基礎構建起用戶等級權益的金字塔,收攏高質量的短視頻創作者。

短視頻行業很容易出現爆款內容,這就對後台業務系統的高並發處理能力提出了挑戰,面對隨時可能出現的用戶流量爆炸式突增情況,需要在系統架構設計中充分的考慮熔斷、限流、隔離等處理策略,以保證系統的穩定運行,即使出現意外,也能夠將問題控制在局部而不會大規模擴散。另外,對於端視頻開播速度、卡頓等基礎性的播放體驗來說,用戶的要求會更加苛刻,容忍度會更低。為了能夠得到極致的播放體驗,需要在短視頻開播流程,碼流生產分發策略,CDN調度,碼流預載入等多個環節進行大量的優化工作。

最後,短視頻的爆發給互聯網行業帶來了巨大的機遇和挑戰,希望可以利用技術的手段讓短視頻業務取得更快更健康的發展!

主題分享:助力短視頻業務

Intel資深解決方案架構師慕延峰表示,在短視頻爆發的帶動之下,整個視頻行業的業務也在不斷演進中,視頻業務的流量消耗在高速增長,屏幕變大的同時解析度也在增長,4K業務推動行業要求更高像素、更高色彩和更高幀率;網路帶寬的限制進一步提升了對高效媒體編碼的需求,而一些解決方案提供商就需要提供更經濟、高密度的視頻轉碼能力。

那麼視頻業務有需求,在數據中心方面是如何解決計算、存儲和網路等問題的呢?在底層的晶元支持上,在不同的應用場景採用了不同的晶元,如智能攝像頭、視頻網關、數據中心和雲、客戶端等不同場景採用不同型號的晶元,利用高速視頻編解碼和圖像處理進行壓縮,加入計算視覺解決方案整理深度學習推理,採用定製化的解決方案優化計算、進行多樣化編程,進一步提升性能和功效。

而且,採用優質的解決方案下的軟硬體進行搭配,對業務的提升是顯而易見的。通過硬體加速的編解碼器、加速器和處理器中的集成圖形來加速媒體及計算機視覺痛點, 從靈活性和互操作性中受益。

分組討論:短視頻的技術選型

在兩位講師分享結束後,晚場活動進入了小組討論的階段,每個小組根據不同的話題在組長的帶領下有序進行。

新浪網視頻運維平台負責人馬根蕾帶領「短視頻的技術選型」小組經過討論後認為,在短視頻選型中,生產、轉碼、存儲、CDN和播放器等都需要面臨選擇。轉碼方面,在初創公司沒有很大的技術團隊,初期選擇商用產品會更好些;但是後期如果有自己的轉碼研發團隊,這時去做自己的轉碼業務會更好些,也可以根據自己的業務應用和業務特點去進行調整。

存儲和 CDN方面,自研和商用相結合是一種好辦法。在商業產品中來看,CDN之間競爭激烈,價格透明,市場成熟度高,一般成本上是不會虧的。但是如果說自建的話,第一,可以拿到一些非常好的資源,第二可以從運營商處獲得優質資源,第三,容災能力會更強。存儲自研的話,第一,擴容、數據保護、加密等都可以根據業務進行調整,靈活可靠。總結來看,在選型的過程中可以多對比幾家進行挑選,每家業務特色不同,這樣就可以找到適合自家業務線的產品,用起來會更順手。

分組討論:如何讓技術跟得上的業務發展的腳步

熊貓直播技術專家盧永菁帶領「如何讓技術跟得上的業務發展的腳步」小組探討後發現,目前,很多企業的視頻業務正在蓬勃發展,越來越多的用戶在使用這一功能。但是這個功能在深層領域中,涵蓋了轉發、存儲、轉網、分發等諸多技術,這些技術有些是屬於痛點問題,有些則是支撐起來了用戶體驗,所以總結一下可以得出一個結論,妨礙用戶體驗的最關鍵技術點在於精彩內容的尋找過程,也就是生成和創作過程。

生成是指通過手機錄製的過程,其中有編碼等問題存在;視頻錄製好後,需要上傳到雲,上傳到伺服器,然後從長視頻中找到精彩片斷進行剪輯。短視頻希望用戶有更好的體驗,是用戶期望看到的片斷,這個精彩內容的尋找過程就變得異常重要。

想要迅速實現這一目的,一方面期望利用視頻內容智能識別,包括人物、動作、人際關係等進行自動識別,找到這個視頻最精彩的片斷然後分發出去。另一方面在直播視頻編輯時也是一樣的,找到最精彩的部分,現在很多是手工,如果加入一些人工智慧技術,基於深度學習進行視頻內容理解,這部分不但節省了大量的人員投入,還能夠實現視頻找到用戶,讓用戶看到最精彩的部分。

分組討論:短視頻與直播的體驗優化

陌陌高級研發工程師龔清華帶領「短視頻與直播的體驗優化」小組探討後得出,體驗優化包括了秒開、卡頓、延遲、上行質量以及海外質量等。而秒開質量對於用戶體驗的整體質量影響最大,其優化主要在網路層面。首先要進行 CDN的預熱。根據對用戶使用習慣的分析或者針對近期的一些熱點視頻,對用戶的觀看喜好進行預判,而不是放在 CDN預熱,沒有了先下載到 CDN的過程會讓整個過程變得更快。在 DNS方面,其解析時間依然很長,通過優化能夠節省幾十毫秒,一點點優化,就會讓整個時間變短。預判用戶即將打開的視頻進行預載也可以達到這一目的。

在卡頓方面,包括時間佔比、人數佔比、技術佔比等問題。解決卡頓問題一般通過兩部分,第一是客戶端打點,做 CDN迴流等。一些案例,包括了主播推流時的卡頓,用戶下載時的卡頓等,這多數與 CDN相關,因此往往採用 CDN自動切換的功能可以解決問題。另一方面則是國外的視頻播放,這些國外的業務也會遇到 CDN專項的卡頓問題,當然也可能會與 DNS存在一些相關性,所以會做一些優化。

分組討論:AI賦能短視頻

愛奇藝演算法高級技術經理方非帶領「AI賦能短視頻」小組探討後得出結論,在這一話題下包括了三大方向,生產製造、管理審核分析和分發推薦消費。在創作上,AI和短視頻的內容形態有關比如 TGC、UGC和自動形成的視頻。也與創作階段有關係,假設把內容分層三類,過程分成三條,這樣就會有 9種不同的 AI作用的場景。在設計思路上,AI可以提供什麼樣的東西?舉個例子,通過聚類或者是提出關鍵詞,搜出類似比較精品的思路或者提供腳本,劇本已經定下來,只要表演視頻就可以了。第二是錄製,最常見就是美顏。第三是後期製作,AI可以自動優化,可以提高質量,甚至是風格轉換或者音效轉換。

在分發和消費類,分兩大階段,第一階段對事物完成理解,第二階段分發和推送。在推薦當中最有效的,行為是最重要的。其次在場景和用戶內容理解上也會有 AI的幫助。內容上最重點的是文本內容,這其中包括了語音識別後的文本等,因為語音識別本來就是人工智慧一部分。目前在科研和工業界熱點是多模態交互,即把圖像、音頻、視頻等產生不同的表達,也會成為可以理解的內容上的東西。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 InfoQ 的精彩文章:

想入門AI?先掌握這些數學知識再說!
普通程序員如何快速上手區塊鏈?

TAG:InfoQ |