視頻點播「黑科技」來襲:他家這項技術全球排名第二 人稱4K解碼神器
圖註:皮克皮克團隊的黑科技,要讓8K視頻實現普及。
「如何讓普羅大眾享受到4K甚至8K視頻,那種逼近人類眼睛的極限體驗?在不折騰各種視頻設備的前提下,這看似很難實現。
畢竟,想要實現超高清視頻內容(4K和8K)的普及,必須逐個攻克帶寬流量、存儲空間、視頻增強等技術難題。隨著5G時代的到來,行業內也亟待出現更具創新的視頻壓縮解決方案。
今年,在CVPR 2019上跑出一匹中國本土「黑馬」,它要讓8K視頻實現普及。
在美國洛杉磯舉辦的CVPR 2019(計算機視覺與人工智慧頂會)上,一家來自中國的視頻技術創新公司——杭州皮克皮克科技有限公司(簡稱「皮克皮克」),提出了一套全新圖像壓縮、插幀、增強的演算法,被認為是目前針對帶寬和畫質等超高清視頻播放問題的最佳解決方案之一。
據了解,這套技術可以幫助企業節省約50%帶寬成本,減少存儲成本,同時為企業提供視頻畫質提升、超解析度、高幀率提升等解決方案,讓視頻播放更加乾淨、清晰、流暢。
也正因如此,「皮克皮克」團隊在與國內外企業、研究機構與高校實驗室的競爭中脫穎而出,在高碼率壓縮方面取得了全球排名第二的成績,並獲得了來自Google、Twitter、Netflix等編碼研發人員的高度認可。
當5G普及,超高清視頻的春天,還會遠嗎?皮克皮克創始人Timmy Wang的答案是,未來超高清視頻內容的普及,已迎來了天時(5G時代到來)、地利(解碼技術迭代)、人和(人工智慧突破)。
4G VS 5G,視頻技術質的飛躍
在4G時代,為了能夠給用戶爸爸們提供更好的視頻觀看體驗,網路視頻平台可謂費盡了心血。
習慣了用手機看劇的朋友,會不經意間發現隱藏在視頻質量選項里,除了不同解析度的選項外,還悄悄多出了HDR畫質選項。下面這個畫質選項,購買了視頻網站會員的用戶都不陌生。
圖註:點擊HDR選項過後,你會發現視頻綜合質量顯著提升。
圖註:HDR畫質對比
這裡實際上應用了視頻的插幀和畫質增強的綜合處理技術。在不同視頻解析度如480P、720P、1080P甚至是4K(在Youtube中已有該選項)選項中,用戶可以根據自己所處的網路環境,進行不同碼流(解析度)的選擇,從而獲得更好的觀影體驗。
同時,為了節約帶寬和不同碼流片源存儲的成本,視頻數據在雲端存儲和傳輸的過程中,都會受到壓縮處理。
所有網路平台在播放視頻的過程中,為了節約帶寬,都會對視頻進行壓縮編碼處理。播放視頻的過程,其實是視頻解碼的過程。
思科的技術報告表明,隨著5G時代的到來,超高清視頻內容(4K和8K)的普及,視頻數據流量將佔據整個互聯網的80%以上。
「皮克皮克」創始人Timmy Wang在大會現場進行關鍵技術講解。
在CVPR 2019上,上「皮克皮克」在高碼率壓縮方面取得了全球排名第二的成績。
皮克皮克的技術團隊認定,在接下來的5G 超高清的浪潮中,整個的視頻產業將迎來新一輪的變革。支撐整個視頻產業最重要的的兩個基礎技術——視頻編碼和視頻增強技術,都迎來了本質上的突破創新。
那些你不知道的視頻黑科技
5G時代即將到來,意味著更多的視頻流量會在互聯網上進行傳輸,因此視頻的編碼技術就會顯得尤為重要。舉一個簡單例子,對於一部1080P的視頻,如果未經壓縮,那麼其1秒的數據流量將高達186M。而視頻編碼技術可以將其壓縮至不足1M,幫助節省上百倍的傳輸帶寬。
要保證4K和8K視頻能夠流暢播放,現今普及的視頻編碼技術仍顯得捉襟見肘。目前,在視頻行業廣泛採用的壓縮和傳輸標準,是2003年推出的H.264,其技術基礎仍然是基於塊單元編碼和線性變換。
基於深度學習的圖片和視頻壓縮技術,皮克皮克自主研發的PIKPIK編碼器,極大地提升視頻壓縮的性能。
他們是如何做到的?皮克皮克的技術團隊向鉛筆道闡述了,PIKPIK解碼器應用的那些前沿黑科技。
通過結合當前計算機視覺、語音識別、自然語言處理等相關最新成果,利用卷積神經網路等人工智慧演算法,以及當前大規模的流媒體數據,使得PIKPIK解碼器的編碼思想由基於像素和像素塊轉變為基於內容,充分考慮了人眼視覺特性及信源特性。
通俗來講,就是相比於H.264等傳統視頻壓縮技術,能夠更加靈活的針對應用定製壓縮方案,以滿足目前高清、超高清以及4K畫質,在網路點播、虛擬現實(VR)遊戲、視頻直播等多種應用中的編碼壓縮需求。
為了更直觀的理解PIKPIK解碼器的技術優勢,在CVPR 2019的「CLIC圖像壓縮編碼競賽」中,皮克皮克以圖片為例,現場展示了與傳統編碼器JPEG的對比圖:
圖注 : 基於深度學習的圖像編碼效果對比:PIKPIK vs JPEG
兩者比較下,明顯能夠看出,經過PIKPIK解碼器壓縮的圖片,體積小於傳統的JPG文件,但圖片的清晰度、細節遠超JPG文件。可以說,PIKPIK編碼器與當前最流行的傳統編碼器JPEG相比,在資源佔用更少的情況下,PIKPIK編碼器可以保留更多的圖像細節和質量。
圖註:左圖,JPEG2000的ROI處理方法是手動選框加局部壓縮;右圖,深度學習方法的自動特徵物體選框加局部壓縮。兩種處理方式,圖片清晰度對比明顯。
「什麼是ROI編碼?」
Region of Interest (ROI)編碼又叫做感興趣區域編碼。在實際監控圖像或視頻中,人往往只對畫面中某些特定區域比較關注,比如車牌、人臉等,而對背景的藍天,高樓等並不關注。這些特定的區域叫做「感興趣區域」。
ROI編碼技術是ISO組織在2000年定的新一代靜態圖像壓縮編碼標準JPEG2000中最大的亮點之一,也是當今圖像編碼領域的研究熱點。此項技術可以對圖像中的感興趣區域(ROI)進行低壓縮比的無損壓縮或近無損壓縮,在背景區域進行高壓縮比的有損壓縮。這樣在碼流不變的情況下,即可保證不丟失重要信息又能有效地壓縮數據量,很好地解決了壓縮比和圖像質量之間的矛盾。
皮克皮克的技術團隊還透露,相比現有解碼器,PIKPIK最大可以節省75%的存儲空間。
以深度學習為代表的人工智慧方法,在視頻編碼壓縮領域具備的優勢是,能夠針對特定的應用場景,自主地學習編碼壓縮過程。
皮克皮克技術團隊認為,「這種基於視頻內容理解的智能視頻編碼壓縮技術,將很快成為新的工業標準。」
另外一個關鍵技術,就是視頻增強技術,包括視頻超分辨、視頻插幀、視頻去雜訊、去模糊、去霧、夜景增強、HDR、視頻風格化等技術。「視頻增強技術是用來提升視頻畫質,增強用戶視覺體驗的關鍵技術。」
圖註:視頻智能插幀
圖註:插幀對比
以視頻插幀為例,該技術可以將25fps的視頻,轉換為50fps,甚至200fps的視頻,能夠明顯增強視頻的流暢度,減少視頻的抖動,從而極大改善視頻主觀體驗。
另外,視頻增強技術還可以進行老電影的高清重建,這是廣大老電影愛好者的福利。基於人工智慧技術,皮克皮克可以實現老電影畫質的翻新,將原本低解析度、低質量的電影素材進行翻新與修復,讓用戶同樣享受老電影帶來的高清/超清畫質觀影體驗。
智能視頻時代的商業想像
皮克皮克一直致力於視頻B端用戶兩大剛需的體驗升級:
一是為用戶與視頻監控相關客戶,解決巨大的存儲空間與帶寬流量需求問題。同時,也為用戶提供最專業的視頻畫質煥新、超分辨、幀率上變換等視頻處理解決方案,為網路播放平台提供更優質的片源。
比如皮克皮克的智能解碼壓縮技術,可以減小視頻傳輸網路帶寬,為視頻點播廠商節省成本。
現在各大視頻點播廠商如愛奇藝、騰訊視頻、優酷土豆等,主要使用的還是H.264傳統的編碼演算法,這對於播放視頻的清晰度,視頻質量,帶寬要求都是一個巨大的限制,也使得帶寬成本大大限制了各視頻企業的營收空間,而使用更好的編碼演算法,無疑會為該類視頻廠商節約大量的帶寬費用。
皮克皮克技術團隊目前能做到,通過皮克皮克提供的視頻壓縮解決方案,幫助企業節省約50%帶寬成本。
其次,皮克皮克還能提供更加優質的視頻播放質量,改善視頻點播產品的用戶體驗。與視頻壓縮技術帶來帶寬節省的同時,在相同的帶寬等硬體條件的限制下,更好的壓縮演算法就意味著更好的視頻質量和內容。
對於視頻點播用戶來說,其最大的體驗升級在於視頻畫質更加清晰、播放過程更加流暢、交互方式更加智能化。而對於各大視頻平台而言,也有助於會員服務的模式升級。
例如,視頻廠商為了控制成本和收益,對於1080P以及4K視頻播放的用戶需求,只提供VIP付費模式。而如果採用更高效的視頻壓縮方案,在同樣的帶寬成本條件下,甚至能夠為用戶提供免費的1080P及以上畫質播放服務,就能夠達到同樣的收益。
另外,皮克皮克產品的應用場景,不僅在於視頻點播行業,在醫學影像智能處理、智能監控安防、智能交通與自動駕駛等許多場景也可以進行延伸。
以智能監控安防為例,中國在公共和私人領域(包括機場、火車站和街道)共裝有 1.76 億個監控攝像頭,預計到2020年中國安防攝像頭的數量會增加到 6.26 億。據中國產業信息網統計,2016年高清攝像機佔比已從2012年的20%提升至55%。這些數據表明,大規模的視頻數據壓縮與智能化處理,在公共安防領域有極為廣闊的應用前景。
最後,在談到為何要參加CVPR 2019大會和各種世界競賽時,創始人Timmy Wang表示,除了推廣團隊的產品,他更想要推動人工智慧技術,在視頻點播應用方面快速落地。
皮克皮克的研發團隊擁有多年的視頻編碼壓縮研發積累,他們希望皮克皮克相關的人工智慧技術,可以藉助資本市場的支持,能夠儘快落地到視頻點播的應用產品之中。


※每日優鮮便利櫃業務暫停擴張 運營團隊併入主商城
※深度分析拼多多的首場618戰事:「貓拼狗「的快打旋風
TAG:鉛筆道 |