當前位置:
首頁 > 最新 > 周正寧:研發最大的挑戰是不斷否定常規 否定自己

周正寧:研發最大的挑戰是不斷否定常規 否定自己

周正寧認為,視頻是未來最重要的溝通方式,視頻處理技術一定要跟上爆發需求,這包括視頻內容的理解,服務端處理,實時編碼及存儲服務。從清華紫光、UTStarcom到Aupera,周正寧一直沒有離開研發工作。大數據與AI技術將與多媒體應用結合將產生更多價值。LiveVideoStack郵件採訪了Aupera聯合創始人兼CTO周正寧,他結合自己的經歷總結了一名普通技術人到CTO的成長經歷,並對硬體與多媒體生態的未來給出了自己的觀點。

策劃 / LiveVideoStack

LiveVideoStack:周正寧你好,能否簡要介紹下自己,包括目前的主要工作及關注領域?

周正寧:我是傲睿智存科技(Aupera)的聯合創始人兼CTO, 傲睿智存(Aupera)專註於視頻數據應用的新一代系統解決方案的創業公司,我主要負責公司的系統架構,技術路線規劃等。我此前曾負責為包括華為海思在內的一些視頻晶元公司提供相關演算法及核心協議棧,還為 PPTV和樂視等互聯網內容運營商提供完整音視頻技術解決方案;我早年曾於UTStarcom深圳研發中心負責ATCA高性能平台及IPTV 系統的相關底層軟硬體架構設計及開發,以及在清華紫光從事FPGA加密晶元及加密引擎硬體產品的研發。我非常關注新興的音視頻編解碼技術,音視頻編解碼與AI融合架構,大規模異構計算以及新型存儲技術及架構。

LiveVideoStack:這麼多年從技術工程師到CTO,哪些關鍵的選擇讓您成為了現在的自己?

周正寧:2007年我決定自己創業的選擇就已經把自己從技術工程師向更加全面的技術架構和把握技術趨勢的角色推進了一大步。當時創業的公司因為沒有更全面的團隊,業務做不起來規模,現在參與了傲睿(Aupera)的創立,最大的不同就是優秀的團隊,我們各司其職,讓我有了更多的時間去考慮公司的技術路線,我認為這兩步是我人生中最關鍵的選擇而成為了現在的自己。

LiveVideoStack:如何保持一顆好奇心?並在日新月異的技術大潮中找到屬於自己的發展路徑?

周正寧:我個人對新興的技術一直都充滿好奇心,保持一顆好奇心並不難,對於我來說可能是如何壓制我過於旺盛的好奇心比較難:)。我以前在和朋友聊天或從其他途徑了解到一些新興技術後,我常常會去查一下相關的文章,得益於當今發達的資訊網路,你可以輕易找到非常多的相關論文和討論, 如果沒有其他事情打擾,我常常可以不吃不喝連續看十幾個小時。但後來發現如果一開始就對一項技術作過於深入的研究不是太有效率,有些新技術常常在很多場合併不適用或根本就是為了發論文粉飾出來的數據。

後來我的做法是對新技術剛開始只需要做到了解其核心思想以及適用場合,同時花更多的時間擴大技術視野的範圍,這樣對整個技術圈的發展能有更為全面的了解。對於與我們正在做的事情的有緊密相關技術,我會邀請內部或相關的專家一起深入討論,如果有市場潛力並且在我們能力範圍以內,特別是結合我們的架構優勢能轉化為巨大市場優勢的技術,我們會進行更為深入的研究甚至安排到後續的研發當中。借用CNN里的術語,簡單說就是一要擴大 「感受野」 ,二要「剪枝」。

我自從工作以來,一直從事技術研發相關的工作,研發創新最大的挑戰就是要不斷的否定常規,甚至否定自己,跳出既定的框框。可以說關注新興的技術和相關的閱讀已經變成了我日常的習慣和某種意義上休閑的方式,非常享受從中挖掘出一些趨勢,結合自己的工作和興趣做些暢想。

我非常幸運的能趕上視頻大數據,人工智慧以及存儲架構變革的浪潮,這裡面的市場和技術機會都非常的多, 自從離開UTStarcom後,我的創業路途一直圍繞音視頻的發展,無論是視頻專用晶元的演算法,到視頻處理的底層架構,再到現在視頻數據的應用與AI的結合,我認為自己有一個比較明確的目標,就是視頻是未來最重要的溝通方式,視頻處理技術一定要跟上爆發需求。同時我也非常幸運的能和一幫志同道合的專家和高手一起研究新技術以及推動一些新技術的發展,一起逐步實現我們對未來的憧憬。

目前我對大部分新技術只是因好奇心而關注,我以及公司都會盡量把精力聚焦在我們目前正在做的工作和技術上。我認為一定要有基於自己專長選擇的專註點,不斷的圍繞這個專註點去反覆推敲再慢慢延伸,否則,將會很容易不斷的去追隨熱點,而在不斷的競爭和打擊中被迫放棄,惡性循環。相信不久的將來我們打造的新一代創新產品能在這個技術日新月異的技術大潮中立穩腳跟,真正成為這個視頻大數據時代各方諸侯手中的利器。

LiveVideoStack:能否描述一下您典型的一天的日程?幾點入睡,幾點起床?

周正寧:我喜歡夜晚安靜的工作和思考,同時因為兩地團隊的緣故,經常凌晨3、4點入睡,早上一般9-10點起床,我可以說是經常享受太平洋東西兩岸凌晨4點的風景為數不多的人之一吧:)。

LiveVideoStack:從清華紫光到Aupera傲睿智存,回顧(FPGA)硬體開發這些年,您的體會和觀察到的行業現象是什麼?

周正寧:FPGA行業發展非常快,性能越來越高,應用範圍越來越廣。1997年大三時第一次用到可編程器件做項目時,那時的PLD只有幾千門,用來做簡單解碼和時序邏輯,到後來我工作中做加密演算法的FPGA有幾萬門到幾十萬門。現在我們用到的FPGA除了基本的邏輯陣列功能以外還能夠集成CPU,SRAM以及各種IP硬核,晶元規模最大的到上百億門,因此FPGA本身能做的事情越來越多,現在一顆FPGA就能成為一個完整的服務節點,獨立完成複雜的工作,不再是只能作為加速引擎附屬在主機上。

就視頻行業來說,真正最高端的編碼器還是FPGA方案, FPGA的可編程高度靈活的並行計算,能夠非常好的兼顧編碼質量與性能。當然近些年來興起的GPU,CPU+硬編碼等方案使編解碼市場競爭更為激烈,但從特定市場來看,特別對於新興演算法,實時高質量編碼,AI融合編解碼上,FPGA的優勢還是非常明顯。個人認為CPU,GPU,FPGA這三種方案在視頻應用市場上各有優勢,他們之間的功能和性能上也有互相靠攏的趨勢。

LiveVideoStack:您如何看專用集成電路RISC、FPGA的前景?在多媒體生態中,專用集成電路在當下為未來有哪些重度應用場景?

周正寧:當一個應用或演算法成熟時,針對特定市場的ASIC有不可比擬的性價比和能耗比,但由於ASIC一定是針對特定的市場,為了極大化性價比,會對一部分功能進行裁減優化,因此開發或應用ASIC需要搞清楚應用場景和範圍。

ASIC從研發到市場的周期很長,而由於技術本身的不斷變化,當ASIC面市時,某些新的演算法或功能很難加入,所以個人並不看好ASIC在一些正在快速迭代的技術上的應用。反觀FPGA,用可編程邏輯實現成熟演算法並無優勢,不過最新的FPGA能夠集成各種硬IP (如HEVC等) ,使這方面可以達到與ASIC同樣性價比和能耗比,加之其具有的可編程硬體演算法優勢,在融合快速迭代技術的實現上具有明顯優勢。在競爭白熱化的今天,雲端服務提供商如何能快速響應新功能從而做到差異化服務顯得尤為重要,而這種情況下,FPGA可能是性價比和能耗比最優方案。

對於ASIC 重度應用場景,我認為首先是在終端應用,特別是一些功耗受限的設備,專用集成電路是剛性需求。包括比如內容的實時編解碼及VR/AR場景實時拼接,人臉應用,語音識別/合成以及一些泛AI應用。在雲端場景,採用成熟的H.264/HEVC,ASIC加速非常適合于海量視頻實時編解碼場合的應用,比如說WebRTC的MCU。WebRTC是典型的低延時實時編解碼場景,許多軟體編碼具有優勢的VQ優化和RC演算法派不上用場,這方面ASIC的性價比和能耗比具有絕對的優勢。

LiveVideoStack:就WebRTC而言,大規模互動的場景下,如何實現性能穩定的MCU就成為系統的關鍵。專用集成電路/FPGA是如何在這裡場景下發揮威力的?

周正寧:在WebRTC的實踐中,SFU和MCU模式各有優勢和缺點。通常由於軟體轉碼混流的成本非常高,加之大多數雲架構採用虛擬化技術,軟體轉碼混流任務的延時很難保證,因此大多數WebRTC服務端採用SFU模式,讓伺服器只做中轉工作,而把繁重的任務交給客戶端來完成。

隨著網路環境的不斷進化,以及各種新的音視頻編碼應用到WebRTC中,採用SFU模式的客戶端的負擔將會越來越重,功能也會越來越複雜以適應各種兼容性問題。特別對於手機等功耗受限的設備硬體配置參差不齊,雖然像SVC這樣的技術從原理上說非常合理,但真正落地到實踐中如何保證用戶體驗還是非常具有挑戰性。當然也有不少公司提供終端「盒子」的方式來搭建基於SFU模式的會議系統,這種方式不但保證編解碼性能和兼容性,還能夠加入各種實用的附加功能,從用戶體驗上說確實會好於普通終端網頁方式,但這種方式推廣上需要龐大的硬體零售的銷售渠道和售後服務支撐,實施難度要遠遠大於基於標準WebRTC的方案,如果考慮到將來AV1或其他新的音視頻編碼的應用,已售出的「盒子」怎樣升級和替換也將是一個值得思考的問題。

MCU解決方案在網路速率的適配和視頻編解碼兼容性上有天生的優勢:局端轉碼,對客戶端的編解碼性能和兼容性要求大大降低;局端混流,大大降低會議系統的帶寬成本,大幅提高弱網情況下客戶端的用戶體驗,也降低客戶端的軟體開發難度;由於部署在IDC機房,與會方之間的AV同步更容易保證, 特別賽事直播領域中的主播PK等高同步要求應用,MCU的方式具有很大優勢;

而針對傳統MCU解決方案的缺點,採用硬體加速的MCU解決方案從根本上解決傳統MCU解決方案中的性價比和延遲抖動問題。同時針對於支持新的音視頻編碼和AI附加功能,硬體FPGA方案能夠及時調整內部硬體演算法適應不同的工作任務,運維人員只需要一次性雲端部署就能完成整個系統的升級,而不需要龐大的客戶端插件/軟體/硬體盒子升級計劃。

對於有存儲要求的,硬體解決方案支持以離線模式線速轉碼存儲,比SFU直存更節省空間。

LiveVideoStack:UTStarcom經歷了小靈通時代的 「曇花一現」。作為一名技術人,您如何理解技術在企業生命周期中的作用?

周正寧:我自己對UTStarcom極有感情,經歷了UTStarcom從小到大,盛極而衰的過程,公司里有一大批極具才華的工程師和專家,但很遺憾最終沒能成長為行業領頭羊。我認為技術在企業生命周期中的作用在於生根發芽,只有技術的領先和紮實,才能夠保證企業的根基雄厚,並能長出健康的樹芽,這是技術型企業最關鍵但也是最基礎的一個元素,企業生命周期中還有更多更重要的因素,包括團隊,技術落地,時點把握等等,都是保證企業發展壯大成為參天大樹的更為重要的因素。

LiveVideoStack:可以預見的是,隨著5G的到來,網路帶寬進一步提升,多媒體應用更具想像空間。在多媒體相關領域(或具體的應用場景中),您認為哪些技術具備快速發展和應用的潛力?

周正寧:5G的到來意味著移動網路延遲大幅降低,移動帶寬大幅增加,以及單位帶寬成本的大幅降低。可以預見到:

互聯網上視頻內容進一步增加,對越來越多的視頻特別是高清視頻內容如何快速高效挖掘的技術將非常有前景。

網路延遲的大幅降低將凸顯其他系統延遲的影響,特別是編解碼的延遲和抖動對用戶體驗的影響佔比會大幅增加, 採用硬體技術來保證其用戶體驗將會越來越普遍。

隨時隨地視頻通話更為普遍,隨之而來的兼容性問題會更加突出(更為複雜的網路速率匹配,更多解析度適配,更複雜的流控演算法,更多的客戶端版本), 考慮到用戶體驗,結合部署應用成本和運營成本的權衡,硬體加速的MCU模式將會越來越流行。

人們對網上直播/實時會議/教育的視頻質量期望大幅提高,更高清晰度的視頻意味著更大的存儲空間,如何離線壓制保存這部分內容的技術值得關注。

WebRTCon 2018

繼2017年第一屆LiveVideoStackCon音視頻技術大會之後,LiveVideoStack又一次出發——WebRTCon 2018,將於5月在上海舉行,這是一次對過去幾年WebRTC技術實踐與應用落地的總結。

WebRTCon 2018設立了主題演講,WebRTC與前端,行業應用專場,測試監控和服務保障,娛樂多媒體開發應用實踐,WebRTC深度開發,解決方案專場,WebRTC服務端開發,新技術跨界,WebRTC與Codec等多個專場。邀請30餘位全球領先的WebRTC技術專家,為參會者帶來全球同步的技術實踐與趨勢解讀。本文受訪者也將出席,為大家分享有關硬體加速方案在WebRTC實踐中帶來的新體驗,並深入探討WebRTC的SFU和MCU模式的優缺點。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 LiveVideoStack 的精彩文章:

動態優化器—一種感知視頻編碼優化框架
報告顯示H.264份額進一步提升 1080p最受歡迎

TAG:LiveVideoStack |