那些被遺忘的碼農……
CSDN 有很多的老朋友,專門做音視頻技術的LiveVideoStack 就是其中的一位。
一個月前,在微信的大本營廣州 TIT 創意園,微信多媒體內核中心音視演算法高級工程師梁俊斌面對 LiveVideoStack 提問「為什麼選擇音頻這麼小眾、枯燥和孤獨的領域」時,表示:「你用了『孤獨』這次詞形容音頻技術開發很到位。」
這折射出多媒體領域的一個尷尬現象 —— 對多媒體技術人的需求很大,但能夠深入到底層開發的人少之又少。這也就導致了這一領域人才極度搶手,薪資水漲船高。
「我們預計國內的多媒體開發者有幾萬人吧」,LiveVideoStack 這樣告訴某 TOP 級短視頻平台多媒體技術負責人,後者的反饋是:「應該沒有那麼多人。從招聘的情況看,能被我們認可的人才非常少。」
區區幾萬人,只佔到國內開發者數量的幾百分之一,「孤獨」是很正常的。在國內,並沒有一個被廣泛認可的「多媒體開發工程師」的崗位,許多多媒體技術開發的正式崗位名字是「運維」、「大數據工程師」。即便在一些主流的視頻平台,許多多媒體開發工程師的 title 是「演算法工程師」,表面上和多媒體開發一點關係也沒有。
當別人在聊 DevOps、IPFS、CNN,你一張口就是 Codec、PSNR、VMAF,瞬間就沒有了朋友。
LiveVideoStack 經常收到推薦多媒體技術人的消息,如果是運維、前端、Android 開發崗位,推薦起來並不困難,但是想要資深的多媒體技術人很難。所以,基本上這樣的請求,只能無功而返。
梁俊斌還告訴 LiveVideoStack,「應屆生招進來,需要學習演算法和基礎知識,當條件具備了可以開始做產品時,已經過去 3 年了。」顯然,這不是小公司也可以承擔的。面對人才的瓶頸,許多公司不得不採取了極端的防守策略——至少保證辛苦培養的技術人不被挖走。一名 TOP 級的視頻平台公司的 HR 告訴 LiveVideoStack:「我們對嶄露頭角,有一定能力的工程師進行特別的保護」。事實上,LiveVideoStack 一直在邀請這家公司的技術人來 LiveVideoStackCon 音視頻技術大會分享,但始終沒有得到積極的反饋。
另一個不容忽視的現實是,一線大學的畢業生選擇金融、P2P、區塊鏈、AI 這些領域,畢竟可以離 money 更近。這進一步擠壓了多媒體技術人的供給,願意投身多媒體開發的技術人相應的減少。
如果展望未來三、五年,VR、5G、4K 乃至 8K 視頻的機會就在眼前,為什麼願意投身多媒體的技術人反而更少呢?
多媒體技術很難?
是的,很難。多媒體技術是一門實踐的科學,不是通過下載源碼,把玩下開源軟體就能搞定的。在現實中,需要面對複雜的網路情況,各種約定俗成的方法,沒有註解的源碼,千奇百怪的硬體和非標準的協議。
上圖便是直播視頻所經歷的關鍵模塊,這還不包括視頻的前處理和後處理。當然,如果加上人耳、眼睛在聲音、圖像上的生物特性,以及相關心理感知模型,全部知識體系是如此龐雜。
「視頻領域是個海洋,可以游泳、衝浪,也可以潛水、遠航……編碼優化、去雜訊、視覺特效等很多問題都是跨領域的,涉及計算機、電子、通信,甚至藝術、生理、心理學等,無論本專業還是外專業都需要再學習」,北京大學信息科學技術學院教授馬思偉告訴 LiveVideoStack。
騰訊多媒體內核中心高級研究員時永方在接受 LiveVideoStack 採訪時表示:「多媒體涉及高等數學,數字信號處理,通信原理,資訊理論等基礎學科。」
同時掌握這麼多專業知識,挑戰可想而知。但投入並不一定能產生高回報,至少回報周期很長。橫向的與 AI、區塊鏈等熱門領域對比,學習多媒體技術的投入產出比沒有任何優勢。
多媒體開發者的機會
如此看來,多媒體技術似乎是學霸們才能玩得起的。事實上,並不完全如此。如果你是要做深入底層的多媒體開發者,的確需要更多時間,而且最好是科班出身,有多媒體領域的導師帶路,不斷探索和豐富自己的知識體系與經驗。比如在視頻 Codec 領域,能夠對底層進行優化的肯定是少數人。
但如果你並不想深入底層,只在應用層開發,那麼難度會大幅降低。比如最近十分流行的 WebRTC,以及不斷完善強大的 FFmpeg,這些框架、工具不僅強大,而且有完備的文檔,社區也足夠活躍,使用它們可以大幅降低學習、開發多媒體產品服務的門檻。
未來,多媒體技術會像通信技術一樣成為一種能力,滲透在各種應用場景中,無論你是前端、後端、運維都需要或多或少地涉及多媒體技術。針對特定場景的多媒體能力開發,需要大量的人才支持。在 5G 和 4K 高清視頻的趨勢下,多媒體應用將誕生新的應用和商業模式。
10 月 19-20 日,CSDN 與 LiveVideoStack 聯合出品的 LiveVideoStackCon 2018 音視頻技術大會將在北京舉行,這是一次針對多媒體技術的全面梳理與展望,也將開啟多媒體技術世界的大門。不過,作為多媒體開發初學者,或者只是有興趣學習相關的技術,能否在專業的技術大會上有所收穫呢?先看看有哪些專家分享經驗?
以上列出了 LiveVideoStackCon 的部分講師,以及出品人和聯席主席,大約還有 20 位講師仍在溝通確認中,在官網上會隨時更新講師與議題的最新進展 (掃碼即可查看)。
不難發現,他們中的大多數都來自多媒體技術重度應用的平台,各自承擔著多媒體技術關鍵任務。同時,組委會與出品人會對講師的內容提出要求,並經過至少兩輪審校,這將保障內容源於實踐,富有啟發性,嚴謹準確。
比如,YY 音視頻演算法中心負責人林緒虹會介紹如何重構 YY 的音視頻技術棧,提升用戶 QoE,控制成本。
學而思網校客戶端架構負責人趙文傑將介紹如何實現功能強大的白板功能,以及如何在複雜網路條件下的實現低延遲保障與可用性。
Hulu 全球高級研發經理視頻編解碼與傳輸領域資深專家傅德良則會介紹在 Hulu 內部的一套視頻質量評價體系,以及他如何幫助 Hulu 甄選 Codec,他包含一系列客觀評價指標,如畫質、延遲、壓縮率等。
快手流媒體大數據平台架構師羅喆會介紹快手如何提升用戶觀看短視頻的體驗的,這包括全鏈路的狀態抓取,以及相應的分析、告警、故障定位和優化。
騰訊視頻視頻編碼團隊負責人汪亮則會分享騰訊視頻在視頻質量、畫質增強、成本控制等方面的經驗。
思科視頻研究員張睿將會分享如何設計 WebEx 的架構,以及如何全方位監控網路與客戶端實現高品質的視頻通話。
其次,除了來自工業界的一線專家,LiveVideoStack 也邀請了來自學術界的代表。
比如,北京大學信息科學技術學院教授馬思偉將會分享全球最新的視頻編碼技術的趨勢以及 AVS2 相關的進展。
上海交通大學教授宋利則會分享視頻畫質評定技術,包括相關的開源工具、方法及工業界的應用情況。
清華大學電子工程系教授、博導竇維蓓將介紹音頻編碼標準的演進等。
三菱電子研究院田棟則會介紹點雲技術的標準與實現方案,以及在全景視頻、VR 等方面的應用進展。
如果說在一線的多媒體技術人可以帶來更接地氣的分享,幫助解決實際應用中的問題。那麼,學術界的各位大咖則可以幫大家補補課,重溫經典演算法,開啟全球視野。
最後,還有一些代表各自領域的 TOP 級公司,帶來各自的獨門秘籍。比如,杜比研究高級總監 Claus Bauer會帶來杜比如何在千差萬別的設備中實現聲音特效。
Twitch Principal Research Engineer 沈悅時則會分享如何將 HLS 打造成比 RTMP 更低延遲的方法,以及通過機器學習的方式自動優化網路。
Intel Media SW Engineering Manager Faouzi Kossentini將會帶來如何基於 Intel 的 CPU/GPU 對 HEVC 及 AV1 編碼的優化,對於演算法複雜度超高的 AV1,如果通過硬體加速的方式提升編碼速度,將給 AV1 帶來巨大的機會。
RealNetworks CTO Reza Rassool會帶來 AI 技術為 Codec 帶來的優化,以及如何在低演算法複雜度下實現極致的軟體編解碼。不少 80 後都有過觀看 RM/RMVB 視頻的經歷,在那個 64KB 帶寬就算是寬頻的年代,RM/RMVB 風靡一時。
北京美攝網路科技有限公司 CTO 見良將分享在移動端視頻處理的性能保障與優化,設計 Codec 優化、視頻渲染、GPU 加速等。
外界對於快手的技術充滿了好奇,尤其多媒體技術方面快手有一幫頂尖技術人才。快手音視頻技術負責人於冰將首次公開分享快手在多媒體技術方面的經驗與探索,包括 AI、編碼和網路演算法等。
Akamai 首席架構師 William Robert Law會分享這家全球最大的 CDN 針對網路方面的優化,如何使用 CMAF 和 QUIC 協議來實現 2-3 秒的低延遲直播。
三體雲實時視頻高級工程師李幸原將分享低延遲音視頻技術在社交、音樂教育等場景下的技術難點與實現。
愛奇藝 CTO 劉文峰介紹 AI 對於一家多媒體娛樂公司的價值,AI 在影片製作、剪輯、編碼、傳輸、廣告以及個性化推薦等方面做的探索。
Aupera Senior Embedded Vision/AI Engineer Narges Afsham則會帶來如何通過 FPGA 硬體來加速實時編碼、轉碼,相對於 CPU/GPU/ASIC 方案,FPGA 在效率、靈活度以及畫質方面可以達到較完美平衡。
除此之外,LiveVideoStackCon 也關注多媒體技術應用的重要行業場景,如教育、醫療、視頻會議、安防等。
如51Talk 技術總監陳靖會介紹音視頻技術在 51Talk 的應用實踐,尤其在延遲、卡頓方面的優化。
即構科技技術副總裁冼牛將會分享實時音視頻技術在教育、遊戲和社交領域的應用案例。
智慧樹網副總經理襲普照將會介紹在業務快速擴張的情況下,如何選擇技術棧與供應商,保證技術平台的可用性及一定限度的擴展性。
前面提到,在 LiveVideoStackCon 期間提供了若干場面向初學者的技術培訓,旨在幫助學員快速掌握和提高技能。除了 FFmpeg Maintainer 李忠、英特爾資深軟體工程師張華聯手帶來的《FFmpeg 視頻編碼原理與實戰》培訓以外,全民快樂研發高級總監展曉凱還會帶來一場《抖音短視頻特效實戰》培訓,掌握基本的播放器技巧和 3D 渲染,並親手完成各種視頻特效。
One More Thing
正因為「孤獨」,才更享受相聚的日子。LiveVideoStackCon 上準備了豐盛的自助餐,輕鬆的社交晚宴,以及「你問我答」與「幫你約專家」活動。


※深度防範,如何應對區塊鏈安全問題?
※技術就是力量!有人拿走百萬現金,真相卻是……
TAG:CSDN |