普林斯頓聯合Adobe 連聲音都能PS了
來源 /TwoMinute Papers
翻譯 /季偉
校對 /賢兒響叮噹
整理 /雷鋒字幕組
AI 研習社出品系列短視頻《 2 分鐘論文 》,帶大家用碎片時間閱覽前沿技術,了解 AI 領域的最新研究成果。
第3期介紹文字語音轉換技術。也就是,我們寫下一段文字,計算機把文字轉化成語音。這在閱讀新聞或者在無官方旁白的情況下,對於創作有聲讀物非常有用。
一般來講,我們可以獲取語音波形,也可以對語音波形進行編輯。但手工波形則非常困難,因為傳統技術通常無法準確地找到波形中單詞或字母的分界,更不用說編輯了。
有了這種技術,我們可以剪切、複製甚至編輯文本。這項工作由普林斯頓大學和Adobe的研究人員共同完成,被Adobe自詡為配音界的Photoshop。
想看看基於文本的音頻敘述編輯到底怎麼操作的?戳下方視頻了解詳情。
本期論文
"VoCo: Text-based Insertion and Replacement in Audio Narration"
音頻編輯技術VoCo:基於文本的插入和替換
觀看論文解讀大概需要3分鐘
學霸們還請自行閱讀論文以獲得更多細節
論文原址
http://gfx.cs.princeton.edu/pubs/Jin_2017_VTI/
關注 AI 研習社(okweiwu),回復1領取
【超過 1000G 神經網路/AI/大數據、教程、論文!】
吳恩達這本書是你踏入DeepLearning.ai的必修課


※吳恩達創業第一波 看看哪些大咖為他站台
※用GAN來做圖像生成,這是最好的方法
※Google AI 實力打臉:你真的懂機器學習嘛?
※在ADAS中運用多任務深度學習框架
※別人在刷屏而我在讀書!吳恩達這本書是你踏入deeplearning.ai的必修課
TAG:唯物 |
※SONY Xperia Ear Duo 讓你聽見亞絲娜的聲音
※經濟實惠型的Soundbar5.1環繞聲音箱系統 Polk Audio MagniFi MAX SR
※NEXT Studios與Bilibili聯合發行的第一款遊戲:不玩畫面只玩聲音的《Unheard-疑案追聲》
※Microsoft Soundscape iOS 應用:3D 聲音為盲人語音導航
※羅技LightSync技術開啟RGB新玩法 聲音、跑馬燈一起歡騰
※BOSE Companion 2 III聲音震撼 在家也有影院體驗
※聽見"吃雞"的聲音!1MORE電競耳機Spearhead VR 圖賞
※朴燦烈Punch首次live合唱鬼怪插曲StayWithMe,聲音溫柔現場穩!
※聲音的12道風味——PIEGA Master Line Source 3 首評
※聆聽時代的聲音 Audio Technica/鐵三角AT-LP60BT黑膠唱片機
※XTZ Cinema S2 Atmosphere XTZ全景聲音箱 瑞典名韻
※《中國好聲音》謝霆鋒為拉票上台即興solo 學員竟選了哈林
※超越外形體積的飽滿聲音!——Talk Electronics Edwards Audio IA6-R合併式放大器
※The Voice of Distance 距離的聲音
※Windows聲音還能DIY?打造獨一無二的系統聲音
※HomePod對比雙Sonos One:立體聲音頻更勝一籌
※Dirac Research AB :讓VR聲音體驗更真實
※ORB Clear force Ultimate:聲音變得更溫和舒服
※OpenAI提出Sparse Transformer,文本、圖像、聲音都能預測,序列長度提高30倍
※首款AI骨聲紋無線耳機 榮耀FlyPods Pro評測:Magic2聲音鑰匙