當前位置:
首頁 > 科技 > MUTA:AI寫歌不稀奇,但把情緒帶進歌里是怎麼回事?

MUTA:AI寫歌不稀奇,但把情緒帶進歌里是怎麼回事?

動點科技 | ID:technode

明星偶像的產生不止源於三次元。從初音未來到赫茲,虛擬偶像的出現立刻將廣大的二次元群體吸引,並聚合了強大的粉絲效應。不過,外行看熱鬧,內行看門道。究竟什麼樣的技術在支撐著這風風火火的虛擬偶像熱?

其中,如優他動漫科技這樣的語音合成技術公司就是核心的參與者。該公司致力於開發可高度還原人類聲音的語音/歌聲合成引擎。據悉,其是國內首家以獨立自主研發的中文語音合成引擎(MUTA)為核心,同時開發並設計具備感情模式的雲端音庫包括動漫視音頻製作等在內的數字虛擬鼓舞平台提供商。

「行業中大部分企業都把主要的精力放在語音理解中。而把語音合成,做到跟人一樣是我們的最終目標。」 優他動漫科技的 CEO 邱志豪說。

其服務的產品包括虛擬歌姬形象嫣汐、琉璃、友繪等,為 2 娘(B 站)、蒂菲爾(西山居)、琥珀虛顏 未央 希聲(中國電信)等提供歌姬聲庫製作。

據邱志豪回憶到,2014 年公司成立的第二年時,很少有國內公司願意做虛擬偶像。後來,市場出現的也是真人配虛擬的形象,用一個虛擬的角色配上真人歌手。「但這樣的形式很難抓住用戶的。因為是官方運營的話,用戶就沒有產出。虛擬 IP 很難持續化,除非官方得不停投入資源。「他說。「實際上明星的流量主要靠緋聞,熱點,或者各種吃瓜過程積累。官方還是要給用戶提供賦能,用戶才會基於這些梗再去產生更多的內容,將 IP 做大。」 他補充道。

邱志豪認為在語音合成的虛擬偶像應用上,需要有持續的解決方案,才可以增加用戶的活躍度以及粉絲的黏度。所以,優他動漫科技提供了中文語音合成引擎 MUTA。首先,可以基於這套引擎做的虛擬偶像,後面其還提供做粉絲運營的 APP。據悉,粉絲可以在 APP 裡面用各明星的聲音,進行一個二次的創作或者二次運營也好。「假如周杰倫封麥了,我們還可以通過電腦去用他的聲音創作歌曲。」 邱志豪說。

據介紹,該 APP 操作簡單,沒有專業樂理基礎的用戶也可以輕易上手。僅需戶輸入任意語句,系統即可合成高品質的語音或者歌曲。就像我們拍照片後修圖直接在軟體內選擇需要的濾鏡一樣,用戶可以創作一段歌詞,然後選取喜歡的樂曲風格,人聲進行組合。「以前的軟體不是專業音樂人根本用不了,我們希望能做一套,讓每個人動手打字就可以創作的軟體。」 邱志豪介紹道,優他動漫科技的技術有三方面明顯的優勢:

一:音質優秀,可適應複雜的語言。音庫體積小,市面上唯一可適用於 APP 上的歌聲合成技術。

二:製作周期短,還原度高,可保留 90% 以上原聲音色與自然度 。

三:人聲自動適應歌曲減少 80% 的調教量 。

此外,邱志豪透露,MUTA 已經到了 3.0 引擎時代。MUTA 3.0 最大的特點即是加上了人工智慧,可以將普通、悲傷、快樂三個情感模式混合,基於語音合成可以做出有情感化的內容。

而且和許多傳統的語音合成不同的是,MUTA 3.0 可以基於 DNN 網路來學習人的聲線,發音方式,還有語氣。來學習人的習慣和音色,並推測其發音、聲線。「所以不需要唱每個音,只需要一段素材,電腦就可以推測一些沒唱過的音,然後按照這個人的風格和發音方式進行模擬。」 邱志豪說。

而傳統的語音合成方式需要人在錄音棚里說中文所有的字,記錄發音。這個過程基本上得錄很久。「我們的方式是你在錄音棚里讀 2000 句話。500 句開心,500 句悲傷,讓機器學習你的情感。對一個明星來說的話,他不可能在錄音棚里錄六個月。」 邱志豪解釋道,MUTA 只需要拿到這個人大概 30 分鐘的歌唱素材就可以訓練出來跟這個人差不多一樣的聲庫。「MUTA 3.0 想要解決的問題就是在有限的素材下,能夠繼續學習。」 他說。

其 APP 是在去年上線,目前大概有 150 萬首用戶填詞的歌曲。此外,目前,APP 對 C 端用戶免費。邱志豪透露,接下來會考慮推出一些付費的服務。此外,邱志豪還表示,為了能做到赫人聲一樣的效果,接下來會推出更大的技術突破。「人聲音的採樣越高越好,真正達到高保真的聲線是 4800 赫茲的採樣,我們在 3.0 已經做到了 1200 赫茲,4.0 可以做到 4800 赫茲,就是說它可以真正意義上實現和真人一樣的聲音。」 他說。

據悉,優他動漫科技已經完成了天使輪和 A 輪融資,其中融資方包括 B 站。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 動點科技 的精彩文章:

360 5S 防火牆:這個路由器想玩轉你殘留的童心,但……
Facebook 表示公司不應該被拆分,因為它太成功了

TAG:動點科技 |