當前位置:
首頁 > 最新 > 科技讓人越來越「懶」,未來我們可能會閉著眼讀新聞嗎?

科技讓人越來越「懶」,未來我們可能會閉著眼讀新聞嗎?

秉承著科技讓人越來越「懶」的原則,語音正在改變著人們的交互方式,你現在可以用語音輸入代替打字、用語音指令代替觸控操作,甚至能直接跟語音助手對話,讓它來幫你完成一些事情。其實語音技術還有一個用處,就是把文字轉換成語音,讓人們可以用「聽」的方式來閱讀一些文字,這裡用到的就是語音合成。我們在很多公共場合聽到的「機器音」,都是用語音合成技術生成的。

當然,這樣生硬而不帶任何感情色彩的聲音談不上什麼用戶體驗,只是在某些場合完成一些重複性的工作,節省人力成本。但大家有沒有想過這樣一個問題,如果機器音也可以變得不那麼生硬,和真人類似,我們的閱讀習慣會不會因此改變?

產生這樣的想法來源於最近聽到的一個聲音。掌閱的語音朗讀功能中有個「情感男聲」選項(百度語音提供支持),把語速調到較慢,這時它發出的聲音就變得和一些有聲小說的主播類似,有停頓、有語氣、有感情,說出的話就是完整的一句,而不像用詞語拼湊起來的。由此我產生一個想法,如果這種類似真人的聲音可以配合文字轉語音功能大規模使用,我們看到的所有文字新聞是不是就都能轉成文字內容?這樣就不再需要用人工朗讀的方式生成語音內容,用戶也不用再忍受生硬的機器音。也許未來,語音新聞會成為一種新的趨勢。

類似真人聲音+文字轉語音,萬物皆可讀

關於文字轉語音的技術已經有很多公司在做,比如國內的訊飛,他們就做了一個主打有聲閱讀的產品「訊飛有聲」,用語音合成技術代替了人工朗讀。不光是小說,在這裡還可以讀知乎、公眾號、新聞等平台的文章,相當於是把文字轉語音工具、聽書網站、新聞資訊三合一,達到「一鍵朗讀」。和喜馬拉雅 FM 這樣的音頻內容平台相比,訊飛是在用語音合成技術來代替人工,這樣一來創作者就顯得不重要了,用戶可以將看到的任何文字內容轉化成語音,而不用局限於現有的音頻內容。

近幾年音頻節目、短視頻內容興起其實可以說明一件事,就是單純的文字內容已經不夠豐富,不夠吸引人。上班族習慣在通勤路上瀏覽新聞,不斷加快的生活節奏也讓人對長篇文字失去耐性,所以喜馬拉雅、得到這樣的平台可以火起來,讓用戶用一種貼近生活、更輕鬆的方式來獲取信息。誠然,頭部用戶、優質內容是吸引用戶的重點,但從一個較長的時間周期來看,語音平台的發展需要持續的內容生產。毫無疑問,類似真人的聲音+語音合成才能滿足這樣的需求,才具備改變行業的力量。

極客公園的「極客早知道」欄目已經在今年四月份增加了語音播報的形式,我們獨家的音頻欄目「IF Talk」也已經更新了六期內容,很多人反響不錯(大家可以在最新的極客公園 App 3.0 版本中收聽)。如果每篇文章都能以語音的方式提供,是不是會更方便閱讀?這個事情由人工朗讀來完成是不現實的,效率低,效果可能也不好。但如果用類似真人的聲音+語音合成的方式來做,會更容易實現。

訊飛在微信裡面也做了文字轉語音的小程序「訊飛快讀」,不過定位是工具,用戶需要手動把文字複製,或者搜索公眾號文章才能聽到語音朗讀。微信小程序里還有個產品叫「飛鳥聽聽」,他們也是主打文字轉語音的功能,不過並不是做工具,而是在用新聞資訊產品的思維來做。只看文字轉語音的技術的話,好多公司都有這個能力,我們也看到了可以把機器音做得和真人聲音差不多的產品。但是在技術成熟後,更重要的是產品的實現方式和體驗。

語音合成可以填補智能音箱的內容空白

語音新聞會成為未來的發展趨勢,還可以從另一個角度來佐證,那就是現在越來越流行的智能音箱和語音助手。智能音箱的市場已經競爭到了百元以下,門檻降低,用戶增加,這時候內容就成了一個巨大的需求。家裡買了智能音箱的人都知道,現在的語音內容其實很少,而且各家的內容壁壘也高,只靠接入現有的語音內容遠遠無法滿足需求,但如果用類似真人的聲音+語音合成的方式來解決,就意味著有了一個不會枯竭的內容生產機器。誰可以先將技術、版權、產品這些整合,把體驗做好,誰就能擁有它。這可以繞過拼資源的老路,從技術的方面捷足先登。

另外還有越來越智能的語音助手,它對手機的交互已經是產生了巨大的影響,但扮演的角色還是一個介質、一個傳聲筒,如果語音合成可以無限接近真人聲音,那麼語音助手就可以兼任生產者、朗讀者。未來讀新聞的場景可能是這樣的:「Hey Siri!我想讀極客公園的最新文章。」然後 Siri 直接幫你找到文章,並語音朗讀。這時候語音內容就不再受限於人工朗讀,可以隨時隨地來聽新聞。

存在版權、準確度等問題

不管是文字、語音、視頻還是哪種內容,版權都是一個讓人頭疼的問題。當語音合成可以盡量像人,那麼這樣生成的內容該怎麼定義版權呢?如果文字轉語音只是作為一個工具,那內容的生成、消費就只是用戶的個人行為,但如果把它當一個語音新聞的平台來做,這就會涉及版權問題了。

另外,掌閱中的「情感男聲」雖然已經無限接近於有聲小說的主播,但說話是一股說書的味道,如果讓他來讀新聞,可能會有一些違和感。所以要想讓語音合成「什麼都能讀」,可能還需要更多的聲音角色,並針對文字內容匹配合適的聲音來朗讀。

語音合成還有一個問題,就是準確率。連真人都可能把 iPhone X 念成「愛瘋叉」,機器能保證不出錯嗎?比如像 GeekPark 這樣的英文,「極客之選」——極客公園的新酷產品頻道,這樣有複雜符號的內容,怎麼處理就是個問題。文字轉語音的技術必須針對這些具體出現的場景進行優化,讓機器去適應人的文字表達習慣,再輸出成語音。當然,拋去這些細節不說,語音合成的效率和準確率一定是會比人工朗讀要高的。

未來我們會怎樣進行閱讀?

語音內容是符合人們閱讀習慣的,智能音箱等產品的發展也需要大量的語音內容填充,而文字轉語音的技術和類似真人的朗讀已經可以實現,所以未來我們看新聞的方式可能會發生翻天覆地的變化。

首先是語音內容的數量,不局限在已有的人工朗讀,大部分的生產者變成了機器。第二是閱讀方式,語音助手可以兼任助手和朗讀者,用戶只需要和語音助手對話就可以得到想聽的內容。第三是閱讀的設備,手機、智能音箱都可以用來獲取信息,語音助手讓它們無縫結合,語音新聞可能成為人們關注的重點。

音頻內容平台早就進入到了拼資源的狀態,用戶需求和智能音箱的內容空白又遠遠沒有得到滿足,所以我們看到了一些公司想用語音技術改變這樣的局面。「隨身聽」在用智能語音的方式來做內容平台,「飛鳥聽聽」想用文字轉語音的方式做播客,訊飛也推出了「訊飛有聲」,不局限於做一個工具。再加上無線耳機、智能音箱等產品的流行,我們的交互、獲取內容的方式都在「語音化」。當基本技術成熟,誰最先把技術、版權、產品等資源整合,把體驗做好,誰就可以掌握這台永不枯竭的內容生產機器。

頭圖來源:視覺中國

編輯:Rubberso


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 極客公園 的精彩文章:

FF 融資 20 億美元:恆大為第一大股東,賈躍亭出任 CEO;摩拜無門檻免押金新增 19 座城市
特斯拉的護城河:沒有賺「差價」的中間商、可連網升級的系統和粉絲的愛

TAG:極客公園 |