當前位置:
首頁 > 最新 > 喜馬拉雅副總裁:今天的人工智慧音響,大多是智障!

喜馬拉雅副總裁:今天的人工智慧音響,大多是智障!

這是一刻講者李海波@一刻talks第70場演講局的分享,作為喜馬拉雅副總裁,他在演講中講述了他對於聲音外在美學與內在美學的追尋之路,以及他對聲音和生命原本價值的思考。

「每一個人的耳朵都是平等的,我們都值得享受最動聽的聲音,聆聽並不需要多麼昂貴的設備,因為真正打動人的是這些聲音背後的故事。未來,智能音箱或許會為我們提供更多和這個世界連接的辦法,聲音將滲透進生活的方方面面,把我們從大量的視覺信息中解放出來,拯救我們越來越匱乏的想像力。」

我是一刻講者李海波。四年前也是在這個 77 劇場,我與聲音的一段連接正是從這裡開始,當時胡偉立老師在這裡為我們講電影音樂和這個世界的美。

那一次聽胡老師的音樂,聽他講在這 60 多年的過程中間,作為香港電影音樂第一人,他是怎麼把人生情感介入到音樂裡頭去的?巧合的是此後四年時間,我一直沿著聲音這條線在做產品,做各種各樣的探索。一路走下來,我一定要感謝那一天在這個劇場的開始。

我希望用聲音來傳遞價值,我們這四年的努力,可以用劉慈欣的一句話總結,他在《三體》裡面最著名的一句,「給時間以生命,給歲月以文明,而不是給文明以歲月。」

我們把這句話提煉成了這四年做事情的底層邏輯。我知道其實不管你是做企業、做人、做商業,都是一直變化的,技術在更新,有太多太多新鮮的東西出來,但是一旦你找到自己的常量,企業的常量,你就會非常坦然的面對每一個最新的變化。我們對聲音外在美學和內在美學進行了多年的探索,我想跟大家交流的就是我找到的常量到底是什麼?

長生是人類幾千年來不變的需求,但是從生物意義上講,這件事幾乎沒有人能做到,怎麼辦呢?我發現了一個好路徑,就是能不能把生命的厚度和寬度做延展?

我做過十年的農民,開過兩年的照相館,當了十一年的記者,後來又去做電影的編劇,去創辦《科學松鼠會》,去法國做一本科學雜誌,再後來和幾個朋友一起做創意產品的麥極網,然後乾脆把這件事情縮減到李海波的趣味,做了海趣網,專註於做一個發燒音箱,最後走到了喜馬拉雅。

這些看起來好像完全不搭桿的事,但每一個經歷我都看作不是一條線走到生命終點的歷程,每一條路徑我經過一些年的探索,左衝右突,它可以延長我的生命寬度

說到音樂,我來自甘肅的一個農村,31 年前,我第一次聽到的音樂是《費加羅的婚禮》,大家可能會奇怪,一個連電都沒有的地方,幾乎可以說是全國最窮的地方之一,為什麼能聽到這些東西呢?我爸爸是當地的廣播站站長,他手裡面有個小小的權力,每個禮拜,縣裡面的圖書館會送一大堆的唱片,這些唱片絕大多數都是紅歌和上面的政策文件,有一次應該是送錯了,滿滿一箱子全部是莫札特,我們在村廣播站裡面,用一個老舊的唱機,放出來一張紅色透明的薄薄的唱片,居然是《費加羅的婚禮》。我當時根本不知道它叫什麼名字,我只是覺得世界上怎麼有這麼好聽的東西,第二天就被大隊書記叫停了,說這種東西不可以放,你們拿回家去玩吧。拿回家出了一個問題,我沒有設備聽,也沒有電聽。

1985 年我爸爸開始帶我學習怎麼樣做一個自己的音響,以便把家裡這一箱子唱片聽一遍,最早拆家裡的蒸鍋,去南京買巨大的 20 寸大喇叭,自己學著做音響,這件事情到今天做了多少年?

做了 30 多年一直在做,我們做過各種各樣的音箱,到今天為止做過上千種了,人家經常開玩笑說我是一個特別糾結的人,可能因為我是處女座,處女座就是非常討厭妥協,我一直試圖還原我當年聽到的那麼美的聲音,其實真還原不了,當時是一個高音喇叭播放的,它沒有多好,但是那一瞬間帶給你的精彩震撼,幫你打開這個世界的另一扇門的感覺,你永遠都找不回來。找不回來怎麼辦?我就想辦法,通過做不同的音箱,想要尋回那種感覺。

我在大學的時候成立了一個隨身聽協會,搜集了全世界幾乎大部分知名的品牌,一共 121 個隨身聽,一個一個的去畫他們的曲線。看每一個技術到底能夠把這個聲音還原到多好?到今天為止,我個人收藏有 51000 張黑膠唱片,我一張張去聽,一張張去比較,並且寫出他們背後的故事,包括自己寫樂評。我想讓大家知道這個音樂背後到底是什麼東西在打動我們。給大家分享一個小故事,大家就知道我這個人有多糾結了,我們家有三台投影儀,這三台投影儀的色溫是不一樣的,我會看這個導演拍的片子是偏冷偏暖還是中性,來選擇不同的投影儀。這個事被我們家那位批評了很多次,看一個電影居然要在那挑投影儀,這是處女座都會犯的一個大毛病。

其實做音響的這二十多年我一直在探索聲音的外在美學,我想還原這四年來做喜馬拉雅的過程,其實是內在價值的探索。四年前第一次在這個地方發布的時候,曾經在邏輯思維上創造了一個年度的奇蹟,4 萬多的一個音響,一早上 8 小時賣了 147 套,成為了國內的一個奇蹟。然後我居然把這件事情放棄了,放棄是因為我發現背後有我更應該做的一件事情,就是找到聲音的內在價值在哪裡

我和音樂還是蠻有緣的,說起來張瑋瑋和郭龍大家應該比較了解,還有《白銀飯店》張佺他們,我跟他們是一起創辦「野孩子樂隊」的,很多年前在蘭州的時候,我們在地下樂隊,包括當時大家可能聽過小眾音樂人張尕慫,他是我的高中同學,我們一起在酒吧裡面彈唱的。

這四十年我一直忘不了的,最美的聲音只有兩個,第一個是《費加羅的婚禮》,第二個是我在大學的時候和我的前女友一起聽的一首音樂,當時一人一隻耳機,我就發現音樂並不在於器材有多好,能打動你,而在於當時的情景和場景。

所以把這些外在的屬於自己的東西,要變成大眾化的東西,怎麼辦呢?我們去尋求一種方式,我發現黑膠這種形態,它把整個人類的編碼和記錄做了新的改變,其實當年愛迪生髮明黑膠唱機的時候,它是用來給貴族做遺言記錄的,因為後人想要聽到這個人臨死前說了什麼話,23 秒的記錄是用一張黑膠唱片來實驗的。貝林納和愛迪生兩個人不小心做出來的東西,居然成為今天一個新時代、新工具以及新出版的代表,這事是怎麼發生的呢?

因為記錄形態的變化,我們每一個人都開始有機會能夠接觸到音樂,從前其實音樂還是蠻貴的一個東西,不管是唱片、黑膠、CD、還是磁帶,它需要的成本還是蠻高的,今天的數字化完成之後,我們發現兩件事情得到了改變。第一件創作者開始有更多的機會把自己的作品上傳上去,同時獲取者能夠有更好的機會拿到這些,我指的不僅僅是音樂,而是指聲音、認知、文明、信息,就像剛才相征說的,原來你到電台去做一個節目,是非常高的門檻,可是現在藉助數字化工具,我可以瞬間觸達到數億的用戶,完全是不一樣的概念。

我們再回到剛才講的,為什麼奇葩的胡老師幫我們第一個來代言這個產品,能夠做到那麼久呢?我發現其實只是解決了一個消費升級階段。大家對於高端發燒器材的玄學裡面的鄙視鏈,這個鄙視鏈其實很多人都看到過,今天為什麼音樂行業、高端音響市場,從 90 年代幾乎是中國異軍突起,到今天一路下滑,是因為港台、新加坡這些地方用了二十年的時間幫我們建立了一條鄙視鏈,讓你聽不懂音樂,它覺得如果你連背後的那些線都搞不清楚,你跟音樂是沒關係的,如果你不知道什麼是相位差,如果你不知道那些名詞,如果你沒有錢買一個十幾萬的設備,你跟音樂是無緣的。

我們其實就是做到一件事情,我告訴大家,每一個人的耳朵都是平等的每一個人都是值得去聽,值得去享受這些好東西的。所以我們每一次給大家的試聽會我都用最爛的音源,最差的喇叭,但是我講出這首音樂背後真正打動你,能讓你感動到哭的這些內容,這才是打破鄙視鏈最好的一個方法。

今天我不講產品,產品本身是沒有意義的,我只是講產品背後我們所秉承的價值觀,當時這件產品能夠做到奇蹟般的,一年 1200 套的銷售量,我只有 4 個人的小團隊,其實我們是擊中了一個生活方式和價值觀的升級,而不是很多人給我們總結出來的它是一個裝逼利器,它是消費升級,它是美學升級,它是品質升級,跟這些都沒有關係。

我只是恰到好處的找到了我想要打動的人在哪裡,我想要幫他們打開音樂之門的這些生命在哪裡?我提供給他一個傻瓜式的一個設備,讓他能夠體會音樂的美好,僅此而已。

這些東西做到一定程度之後我發現最終還是一個小眾市場,我能想的也就那幾千個人,我們希望讓信息文明和認知從聲音這種編碼得到最廣泛的傳播,這件事情我們把它總結出來,其實所有人類文明的信息的傳承全部是編碼的一個代表,從當年的岩畫、書簡到計算機的 PC 時代,再到觸屏時代,接下來的 AI 時代,我們其實一直在做的是信息能不能得到更高效的傳播,文明能不能得到更有利的傳承。這兩件事鑄就了我們這四年來做喜馬拉雅的過程。你說這事有多複雜嗎?我們能夠在四年之內,能跑到所有人的前面去,今天有 4 億的用戶,70 % 多的市場份額,怎麼做的呢?一共只有九個字,這九個字是「哪裡來?哪裡去?憑什麼?」

其實和人的終極之問是一樣的,哪裡來?這個世界上有那麼多的有知識,有認知,有見解的人,我需要提供一條最簡潔的路徑,讓他們能夠把自己的認知分享給大家,因為這是一個信息爆炸和認知盈餘的時代,每一個人都有在某一方面和別人不一樣的東西,比如說我認識的唐老師,唐老師帶我喝懂了威士忌,我就把他請到喜馬拉雅來做威士忌,他就發現,怎麼辦啊?我又不懂主播,我不會主播工作台這些。我告訴他一部手機,一個耳機,你每天在家裡錄就行了,剩下的東西我們用技術的手段去實現。

這一條原則一旦確定,我們發現喜馬拉雅在一年之內做到了從 1 萬 7000 主播增加到了 470 萬主播,到今天已經有 500 萬主播加 30 萬大V主播。我們只是提供了一個工具給大家,讓大家更容易把自己的簡介傳遞給更多人。第二,當這 500 萬人做出來 1 億 1 千條內容的時候,手機的屏幕就這麼小一點,不可能我觸達到每個人的屏幕上去,怎麼辦呢?我們學習今日頭條的方式,用大數據分析,看你家裡有沒有孩子?你平時喜歡吃什麼東西?你去哪一些地方?你的收入水平如何?比如我知道你是個音樂愛好者,因為你前兩天在百度搜了巴赫的唱片,我就會把田英島的音樂推薦給你。

每一個人,千人千面系統的採用,讓我們在短短一年半時間裡面,用戶量從 7100 萬上升了 3.5 個億,突破了 4 億用戶。因為發現電台不再是一個別人選好我來聽的電台,而是我想聽什麼就由我來決定的電台,我打開上面全部是我愛聽的東西。解決了這兩個問題之後,我憑什麼讓人家留在我這上面聽?憑什麼讓人家留在我上面做節目呢?

實話實說,我們就是一個聲音版的淘寶網,我搭建了一套交易系統,我讓所有有價值的人在這裡能獲取他最有價值的收益,即使是只有 1 萬粉絲的小主播,或者是有一千萬粉絲的大主播,他們都能實現在我們平台,從 1000 塊錢到 1000 萬不等的收入,去年最高的時候,光付費節目的收益就有 6900 萬,一個主播,就有這麼多。

我舉幾個例子,有些掙到這麼多錢的人還只是大學生,還沒有畢業,大家可以去聽一下,有聲的子君,每天讀一個玄幻小說,他讀得特別好聽,聽到第三集你就會一直往下聽,他前 10 集都是免費的,第 11 集 4 毛錢一集,每一部小說讀完需要 200 到 300 集,他到今天為止在喜馬拉雅有 141 部小說,《茅山道士》《盜墓筆記》這些都是他讀過的,是大家最愛聽的,平均播放量達到了 16 個億。

所以我們為什麼敢去做付費呢?而且付費在 12 月 3 號這一天,我們自己做了一個聲音節。昨天是雙 11 節,雙 11 非常有意思,七、八年前,雙 11 第一次開始的時候,當天的銷售額是多少?是 5080 萬,去年我們 123 聲音節,第一次做聲音這件生意,24 小時的銷售額是 5088 萬。我其實有一個夢想,我希望再過 8 年,關於認知,關於知識這件事情是不是能像今天我們在淘寶剁手一樣,也變成再正常不過的一個行為,我願意為了知識去付給這些提供知識的人價值,這才是理所當然的一個事情,因為他們幫我們在這個粉塵化爆炸的時代,幫我節省我的時間。

你知道人類誕生到今天一共產生多少位元組嗎?到 2013 年我們人類一共產生了 5 艾位元組,5 艾位元組就是 50 億部 1G 電影的容量,2017 年這個數據是多少呢?47 秒鐘產生 5 艾位元組,我們已經完全面臨信息爆炸到沒有辦法承受的時候,我需要讓這些專業人士站出來,在你們認知的領域內,幫我篩選一下什麼值得看,什麼值得聽,什麼值得買?

所以用戶和圈層的細分讓所有的知識形態都可以變成有價值的知識,比如馬東可以每天教你 5 分鐘怎麼跟人來對話,怎麼跟人來交流;龔琳娜可以教你在 KTV 裡面怎麼唱好歌;蘇珊米勒可以每天早上告訴你,今天的星座運勢怎麼樣;華少可以每天講一個鬼故事,有些人真的很有怪僻,每天願意聽一個鬼故事;樊登可以每周來跟你講一本書,我列在這裡的,只是我們 2300 個付費節目中間超過一千萬銷售額的這些人,其他有非常多垂直領域的專業認知者,讓知識變得開始值錢起來了。所有這些東西我們把它叫做知識的 IP,我們喜馬來做什麼呢?喜馬只是一個搭建了知識 IP 的長尾變現系統,讓我找到人在哪裡。

我舉一個例子大家馬上就能聽懂,去年我在上海聽了一堂陳志武教授的課,他講金融學底層原理,6 個小時時間,我交 5200 塊錢,現場跟咱們差不多,400 多人,陳老師講得挺辛苦的,他一年要講 6 次的這樣的講座,我們把陳老師的課搬到喜馬拉雅之後,每天 45 分鐘,整整講 365 期 200 塊錢,你知道有多少人買嗎?一周就超過 1000 萬的銷售額。陳老師也很高興啊,他只講一次就可以了,就可以面向 4 億用戶去篩選誰願意去聽他的課,我們把兩端的價值一下就連接起來了,我也能聽得起他的課了,只要 200 塊錢,我還可以聽一年呢。這樣的專家學者我們今天已經有 2600 個,這些名師們每天在給大家分享,他們領域內最高的認知,同時也有一些特別好玩的小樂趣,比如田藝苗老師會來講古典音樂,恆老師講威士忌,汪起源老師講科幻到底是怎麼一回事,尤其打動我的其實是今年新上的一個人,因為這個人讓我知道大家原來並不是光想聽那些有用的知識,也願意聽一些沒有用的東西了,這個人叫胡婷婷,就是《婷婷詩教》的創作者。

現在平均每天有 6000 萬孩子在聽他的詩教,我兒子今年 6 歲,上小學兩個半月,小學裡面要求孩子必須要會背 15 首唐詩,那天我問他會背多少了?我拿那個清單在那畫,我發現他居然會背 75 首,我說你哪學來的?他說每天我聽小雅都在聽《婷婷詩教》,他唱兩遍我就記住了,我說你真的記住了嗎?他搬出來一摞畫證明。因為我長期出差不在家,也是很遺憾。

我們在部門裡面新成立了一個項目叫做給孩子磨耳朵,給鄉村的孩子送聲音,為什麼要給鄉村的孩子送呢?因為中國像胡婷婷這樣的人太稀缺了,而中國的三四線城市以及鄉村它是聽不到這些好東西的,我們希望讓喜馬拉雅來發力,把這些好東西,把 K12 的這些教育全部普及到最底層去。

當我們完成以上所說的所有信息彙集之後,就要去做分發,要觸達人。在前面四年我們比別人跑得快,就是因為掌握了一個訣竅,用大數據的方式實現了分發,可是接下來大數據不管用了。我們之前做過一個非常不好的嘗試,就是我把全站 6800 萬條庫開放給了所有的合作夥伴,一共有 2000 家接入,最後很多家接入都覺得接得非常不爽,不爽的一個極端的例子,我給你講出來,可能大家都會笑。

有一家路由器接了我們的喜馬拉雅內容,這個路由器每天早上七點到八點開始會給你播報喜馬的一些內容,播什麼他說了算,播什麼他隨機選,然後你還沒有開關關掉它。這個事情直接導致原本銷量很大的一個路由器銷量嚴重下滑,因為大家覺得這個東西實在是打擾到我了,它沒有屏幕,沒有辦法選擇,沒有語音交互。

接下來最重要的分發裡面,我們來看一個數字,今天喜馬拉雅的日活用戶,每個單個日活用戶平均使用時長是 128 分鐘,這個數據為什麼重要呢?所有的企業的價值無非就是 A 乘於 B,A 是用戶的數量,B 是用戶的價值,我們的用戶價值就在於他的停留時間,那我怎麼樣才能做到你能聽 128 分鐘之外再聽 200 分鐘,再聽 300 分鐘?通過手機這是永遠都不可能做到的事情,一個人手機哪怕長在身上,我也不可能一天聽兩三個小時,這事會很煩,我需要去覆蓋一大場景,叫作萬物有聲。在大家做萬物互聯的時候我們做萬物有聲,我想覆蓋你早上起床的那 5 分鐘,我想把你洗手間裡面那 10 分鐘時間佔領,我想把你做飯的時候,耳朵閑著的那 15 分鐘佔領,我想把你開車路上的這一個小時佔領。

所有的這些加總起來,不就又給我增加了 100 到 200 分鐘嗎?這個企業的價值, A 乘 B 這個量不就可以又一次被放大嗎?這一切都依賴一件事情,就是人工智慧的語音系統。

人家都說喜馬拉雅也做人工智慧,因為我們 6 月 20 號發布了一個人工智慧音響—小雅,大家可能會說你們不是趕潮流嗎?你們不是追風口嗎?你們不是覺得人家都在做你們也做一個嗎?我無數次告訴大家,我們是感覺到了生存的危機,我在做一件救命的事情。

當 5 年之後,技術的發展讓大家不在用手機的時候,我們一個活在手機裡面的 APP 出路在哪裡?我怎麼才能活下去?這個活下去的唯一路徑就是我要去找到我能夠場景化的方式,今天其實大家看到人工智慧這四個字千萬不要相信,即使像阿爾法 0,阿爾法 go 這樣的產品它也只是在某一個特定領域做到了一個自循環的演算法而已。

諾貝爾生物學獎獲得者蘇德霍夫曾經說,「今天的人工智慧和腦神經科學、認知科學沒有半毛錢關係。」我要告訴大家今天為什麼大家看到的智能音響大部分是人工智障,比如你說給我播個郭德綱吧,你說一百遍,它給你播的都是同一個郭德綱,你相信我,一定是這樣子的。你跟它說我要聽盜墓筆記,它才不管你上次聽到哪了,它每次都是從第一章第一節第一頁開始播,會把你煩死,這東西根本就沒法用。

你說我要聽下一曲,你必須準確的說出來「我要聽下一曲」這五個字,你說我要聽下一首它就聽不懂了,就懵逼了。今天所有的人工智慧想讓它變得智能,背後全部都是人工,這是真相,我們 1 億多條音頻,有 200 個實習生,每天一條一條在幫大家梳理,到今天為止我們梳理了大概 300 萬條,距離 1 億條還有很長的路徑要走,如果不梳理是什麼結果呢?你說你要聽郭德綱,調出來是一個跟郭德綱沒有一點關係的一條音頻,因為背後的演算法和邏輯是對不上的。

今天所有的行為,我們這幾百人在做,其實就是把演算法和數據和用戶的行為做一個良好的匹配,這個不叫人工智慧,這叫一個大數據的優化演算法。所以大家一定不要上當,所謂的今天的人工智慧就是連連這個電器,連連那個電器,可是你發現沒有?中國的電器的標準有無數種之多,我們每一個人家裡最多有一種能夠跟這個東西連起來,難道我買一堆的東西把它的都連到一塊嗎?再過 5 年這事也是有可能的,但是今天呢大家都是剛剛起步,都在探索,都在想盡辦法去撲,但為什麼要義無反顧的撲到這件事情上去呢?

就是我剛才講的,我希望大家起床之後,不要再去摸手機,我希望孩子遠離那些視覺的東西,給自己多增加一些想像,我希望我們的老人能夠用自己懂的語言,能跟這個世界有一個連接的辦法,老人其實很可憐的,智能手機完全不會用,找廣場舞,找紅歌找這些他不會找的,他得來求著我們這些孩子,幫他下載,幫他找這些東西。可是世界原本就應該是公平的,我們需要提供一個方式,讓他們用他們會的方式,他能夠找到和這個世界的連接辦法,讓不識字的孩子儘可能多的遠離,這些都是聲音可以做到的一點。

所以其實大家都說,我們做這個企業,我們從電台,最後變成了出版社,變成了平台,今天居然你們還變成個 AI 來,我們一切都沒有變,我們所有的常量都是在想辦法,在平行時空裡面,在延長大家的生命的價值,在做時間這件事情所有的技術只是我們的工具,只是我們的變數而已。我記得兩個月前,曹燦藝校的一個老師給我分享一個朋友圈,他說我註冊了喜馬拉雅 420 天時間,聽了 3300 條聲音,我在上面我發現我過了 60 天的時間,這 60 天是我多出來的生命的 60 天,因為我沒有耽誤一點點事情,所有的這些時間原本都是應該被浪費掉的時間,我居然聽到了那麼多的東西,這就是我們這個產品最後要實現的價值,我要給時間以生命,給時間以生命,最後回歸過來,我要給兩端的人建立一個價值,一端我要尊重這個社會那些創造者,我給那些創造者讓他們站著就能把錢掙了,你能貢獻知識,好,沒關係,我來給你實現收益。

這另外一端連接的其實就是我們每一個個體的時間,我們讓大家變得懶一點,讓你用聲音就可以獲取那些,你想要的那些東西,讓你把時間騰出來,能去體驗這個世界更美好、更高效、更有意思的那一些空間、時間和瞬間,這就是聲音原本應該存在的價值。好,謝謝大家!

一刻talks ? 全球創見者分享平台

長按下方二維碼發現更多未知驚喜

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 一刻talks 的精彩文章:

令吳彥祖感動流淚的中國建築女神,美得不像實力派!
我們真的需要製造帶有人類情感的機器人嗎?
從無人問津到備受追捧,Molly之父的玩具生存之道
「AI引爆的教育革命就快來了嗎?」四位教育實踐家這樣說
打造智能音樂的音聯網聲音設計師:什麼音樂「最懂你」

TAG:一刻talks |