專訪考拉閱讀CEO趙梓淳:用AI打造中國的「藍思標準」
近日,專註中文分級閱讀系統的考拉閱讀宣布完成了2000萬美金B輪融資,距去年12月A輪融資過去了9個月時間。
談到A輪以後的最新進展,趙梓淳表示,考拉閱讀App總日活量已經增漲到近百萬,平均日停留時長30分鐘,次日和次周的留存率達到70%以上,產品半年時間發版26次。
雷鋒網來到考拉閱讀北京辦公室,專訪了考拉閱讀CEO趙梓淳。
中文分級閱讀難點在哪?
分級閱讀有幾百年的歷史,歐美都比較普及。在中國,引入分級閱讀的時間也不短,但是,中國跟美國最大的不同在於,無論是像中文在線還是其他公司,基本上停留在書單形式,根據學生年級或年齡來區分書單。
「但是,真正的分級閱讀應該像歐美那樣,根據學生的閱讀能力進行匹配。通過分級閱讀把閱讀解放出來,讓孩子找到適合自己的東西。但為什麼之前沒人像我們這樣做,最大的難點就在於中文文本難度的測量,即如何科學劃分文本難度的等級。」
首先,中文和英文存在著非常大的差異,不同於西方印歐語系繁複的格標記語法系統,漢語語法過於靈活、意合語義相當複雜。英文的基礎組成單位是26個字母,中文的組成單位是字,常用的漢字大概就有3500個。《康熙字典》收錄的漢字大概就有8萬到10萬個漢字,這種複雜構成的稀缺性會導致分析中文的時候,往往需要更龐大的語料。
第二,現代漢語的歷史很短,中國的學者、專家,對中國的漢語言、語言學的一些累積和沉澱其實很少,真正進行科學化的一些研究時間並不長,積澱也不夠。
第三,分級閱讀還涉及到數據挖掘、語言學、測量心理學、閱讀測量學等各學科的聯動。
最後,更關鍵的是,在深度學習普遍應用之前,沒有技術能解決這樣的問題。10年前或者20年前的技術,其實不太能解決當時遇到的這個問題,例如美國的藍思分級,主要運用的是語言學家傳統的統計學,所以其實沒有用太多的高深的技術。中文閱讀分級要想完成規模化的解決方案只能依賴於現代科學技術的發展。
據介紹,考拉閱讀歷時兩年,構建起全球最大的中文分級底層語料庫,結合語言學、測量心理學以及深度神經網路為代表的前沿AI演算法解決了這一難題。
「我們邀請常年參加教學研究的專業學者和經驗豐富的教學專家參與難度判斷和標準制定,通過上萬篇文本測試,發現準確度能達到93%左右。」
AI驅動的學習系統
圖片來源:考拉閱讀App界面
考拉閱讀的產品有學生端、教師端App,還有考拉家長微信小程序。有兩項特點。
一是遊戲化。「我們最早做考拉閱讀產品時,借鑒了國外的產品,做的比較嚴肅,缺乏遊戲和動漫色彩。但做了一段時間後發現,嚴肅產品對中國學生缺乏吸引力,小學生還是喜歡比較遊戲化的東西,後來對此做了調整,引進了一位優酷少兒的設計師,使整個UI和孩子的契合度越來越高。」
雷鋒網試用了考拉閱讀學生端App,主界面第一欄即為「短文星球」小遊戲;第二欄的「探索世界」為ER值不同的閱讀文本;第三欄「聽書電台」為和喜馬拉雅合作的音頻欄目;第三欄為組詞闖關遊戲,第四欄又轉為標註ER值的故事文本,此外,還有童話島、每日晨讀、書籍專題、同學熱讀、書籍海洋等閱讀欄目。
二是AI驅動。「我們是將底層的AI演算法應用到產品層面。這套演算法類似於今日頭條,只不過今日頭條是內容推動演算法,無論是交叉推薦還是做用戶畫像,都是根據興趣推薦用戶喜歡的內容。而我們的推薦演算法是根據學生閱讀能力進行匹配,使用的頻率越多,推薦的準確度就越高。」
圖片來源:考拉閱讀提供
「因為中文句子相較英文要複雜得多,機器在理解中文第一步時就會遇到詞性分析、語言模型上的困難。所以,有賴於現在流行的AI技術,如RNN、LSTM等深度學習技術,可以彌補中文在NLP上的缺失。我們將一個句子按照句法樹、依賴關聯等予以拆解,以分析每一個成分在句子中的比重,從而實現閱讀文本的難度分級。」
據介紹,考拉閱讀一共處理了1300萬字的非平衡語料庫和2億字的平衡語料庫。其中,非平衡語料庫主要來自各個版本的小學教材及其教輔資料;平衡語料庫指一個孩子在日常生活中需要真實接觸的語料,如,按照一位10歲小孩需要看20%的名著小說、50%的課文和20%的漫畫這種比例來配語料庫。
考拉閱讀的人工智慧主要應用,除了打造底層分級標準,還有自適應學習系統,即學生端App會根據學生閱讀能力自動推薦相應內容。
談到現在火熱的自適應學習,趙梓淳表示,自適應學習不宜被過分誇大,基於知識圖譜的自適應學習有一定意義,可以避免學生重複做已經掌握的題目,節省時間提高效率,「但這件事並沒有多難,其實就是把知識圖譜做的足夠細,而這個主要考驗的是教研能力,那你說這個事兒有多顛覆呢?坦白說,沒有多顛覆。」
此外,考拉閱讀也正在進行智能語音產品研發,可以通過語音輸入測試學生的普通話標準程度。
打造中國的「藍思標準」
國外的分級閱讀標準體系已經很成熟,比如培生公司推出的測定少兒英文閱讀能力的DRA(Developmental Reading Assessment)發展性閱讀評估體系;英國 Renaissance Learning 公司開發的AR(Accelerated Reader)分級系統;還有著名的藍思閱讀測評體系(The Lexile Framework for Reading),該體系由美國Metametircs教育公司經過15年研究開發出來,美國使用藍思的機構遍布50個州,約覆蓋全國學生人數的50%。
藍思閱讀測評體系從讀物難度和讀者閱讀能力兩方面進行衡量,使用的是同一個度量標尺,因此讀者可以根據自己的閱讀能力,選擇適合自己的讀物。難度範圍為0L~1700L,數字越小表示讀物難度越低或讀者閱讀能力越低,反之則表示讀物難度越高或讀者閱讀能力越高。主要從兩個維度來衡量讀物難度,即語義難度(Semantic Difficulty)和句法難度(Syntactic Complexity)。
考拉閱讀推出的中文分級閱讀標準(ER Framework )借鑒了國外的「詞、句」的分析思想,度量方式也和藍思極為相似。(ER為考拉閱讀品牌所屬公司享閱科技的英文名Enjoy Reading的縮寫。)
圖片來源:考拉閱讀提供
一方面,把任意的中文文本測出來,從200ER到1300ER,以10為一個進位。另一方面,運用測量心理學、閱讀測量學和語言學的方法,測人的閱讀能力,也是從200ER到1300ER,以10為一個進位。
「如果一個孩子測出來是600ER的閱讀能力,他到底能夠看多大難度的文本?是600還是610?我們提出一個叫CPD的概念,借鑒了著名心理學家維果斯基提出的『最近發展區』,即能力範圍內可以做得到的區間。 別總做一些很簡單的事情,但如果做特別難的事情,久而久之也喪失信心。」
「例如600ER的孩子,我們做了大量的實驗,她/他的CPD範圍大概是550到700。這個區間代表了孩子探究文本的理解程度在50%到59%之間,既不會因為文本太難而讀不懂,也不會因為文本太簡單而讀不到新內容。」
圖片來源:考拉閱讀App截圖
具體測試方式,趙梓淳向雷鋒網解釋,是在手機上進行時長約三分鐘的測試,即可估測學生的閱讀等級。
至於商業模式,「目前主要是和公立學校合作,已經在二、三線城市的近萬所小學落地。未來一定是ToC的,但現在沒有做任何嘗試,學生、老師和家長都可以免費使用。我們目前其實還不太考慮盈利的事,先擴大規模,如果說全中國小學生最後能夠用ER值來表徵自己的閱讀能力,所有的人都用ER值來表徵文本難度,這件事情背後蘊藏著很大的機會。」
「我們準備明年公布整個底層標準,所採用的演算法也可能會相繼公布。」
當雷鋒網問到考拉閱讀目前面臨的最大挑戰是什麼,趙梓淳表示:「最大的挑戰是沒有競爭對手可以對標。這條路以前沒有人走過,不知道參照誰,每一步都要靠自己摸索。」


※瑞士試圖再登加密貨幣寶座
※條條大道通金融,拼多多會走哪一條?
TAG:雷鋒網 |