作者:紅印兒 發布時間: 2017-12-20 07:00
作者:紅印兒 發布時間: 2017-12-20 07:00
芥末堆 紅印兒 12月20日報導
「當你吃完一塊蛋糕,想再找一塊與之相似或者完全不同的蛋糕時,光靠蛋糕名字是很難進行判斷的。」考拉閱讀創始人兼CEO趙梓淳說,「你需要知道蛋糕裡面都有哪些原料、原料配比如何,才能進行比較和選擇。」
這個情況也適用於兒童閱讀。2016年,全國共出版少年兒童讀物43639種,圖書種數比2015年增長19.12%。面對浩如煙海的書目,想在最短的時間裡找到自己喜歡的讀物並非易事。尤其當兒童還不夠了解自身的閱讀能力水平時,選擇適合自己的閱讀內容就變得難上加難。
考拉閱讀希望用中文分級閱讀產品為K12學生提供適合的閱讀內容。趙梓淳從兩個方面來解釋「適合」的意思,「一方面是孩子看得懂,也就是文本難度適合;另一方面是孩子感興趣,也就是內容適合。」
細化內容顆粒度,用分級閱讀標準量化文本難易度要想給學生提供適宜的閱讀內容,考拉閱讀需要一套能夠同時測量文本難度與學生閱讀能力的標準,進而將學生與適宜難度的文本匹配起來。
實際上,英語分級閱讀中已有較為成熟的分級量化文本難度和讀者閱讀能力的做法,例如覆蓋美國50個州的藍思分級體系。藍思分級閱讀測評體系主要從詞頻和句長來判別文本的難度。但由於中文獨有的一些特點,這兩個判別維度都不完全奏效,考拉閱讀團隊需要對測量標準做很多特殊處理。
比如,中文裡的一些低頻詞其實並不會過多影響讀者理解文本的意思。 「『鬣狗』這個詞不常見,『鬣』的字形還很複雜。但當『鬣狗』兩個字作為一個詞出現時,不認識『鬣』字也不會影響閱讀理解。」 趙梓淳說,「所以不能單以詞頻來判斷中文文本的難度。」
考拉閱讀建立的中文分級語料庫文本難度與閱讀能力測量是一項集統計學、語言學、數據挖掘、人工智慧技術、心理學等多領域知識與應用於一體的工作。考拉閱讀團隊處理了1300萬字非平衡語料庫,近兩億字平衡語料庫,最後搭建出名為「ER Framework」的中文分級測量標準。該標準可以測量出任一中文文本的難易度或任一學生的閱讀能力,以200ER-1300ER為難度區間,數值越大,文本難度或是閱讀能力就越高。
基於ER Framework的測量結果,考拉閱讀的系統會自動為學生推薦難度適宜的圖書,學生也可以自主選擇與自己閱讀能力相匹配的圖書。考拉閱讀還在通過「圖書基因組計劃」對文本內容做更加精細的解剖。「例如,如果可以計算出某本書有3%的恐怖元素,另一本書的大部分內容都跟聖誕節有關,就可以進一步優化圖書推薦的算法。」趙梓淳說。
掃描學生閱讀能力,輔之精細化運營測量出學生的閱讀能力是向學生推薦閱讀內容的另一前提。考拉閱讀的閱讀能力測評涵蓋五大維度,對最基本的信息提取能力到較為高級的實際運用能力均有考察。
為了讓測試結果更加容易理解,考拉閱讀將ER值與學生在小學一年級到高中十二年級之間的閱讀能力對應起來。一年級到十二年級的閱讀能力按照年級被分十二級,再按學生在該年級的就讀時長做進一步細分。「比如,『5.1』就代表五年級學生在讀完五年級第一個月之後的閱讀能力水平。」趙梓淳解釋。
閱讀能力測評標準基於學生的海量數據建立。截至2017年11月,考拉閱讀聯合教育部基礎教育質量監測中心和國家語委漢語智能教育中心採集了全國三十餘萬K12學生的閱讀能力信息,繼而打磨出學生的閱讀能力量表和常模。
考拉閱讀建立的中文分級閱讀測量體系不過,不同經濟發展水平地區的同年級學生閱讀能力差異不小。例如,北京中關村某小學三年級學生的閱讀水平可以達到5.5,而甘肅省某鄉鎮小學三年級學生的閱讀水平卻只有1.6。因此,同一常模與量表在不同地區並不完全通用。「接下來我們想把常模做得更細。」趙梓淳說,「比如分別製作華東、華北、西北分區的量表。」
診斷出學生的閱讀水平之後,考拉閱讀會向學生推薦適合的閱讀材料。「我們就像今日頭條那樣做推送,但推送不僅僅是基於學生的興趣。」趙梓淳說。考拉閱讀推送的閱讀內容包括自主研發的短篇閱讀、新課標書目、兒童圖書大獎獲獎作品、京東和噹噹的暢銷書等。
即便是同樣的文本,不同閱讀能力的學生看到的文本標籤也會有所不同。「比如曹文軒的《草房子》這本書,一些學生看到的圖書標籤是『小菜一碟』,另一些學生可能會看到『適宜閱讀』的標籤,還有一些學生看到的標籤可能是『值得挑戰』。」趙梓淳說,「每個孩子看到的都是不一樣的東西。」
推送自適應的閱讀內容只是考拉閱讀發力語文自適應學習的第一步。相較於英語、數學,語文輔導與學習的效率通常不高。「語文的知識點不容易被串成線,只靠死記硬背的話,學生容易喪失興趣,學習效果也沒太大提高。」趙梓淳說。考拉閱讀希望通過個性化的學習內容讓語文整體能力提升的過程更有效且更可視。
B端與C端齊頭並進,瞄準語文自適應學習學校是考拉閱讀推進語文自適應學習的一個切入口。由於分級閱讀理念在國內的認知度尚未很高,考拉閱讀的推廣過程其實也是教育市場的過程。「剛開始我們總是去講分級閱讀的各種理論和測量方法,發現學校老師並不理解。」趙梓淳回憶,「後來我們就改為現場展示如何測量文本難度。大家親眼看到測試結果,就慢慢信服了。」
老師是考拉閱讀B端服務的主要使用者。「以前老師可能只是給學生分配幾本階梯閱讀訓練書,現在通過考拉閱讀的系統,老師從終端上可以一鍵完成分發,把更具針對性的閱讀內容推送到學生的設備上。」趙梓淳介紹,「這些分級閱讀內容就像是數據驅動的教輔材料。」
考拉閱讀教師端效果圖除了發放分級閱讀內容,考拉閱讀還配套提供文本的導讀、思維導圖及測試題,便於老師與學生進行更多的互動,並同時追蹤實際的閱讀效果。另外,老師還可以在後臺看到學生學習與使用數據的分析結果。
這些數據不僅便於老師更有效地安排教育計劃,還為考拉閱讀優化整個分級系統提供支持。「從B端回收的數據往往質量更高。」趙梓淳說,「C端的數據則可能不夠『乾淨』,比如學生的玩耍時間可能也會被計入閱讀時長。」
得到學校和老師的接受為考拉閱讀提升C端用戶的認可度奠定了基礎。目前,考拉閱讀還有小部分的海外用戶。「一些海外用戶是教中文的老師。」趙梓淳說,「主要是為了解決當地缺乏母語學習環境的問題。」隨著AI技術的成熟與市場認知度的提升,趙梓淳相信C端用戶會越來越多。
考拉閱讀於12月5日宣布完成近千萬美金A輪融資,資金將主要用於累積底層AI技術,打造「人工智慧+閱讀」研究院XY Research,並逐步發力C端市場。
1、本文是
芥末堆網原創文章,轉載可點擊
芥末堆內容合作了解詳情,未經授權拒絕一切形式轉載,違者必究;
2、芥末堆不接受通過公關費、車馬費等任何形式發布失實文章,只呈現有價值的內容給讀者;
3、如果你也從事教育,並希望被芥末堆報導,請您
填寫信息告訴我們。
推廣: 芥末堆商務合作:010-5726 9867