調研 | 王璐 撰寫 | 王璐
馳聲是教育領域智能語音測評的行業開拓者,也是中高考英語聽說考試測評唯二的供應商之一。基於大數據積累、領先的智能語音技術,馳聲以「評分-診斷-反饋指導」的獨特研發路徑提升英語口語教學練習效率,實現技術賦能在線語培。
對於英語教學者和學習者而言,評判、知曉分數不是終點,提升練習效率和教學質量才是關鍵。然而,當下超過85%的學習者在英文發音練習時往往錯而不自知;同時,在傳統大班課堂中,老師無法對每位學生都進行針對性糾音指導,導致學習者容易在同樣的地方重複犯錯。
實現語培從人力驅動向技術驅動轉型,通過技術提升教學效率勢在必行。如馳聲創始人兼CEO林遠東所言,疫情成為撬動行業教學產品服務提供方式變化的重要轉折點;技術賦能提效、打通英語教學測評練習場景的價值愈加彰顯。
領創「評分-診斷-反饋指導」路徑,解決英語教學痛點
馳聲在研發路徑上走在行業前列,創新性地提出了「評分-診斷-反饋指導」的路徑,打造人機互動的口語練習環境。
AI技術在口語測評領域的演進分為3個階段:第一階段是建立評測標準,即判斷、告知用戶發音是否正確;第二階段是在打分基礎上進行個性化診斷,告知學習者發音中哪個音節有問題;第三階段是給予糾錯和反饋指導,讓用戶有針對性地提升,比如告知用戶有問題的原因在於發音不夠飽滿。目前市面上大多數語音評測公司仍處在「建立標準」的階段,馳聲創新性研發英文診斷糾音內核,率先完成三階段閉環,不僅能夠以豐富的評測維度準確、客觀評價學習者的發音、語言能力,也通過智能語音技術解決英語口語評價可視化、需要個性化診斷和反饋指導的問題。
這一獨特的研發路徑有效提升了教培機構教學互動和作業練習環節效率。在直播課或傳統課堂教學場景中,馳聲診斷評分內核能夠扮演「AI助教」的角色,進行一對一口語陪練,同時將學生的練習音頻和得分被實時推送給老師。老師基於成績報表和糾音報告,可快速了解全班和個體的發音薄弱點,有針對性地當堂講練,大幅提升教學效率。在作業練習場景中,馳聲英文診斷糾音內核接入語言學習產品,助力產品實現智能評測反饋,減少無效練習,提升用戶體驗。數據顯示,某產品接入該內核後,學習者得到滿分的總練習次數比先前平均減少3.4次,學習效率和用戶滿意度大幅提升。
深耕教育場景,全方位賦能教培機構
之所以能率先實現這一研發路徑和技術領先,源於馳聲紮根教育場景的數據積累與專業性。
數據方面,一方面馳聲建設了業界首個可用大規模教育語音雲,積累了大量語料數據及應用信息報告;另一方面,馳聲近十年間覆蓋60%智能語音學習產品,同時是中高考英語聽說考試解決方案唯二供應商,並向學校端提供英語聽說考輔解決方案,構建多環節、多場景、多維度數據閉環。
技術方面,目前智能語音技術本身已趨於成熟,馳聲在技術與教育場景結合的專業性和深度上構建了自身壁壘。例如,在每個音素評測維度或屬性的研究與選擇、算法的工程化、語料採集與標註、聲學模型和評分模型建立上打磨;馳聲的評分引擎經過13年上萬億次錄音評分,已在各種運行環境中試驗。近兩年,馳聲創新性提出英文單詞和句子診斷糾錯內核,通過升級誤發音檢測與診斷(MDD)算法框架提升評分準確性,並通過直接呈現學習者實際發音的音素序列,標記多讀、錯讀、漏讀、重複朗讀之處,為學習者提供正確發音指導。此外,馳聲首創開放題型多維度評估技術,結合詞嵌入模型、句法解析、GOP算法、句子邊界檢測等多種底層技術,突破了行業對於開放題型僅能評總分的瓶頸,可為產品設計提供總分、內容評分、發音評分、語法評分、流利度評分等5大評分維度,給予學習者更豐富、全面、直觀的評價反饋。
在場景的落地上,馳聲的口語測評技術不僅可用於口語教學和作業練習場景,同時可用於拓客拉新、增值拓展等環節,全方位賦能教培機構。例如,在拓客拉新環節,馳聲診斷糾音內核製作遊戲化的發音評分小程序和生成糾音診斷報告,吸引客戶關注分享,通過優質體驗助力縮短消費者購買教育產品的決策時間,實現傳播裂變、提升獲客轉化率。
未來,馳聲將雙管齊下,借力政策風口擴大考試考輔業務,同時沿著「評分-診斷-反饋指導」的研發思路,致力於研發高自由度的口語對話評測技術,打造可自由對話「AI老師」,助力智能語言學習產品升級,減輕語培人力成本壓力;通過將各環節數據打通,在對學生充分理解的基礎上規劃最優學習路徑,實現技術驅動學習者提升口語水平。
近期,愛分析對馳聲科技創始人兼CEO林遠東進行了訪談,針對馳聲科技語音測評技術授權及考試考輔解決方案業務現狀及發展策略進行了深度交流,現將專訪精選內容分享如下。
智能技術消滅啞巴英語,建設標準和數據閉環
愛分析:疫情帶來語培行業哪些明顯的變化?
林遠東:疫情帶來在線教育滲透率提升,也成為技術提供方進入語培市場有利的跳板。疫情成為行業變化的導火索,或者說是撬動行業教學產品服務提供方式變化的重要轉折點,因為從教育政策的制定實施者,到老師學生家長、民營培訓機構的老師等服務人員,都深深地被迫近距離體會技術、網際網路加教育誕生出各種各樣新的場景。
過去語培市場在收入規模和學習時長上都是線下佔主導,線上語培也是人力主導;但是線上的以人力為核心的語培規模經濟問題、商業模式問題一直存在,整個業界一直都在探索和推廣技術主導的語培,在不同的賽道上開始出現一些比較成功的探索案例。疫情加速了行業變革,線下的教育培訓秩序都受到巨大的挑戰和變化,線下傳統行業的從業者思想被迫發生改變,扭轉尋求線上解決方案,給行業攪動起了不小的水花。
另外,疫情下公立校也發生了一系列化學反應,例如北京提出了停課不停練,從考試反推教學秩序,開學後最先考的就是英語口語,所以馳聲成為北京市朝陽區教委疫情期間官方認可的教學工具,幫助公立校為中高考口語考試做練習和準備。
愛分析:您在2007年創業切入智能語音評測領域是如何考慮的?
林遠東:創業主要是希望人工智慧技術促進學習更高效。我在國內讀完大學去英國,雖然在國內學了超過十年英語,在國外用英語做日常交流卻非常痛苦;很多我們這個年齡出國留學的人都有這樣體會,語法可能學得比美國20%的人更好,但是對於日常會話卻表現尷尬。我從自己和身邊的華人朋友身上看到消滅啞巴英語的需求,促使我思考在劍橋學到的智能語音技術能否與之一需求結合,通過智能技術讓學習更高效。
同時,擔任劍橋大學工程系語言中心中文教師期間,我看到英國對於中文交流學習的重視,意識到世界語言交流連結將更加緊密,口語語言的需求會更加旺盛;我希望用自己所學所知,滿足市場需求,也為企業增添一些比較獨特的競爭優勢。
愛分析:目前您對於馳聲的定位是什麼?
林遠東:馳聲的口號或者願景切分成兩個半句,第一是智能技術消滅啞巴英語,第二是讓學習更高效,所以馳聲的願景短期是消滅啞巴英語,長期是讓學習更高效,在教育領域能夠通過智能技術讓學習更高效的都屬於馳聲的業務範疇。
馳聲的定位首先是技術性的公司,其次是教育公司。短期我們會圍繞著英語的聽說切入布局,實際上不局限於聽說,不局限於英語,甚至不局限於語言。自適應學習教育和技術的結合會由量變過渡到質變,質變的基礎是數據,馳聲的戰略布局要圍繞數據,從聽說切入技術賦能。
馳聲未來的定位是一家建設標準和數據閉環的教育人工智慧公司,一家用智能技術和海量數據去推動、踐行英語聽說能力標準的公司,對外輸出的是「標準」。客戶選擇馳聲技術,就意味著承認馳聲的評分準確性,評分就是一種標準,考試評分的過程就是將用戶的數據往標準上做貼合比較。
馳聲的布局是圍繞數據來做的,數據驅動自適應學習。中高考政策的出現帶來很大的市場風口,馳聲通過英語聽說這條線切入,通過為中高考英語聽說考試提供技術服務,積累終結性評價數據,為學校提供教考練平臺,積累單元考、月考、期末考等過程性評價數據,再到為企業客戶提供技術賦能服務積累海量日常練習數據,從而覆蓋英語聽說全環節,再把各個環節的數據打通,基於對學習者深度理解和了解的基礎上,給出最優的學習路徑,這也是自適應學習的本質。
愛分析:您認為智能語音測評領域目前的格局如何?
林遠東:這個行業還很年輕,方興未艾、群雄逐鹿。智能語音評測行業從2011年開始興起,基本上是馳聲從無到有地推動建立起來的。2016年以後,各種玩家入局,科大訊飛開始做口語評測技術授權,先聲也在同年成立,隨後,騰訊、百度、網易也紛紛加入戰場,這讓我心血澎湃,表明這個行業有巨大價值。
推動行業快速成長的驅動力是:2014年教育部高考改革綱要明確外語科目提供兩次考試機會,2017年,上海、浙江開始試點外語考試一年兩考,考試內容包括筆試和聽說測試。2019年全國有15個省已經頒布中考英語聽說考試政策,每個省份將有1-3個地級市作為中考口語考試改革的試點,高考可能在中考普及以後的2-3年推進。
政策推動以及眾多公司進入會迅速攪動行業升溫,原來只有馳聲一家在到處鼓吹智能語音測評,現在有很多大的公司在一起推動行業發展,所以可以想像未來很長一段時間會掀起波瀾壯闊的故事,行業的格局遠未到穩定的階段。
馳聲有13年技術的積累,當前在品牌影響力、客戶佔有率、收入規模方面依舊是這個領域內最前線的公司,在業內處於相對有利的頭部區域,隨著行業水漲船高,我們面臨的挑戰也很大,但機遇遠遠大於挑戰。
研發路徑領先,技術賦能教培機構
愛分析:馳聲的語音技術授權在教培機構的應用場景如何?
林遠東:市場的商業環境很有意思,孕育出很多不同的公司和場景,市場的活躍度遠超我們的想像。客戶會提出形形色色的要求,促進馳聲技術往深度、廣度去發展,最後留下一些主流的應用場景,比如作業練習、直播課程、考試服務、繪本朗讀、電影配音、營銷拓客等等。
我們甚至遇到一些非常有意思的應用場景,比如社交。有一個平臺希望通過口語評測技術,讓學習者找到和他水平相當的學習者,方便以後交流和學習。
馳聲不僅會在研發諮詢、場景應用上做建議,還會利用10多年積攢的經驗,幫助客戶對產品設計、用戶體驗提一些有價值的建議。比如有的少兒英語產品得知馳聲引擎有強大的功能,希望把引擎裡所有維度都展示在界面上,我們會勸客戶不需要。因為小朋友的感知維度簡單,並不喜歡複雜、結構化的東西,用笑臉和哭臉表示練習結果就可以了。孩子只要得到笑臉,得到鼓勵,就會持續不斷地練習下去。而成人是結構化思維,更願意去深究哪個音素錯了、句末升降調是否準確,並且會重複練習。
愛分析:馳聲為何施行獨特的「評分-診斷-反饋指導「研發路徑?
林遠東:馳聲的研發路徑是指導馳聲研發團隊一步步向前的指導思想。很長一段時間內,我們在反思口語評測技術提供的價值是什麼,最終聚攏到「評分-診斷-反饋指導」三部曲。這幾年馳聲新研發的英文單詞和句子診斷糾音技術、開放題型多維度評估技術都是在踐行這個研發思路。
2012年之前,馳聲主要做朗讀等封閉題型的發音評測,一個星期只有2000次錄音;2014年,馳聲一周錄音次數突破千萬人次,增長10000倍。作為技術人員,我們很興奮,很驕傲。
那時,我做了一件挺有意義的事:我一共拉取了六七次、每次500組用戶在短時間內反覆練習一個句子或者單詞的錄音。當我聽完這幾千個錄音後,對結果很失望,因為發現85%的學習者第一次發音怎麼錯,最後一次還是怎麼錯。馳聲的技術雖然有很多人在用,但是我不希望只幫助了15%的人提升口語水平,還有85%的人在重複錯誤。
這促使我們去思考如何解決這個問題。其實,口語評測和健康檢查有點像,從建立標準開始,什麼樣的身體是健康、亞健康,通過對每個人體檢做個性化診斷,告訴你身體有哪些問題,最後還會給你一個有效建議和改善方向:比如太胖了,就建議加強鍛鍊,每周做2-3次30分鐘的有氧練習等等。我們的評分也一樣,首先是建立標準,進行好壞中差評分;其次需要做個性診斷,因為每個學員存在的發音問題不一樣,技術可以幫助他們糾正發音、找出錯誤;最後,反饋給學習者,告訴他們如何有效練習,提高發音正確率。
愛分析:這一獨特的研發路徑有何價值?
林遠東:這是口語評測技術授權行業一個質的飛躍。「評分-診斷-反饋指導」本質上是在做「建立標準- 個性化 - 有效練習」這三件事,這樣才能逐步把85%的無效練習降低,最終讓有效練習達到85%,甚至90%,從而大量節省學習者的時間,高效地到達他們理想中的口語水平。
在現在這個社會,學會一個東西並不是最高的要求和標準,因為終究總能學會,但是習得效率的高低其實才是衡量學習者能力的標準,因為人的生命是有限的,社會發展越來越快,儘快掌握足夠多的專業知識和專業技能,把更多時間投入創作、研發等等,才是教育的意義,也是驅動馳聲人不斷前進的動力。
愛分析:馳聲對於教培機構技術賦能在服務上是如何做的?
林遠東:馳聲建立了這個行業的標準。馳聲有一個比較大的售後服務部門,每個客戶都會指定售後工程師全權負責,這些工程師大多擁有PMP認證,對項目管理非常有經驗和能力,可以組織好馳聲內部資源服務客戶,並在這個過程中不斷整理、積累知識庫,逐步建設成語音授權服務領域的專家體系,這是馳聲在行業的核心競爭力之一。
馳聲的售後服務在流程上有兩大塊,服務客戶的階段性比較明顯。
第一是籤約到上線階段,籤約以後要把我們的技術接入客戶產品,中間需要大量技術、開發問題的溝通,比如語言、框架支持等問題。
第二是上線後的售後服務階段,客戶在使用馳聲技術的過程中遇到任何問題,都會有相應的售後工程師及時處理。
愛分析:馳聲教培機構客戶續費情況如何?
林遠東:老客戶持續擴大合作範圍。疫情期間,技術賦能的業務增速非常快,錄音高峰數值是去年同期的5.6倍,去年投入幾百萬擴容,沒想到很快就用上,甚至一度臨時擴容。馳聲採用混合雲的模式,可以隨時獲取更高的計算能力,增加存儲和可擴展性,保障用戶使用體驗。
中高考口語考試唯二供應商,驗證技術與服務能力
愛分析:馳聲與教育局、學校的合作與教培機構在形式上有何不同?
林遠東:我們和在線教育機構合作是技術賦能,比方說提供技術封裝能力標準的SDK API,提供給像VIPKID、ABC360、新東方、英語趣配音等數百家客戶,把這些技術模塊集成到他們自己的產品之中,表現形式有IOS,網頁、Linux、Mac,甚至有通過電話錄音評分等等。我們提供的是一種能力,這種能力並不能直接展現為產品,需要客戶進行二次加工,客戶利用自身的開發能力提升融入到產品之中。
但是跟教育局、學校合作是另外的形式,教育局要的是完整解決方案,更關注供應商是否能提供完整的能力和服務。例如2021年某市將施行口語考試,需要馳聲直接給出能夠實現中考口語考試順利舉辦、公平公正測評的整套解決方案。
愛分析:馳聲如何觸達教育局客戶,其需求和教培機構有何差異?
林遠東:隨著中高考口語考試普及,各地教育局在主動尋找相關口語考試供應商;馳聲在口語考試領域已布局多年,形成一定的口碑積累。在高考這一關係國計民生的政策發布時,教育部也經歷了詳細論證,2012年馳聲服務了廣東湛江中考口語考試;2013年我們服務了肇慶、中山、深圳、珠海以及青島;2016年我們服務了瀋陽、銀川,2017年,馳聲參與到北京中考口語考試的技術方案設計和技術驗證,2018年我們提供了上海市高考口語考試官方模擬考試系統,2019年我們中標湖北試點城市宜昌中考口語考試,2020年施行了上海市中考口語考試模擬考和考題難度錨定等項目。
中高考口語考試評分技術要求比普通評分場景的要求高很多,和教育局合作如果考試結果出錯,就會影響成百上千個孩子的前程,所以在我們這個領域,對每一個百分點小數點的準確率都非常在意。
另外,中國大部分中高考口語考試都有開放題,包括口頭作文、故事、看圖說話等,正確答案可能無窮無盡,這個領域的技術難度極高。在很長一段時間內,技術上只有馳聲和訊飛真正具備在中高考這種高利害關係的口語考試裡提供包括封閉題型和開放題型的實施能力,並且有10萬人以上大規模考試評分的實施經驗。因此,很多教育局會主動找到馳聲協助落地教育部和省內推動的中高考政策。
愛分析:考試考輔系統解決方案產品形態如何?
林遠東:馳聲英語聽說正式考試系統主要包含命題制卷、考務管理、考試系統、智能評分四個部分。考前馳聲服務主要是考務系統部署對接、考生報名、考場編排、考題錄入,考中馳聲技術團隊會提供現場支持,包括數據收集、異常處理等,考後提供定標評分、分數發布等服務。
從沒有口語考試到有口語考試,對學校秩序而言,是一種挑戰,因此誕生了模擬考試的需求。以北京朝陽區為例,朝陽區從2017年起在馳聲的服務下,實施了幾年初中區校聯考,後來高中也加入了期中期末區校聯考,如今,有的學校每周還會進行周考。今年由於疫情的原因,2020年2月,北京朝陽區教委針對中小學學生短期無法返校複課的情況,緊急部署上線了「朝陽中小學英語聽說訓練平臺」,該平臺由馳聲提供技術和內容支持,為學生提供網上學習資源及線上輔導,滿足了孩子們居家學習的需求。
如今,馳聲的產品形態已經慢慢延伸至教學的各個環節,並在這個過程中不斷收集教研員、老師的需求,完善解決方案。
未來,馳聲也會進行創新,形成新的解決方案。比如現在提到英語聽說教學,就需要到機房練習。未來我們會探索讓聽說從機房走進普通課堂,把老師從機房中解放出來。
技術賦能與中高考產品化並重,拓展自適應教學
愛分析:馳聲是否從技術授權向完整的產品和技術解決方案轉變?
林遠東:政策風口正在逐步落地, 2007到2014、2015年是教育部的中高考政策試點期,2015-2017是政策形成期,現在已進入政策落地期。政策落地本身是基於市場有需求,推動馳聲為越來越多的地方提供中高考解決方案,在此過程中,技術也會隨著中高考政策普及水漲船高,我們慢慢就會形成技術賦能和中高考產品化兩條腿都並重的局面。
愛分析:從測評到整個 AI+教學,技術上是否有共性,能否實現無縫過渡?
林遠東:人工智慧在業界比較主流的技術流派是機器學習,或者說有監督的機器學習。所謂的人工智慧是指通過大量的數據去學習和抓取、逼近人類訓練有素的專家水平;比如說我們的口語評測是通過大量的數據把我們逼近人類口語水平的最棒的一批專家。技術的部署相比於人力具有便捷性和性價比,比如全中國能達到這樣一個水準的專家可能不超過50個,如果要請這50個人糾正輔助練習大部分人付不起代價,技術的價值在此體現。
馳聲的口語評測技術是人工智慧技術的分支,只是其應用場景在口語評測方面,我們的核心競爭力或者技術要素第一是機器學習的算法,第二是有足夠多的數據。自適應學習本質上是機器學習的應用,通過對學習者在數據基礎上充分了解規劃出合理的學習路徑。
人工智慧的口語評測技術和自適應學習本身就是同根同源,只是他們的數據對象、研究的問題對象不一樣。通過人工智慧口語的技術切入點,能夠切入剛需痛點,敦促學習者不斷的使用產品,源源不斷的誕生數據。只有不斷誕生這些數據,並且覆蓋不同環節,才可能把學習的環節了解清楚,然後再去進行學習路徑規劃,所以本質上是能夠自然過渡的。
愛分析:馳聲未來的市場布局規劃如何?
林遠東:馳聲未來的布局定位是一家建設標準的公司,評分、考試都是在樹立標準,所以馳聲會堅持以技術賦能為核心,圍繞標準構建強大核心能力;另外,我們不排斥通過靈活的資本的手段,無論是控股、參股、合資還是孵化等,以馳聲的技術的和標準為基礎,衍生出更多的形態,探索一切有可能結合起來消滅啞巴英語、讓學習高效的學習方式,更好地滿足市場需求。
另外,馳聲由於和網龍關係密切,我們也積極探索海外業務,包括在阿拉伯、東南亞,美國等地區,我們一直都在探討阿拉伯語、日語等多個語種的測評業務;未來我們也不排斥通過合資公司等形式發展其他語種的口語評測。