一個好產品能最大程度地滿足用戶需求,一個教育的好產品能獲得學生的喜歡與家長的信賴,有了好產品,才有更好的教育。
環球網教育頻道聯合知更鳥網特別推出了大型訪問欄目《遇見》,一起遇見好產品。
小編有幸採訪到了馳聲創始人林遠東,一起聊聊馳聲的強大口語測評技術。
人物介紹——
林遠東,語音評測技術專家,馳聲創始人&CEO,本科畢業於清華大學,碩士畢業於劍橋大學,曾任英國標準協會(BSI)全球新業務總監。為充分了解語言教育,林遠東曾擔任劍橋大學工程系語言中心中文教師,2007年創建馳聲團隊,隨後歸國產業化,至今已參與建設了超過上百個語音評測相關項目和產品,榮獲「蘇州工業園區科技領軍人才」榮譽稱號。2015年帶領馳聲加入網龍網絡公司,在網龍構築教育生態系統的大平臺上,持續為學習者高效提升學習體驗而奮鬥。
小編:您在劍橋大學創立了馳聲團隊,為什麼一開始選擇做評估發音能力的軟體?
林遠東:我從清華畢業後,就去了劍橋攻讀碩士學位。2005年,我進入英國標準委員會(BSI)擔任全球新業務總監,閒暇時間為BSI的高層教授中文,卻意外的發現外國人對學習中文有強烈的需求,為此,我從BSI辭職回到劍橋擔任中文老師,學習中文教育的那些事兒。
這兩年在劍橋教中文的經歷,確實很有益,也是馳聲立下要用智能語音評測技術改變語言學習方式目標的起點。
第一年,我花了大量工夫備課,中規中矩的課堂教學效果慘澹,期末時學生到堂率僅剩20%。
第二年,我請來一位知名的中文老師錄製了教學視頻,結合團隊正在研發的智能語音技術做互動,讓學生在機房先自學,再開口練習。我在課堂上再結合錯題,重點講解。這樣的授課方式效果不錯,期末班級到堂率高達90%。
劍橋大學智能語音實驗室在國際全行業最高規格的賽場上屢屢奪冠,馳聲智能語音評測技術正是起源於此。這兩年的教學經歷使我堅信:智能語音評測打分技術在語言教育方面的價值,不僅可以節省教師人力、提高教學效率,還能驅動教學方式的變革。
科技改變生活,更成就夢想。
馳聲團隊在英國創業期間,獲得了英國政府優秀高科技企業獎、威爾斯政府優秀高科技項目獎、劍橋大學最佳商業計劃獎等殊榮。2008年,馳聲團隊正式回國設立總部,亦被認定為國家高新技術企業,並屢屢獲得中國最具商業價值人工智慧公司TOP50、優質教育技術服務商等榮譽。
回想剛創業時,有人開玩笑「幾年後,就可以想想古巴的沙灘,藍天白雲,波濤洶湧」。可是,這份事業,我們一幹就是10幾年。辦公室越來越大,團隊成員從幾個人擴充到百來號人,一起奮鬥的小夥伴,從少年變成了大叔,而公司也從用技術幫助外國人學中文,拓展到用英文口語評測技術幫助全球132個國家和地區、每天過億人高效學習英語。
馳聲前進的步伐是越來越快了。
小編:請您介紹一下馳聲,它的核心優勢在哪裡?
林遠東:英語口語從前只能被稱為素質教育,在中國教育版圖裡永遠是「遊擊隊」。
2014年9月,國務院發布的《國務院關於深化考試招生制度改革的實施意見》,高考外語科目擁有了兩次考試機會。隨後,上海、北京等地相繼發布了各自細則。隨著北京、上海正式把英語口語考試納入中高考的範疇,更是推動K12口語考試教育培訓市場井噴式發展,並一步步變成素質教育和應試教育並重的市場。
K12口語考試的存在與普及,讓整個市場潛力無窮,雖然玩家將越來越多,但要進入這個行業的門檻也註定將越來越高——
1、算法。即便不計資本、人力投入,再高效的情況下,一套語音評測技術至少需要9-12個月的時間才能搭建出來合適的算法。
2、數據。數據之於人工智慧技術,相當於汽油之於汽車。要知道,建立一個實驗室語音引擎只需要100個小時,而做到業界頂尖也僅需5000個小時的數據,而馳聲在十年間與優質客戶合作,平均每月有80億錄音人次、每年積累700萬小時的語音數據,並用數據反哺引擎,從而使引擎持續保持領先地位。
強大算法和龐大數據積累,正是馳聲的核心競爭力。
馳聲入行早、紮根深、專注更專業,是智能語音界最熱衷創新的公司之一。平均每年都會發布新技術,業界首個評估中文發音能力、聲調能力、定位聲韻母的SDK都出自於馳聲。再比如,馳聲去年發布了業界首個開發題型多維度評估的評測內核,這意味著,馳聲不僅是中國能為口頭作文、看圖說話、翻譯題等口語開放題型評總分的少數幾家公司之一,還能為內容、發音、流利度等細分維度一一評分,給予學習者更豐富、更全面、更客觀的評價反饋。
馳聲將中英文口語評測技術做成標準化、跨平臺的模塊,智能診斷糾錯技術可以診斷出學習者每個細微的錯誤發音,評分準確率遠超同行業。
在語音評測技術授權(API)領域,馳聲佔據了中國市場的半壁江山,為新東方、VIPKID、Person等知名教育公司提供技術支持,因而馳聲享有「中國語言教育產品的智能語音工具包」的美譽。
馳聲技術還有另一個美稱——「考試級口語評測引擎」。2012年,馳聲開始站上中高考的舞臺,評測技術受各地教育局和考試院的信賴,多年來,馳聲服務了廣州、成都、瀋陽、銀川等多地的小升初、中職、中考、高考等英語聽說考試的機考機評項目,是中國屈指可數真正有中高考實施經驗並且評分性能受官方認可的語音技術提供商,累積服務百萬考生。
小編:馳聲專注了語音評測技術12年,與其他公司的技術相比有何突出特色?
林遠東:當然,在人工智慧領域,馳聲一直追求用技術改變人的學習方式,提高學習效率。
以前,語音技術更多只是做到打分,完成了評分閉環。但是只有口語打分,並沒有從本質上提升學習效率,因為並沒有告訴學習者哪裡犯了錯,犯了什麼具體錯誤。
馳聲語音評測實驗室的做了一項研究,調取大量的錄音數據發現,大部分學習者在短時間內練習同一個內容,第1次錯和第10次錯、甚至100次錯的地方往往是一樣的。我們總結85%的語言學習者,總是在重複犯錯。
那麼,如何才能捕捉到發音錯誤?馳聲研究團隊發現,音素(phone)是根據語音的自然屬性劃分出來的最小語音單位,直觀呈現學習者的實際發音序列,並與標準音標進行比較,進而發現錯讀、漏讀、多讀的音素,這樣最為直觀高效。
於是,2018年,馳聲推出可以「看見」發音錯誤的診斷糾音內核,真正做到以評促教、以評促學。該內核採用音素級發音評價,通過漏讀、多讀、錯讀三種算法,可以檢測出學習者在發音練習過程中的微小錯誤。更重要的是,新內核突破了市面上大多評測引擎只能提供發音得分的瓶頸,可通過直觀呈現學習者實際發音的音素序列,讓發音問題「看得見」!
可直觀呈現學習者實際發音音素序列
思考未來,我們認為人工智慧技術的發展,都脫離不了這「三步走」的框架,第一步是建立標準,第二步是個性診斷,第三步是反饋指導。
未來,馳聲也將繼續沿著這個方向布局,加大對語音識別和語音評測的基礎研究,讓技術與教學深度結合。
小編:馳聲未來發展的前景是什麼?
林遠東:馳聲的使命是「消滅啞巴英語,提高學習效率」,通過研發和推動智能技術的應用快速廣泛地改變人們學習的方式,讓學習變得自然、高效,並實現技術的最大價值!
在智能語音技術評測領域,相對於通用引擎,我認為做好細分領域的個性化「小」引擎和「細」服務,才能比同行更勝一籌。
比如,早在幾年前,馳聲推出了第一個細分領域的個性化「小」引擎——專屬於學齡前至小學階段的兒童英文口語評測引擎。
推出兒童口語評測引擎是因為小朋友英語發音和成人有諸多不同之處:
1、聲學特徵方面:音調高、發音不飽滿;
2、韻律特性方面:單詞之間停頓時間長。由於學齡前兒童口腔肌肉發育尚未完善,唇、舌、牙齒配合不夠靈活,容易多讀、漏讀,句子中的升降調、停頓等也不如成人容易掌握。
為此,馳聲通過自適應的方法訓練了專屬於兒童的評測引擎,特定的打分參數使得評測結果更貼近老師對兒童的評價標準,因而該引擎在市場上大獲好評,被眾多客戶所接納採用。
馳聲現在在做中高考人機對話考試和評分服務,發現不同地區有不同的評分標準,通用引擎難以滿足嚴肅嚴苛的高考評分需求,同樣必須要根據不同地區、不同專家打分標準定製評分引擎。
未來人群的細分、地域的細分將會是很長時間的主流。整個教育技術的市場隨著個性化和自適應學習時代的來臨,小引擎、細服務必不可少,誰的技能打穿了整個行業,誰就能佔領市場。
以上就是本次採訪的主要內容。遇見好產品,讓我們一起期待下一個好產品的故事。