【獵雲網(微信:ilieyun)北京】11月16日報導(文/王亞楠)
11月14日-16日,GET2017教育科技大會在北京國際會議中心舉行,英語流利說創始人&CEO王翌為大會帶來主題演講,探索AI+教育的最前沿。會後,王翌接受媒體群訪,就AI+教育、教育目前的發展趨勢等問題展開討論。
流利說成立人工智慧實驗室,王翌表示,該實驗室的研究方向很明確,打造世界上最智能、最高效的AI英語老師。
傳統的老師和學生之間的學習存在互動,現在流利說推出AI老師,怎樣做到與學生之間的互動學習?王翌提到,互動很重要,流利說之前能夠積累大量的數據,就是因為其產品具有較強的互動性,用戶覺得有意思,他就不斷地刷,不斷地練,我們現在也正沿著這個方向繼續深耕下去。
據悉,在本次大會上,王翌還公布了消息,成立英語流利說顧問團。同時,王翌表示:「2017年,將成為『AI+教育元年』。」在教育領域,隨著英語流利說等企業對於AI技術的不斷應用,AI已經成為快速提高學習效率,減輕人工負擔的重要方式,人工智慧在教育領域已從基礎技術進入實際應用領域。
以下是王翌的群訪內容,獵雲網刪減整理:
問:很多資本都在提今年是「AI+教育」的元年,這一年所有的公司所有的人都在提AI,你們在沒有這個概念之前就做了,您如何看待AI是扎堆還是?
王翌:每一年都會有一些概念出來,2014、2015年「網際網路+教育」有一波,後來就沒有了。我覺得同樣,它一定會有泡沫破滅存在,教育行業,別的行業都是如此。不只是「AI+教育」,AI加任何行業都會有一堆公司出來,所以,教育行業也不例外。
問:英語流利說做AI產品實現了規模化的盈利,也積累了大量的數據,下一步的商業模式是什麼?
王翌:我們之前收集數據,一開始收集的是語音數據,確立了一個引擎,並打造了AI老師的產品。之後又收集了第二類數據,就是我收集他完整的學習軌跡數據。有了這些數據,再加上其它的語音數據,對於學生知識掌握情況的了解,可以幫助我們更好的為學生量身定製他接下去的學習。
問:未來流利說的用戶目標是什麼?
王翌:用戶目標,像流利說我們在矽谷成立了一個AI實驗室。流利說未來,第一會成為國際化的公司,第二我們目標是成為世界領先的教育科技公司,我們還是堅定地在科技和教育這條道路上走,走得更加堅決一點。
問:您在演講中提到,現在教育行業的付費模式從課程收費轉變到結果收費,對於這個預測,流利說目前往這個方向有沒有戰略部署?
王翌:我們一直往這個方向努力,一步步來,我們先把它變成不是按照一個小時多少錢,而是一個月多少錢。你愛學幾個小時就學幾個小時。我們覺得不應該把它和所謂的成本、老師的成本直接掛鈎。因為它最終是商家的角度在定義,不是從用戶的角度,從學習者的角度定義。
問:現在流利說的英語語音開始給其它教育機構做服務了,以後技術和產品的輸出,比如輸出給其它教育機構,是不是也會成為流利說業務的方向?
王翌:我覺得是很重要的一部分,因為這個時代本身就是一個很開放的時代,這是我們的一個基本觀點。我們三個聯合創始人,兩個來自於谷歌。谷歌做了Android,不是做了蘋果,這是一個理念上的事情,我們覺得這是開放的。我們一些核心的技術,如果我們有合作夥伴覺得這個東西挺好的,我們想合作來用一下,這個沒有問題,而且另外一方面,我們現在也在跟一些擁有優質學習內容的第三方合作夥伴進行一些合作。他們有很好的內容,他們覺得流利說的技術和產品不錯,我們能不能結合一下,大家一起打造一種新的形態,我覺得這些都是很有意思的一些形式。
問:「AI+教育」大數據是啟動了一個壁壘,像流利說在數據收集方面做了哪些?另外您的數據源和數據量怎麼樣?
王翌:這個可以說是流利說從誕生第一天開始就在做的事情之一。第一種收集方式就是用戶在上面練口語,把語音數據都收集下來,今天的數據量應該是6.58億分鐘錄音,超過83.9億個句子,相當於超過1200年的總量。,讓我們成為世界上最大的中國人說英語的一個標籤數據。
數據源就是用戶,語音數據是一大塊,然後語音數據裡面現在包含了跟讀數據,就是開放式的口語數據。還有一塊就是我們的AI老師裡面的叫學習軌跡的數據。我們有20多種題型,每種題型跟用戶結合,我們既有某一類或者某幾類內容和題型下,幾十萬、上百萬用戶的數據;也有一個以時間軸為視角,在這個水平慢慢提升的,用戶進一步學習的軌跡。
記者:另外,AI做教育肯定是想要介入到個性化教學,個性化教學裡面從K12到成人,您怎樣做英語分級的?
王翌:英語分級我們想得比較清楚,它不是典型重新造輪子的事,我們用的是國際公認的語言分級的標準,叫做CEFR,Common European Framework of Reference for Languages,簡稱歐標。它分為六級,A1、A2,B1、B2,C1、C2,每一級覆蓋的所謂知識點、能力都會有詳細的描述,世界上幾乎所有的標準化考試,比如雅思、託福等等都會和這個分級有對應關係。
記者:在人工智慧浪潮中,您也提出大家都看不清方向,而流利說成立人工智慧實驗室,那麼您推動人工智慧實驗室研究方向是什麼?
王翌:我們AI實驗室的目標特別明確,就是打造世界上最智能、最高效的AI英語老師。在語音評測方面,我們會對用戶的輸入做視覺上的呈現,紅綠也好、打分也好,這是一種角度的反饋。還有一種情景式講課,那就直接是語音對語音了,機器人說話,你和他對話,這是我們在做嘗試,並且技術比較領先的一個方面。
我們要做最智能、最高效的AI英語老師,那麼評判它是否智能、高效的標準就是結果導向,比如有三百名學生,其中一百名學生去傳統教室裡面聽課,另外一百名跟著外教上課,最後一百名跟著流利說學習。同樣學一百個小時,三百名學生,誰提升最高,相同時間下誰進步最快,或者達到相同的程度誰時間最短,這麼一來就能很清晰地看出學習效果的高低。
問:傳統的老師和學生之間的學習是存在互動的。現在流利說推出AI老師,它怎樣做到與學生之間的互動學習?
王翌:互動很重要,你如果體驗一下我們AI老師,就會發現當中的互動。這種互動是以一種遊戲化的形式,你做一道題我們給你反饋,你做得好就得一個金幣,你會看到自己的金幣往前走。你做得每一個學習行為、練習行為是有實時反饋的。隨著慢慢迭代,你會發現互動的形式越來越多,比如我們新推的「情景實戰」功能,那也是互動。就是跟一個chatbot(聊天機器人)聊天,而且這裡面會抖一些很幽默的東西出來,你們可以去玩一下,很搞笑的,這都是互動。
我覺得互動很重要,其實流利說之所以之前能夠積累這麼多的數據,就是因為我們的產品具有比較強的互動性,用戶覺得有意思,他就不斷地刷,不斷地練。我們現在也正沿著這個方向繼續深耕下去。
問:流利說語音技術方面有沒有獨特的算法,比如語音的識別,語義的理解、語用方面,哪個東西比較佔優勢?
王翌:首先我們擁有獨特的算法。第一叫發音,發音裡面還有很多,不細說,不同的維度、粒度;第二叫語法,我得語法檢錯,有一些你發音很好,但是語法有問題。關於語法檢錯,我們的科學家們最近在一個國際會議上,叫Interspeech,發表了一篇論文,他們一邊寫代碼,一邊在公司工作,一邊寫論文,而且是一個國際頂級會議,上面有一篇論文叫Deep Context Model for Grammatical Error Correction,就是關於用深度學習的技術來檢測錯誤;第三,詞彙量。你是三千詞彙,他也是三千詞彙,但是你們講出來的話不一樣。你對詞彙量的運用,你怎麼樣挑一個詞,怎樣組成一個句子表達你的意思,都很有講究。我發現你喜歡用這類詞,這類詞其實不準確,或者不精彩,於是我給你推薦一些詞句。以上這些指導在雅思流利說都有;第四,流利度和上下文。比如他問你今天天氣怎麼樣,你卻回答說昨天足球很好;或者你前面說了一件事,突然沒有任何轉折又去說另一件等等。我們的技術可以判斷你是不是答非所問。
以上就是口語的四個方面。這不是我們定義的,雅思託福就是考這四個維度,我們就從這四個維度去做。毫無疑問,我們在這方面的技術、數據和內容是齊頭並進的。回到前面所說的,團隊、數據、技術、產品,這幾個環節真的需要打通來做。
問:我有測試我們的流利說,我發現如果某一個音你一直不讀準的話,它只是一個語音的提示,有沒有考慮解決這個問題,或者通過一些小視頻解決這個問題?
王翌:現在我們有一個小功能叫發音攻略,你可以去試試看能不能解決你的問題,如果不能解決,我們後面還有大招,敬請期待。