新東方AI研究院院長瞿煒:AI要在教育場景落地必須克服20個挑戰 |...

2020-12-14 雷鋒網

11月15日,「全球AI+智適應教育峰會」在北京嘉裡中心大酒店盛大開幕,峰會由雷鋒網聯合乂學教育松鼠AI,以及IEEE(美國電氣電子工程師學會)教育工程和自適應教育標準工作組共同舉辦,匯聚國內外頂尖陣容。

AI智適應學習是目前產學研三界關注度最高的話題之一。此次峰會,主辦方邀請了美國三院院士、機器學習泰鬥Michael Jordan,全球公認機器學習之父Tom Mitchell,斯坦福國際研究院(SRI)副總裁Robert Pearlstein、美國大學入學考試機構ACT學習方案組高級研究科學家Michael Yudelson等頂尖學者。

圖為:新東方AI研究院院長 瞿煒博士

在大會下午主論壇上,新東方AI研究院院長瞿煒博士發表了精彩演講。瞿煒博士在人工智慧領域有近20年的豐富研究經歷,此前在西門子公司有過工作經歷。新東方作為中國最早在美上市的教育公司,在全球已經有超過2000萬的學生使用他們的平臺。瞿煒博士在現場的演講正是新東方在AI時代的最新思考。

瞿煒博士認為,通用AI已經走向瓶頸,場景AI將迎來新的蓬勃發展。而對於AI+教育來說,儘管是極具潛力的市場,但是依然面臨著諸多挑戰,比如語音識別、人臉識別、文字識別、視頻分析等。新東方AI研究院雖然剛剛成立,但會在整體戰略上走向「開放」,並將以N-Brain聯盟為基點,在數據、場景、資源層面做更多與業界、學界的合作。

以下大部分為瞿煒的演講原文,雷鋒網做了不改變原意的編輯與整理。

作為一個接觸AI接近20年的老兵,根本就沒有想到AI能成為一個行業,甚至在2016年左右的時候,隨著AlphaGo為公眾所熟悉,AI幾乎是指數級地變成了一個行業,所有的網際網路公司都在擁抱AI,所有的行業也越來越多地去touch AI。

但是新東方很冷靜,俞老師(雷鋒網註:俞敏洪)很冷靜,並沒有著急,給大家的感覺是新東方在做什麼?其實我們一直在做AI,各個BU一直在應用AI,但是我們很冷靜地在思考教育+AI到底應該怎麼做?什麼才是最好的時機來擁抱AI?

AI的冬天來了,但春天也不遠

事實上,AI在兩年的火熱之後,冬天已經來臨了,就像外面北京的冬天來到了一樣。

語音識別其實已經很成熟,但是機器學習、NLP、計算機視覺這幾個技術(佔到AI最重要部分的分支)其實已經過了它的頂峰。以深度學習為例,經過幾年大規模的應用,其實越來越多的研究者已經發現,它已經到達了一個瓶頸。我們發現AI並不是像我們想像的那樣真的能去替代人。

中國有一句固話叫「冬天來了,春天還遠嗎」?AI的一個冬天來了,它的下一個春天是什麼呢?其實,很多AI行業中的人也意識到了是場景化的AI。

通用化的AI在過去的兩年中得到了極大的普及,為公眾所接受,很多創業公司如雨後春筍般地興起,獲得了大量的投資,這兩年大家都感受到了,甚至融資的速度超越了前幾年網際網路的速度。

但是,它的冬天來了,因為很多AI的公司並沒有商業化變現,當他們落地的時候發現,變現是如此地困難。尤其是在ToC領域。這是為什麼呢?

實際上是因為AI和行業的結合非常非常困難,不是那麼容易的。所以我們看到通用的AI的發展將會變成這樣一個趨勢,但是場景化的AI在AI和行業的結合領域會產生無窮無盡的機會。

AI+教育將會是對整個教育科技的重構

AI+汽車已經形成了垂直的平臺,百度的阿波羅、谷歌的Waymo都產生了這樣的平臺,AI+生活催生了Facebook的出現,AI+教育會出現什麼呢?我們非常期待。這也新東方對AI+教育這件事深度的思考。

我們認為AI+教育並不一定就是通用AI技術直接嫁接到教育領域,像出現了很多產品級的應用一樣,更多的AI+教育將會是對整個教育科技的重構。很多數據都已經準備好,比如說大數據、雲計算,但在AI+教育領域必將出現一個新的大腦,我們姑且稱之為教育大腦,也必將會出現新的作業系統,這種作業系統可能是在雲,也可能在端,因為所有的AI系統肯定是一個軟硬結合的系統。

個性化的學習平臺將會雨後春筍地湧現

個性化的學習平臺將會雨後春筍地湧現。我們認為它一定是開放的,為什麼?因為個性化的學習太難了,很難一個公司把它實現。因為這麼多的國家,這麼多的人群,不同的年齡段、不同的學科,這個問題對研究界而言,幾乎是沒有唯一解的,所以不可能由一家公司來完成。

新東方AI研究院在「新東方AI+教育戰略」基本的步驟,大家可以關注教育大腦的具體應用。

這張圖很多在座的朋友們可能都已經看到很多次了,不光是在教育領域,其實很多的領域都可以用這張圖來表示,但我們關心的這8個領域,最關注的是他們在這個教育上有什麼樣的不一樣,而不僅僅是這8個詞。所以我藉此機會介紹一下我們關注的20個挑戰。

「AI+教育」的20個挑戰

語音識別的挑戰:中英混合、專有名詞識別難、強噪聲

通用的語音引擎真正應用到教育這個場景下的時候,其實並不像在很多場景下那麼有效,比如說通用的新聞,其實我們很多的雲引擎,無論是谷歌、訊飛、百度的都可以做到接近人或者是超越人的水平,97%以上是沒有任何問題的,99%在特定的場景下也是可實現的。但當進入到教育這個場景下的時候,卻發現它們並不產生作用。比如我們應用到中英混合識別問題,新東方的很多課程都是在拿中文教英語,所以當你看這個波形的時候,中英之間的切換幾乎是糅在一起的,這對語音識別是一個挑戰的問題。

另外進入到教育領域,其實它的場景是非常非常零碎的。你去分科施教的時候,會發現在數理化有很多的公式和名詞是要分別的,現有的中英文的引擎,我們發現原有的識別率在現有的場景下會下降到70%左右。還有一個是很多朋友即將面對的,中國人學英語的時候,我們的發音(尤其是孩子們的發音),我們稱之為「chinglish」,用中文引擎用英文引擎識別都不是有效的,所以我們認為是第三種引擎。

還有我們的線下教室是強噪聲、強混響的語音問題,這個問題解決起來非常困難。亞馬遜的Echo之所以能被大規模地應用起來,其實關鍵是解決了一個工程的問題,就是語音識別的問題,當語音識別應用到教育場景下的時候,這樣一個語音增強的工程問題必須要面對,否則我們基本上很難去實現線下場景下真實的語音識別。

還有多人混合下的聲文識別問題,教育場景下無論是線上還是線下,尤其是一對多的情況,經常會出現多個孩子同時回答一個問題,多個孩子同時討論一個問題,這種情況下做語音識別,不得不面臨如何去把這個聲音分開的問題,這些問題都非常挑戰。

人臉識別的挑戰:超低解析度、強畸變角度、遮擋

進入到人臉識別,這是這一撥AI炒得最熱的,但進入到教育這個場景下的時候很多人臉識別公司也不見了。我們在和幾乎大家能看到的所有國內、國外最牛的人臉公司進行合作。這三個是我們列舉的很實際的問題。

第一個是超低解析度下的人臉識別的問題,右邊這張圖是一個真實的線下課堂場景,就用一個簡單的監控攝像頭試圖來覆蓋整個教室,你會發現問題出現了,當你能看清楚第一排的學生的時候,你就無法看清楚最遠這一排的學生,你試圖要看清楚兩邊的孩子的時候,必須要用一個廣角鏡頭,而這導致了很大的畸變,所以在教育的場景下是非常非常現實的,很難像普通的人臉識別問題一樣給你一個大頭照這麼簡單。畸變的角度下的人臉識別問題就出現了。

孩子們是非常活躍的,這也是教育的本質所在,這就導致了人臉識別不是一個靜態的,而是老老實實地等著你去識別,你如何在動態的情況下、大遮擋的情況下而不是僅僅是局部遮擋的情況下能夠實現人臉的識別?這是必須要解決的一個問題,不解決表情怎麼識別,怎麼時時刻刻知道孩子在幹什麼,所以說起來容易,理想很美好,現實其實是很骨感的。

文字識別挑戰:數理化的公式、手寫體難識別

進入文字識別領域,我們面臨的問題是數理化的公式、圖形、圖像識別問題,還有包括手寫體的識別問題,這都是我們必須要解決的。

NLP的挑戰:多輪對話難以實現、智能批改有局限

還有NLP(自然語言處理)的挑戰,最經典的是多輪對話,這個多輪對話還不是普通意義上的客服機器人,我們希望答疑甚至是替代老師,一定是基於內容的。當基於內容領域的時候,這個多輪對答更困難,號稱能做到二十七輪對話的話是非常非常困難的,我不認為在未來的一兩年內能發生這樣一件事,但也許我們能解決三輪、五輪、七輪。

線上線下課堂自動提煉的問題,新東方也是很多教育公司可能的剛需,我們有這麼多的課堂,這麼多的老師,如何能用AI的手段自動地提煉課堂的內容是解決教學一體化的非常重要的手段。

中英作文的智能批改閱卷,其實已經有成熟的產品了,但我們的實踐發現,要做到真正意義上的批改,必須要進入語義層面,這是非常非常有挑戰的。

視頻分析的挑戰:線下的情況太複雜

其實有很多公司也在向這個方向努力。我們完整的教學過程既包括了老師的分析,也包括了學生的分析。對於老師,我們希望對他所有的教學過程進行評價,對於學生,我們希望對他的微表情進行分析。可是在現在的場景下,線上簡單一些,尤其是英語的教學,因為我們幾乎可以正對著他,有一個大頭照;但線下的情況太複雜了。

圖譜的挑戰:高精知識地圖缺乏

我們幾乎沒有看到任何一張基於學科的高精知識地圖。當AI進入到無人駕駛領域,高精地圖已經成為了一個必然的選項,但我們講了半天的AI+教育,卻很難看到一張基於學科的知識地圖,所以這是一個非常非常基礎的工作。

AR·VR的挑戰:AI合成教師需要互動

最近一個星期最火的事情就是新華社和搜狗一起做了一個AI合成主播。主播技術簡單,因為它是一個單向的,但當我們把這件事放在教育領域談的時候,就是個挑戰,因為AI合成教師不僅僅是一個單向的講,而是需要互動。

機器學習的挑戰:自動標註難、場景零碎、個性化難

自動標註的問題。所有的AI都牽扯到標註,因為我們現在接觸到的絕大部分是監督式的。AI如何做自動的標註,小數據量的情況不是問題,但像新東方這樣擁有海量的公司做這樣的事情的時候,我們發現自動標註是我們必須要面對的問題。

教育場景是如此地零碎和複雜。其實具體到每一個小的場景下的時候,我們發現,小樣本級的訓練問題是如此地突出,這次大會有一個主題就是自適應學習,你會發現專注到每一個孩子的時候,其實它的樣本數據並不多,尤其是冷啟動階段。

個性化學習問題。這可能是我們繞不開的問題,因為一開始的時候不可能對所有的孩子都有一個模型來進行推理,如何把一個模型個性化到一個孩子的身上是一個難題。

新東方的開放戰略:以N-Brain聯盟為基點,數據、場景、資源全部開放

上面這20個問題每一個都如此具有挑戰性,把它做成了,也許能成為一家偉大的公司,至少能對這個行業產生很大的影響。我們面臨這20個,可能還不止20個,新東方怎麼辦?我們的思考其實很簡單,就是開放。

新東方願意把數據拿出來,把場景拿出來,把資源拿出來,因為我們知道我們的起步很晚,我們不可能在所有上述領域再去重新來過,新東方AI研究員也不可能以一己之力跟那麼多的公司PK,所以我們能做到的就是「開放」。

我們兩個星期之前成立了N-Brain聯盟。「N」,首先它代表了N種教育場景,也代表了N種可能,更代表了N個model。N在自然數集裡其實代表了無窮的概念,也代表了力,也代表了氮元素佔到了大氣層78%的比例,我們希望以這種形態,能和在座的各位朋友合作,共同做好AI+教育這件事情。

目前,我們已經和美國的伊利諾伊大學、中國自動化科學研究所這樣頂尖的AI研究機構合作,我們也和北京師範大學、史丹福大學這樣頂級的教育領域、心理學領域、認知科學領域、腦科學領域的研究機構合作,以及與GSV(雷鋒網註:全球矽谷投資公司)等一起合作,我們一起團結資本的力量,還有像騰訊、網易這樣網際網路的公司,甚至包括很多很多的創業公司,我們正在合作,越來越多的公司加入進我們這個聯盟。新東方可以把數據貢獻出來,我們也願意把所有的場景貢獻出來,我們也願意把資源貢獻出來。

新東方AI研究院不僅僅是一個研究的機構(雷鋒網(公眾號:雷鋒網)註:2018年7月成立),同時我們也願意做一個橋,連接內部的資源和外部所有的資源,一起把「AI+教育」這件事情做好,我們的目的不是為了新東方自己用,而是希望向所有的機構和所有的公立學校開放。

雷鋒網2018年度AI最佳掘金案例評選

人工智慧風雨60年,與其說技術升級促成了今天的浪潮,不如說當前的人工智慧,終於站在離商業最近的位置。

去年,首屆「AI 最佳掘金案例年度評選」活動一經推出,便受到了AI方案輸出方和AI技術需求方的極大關注。評選從商業維度出發,尋找用戶/客戶問題解決能力強的產品和解決方案。

現在,我們再次站在AI浪潮之巔,正式啟動第二屆「AI最佳掘金案例評選」。

在AI+教育領域我們一共設置了6個獎項,歡迎踴躍報名,報名地址:https://www.leiphone.com/special/custom/AITopTen2018.html

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 雷鳴、王海峰等20位大咖開講:AI中國機會更多
    醫學影像領域,影像視覺由2019年度 IEEE Fellow、深睿醫療首席科學家俞益洲主講 智能教育由新東方AI研究院院長瞿煒主講 智能技術綜合應用,由清華大學理學院院長、地球系統科學系教授、主任宮鵬主講 最後是一節作業課
  • 夏日專刊AI產品上新升級集錦,50餘項軟硬能力加速場景落地
    七八月50餘項能力的開源開放及升級,是夏日火熱的積澱,希望可以幫助您更高效實現產業智能化應用落地,快來一同閱讀您最關心的內容吧。此次接口公測上線,同步優化模型效果,教育場景下的識別準召率提升至85%+,可用於智能閱卷、拍照搜題等場景>>立即試用ai.baidu.com/tech/ocr/doc_analysis 儀器儀錶盤讀數識別全面公測
  • 「全球AI+智適應教育峰會」亮點與乾貨集錦
    此次峰會,我們邀請到了全球機器學習教父、全球AI排名第一的CMU卡耐基梅隆大學計算機學院院長Tom Mitchell教授,美國三院院士、阿里達摩院首席AI科學家Michael Jordan,IEEE自適應教育標準工作組主席Avron Barr、美國知名智適應教育公司ALEKS前主席、現任首席產品官Wilmot Almpros等頂尖學者;新東方、好未來、松鼠AI、ALEKS 、一起教育科技、掌門一對一
  • 機器閱讀理解快速迭代,人機互動場景持續落地
    經過全球2502個團隊長達2個月的激烈角逐,深思考人工智慧在兩項評測指標中均登頂榜首。值得一提的是,在2018年的「機器閱讀理解大賽」中,深思考人工智慧同樣在1600多支國內外參賽隊伍中脫穎而出,排名第三,獲全球大獎。
  • 京東AI研究院獲QuAC機器閱讀理解競賽冠軍,模型能力業界領先
    這也意味著以零售、物流、金融、客服等優質場景為依託的京東 AI 研究院,在機器閱讀理解能力上取得了突飛猛進的成果。QuAC 新挑戰:更複雜的數據集、更開放的問題、更貼近真實場景機器閱讀理解能力已成為判斷機器是否具有自然語言理解(語義理解、閱讀、問答等)能力的重要標準。SQuAD[2] (Rajpurkar et al., 2016) 數據集的提出極大地推動了機器閱讀理解的研究與發展。
  • 疫情下教培行業加快AI技術布局
    「教育可能是AI商業化落地最好的2-3個行業之一,AI的落地需要很多條件,包括足夠海量的數據、足夠豐富的應用場景,而教育領域可完美地提供這兩個必要條件。同時教育行業是一個人力密集型行業,AI恰恰是極大提高生產力和效率的一個重要工具。」新東方AI研究院院長瞿煒表示。
  • 從場景落地,到改變交通網絡,自動駕駛到底如何定義未來,這10位大牛...
    中科院自動化所複雜系統管理與控制國家重點實驗室主任、中國自動化學會副理事長兼秘書長、青島智能產業技術研究院院長王飛躍、採埃孚中國投資有限公司工程技術中心總監綦平、Mobileye中國區總監Boaz Sacks、偉世通自動駕駛首席架構師王凱 、深圳市城市交通規劃設計研究中心車聯網項目主管 劉琪、Roadstar.ai 創始人兼CEO 佟顯喬、安波福電氣分配系統亞太中心產品工程總監 、應用工程總監餘寧、
  • 新東方教育引入AI模擬真實場景 網絡並非鄉村雲教室障礙
    經濟日報-中國經濟網 鞠然 攝 經濟日報-中國經濟網北京9月7日訊(鞠然 郭彩萍)「在這次疫情中,更多孩子通過雲教室平臺,可以回到真實教學場景中。」 新東方教育科技集團副總裁張戈6日在2020年中國國際服務貿易交易會上說。
  • 英語音標發音:雙元音[ai]的發音方法
    /ai/傳統的國際音標讀音符號   該音是個雙元音,是字母i或y在單詞中的發音。/ai/為雙元音。先發/a/音,然後滑向/i/音。舌尖抵住下齒。發此音的關鍵是要把/a/音發足,注意從開到合的滑動。   發音秘訣:   1.這是個雙元音,由兩個音組成。   2.第一個音/a/,發音時舌尖靠近下齒,牙床全開。
  • 預告| 需求多變的AI安防行業,需要什麼樣的AI視覺計算引擎?
    而在業務層,在面對雜亂需求以及碎片化的場景時,客戶急需選購一款性能強勁、通用性較強、適配度高、定製周期短的軟硬體一體化產品。在甲需求與乙方產品信息難以對稱的情況下,我們的人工智慧安防,到底需要什麼樣的軟硬體一體化視頻分析解決方案?
  • Drive.ai、Waymo率先商業化,智能駕駛加速進入衝擊階段
    繼Drive.ai和德克薩斯州阿靈頓市政府籤署了商業合約後,在日前舉行的2018全球智能駕駛峰會上,Drive.ai的聯合創始人王弢就《自動駕駛技術的快速迭代與落地》進行演講並強調,「Drive.ai到2020年計劃拓展至15個城市,我們正與全球多個城市的當地政府和合作夥伴進行協商」。
  • Drive.ai 王弢:自動駕駛的賽道上,如何與時間賽跑 | 2018 全球智能...
    本次峰會上,Drive.ai聯合創始人,研發與工程總監王弢發表了題為《自動駕駛技術的快速迭代與落地》的主題演講。有報告顯示,如果用路測證明自動駕駛比人類駕駛更安全,至少要經過100多億公裡的道路測試,此外確定路測過程中,接管率要低於多少,才能達到人類駕駛員的標準。其實,自動駕駛的正常執行並不困難,應對突發狀況才是最需要突破的。這些偶發情況稱為邊角案例。但是邊角案例在路測中進行收集和測試,效率較低,因為行駛幾千英裡可能才遇到一次邊角案例。
  • 從教師端到學生端,新東方 BlingABC 「 AI 班主任 」 打造「教育 +...
    10月29日,新東方在京舉辦以「融合 連接 共創」為主題的新東方AI研究院N-Brain聯盟發起暨新品發布會。會上,新東方發布了基於全新平臺的首款「教育+AI」產品——新東方青少外教直播BlingABC「AI班主任」。
  • AI創業公司大列表
    Viscovery : http://viscovery.cn/ , Viscovery於2010年開始研究移動端的圖像識別技術,經過了多年圖像識別技術研發的累積,以及實地操作大量客戶落地場景的基礎之上,成功開發出智能視頻探索平臺VDS。
  • 英語國際音標發音視頻:海倫英語音標[ai]的發音
    新東方網>英語>英語學習>口語>實用口語>正文英語國際音標發音視頻:海倫英語音標[ai]的發音   這節課學習雙元音音標[ai]的發音 ,通常有字母和字母組合i, y, ie, ei, uy, igh, eye都發這個音。
  • 英語音標發音:雙元音 [ai]
    新東方網>英語>英語學習>口語>實用口語>正文英語音標發音:雙元音 [ai] 2012-12-11 16:27 來源:人人聽力 作者:
  • 聖路易斯華盛頓大學劉晨:室內場景的結構化重建 | AI研習社68期大...
    公開課回放地址:http://www.mooc.ai/open/course/538?為了應對挑戰,我們提取了室內場景的特性:平面性與正交性,利用這兩點來做單目結構化重建的工作。我們試圖從照片中提取出所需要的平面,並估計每個平面的三維參數,進而確定平面的三維結構信息。
  • AI視覺在包裝行業中的全方位應用
    同時,必須嚴格把控食品包裝的完整性,包裝上內容的準確性、詳細性以及不同食品分類的速度,這三個環節是食品生產過程中的重中之重。為解決工業生產中的視覺難題,北京矩視智能科技有限公司推出矩視智能工業AI視覺雲平臺(nb-ai.com)可對食品包裝的缺陷、文字、位置等信息進行學習並識別。
  • 微軟開放多項AI技術,小娜與Alexa「合體」丨AI Daily
    1、7 月起,Drive.ai 將在德州提供無人計程車服務由吳恩達擔任董事的無人車初創公司 Drive.ai 昨日宣布: 2018 年 7 月起將在德克薩斯州弗裡斯科(Firsco)提供無人計程車服務。Drive.ai 將與弗裡斯科運輸管理協會合作,共同運營該項目。
  • 對話深思考CEO楊志明:從AI技術走到用戶需求
    專攻多模態深度語義理解,推出深思考大腦(iDeepWise.ai)4.0「AI技術的發展會經歷感知、識別、理解、決策四個階段。業務場景來落地。創業三年,楊志明認為最關鍵的就是找到剛需場景,用AI技術賦能這些場景,產生更好服務,最大的挑戰是如何用技術來解決這些場景下的產品化問題。深思考目前更多地將多模態深度語義理解技術應用在醫學健康領域。