作業幫羅亮:基礎音視頻服務和AI視覺語音是直播課技術兩大核心

2020-12-16 澎湃新聞

原創 李海顏 芥末堆看教育 收錄於話題#芥末堆·GET全國行29個

作業幫副總裁羅亮在做「後疫情時代作業幫對教育科技的探索」的主題分享

♪ 作者|芥末堆 李海顏

♪ 編輯|芥末堆看教育

11月24日,在「或躍在淵:教育的信心與發展」芥末堆GET2020教育科技大會上,作業幫副總裁羅亮帶來了「後疫情時代作業幫對教育科技的探索」的主題分享。

他表示,在線教育的最大價值是在於用科技的力量,把知識分發到每一個有需要的學生身邊,而教育科技就是把優質的教育資源放大、遷移、匹配的便捷管道。就直播技術而言有兩大核心,一是基本的音視頻傳輸能力和互動能力,二是利用AI技術提升學生課堂中的互動效果。

以下為羅亮的演講實錄:

尊敬的各位嘉賓大家好!我是來自作業幫的羅亮,今天分享主題是《後疫情時代作業幫在教育科技的探索》。我是在教育行業裡面做技術的,其實可以看得出來,在線教育的最大價值就是用科技的力量把知識分發到每一個有需求的學生身邊。

網際網路是什麼?網際網路本質是連接,它能打破時間、空間、地域、階層的限制,讓整個社會、整個信息得以連接。教育又是最不均衡的社會資源,通過技術我們可以把教育資源均衡地分發下去,所以技術的價值就是搭建起了把優質的教育資源放大、遷移、匹配的便捷管道。

為什麼我們能做一個管道呢?在我看來,作業幫在累計8億智能設備上被激活,每月連接用戶數超過1.7億,這樣的積累幫助我們在技術上持續提升。我們用科技來賦能教育,為教育普惠貢獻自己的一份力量,我們有60%的直播課的學員是來自三線及三線以下的城市與鄉村。

疫情以來,各地紛紛轉戰線上,在線教育被推到了風口浪尖。作業幫也積極響應政府號召,助力各地中小學生在線學習。疫情期間,我們開設了春季免費直播課,僅五周的時間就有3300萬人次的學員參與了春季免費直播課。同時,我們還開設了名師講堂公益課和針對高考的高考真題解析直播課。

疫情來臨時,大量的學生突然湧入在線教育。過往我們在線直播課學員數量是百萬級別,但今年已超過了3000萬,整個數量級乘了10倍,這其實對於做技術的人而言是一個非常大的挑戰。

這個時候怎麼辦?坦白的說就一個辦法,多加點伺服器、多加點帶寬,但是加伺服器和帶寬並不是那麼容易。首先,需要基礎架構能夠支撐增加伺服器和帶寬;其次,需要在短時間內找到供應商,並讓其提供服務。這兩點都不是短時間內可以做到的。

作業幫早在一年前就已經從單一的雲服務商變成了五家雲服務商同時提供服務,才能在短時間內增加伺服器和帶寬,才能比較從容地承接用戶的爆發。此外,直播技術也是我們的核心技術之一。我們用了將近一年半的時間搭建了一套自己的直播體系,在今年的免費直播課中也發揮了應有的作用。

直播課的兩大核心:基礎音視頻服務和AI視覺語音技術

後疫情時代對教育科技提出了更多要求和挑戰。比如,如何滿足更多形式的授課方式、如何更好地提升整個課程的互動效果、如何真正有效地提升學習的效果。經過疫情的大考我們開始進行自己的思考和探索,我們認為技術是能做非常多的事情。

整個直播課我認為有兩個核心要點,第一是直播技術本身,基於Web RTC的行業協議我們自研了一套直播架構體系,讓分布在全國各地的師生通過直播網絡穩定的連接在一起。我們的直播課類型是多樣的,包括1對多的大班直播課、1對1的輔導課以及6人的小班課等等。6人小班課其實本質上是一個大班,但是每一個學生的感受是在一個6人小班當中上課。

我們的用戶覆蓋全國整個學生群體,這樣多形式的直播課,如何通過直播網絡將分布在全國各地的師生都穩定的連接在一起呢?我們用了一年時間和雲服務供應商一起共建了遍布全國的節點網絡,為老師和學生提供足夠清晰、足夠流暢、實時互動的直播音視頻服務。

基礎的音視頻服務之外,在未來直播課中我們認為會大放異彩的是AI技術。我們用AI做什麼呢?就目前的行業技術而言,我們在教學領域應用最多的是視覺技術和語音技術。

以視覺技術為例,我們可以利用視覺技術對學生在課堂上的學習情況、表現情況進行感知。通過視覺技術能夠幫助主講老師收集學生在課堂上的表現情況,包括注意力是否集中、是否有家人陪同、坐姿是否端正等。這些行為的識別、分析和匯總,能夠幫助主講老師及時了解所有學生的上課狀態,比如內容是否難度偏大,學生整體的接受度如何,是否需要著重講解或者是轉換講課方式。

同時也能夠幫助輔導老師關注學生的學習行為。如學生狀態有異常,老師直接收通知,會提醒學生更好地投入到學習中去。學生在上課過程中,如果離屏幕太近,我們也會對他進行提醒。

每節課結束後,我們會綜合匯總學生當節課各種行為、注意力集中狀態、答疑情況等,智能分析的學生行為數據,匯總後呈現給老師,老師基於這個完整的報告來評估自己教學情況,不斷提高自己的教學水平。

另外一種形式是語音技術,我們自研的AI語音技術提供了語音發彈幕的能力和服務。在小低年級,孩子最自然的交互形式是說話,學生們可以用語音發送自己的彈幕,這樣極大提升了學生在課堂當中的參與感和積極性。而且在一些英語學科當中,口語的讀寫、聽寫能力都是非常重要的,我們也能通過AI技術對用戶的讀音的效果進行評分,匯總到老師那裡,可以讓老師和學生進行反饋互動,你答得好不好、你答得怎麼樣,這樣的技術在當今的直播課裡面、AI課裡面大量使用。

同時,通過語音技術還能提升交互能力。我們有一種教學類型叫集體發言,六個學生針對老師提出的問題一起來發言,這個時候我們會發現一個問題,每個學生既要聽得見同學們的聲音,還要不被發出來的聲音回聲所幹擾,這需要大量噪音消除、回聲消除的技術,讓同組學生,也讓老師能聽到學生們的清晰發言。

所以其實我們可以看到直播課技術的兩大核心,一是基本的音視頻傳輸能力和互動能力,二是利用AI技術提升學生課堂中的互動效果。

AI技術是算法、模型和數據的結合體

其實AI是什麼呢?AI是算法、模型和數據的結合體,我們在這上面的成果,源於作業幫長期的技術和數據積累,尤其是在作業幫拍照搜題這個場景下的不斷探索。

作業幫APP是中國全網流量裡面APP活躍度TOP30的教育類APP,我們的月活過億。在這5年的過程裡面,我們累積了20000TB的學習數據,同時也積累了超過2.5億的行業題庫。

疫情期間,對拍照搜題業務也提出了新的挑戰。過去對著書本或者手寫的文字,疫情期間出現了很多對著屏幕拍照的需求,增加了對識別技術的要求。比如電腦屏幕有閃爍,有摩爾紋,有反光,這些新情況,需要不斷的去迭代和優化,儘可能的去提升用戶搜索的準確率和召回率。

拍照搜題是作業幫積累最久的一個技術,經過5年多不斷的迭代和創新以及積累,目前已經是一個結合神經網絡,集群化的識別引擎。我們在5年前拍一道題得到它的答案大概可能要七八秒鐘的時間,但是到了今天通過不斷提升的神經網絡,我們能做到在200ms內完成識別解析,然後從包含2.5億個題目的搜尋引擎裡匹配到最佳的結果。

其實在這個過程中我們經歷了非常多的挑戰,從最開始的準確率低到令人髮指,到今天我們能應對模糊、傾斜、幹擾各種低像素的相機,很多用戶的設備是拿著家長淘汰下來的舊手機、老手機,像素低、內存小,拍出來的質量參差不齊。

長期面對這種低像素、模糊、傾斜、幹擾等等的輸入,倒逼我們去不斷的提升識別的效果,也幫助我們積累了大量的寶貴數據,提升了模型的能力,形成一個正向循環。通過不斷的積累在AI方面的技術能力,我們也把這些能力應用到了更多的場景中去,提供更好的產品,比如整頁拍搜、自動批改,自動答題等功能。

我們在這個過程中能看到技術對在線教育起非常大的促進作用,在疫情的衝擊下,各行各業都起了很多的變化。在線教育在後疫情時代被推上了歷史的舞臺,中央也在「十四五」的規劃裡面提出要建設高質量的教育體系。在線教育不僅可以促進教育普惠,推動教育均衡發展,還可以激發優質教育新供給,推動中國教育邁向數位化、智能化、個性化的新臺階。

本文作者:李海顏

芥末堆 記者

挖掘、尋求真相

原標題:《【GET2020】作業幫羅亮:基礎音視頻服務和AI視覺語音是直播課技術兩大核心》

閱讀原文

相關焦點

  • 作業幫羅亮:基礎音視頻服務和AI是直播課技術兩大核心
    就直播技術而言有兩大核心,一是基本的音視頻傳輸能力和互動能力,二是利用AI技術提升學生課堂中的互動效果。以下為羅亮的演講實錄:尊敬的各位嘉賓大家好!我是來自作業幫的羅亮,今天分享主題是《後疫情時代作業幫在教育科技的探索》。
  • 中國教育科技大會|作業幫發力OCR+AI技術,持續打造技術壁壘
    為此,作業幫持續更迭OCR技術進階拍搜體系,以多線性思路兜底知識索取,同時發力AI技術在直播課中的深度應用,打造強交互和場景化在線課堂。作業幫拍搜技術向上突破,承接全國中小學生釋疑需求近年來,作業幫拍照搜題成為全國中小學生快速獲取知識的重要工具。據王巖介紹,早期經過研發和探索,作業幫拍搜系統在後臺開發及測試階段已經能達到較高的準確率。
  • 讓小學生對話「雲同桌」——AI技術下作業幫在線課堂的高頻互動
    2021年1月27日,應學員在用戶調研問卷中提出的需求,作業幫直播課對「小組直播間」的集體發言功能進行了升級。「在線下,老師和學生之間的互動頻率會非常高,而在線上,各個公司目前的直播課產品互動頻率卻都非常低,能夠做到15分鐘一次就已經很不錯了。」曹越認為,這個問題的核心原因就是缺少一個高頻互動的方式。
  • 作業幫受邀參加GET2020教育科技大會
    羅亮表示,作為在線教育行業的重要參與者和建設者,作業幫累計在超過8億臺智能設備上被激活,每月連接超過1.7億用戶。這樣的積累構成了作業幫管道的底層能力,同時也反過來促進作業幫自身科技實力的提升。「在作業幫,有60%的直播課學員都來自三線及以下的城市和鄉村,這顯示出教育科技的發展和創新,已經真真切切地用一線城市優質的教育資源,服務到了最普遍、最廣大的學生。」
  • 視覺模型核心難點攻破!AI開發進階系列公開課邀你加入
    其中物體檢測和圖像分割被廣泛應用在瑕疵檢測、安全生產隱患檢測、衛星遙感監測、無人機航拍等場景中,這些場景裡往往需要對大圖像數據中的小目標進行檢測,如何藉助AI能力在大圖小目標的場景裡降低漏檢率和誤檢率是行業一大難題,困擾著無數開發者。
  • 「作業幫直播課」產品分析:K12在線直播如何抓住用戶的心?
    作業幫以其優質的教師資源、豐富的課程內容和獨創的課程服務模式,獲得了600萬家庭的信賴。就在2019 年暑假,K12在線輔導流量大戰硝煙四起,迎來「百團大戰」。而作業幫更是在廣告營銷方面日均投放高達1000萬。K12在線輔導戰火不歇,在線直播課何以如此火爆?「作業幫直播課」又是怎樣抓住了用戶的心?本文從「作業幫直播課」出發,來進行進一步探究。
  • 作業幫直播課最新下載安裝_作業幫直播課下載安裝_18183軟體下載
    對此類軟體感興趣的用戶,快來挑戰作業幫直播課下載安裝吧作業幫直播課下載安裝特色系統:作業幫直播課下載安裝將為您帶來一種前所未有的軟體體驗原作業幫一課更名為作業幫直播課
  • 起底在線教育行業的技術霸主
    而保證用戶體驗的技術,正是作業幫的「看家本領」。2016年開始嘗試直播課到現在成為核心產品,作業幫直播課背後的技術架構大大小小迭代了太多遍,每一遍都有切實的提升。從原來的單一雲服務到現在同時用5家雲服務;從原來大多使用第三方API到現在大多自研……甚至公司直播區的電線都要有兩路,一度引發了技術工程團隊和後勤保障團隊之間的誤解。
  • 上線「雪球」AI伴學 作業幫直播課產品升級的邏輯是什麼?
    作業幫直播課小學數學李老師以這樣的開場,將小學員們「帶入」了在線直播課堂。  雪球是以北極熊為原型的IP形象,是學生們學習的夥伴,更是一個跟蹤記錄所有學習數據的AI伴學系統。當前,雪球貫穿了作業幫直播課的整個小學產品線。  小學階段是入口,作業幫非常看重。作業幫聯合創始人陳恭明認為:「小學階段就像金字塔的底端,是我們全力以赴的事情。」
  • 作業幫怎麼使用 作業幫直播課觀看方法
    作業幫是一款非常不錯的學習幫助軟體,小夥伴們如果在學習上遇到了作業上的難題的話可以在裡面尋求解決,同時還能觀看直播課提高自己的學習成績,那麼作業幫裡面的直播課究竟應該怎麼觀看呢?下面小編就給大家介紹一下作業幫直播課觀看方法,希望能夠幫助到大家。
  • 作業幫直播課發布《直播課上課操作指南》
    學生長時間遠離學校、老師,怎樣才能保證持續有效地教育和學習?這成為老師、家長、社會共同關注的焦點。為給廣大老師、家長提供幫助,今日,作業幫直播課發布《直播課上課操作指南》,從基礎硬體、備課準備、課堂設計、上課建議等四個方面進行操作提示,希望為初次接觸在線直播授課的教育工作者帶來一點啟發和幫助。
  • 暑期780萬學員背後:風暴中心,作業幫的躍遷之戰
    迎戰風暴中心:最低代價的超速增長從 1 月 24 號大年三十開始,作業幫直播課技術負責人洪定乾每天要打 150 個以上的電話,以確認免費課能夠在5 天內順利上線。在 2019 年 8 月加入作業幫之後,技術副總裁羅亮的會議時間精確到了每一個 15 分鐘。作為曾在百度並肩多年的老同事,羅亮從 2015 年開始每年都會和作業幫聯創陳恭明吃幾次飯。
  • 作業幫一課更名為「作業幫直播課」
    隨著作業幫在線直播課產品受到全國更多學生和家長的青睞,近期我們對「作業幫一課」進行了全新升級,並正式更名為「作業幫直播課」。 作為教育行業和前沿技術成功融合的新事物,作業幫直播課已成為傳遞優質教育資源、推動教育行業發展的新機會,「作業幫直播課」將更好地體現我們的品牌,以及業務的性質。
  • 人工智慧產業鏈的三個核心,底層硬體、通用AI技術及平臺、應用領域...
    )、FaceOS(CV)、思必馳(語音)、聲智科技(語音)、雲知聲(語音)、啟英泰倫(語音)、耐能(IoT)、NovuMind(IoT)、微軟(VR)、華捷艾米(VR)、IBM(類腦晶片)、西井科技(類腦晶片) 視覺傳感器:圖像傳感器及視覺算法/軟體解決方案提供商,用於捕捉和分析視覺信息,代替人眼做各種測量和判斷
  • 作業幫直播課與中國移動、中國聯通等多家平臺聯合推出免費直播課
    中國移動、中國聯通、愛奇藝知識、浦發銀行信用卡等多家網際網路平臺及機構平臺,與作業幫直播課攜手為學生們打造全網便捷的在線優質教育通道。 作業幫直播課攜手中國移動聯合上線免費直播課。在北京移動APP首頁點擊「免費授課」即可參與,作業幫免費直播課,課程涵蓋小、初、高所有年級主要學科,針對特殊學情定製內容,主要為校內基礎知識點的鞏固與學習,不超前、不超綱,讓孩子們足不出戶暢享移動網際網路時代下的學習新體驗。中國移動充分發揮5G技術優勢,在這一特殊的新春佳節中,為學生們保駕護航,與全國人民共同打贏這場疫情防控阻擊戰。
  • 作業幫、學而思們排排坐:免費直播課交作業,而考驗才剛開始
    對於網絡直播課來說,中小學延期開學,更意味著要在幾乎沒有時間準備的情況下展開一場「裸考」。如今開學時間尚未確定,學生們在家卻學習正酣,網上幾大在線教育平臺如學而思、作業幫、猿輔導、跟誰學等以摸著石頭過河的魄力與決心也收穫了用戶量的井噴和社會好評。
  • 新零售運營小技巧:關於直播培訓的22個工具整理
    ⑤PPT直播⑥PPT語音頭像直播⑦語音視頻直播;2、視頻商城功能;3、代理分銷;4、社群管理;5、數據輸出;6、用戶積分;7、5000人社群直播;8、好友助力;9、作業打卡;10、營銷方案制定11、獨立專屬品平臺開發(10-15天周期,需要搭載企業認證服務號
  • 作業幫直播課初中課程體系,打造從思維到視野全面提升的課堂
    剛剛過去的寒假,作業幫直播課為全國3000萬中小學生提供免費直播課。如果說免費課打開了線上教育的一扇窗,讓更多人看到了「讓優質教育觸手可及」的可能,我們希望接下來為你帶來更全面的課程體驗與服務——作業幫直播課長期班。作業幫直播課小初高各學部的長期班都擁有獨家研發的課程體系,這些課程體系究竟是怎樣幫助同學們高效學習的呢?
  • 音視頻技術開發周刊
    每周一期,縱覽音視頻技術領域的乾貨和新聞投稿:contribute@livevideostack.com。 https://www.kurento.org/blog/kurento-6140-june-2020 WebRTC系列之音頻的那些事 WebRTC由語音引擎,視頻引擎和網絡傳輸三大模塊組成,其中語音引擎是WebRTC中最具價值的技術之一,實現了音頻數據的採集
  • 作業幫直播課:開啟北大學姐理科逆襲的三大錦囊
    (原標題:作業幫直播課:開啟北大學姐理科逆襲的三大錦囊) 作業幫直播課高能學霸課