華中師範大學 劉三女牙
[摘 要]當前,關於學習分析研究,國內外研究學者主要關注於學習者在網絡教學環境下產生的結構化數據,而伴隨學習交互模式的多元化,以文本為主的非結構化數據正在不斷生成。近年來,通過對文本數據的挖掘來測評學習者的知識能力以及甄別其心理與行為已成為一種新的學習分析方法。本文首先描述了學習分析、文本挖掘的概念,通過文獻分析法,對國內外採用文本挖掘技術的學習分析研究現狀進行了綜述;其次,介紹了學習分析中文本挖掘的數據來源、方法和工具;最後主要從課程評價支持、學習者知識能力測評、學習共同體分組、學習行為危機預警、學習效果預測和學習狀態可視化6個方面闡述了文本挖掘應用於學習分析中的具體實例,並對未來作進一步的展望和探討。近年來,「大數據」成為了各行各業關注的熱點話題,教育作為大數據的一個重要應用領域,相關學者已預測大數據將給教育帶來革命性的變化。開放式網絡課程的井噴式湧現和在線學習平臺的普及,使教育領域中的「大數據」技術獲得了更為廣闊的發展空間,為利用這些數據中隱含的、有價值的信息,進行智能化的教學決策與學習服務的優化,學習分析技術應運而生。當前國外一些學習分析研究小組和機構已開展了一些前瞻性項目和應用,例如:2009年美國普渡大學推出一個名為信號(Signals)的項目[7]。它旨在利用課程管理系統中的數據來預測學業成功與失敗;2011年比爾和梅琳達·蓋茨基金會資助開發的大數據分析系統——「學位羅盤」(Degree Compass)[15]。它能在對學生信息管理系統中數據分析的基礎上向學習者推薦合適的課程;2012年密西根大學開發了用於鼓勵和指引學習者有效完成交互活動的Gradecraft平臺等[16]。我們可發現,目前的學習分析應用大多是利用學習管理系統、教學軟體來收集學習者個體及群體在網絡教學活動中產生的結構化數據,然後從中提取知識並存入關係型資料庫。
然而最近的趨勢是交互科技(Interactive Technologies)在教學中得到了廣泛應用,通過在線學習系統、社交網絡平臺、移動終端生成了越來越多複雜的非結構化數據。非結構化數據包括所有格式的辦公文檔、即時信息、e-Mail、聲音、圖像和音頻等等。Gartner和IDC稱:近80%的網絡數據都是非結構化[1][2][22],這些數據蘊藏了大量有價值的信息,但是目前人們還很難管理和分析。非結構化數據是不符合預定義的數據模型的內容,難以實現自動化識別,並且不完全符合資料庫的存儲標準與規範。毫無疑問,文本是非結構化數據中最典型、顯性的實例來源[2][20]。通過捕獲和分析在商業、生物醫學、政府等中的文本數據[2][17][19][23][25]已改變了其決策的制定和資源的分配。然而,在教育領域中,致力於優化學習服務的學習分析技術,通常注重於數字的分析[3],比如在線學習系統中學習者的登錄/登出次數,上傳/下載文件次數,提交/未提交作業次數,瀏覽課件時長等外顯式行為數據,但較少考慮學習者的態度與感受等內隱式行為信息,例如學習者群體的在線對話交流與討論,學習者個體的課程評價、筆記等數據信息。因此傳統的學習分析技術難以準確發現學習者的個體意願和內在心理狀態,並不能深入解釋影響學習者學業成功與否的關鍵因素。文本作為教育大數據中一種特質的類型,最真實、直接地反映了學習者的學習動機、認知發展、情感態度、學習體驗。通過文本挖掘,可提取出學習者文本表達中隱藏的關鍵信息,實時監控學習者的意見和想法,將有助於學習者在文本交互中的自動幹預和推理。並且至2011年起,連續四屆「學習分析技術與知識國際會議」中,文本作為協作學習和知識傳播的重要途徑成為了一個研究重點。由此可見,文本挖掘在學習分析中的地位已日益凸顯,那麼如何將文本挖掘的優勢與學習分析應用相結合就給我們帶來了新的研究視角和挑戰。
(一)大數據環境下的學習分析
隨著教育信息化的不斷深入和「大數據」時代的來臨,學習分析作為大數據在教育中的重要應用之一,為達到支持教學決策,優化學習服務的目的提供了一系列方法和策略。加拿大阿塞巴斯卡大學的G.Siemens 教授[5]認為學習分析是「關於學習者以及他們的學習環境的數據測量、收集、分析和匯總呈現,目的是理解和優化學習以及學習情境」。新媒體聯盟(NMC)將學習分析定義為:利用鬆散耦合的數據收集工具和分析技術,研究分析學習者學習參與、學習過程和學習表現的相關數據,進而對課程、教學和評價進行實時修正[4]。並且新媒體聯盟地平線報告(2014高等教育版)中[16]預測學習分析將在1年內成為主流。
(二)面向學習者行為的文本挖掘
文本挖掘作為輔助學習分析的核心技術之一,可以幫助辨識和解釋學習者的心理及行為過程。文本挖掘作為一種主流的方法論,在許多領域都有廣泛的應用。文本挖掘一般指從非結構化的文本數據中(例如:文檔、聊天信息和郵件)發現和提取有用的模式、模型、方向、趨勢或者規則[43][44],最終形成用戶可理解的信息與知識的過程。它是語言學、統計學、機器學習、數據挖掘及自動文本處理如信息抽取、信息檢索、文本分類等理論和技術相結合的產物,更多地被用在生命科學研究、政府智能、商業等應用領域。目前,已有不少研究將文本挖掘引入教育領域中,輔助文本內容研究,實現面向學習者行為的文本數據挖掘,支持學習設計和評估反饋。
在查閱國內外著名文獻資料資料庫基礎上,本文嘗試運用文獻分析法對基於文本挖掘的學習分析應用研究的現狀進行綜述和梳理,具體情況如下:
對於國內研究,文獻分析的主要來源是「中國知網」學術文獻庫中的相關文獻。筆者在「中國知網」學術文獻庫中以最近十年(2005年1月至2014年12月)為時間跨度,對「文本挖掘」和「在線學習」、「文本分析」和「在線學習」、「學習分析」等關鍵詞進行高級搜索,統計時剔除與主題關聯性不大的文章,最後獲得相關文獻11篇。由此可見國內運用文本挖掘技術來調整和改善教學的研究較少,缺乏具體的案例實踐經驗,有待進一步思考和研究。
對於國外研究,筆者藉助Google學術搜索、ACM 美國計算機學會資料庫(國際站)、Elsevier Science Direct Online資料庫為國外文獻搜索來源,以最近十年(2005年1月至2014年12月)為時間跨度,對「文本挖掘(Text Ming)」 和「在線學習(Online Learning)」、「文本分析(Text Analysis)」 和「在線學習(Online Learning)」、「學習分析(Learning Analytics)」等關鍵詞進行高級搜索,對搜索結果進行針對性的選讀並去掉重複篇章,最後獲得與本文主題相關學術期刊或會議論文共103篇(Google學術搜索43篇,ACM資料庫31篇,Elsevier資料庫29篇)。如圖1所示是國內外各年份研究論文的數量分布。
圖1顯示,國內外對文本挖掘學習分析應用的研究整體有顯著的上升趨勢。尤其自2010年以後,研究論文增長的幅度更為明顯,主要因為在國際上有專門針對學習分析研究和應用而召開的國際會議「學習分析技術與知識國際會議」和美國新媒體聯盟與美國高等教育信息化協會(EDUCAUSE)對學習分析研究的高度重視,並且越來越多的研究者對利用文本挖掘技術助力學習者知識能力的測評和學習者心理與行為的研究方法產生了較大的關注度和興趣。根據文本挖掘在學習分析應用中的研究與實踐,我們可以將獲取的114篇文章劃分到七個應用類別:「課程評價支持」、「學習者知識能力測評」、「學習共同體分組」、「學習行為危機預警」、「學習效果預測」、「學習狀態可視化」、「其他」(包括知識構建、文本注釋、同伴互評等方面研究)。圖2所示是文本挖掘在學習分析中的具體應用研究分布情況。
從圖2可看出,往年關於課程評價支持的研究相對較多,一定程度上反映出文本挖掘在支持課程教學方面具有較強的實用意義和價值。最近幾年,各類具體應用研究的比重都有所提高,這也表明將文本挖掘作為一種技術手段來調整和優化教學過程已日漸得到本領域研究者的肯定和認可。
為了更全面準確地揭示學習系統的概覽,學習分析中不僅應包括結構化數據,也應包括以文本為主的非結構化數據。我們需充分利用文本挖掘技術的優勢來剖析學習者文本表述背後的深層次含義和理解其認知過程,輔助分析、優化學習及其發生情境。如圖3所示是文本挖掘應用於學習分析的系統框架圖,左側列舉了制約文本挖掘在教學中繼續深入推進的關鍵因素,中間描述了文本挖掘作為支撐學習服務的一種輔助技術的過程, 右側總結了文本挖掘應用於學習分析中的一些具體實踐項目。
(一)數據來源
目前,在線學習系統、教學網站和網絡公開平臺的討論區、實時答疑室、評論模塊、學習文檔、學習筆記和日誌已成為學習者產生文本數據的主要來源,並且隨著廣播式社交網絡應用的盛行,校園SNS (Social Networking Services)、微博、博客等Web應用以及移動手機、平板上所產生的文本數據都為密切跟蹤學生學習的感受和需求提供了充足且真實的數據源。與現實中面對面交流不同,虛擬網絡為學習者提供了更為自由和開放的言論空間,這使得學習者在在線互動過程中「無意」生成的數據裡蘊含大量潛在的、有價值的個體或群體信息。
(二)分析方法
根據文本挖掘的主體可分為人工挖掘和自動挖掘。人工挖掘是人們閱讀文檔、關注內容並手動劃分其類別,雖然對於小樣本文本數據的分析,人們很擅長理解其含義,但耗時又耗力,並且對於當前日益增長的文本數據而言,僅使用人工挖掘顯得不太現實。而自動挖掘不僅可以節省時間和人力成本,並且適用於解決海量文本數據分析的問題。通過對收集文獻的總結歸納,基於自動挖掘的方法可以涵蓋以下幾種:(1)分類;(2)聚類;(3)關聯規則分析;(4)語義分析;(5)可視化;(6)話語分析;(7)內容分析;(8)其他。如圖4所示是文本挖掘應用於學習分析具體案例中各種方法數量的柱狀圖。(一篇文獻可能包括一種或多種分析方法,本文採用累加統計。)
從圖4可看出,分類、聚類、關聯規則分析等經典文本挖掘方法仍佔據很大比例,不過作為社會科學領域中的關鍵方法話語分析和內容分析也表現出強勁的增長趨勢。
(三)分析工具
針對不同學習情境中文本數據的複雜性、內隱性、交互性等特點,一些特色各異的文本挖掘工具已經被設計和開發,極大加快了人們從中提取信息的能力,為快速、精準、深入解讀學習者表述中的隱含內容和豐富意義提供了便利。如表5所示是基於文獻分析基礎之上,對學習分析具體實例中文本挖掘工具的使用次數進行排序和概述。
當前文本挖掘與學習分析正在不斷地深度融合,這一交叉領域已產生了大量研究成果,具有廣泛的應用前景。根據差異化的教學目的,針對不同的學習情境,研究者開發出一些新工具和提出新模型、方法,並在新研發平臺或已有平臺上開展了大量實例研究。筆者對其進行詳細的總結和歸納,主要從以下六個方面來探討。
(一)課程評價支持
作為一種有效的教學方法,課程評價在教學過程中的作用至關重要,能為教師和學生提供及時的反饋和建議。如一項探討挖掘學習者反饋的教學文本情感研究[41],提到在每門課程結束後,學習者通過行動裝置發送短消息來評價課程教學。該研究旨在利用SMS(Short Message Service)文本內容和表情符號來呈現課程評價的積極和消極內容。與此類似的一項研究中,Kontogiannis等人提出了一種新的課程教學評價框架來自動挖掘學習者情感觀點[26],他們通過收集學習者在社交網絡微博客中產生的有關學習課程活動文本數據,並利用觀點挖掘技術來判斷學習者對每門課程所持有的積極或消極態度。此外,一項由美國國家科學基金會資助的學習系統GIS研究[30],通過收集GIS系統中大學生的文本評論內容,使用文本挖掘技術來發現和抽取潛在的知識,旨在將學習者評論劃分為不同類別,從而輔助學習平臺的教學者可以從大量文本數據中快速識別出關鍵主題,為進一步指導課程教學提供依據。
(二)學習者知識能力測評
相比傳統研究中利用學習者的客觀題解答結果來評估知識掌握程度,我們可以利用學習者在教學活動中產生的主觀文本數據來測評其知識結構、高級思維技能等。以下我們將主要從學習者寫作能力和閱讀理解能力測評兩個方面來闡述。在威特沃特斯蘭德大學計算機科學學院[36],研究者專注於開發一個自動短文評分系統,它通過對學習者提交的短文本內容採用潛在語義分析方法進行自動評分。實驗結果指出該系統在理想的配置下可以準確測評出學習者的寫作水平,並且自動評分的準確度可超過80%。此外,中國香港大學計算機科學與工程系研究者開發了一個名為VeriGuide的平臺[34],旨在提供專業的寫作工具集測評學習者能力並促進寫作的教學和學習。在智利大學,一項基於情境化模型和潛在語義特徵的自動化文本理解分類器研究中[13],以來自工程學和語言學學院的大一學生為實驗對象,通過分析學習者關於閱讀資料問題的文本作答來檢測發現其閱讀理解能力的不足。此外,就學習者的閱讀理解任務而言[14],該項研究描述了如何結合多維K-means聚類方法和布魯姆教育分類理論來確定他們採取的積極和消極的認知策略。
(三)學習共同體分組
大規模在線學習環境中,協同學習已經成為一種主流的學習方式,我們應結合實際的教學需要,根據學習者特徵來確定不同類型的學習者,促進學習共同體學習效果的最優化。例如,在加拿大英屬哥倫比亞大學,一項辨識學習者在線交互行為模式的研究中[35]。研究者基於學習者與在線學習平臺的交互日誌進行分析,構建用戶模型框架,對具有相同學習偏好、興趣、主題等的學習者進行聚類和分組,提供合適的學習支持和交互體驗。在此基礎之上,西班牙科爾多瓦大學計算機科學學院研究者提出了一種改進的聚類模型[6],相比傳統收集學習者所有在線交互的日誌數據,該模型在劃分學習共同體組別方面具備更好的適應性。在美國哥倫比亞大學計算學習系統中心,研究者介紹了一種非監督式方法來自動化檢測討論區主題內持有相似觀點的學習者[46]。實驗結果指出學習者含蓄態度的表達(傾向於使用相似的文本內容)對於直接態度的表達(討論話題內隱含的情感)是一個很重要的補充,並且兩者的結合可以有效提高構建學習共同體的準確度。
(四)學習行為危機預警
根據言語行為理論[29],人們在書寫文字的同時也在實施某種行為,從文字中傳遞出來的言語信息可反映個體的意志和行為心理現象,能為教師及時掌握學習者的思想狀況及行為危機預警提供可靠的決策支持。在澳大利亞昆士蘭大學,研究者使用SNAPP(Social Networks Adapting Pedagogical Practice)工具來分析學習者與討論區的交互活動[11],旨在識別處於高風險狀態的學習者,引導教學者及時實施幹預。由美國國家科學基金會(National Science Foundation)資助卡耐基梅隆大學計算機科學學院的一項關於情感分析來預測學習者退課行為的研究中[39],以Coursera平臺中3門課程的討論區帖為數據來源,通過分析學習者集體的情感來監測學習者在課程中的情感趨勢。實驗結果指出學習者在課程討論區內的集體情感比率與其退課率有顯著的關聯。此外,在美國德州大學達拉斯分校行為與腦科學研究院,Underwood教授開展的關於中學生反社會行為挖掘的開創性研究[27][28]。該研究通過採集學習者在手機通訊中產生的簡訊內容,利用發布時間、關鍵不良情緒詞、發送對象等信息推測群體性不良行為,並得出了觸發該群體不良行為的一系列量化因素,為學習者行為的分析和危機幹預起到了重要的推動作用。
(五)學習效果預測
研究者通過採集和分析學習者學習經歷相關文本數據,探索學習者在不同階段中學習效果的改變,發現學習者學習行為與學習效果的相關關係。例如,在美國德克薩斯大學[8],研究者以363個大學生的自我介紹簡文為數據來源,使用LIWC工具對其進行分析來預測學習者的課程效果。實驗結果指出某些特殊語詞類別的詞語構造使用概況確實可作為預測學習者課程效果的重要指標。西班牙科爾多瓦大學計算機科學與數據分析學院提出了從定量、定性和社交網絡三個測量角度來評判學習者在討論區內的參與行為[9],並結合不同的文本挖掘方法來提高學習者最終學習效果預測的準確度。實驗結果表明,基於學習者在討論區內產生的文本數據,使用聚類及關聯規則分析方法有助於預測學習者課程通過情況。此外,韓國梨花女子大學研究者通過分析學習者的學習日誌[12],從中選取能夠體現其時間管理策略的3個變量來驗證與學習者學習成效的關聯關係。
(六)學習狀態可視化
使用文本數據的交互式圖形來評價學習者的知識結構、認知能力、情感態度等多維度的狀態特徵,有助於教學者的教學決策和學習者的自我學習監控。例如,英國開放大學研究者提出了一個自然語言處理工具XIP[37],旨在分析學習者的學術寫作文檔,並通過儀錶盤來可視化其中的關鍵特性,如語句的修辭類型、關鍵概念等。在臺灣一項分析學習者知識構建過程的研究中[33],以56個來自信息管理專業的研究生為實驗對象,通過分析處理學習者在在線學習社區交互過程中產生的文本內容,按照布魯姆的教育目標分類法,從知識層次、領會層次、應用層次、分析層次、綜合層次和評價層次6個方面為教學者和學習者呈現實時可視化的認知能力評估圖形。研究結果指出該評估方法可通過有效激發學習者的學習動機來發布高階認知層次的內容,並促進學習者之間更深層次的對話交流。在一項旨在追蹤學習者情緒變化過程的研究中[32],教學者通過自主開發平臺來分析學習者的學習體驗日記,依據普拉特切克的情緒三維理論,自動抽取學習者的8類基本情緒,實現學習者情緒流的動態可視化呈現。
除了以上描述的六個主要應用研究方面外,也有部分考察和促進學習者高階思維能力發展的研究。比如,Gasevic等人通過使用特有的文本挖掘框架LIWC[42][47],收集學習者產生的文本數據來分析他們的心理和語言加工過程,識別和抽取其中的關鍵變量,從而培養自我反思和元認知建構的技能;此外,Rosen等人採用語義模型來實現文本挖掘研究的結果表明[10][48],學習者的分析推理和探索分析能力都有所提高,學習者之間的協作明顯加強。最近研究發現,研究者相當重視一定社會文化情境下學習者與在線對話交流實踐中的文本話語,相比學習者外顯行為數據,這些數據更能表徵出學習者在特定情境中的內隱思維過程。並且運用話語分析技術,可以幫助我們理解不同類型文本消息或消息序列在知識構建過程中存在的時間和因果關係,而且有助於我們探究意義學習的發生模式[21][24][40][45]。建構主義作為認知學習理論中一個重要分支,對話語分析的研究提供了有力的理論支撐。建構主義學者認為學習是在一定的社會文化情境中,學習者主動地建構個人知識與經驗的過程。他們強調知識的構建性,關注學習發生的本質和規律,而不僅僅是簡單的表徵和描述,這就與研究者分析話語的核心思想不謀而合。
眾所周知,一場由網絡教育2.0為標誌的新革命正強烈衝擊著傳統教育的生態環境,學習的交互方式和組織形式不斷被重塑和變革,個性化學習需求受到各界重視,以學習者為中心的新的教學模式催生了大量文本數據的產生,如何利用文本挖掘技術對其進行深度挖掘,提取潛在的、有價值的規律信息及群體或個體學習行為模式已經刻不容緩。將文本挖掘應用於學習分析中,不僅可以幫助學習者快速定位和檢索關鍵信息,也能夠引導學習者進行自我反思、自我管理、自主學習,促進學習者的知識構建和有意義學習。
然而,由於技術與現代化教育理念的融合尚淺、文本挖掘技術的發展瓶頸、研究者單一學科背景的局限等多方面的不足,目前採用文本挖掘的學習分析研究仍處於初級階段。未來相關研究可以從以下幾個方面深入展開:
1. 多樣性文本數據的標準研究。隨著泛在學習環境的不斷豐富,面對學習過程中產生的大量不同來源的文本數據,如何規範化管理和共享,實現數據的兼容性和統一性是當前急需解決的問題。
2. 面向學習服務的文本挖掘模型和方法研究。文本挖掘作為一種面向學習服務的社會情境性輔助技術,所涉及的多種模型和方法大多局限於某一學科或情境,為避免資源的浪費,應設計一些通用的文本挖掘模型和方法來實現跨平臺、跨學科的應用。
3. 學習者在線交互文本數據的深度學習技術研究。深度學習技術有利於探討對學習本質的認識,應加大研究力度和資助經費來挖掘交互式文本數據中的各種學習行為和心理信息,通過深入分析和掌握學習者文本表達的內在含義、理解學習者在協作學習中知識信息的建構過程,實現知識驅動的深度學習研究,探討意義學習的演化規律以及進而揭示其發生機制。
4. 跨領域的多學科交叉理論研究。目前此項研究主要是從自然科學領域的角度出發,如機器學習、自然語言處理、統計學等,難以挖掘文本數據中隱藏的深層次內涵和解釋學習者的心理狀態變化,應融合人文科學領域視角,如學習科學、學習心理學、教育學等,進一步為其提供理論依據。
筆者相信,為了更好地理解和優化學習以及學習情境,文本挖掘將成為學習分析研究中一種有力的論證方法。我國廣大教育工作者有必要充分意識到文本挖掘在學習分析應用中所扮演的重要角色,借鑑國外先進的理念和研究經驗,將此項新型的研究運用於在線學習中,支撐數據驅動的學習和評估,更準確客觀地認識學習者,幫助其獲得更高的學業成就,優化教學方法和教學活動,從而進一步推動教育教學的創新研究。
發表於《電化教育研究》2016年第2期
[參考文獻]
[1] Steve Kearns. Six Reasons Businesses Need to Pay Attention to Unstructured Data[EB/OL]. http://www.itbusinessedge.com/slideshows/six-reasons-businesses-need-to-pay-attention-to-unstructured-data-05.html,2013-12-01.
[2] White Paper. Unstructured Data Analytics: Unlock the Treasures of Your Unstructured Content [DB/OL].https://www.filelytics.com/sites/default/files/downloadable/.
[3] 吳永和,曹盼,那萬裡,馬曉玲.學習分析技術的發展和挑戰——第四屆學習分析與知識國際會議評析[J]. 開放教育研究,2014,20(6):72-80.
[4] The New Media Consortium. NMC Horizon Report 2011 Higher Ed Edition [EB/OL]. http://www.nmc.org/publications/horizon-report-2011-higher-ed-edition, 2011-01-10.
[5] 魏雪峰,宋靈青.學習分析:更好地理解學生個性化學習過程[J].中國電化教育,2013,(9):1-4.
[6] Bogarín, A. ,Romero, C. , Cerezo, R. , & Sánchez – Santillán, M. .Clustering for improving educational process mining[A]. In Proceedings of the Fourth International Conference on Learning Analytics And Knowledge[C]. New York: ACM Press, 2014: 11-15.
[7] 祝智庭,沈德梅.學習分析學:智慧教育的科學力量[J].電化教育研究,2013,(5):5-12.
[8] Robinson R L, Navea R, Ickes W. Predicting Final Course Performance From Students』 Written Self-Introductions: A LIWC Analysis[J]. Journal of Language and Social Psychology, 2013: 1-11.
[9] Romero C, López M I, Luna J M, et al. Predicting students' final performance from participation in on-line discussion forums[J]. Computers & Education, 2013, 68: 458-472.
[10] Rosen D, Miagkikh V, Suthers D. Social and semantic network analysis of chat logs[A]. Proceedings of the 1st International Conference on Learning Analytics and Knowledge[C]. New York: ACM Press, 2011: 134-139.
[11] Bakharia A, Heathcote E, Dawson S. Social networks adapting pedagogical practice: SNAPP[J]. Same Places, Different Spaces, 2009: 49-51.
[12] Jo I H, Kim D, Yoon M. Analyzing the log patterns of adult learners in LMS using learning analytics[A]. Proceedins of the Fourth International Conference on Learning Analytics And Knowledge[C]. New York: ACM Press, 2014: 183-187.
[13] Bravo-Marquez F, L'Huillier G, Moya P, et al. An automatic text comprehension classifier based on mental models and latent semantic features[A]. Proceedings of the 11th International Conference on Knowledge Management and Knowledge Technologies[C]. New York: ACM Press, 2011: 158-162.
[14] Peckham T, McCalla G. Mining Student Behavior Patterns in Reading Comprehension Tasks[J]. International Educational Data Mining Society, 2012, 34: 87-94.
[15] West, Darrell M. Big Data for Education: Data Mining, Data Analytics, and Web Dashboards. Governance Studies at Brookings [R].Washington: Brookings Institution, 2012: 1-10.
[16] The New Media Consortium.NMC Horizon Report 2014 Higher Ed Edition [EB/OL]. http://www.nmc.org/publications/horizon-report-2014-higher-ed-edition, 2014-01-10.
[17] Di Mo, Renfu Luo, Chengfang Liu, Huiping Zhang, Linxiu Zhang, Alexis Medina, Scott Rozelle. Text Messaging and its Impacts on the Health and Education of the Poor: Evidence from a Field Experiment in Rural China[J]. World Development, 2014, 64(1): 766-780.
[18] Reategui E, Epstein D, Lorenzatti A,et al. Sobek: a text mining tool for educational applications[A]. Proceedings International Conference on Data Mining (DMIN)[C]. Las Vegas: ACM Press, 2011: 59-64.
[19] Byrd R J, Steinhubl S R, Sun J, et al. Automatic identification of heart failure diagnostic criteria, using text analysis of clinical notes from electronic health records[J]. International journal of medical informatics, 2014, 83(12): 983-992.
[20] Seth Grimes. Unstructured Data and the 80 Percent Rule [EB/OL]. http://breakthroughanalysis.com/2008/08/01/unstructured-data-and-the-80-percent-rule/.2008-08-01.
[21] De Liddo A, Shum S B, Quinto I, et al. Discourse-centric learning analytics[A]. Proceedings of the 1st International Conference on Learning Analytics and Knowledge[C]. New York: ACM Press, 2011: 23-33.
[22] Xu Y, Reynolds N. Using text mining techniques to analyze students』 written responses to a teacher leadership dilemma[A]. Proceedings of the 2011 4th IEEE International Conference on Computer Science and Information Technology[C]. New York: ACM Press, 2011: 93-97.
[23] Melville P, Chenthamarakshan V, Lawrence R D, et al. Amplifying the voice of youth in africa via text analytics[A].Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining[C]. New York: ACM Press, 2013: 1204-1212.
[24] Chen, B. , & Resendes . Uncovering what matters: Analyzing sequential relations among contribution types in knowledge - building discourse[A]. In Proceedings of the Fourth International Conference on Learning Analytics and Knowledge[C]. New York: ACM Press, 2014: 226-230.
[25] Enck W, Xie T. Tutorial:Text Analytics for Security[A]. Proceedings of the 2014 ACM SIGSAC Conference on Computer and Communications Security[C]. New York: ACM Press, 2014: 1540-1541.
[26] Kontogiannis S, Valsamidis S, Kazanidis I, et al. Course opinion mining methodology for knowledge discovery, based on web social media[A].Proceedings of the 18th Panhellenic Conference on Informatics[C]. New York: ACM Press, 2014: 1-6.
[27] M.K. Underwood, L.H. Rosen, D. More,et al. The BlackBerry project: capturing the content of adolescents' text messaging [J]. Developmental Psychology, 2012,48(2): 295-302.
[28] Ehrenreich S E, Underwood M K, Ackerman R A. Adolescents』 Text Message Communication and Growth in Antisocial Behavior Across the First Year of High School[J]. Journal of abnormal child psychology, 2014, 42(2): 251-264.
[29] L.J. Austin. How to do things with words [M]. Oxford: Oxford University Press, 1962.
[30] Yu W B, Luna R. Exploring user feedback of a e-learning system: a text mining approach[M]. Las Vegas: Springer Berlin Heidelberg, 2013.
[31] Panian Z. Text analytics as a form of knowledge mining[A]. Proceedings of the 4th conference on European computing conference[C]. World Scientific and Engineering Academy and Society (WSEAS), 2010: 112-117.
[32] Munezero M, Montero C S, Mozgovoy M, et al. Exploiting sentiment analysis to track emotions in students' learning diaries[A]. Proceedings of the 13th Koli Calling International Conference on Computing Education Research[C]. New York: ACM Press, 2013: 145-152.
[33] C Hsu J L, Chou H W, Chang H H. EduMiner: Using text mining for automatic formative assessment[J]. Expert Systems with Applications, 2011, 38(4): 3431-3439.
[34] Lau T P, Wang S, Man Y, et al. Language technologies for enhancement of teaching and learning in writing[A]. Proceedings of the companion publication of the 23rd international conference on World wide web companion. International World Wide Web Conferences Steering Committee[C]. New York: ACM Press, 2014: 1097-1102.
[35] Kardan S, Conati C. A Framework for Capturing Distinguishing User Interaction Behaviors in Novel Interfaces[A]. EDM[C]. New York: ACM Press, 2011: 159-168.
[36] Klein R, Kyrilov A, Tokman M. Automated assessment of short free-text responses in computer science using latent semantic analysis[A]. Proceedings of the 16th annual joint conference on innovation and technology in computer science education[C]. New York: ACM Press, 2011.
[37] Simsek D, Shum S B, De Liddo A, et al. Visual analytics of academic writing[A]. Proceedins of the Fourth International Conference on Learning Analytics And Knowledge[C]. New York: ACM Press, 2014: 265-266.
[38] He W. Examining students』 online interaction in a live video streaming environment using data mining and text mining[J]. Computers in Human Behavior, 2013, 29(1): 90-102.
[39] Wen M, Yang D, Rosé C P. Sentiment Analysis in MOOC Discussion Forums: What does it tell us[J]. Proceedings of Educational Data Mining, 2014, 45(4): 1-8.
[40] Chiu, M. M., & Fujita, N. Statistical discourse analysis of online discussions: Informal cognition, social metacognition and knowledge creation[A]. In Proceedings of the Fourth International Conference on Learning Analytics And Knowledge[C]. New York: ACM Press, 2014: 217-225.
[41] Leong, C-K., Lee, Y-H., & Mak, W-K.Mining sentiments in SMS texts for teaching evaluation[J]. Expert Systems with Applications, 2012, 39(3): 2584-2589.
[42] Gašević D, Mirriahi N, Dawson S. Analytics of the effects of video use and instruction to support reflective learning[A]. Proceedins of the Fourth International Conference on Learning Analytics And Knowledge[C].New York: ACM Press, 2014: 123-132.
[43] M. Abdous and W. He,Using text mining to uncover students' technology-related problems in live video streaming[J]. British Journal of Educational Technology, 2011, 42(1): 40-49.
[44] Lin, F. R., Hsieh, L. S., & Chuang, F. T. Discovering genres of online discussion threads via text mining[J]. Computers & Education, 2009, 52(2), 481–495.
[45] De Liddo A, Shum S B, Quinto I, et al. Discourse-centric learning analytics[A]. Proceedings of the 1st International Conference on Learning Analytics and Knowledge[C]. New York: ACM Press, 2011: 23-33.
[46] Dasigi P, Guo W, Diab M. Genre independent subgroup detection in online discussion threads: a pilot study of implicit attitude using latent textual semantics[A].Proceedings of the 50th Annual Meeting of the Association for Computational Linguistics:Short Papers-Volume 2[C]. New York: ACM Press, 2012.
[47] Tausczik Y R, Pennebaker J W. The psychological meaning of words: LIWC and computerized text analysis methods[J]. Journal of language and social psychology, 2010, 29(1): 24-54.
[48] Drieger P. Semantic network analysis as a method for visual text analytics[J]. Procedia-Social and Behavioral Sciences, 2013, 79(2): 4-17.