面向高職高專的慕課大數(shù)據(jù)分析及應用
引 言
教育部在 2015年年度工作要點中明確提出要 繼續(xù)加大優(yōu)質數(shù)字教育資源開發(fā)和應用力度,探索在線開放課程應用帶動機制,加強 慕課 (MOOC)建設、使用和管理。 國家隨之確定了 慕課 建設框架,其中涵蓋了高職高專等職業(yè)教育的內(nèi)容。國務院參事湯敏老師 2015倡導的 慕課最大的空間和機會實際上是在職業(yè)教育 ,鼓勵高職優(yōu)質慕課資源和平臺的建設。此舉對于完善終身教育體系,提高國民的職業(yè)技術和能力,乃至學習型社會的建設都有重要意義。
目前國內(nèi)MOOC的研究主要包括MOOC平臺建設研究、MOOC教學模式研究、 翻轉課堂 實現(xiàn)方式研究等。清華大學、北京大學、北京航空航天大學、復旦大學等很多高水平大學都設置了 MOOC,并進行了深入研究。同時,在國家積極倡導 互聯(lián)網(wǎng)+ 教育 的時代背景下, 更具特色的高職高專院校如何結合自身學科建設特點與優(yōu)勢,發(fā)揮 重技能,強能力 的培養(yǎng)特點,提供更優(yōu)質的開放性遠程教育服務是各高職高專院校面臨的一項挑戰(zhàn),從大量MOOC 課程建設的嘗試中探索自己的 MOOC 之路。
MOOC 不是單純的教師講課,而是通過網(wǎng)絡技術,將課堂教學、學習體驗、師生互動等不同教學環(huán)節(jié)通過編排完整呈現(xiàn),從而在線產(chǎn)生大量數(shù)據(jù)。這些大數(shù)據(jù)中蘊含了大量的對教育教學具有普遍意義的規(guī)律和價值,通過對這些慕課大數(shù)據(jù)進行挖掘與分析,教師可以有效掌握教學規(guī)律、預測教育活動、進行教育管理和決策等。
1 高職高專院校慕課物聯(lián)網(wǎng)建設
目前, 大多數(shù)高職高專院校都有自己的圖書館, 而MOOC 學習需要學生進行登錄、學習、進行互動等。將MOOC 的平臺建設與學校已有的圖書館平臺相結合,充分利用已有資源,進行統(tǒng)一資源平臺登錄,可有效降低學校建設MOOC 平臺的成本,提高資源使用率。MOOC 與圖書館統(tǒng)一物聯(lián)建設平臺如圖 1 所示。
統(tǒng)一MOOC 教育平臺與圖書館系統(tǒng),學生通過圖書館統(tǒng)一登錄賬戶登錄,通過MOOC 教室進行MOOC 課程在線學習。慕課教育平臺包括在線教學、課輔教學、社交媒體(包括微信、QQ 等)、知識分析與綜合等,最終形成知識的積累信息。
MOOC 教學平臺與大數(shù)據(jù)分析平臺直接相連,將學生學習記錄以及圖書借閱記錄等提交大數(shù)據(jù)分析平臺進行分析。此外,大數(shù)據(jù)分析平臺還包括數(shù)據(jù)存儲、數(shù)據(jù)清洗和數(shù)據(jù)預處理、大數(shù)據(jù)分析與可視化等功能。
學生可以通過客戶端、瀏覽器及移動端等設備,形成一個綜合的物聯(lián)網(wǎng)技術平臺。
2 慕課大數(shù)據(jù)分析
通過MOOC 平臺可以獲得學校學生對于MOOC 課程學習的有效記錄,包括學生的學號、姓名、登錄時間、下線時間、學習課程名稱,學習課程知識點記錄、在線互動內(nèi)容、在線互動次數(shù)、做作業(yè)次數(shù)、做作業(yè)時長、做作業(yè)成績、學生考試課程名稱,課程期中考試成績、期末考試成績、課程綜合成績、課程成績排名等內(nèi)容。由于學生使用的是與圖書館平臺進行綜合統(tǒng)一登錄的平臺,還可以獲取學生的圖書借閱情況,如借閱圖書名稱、借閱日期、還書日期等。
針對獲取的學生學習MOOC 的綜合大數(shù)據(jù),需要采用大數(shù)據(jù)分析平臺進行處理。圖 2 所示為基于分布式集群處理的大數(shù)據(jù)處理平臺架構圖。平臺采用大數(shù)據(jù)生態(tài)圈的Python, 數(shù)據(jù)庫采用MongDB,存儲動態(tài)常用分析所用的數(shù)據(jù);數(shù)據(jù)預處理與存儲模塊包括用于大數(shù)據(jù)分布式存儲的分布式文件系統(tǒng)(Hadoop Distributed File System,HDFS)和 Tachyon 分布式內(nèi)存管理系統(tǒng),可對獲取的數(shù)據(jù)進行清洗并提供存儲服務;在計算處理方面,采用 UC Berkeley 提出的基于內(nèi)存計算的Spark。Spark 所有作業(yè)都在內(nèi)存中完成,通過分布式彈性數(shù)據(jù)集(Resilient Distributed Dataset,RDD),Spark 能夠對作業(yè)流程進行掃描并根據(jù)作業(yè)的先后次序進行優(yōu)化,加快在內(nèi)存中的運算速度。利用Spark 中的MLlib 和Graphx 提供機器學習、優(yōu)化和圖計算等方面的功能,并輔以 Mahout 和HadoopMapReduce 框架進行其他算法的補充 ;可視化模塊以JavaScript 為手段,采用D3 和 Processing 將整個過程中產(chǎn)生的相關結果進行可視化展示。
數(shù)據(jù)挖掘子系統(tǒng)與數(shù)據(jù)分析子系統(tǒng)是整個框架的核心, 整個大數(shù)據(jù)處理平臺以Spark 分布式集群為主體,由1 臺主節(jié)點,8 臺子節(jié)點組成,其中主節(jié)點與子節(jié)點機器均為 4 核 Intel Xeon E7-8837,2.67 GHz,16 G 內(nèi)存,HDFS 存儲容量為 2.5 T。
此外,學生還可以在線下根據(jù)自身需求選擇不同的教學資源、方式、媒介,亦可自行決定課程學習時間,加之網(wǎng)絡論壇的輔助和課上網(wǎng)絡平臺的使用,使得教學更富成效。
3 計算機媒體類課程慕課的應用推廣
針對計算機類課程,通過圖 1 所示的MOOC 與圖書館統(tǒng)一資源平臺,借助大數(shù)據(jù)分析平臺,對于獲取的學生的數(shù)據(jù)結構、操作系統(tǒng)、程序設計基礎等課程的學習數(shù)據(jù)進行綜合處理, 得到準確的學生學習喜好模式,及對教師 MOOC 課程水平進行準確分級。
4 結 語
基于這些計算機類課程大數(shù)據(jù)分析的結論,梳理出計算機媒體處理類課程MOOC 教學的特點,結合MOOC 的獨特優(yōu)勢與媒體處理類課程需要大量視頻、圖像、PPT、音頻等綜合展示的特色,將其他類課程MOOC 建設模式和大數(shù)據(jù)分析的結論,靈活遷移到媒體類課程教學中,幫助教師探尋學生的學習規(guī)律,調(diào)整教學,提高教學效率,提出具體的教學方法改進措施,使得課程的講授更加靈活、開放、動態(tài),更加具有針對性,方便教師更好地滿足學生個性化學習的需求,真正做到因材施教,取得事半功倍的成效,在減少教師負擔的同時, 也讓學生能夠學的更直觀,更深入,更扎實。