課程名稱:大數據分析導論
英文名稱:Introduction of Big DataAnalytics
學分數:2
建議學時數:課內32學時,實踐16學時
課程性質:通識基礎課
教學目的:通過本課程的學習,讓學生對大數據技術相關基礎知識、基本應用路線和實用工具進行深入學習和了解,為後續的其他信息科學技術及大數據應用等專業課程的學習打下基礎。
基本內容簡介:以大數據分析技術及其應用路線為核心,系統地介紹了計算機的基礎及信息技術前沿、大數據分析基礎、計算機網絡基礎及數據獲取、信息處理與發布、數據存儲和數據分析理論與方法等內容。本書通過一系列實例分析,深入淺出地向讀者介紹了AI studio雲計算平臺、Python程序設計語言、Word 2016、Excel 2016和PowerPoint 2016等工具和軟體的使用方法及其在大數據分析技術中的應用。
基本要求:學生通過課程學習,應對信息技術及計算基礎知識、大數據技術基礎知識、Internet、網絡爬蟲、數據處理與數據分析等內容有一個較為全面的認識和理解,並能基於AI studio平臺,熟練掌握利用Python程序設計語言和Office 2016軟體完成簡單的數據獲取、數據處理、數據分析和數據展示等大數據分析技術應用方法。
授課方式:教師課堂授課,同時由於課程內涵蓋大量實際操作內容,應配合進行上機實踐操作教學。
1.1信息社會與計算機
1.2 計算機系統
1.3 微型計算機的硬體系統
1.4 計算機的軟體系統
1.5 作業系統和文件管理
1.6 信息技術前沿
學時分配:教學4學時
教學內容:介紹計算機與信息技術的基礎內容,包括信息社會與計算機、計算機系統、計算機硬體與軟體系統、信息技術前沿等,讓讀者建立信息科學與相關技術的基礎概念
教學重點:1.1.2 信息編碼、1.2.1 計算機的工作原理、1.5.2 文件基礎知識
2.1 大數據基礎知識
2.2 大數據的國內外發展情況
2.3 大數據技術及應用
2.4 AIStudio平臺介紹
2.5Python語言基礎
學時分配:教學8學時,實踐4學時
教學內容:介紹大數據分析技術的基礎內容,包括大數據基礎知識,大數據的發展及其應用、AI Studio平臺介紹、Pytho語言的基礎知識等,讓讀者了解大數據技術及大數據分析的基本概念,並對其實現工具、平臺和方法有初步的認識
教學重點:2.3.2 大數據應用、2.5.2 變量及數據的使用、2.5.3 Python程序的語法結構、2.5.4 Python程序的輸入/輸出、2.5.5 Python程序的控制結構
3.1 互聯時代
3.2 計算機網絡概述
3.3Internet基礎
3.4Internet的服務
3.5 網絡數據獲取
學時分配:教學5學時,實踐2學時
教學內容:介紹大數據技術中的數據獲取方法,包括計算機網絡的基礎知識、Internet及其服務和網絡爬蟲工具的相關內容,讓讀者掌握獲取大數據分析所需的原始數據集的方法
教學重點:3.3.1 IP位址、3.4.1Internet的基礎服務、3.5.2Python網絡爬蟲實戰
4.1 辦公軟體概述
4.2 基於Word的文字編輯處理
4.3 製作演示文稿發布信息
學時分配:教學5學時,實踐4學時
教學內容:介紹大數據技術中的非結構化的數據處理與展示方法,包括利用Word 2016實現文字數據的編輯、排版、圖文混排等內容,同時讓讀者掌握利用PowerPoint 2016製作演示文稿的方法,實現對數據分析和處理結果的展示和發布
教學重點:4.2.3 文檔排版、4.2.5 高級排版技巧、4.3.2幻燈片布局和內容編輯
5.1Excel基礎
5.2 Excel公式與函數
5.3Excel數據處理工具
5.4 基於Excel的數據預處理
學時分配:教學6學時,實踐4學時
教學內容:介紹大數據技術中的結構化的數據處理方法,包括利用Excel 2016構建工作表存儲和管理結構化的數據,利用公式和函數完成各類數據計算,利用Excel各類數據處理工具完成數據排序、篩選、分類匯總、圖表製作等操作,並介紹利用Excel完成數據分析預處理操作的方法
教學重點:5.2.1 Excel公式的基本使用、5.2.3 常用函數的應用、5.3 Excel數據處理工具
6.1 數據分析基礎
6.2 描述性統計分析
6.3 投資決策分析
6.4 時間序列預測分析
6.5 相關與回歸分析
學時分配:教學4學時,實踐2學時
教學內容:介紹大數據分析相關理論與方法,包括數據分析基礎、描述性統計分析、投資決策分析、時間序列分析和相關回歸分析等,引導讀者利用Excel 2016工具進行簡單的大數據分析,從海量數據集中挖掘和提取關鍵決策信息,完成大數據分析的應用和實踐
教學重點:6.2.4 數據交叉透視分析、6.4 時間序列預測分析、6.5.1 相關分析、6.5.2 一元線性回歸分析
章節
教學課時(32)
實踐課時(16)
第1章 計算機基礎及信息技術前沿
4課時(12.5%)
第2章 大數據分析基礎
8課時(25%)
6課時(37.5%)
第3章 計算機網絡基礎及數據獲取
5課時(15.625%)
2課時(12.5%)
第4章 信息處理與發布
5課時(15.625%)
4課時(25%)
第5章 數據管理與預處理
6課時(18.75%)
4課時(25%)
第6章 數據分析
4課時(12.5%)
共32課時課堂教學(6-7周每周5課時,8-15周每周3課時),16課時實踐教學(8-15周每周2課時)
周次
教學內容
實踐內容
1
2
3
4
5
6
第1章計算機基礎及信息技術前沿
1.1信息社會與計算機
1.2 計算機系統
1.3 微型計算機的硬體系統
1.4 計算機的軟體系統
1.5 作業系統和文件管理
1.6 信息技術前沿
第2章大數據分析基礎
2.1 大數據基礎知識
2.2 大數據的國內外發展情況
2.3 大數據技術及應用
7
2.4 AI Studio平臺介紹
2.5 Python語言基礎
2.5.1 Python語言概述
2.5.2 變量及數據的使用
2.5.3 Python程序的語法結構
2.5.4 Python程序的輸入/輸出
2.5.5 Python程序的控制結構
8
2.5.6 函數和模塊
2.5.7 大數據文本分析
第3章計算機網絡基礎及數據獲取
3.1 互聯時代
3.2 計算機網絡概述
3.3 Internet基礎
3.4 Internet的服務
1、AI Studio 平臺入門操作
2、python基礎實驗
9
3.5 網絡數據獲取
3.5.1 網絡爬蟲基礎知識
3.5.2 Python網絡爬蟲實戰
1、python基礎實驗
10
第4章信息處理與發布
4.1 辦公軟體概述
4.2 基於Word的文字編輯處理
4.2.1 從創建文檔開始
4.2.2 文本編輯
4.2.4 圖文混排
1、python進階實驗
11
4.2.5 高級排版技巧
4.3 製作演示文稿發布信息
4.3.1創建並保存演示文稿
4.3.2幻燈片布局和內容編輯
4.3.3視覺美化的渠道
4.3.4演示文稿的放映和輸出
Python網絡爬蟲實驗
12
第5章數據存儲與預處理
5.1 Excel基礎
5.1.1 Excel界面與基本術語
5.1.2 Excel的基本操作
5.1.3 在工作表中輸入和導入數據
5.1.4 格式化工作表
5.2 Excel公式與函數
5.2.1 Excel公式的基本使用
5.2.2 Excel函數的基本使用
5.2.3 常用函數的應用
Office 2016 綜合實驗(百科園)
13
5.3 Excel數據處理工具
5.3.1 數據清單
5.3.2 數據排序
5.3.3 數據篩選
5.3.4 分類匯總
5.3.5 合併計算
5.3.6 圖表的應用
Office 2016 綜合實驗(百科園)
14
5.4 基於Excel的數據預處理
5.4.1 數據預處理的目的
5.4.2 數據清洗
5.4.3 數據補全
5.4.4 數據篩選
5.4.5 數據加工
第6章數據分析
6.1 數據分析基礎
6.2 描述性統計分析
6.3 投資決策分析
Office 2016 綜合實驗(百科園)
15
6.4 時間序列預測分析
6.5 相關與回歸分析
課程內容總結與答疑
Office 2016 綜合實驗(百科園)
16