課程大綱
一、數據挖掘概述與數據預處理
1、目標:對數據挖掘建立清晰、正確的認識;了解如何對數據進行初步的統計分析,掌握利用報表、統計指標、可視化圖形對數據進行概括性描述;掌握數據預處理的基本技巧,例如數據清洗、規范化轉換、連續值離散化、缺失值的處理;了解數據倉庫的基本概念和建設。
—— 了解數據挖掘基本概念、模型和能解決的問題;
—— 數據挖掘面臨的問題
—— 統計分析的基本方法和度量
—— 數據準備與數據倉庫
—— 數據預處理的方式方法
二、挖掘方法1:
1、目標:掌握頻繁項集、閉合頻繁項集、關聯規則概念,典型關聯規則挖掘算法,關聯規則挖掘的建模與分析;掌握決策樹分類法,理解預測準確率與過擬合的關系,能夠構建訓練集、測試集,并用學習到的分類模型進行分類預測。
—— 關聯分析算法與模型設計
—— 決策樹算法與模型設計
—— 結合工具軟件操作
三、挖掘方法2:
1、目標:理解貝葉斯方法,能夠用工具建立貝葉斯網絡模型;掌握聚類典型算法k-均值聚、層次聚類 和基于密度的聚類,能夠構建聚類模型,對數據進行有效聚類。
—— 貝葉斯與貝葉斯網絡算法與模型設計
—— 典型聚類算法與模型設計
—— 結合工具軟件操作
四、其他挖掘方法與挖掘前沿技術
1、目標:了解多種挖掘算法與技術,了解數據挖掘的前沿技術,以利于日后可能的應用。
—— 時序和序列數據的挖掘
—— 神經網絡分類
—— 圖挖掘、社會網絡挖掘分析與介紹
—— 其他挖掘技術
五、挖掘模型建模和實例分析
1、目標:了解多個工具軟件,對個工具軟件有總體認識,以便恰當選擇商業化的挖掘工具;通過一個實例,應用挖掘工具逐步、詳細實現挖掘工程。
—— 其他多種挖掘工具的介紹。
—— 結合一個實例,例如市場營銷、證券、電信業務、銀行業務等,進行實際建模
與挖掘分析。
1、目標:對數據挖掘建立清晰、正確的認識;了解如何對數據進行初步的統計分析,掌握利用報表、統計指標、可視化圖形對數據進行概括性描述;掌握數據預處理的基本技巧,例如數據清洗、規范化轉換、連續值離散化、缺失值的處理;了解數據倉庫的基本概念和建設。
—— 了解數據挖掘基本概念、模型和能解決的問題;
—— 數據挖掘面臨的問題
—— 統計分析的基本方法和度量
—— 數據準備與數據倉庫
—— 數據預處理的方式方法
二、挖掘方法1:
1、目標:掌握頻繁項集、閉合頻繁項集、關聯規則概念,典型關聯規則挖掘算法,關聯規則挖掘的建模與分析;掌握決策樹分類法,理解預測準確率與過擬合的關系,能夠構建訓練集、測試集,并用學習到的分類模型進行分類預測。
—— 關聯分析算法與模型設計
—— 決策樹算法與模型設計
—— 結合工具軟件操作
三、挖掘方法2:
1、目標:理解貝葉斯方法,能夠用工具建立貝葉斯網絡模型;掌握聚類典型算法k-均值聚、層次聚類 和基于密度的聚類,能夠構建聚類模型,對數據進行有效聚類。
—— 貝葉斯與貝葉斯網絡算法與模型設計
—— 典型聚類算法與模型設計
—— 結合工具軟件操作
四、其他挖掘方法與挖掘前沿技術
1、目標:了解多種挖掘算法與技術,了解數據挖掘的前沿技術,以利于日后可能的應用。
—— 時序和序列數據的挖掘
—— 神經網絡分類
—— 圖挖掘、社會網絡挖掘分析與介紹
—— 其他挖掘技術
五、挖掘模型建模和實例分析
1、目標:了解多個工具軟件,對個工具軟件有總體認識,以便恰當選擇商業化的挖掘工具;通過一個實例,應用挖掘工具逐步、詳細實現挖掘工程。
—— 其他多種挖掘工具的介紹。
—— 結合一個實例,例如市場營銷、證券、電信業務、銀行業務等,進行實際建模
與挖掘分析。

