課程名稱 |
資料探勘 Data Mining |
開課學期 |
99-2 |
授課對象 |
工學院 醫學工程學研究所 |
授課教師 |
蔣以仁 |
課號 |
Biomed7083 |
課程識別碼 |
548EM1240 |
班次 |
|
學分 |
3 |
全/半年 |
半年 |
必/選修 |
選修 |
上課時間 |
星期三2,3,4(9:10~12:10) |
上課地點 |
|
備註 |
本課程以英語授課。教室:基醫507。 總人數上限:20人 |
Ceiba 課程網頁 |
http://ceiba.ntu.edu.tw/992Biomed7083 |
課程簡介影片 |
|
核心能力關聯 |
核心能力與課程規劃關聯圖 |
課程大綱
|
為確保您我的權利,請尊重智慧財產權及不得非法影印
|
課程概述 |
資料探勘 |
課程目標 |
1. 資料發掘的技術介紹與類型─主要使學者了解何謂知識發掘,知識發掘的成因及演進,及各種熟知的技術,如下列:
(1) 決策樹(Decision Trees):於成本效益分析之應用;
(2) 類神經網路(Artificial Neural Networks):於疾病預測之應用;
(3) 貝氏網路(Bayesian Networks):於臨床特徵施行病學臨床試驗之應用;
(4) 模糊邏輯(Fuzzy Logic)與括約集合(Rough Sets):於疾病分類之應用等技術;另就技術與應用領域而言,探討知識發掘技術之類型。
2. 知識發掘與資料分析之異同─說明解說統計方法與知識發掘方法相似與相異之處,並以實例探討效果及限制。
3. 醫療資料倉儲的建立─探討如何進行知識發掘的第一步,即整理並歸納資料,以建立完整醫療資料倉儲的方法。
4. 分類技術(Classifications & Clustering)、時序連續因子分析(Time-Series & Temporal Analysis)、交互重要性分析(Association & Dependence)、及重要因子研判(Feature Selection & Factor Analysis) 等知識發掘技術在醫療資訊上中作重要研判的應用之探討,探究如何應用知識發掘進行疾病診斷與治療的研判。
5. 持續改善:因應每屆修課學生背景不同而調整授課內容、難易度與課程進度。 |
課程要求 |
無 |
預期每週課後學習時數 |
|
Office Hours |
每週三 09:00~12:00 |
指定閱讀 |
Trevor Hastie, Robert Tibshirani and Jerome Friedman, The Element of statistical Learning 2008 2nd Edition |
參考書目 |
資料探勘相關文獻 |
評量方式 (僅供參考) |
No. |
項目 |
百分比 |
說明 |
1. |
期末Project與報告 |
100% |
|
|
週次 |
日期 |
單元主題 |
第1週 |
02/23 |
Overview - 1 |
第2週 |
03/02 |
Regression & Instance-Based Learning |
第3週 |
03/09 |
Clustering |
第4週 |
03/16 |
Clustering cont |
第5週 |
03/23 |
Classifications |
第6週 |
03/30 |
Classifications cont |
第7週 |
04/06 |
停課 |
第8週 |
04/13 |
Artificial Neural Networks |
第9週 |
04/20 |
Artificial Neural Networks cont |
第10週 |
04/27 |
Decision Trees |
第11週 |
05/04 |
Self Organization Map & Radial Basis Function |
第12週 |
05/11 |
Automatic Construction of Decision Trees |
第13週 |
05/18 |
Support Vector Machine |
第14週 |
05/25 |
Boosting |
第15週 |
06/01 |
Feature Extractions |
第16週 |
06/08 |
Rough Set & Time Series |
第17週 |
06/15 |
期末Project與報告 ,期末問卷 |
|