課程名稱 |
資料科學導論 Introduction to Data Science |
開課學期 |
106-2 |
授課對象 |
文學院 圖書資訊學系 |
授課教師 |
楊東謀 |
課號 |
LIS5088 |
課程識別碼 |
126 U1510 |
班次 |
|
學分 |
2.0 |
全/半年 |
半年 |
必/選修 |
選修 |
上課時間 |
星期四8,9(15:30~17:20) |
上課地點 |
圖資視聽室 |
備註 |
U選課程,學士班與碩士班學生均可選修。兼通識A6*。 限文學院學生(含輔系、雙修生) 總人數上限:60人 外系人數限制:5人 |
Ceiba 課程網頁 |
http://ceiba.ntu.edu.tw/1062LIS5088_ |
課程簡介影片 |
|
核心能力關聯 |
核心能力與課程規劃關聯圖 |
課程大綱
|
為確保您我的權利,請尊重智慧財產權及不得非法影印
|
課程概述 |
此課程為知識管理學程的課程之一。由於近年來資料科學相關議題興起,而資料科學的相關知識與能力之培養涉及跨學科與領域的學習。此課程之定位為資料科學的導論課程,以期裝備學生對於資料科學的整體性認知,並給予學生對於其所涉及之學科領域的基本介紹。學生在修習此課程之後,可再修習資料科學的相關進階課程,以培養資料科學的能力。
課程內容為介紹資料科學的基本概念與其應用發展趨勢。在相關技術方面,課程會針對資料科學領域常見之統計與機器學習方法(如單純貝式分析、相關分析、迴歸與因素分析、群集分析、分類分析、類神經網路、基因演算法等)作基本概念介紹,以協助同學瞭解這些技術的功能為何。
課程內容亦會介紹大數據的相關應用框架,如Apache Hadoop、MapReduce與Apache Spark等。在資料儲存方面,課程內容會介紹關聯式資料庫、結構式查詢語言與NoSQL資料庫的角色與功能。
在資料呈現上,課程內容亦會介紹資料視覺化議題。在資料來源上,課程內容會討論政府開放資料、資料庋用等相關主題。此外,課程內容亦會涵蓋語意網與鏈結資料的介紹。
備註:
• 開放5位名額給與外系學生,以文學院學生優先
• 本課程以圖資系學生為主要授課對象,電機資訊學院學生不建議選修 |
課程目標 |
建立學生於資料科學領域的基本認識與了解,以鼓勵學生後續修習資料科學領域之其它基礎與進階課程 |
課程要求 |
課堂討論參與、以及報告與考試
課堂出席、提問與討論參與:30%
作業與期末報告:35%
期末考試:35%
|
預期每週課後學習時數 |
|
Office Hours |
每週一 13:00~15:00 備註: or by appointment |
指定閱讀 |
• 以授課老師之課堂講義為主,並輔以其它相關專書章節 |
參考書目 |
• Saltz, J. S., & Stanton, J. M. (2017). An Introduction to Data Science. Sage Publishing.
• Ng, A., & Soo, K. (2017). Numsense! Data Science for the Layman: No Math Added. Annalyn Ng & Kenneth Soo.
• Pierson, L. (2017). Data Science for Dummies: For Dummies.
• Johnston, L. R. (2017). Curating research data. Chicago: American Library Association.
• Peng, R. (2016). R Programming for Data Science: lulu.com.
• Kabacoff, R. (2015). R in Action- Data Analysis and Graphics with R (2 ed.): Manning Publications.
• Gama, A. P. (Ed.). (2015). Knowledge Engineering: Principles, Methods and Applications: Nova Science Pub Inc.
• Grus, J. (2015). Data Science from Scratch- First Principles with Python: O'Reilly Media.
• Zumel, N., Mount, J., & Porzak, J. (2014). Practical Data Science with R: Manning Publications.
• Provost, F., & Fawcett, T. (2013). Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking: O'Reilly Media.
• Allemang, D., & Hendler, J. (2011). Semantic Web for the Working Ontologist (2nd ed.): Morgan Kaufmann.
• Milton, M. (2009). Head First Data Analysis: A learner's guide to big numbers, statistics, and good decisions: O'Reilly Media.
• Antoniou, G., & Harmelen, F. v. v. (2008). A Semantic Web Primer (2nd ed.): The MIT Press.
• Griffiths, D. (2008). Head First Statistics: A Brain-Friendly Guide: O'Reilly Media.
• Kendal, S., & Creen, M. (2007). An Introduction to Knowledge Engineering: Springer.
• Berners-Lee, Tim, James Hendler and Ora Lassila (2001). The Semantic Web. |
評量方式 (僅供參考) |
No. |
項目 |
百分比 |
說明 |
1. |
課堂出席、課堂參與和討論 |
30% |
|
2. |
作業與期末報告 |
35% |
|
3. |
期末考試 |
35% |
|
|
週次 |
日期 |
單元主題 |
第1週 |
3/01 |
Course Introduction |
第2週 |
3/08 |
Data Science |
第3週 |
3/15 |
Getting Started with Data Science |
第4週 |
3/22 |
Probability, and Statistical Modeling I |
第5週 |
3/29 |
Probability, and Statistical Modeling II |
第6週 |
4/05 |
停課(民族掃墓節) |
第7週 |
4/12 |
Machine Learning I |
第8週 |
4/19 |
Machine Learning II |
第9週 |
4/26 |
Relational Databases and SQL [期中考週] |
第10週 |
5/03 |
Big Data EcoSystem I |
第11週 |
5/10 |
Big Data EcoSystem II |
第12週 |
5/17 |
Data Visualization |
第13週 |
5/24 |
Data Sources |
第14週 |
5/31 |
Semantic Web |
第15週 |
6/07 |
Semantic Web |
第16週 |
6/14 |
Course Project Presentation I |
第17週 |
6/21 |
Course Project Presentation II |
第18週 |
6/28 |
Final Exam |
|