課程資訊
課程名稱
資料科學導論
Introduction to Data Science 
開課學期
106-2 
授課對象
文學院  圖書資訊學系  
授課教師
楊東謀 
課號
LIS5088 
課程識別碼
126 U1510 
班次
 
學分
2.0 
全/半年
半年 
必/選修
選修 
上課時間
星期四8,9(15:30~17:20) 
上課地點
圖資視聽室 
備註
U選課程,學士班與碩士班學生均可選修。兼通識A6*。
限文學院學生(含輔系、雙修生)
總人數上限:60人
外系人數限制:5人 
Ceiba 課程網頁
http://ceiba.ntu.edu.tw/1062LIS5088_ 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

此課程為知識管理學程的課程之一。由於近年來資料科學相關議題興起,而資料科學的相關知識與能力之培養涉及跨學科與領域的學習。此課程之定位為資料科學的導論課程,以期裝備學生對於資料科學的整體性認知,並給予學生對於其所涉及之學科領域的基本介紹。學生在修習此課程之後,可再修習資料科學的相關進階課程,以培養資料科學的能力。

課程內容為介紹資料科學的基本概念與其應用發展趨勢。在相關技術方面,課程會針對資料科學領域常見之統計與機器學習方法(如單純貝式分析、相關分析、迴歸與因素分析、群集分析、分類分析、類神經網路、基因演算法等)作基本概念介紹,以協助同學瞭解這些技術的功能為何。

課程內容亦會介紹大數據的相關應用框架,如Apache Hadoop、MapReduce與Apache Spark等。在資料儲存方面,課程內容會介紹關聯式資料庫、結構式查詢語言與NoSQL資料庫的角色與功能。

在資料呈現上,課程內容亦會介紹資料視覺化議題。在資料來源上,課程內容會討論政府開放資料、資料庋用等相關主題。此外,課程內容亦會涵蓋語意網與鏈結資料的介紹。

備註:
• 開放5位名額給與外系學生,以文學院學生優先
• 本課程以圖資系學生為主要授課對象,電機資訊學院學生不建議選修  

課程目標
建立學生於資料科學領域的基本認識與了解,以鼓勵學生後續修習資料科學領域之其它基礎與進階課程 
課程要求
課堂討論參與、以及報告與考試

課堂出席、提問與討論參與:30%
作業與期末報告:35%
期末考試:35%
 
預期每週課後學習時數
 
Office Hours
每週一 13:00~15:00 備註: or by appointment 
指定閱讀
• 以授課老師之課堂講義為主,並輔以其它相關專書章節 
參考書目
• Saltz, J. S., & Stanton, J. M. (2017). An Introduction to Data Science. Sage Publishing.
• Ng, A., & Soo, K. (2017). Numsense! Data Science for the Layman: No Math Added. Annalyn Ng & Kenneth Soo.
• Pierson, L. (2017). Data Science for Dummies: For Dummies.
• Johnston, L. R. (2017). Curating research data. Chicago: American Library Association.
• Peng, R. (2016). R Programming for Data Science: lulu.com.
• Kabacoff, R. (2015). R in Action- Data Analysis and Graphics with R (2 ed.): Manning Publications.
• Gama, A. P. (Ed.). (2015). Knowledge Engineering: Principles, Methods and Applications: Nova Science Pub Inc.
• Grus, J. (2015). Data Science from Scratch- First Principles with Python: O'Reilly Media.
• Zumel, N., Mount, J., & Porzak, J. (2014). Practical Data Science with R: Manning Publications.
• Provost, F., & Fawcett, T. (2013). Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking: O'Reilly Media.
• Allemang, D., & Hendler, J. (2011). Semantic Web for the Working Ontologist (2nd ed.): Morgan Kaufmann.
• Milton, M. (2009). Head First Data Analysis: A learner's guide to big numbers, statistics, and good decisions: O'Reilly Media.
• Antoniou, G., & Harmelen, F. v. v. (2008). A Semantic Web Primer (2nd ed.): The MIT Press.
• Griffiths, D. (2008). Head First Statistics: A Brain-Friendly Guide: O'Reilly Media.
• Kendal, S., & Creen, M. (2007). An Introduction to Knowledge Engineering: Springer.
• Berners-Lee, Tim, James Hendler and Ora Lassila (2001). The Semantic Web. 
評量方式
(僅供參考)
 
No.
項目
百分比
說明
1. 
課堂出席、課堂參與和討論 
30% 
 
2. 
作業與期末報告 
35% 
 
3. 
期末考試 
35% 
 
 
課程進度
週次
日期
單元主題
第1週
3/01  Course Introduction 
第2週
3/08  Data Science  
第3週
3/15  Getting Started with Data Science 
第4週
3/22  Probability, and Statistical Modeling I 
第5週
3/29  Probability, and Statistical Modeling II 
第6週
4/05  停課(民族掃墓節) 
第7週
4/12  Machine Learning I 
第8週
4/19  Machine Learning II 
第9週
4/26  Relational Databases and SQL [期中考週] 
第10週
5/03  Big Data EcoSystem I 
第11週
5/10  Big Data EcoSystem II 
第12週
5/17  Data Visualization 
第13週
5/24  Data Sources 
第14週
5/31  Semantic Web  
第15週
6/07  Semantic Web  
第16週
6/14  Course Project Presentation I 
第17週
6/21  Course Project Presentation II 
第18週
6/28  Final Exam