課程資訊
課程名稱
資料科學程式設計
Data Science Programming 
開課學期
107-1 
授課對象
共同教育中心  共同教育組  
授課教師
蔡芸琤 
課號
CSX4001 
課程識別碼
H03 04010 
班次
 
學分
3.0 
全/半年
半年 
必/選修
選修 
上課時間
星期四2,3,4(9:10~12:10) 
上課地點
新502 
備註
基本能力課程.另開放國北教大、台藝大各5個名額.。基本能力課程。
總人數上限:40人 
Ceiba 課程網頁
http://ceiba.ntu.edu.tw/1071CSX4001_ 
課程簡介影片
 
核心能力關聯
本課程尚未建立核心能力關連
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

拜寬頻網路普及化之賜,大數據熱潮來襲,許多資料科學相關的需求因應而出,《哈佛商業評論》將會寫程式、又有專業領域知識的資料科學家,封為「21世紀最性感行業」。本課程結合 R 語言與其他電腦資訊技術,運用在各專業領域上。例如:以虛擬社群做社會行為的量化分析、以量化研究方法做人口統計學上的社會變遷、以質性研究方法針對虛擬社群做網誌調查、資料視覺化與結合地圖資訊系統等。 

課程目標
本課程會以「翻轉教學」方式進行,學生需透過提供的線上資源,在每次上課前自行學習要求的進度,而上課時間則會與組員、助教、教授討論,運用所學完成小任務(作業)。在整個教學過程中,學生主動地去了解、探索問題及深入思考,讓學習深化,而所培養的自主學習態度也是一切創新研究的根本。 
課程要求
修課學生必須確認自己對以上課程內容有高度學習興趣及熱忱。每週除了固定上課三小時之外,每週另外需再花 10 ~ 20 小時 (依學習者的能力,自行調配) 進行作業撰寫與課前課後任務練習,到期末前一個月,每週需要花 50 個小時進行專案開發。  
預期每週課後學習時數
 
Office Hours
每週四 09:00~13:00 
指定閱讀
待補 
參考書目
 
評量方式
(僅供參考)
 
No.
項目
百分比
說明
1. 
課堂任務 
70% 
總共有 14 次課堂任務,每次佔 5%。 
2. 
期末專題 
30% 
共1次,於期中考後,進行分組,三個人一組,依照完成度斟酌給分。 
 
課程進度
週次
日期
單元主題
第1週
09/13  1. 上課規則、計分規則、作業說明、Github 教學。
2. 介紹 R 語言、上手 R 語言、如何進行翻轉教學。
【課堂任務01:GitHub & RMD。】  
第2週
09/20  1. 網路爬蟲初探。
2. 完成第一個 RMarkdown 的基本報告。
【課堂任務02:爬蟲程式,並將資料順利收集整理存檔。】  
第3週
09/27  1. 活用 dplyr 與 data farame。
2. 上手 ggplot2 繪圖工具包。
【課堂任務03:完成第一個資料視覺化任務。】 
第4週
10/04  詞頻 & 文字雲。主題討論:使用 R 進行自動化分析,政治人物的臉書都在討論甚麼?詞頻與文字雲。
【課堂任務04:使用臉書資料集完成文字雲分析。】  
第5週
10/11  Term to Document Matrix 與文本分析。
【課堂任務05:使用臉書資料集完成第一個基礎文字資料分析。】  
第6週
10/18  TF-IDF 與文本分析。
【課堂任務06:使用臉書資料集完成第一個進階文字資料分析。】  
第7週
10/25  R Shiny 自學介紹。
【課堂任務07:使用 Shiny 整合任務 03 ~ 06。】  
第8週
11/01  PCA & Kmeans 分群整合應用。
【課堂任務08:以 TFIDF -> PCA -> K-means 流程完成文字探勘報告。】  
第9週
11/08  【主題演講:對話式資料呈現實作】
在小小的對話框中,也能實現資料科學家的精神!讓我們運用雲端工具結合Chatbot,做出能幫助我們更快瞭解資料的機器人! 
第10週
11/15  EDA & ETP 基本觀念介紹。 【課堂任務09:參考 Kaggle Script,透過 EDA & ETP 找出問題。】  
第11週
11/22  小組討論與提案說明。 【課堂任務10:提出期末作品預計進行的 ETP 說明。】  
第12週
11/29  資料科學中的常見統計分析技巧。 【課堂任務11:參考 Kaggle Script,進行更深入的 EDA 探索。】  
第13週
12/06  關聯規則 Apriori algorithm。 【課堂任務12:使用關聯性規則,對自訂資料集進行探索。】 
第14週
12/13  類神經網路基礎介紹與應用。 【課堂任務13:透過 nnet 進行類神經網路架構建模。】  
第15週
12/20  資料科學混合工具應用。 【課堂任務14:Kaggle 資料集預測競賽。】  
第16週
12/27  小組專題整合實作。 
第17週
01/03  小組專題成果發表。