課程資訊
課程名稱
新聞資料處理與視覺呈現
Journalism Processing and Visualization 
開課學期
106-1 
授課對象
社會科學院  新聞研究所  
授課教師
謝吉隆 
課號
JOUR5014 
課程識別碼
342 U1250 
班次
 
學分
3.0 
全/半年
半年 
必/選修
選修 
上課時間
星期五6,7,8(13:20~16:20) 
上課地點
新聞103 
備註
限學士班三年級以上
總人數上限:20人 
Ceiba 課程網頁
http://ceiba.ntu.edu.tw/1061R 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

本門課除新聞所學生外,加選以曾選修新聞所開設之「新聞與數位創作」學生為優先,社科院大學部學生次之,生傳、文學院、管院學生再次之。理工科系學生由於相關程式學習資源多元,建議選修共教中心為培植學生資訊能力而開設的CS+X系列精彩課程。本課程預設對象為「無程式寫作經驗」且對資料新聞抱有興趣的學生。不建議有程式撰寫經驗者選修,亦不開放旁聽。
新聞所學生得選修本課,但由於本課程內容與碩士班「新聞資料分析」相近,兩門課僅可用一門抵畢業學分。
 

課程目標
本課程強調如何使用R語言進行資料分析以產製資料新聞。由於本課以無程式經驗者為對象,教師得依學生學習情形彈性調整授課內容,但至少包含以下內容:
1. R Programming basics
2. Reading files including CSV and JSON formats
3. Processing data by apply() family and dplyr package
4. Exploratory Data Analysis with ggplot()
5. Web crawler skill: getting data by GET and POST
6. Web APIs e.g., Google Map, Facebook, and Twitter
7. Text processing packages including tidytext and jiebaR 
課程要求
1. 因程式學習過程需要反覆試誤學習,建議該學期含本課修四門主修課目以上者請勿選修。
2. 課程專題需與修課同學合作產製資料新聞。
3. 請假請循台大學生請假系統請假,不接受信件請假。
4. 因所授內容為逐週累積的技術,故前6週未請假缺席一次扣總成績5%,後12週未請假缺席一次扣總成績3%。 
預期每週課後學習時數
 
Office Hours
每週三 10:00~12:00 備註: 請先寫信告知老師你大概要問什麼樣的問題 
指定閱讀
待補 
參考書目
R for data science http://r4ds.had.co.nz/
Text Mining with R http://tidytextmining.com/ 
評量方式
(僅供參考)
 
No.
項目
百分比
說明
1. 
Mini project 
20% 
資料新聞專題 
2. 
Final Project 
30% 
資料新聞專題 
3. 
Assignments 
40% 
- 每位學生必須完成10項作業。 - 作業繳交時間一律為作業公布後的五天內繳 交(Wed 24:00),以便助教批改並協助同學回顧作業內容。作業公布七天內可接受補交,然成績以八折計算,公布七天後不再接受補交(Fri 24:00)。 - 作業繳交問題請聯絡Official TA 陳潔。作業應按照指定格式繳交(第三次作業開始,需以RMarkdown或R Notebook撰寫,並繳交.rmd檔及其所衍生的HTML檔),如格式不合,經助教聯繫未在次週授課當天補交者該項亦不予計分。 
4. 
Quiz 
10% 
用以驗收學期中前所學的技術 
5. 
Quiz 
0% 
本門課包含二次不計分的隨堂小考,分別用以了解學生期初之學習情形與驗收期末學習成果。 
 
課程進度
週次
日期
單元主題
第1週
9/15  Couse overview and installing environment 
第2週
9/22  R basic: vector, dataframe, factor, list 
第3週
9/29  Data analysis cycle: Using paid maternity leave as an example 
第4週
10/06  Summarizing data by apply() family: Using Taipei open data as examples 
第5週
10/13  Reading JSON: Using ubike data as an example 
第6週
10/20  Proposal I  
第7週
10/27  Read Web API: Google Map APIs as examples 
第8週
11/03  dplyr: Mining Trump's tweeting behaviors 
第9週
11/10  Project I presentation 
第10週
11/17  ggplot2 and exploratory data analysis 
第11週
11/24  Getting web data and database 
第12週
12/01  Proposal II  
第13週
12/08  Web crawler 
第14週
12/15  Getting and tabulating facebook data 
第15週
12/22  Unsupervised learning skills:
K-mean clustering and data dimension reduction 
第16週
12/29  Supervised learning skills:
Regression 
第17週
1/05  Sentiment analysis 
第18週
1/12  Final presentation