課程資訊
課程名稱
新聞資料處理與視覺呈現
Journalism Processing and Visualization 
開課學期
108-2 
授課對象
學程  人口學程  
授課教師
謝吉隆 
課號
JOUR5014 
課程識別碼
342 U1250 
班次
 
學分
3.0 
全/半年
半年 
必/選修
選修 
上課時間
星期一2,3,4(9:10~12:10) 
上課地點
新聞103 
備註
初選不開放。[人口學程]選修領域(四)遷移與空間。
限學士班三年級以上
總人數上限:30人 
Ceiba 課程網頁
http://ceiba.ntu.edu.tw/1082R 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

0. 【特別公告】因應疫情與學校政策,本學期將自第一週起改用遠距教學直至台灣疫情減緩為止(希望是四月底),課程平台使用NTU COOL,該平台會掌握每一個人觀看非同步課程的比例,並將配合問卷填寫與作業來掌握學生進度。請有意修課者照下一點加選辦法選課。
1. 【加選辦法】本課程將優先選擇以「資料新聞記者」為志業的同學,故本學期嘗試不參與初選。請有興趣的同學請於02/28 23:59分前填寫完修課意願表單https://forms.gle/eg5sqTvBL7QNFkNQ8,並將於2/29統一寄發選課名單與授權碼。
2. 如純以學寫程式為目的,建議選修管院與共教中心的程式設計課程,或選修1091於經濟系的資料科學與社會研究課程。
2. 本門課專為「資料新聞實作」開設,強調如何使用R語言產製資料新聞。著重獲取資料、視覺化和撰寫報導。
3. 講授如何用R爬取開放資料、如何用R靈活處理資料、做清洗、整合及探索;如何用R進行回歸分析、基礎文本分析、群聚分析。
4. 本門課前三週將講授Tableau以強化資料的概念與視覺化的日常運用。 

課程目標
1. 培養學生擁有資料獲取、儲存、轉換、與清理的能力。
2. 培養學生可自動化爬梳與擷取政府開放資料與社群資料的能力。
3. 培養學生利用R語言進行數值分析與數值探勘的能力。
4. 培養學生利用R語言進行文字分析與文字探勘的能力。
5. 培養學生利用R語言製作出新聞資料視覺化的能力。
6. 培養學生具有產製資料新聞之概念與能力 
課程要求
1. 每位同學須完成二則資料新聞報導,將由國內新聞編輯與資料記者評分並擇優刊載。
2. 本門課將有1/3週次部分採用翻轉教學,學生回家需利用線上教學平台學習R的基本操作,空下來的課堂則將請現役資料記者與編輯講授資料新聞製作經驗,或帶領學生實際以所學技術分析公投、twitter、網民、開放資料。如果不喜歡翻轉教學者請勿選修。
 
預期每週課後學習時數
 
Office Hours
 
參考書目
一、 指定閱讀:無指定閱讀,教師依照週次自編講義。
二、 延伸閱讀:
書名:R 錦囊妙計
作者:Paul Teetor
譯者:張夏菁
出版社:歐萊禮
出版日:2014年01月24日
ISBN:978-9-862-76982-9
語言:中文繁體
參考網址:http://www.books.com.tw/products/0010624153 
指定閱讀
待補 
評量方式
(僅供參考)
 
No.
項目
百分比
說明
1. 
線上學習 
20% 
DataCamp完成程度5% DataCamp學習成效期中考核10% Youtube參與程度5% 
2. 
作業 
30% 
 
3. 
報導 
50% 
每位同學需製作二則報導。第一則報導為個人報導,第二則為以二~三人為一組的資料導向深度報導。 
 
課程進度
週次
日期
單元主題
第1週
3/02  Course overview
R: Install and basic operations
Datacamp: Basic operations and data types  
第2週
3/09  Tableau01: Geo-mapping Air Quality Index
Tableau02: Understand what is data and reading files
Invited talk I: CommonWealth Data Journalist
Datacamp: Conditionals and Control Flow, Loops, Functions 
第3週
3/16  Tableau03: Reading JSON and plotting youbike map
Tableau04: Counting data - Crime and Infectious disease (Dengue fever)
Datacamp: Data manipulation by dplyr  
第4週
3/23  R Practice: Summarizing PTT netizen demography
Invited Talk II
Datacamp: Cleaning data in R 
第5週
3/30  Tableau05: Data manipulation Crime and Paid maternal leave
Tableau06: Joining data tables
R Practice: Summarizing behaviors of suspended twitter accounts.
Datacamp: Joining data with dplyr in R 
第6週
4/06  R Practice: 2018 Referendum + 2020 Presidential + demography
Invited Talk III
Datacamp: Data Visualization with ggplot2 
第7週
4/13  R: Text analysis on Trump’s tweets
Datacamp: String Manipulation in R with stringr 
第8週
4/20  R: Crawler design - JSON - Youbike and online news
Invited talk IV 
第9週
4/27  Quiz & Midterm report 
第10週
5/04  R: Crawler design - HTML parsing - Online forums 
第11週
5/11  R: Chinese Processing
R Review: String Operation + Regular Expression  
第12週
5/18  Proposal for Final 
第13週
5/25  Topic modeling with R: Speech text in the 2020 presidential campaign 
第14週
6/01  Network analysis on retweeting behaviors (Disclosed accounts related to Information operations directed at Hong Kong)  
第15週
6/08  Reviewing text mining: Detecting clickbait
Text mining advanced: Using word embedding 
第16週
6/15  Machine learning: Labeling sentences in abstract of academic articles 
第17週
6/22  Submitting final report