課程資訊
課程名稱
新聞資料處理與視覺呈現
Journalism Processing and Visualization 
開課學期
105-2 
授課對象
新聞研究所  
授課教師
謝吉隆 
課號
JOUR5014 
課程識別碼
342 U1250 
班次
01 
學分
3.0 
全/半年
半年 
必/選修
選修 
上課時間
星期四6,7,8(13:20~16:20) 
上課地點
新聞315 
備註
已修過謝吉隆副教授的?新聞資料分析」課程者,請勿再選本課程。
限學士班三年級以上
總人數上限:15人 
Ceiba 課程網頁
http://ceiba.ntu.edu.tw/1052R1052_01 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

1. 本課程為訓練對資料新聞感興趣但缺乏資料處理能力的初學者而開,並為為社科院新聞專業課程,加選以社科院大學部學生為優先。
2. 本課程預設對象為「無程式寫作經驗」且對資料新聞抱有興趣的學生。有程式撰寫經驗者請盡量不要選修。建議可以台大為培植學生資料分析能力而設的CS+X課程。
3. 為保持學習者間程度與付出的一致性,本課程不開放旁聽。
4. 新聞所學生得選修本課,但由於本課程內容與「新聞資料分析」雷同,兩門課僅可用一門抵畢業學分。
5. 由於本課以無程式經驗者為對象,教師得依學生學習情形彈性調整授課內容,但至少包含以下內容:
R Programming basics
Reading files including CSV and JSON formats
Processing data by apply() family and dplyr package
Web crawler skill: getting data by GET and POST
Visualization skills including rworldmap and basic plotting functions
Facebook graph API to get post and like data of facebook page 

課程目標
教學目標
1.學生具有資料獲取、儲存、轉換、與清理的能力。
2.培養學生可自動化爬梳與擷取政府開放資料與社群資料的能力。
3.培養學生利用R語言進行數值分析與數值探勘的能力。
4.培養學生利用R語言進行文字分析與文字探勘的能力。
5.培養學生利用R語言製作出新聞互動資料視覺化的能力。
 
課程要求
1. 因學習程式過程為技術的積累,如有中斷不易銜接。故修課生未能到課需依學校規定之請假程序請假,未出席而並未依照學校規定請假者,每次得扣學期總成績三分。
 
預期每週課後學習時數
 
Office Hours
每週一 14:00~16:00 備註: 如有技術上的問題需要解決,可先聯絡助教求解,或在以下時間至老師辦公室拜訪,但建議先來信通知。 
指定閱讀
無指定閱讀,採用教師自編教材。 
參考書目
待補 
評量方式
(僅供參考)
 
No.
項目
百分比
說明
1. 
Assignments 
50% 
1. 作業內容為驗收當週所授課程內容。故作業繳交時間一律為作業公布當週後的五天內繳交(二 24:00),以便於次週回顧作業內容。 2. 如未能依期繳交,公布七天後不再接受補交(四 24:00)。在期限前補交成績以八折計算。 
2. 
Midterm Exam 
20% 
期中考主要為驗收學生的學習情形,形式為填充、簡答的紙筆測驗。 
3. 
Final project 
30% 
1. 期末專題需以政府開放資料、Kaggle、或利用網路爬蟲、Facebook Graph API所獲得的資料作為分析對象,並以R語言進行分析與視覺化。 2. 繳交期限為06/22 24:00,遲交每隔三天書面報告成績打八折。 3. 專題成績包含以下項目:期中計畫書報告 30%、期末成果報告 30%、期末書面報告 40% 4. 專題採分組進行,並於期初進行分組。所有組員均應參與期中的專題計畫書報告與期末的成果展示。如應到未到而無請假紀錄者,酌扣總成績三分。 5. 專題成果應繳交以下項目,如缺少一項扣專題成績10%。 Poster in specified format Raw data collected for your project R script for processing your data with comments Report(1500~2000 words in Chinese) 
 
課程進度
週次
日期
單元主題
第1週
2/23  Course overview 
第2週
3/02  Vector, dataframe, factor, and datatype 
第3週
3/09  Reading CSV data, RMarkdown 
第4週
3/16  Plotting and visualization 
第5週
3/23  dplyr: Manipulating raw data  
第6週
3/30  Reading JSON: open data 
第7週
4/06  Text processing 
第8週
4/13  Web crawler I 
第9週
4/20  Web crawler II: ptt as an example 
第10週
4/27  Introduction to Facebook graph API 
第11週
5/04  Midterm exam and proposal 
第12週
5/11  Graph API: Reaction and Comments 
第13週
5/18  Facebook page analysis  
第14週
5/25  Visualization: ggplot2  
第15週
6/01  Interaction: Shiny R  
第16週
6/08  Visualization: Drawing Map 
第17週
6/15  R sentiment analysis 
第18週
6/22  Final presentation