課程資訊
課程名稱
新聞資料處理與視覺呈現
Journalism Processing and Visualization 
開課學期
105-2 
授課對象
新聞研究所  
授課教師
蔡芸琤 
課號
JOUR5014 
課程識別碼
342 U1250 
班次
02 
學分
3.0 
全/半年
半年 
必/選修
選修 
上課時間
星期三2,3,4(9:10~12:10) 
上課地點
新聞313 
備註
兼通識AB*。。可充抵基本能力課程。
限學士班三年級以上
總人數上限:15人 
課程網頁
https://ceiba.ntu.edu.tw/1052JOUR5014_02 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

課程概述
1.本課程強調如何使用R語言進行新聞相關的資料分析。
2.如何用R撰寫爬蟲程式收集資訊。
3.如何用R靈活處理資料,做清洗、整合及探索。
4.如何用R製作出互動資料視覺化。
5.如何用R處理線型回歸、邏輯函數、文本分析、群聚分析。 

課程目標
教學目標
1.培養學生擁有資料獲取、儲存、轉換、與清理的能力。
2.培養學生可自動化爬梳與擷取政府開放資料與社群資料的能力。
3.培養學生利用R語言進行數值分析與數值探勘的能力。
4.培養學生利用R語言進行文字分析與文字探勘的能力。
5.培養學生利用R語言製作出新聞互動資料視覺化的能力。 
課程要求
 
預期每週課後學習時數
 
Office Hours
每週三 12:30~14:00 備註: 面談地點為博雅館五樓共同教育中心 
指定閱讀
http://r4ds.had.co.nz/
http://datascienceandr.org/ 
參考書目
書名:R 錦囊妙計
作者:Paul Teetor
譯者:張夏菁
出版社:歐萊禮
出版日:2014年01月24日
ISBN:978-9-862-76982-9
語言:中文繁體
參考網址:http://www.books.com.tw/products/0010624153 
評量方式
(僅供參考)
 
No.
項目
百分比
說明
1. 
回家作業 
60% 
共5次,每次佔個人總分的12%,於作業公布後兩周內於上課前繳交,每次作業分數依照指示給分,於公布作業當天公告,不收遲交者的作業。  
2. 
期末報告 
40% 
共1次,佔個人總分的40%,於期中考後,進行分組,三個人一組,最後有參加期末發表的組別,期末報告成績為A,於期末發表會得獎的組別,期末報告成績為A+,其餘依照完成度斟酌給分。  
 
課程進度
週次
日期
單元主題
第1週
2017/02/22  R 語言基礎介紹,包含安裝 R、RStudio、R 翻轉教室。
專案討論:<a href=http://d4sg.org/>http://d4sg.org/</a> 
第2週
2017/03/01  利用 R 繪製出 1945 ~ 2015 年間台大學生組成分佈。
公布作業一
資料來源:台大主計室 http://acct2015.cc.ntu.edu.tw/ 
第3週
2017/03/08  https://plot.ly/ 套件包介紹
SAVE PLOT TO GIF: https://cran.r-project.org/web/packages/animation/animation.pdf
自學 R 語言:https://ntu-csplusx.github.io/2017-DS-Programming/2nd.week/learn-R.html#1 
第4週
2017/03/15  網路爬蟲實戰 
第5週
2017/03/22  作業一各別報告
爬蟲實戰與XPATH、Regular Expression規則介紹
公布作業二  
第6週
2017/03/29  分組、決定主題,助教帶領新聞討論活動。
三個人一組。 
第7週
2017/04/05  清明節連假,休息一週 
第8週
2017/04/12  作業二各別報告
主題:使用 R 完成單變量分析的互動視覺化。
https://pecu.github.io/NTU_R/NTUCSX/teachers.html
公布作業三
作品主題:台大師資人數變化。
資料來源:國立臺灣大學主計室 2015 年統計年報 http://acct2015.cc.ntu.edu.tw/
參考資料:<a href=https://chtseng.wordpress.com/2015/04/30/%E8%A6%96%E8%A6%BA%E5%8C%96%E8%B3%87%E6%96%99%E5%B7%A5%E5%85%B7tableau-public/>視覺化資料工具Tableau Public</a> 
第9週
2017/04/19  主題:使用 R 完成雙變量分析的視覺化呈現。 
第10週
2017/04/26  [中文文字探勘]
公布作業四與作業五 
第11週
2017/05/03  作業三各別報告
[中文文字探勘與機器學習簡介] 
第12週
2017/05/10  資料科學與機器學習
k-means、PCA、SVM 
第13週
2017/05/17  自建 R 套件包並分享於 Github 提供他人安裝
https://github.com/pecu/powerInfo 
第14週
2017/05/24  作業四各別報告
校園節電專案實作分享 
第15週
2017/05/31  ggplot2 繪圖教學
R 翻轉教室 ggplot2 破關示範
http://datascienceandr.org/note/03-RVisualization-03-ggplot2.html 
第16週
2017/06/07  作業五各別報告
R 翻轉教室 GIS 地圖資訊教學示範
http://datascienceandr.org/note/03-RVisualization-04-Javascript-And-Maps.html 
第17週
2017/06/14  期末專題發表,並同時進行挑選出參與期末聯合展的組別。