課程資訊
課程名稱
新聞資料處理與視覺呈現
Journalism Processing and Visualization 
開課學期
109-2 
授課對象
學程  人口學程  
授課教師
謝吉隆 
課號
JOUR5014 
課程識別碼
342 U1250 
班次
 
學分
3.0 
全/半年
半年 
必/選修
選修 
上課時間
星期二2,3,4(9:10~12:10) 
上課地點
新聞103 
備註
初選不開放。[人口學程]選修領域(四)遷移與空間。
限學士班三年級以上
總人數上限:30人
外系人數限制:20人 
課程網頁
https://docs.google.com/document/d/1VFlSTUfm6p8oCIGHcLhVOvYqgyfgOM3RiL0nRi7xB30/edit?usp=sharing 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

本門課企圖訓練對新聞傳播有興趣的學生成為資料記者,同樣適用於其他需要快速探索資料、視覺化、並加以文字詮釋的能力需求。這樣的訓練通常需要對程式語言概念、案例解析、資料集與方法涉獵、程式撰寫實作、甚至媒體實務等多面向進行教學。在原訂課程內三小時勢必無法全部完成。因此,本門課將採混成授課方式,分線上與實體課程兩部份進行:
1. 實體課程:除第一週與報告週次外,自第二週起縮短課堂時間為兩小時(10:20~12:10),主要活動為程式概念講解、Lab操作、作業說明、業界演講、案例分析等。
2. 線上非同步教學:每週約2~3小時程式實作教學影片,隨著老師講解,從零開始按步驟寫程式,估計約3~5小時可以消化完畢,依每個學生的情形不同。實體課堂教學

---
本門課以對資料新聞有強烈興趣的學習者為對象,故將優先接受所有新聞所學生、曾修新聞所相關課程(如新聞所跨域專長等)者選修;生傳系所、社科院、文學院學生次之;其他學院則視學生對資料新聞、傳播的興趣而定。
所有修課生(含新聞所學生)必須在第一週前填寫以下問卷:https://forms.gle/ZPPJE83y2jYNFBVR9
並在第一週上課前依照Youtube影片安裝好R與RStudio
https://youtu.be/FbnYioMlYm8

曾修過資料科學與社會研究課程的學生不建議選修(無法抵用經濟系跨域專長)。
本課程以數位新聞人才訓練為目標,如果想學程式的同學,建議修社會科學程式設計(Python )、程式語言與資料科學導論(R、共教課程)、或管院之商管程式設計課程。

每週進度如後表列,實際內容則以開學第一週公布內容為準: 

課程目標
1. 培養學生擁有資料獲取、儲存、轉換、與清理的能力。
2. 培養學生可自動化爬梳與擷取政府開放資料與社群資料的能力。
3. 培養學生利用R語言進行數值分析與數值探勘的能力。
4. 培養學生利用R語言進行文字分析與文字探勘的能力。
5. 培養學生利用R語言製作出新聞資料視覺化的能力。
6. 培養學生有自行利用第三方服務處理並視覺化資料的能力。
---
本課程的重要目的在於訓練能夠自己獲取資料、操作資料、分析、視覺化並撰寫資料新聞的記者,你可以期待在認真上過一學期的課後,有相當的能力可應徵資料記者實習。教學內容包含以下範例與程式語言方法:
1. R教學範例:產假支薪、空污、Youbike、疫情、選舉與公投與人口變項、網軍的人口特徵探勘、Tweet分析、104職缺分析、新聞分析
2. R課程內容:讀取檔案、操作並合併資料、視覺化、爬蟲、基礎R文字探勘分析、資料庫
課程負擔
 
課程要求
實際學生需要參與的時數為實體課程共15週31小時、線上課程共13週,約40小時。

實際學生的作業負荷共有8個課程回家作業(35%)、1則個人期中視覺化新聞(15%)、1個小組期末資料新聞專題(40%)、10個課堂即時演練(10%)。 
預期每週課後學習時數
 
Office Hours
 
指定閱讀
本課程以教師自製課程簡報、範例程式碼、非同步錄影為教材。 
參考書目
一、 指定閱讀:無指定閱讀,教師依照週次自編講義。
二、 延伸閱讀:
書名:R 錦囊妙計
作者:Paul Teetor
譯者:張夏菁
出版社:歐萊禮
出版日:2014年01月24日
ISBN:978-9-862-76982-9
語言:中文繁體
參考網址:http://www.books.com.tw/products/0010624153 
評量方式
(僅供參考)
   
課程進度
週次
日期
單元主題
第1週
2/23  每週進度如下,實際內容則以開學第一週公布內容為準:
課程概覽 
第2週
3/02  R語言基礎操作 
第3週
3/09  資資料格式(表格、文字、JSON、資料庫等):產假支薪、住宅竊盜案 
第4週
3/16  料操作(變數型態、資料排序、缺失值等):誰是KOL? 
第5週
3/23  資料合併:以大選與公投的人口變項為例 
第6週
3/30  資料清理與時間處理:社群時間 
第7週
4/06  春假(實體課不上、有線上課程內容) 
第8週
4/13  資料視覺化:網軍的人口統計特性(期中考準備、無線上課程、有期中視覺化專案)
 
第9週
4/20  期中考週(實體課不上、無線上課程內容) 
第10週
4/27  文字資料處理 
第11週
5/04  中文文字處理:PTT貼文關鍵字萃取 
第12週
5/11  期中報告(資料視覺化) 
第13週
5/18  網頁爬蟲(JSON):爬取104職缺、租屋、DCard資料 
第14週
5/25  網頁爬蟲(HTML):爬取PTT、線上新聞 
第15週
6/01  產業演講與期末報告準備(實體課程由老師與助教解題、線上課程無進度) 
第16週
6/08  文字探勘進階 
第17週
6/15  期末報告與海報展 
第18週
6/22  海報展