課程名稱 |
新聞資料處理與視覺呈現 Journalism Processing and Visualization |
開課學期 |
109-2 |
授課對象 |
社會科學院 新聞研究所 |
授課教師 |
謝吉隆 |
課號 |
JOUR5014 |
課程識別碼 |
342 U1250 |
班次 |
|
學分 |
3.0 |
全/半年 |
半年 |
必/選修 |
選修 |
上課時間 |
星期二2,3,4(9:10~12:10) |
上課地點 |
新聞103 |
備註 |
初選不開放。 限學士班三年級以上 總人數上限:30人 外系人數限制:20人 |
課程網頁 |
https://docs.google.com/document/d/1VFlSTUfm6p8oCIGHcLhVOvYqgyfgOM3RiL0nRi7xB30/edit?usp=sharing |
課程簡介影片 |
|
核心能力關聯 |
核心能力與課程規劃關聯圖 |
課程大綱
|
為確保您我的權利,請尊重智慧財產權及不得非法影印
|
課程概述 |
本門課企圖訓練對新聞傳播有興趣的學生成為資料記者,同樣適用於其他需要快速探索資料、視覺化、並加以文字詮釋的能力需求。這樣的訓練通常需要對程式語言概念、案例解析、資料集與方法涉獵、程式撰寫實作、甚至媒體實務等多面向進行教學。在原訂課程內三小時勢必無法全部完成。因此,本門課將採混成授課方式,分線上與實體課程兩部份進行:
1. 實體課程:除第一週與報告週次外,自第二週起縮短課堂時間為兩小時(10:20~12:10),主要活動為程式概念講解、Lab操作、作業說明、業界演講、案例分析等。
2. 線上非同步教學:每週約2~3小時程式實作教學影片,隨著老師講解,從零開始按步驟寫程式,估計約3~5小時可以消化完畢,依每個學生的情形不同。實體課堂教學
---
本門課以對資料新聞有強烈興趣的學習者為對象,故將優先接受所有新聞所學生、曾修新聞所相關課程(如新聞所跨域專長等)者選修;生傳系所、社科院、文學院學生次之;其他學院則視學生對資料新聞、傳播的興趣而定。
所有修課生(含新聞所學生)必須在第一週前填寫以下問卷:https://forms.gle/ZPPJE83y2jYNFBVR9
並在第一週上課前依照Youtube影片安裝好R與RStudio
https://youtu.be/FbnYioMlYm8
曾修過資料科學與社會研究課程的學生不建議選修(無法抵用經濟系跨域專長)。
本課程以數位新聞人才訓練為目標,如果想學程式的同學,建議修社會科學程式設計(Python )、程式語言與資料科學導論(R、共教課程)、或管院之商管程式設計課程。
每週進度如後表列,實際內容則以開學第一週公布內容為準: |
課程目標 |
1. 培養學生擁有資料獲取、儲存、轉換、與清理的能力。
2. 培養學生可自動化爬梳與擷取政府開放資料與社群資料的能力。
3. 培養學生利用R語言進行數值分析與數值探勘的能力。
4. 培養學生利用R語言進行文字分析與文字探勘的能力。
5. 培養學生利用R語言製作出新聞資料視覺化的能力。
6. 培養學生有自行利用第三方服務處理並視覺化資料的能力。
---
本課程的重要目的在於訓練能夠自己獲取資料、操作資料、分析、視覺化並撰寫資料新聞的記者,你可以期待在認真上過一學期的課後,有相當的能力可應徵資料記者實習。教學內容包含以下範例與程式語言方法:
1. R教學範例:產假支薪、空污、Youbike、疫情、選舉與公投與人口變項、網軍的人口特徵探勘、Tweet分析、104職缺分析、新聞分析
2. R課程內容:讀取檔案、操作並合併資料、視覺化、爬蟲、基礎R文字探勘分析、資料庫
課程負擔
|
課程要求 |
實際學生需要參與的時數為實體課程共15週31小時、線上課程共13週,約40小時。
實際學生的作業負荷共有8個課程回家作業(35%)、1則個人期中視覺化新聞(15%)、1個小組期末資料新聞專題(40%)、10個課堂即時演練(10%)。 |
預期每週課後學習時數 |
|
Office Hours |
|
指定閱讀 |
本課程以教師自製課程簡報、範例程式碼、非同步錄影為教材。 |
參考書目 |
一、 指定閱讀:無指定閱讀,教師依照週次自編講義。
二、 延伸閱讀:
書名:R 錦囊妙計
作者:Paul Teetor
譯者:張夏菁
出版社:歐萊禮
出版日:2014年01月24日
ISBN:978-9-862-76982-9
語言:中文繁體
參考網址:http://www.books.com.tw/products/0010624153 |
評量方式 (僅供參考) |
|
週次 |
日期 |
單元主題 |
第1週 |
2/23 |
每週進度如下,實際內容則以開學第一週公布內容為準:
課程概覽 |
第2週 |
3/02 |
R語言基礎操作 |
第3週 |
3/09 |
資資料格式(表格、文字、JSON、資料庫等):產假支薪、住宅竊盜案 |
第4週 |
3/16 |
料操作(變數型態、資料排序、缺失值等):誰是KOL? |
第5週 |
3/23 |
資料合併:以大選與公投的人口變項為例 |
第6週 |
3/30 |
資料清理與時間處理:社群時間 |
第7週 |
4/06 |
春假(實體課不上、有線上課程內容) |
第8週 |
4/13 |
資料視覺化:網軍的人口統計特性(期中考準備、無線上課程、有期中視覺化專案)
|
第9週 |
4/20 |
期中考週(實體課不上、無線上課程內容) |
第10週 |
4/27 |
文字資料處理 |
第11週 |
5/04 |
中文文字處理:PTT貼文關鍵字萃取 |
第12週 |
5/11 |
期中報告(資料視覺化) |
第13週 |
5/18 |
網頁爬蟲(JSON):爬取104職缺、租屋、DCard資料 |
第14週 |
5/25 |
網頁爬蟲(HTML):爬取PTT、線上新聞 |
第15週 |
6/01 |
產業演講與期末報告準備(實體課程由老師與助教解題、線上課程無進度) |
第16週 |
6/08 |
文字探勘進階 |
第17週 |
6/15 |
期末報告與海報展 |
第18週 |
6/22 |
海報展 |