課程資訊
課程名稱
巨量資料系統之應用
Application of Big Data System 
開課學期
102-2 
授課對象
電機資訊學院  資訊網路與多媒體研究所  
授課教師
廖世偉 
課號
CSIE5323 
課程識別碼
922EU4170 
班次
 
學分
全/半年
半年 
必/選修
選修 
上課時間
星期二A,B,C(18:25~21:05) 
上課地點
資104 
備註
總人數上限:106人 
Ceiba 課程網頁
http://ceiba.ntu.edu.tw/1022bigdata 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

課程網站:http://csie.ntu.edu.tw/~bigdata

隨著行動,社群,雲端應用的成熟發展,巨量資料(Big Data)已成為下一波提升所有產業的生產力與創新性的重要元素。本課程將從分析模式、系統模式、商業模式等面向探討各行各業之巨量資料應用系統。因LAP(Large application platforms 如Facebook,Android,Google Search)是現今重要趨勢,其強調具備ecosystem及平台的系統,我們希望此課以大系統為主,作出國際級的真正的Large Application Platforms,取代小打小鬧的台灣軟體走向及one-off apps。本課程先從分析模式來培養懂data science 的平臺架構師、再從系統模式來訓練有大開大合能力的 cloud programmers、最後再從商業模式的實例讓學生具備有走的出去的價值及能力(entrepreneurs)。LAP 需要以上有整合系統,及垂直綜觀產業能力的師資都願意開課來幫助帶領台灣軟體能量到新的層次。 

課程目標
本課程的目標在於讓修課同學:培養同學全面掌握巨量資料應用系統之基本能力,鼓勵同學投入發展各行各業的巨量資料創新應用系統,有機會與國際級企業家合作落實創新構想於實際企業案例。 
課程要求
大二及以上. The understanding of programming is necessary but not sufficient. Reviewing of my course slides on www.csie.ntu.edu.tw/~bigdata/bigdata2013f is strongly recommended. In addition, read related course material in data mining, machine learning, and information retrieval. 
預期每週課後學習時數
 
Office Hours
 
指定閱讀
"Mining of Massive Datasets", http://infolab.stanford.edu/~ullman/mmds/book.pdf 
參考書目
待補 
評量方式
(僅供參考)
   
課程進度
週次
日期
單元主題
第1週
2/18  Introduction and review of the Economic value for Big Data. 
第2週
2/25  Global trend in the development of big data applications. 
第3週
3/04  Introduction of digital analytics and strategy: decision model and prediction model, data mining and machine learning. 
第4週
3/11  Internet: web measurement and analytics 
第5週
3/18  Social Networks: connections, distribution, segmentation, modeling and visualization 
第6週
3/25  Online recommendation: item hierarchy, attribute & content-based, collaborative filtering, social & interest graph-based, model based 
第7週
4/01  Integration and strategy framework 
第8週
4/08  Data warehousing, ETL, OLAP, real-time reporting, etc. 
第9週
4/15  Midterm Exam 
第10週
4/22  MPP, Hybrid row-column, in-memory cache/database. 
第11週
4/29  MapReduce, CSP/BSP, etc. 
第12週
5/06  Customer acquisition (search engine optimization, paid search, e-mail marketing) 
第13週
5/13  AdWords, search & display 
第14週
5/20  Mobile marketing & location based marketing 
第15週
5/27  Social media Marketing, content Marketing & building communities 
第16週
6/03  Success stories from industry, healthcare, retail/e-commerce, finance, etc. 
第17週
6/10  Final presentation & competition by groups