課程資訊
課程名稱
巨量資料系統
Big Data Systems 
開課學期
102-1 
授課對象
電機資訊學院  資訊工程學研究所  
授課教師
廖世偉 
課號
CSIE5322 
課程識別碼
922 U4120 
班次
 
學分
全/半年
半年 
必/選修
選修 
上課時間
星期四A,B,C(18:25~21:05) 
上課地點
資103 
備註
總人數上限:98人 
Ceiba 課程網頁
http://ceiba.ntu.edu.tw/1021bigdata 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

隨著行動,社群,雲端應用的成熟發展,巨量資料(Big Data)已成為下一波提升所有產業的生產力與創新性的重要資訊系統技術。 本課程將以Google在巨量資料系統技術的成功案例為基礎,結合學界基礎研究,產業實務經驗,以及研究機構的創新研發能量,研習發展巨量資料應用所需的知識技能與系統技術。 

課程目標
本課程的目標在於讓修課同學:充分了解Google等國際頂尖公司的技術與應用發展脈絡,做好迎接巨量資料時代的準備,掌握知識經濟下,全球化,數位化,以及網路化時代下的科技人必備的競爭利器。 
課程要求
Backgrounds in programming, file system and database and operating systems are highly desirable. 
預期每週課後學習時數
 
Office Hours
 
指定閱讀
1. "Hadoop: The Definitive Guide", 2nd Edition. Tom White.

2. "Mining of Massive Data Sets", Anand Rajaraman, Jure Leskovec and Jeff Ullman.
Available at http://infolab.stanford.edu/~ullman/mmds.html#latest 
參考書目
"The Datacenter as a Computer", Urs Holzle and Luiz Andre Barroso 
評量方式
(僅供參考)
 
No.
項目
百分比
說明
1. 
Midterm 
30% 
期中考 
2. 
Programming and Hand-on Hw 
35% 
 
3. 
Final Project 
35% 
 
 
課程進度
週次
日期
單元主題
第1週
09/12  Big Data: Opportunities & Challenges 
第2週
9/19  Autumn Festival: No Class 
第3週
9/26  Computation: MapReduce 
第4週
10/03  Hadoop 
第5週
10/10  National Day: No class 
第6週
10/17  In-Memory Computation : Spark 
第7週
10/24  Graph Computation: Pregel & HAMA 
第8週
10/31  Distributed Storage: GFS 
第9週
11/07  Midterm 
第10週
11/14  Distributed DB:Google's Big Table & HBase 
第11週
11/21  Distributed DB:Dynamo & Cassandra 
第12週
11/28  Data Warehouse: Hive & Shark 
第13週
12/05  Analytics: Google's Drmel & Drill 
第14週
12/12  Analytics: Big Explorer 
第15週
12/19  Tech Trend 
第16週
12/26  Final Project: Demo 
第17週
1/02  Final Project: Demo