課程名稱 |
巨量資料系統 Big Data Systems |
開課學期 |
102-1 |
授課對象 |
電機資訊學院 資訊網路與多媒體研究所 |
授課教師 |
廖世偉 |
課號 |
CSIE5322 |
課程識別碼 |
922 U4120 |
班次 |
|
學分 |
3 |
全/半年 |
半年 |
必/選修 |
選修 |
上課時間 |
星期四A,B,C(18:25~21:05) |
上課地點 |
資103 |
備註 |
總人數上限:98人 |
Ceiba 課程網頁 |
http://ceiba.ntu.edu.tw/1021bigdata |
課程簡介影片 |
|
核心能力關聯 |
核心能力與課程規劃關聯圖 |
課程大綱
|
為確保您我的權利,請尊重智慧財產權及不得非法影印
|
課程概述 |
隨著行動,社群,雲端應用的成熟發展,巨量資料(Big Data)已成為下一波提升所有產業的生產力與創新性的重要資訊系統技術。 本課程將以Google在巨量資料系統技術的成功案例為基礎,結合學界基礎研究,產業實務經驗,以及研究機構的創新研發能量,研習發展巨量資料應用所需的知識技能與系統技術。 |
課程目標 |
本課程的目標在於讓修課同學:充分了解Google等國際頂尖公司的技術與應用發展脈絡,做好迎接巨量資料時代的準備,掌握知識經濟下,全球化,數位化,以及網路化時代下的科技人必備的競爭利器。 |
課程要求 |
Backgrounds in programming, file system and database and operating systems are highly desirable. |
預期每週課後學習時數 |
|
Office Hours |
|
指定閱讀 |
1. "Hadoop: The Definitive Guide", 2nd Edition. Tom White.
2. "Mining of Massive Data Sets", Anand Rajaraman, Jure Leskovec and Jeff Ullman.
Available at http://infolab.stanford.edu/~ullman/mmds.html#latest |
參考書目 |
"The Datacenter as a Computer", Urs Holzle and Luiz Andre Barroso |
評量方式 (僅供參考) |
No. |
項目 |
百分比 |
說明 |
1. |
Midterm |
30% |
期中考 |
2. |
Programming and Hand-on Hw |
35% |
|
3. |
Final Project |
35% |
|
|
週次 |
日期 |
單元主題 |
第1週 |
09/12 |
Big Data: Opportunities & Challenges |
第2週 |
9/19 |
Autumn Festival: No Class |
第3週 |
9/26 |
Computation: MapReduce |
第4週 |
10/03 |
Hadoop |
第5週 |
10/10 |
National Day: No class |
第6週 |
10/17 |
In-Memory Computation : Spark |
第7週 |
10/24 |
Graph Computation: Pregel & HAMA |
第8週 |
10/31 |
Distributed Storage: GFS |
第9週 |
11/07 |
Midterm |
第10週 |
11/14 |
Distributed DB:Google's Big Table & HBase |
第11週 |
11/21 |
Distributed DB:Dynamo & Cassandra |
第12週 |
11/28 |
Data Warehouse: Hive & Shark |
第13週 |
12/05 |
Analytics: Google's Drmel & Drill |
第14週 |
12/12 |
Analytics: Big Explorer |
第15週 |
12/19 |
Tech Trend |
第16週 |
12/26 |
Final Project: Demo |
第17週 |
1/02 |
Final Project: Demo |