課程資訊
 課程名稱 資料科學之統計基礎(二)Statistical Foundations of Data Science 開課學期 106-2 授課對象 理學院  應用數學科學研究所 授課教師 陳素雲 課號 MATH5079 課程識別碼 221 U8260 班次 學分 3.0 全/半年 半年 必/選修 選修 上課時間 星期三6,7,8(13:20~16:20) 上課地點 天數201 備註 資料科學學程課程。限本系所學生(含輔系、雙修生) 或 限電資學院學生(含輔系、雙修生)總人數上限：30人 Ceiba 課程網頁 http://ceiba.ntu.edu.tw/1062MATH5079_SFDS2 課程簡介影片 核心能力關聯 本課程尚未建立核心能力關連 課程大綱 為確保您我的權利,請尊重智慧財產權及不得非法影印 課程概述 This course will cover the following topics: unsupervised dimension reduction (SVD, PCA), supervised dimension reduction (sliced inverse regression SIR), tensor methods (high order SVD, multilinear PCA, multilinear algebra, tensor SIR, tensor regression), clustering analysis (k-means, self-updating process), discriminant analysis (LDA, logistic regression), kernel machines (kernel PCA, kernel SIR, kernel Fisher discriminant analysis, support vector machine, reproducing kernel Hilbert space), robust loss functions (Kullback-Leibler divergence, Bregman divergence, gamma-divergence, etc), neural networks (universal approximation theory, back-propagation, activation functions, dropout regularization). 課程目標 selected statistical methods and theory for machine learning and data science 課程要求 1. grading: 80% assignments (homework, mini projects), 20% class participation (attendance, in-class discussions) 2. able to write scripts for data analysis in a package such as Matlab, R, or Python 3. good understanding of theory is required 預期每週課後學習時數 Office Hours 另約時間 備註： by appointment 參考書目 An Introduction to Statistical Learning by James, Witten, Hastie and Tibshirani. web link to an ebook is posted on ceiba. The Elements of Statistical Learning: Data Mining, Inference, and Prediction by Hastie, Tibshirani and Friedman. web link to an ebook is posted on ceiba. 指定閱讀 will be assigned in class 評量方式(僅供參考)
 課程進度
 週次 日期 單元主題 第1週 2/28 national holiday, no class 第2週 3/07 1. course overview; 2. clustering analysis: k-means, hierarchical clustering and self-updating process for clustering ebooks: An Introduction to Statistical Learning http://www-bcf.usc.edu/~gareth/ISL/ The Elements of Statistical Learning 第3週 3/14 unsupervised dimension reduction: SVD, PCA, stability analysis 第4週 3/21 unsupervised dimension reduction (continued) 第5週 3/28 high order SVD 第6週 4/04 national holiday, no class 第7週 4/11 Tensor Toolbox. Tensor methods. 第8週 4/18 tensor methods; supervised dimension reduction, sliced inverse regression, KSIR Toolbox 第9週 4/25 linear discriminant analysis, logistic regression, maximum margin linear classifier 第10週 5/02 數學系自主學習週。 複習 HOSVD, MPCA, LDA, logistic reg, linear SVM, 以及介紹軟體 第11週 5/09 robust loss functions and various divergence measures 第12週 5/16 kernel machines: kernel trick, kernel PCA, kernel Fisher discriminant analysis 第13週 5/23 kernel machines: SVM 第14週 5/30 1. kernel machines (continued) 2. Bring a laptop to class. 第15週 6/06 introduction to neural networks, universal approximation theory, back-propagation algorithm 第16週 6/13 neural networks (continued) 第17週 6/20 mini-project presentation (each person 8-10 minutes) 報告次序：黃聖堯，曾華廷 ，邱郁軒 ，劉妍君 ，鄭宗哲 ，森元俊成，朱傑韜，盧俊澎，林致弘，何文劭 ，洪嘉鴻 ，呂融昇 ，林伯儒 ，謝君宥，顏惠萱 上 ceiba 確認你的作業 (1,2,3,6,7,8次的作業) 成績