現今的機器學習模型已在許多應用領域上達到甚至超過人類的水平。也因此人們開始將機器學習應用到如自駕車等對安全需求極高的領域。然而,機器學習許多成功的案例都是在資料及環境非常固定的情況下才能成立,而在現實應用中情況卻往往不是如此。例如在人臉辨識應用裡,惡意使用者可以戴上特別製作的眼鏡或其他配件來躲避辨識。若在模型訓練的過程中沒有考慮到這種惡意使用者的話,所得的模型將會有潛在的安全性問題。
本課程將帶領學生認識機器學習模型的潛在漏洞、設計並實作模型在訓練及測試階段的不同攻擊方法,以及提出防禦機制並提升整體機器學習系統的可靠性。除了安全性議題,本課程也會介紹近年來機器學習越來越被重視的各個面向,包括模型及資料的隱私性問題,以及模型預測的公平性問題。
本課程會引導學生進行論文研讀及進行小組討論,並在期末專題讓學生提出及實作各種攻擊及防禦的方法,並進行同學之間的攻防比賽,以培養學生對機器學習安全的知識與實作能力。 |