課程資訊
課程名稱
資訊檢索與擷取
Information Retrieval and Extraction 
開課學期
100-2 
授課對象
電機資訊學院  資訊網路與多媒體研究所  
授課教師
陳信希 
課號
CSIE5460 
課程識別碼
922 U1910 
班次
 
學分
全/半年
半年 
必/選修
選修 
上課時間
星期四2,3,4(9:10~12:10) 
上課地點
資111 
備註
限學士班三年級以上
總人數上限:55人 
Ceiba 課程網頁
http://ceiba.ntu.edu.tw/1002ire 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

在資訊大爆炸的時代,如何讓使用者快速準確的掌握資訊,是很重要的課題。本課程包括資訊檢索與資訊擷取兩部份,前者涵蓋資訊檢索模型、檢索評估、查詢語言和運算、文件和多媒體、Indexing、資訊呈現等技術。後者涉及文件的分析,和初步的語言理解,與自然語言處理課程相互連貫。 

課程目標
本課程的目標在於讓修課同學:了解資訊檢索與擷取的理論;熟悉文件與多媒體資料處理的方法;熟悉資訊檢索與擷取的標準測試資料集與分析法則;有能力從事相關主題之研究,例如:跨語言檢索、文件摘要與分類;有能力開發資訊檢索或擷取系統的軟體元件。
 
課程要求
 
預期每週課後學習時數
 
Office Hours
每週三 09:00~12:00 
指定閱讀
(1) Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008. http://www-csli.stanford.edu/~hinrich/information-retrieval-book.html
(2) Ricardo Baeza-Yates and Berthier Riberiro-Neto (1999) Modern Information Retrieval, Addison-Wesley.
(3) Sunita Sarawagi, Information Extraction, Foundations and Trends in Databases, Vol. 1, No. 3, 2007, 261–377.
 
參考書目
(1) W.B. Croft, D. Metzler, and T. Strohman, Search Engines: Information Retrieval in Practice, 2010.
 
評量方式
(僅供參考)
 
No.
項目
百分比
說明
1. 
期中考、期末考、學期計畫 
100% 
 
 
課程進度
週次
日期
單元主題
第1週
2/23  Lecture 1 Introduction 
第2週
3/01  Lecture 2 An Overall View on IR 
第3週
3/08  Lecture 3.1 IR Modeling 
第4週
3/15  Lecture 3.2 Alternative IR Models 
第5週
3/22  Lecture 4 Retrieval Evaluation 
第6週
3/29  Lecture 5 Language Models for IR 
第7週
4/05  溫書假 
第8週
4/12  Lecture 6 Relevance Feedback and Query Expansion 
第9週
4/19  期中考 
第10週
4/26  Lecture 7 Chinese Language Retrieval 
第11週
5/03  Lecture 8 Text Operations 
第12週
5/10  Lecture 9 Classification & Clustering 
第13週
5/17  Lecture 10 Index Construction 
第14週
5/24  Lecture 11. Social Search (--> Learning to rank) 
第15週
5/31  Lecture 12 Introduction to Information Extraction 
第16週
6/07  Lecture 13 Information Extraction Technologies (part 1) 
第17週
6/14  Lecture 14 Information Extraction Technologies (part 2)