課程名稱 |
資訊檢索與擷取 Information Retrieval and Extraction |
開課學期 |
107-1 |
授課對象 |
電機資訊學院 資訊工程學研究所 |
授課教師 |
陳信希 |
課號 |
CSIE5460 |
課程識別碼 |
922 U1910 |
班次 |
|
學分 |
3.0 |
全/半年 |
半年 |
必/選修 |
選修 |
上課時間 |
星期四2,3,4(9:10~12:10) |
上課地點 |
資105 |
備註 |
限學士班三年級以上 總人數上限:55人 |
Ceiba 課程網頁 |
http://ceiba.ntu.edu.tw/1071CSIE5460_irie |
課程簡介影片 |
|
核心能力關聯 |
核心能力與課程規劃關聯圖 |
課程大綱
|
為確保您我的權利,請尊重智慧財產權及不得非法影印
|
課程概述 |
課程概述
在巨量資料的世代,資訊以多樣化的語言文字與媒體呈現,透過不同的網路平台,在不同時空情境與社群間傳遞。資訊具有不同的顆粒大小,含括文件、實體、實體特性、實體關係等不同層次。本課程分成資訊檢索和資訊擷取兩部分,由文字檢索、多語言檢索、網路檢索、情境檢索、社群媒體檢索、到實體擷取、特性擷取、以及關係擷取等不同面向的理論、方法、技術、與應用。
由於深度學習技術帶來新的表示方法,本課程也比較進階模型和傳統模型的差異。
課程內容
1. Introduction
2. An Overview On IR
3. Classic IR Models (Boolean Model, Vector Model, Probabilistic Model)
4. Advanced IR Models (Learning Model, Language Model, Topic Model, Deep Learning Model)
5. Retrieval Evaluation
6. Relevance Feedback and Query Expansion
7. Chinese Information Retrieval
8. Text Operations
9. Social Search
10. Entity Extraction
11. Relationship Extraction
12. Knowledge Base and Linked Data |
課程目標 |
本課程學習資訊檢索和資訊擷取兩大領域的理論、方法、技術、與應用。
|
課程要求 |
待補 |
預期每週課後學習時數 |
|
Office Hours |
每週二 09:00~12:00 備註: R301 |
指定閱讀 |
待補 |
參考書目 |
1. Ricardo Baeza-Yates and Berthier Ribeiro-Neto, Modern Information Retrieval:
The Concepts and Technology behind Search, Second edition, 2011.
2. Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction
to Information Retrieval, Cambridge University Press. 2008.
3. Yoav Goldberg, Neural Network Methods for Natural Language Processing,
Synthesis Lectures on Human Langauge Technologies, 2016.
4. Hang Li and Zhengdong Lu, Deep Learning for Information Retrieval,
dl.acm.org/ft_gateway.cfm?id=2914800&type=pdf
5. Sunita Sarawagi, Information Extraction, Foundations and Trends in
Databases, Vol. 1, No. 3, 2007, 261–377.
6. Fabian Suchanek and Gerhard Weikum, Knowledge Harvesting in the Big Data
Era, http://www.mpi-inf.mpg.de/yago-naga/sigmod2013-tutorial/
7. Selected Papers |
評量方式 (僅供參考) |
|
週次 |
日期 |
單元主題 |
第1週 |
09/13 |
Lecture 1. Introduction |
第2週 |
09/20 |
Lecture 2. Representations and IR Models
Lecture 3. Classic IR Models (Boolean and Vector Models) |
第3週 |
09/27 |
Lecture 3. Classic IR Models (Probabilistic Model)
Lecture 4. Set Theoretical Models |
第4週 |
10/04 |
Lecture 5. Algebraic Models
Lecture 6. Probabilistic Models |
第5週 |
10/11 |
Lecture 7. Fundamentals of Deep Learning |
第6週 |
10/18 |
Lecture 7. Fundamentals of Deep Learning (cont.)
Term Project 1 講解 (11:30-12:00) |
第7週 |
10/25 |
Lecture 7. Fundamentals of Deep Learning (Cont.)
Lecture 8. Deep Learning for IR |
第8週 |
11/01 |
Lecture 9. Retrieval Evaluation |
第9週 |
11/8 |
期中考 (範圍:Lecture 1-Lecture 8) |
第10週 |
11/15 |
校慶停課 |
第11週 |
11/22 |
Lecture 9. Retrieval Evaluation
Lecture 10.Relevance Feedback andQuery Expansion |
第12週 |
11/29 |
Lecture 10. Relevance Feedback and Query Expansion (Revised) |
第13週 |
12/6 |
Term Project 1報告 |
第14週 |
12/13 |
Lecture 11. Natural Language Issues in IR |
第15週 |
12/20 |
Lecture 12. Fundamental of Information Extraction, Lecture 13 Entity Extraction (part)
|
第16週 |
12/27 |
Lecture 13. Entity Extraction,
Lecture 14. Relation Extraction (part) |
第17週 |
1/3 |
Lecture 14. Relation Extraction,
Lecture 15. Knowledge Base-and-Linked Data |
第18週 |
1/10 |
期末考 |
|