週次 |
日期 |
單元主題 |
第1週 |
9/10 |
中文和英文的字(character)、語素(morpheme)與詞(word)。
中英文複合詞(compound)的種類與性質。
中英文的構詞律。
萬國碼Unicode的簡介。
|
第2週 |
9/17 |
中文智慧型輸入法的原理。
中文分詞的應用。
中文分詞演算法。
詞頻與Zipf’s law。
|
第3週 |
9/24 |
如何利用有限狀態機(finite state machine)來辨識詞。
語料庫的類型與應用(corpus) 。
語言模型(language model) 。
訊息理論(information theory)包括熵(entropy)和互見訊息(mutual information)的應用。
如何擷取搭配語(collocation) 。
|
第4週 |
10/01 |
如何擷取關鍵詞(keyword identification) 。
文件分析(text analysis)簡介。
英文拼字錯誤檢查軟體(spelling checker)的設計原理。
中文錯字偵測軟體的設計原理。
|
第5週 |
10/08 |
中英文的詞性標記集(tagset) 。
中英文的詞性標注(part-of-speech tagging)演算法。
|
第6週 |
10/15 |
中英文句子的結構。
詞組結構律(phrase structure rules) 。
Context-Free Grammar (CFG) 。
Context-Sensitive Grammar (CSG) 。
Probabilistic Context-Free Grammar (CFG) 。
|
第7週 |
10/22 |
正規式(regular expressions)的應用。
如何利用詞性標注和正規式(regular expressions)來辨識名詞組。
|
第8週 |
10/29 |
詞權重(term weighting)的計算。
資訊檢索技術的原理。
|
第9週 |
11/05 |
文件相似度的計算(document similarity) 。
文件自動分類(document classification)的原理。
文件自動摘要(automatic summarization)的原理。
|
第10週 |
11/12 |
中英文語法剖析演算法。 |
第11週 |
11/19 |
詞彙岐義與結構岐義。
如何利用語料庫解決詞彙岐義與結構岐義。
|
第12週 |
11/26 |
文件中人事時地物的自動辨識。
語義角色理論。
語義角色的辨識。
|
第13週 |
12/03 |
資訊擷取(information extraction) 。
對話中的語用學原理。
問答系統(question answering) 。
|
第14週 |
12/10 |
雙語平行語料庫。
翻譯記憶系統的原理。
機器翻譯的原理。
|
第15週 |
12/17 |
中文及英文的語音及音韻系統。
中英文的聲韻學規則。
語音的處理。
|
第16週 |
12/24 |
語音辨識(speech recognition)的原理。
語音合成(speech synthesis) 。
|
第17週 |
12/31 |
學生分組期末報告 |
第18週 |
|
學生分組期末報告 |