1.基本概念:
NLP:自然語言處理是研究如何利用計算機技術對語言文本(句子、篇章或話語等)進行處理和加工的一門學科,研究內容包括對詞法、句法、語義和語用等信息的識別、分類、提取、轉換和生成等各種處理方法和實現技術。
語言的基本屬性:語音和文字
2.研究內容:
3.基本問題:
a)形態學(morphology)問題:研究詞(word) 由有意義的基本單位-詞素(morphemes)的構成問題。單詞的識別/ 漢語的分詞問題。詞素:詞根、前綴、后綴、詞尾。
b)語法學(syntax)問題:研究句子結構成分之間的相互關系和組成句子序列的規則 。為什么一句話可以這么說也可以那么說?如何建立快速有效的句子結構分析方法?
c)語義學(semantics)問題:研究如何從一個語句中詞的意義,以及這些詞在該語句中句法結構中的作用來推導出該語句的意義。
d)語用學(pragmatics)問題:研究在不同上下文中語句的應用,以及上下文對語句理解所產生的影響。從狹隘的語言學觀點看,語用學處理的是語言結構中有形式體現的那些語境。相反,語用學最寬泛的定義是研究語義學未能涵蓋的那些意義。
e)語音學(phonetics)問題:研究語音特性、語音描述、分類及轉寫方法等。
4.主要困難:
a)大量歧義
b)大量新詞和未知語言:
5.研究方法:
6.研究現狀: