本文面向的讀者對象是具有傳統(tǒng)計算機科學知識背景的研究人員和科學工作者,主要介紹基于統(tǒng)計的語言處理技術——單詞標注(word tagging)、基于概率上下文無關語法(pcfg,probabilistic context-free grammar)的剖析(parsing,又稱為句法分析)、語法歸納(grammar induction)、句法排歧(syntactic disambiguation)、詞義分類(semantic word classes)、詞義排歧(word-sense disambiguation)等技術,同時還介紹了相關的數(shù)學知識,每一章還附有一定數(shù)量的練習題。本書在國外好評如潮,已經成為學習統(tǒng)計自然語言處理的不可缺少的入門書之一。
|