針對(duì)漢語(yǔ)自然語(yǔ)言處理句法標(biāo)注環(huán)節(jié)“名·名”詞語(yǔ)串識(shí)別這一熱點(diǎn)和難點(diǎn)問(wèn)題,韓蕾編著的《現(xiàn)代漢語(yǔ)指人名詞研究(精)》運(yùn)用結(jié)構(gòu)主義語(yǔ)言學(xué)、語(yǔ)料庫(kù)語(yǔ)言學(xué)、認(rèn)知語(yǔ)言學(xué)、功能語(yǔ)言學(xué)等多種理論,對(duì)現(xiàn)代漢語(yǔ)指人名詞進(jìn)行研究。 本書(shū)作者的辛勤勞動(dòng),只是面向信息處理的漢語(yǔ)基礎(chǔ)研究的一個(gè)小課題,只是漢語(yǔ)信息處理工程的一塊磚石。但是,宏偉大廈就是在這樣的一塊塊磚石的基礎(chǔ)上建筑起來(lái)的。 針對(duì)漢語(yǔ)自然語(yǔ)言處理句法標(biāo)注環(huán)節(jié)“名·名”詞語(yǔ)串識(shí)別這一熱點(diǎn)和難點(diǎn)問(wèn)題,韓蕾編著的《現(xiàn)代漢語(yǔ)指人名詞研究(精)》提出,語(yǔ)料庫(kù)加工需對(duì)名詞進(jìn)行多層級(jí)分類(lèi)標(biāo)注(MCT),并制訂測(cè)試框架,采用句法語(yǔ)義一體化處理策略,建構(gòu)現(xiàn)代漢語(yǔ)指人名詞逐級(jí)分類(lèi)系統(tǒng)。本書(shū)在此基礎(chǔ)上,實(shí)現(xiàn)由詞項(xiàng)驅(qū)動(dòng)句法規(guī)則,即以具有典型分析意義的雙項(xiàng)指人名詞為代表,發(fā)現(xiàn)指人名詞同位組構(gòu)模式的連續(xù)統(tǒng)及內(nèi)部組構(gòu)條件;同時(shí)從大規(guī)模真實(shí)語(yǔ)料中提取對(duì)短語(yǔ)定界有用的外部確認(rèn)規(guī)則與否認(rèn)規(guī)則,考察詞語(yǔ)串鄰近詞語(yǔ)的屬性、一定的句式乃至篇章對(duì)雙名組構(gòu)的外部限制。這一設(shè)想最終可實(shí)現(xiàn)為一個(gè)基于轉(zhuǎn)換操作的計(jì)算機(jī)識(shí)別模型。
|