近年來,語言變體研究受到了計(jì)算語言學(xué)界的廣泛關(guān)注。本書從人工智能技術(shù)和語言變體相結(jié)合的視角,結(jié)合自然語言處理、機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、語音識別、語料庫語言學(xué)等相關(guān)技術(shù),以作者的一系列研究成果為內(nèi)容主線,系統(tǒng)介紹語言變體(相似語言)研究的語料庫構(gòu)建及計(jì)算模型。全書共9章,探索了相似語言及變體語料庫的構(gòu)建規(guī)范、多模態(tài)語音和文本)語料庫的標(biāo)注、語言變體文字和語音處理的計(jì)算模型。本書對相似語言及語言變體中的關(guān)鍵技術(shù)進(jìn)行較為深入的研究,提出相關(guān)問題的一些解決方法,并設(shè)計(jì)相應(yīng)的算法和實(shí)驗(yàn)。實(shí)驗(yàn)表明,本書提出的這些方法有助于提高相似語言的分析性能,同時(shí)減少對大規(guī)模語料庫的依賴性,為今后的相似語言變體分析研究奠定了重要基礎(chǔ),為同類研究提供了參考。 本書可作為從事自然語言處理、計(jì)算語言學(xué)、數(shù)據(jù)挖掘研究的科研、管理等相關(guān)人員的參考書,也可供高等院校語言學(xué)、智能科學(xué)與技術(shù)、管理科學(xué)與工程等教育類、信息類和管理類相關(guān)研究生及本科生使用。
|