本文定量考察漢語常見篇章銜接標(biāo)記在書面話語中的連貫用法。首先根據(jù)修辭結(jié)構(gòu)理論(Rhetorical Structure Theory,RST),設(shè)立了漢語修辭關(guān)系集以及關(guān)系優(yōu)選協(xié)議,按標(biāo)注流程開發(fā)出漢語財(cái)經(jīng)評論修辭結(jié)構(gòu)樹庫。接著為各類銜接標(biāo)記在該篇章語料庫中的分布和用法設(shè)立多個特征變量,展開形式、句法、語義和語用標(biāo)注。隨后利用樹庫和標(biāo)注語料,對特定銜接標(biāo)記展開深入的個案分析,探討其篇章分布與語用連貫作用之間的相關(guān)性。最后嘗試?yán)勉暯訕?biāo)記及其所在篇章單元的形式特征,通過機(jī)器學(xué)習(xí)方法來自動判定所在篇章單元間的修辭連貫關(guān)系,測試結(jié)果較令人滿意。本文最后也討論了對人工標(biāo)注質(zhì)量的理解,以及數(shù)據(jù)挖掘技術(shù)在語言學(xué)研究中的應(yīng)用前景。 樂明,浙江大學(xué)副教授、“求是青年學(xué)者”。曾師從馮志偉研究員,于2006年獲中國傳媒大學(xué)語言學(xué)及應(yīng)用語言學(xué)博士,研究方向?yàn)橛?jì)算語言學(xué)。2011年在美國新墨西哥大學(xué)語言學(xué)系訪問,師從Joan Bybee教授,研究方向?yàn)檎Z法化理論。已發(fā)表多篇AHCI/CSSCI/SCI/SSCI語言學(xué)論文,負(fù)責(zé)完成國家社科基金青年項(xiàng)目一項(xiàng)及省部級項(xiàng)目兩項(xiàng)。 目前主要的研究方向是語言資源的開發(fā)和利用,重點(diǎn)關(guān)注關(guān)聯(lián)詞語和人稱代詞在各類自然語篇中的分布和功能,通過制定詳細(xì)的工作手冊和標(biāo)注規(guī)范,指導(dǎo)篇章語料庫的構(gòu)建以及目標(biāo)詞語在,語料庫中的多維度標(biāo)注,在此基礎(chǔ)上用進(jìn)行量化的語言學(xué)本體研究。
|