作品介紹

語言與數(shù)學


作者:馮志偉     整理日期:2017-02-24 16:33:21


  如何實現(xiàn)語言的機器翻譯?如何從海量的語言文字中抽取有用信息?如何利用自然語言進行人機對話?自然語言與計算機程序語言是否一致?如何自動合成語音……信息時代對自然語言的處理使語言學與數(shù)學緊密結(jié)合在一起。
  作者從事計算語言學研究幾十年,潛心探索出語言符號的七種新特性。本書詳細論述了這七種特性與數(shù)學的關系,反映了當前國內(nèi)外語言與數(shù)學關系研究方面的最新成果。
  -------
  語言符號的隨機性與統(tǒng)計數(shù)學
  語言符號的冗余性與隨機過程
  語言符號的離散性與集合論
  語言符號的遞歸性與公理化方法
  語言符號的層次性與圖論
  語言符號的非單元性與復雜特征的運算
  語言符號的模糊性與模糊數(shù)學

目錄:
  信息時代語言學研究的基礎——讀《語言與數(shù)學》有感
  再版前言
  緒言——語言學是數(shù)學和人文科學之間的橋梁
  第一章 語言符號的隨機性與統(tǒng)計數(shù)學
  第1節(jié) 語言符號的隨機性
  第2節(jié) 字頻和詞頻的統(tǒng)計
  第3節(jié) 語音統(tǒng)計研究
  第4節(jié) 方言研究中的統(tǒng)計方法
  第5節(jié) 計算風格學
  第6節(jié) 古代語言研究中的統(tǒng)計方法
  第二章 隨機過程與語言符號的冗余性
  第1節(jié) 語言的使用與馬爾可夫鏈
  第2節(jié) 語言的熵和語言符號的冗余性
  第三章 語言符號的離散性與集合論
  第1節(jié) 語言符號的離散性
  第2節(jié) 語言的集合論模型
  第四章 語言符號的遞歸性與公理化方法
  第1節(jié) 語言符號的遞歸性
  第2節(jié) 生成語法的公理化方法
  第五章 語言符號的層次性
  第1節(jié) 語言符號的層次性
  第2節(jié) 樹形圖
  第六章 語言符號的非單元性與復雜特征的運算
  第1節(jié) 語言符號的非單元性
  第2節(jié) 復雜特征的運算
  第七章 語言符號的模糊性與模糊數(shù)學
  第1節(jié) 語言符號的模糊性
  第2節(jié) 模糊數(shù)學在語言研究中的應用
  附錄:胡耀邦同志鼓勵我研究數(shù)理語言學
  1989年,當時的北京大學校長丁石孫教授決定出版一套《數(shù)學·我們·數(shù)學》的叢書,內(nèi)容包括“數(shù)學與經(jīng)濟”、“數(shù)學與軍事”、“數(shù)學與教育”、“數(shù)學與語言”等許多方面,丁石孫校長委托北京大學數(shù)學系馬希文教授找我,希望我寫一本《數(shù)學與語言》。我是一個語言學工作者,當時正從事機器翻譯和信息檢索等應用系統(tǒng)的開發(fā)研究,接觸到不少語言學中的數(shù)學方法問題,對于數(shù)學與語言之間關系的問題作過一些思考,因此,我欣然接受了丁石孫教授的這個任務,歷時兩年,寫成了這本《數(shù)學與語言》專著,于1991年出版。
  在這本專著中,我從數(shù)學的角度,對于自然語言的性質(zhì)進行了深入的思考,明確地指出,除了索緒爾過去提出的語言符號的任意性之外,語言符號還具有另外7個明顯的特性,它們是:語言符號的隨機性、語言符號的冗余性、語言符號的離散性、語言符號的遞歸性、語言符號的層次性、語言符號的非單元性、語言符號的模糊性。我提出的語言符號的這7個新的特性,顯然補充了索緒爾關于語言符號任意性的思想,使我們對于語言符號的特性有了更加深刻的認識。
  我在本書中提出語言符號的這7個新的特性之后,引起了許多語言學家的關注,有的語言學家指出,語言符號的這7個特性,反映了“信息時代的語言觀”。語言學家劉海濤在本書的書評中指出,語言符號的這7個特性應當成為“信息時代語言學研究的基礎”,并指出,本書“值得每一位語言工作者研讀”。19年過去了,我提出的語言符號這7個特性的“語言觀”仍然顯得很有生命力,越來越多的事實將會繼續(xù)證明這種“語言觀”的正確性。
  本書在1991年出版時只印了1400冊,早已銷售一空。不少讀者盡管聽說過此書,但是,踏破鐵鞋無覓處,根本買不到此書。
  總之,電子計算機的出現(xiàn)和廣泛使用,就像催化劑一樣促進了數(shù)學和語言學的結(jié)合。數(shù)學滲透到了形態(tài)學、句法學、詞匯學、語音學、文字學、語義學等語言學的各個分支部門,促進了語言學的數(shù)學化。而語言學的數(shù)學化則是語言學現(xiàn)代化的一個重要內(nèi)容,這些內(nèi)容被概括在“數(shù)理語言學”(mathematieal linguistics)這個新興學科中,并得到了迅速的發(fā)展。
  1955年,美國哈佛大學首先創(chuàng)辦了數(shù)理語言學討論班,1957年正式開設了數(shù)理語言學課程。接著,麻省理工學院、密歇根大學、賓夕法尼亞大學、印第安納大學、加利福尼亞大學都相繼開設了數(shù)理語言學課程。同年,日本成立了計量語言學會,創(chuàng)辦了數(shù)理語言學雜志《計量國語學》,德國的波恩大學也開設了數(shù)理語言學課程,蘇聯(lián)在莫斯科大學、列寧格勒大學及莫斯科國立第一外國語師范學院也進行了數(shù)理語言學的研究工作。1958年,莫斯科大學、高爾基大學、薩拉托夫大學、托姆斯克大學,分別給數(shù)學系及語文系的學生開設了數(shù)理語言學的選修課,并在列寧格勒大學設置了數(shù)理語言學專業(yè)。
  此外,羅馬尼亞、匈牙利、捷克、英國、法國、挪威、波蘭、瑞典等國,都先后開展了數(shù)理語言學的研究工作,有的國家還創(chuàng)辦了專門的刊物,成立了專門的研究機構(gòu)。
  我國從20世紀50年代起便開展了數(shù)理語言學的研究工作。1982年,北京大學中文系給漢語專業(yè)的學生開設了《語言學中的數(shù)學問題》的選修課,首先在我國開設了數(shù)理語言學方面的課程。①1985年,上海知識出版社出版了我國的第一本數(shù)理語言學專著——《數(shù)理語言學》。數(shù)學的定量的研究方法已逐漸受到我國傳統(tǒng)的語言學家們的注意,并開始用到他們的研究工作中去,在用數(shù)學方法研究漢語的句子結(jié)構(gòu)、漢字頻率統(tǒng)計、漢語單詞頻率統(tǒng)計、頻率詞典的編制、方言定量分析、漢字熵值測定等方面,都取得一定的成績。
  數(shù)理語言學的研究常常要用電子計算機作為工具,因此,它與計算語言學的研究是聯(lián)系在一起的。當前,數(shù)理語言學與計算語言學有合流的傾向。這清楚地說明,語言學、數(shù)學、計算機科學有著不解之緣。





上一本:華羅庚文集代數(shù)卷II 下一本:數(shù)學欣賞

作家文集

下載說明
語言與數(shù)學的作者是馮志偉,全書語言優(yōu)美,行文流暢,內(nèi)容豐富生動引人入勝。為表示對作者的支持,建議在閱讀電子書的同時,購買紙質(zhì)書。

更多好書