我們在《機(jī)器學(xué)習(xí)里,數(shù)學(xué)究竟多重要?》一文中提供了機(jī)器學(xué)習(xí)所需的數(shù)學(xué)知識和建議,對于初學(xué)者來說,并不需要先掌握大量的數(shù)學(xué)知識再開始做機(jī)器學(xué)習(xí)。學(xué)習(xí)最基本的線性代數(shù)和數(shù)理統(tǒng)計,然后在掌握更多技術(shù)和算法的過程中繼續(xù)學(xué)習(xí)數(shù)學(xué)是很好的方法。那么,本文帶來值得推薦的數(shù)學(xué)基礎(chǔ)書籍。 “機(jī)器學(xué)習(xí)/深度學(xué)習(xí)并不需要很多數(shù)學(xué)基礎(chǔ)!”也許你在不同的地方聽過不少類似這樣的說法。對于鼓勵數(shù)學(xué)基礎(chǔ)不好的同學(xué)入坑機(jī)器學(xué)習(xí)來說,這句話是挺不錯的。不過,機(jī)器學(xué)習(xí)理論是與統(tǒng)計學(xué)、概率論、計算機(jī)科學(xué)、算法等方面交叉的領(lǐng)域,對這些技術(shù)有一個全面的數(shù)學(xué)理解對理解算法的內(nèi)部工作機(jī)制、獲取好的結(jié)果是有必要的。機(jī)器學(xué)習(xí)確實需要對一些數(shù)學(xué)領(lǐng)域有深入理解,缺乏必要的數(shù)學(xué)知識,很可能在更深入的學(xué)習(xí)中不斷遇到挫折,甚至導(dǎo)致放棄。 機(jī)器學(xué)習(xí)需要的數(shù)學(xué)主要包括: 線性代數(shù) 概率論與數(shù)理統(tǒng)計 多元微積分 算法和復(fù)雜性優(yōu)化 其他 那么,了解機(jī)器學(xué)習(xí)這樣一個跨學(xué)科領(lǐng)域,需要多高的數(shù)學(xué)水平?答案是多方面的,取決于個人水平和興趣。至于在機(jī)器學(xué)習(xí)中各方面的數(shù)學(xué)知識的重要性,可以用下面的圖表表示: 機(jī)器學(xué)習(xí)中各數(shù)學(xué)主題的重要性 上圖中,“線性代數(shù)”和“概率論與數(shù)理統(tǒng)計”占比達(dá)到60%,可見它們既是必要、也是十分重要的數(shù)學(xué)知識。下面針對這兩個領(lǐng)域,推薦一些廣受好評的書籍。 《線性代數(shù)導(dǎo)論》 Introduction to Linear Algebra (5th Ed.) 作者:Gilbert Strang 這本教材是Gilbert Strang教授在MIT講授《線性代數(shù)》課程的指定教材(MIT OpenCourseWare提供公開課視頻),也是被很多其他大學(xué)選用的經(jīng)典教材。這本教材難度適中,講解清晰,對許多核心概念的討論也很透徹,在國內(nèi)國外都廣受好評。 Gilbert Strang 教授是美國享有盛譽(yù)的數(shù)學(xué)家,在有限元理論、變分法、小波分析及線性代數(shù)方面均有所建樹。他對教育的貢獻(xiàn)尤為卓著,包括所著有的七部經(jīng)典數(shù)學(xué)教材和一部專著。 Strang 自1962年至今擔(dān)任麻省理工大學(xué)教授,其所授課程《線性代數(shù)導(dǎo)論》、《計算科學(xué)與工程》均在 MIT開放課程軟件(MIT OpenCourseWare)中收錄,獲得廣泛好評。 雖然該書似乎仍沒有正式的中文版出版(如果有了請告訴我們),不過可以對照視頻講解學(xué)習(xí)。學(xué)過的同學(xué)的建議是,一定要做課后習(xí)題。 線性代數(shù)及其應(yīng)用 作者:David C. Lay Lay 的《線性代數(shù)及其應(yīng)用》同樣是一本經(jīng)典教材,中文版已出到第3版。除了講解數(shù)學(xué)知識外,該書的特色是介紹一些有趣的應(yīng)用,幫助學(xué)習(xí)者掌握線性代數(shù)基本概念和應(yīng)用技巧,為后續(xù)課程的學(xué)習(xí)和工作實踐奠定基礎(chǔ)。 《統(tǒng)計學(xué)習(xí)方法》 作者:李航 李航老師的《統(tǒng)計學(xué)習(xí)方法》對于中國學(xué)習(xí)者來說也是非常熟悉的數(shù)學(xué)參考書。李航的研究方向包括信息檢索、自然語言處理、統(tǒng)計機(jī)器學(xué)習(xí)及數(shù)據(jù)挖掘,這本書被用于部分高校文本數(shù)據(jù)挖掘、信息檢索及自然語言處理等專業(yè)的教材。 《深度學(xué)習(xí)》(Deep Learning) 作者:Ian Goodfellow, Yoshua Bengio, Aaron Courville 這本“花書”的中文版發(fā)售沒幾天便要加印,被譽(yù)為深度學(xué)習(xí)“圣經(jīng)”,可見其熱門。三位作者都是深度學(xué)習(xí)領(lǐng)域的“大!,這本書也確實被公認(rèn)寫得很好,不少讀者在中文版出版前勤勤懇懇地打印出開源譯本來學(xué)習(xí)。 數(shù)學(xué)方面,《深度學(xué)習(xí)》的第2—4章非常詳細(xì)地解釋了深度學(xué)習(xí)中所需的線性代數(shù)、概率分布、數(shù)值計算等數(shù)學(xué)知識,值得認(rèn)真研讀。
|