《傳奇學(xué)人林毅夫》為普通高等教育“十一五”國家級規(guī)劃教材,同時也是教育部高等學(xué)校統(tǒng)計學(xué)專業(yè)教學(xué)指導(dǎo)分委員會推薦教材!秱髌鎸W(xué)人林毅夫》努力貫徹“少而精”的原則,力求以統(tǒng)計思想為主線,以SPSS軟件為工具,深入淺出地介紹各種多元統(tǒng)計方法的理論和應(yīng)用。主要內(nèi)容包括:多元分析概述、多元正態(tài)分布的參數(shù)估計、多元正態(tài)分布均值向量和協(xié)差陣的檢驗(yàn)、判別分析、聚類分析、主成分分析、因子分析、相應(yīng)分析、典型相關(guān)分析、多維標(biāo)度法、多變量的可視化分析等。特別是,《傳奇學(xué)人林毅夫》將SPSS軟件的學(xué)習(xí)和案例分析有機(jī)結(jié)合,體現(xiàn)了多元統(tǒng)計分析方法的應(yīng)用。 《傳奇學(xué)人林毅夫》配備多媒體教學(xué)課件,可作為經(jīng)濟(jì)類、管理類各專業(yè)本科生教材,同時也適合自學(xué)多元統(tǒng)計分析的讀者閱讀參考。 作者簡介: 朱建平 目錄: 總序 第二版前言 第一版前言 第一章多元分析概述 第一節(jié)引言 第二節(jié)應(yīng)用背景 第三節(jié)計算機(jī)在統(tǒng)計分析中的應(yīng)用 思考與練習(xí) 第二章多元正態(tài)分布的參數(shù)估計 第一節(jié)引言 第二節(jié)基本概念 第三節(jié)多元正態(tài)分布 第四節(jié)多元正態(tài)分布的參數(shù)估計 第五節(jié)實(shí)例分析與計算機(jī)實(shí)現(xiàn) 思考與練習(xí)總序 第二版前言 第一版前言 第一章多元分析概述 第一節(jié)引言 第二節(jié)應(yīng)用背景 第三節(jié)計算機(jī)在統(tǒng)計分析中的應(yīng)用 思考與練習(xí) 第二章多元正態(tài)分布的參數(shù)估計 第一節(jié)引言 第二節(jié)基本概念 第三節(jié)多元正態(tài)分布 第四節(jié)多元正態(tài)分布的參數(shù)估計 第五節(jié)實(shí)例分析與計算機(jī)實(shí)現(xiàn) 思考與練習(xí) 第三章多元正態(tài)分布均值向量和協(xié)差陣的檢驗(yàn) 第一節(jié)引言 第二節(jié)均值向量的檢驗(yàn) 第三節(jié)協(xié)差陣的檢驗(yàn) 思考與練習(xí) 第四章判別分析 第一節(jié)引言 第二節(jié)距離判別法 第三節(jié)貝葉斯判別法 第四節(jié)費(fèi)希爾判別法 第五節(jié)實(shí)例分析與計算機(jī)實(shí)現(xiàn) 思考與練習(xí) 第五章聚類分析 第一節(jié)引言 第二節(jié)相似性的量度 第三節(jié)系統(tǒng)聚類分析法 第四節(jié)K均值聚類分析 第五節(jié)有序樣品的聚類分析法 第六節(jié)實(shí)例分析與計算機(jī)實(shí)現(xiàn) 思考與練習(xí) 第六章主成分分析 第一節(jié)引言 第二節(jié)主成分的幾何意義及數(shù)學(xué)推導(dǎo) 第三節(jié)主成分的性質(zhì) 第四節(jié)主成分方法應(yīng)用中應(yīng)注意的問題 第五節(jié)實(shí)例分析與計算機(jī)實(shí)現(xiàn) 思考與練習(xí) 第七章因子分析 第一節(jié)引言 第二節(jié)因子分析模型 第三節(jié)因子載荷矩陣求解 第四節(jié)公因子重要性的分析 第五節(jié)實(shí)例分析與計算機(jī)實(shí)現(xiàn) 思考與練習(xí) 第八章相應(yīng)分析 第一節(jié)引言 第二節(jié)列聯(lián)表 第三節(jié)相應(yīng)分析的基本理論 第四節(jié)相應(yīng)分析中應(yīng)注意的問題 第五節(jié)實(shí)例分析與計算機(jī)實(shí)現(xiàn) 思考與練習(xí) 第九章典型相關(guān)分析 第一節(jié)引言 第二節(jié)典型相關(guān)的基本理論 第三節(jié)樣本典型相關(guān)分析 第四節(jié)典型相關(guān)分析應(yīng)用中的幾個問題 第五節(jié)實(shí)例分析與計算機(jī)實(shí)現(xiàn) 思考與練習(xí) 第十章多維標(biāo)度法 第一節(jié)引言 第二節(jié)古典多維標(biāo)度法 第三節(jié)權(quán)重多維標(biāo)度 第四節(jié)實(shí)例分析與計算機(jī)實(shí)現(xiàn) 思考與練習(xí) 第十一章多變量的可視化分析 第一節(jié)引言 第二節(jié)折線圖分析法 第三節(jié)條形圖分析法 第四節(jié)散點(diǎn)圖分析法 第五節(jié)雷達(dá)圖分析法 第六節(jié)星座圖分析法 思考與練習(xí) 參考文獻(xiàn) 附錄常用統(tǒng)計表 附表1正態(tài)分布概率表 附表2t分布臨界值表 附表3χ2分布臨界值表 附表4F分布臨界值表 第一章多元分析概述 第一節(jié)引言 多元統(tǒng)計分析是運(yùn)用數(shù)理統(tǒng)計方法來研究解決多指標(biāo)問題的理論和方法。近30年來,隨著計算機(jī)應(yīng)用技術(shù)的發(fā)展和科研生產(chǎn)的迫切需要,多元統(tǒng)計分析技術(shù)被廣泛地應(yīng)用于地質(zhì)、氣象、水文、醫(yī)學(xué)、工業(yè)、農(nóng)業(yè)和經(jīng)濟(jì)等許多領(lǐng)域,已經(jīng)成為解決實(shí)際問題的有效方法。然而,隨著電子計算的日益普及,各行各業(yè)都開始采用計算機(jī)及相應(yīng)的信息技術(shù)進(jìn)行管理和決策,這使得各企事業(yè)單位生成、收集、存儲和處理數(shù)據(jù)的能力大大提高,數(shù)據(jù)量與日俱增,大量復(fù)雜信息層出不窮。在信息爆炸的今天,人們已經(jīng)意識到數(shù)據(jù)最值錢的時代已經(jīng)到來。顯然,大量信息在給人們帶來方便的同時也帶來了一系列問題。例如,信息量過大,超過了人們掌握、消化的能力;一些信息真?zhèn)坞y辨,從而給信息的正確應(yīng)用帶來困難;信息組織形式的不一致性導(dǎo)致難以對信息進(jìn)行有效統(tǒng)一的處理,等等,這種變化使傳統(tǒng)的數(shù)據(jù)庫技術(shù)和數(shù)據(jù)處理手段已經(jīng)不能滿足要求。Internet的迅猛發(fā)展,也使得網(wǎng)絡(luò)上的各種資源信息異常豐富,在其中進(jìn)行信息的查找真如大海撈針。這樣又對多元統(tǒng)計分析理論的發(fā)展和方法的應(yīng)用提出了新的挑戰(zhàn)。 多元統(tǒng)計分析起源于20世紀(jì)初,1928年Wishart發(fā)表論文?多元正態(tài)總體樣本協(xié)差陣的精確分布?,可以說是多元分析的開端。20世紀(jì)30年代R.A.Fisher、H.Hotelling、S.N.Roy、許寶?等人做了一系列的奠基性工作,使多元分析在理論上得到了迅速發(fā)展。40年代多元分析方法在心理、教育、生物等方面有不少應(yīng)用,但由于計算量大,使其發(fā)展受到影響,甚至停滯了相當(dāng)長的時間。50年代中期,隨著電子計算機(jī)的出現(xiàn)和發(fā)展,多元分析方法在地質(zhì)、氣象、醫(yī)學(xué)、社會學(xué)等方面得到廣泛的應(yīng)用。60年代通過應(yīng)用和實(shí)踐又完善、發(fā)展了理論,由于新的理論、新的方法不斷涌現(xiàn),又促使它的應(yīng)用范圍更加擴(kuò)大。70年代初期多元統(tǒng)計分析在我國才受到各個領(lǐng)域的極大關(guān)注,并在理論研究和應(yīng)用上也取得了很多顯著成績,有些研究工作已達(dá)到國際水平,并已形成一支科技隊伍,活躍在各條戰(zhàn)線上。在20世紀(jì)末與21世紀(jì)初,人們獲得的數(shù)據(jù)正在以前所未有的速度急劇增加,產(chǎn)生了很多超大型數(shù)據(jù)庫,遍及超級市場銷售、銀行存款、天文學(xué)、粒子物理、化學(xué)、醫(yī)學(xué)以及政府統(tǒng)計等領(lǐng)域,多元統(tǒng)計與人工智能和數(shù)據(jù)庫技術(shù)相結(jié)合,在經(jīng)濟(jì)、商業(yè)、金融、天文等領(lǐng)域得到了成功的應(yīng)用。 為了讓讀者更好、更系統(tǒng)地掌握多元統(tǒng)計分析的理論與方法,本書重點(diǎn)介紹多元正態(tài)總體的參數(shù)估計和假設(shè)檢驗(yàn)以及常用的統(tǒng)計方法。這些方法包括判別分析、聚類分析、主成分分析、因子分析、對應(yīng)分析、典型相關(guān)分析、多維標(biāo)度法以及多變量的可視化分析等。與此同時,我們將利用在我國廣泛流行的SPSS統(tǒng)計軟件來實(shí)現(xiàn)實(shí)證分析,做到在理論的學(xué)習(xí)中體會應(yīng)用,在應(yīng)用的分析中加深理論。 第二節(jié)應(yīng)用背景 統(tǒng)計方法是科學(xué)研究的一種重要工具,其應(yīng)用頗為廣泛。特別地,多元統(tǒng)計分析方法常常被應(yīng)用于自然科學(xué)、社會科學(xué)等領(lǐng)域的問題中。為了進(jìn)一步體現(xiàn)多元統(tǒng)計分析方法的應(yīng)用,我們首先從宏觀的角度認(rèn)識統(tǒng)計學(xué)應(yīng)用的背景,然后從微觀的角度顯示多元統(tǒng)計分析應(yīng)用的廣泛性。 一、統(tǒng)計學(xué)的生命力在于應(yīng)用 。ㄒ唬┙y(tǒng)計學(xué)產(chǎn)生于應(yīng)用統(tǒng)計學(xué)的發(fā)展過程可以看出統(tǒng)計學(xué)產(chǎn)生于應(yīng)用,在應(yīng)用的過程中發(fā)展,它的生命力在于應(yīng)用。 300年前,威廉?配第(1623~1687)寫的?政治算術(shù)?,從其研究方法看,被認(rèn)為是一本統(tǒng)計學(xué)著作。政治算術(shù)學(xué)派的統(tǒng)計學(xué)家將統(tǒng)計方法應(yīng)用于各自熟悉和感興趣的研究領(lǐng)域,都還是把其應(yīng)用對象當(dāng)做肯定性事物之間的聯(lián)系來進(jìn)行研究的。 他們確信,事物現(xiàn)象存在著簡單明了的數(shù)量關(guān)系,需要用定性與定量的方法將這種關(guān)系(規(guī)律)揭示或描述出來,使人們能夠更具體、真切地認(rèn)識世界。 數(shù)理統(tǒng)計學(xué)派的奠基人凱特勒在統(tǒng)計學(xué)中引入了概率論,把它應(yīng)用于自然界和社會的許多方面,從而為人們認(rèn)識和說明不確定現(xiàn)象及其相互之間的聯(lián)系開辟出了一條道路。在自然科學(xué)和社會科學(xué)的許多領(lǐng)域,都留下凱特勒應(yīng)用統(tǒng)計學(xué)研究的烙印。自從凱特勒把概率論引入了應(yīng)用中的統(tǒng)計學(xué),人們對客觀世界的認(rèn)識及描述更全面、更接近于實(shí)際了。他在廣泛應(yīng)用拉普拉斯等人概率論中的正態(tài)曲線、誤差法則、大數(shù)法則等成果的過程中,為統(tǒng)計學(xué)增添了數(shù)理統(tǒng)計方法,進(jìn)而又?jǐn)U展了統(tǒng)計學(xué)的應(yīng)用范圍。 在應(yīng)用中對發(fā)展統(tǒng)計方法貢獻(xiàn)顯著的當(dāng)推生物統(tǒng)計學(xué)派的戈爾登(1822~1921)、皮爾遜(1857~1936)和農(nóng)業(yè)實(shí)驗(yàn)學(xué)派的孟德爾(1822~1884)、戈塞特(1876~1937)等。戈爾登六年中測量了近萬人的“身高、體重、闊度、呼吸力、拉力和壓力、手擊的速率、聽力、視力、色覺及個人的其他資料”。在探究這些數(shù)據(jù)內(nèi)在聯(lián)系的過程中提出了今天在自然科學(xué)和社會科學(xué)領(lǐng)域中廣泛應(yīng)用的“相關(guān)”思想。 他將大量數(shù)據(jù)加以綜合描述和比較,從而能使其遺傳理論建立在比較精確的基礎(chǔ)上,并為統(tǒng)計學(xué)引入了中位數(shù)、四分位數(shù)、分布、回歸等極為重要的概念和方法。皮爾遜在檢驗(yàn)他老師戈爾登的“祖先遺傳法則”和自然選擇中“淘汰”對器官的相關(guān)及變異的影響中,導(dǎo)入了復(fù)相關(guān)的概念和方法。在討論生物退化、反祖、遺傳、隨機(jī)交配等問題中,展開了回歸與相關(guān)的研究,并提出以χ2檢驗(yàn)作為曲線配合適合度的一種量度的思想。 農(nóng)業(yè)實(shí)驗(yàn)學(xué)派的孟德爾和戈塞特同樣是在嘗試回答各自應(yīng)用領(lǐng)域中出現(xiàn)的新問題的過程中,發(fā)展了統(tǒng)計思想和統(tǒng)計分析方法。孟德爾及其后繼者貝特森等人創(chuàng)建的遺傳試驗(yàn)手段,比通過記錄生命外部聯(lián)系曲折反映事物內(nèi)在本質(zhì)的描述統(tǒng)計更加深刻。他們運(yùn)用推斷的理論與實(shí)驗(yàn)的方法,通常只用小樣本來處理。戈塞特的t分布與小樣本思想更是在由于“有些實(shí)驗(yàn)不能多次地進(jìn)行”,從而“必須根據(jù)極少數(shù)的事例(小樣本)來判斷實(shí)驗(yàn)結(jié)果的正確性”的情況下產(chǎn)生的。今天,這些統(tǒng)計思想和分析推斷方法已經(jīng)成為了科學(xué)家們不可缺少的基本研究工具。 近現(xiàn)代,統(tǒng)計學(xué)已經(jīng)空前廣泛應(yīng)用于最高級的運(yùn)動形式――社會,其結(jié)果便是出現(xiàn)了一系列與其應(yīng)用對象指導(dǎo)理論和其他相關(guān)學(xué)科交織在一起的邊緣學(xué)科,如在社會經(jīng)濟(jì)方面的投入產(chǎn)出經(jīng)濟(jì)學(xué)、經(jīng)濟(jì)計量學(xué)、統(tǒng)計預(yù)測學(xué)、統(tǒng)計決策學(xué)等。在這些邊緣學(xué)科中,統(tǒng)計學(xué)與其應(yīng)用對象結(jié)合更緊密、更自然。這些學(xué)科的專家學(xué)者至少在兩個或兩個以上的專業(yè)領(lǐng)域里有比較深厚的學(xué)術(shù)造詣。統(tǒng)計學(xué)的應(yīng)用幫助他們在各自的應(yīng)用領(lǐng)域中取得輝煌的成就。 可見,統(tǒng)計學(xué)的發(fā)展一刻也離不開應(yīng)用。它在應(yīng)用中誕生,在應(yīng)用中成熟、獨(dú)立,在應(yīng)用中擴(kuò)充自身的方法內(nèi)容,同時擴(kuò)展了應(yīng)用領(lǐng)域,又在應(yīng)用中與其他學(xué)科緊密結(jié)合形成新的邊緣學(xué)科。一部統(tǒng)計理論發(fā)展史同時又是一部應(yīng)用統(tǒng)計發(fā)展史,正因如此,統(tǒng)計學(xué)的生命力在于應(yīng)用。 。ǘ├碚撗芯繛榻y(tǒng)計學(xué)的應(yīng)用奠定了基礎(chǔ) 統(tǒng)計理論問題的研究和應(yīng)用研究從總體看,如果理論不成熟,方法不完善,統(tǒng)計應(yīng)用研究也很難達(dá)到較高的水平。因此,充分發(fā)揮統(tǒng)計學(xué)的生命力,必須建立在統(tǒng)計理論研究的基礎(chǔ)之上。 從國際上看,近十幾年來,統(tǒng)計分析技術(shù)的研究有了新的發(fā)展。這些研究的總體特征是,廣泛吸收和融合相關(guān)學(xué)科的新理論,不斷開發(fā)應(yīng)用新技術(shù)和新方法,深化和豐富了統(tǒng)計學(xué)傳統(tǒng)領(lǐng)域的理論與方法研究,并拓展了統(tǒng)計研究的新領(lǐng)域。這些都充分地體現(xiàn)了統(tǒng)計學(xué)強(qiáng)有力的生命力,其具體表現(xiàn)在:第一,統(tǒng)計學(xué)和計算機(jī)科學(xué)相互促進(jìn)。通過計算機(jī)協(xié)助的電子通信、網(wǎng)絡(luò)創(chuàng)新、資源及信息統(tǒng)計中的統(tǒng)計軟件等,在統(tǒng)計信息搜集、存儲和傳遞過程中利用計算機(jī)提高工作效能,使統(tǒng)計信息時空結(jié)構(gòu)有了新的發(fā)展。在網(wǎng)絡(luò)推斷、統(tǒng)計軟件包、統(tǒng)計建模中的計算機(jī)診斷等方面,提出了統(tǒng)計思想直接轉(zhuǎn)化為計算機(jī)軟件,通過軟件對統(tǒng)計過程實(shí)行控制,以及利用計算機(jī)程序識別模型、改善估計量性質(zhì)的新方法。這些研究成果使人們興奮地看到計算機(jī)技術(shù)正在促使統(tǒng)計科研工作發(fā)生革命性變化。在軟件的質(zhì)量評估和統(tǒng)計程序及方法對軟件可靠性的檢驗(yàn)等方面也有了新的發(fā)展。 第二,統(tǒng)計理論與分析方法的新發(fā)展。近年來,統(tǒng)計方法成果豐碩,反映了統(tǒng)計理論與分析方法在不斷的發(fā)展中趨于成熟和完善。在貝葉斯方法、非線性時間序列、多元分析、統(tǒng)計計算、線性模型、穩(wěn)健估計、極值統(tǒng)計、混沌理論及統(tǒng)計檢驗(yàn)等方面,內(nèi)容廣泛而翔實(shí),可以歸納為三個方面:①理論上有新的開拓。如應(yīng)用混沌理論提出混沌動態(tài)系統(tǒng)、混沌似然分析;引入數(shù)學(xué)中象分析、譜分析的方法,探討象分析中同步模型化的方法,建立經(jīng)驗(yàn)譜類函數(shù)的假設(shè)檢驗(yàn)方法等;②不同的分析方法相互滲透、交叉結(jié)合運(yùn)用,衍生新的分析方法。如馬爾可夫鏈,蒙特卡羅方法在葉貝斯似然計算中的應(yīng)用,參數(shù)估計方法的非參數(shù)校正,狀態(tài)空間模型與月份時間序列的結(jié)合運(yùn)用等;③借助現(xiàn)代計算機(jī)技術(shù)活躍新的研究領(lǐng)域。在計算機(jī)技術(shù)迅速發(fā)展的帶動下,模擬計算理論和方法有了長足的發(fā)展,這給非線性模型等因計算煩瑣而沉悶多時的研究領(lǐng)域注入了新的活力,提出了非線性結(jié)構(gòu)方程模型的特征向量估計方法,非線性回歸中的截面有效性逼近,帶噪聲的非線性時間序列的識別等富有見地的新思路。Logistic模型、向量時間序列模型的研究也因計算技術(shù)的解決而不乏新成果。 第三,統(tǒng)計調(diào)查方法與記述的創(chuàng)新。調(diào)查方法是統(tǒng)計方法論的重要組成部分,近年來,在抽樣理論與方法、抽樣調(diào)查、實(shí)驗(yàn)設(shè)計等方面如何改進(jìn)調(diào)查技術(shù)、減少抽樣誤差等問題是人們十分關(guān)心的。在調(diào)查過程的綜合管理、不等概率抽樣設(shè)計、分層總體的樣本分配、抽樣比例的回歸分析和實(shí)驗(yàn)設(shè)計正交數(shù)組的構(gòu)造方法等方面也有了新見解。再抽樣及隨機(jī)加權(quán)方法、隨機(jī)模型及連續(xù)調(diào)查報告的趨勢計量、輔助信息和抽樣方法等,則涉及多種統(tǒng)計分析和計算方法的應(yīng)用,在轉(zhuǎn)換樣本調(diào)查設(shè)計等方面也取得了一定成果,計算機(jī)輔助調(diào)查也有了新的發(fā)展。 眾所周知,理論來源于實(shí)踐,反過來又服務(wù)于實(shí)踐。統(tǒng)計理論的研究和分析技術(shù)的發(fā)展,無疑對統(tǒng)計的實(shí)踐起到了一定的指導(dǎo)作用。從另一角度也顯示出統(tǒng)計理論和分析技術(shù)的不斷完善,為統(tǒng)計學(xué)的應(yīng)用奠定了基礎(chǔ),確保了統(tǒng)計學(xué)強(qiáng)大的生命力。 二、多元統(tǒng)計分析方法的應(yīng)用 這里我們要通過一些實(shí)際的問題,解釋選擇統(tǒng)計方法和研究目的之間的關(guān)系,這些問題以及本書中的大量案例能夠使讀者對多元統(tǒng)計分析方法在各個領(lǐng)域中的廣泛應(yīng)用有一定的了解。多元分析方法從研究問題的角度可以分為不同的類,相應(yīng)有具體解決問題的方法,參看表1.1。 多元統(tǒng)計分析方法在經(jīng)濟(jì)管理、農(nóng)業(yè)、醫(yī)學(xué)、教育學(xué)、體育科學(xué)、生態(tài)學(xué)、地質(zhì)學(xué)、社會學(xué)、考古學(xué)、環(huán)境保護(hù)、軍事科學(xué)、文學(xué)等方面都有廣泛的應(yīng)用,這里我們列舉一些實(shí)際問題,進(jìn)一步了解多元統(tǒng)計分析的應(yīng)用領(lǐng)域,讓讀者從感性上加深對多元統(tǒng)計分析的認(rèn)識。 (1)城鎮(zhèn)居民消費(fèi)水平通常用八項(xiàng)指標(biāo)來描述,如人均糧食支出、人均副食支出、人均煙酒茶支出、人均衣著商品支出、人均日用品支出、人均燃料支出、人均非商品支出。這八項(xiàng)指標(biāo)存在一定的線性關(guān)系。為了研究城鎮(zhèn)居民的消費(fèi)結(jié)構(gòu),需要將相關(guān)強(qiáng)的指標(biāo)歸并到一起,這實(shí)際就是對指標(biāo)進(jìn)行聚類分析。 。2)在企業(yè)經(jīng)濟(jì)效益的評價中,涉及的指標(biāo)往往很多,如百元固定資產(chǎn)原值實(shí)現(xiàn)產(chǎn)值、百元固定資產(chǎn)原值實(shí)現(xiàn)利稅、百元資金實(shí)現(xiàn)利稅、百元工業(yè)總產(chǎn)值實(shí)現(xiàn)利稅、百元銷售收入實(shí)現(xiàn)利稅、每噸標(biāo)準(zhǔn)煤實(shí)現(xiàn)工業(yè)產(chǎn)值、每千瓦時電力實(shí)現(xiàn)工業(yè)產(chǎn)值、全員勞動生產(chǎn)率、百元流動資金實(shí)現(xiàn)產(chǎn)值。如何將這些具有錯綜復(fù)雜關(guān)系的指標(biāo)綜合成幾個較少的因子,既有利于對問題進(jìn)行分析和解釋,又能便于抓住主要矛盾做出科學(xué)的評價,可用主成分分析和因子分析法。 。3)某一產(chǎn)品是用兩種不同原料生產(chǎn)的,試問此兩種原料生產(chǎn)的產(chǎn)品壽命有無顯著差異?又比如,若考察某商業(yè)行業(yè)今年和去年的經(jīng)營狀況,這時需要看這兩年經(jīng)營指標(biāo)的平均水平是否有顯著差異以及經(jīng)營指標(biāo)之間的波動是否有顯著差異。可用多元正態(tài)總體均值向量和協(xié)差陣的假設(shè)檢驗(yàn)。 (4)按現(xiàn)行統(tǒng)計報表制度,農(nóng)村家庭純收入是指農(nóng)村常住居民家庭總收入中扣除從事生產(chǎn)和非生產(chǎn)經(jīng)營用支出、稅款和上交承包集體任務(wù)金額以后剩余的、可直接用于進(jìn)行生產(chǎn)、非生產(chǎn)性建設(shè)投資、生產(chǎn)性消費(fèi)的那一部分收入。如果我們收集某年各個省、自治區(qū)、直轄市農(nóng)民家庭人均純收入的數(shù)據(jù),可以用相應(yīng)分析,揭示全國農(nóng)民人均純收入的特征以及各省、自治區(qū)、直轄市與各收入指標(biāo)的關(guān)系。 。5)某醫(yī)院已有100個分別患有胃炎、肝炎、冠心病、糖尿病等病的病人資料,分別記錄了他們每個人的若干項(xiàng)癥狀指標(biāo)數(shù)據(jù)。如果對于一個新病人也測得這若干項(xiàng)癥狀指標(biāo)時,可以利用判別分析方法判定他患的是哪種病。 。6)有100種酒,品嘗家可以對每兩種酒進(jìn)行品嘗對比,給出一種相近程度的得分(越相近得分越高,相差越遠(yuǎn)得分越低),希望用這些得分?jǐn)?shù)據(jù)來了解這100種酒之間的結(jié)構(gòu)關(guān)系。這樣的問題就可以用多維標(biāo)度法來解決。 。7)在地質(zhì)學(xué)中,常常要研究礦石中所含化學(xué)成分之間的關(guān)系。設(shè)在某礦體中采集了60個標(biāo)本,對每個標(biāo)本測得20個化學(xué)成分的含量。我們希望通過對這20個化學(xué)成分的分析,了解礦體的性質(zhì)和礦體形成的主要原因。 。8)在生態(tài)學(xué)的研究中,對1000個類似的魚類樣本,我們可以利用聚類分析方法根據(jù)測量的特征如體重、身長、鰭數(shù)、鰭長、頭寬等,將這類魚分成幾個不同品種。 (9)考古學(xué)家通過挖掘出來的人頭蓋骨的高、寬等特征來判斷是男或女;根據(jù)挖掘出的動物牙齒的有關(guān)測試指標(biāo),判別它是屬于哪一類動物牙齒,是哪一個時代的。 。10)在高考招生工作中,我們知道每個考生的基本情況,通過分析,我們不僅可以了解到學(xué)生喜歡學(xué)習(xí)的科目,還可以進(jìn)一步從考生每門課程的成績分析出學(xué)生的邏輯思維能力、形象思維能力和記憶力等因素對學(xué)習(xí)成績的影響。 第三節(jié)計算機(jī)在統(tǒng)計分析中的應(yīng)用 一、加強(qiáng)計算機(jī)統(tǒng)計應(yīng)用教學(xué) 從統(tǒng)計學(xué)產(chǎn)生和發(fā)展的歷史我們可以看到,統(tǒng)計數(shù)據(jù)的收集、整理、加工、分析的過程中,對統(tǒng)計學(xué)的繁榮發(fā)展起決定性作用的工具就是高速的計算工具――計
|