本書以數(shù)據(jù)的常用統(tǒng)計分析方法為基礎(chǔ),在簡明扼要的闡述統(tǒng)計學(xué)基本概念、基本思想與基本方法的基礎(chǔ)上,講述與之相對應(yīng)的R函數(shù)的實現(xiàn),并通過具體的例子說明統(tǒng)計問題求解的過程。內(nèi)容上不僅包括了基礎(chǔ)統(tǒng)計分析中的探索性數(shù)據(jù)分析,參數(shù)估計與假設(shè)檢驗,還包括了非參數(shù)統(tǒng)計分析的常用方法、多元統(tǒng)計分析方法及貝葉斯統(tǒng)計分析方法。
通過《R語言與統(tǒng)計分析》,讀者不僅可以快速學(xué)會R的基本原理與核心內(nèi)容,而且可以根據(jù)書中的例子與例子中的R程序?qū)W會解決問題的統(tǒng)計計算方法與基本的編程技術(shù),為解決更為復(fù)雜的統(tǒng)計問題奠定扎實的基礎(chǔ)。
統(tǒng)計學(xué)的任務(wù)是研究有關(guān)收集、整理、分析數(shù)據(jù),從而對所考察的問題作出統(tǒng)計推斷。作為一門科學(xué),統(tǒng)計學(xué)有其堅實的理論基礎(chǔ),研究統(tǒng)計學(xué)方法的理論基礎(chǔ)問題的那一部分,構(gòu)成了所謂數(shù)理統(tǒng)計學(xué)的內(nèi)容。其次,統(tǒng)計學(xué)就其本質(zhì)來講,是一門實用性很強的科學(xué),它在人類活動的各個領(lǐng)域有著廣泛的應(yīng)用。因此數(shù)理統(tǒng)計的理論與方法應(yīng)該與實際相結(jié)合,解決社會、經(jīng)濟、工農(nóng)業(yè)生產(chǎn)、生物制藥、航空航天、質(zhì)量管理、環(huán)境資源等領(lǐng)域中的各種問題。最后,統(tǒng)計學(xué)又是一門技術(shù)性很強的科學(xué),由于所研究的問題越來越復(fù)雜、變量之間關(guān)聯(lián)性越來越強、數(shù)據(jù)的規(guī)模越來越大,使得原有的計算方法無法順利實現(xiàn),F(xiàn)在,隨著計算機的不斷發(fā)展與普及,特別是近20年來統(tǒng)計計算的突破性進展及統(tǒng)計軟件的不斷完善和成熟,使得解決這些問題不僅成為可能,而且越來越容易、快速。
目前許多大學(xué)中幾乎所有理工科、甚至文科的許多專業(yè)都開設(shè)了《數(shù)理統(tǒng)計》或《應(yīng)用統(tǒng)計》之類的課程,有的還編寫了相應(yīng)的教材,這是可喜的。這些課程與教材的共同特點是以較大的篇幅介紹數(shù)理統(tǒng)計的理論、方法與實際背景,并配有一定數(shù)量的例子和習(xí)題。部分學(xué)校還為有統(tǒng)計專業(yè)和應(yīng)用數(shù)學(xué)專業(yè)的學(xué)生開設(shè)sAs或MATLAB統(tǒng)計軟件課程,為經(jīng)濟統(tǒng)計專業(yè)的學(xué)生開設(shè)SPSS或Eviews統(tǒng)計軟件課程,但這還遠遠不夠。
作者長期從事概率論與數(shù)理統(tǒng)計、統(tǒng)計計算及統(tǒng)計軟件的教學(xué)工作,我們發(fā)現(xiàn)目前的統(tǒng)計教學(xué)普遍存在的問題有:一、關(guān)于教學(xué)內(nèi)容:在有限的課時中,對于非統(tǒng)計專業(yè)的學(xué)生采用針對統(tǒng)計專業(yè)學(xué)生的教學(xué)方式,過多強調(diào)理論的重要性,從而忽視了統(tǒng)計思想和數(shù)據(jù)處理能力的培養(yǎng)。
第一章 R介紹
1.1 S語言與R
1.2 R的特點
1.3 R的資源
1.4 R的安裝與運行
1.4.1 R軟件的安裝、啟動與關(guān)閉
1.4.2 R程序包的安裝與使用
第一章習(xí)題
第二章 R的基本原理與核心
2.1 R的基本原理
2.2 R的在線幫助
2.3 一個簡短的R會話
2.4 R的數(shù)據(jù)結(jié)構(gòu)
2.4.1 R的對象與屬性
2.4.2 瀏覽對象的信息
2.4.3 向量的建立
2.4.4 數(shù)組與矩陣的建立
2.4.5 數(shù)據(jù)框(dataframe)的建立
2.4.6 列表(1ist)的建立
2.4.7 時間序列(ts)的建立
2.5 數(shù)據(jù)的存儲與讀取
2.5.1 數(shù)據(jù)的存儲
2.5.2 數(shù)據(jù)的讀取
2.6 R的圖形功能
2.6.1 繪圖函數(shù)
2.6.2 低級繪圖命令
2.6.3 繪圖參數(shù)
2.6.4 一個實例
2.7 R.編程
2.7.1 循環(huán)和向量化
2.7.2 用R寫程序
2.7.3 編寫你自己的函數(shù)
2.7.4 養(yǎng)成良好的編程習(xí)慣
第二章習(xí)題
第三章 概率與分布
3.1 隨機抽樣
3.2 排列組合與概率的計算
3.3 概率分布
3.3.1 離散分布的分布律
3.3.2 連續(xù)分布的密度函數(shù)
3.4 R中內(nèi)嵌的分布
3.5 應(yīng)用:中心極限定理
3.5.1 中心極限定理
3.5.2 漸近正態(tài)性的圖形檢驗
3.5.3 舉例
第三章習(xí)題
第四章 探索性數(shù)據(jù)分析
4.1 常用分布的概率函數(shù)圖
4.2 直方圖與密度函數(shù)的估計
4.2.1 直方圖
4.2.2 核密度估計
4.3 單組數(shù)據(jù)的描述性統(tǒng)計分析
4.3.1 單組數(shù)據(jù)的圖形描述
4.3.2 單組數(shù)據(jù)的描述性統(tǒng)計
4.4 多組數(shù)據(jù)的描述性統(tǒng)計分析
4.4.1 兩組數(shù)據(jù)的圖形概括
4.4.2 多組數(shù)據(jù)的圖形描述
4.4.3 多組數(shù)據(jù)的描述性統(tǒng)計
4.4.4 分組數(shù)據(jù)的圖形概括
4.5 分類數(shù)據(jù)的描述性統(tǒng)計分析
4.5.1 列聯(lián)表的制作
4.5.2 列聯(lián)表的圖形描述
第四章習(xí)題
第五章 參數(shù)估計
5.1 矩法估計和極大似然估計
5.1.1 矩法估計
5.1.2 極大似然估計
5.2 單正態(tài)總體參數(shù)的區(qū)間估計
5.2.1 均值μ的區(qū)間估計
5.2.2 方差σ2的區(qū)間估計
5.3 兩正態(tài)總體參數(shù)的區(qū)間估計
5.3.1 均值差μ1-μ2的置信區(qū)間
5.3.2 兩方差比σ12/22的置信區(qū)間
5.4 單總體比率p的區(qū)間估計
5.5 兩總體比率差p1-p2的區(qū)間估計
5.6 樣本容量的確定
5.6.1 估計正態(tài)總體均值時樣本容量的確定
5.6.2 估計比例p時樣本容量的確定
第五章習(xí)題
第六章 參數(shù)的假設(shè)檢驗
6.1 假設(shè)檢驗與檢驗的p值
6.1.1 假設(shè)檢驗的概念與步驟
6.1.2 檢驗的p值
6.2 單正態(tài)總體參數(shù)的檢驗
6.2.1 均值μ的假設(shè)檢驗
6.2.2 方差盯σ2的檢驗:x2檢驗
6.3 兩正態(tài)總體參數(shù)的檢驗
6.3.1 均值的比較:t檢驗
6.3.2 方差的比較:F檢驗
6.4 成對數(shù)據(jù)的t檢驗
6.5 單樣本比率的檢驗
6.5.1 比率p的精確檢驗
6.5.2 比率p的近似檢驗
6.6 兩樣本比率的檢驗
第六章習(xí)題
第七章 非參數(shù)的假設(shè)檢驗
7.1 單總體位置參數(shù)的檢驗
7.1.1 中位數(shù)的符號檢驗
7.1.2 Wilcoxon符號秩檢驗
7.2 分布的一致性檢驗:x2檢驗
7.3 兩總體的比較與檢驗
7.3.1 X2獨立性檢驗
7.3.2 Fisher精確檢驗
7.3.3 Wilcoxon秩和檢驗法和Mann-whitneyU檢驗
7.3.4 Mood檢驗
7.4 多總體的比較與檢驗
7.4.1 位置參數(shù)的Kruskal-Wallis秩和檢驗
7.4.2 尺度參數(shù)的Ansari-Bradley檢驗
7.4.3 尺度參數(shù)的Fligner-Killeen檢驗
第七章習(xí)題
第八章 方差分析
8.1 單因子方差分析
8.1.1 數(shù)學(xué)模型
8.1.2 均值的多重比較
8.1.3 同時置信區(qū)間:Tukey法
8.1.4 方差齊性檢驗
……
第九章 回歸分析與相關(guān)分析
第十章 多元統(tǒng)計分析介紹
第十一章 貝葉斯統(tǒng)計分析