統(tǒng)計(jì)學(xué):從概念到數(shù)據(jù)分析
定 價(jià):26.4 元
- 作者:吳喜之,劉超編著
- 出版時(shí)間:2016/4/1
- ISBN:9787040449723
- 出 版 社:高等教育出版社
- 中圖法分類:C8
- 頁碼:217
- 紙張:膠版紙
- 版次:1
- 開本:16K
本書主要介紹了概率基礎(chǔ)、統(tǒng)計(jì)的基本概念、描述性統(tǒng)計(jì)、估計(jì)、假設(shè)檢驗(yàn)、回歸與分類等內(nèi)容,同時(shí)介紹了決策樹、神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林等組合方法以及如何用R軟件來實(shí)現(xiàn)相應(yīng)的計(jì)算目標(biāo)。本書著重直觀討論,盡量少用公式,避免數(shù)學(xué)推導(dǎo),強(qiáng)調(diào)統(tǒng)計(jì)學(xué)的基本內(nèi)容及應(yīng)用,使讀者能夠完整、準(zhǔn)確地理解統(tǒng)計(jì)學(xué)的概念,學(xué)會(huì)利用統(tǒng)計(jì)軟件進(jìn)行數(shù)據(jù)分析。本書主要是為非統(tǒng)計(jì)學(xué)專業(yè)的學(xué)生和讀者編寫,讀者不需要任何概率統(tǒng)計(jì)基礎(chǔ)知識(shí)。
統(tǒng)計(jì)學(xué)是一門收集、整理和分析數(shù)據(jù)的科學(xué)和藝術(shù)。這里的“數(shù)據(jù)”通指“信息的載體”,涵蓋了大千世界中的文本、圖像、視頻、時(shí)空數(shù)據(jù)、基因數(shù)據(jù)等。統(tǒng)計(jì)學(xué)是一個(gè)獨(dú)立的學(xué)科,在歷史上曾隸屬于數(shù)學(xué),但統(tǒng)計(jì)學(xué)與數(shù)學(xué)有著本質(zhì)的區(qū)別,因此統(tǒng)計(jì)學(xué)教育有其自身的特點(diǎn)和要求,這些特點(diǎn)表現(xiàn)為:(1)統(tǒng)計(jì)學(xué)研究的是隨機(jī)現(xiàn)象,而數(shù)學(xué)研究的是確定性的規(guī)律;(2)統(tǒng)計(jì)學(xué)是一門應(yīng)用性很強(qiáng)的學(xué)科,許多概念和原理來自于實(shí)際的需要,不是數(shù)理邏輯的產(chǎn)物;(3)數(shù)據(jù)在統(tǒng)計(jì)學(xué)中扮演了重要的角色。目前,統(tǒng)計(jì)學(xué)已被列為一級(jí)學(xué)科。
在過去的30年中,隨著生命科學(xué)、信息科學(xué)、物質(zhì)科學(xué)、資源環(huán)境、認(rèn)知科學(xué)、工程技術(shù)、經(jīng)濟(jì)金融和人文科學(xué)等眾多學(xué)科的發(fā)展,產(chǎn)生了許多新的統(tǒng)計(jì)學(xué)分支,如風(fēng)險(xiǎn)管理、數(shù)據(jù)挖掘、基因芯片分析等。此外,計(jì)算機(jī)及其有關(guān)軟件在統(tǒng)計(jì)教育和應(yīng)用中扮演了越來越重要的角色,它們提供了越來越多的圖形表達(dá)和分析的方法,使得許多原來教科書中重要的內(nèi)容,現(xiàn)在已變得無足輕重。統(tǒng)計(jì)教育必須要改革才能適應(yīng)高速發(fā)展的形勢(shì)。
大學(xué)的統(tǒng)計(jì)教育可分為兩大類,一類是非統(tǒng)計(jì)學(xué)專業(yè)的課程,另一類是統(tǒng)計(jì)學(xué)專業(yè)的教學(xué)設(shè)計(jì)。非統(tǒng)計(jì)學(xué)專業(yè)的學(xué)生學(xué)習(xí)統(tǒng)計(jì)的目的是為了應(yīng)用,在大學(xué)階段,課程不多,主要是學(xué)習(xí)基礎(chǔ)的統(tǒng)計(jì)概念和方法,學(xué)會(huì)使用統(tǒng)計(jì)軟件,培養(yǎng)其解決實(shí)際問題的能力。統(tǒng)計(jì)學(xué)專業(yè)的課程設(shè)置十分重要,應(yīng)向國際靠攏,對(duì)教師隊(duì)伍的要求也較高。雖然這兩類學(xué)生的教育有很多共同點(diǎn),但在課程設(shè)置中必須加以區(qū)分。
我國的統(tǒng)計(jì)教育在過去受蘇聯(lián)的影響很深,把統(tǒng)計(jì)學(xué)作為數(shù)學(xué)的一個(gè)分支,在內(nèi)容上偏理論,少應(yīng)用,過于強(qiáng)調(diào)概率論在統(tǒng)計(jì)中的作用。統(tǒng)計(jì)學(xué)是一門應(yīng)用性很強(qiáng)的學(xué)科,應(yīng)從實(shí)際問題、從數(shù)據(jù)出發(fā),通過統(tǒng)計(jì)的工具來揭示數(shù)據(jù)內(nèi)部的規(guī)律。用“建模”的思路來教統(tǒng)計(jì),使學(xué)生能更加容易理解統(tǒng)計(jì)的概念和方法,知道如何將實(shí)際問題抽象為統(tǒng)計(jì)模型,反過來又指導(dǎo)實(shí)踐。對(duì)非統(tǒng)計(jì)學(xué)專業(yè)的學(xué)生,要強(qiáng)調(diào)統(tǒng)計(jì)的應(yīng)用。學(xué)生要能熟練地使用至少一個(gè)統(tǒng)計(jì)軟件包。對(duì)于統(tǒng)計(jì)學(xué)專業(yè)的學(xué)生,要培養(yǎng)學(xué)生對(duì)實(shí)際問題的建模能力。有些實(shí)際問題可直接應(yīng)用現(xiàn)有的統(tǒng)計(jì)方法來解決,如問卷調(diào)查的統(tǒng)計(jì)分析。
第一章 引言
1.1 什么是科學(xué)方法?
1.2 什么是統(tǒng)計(jì)學(xué)?
1.3 統(tǒng)計(jì)學(xué)習(xí)需要的基礎(chǔ)知識(shí)和技能
1.4 習(xí)題
第二章 數(shù)據(jù)和變量
2.1 變量
2.2 數(shù)據(jù)
2.3 總體、樣本和抽樣
2.3 1幾個(gè)基本概念
2.3.2 抽樣調(diào)查方法
2.4 習(xí)題
第三章 數(shù)據(jù)的展示和描述方法
3.1 制表方法
3.2 統(tǒng)計(jì)圖
3.2.1 條形圖
3.2.2 餅圖
3.2.3 直方圖
3.2.4 盒形圖
3.2.5 莖葉圖
3.2.6 散點(diǎn)圖
3.2.7 其他的圖描述法
3.3 用少量匯總數(shù)字的描述方法
3.3.1 關(guān)于數(shù)據(jù)位置的匯總統(tǒng)計(jì)量
3.3.2 關(guān)于數(shù)據(jù)尺度的匯總統(tǒng)計(jì)量
3.3.3 標(biāo)準(zhǔn)得分、標(biāo)準(zhǔn)化和離群點(diǎn)
3.4 習(xí)題
第四章 變量的分布
4.1 概率和概率分布
4.2 概率運(yùn)算回顧
4.3 離散型隨機(jī)變量的分布
4.3.1 二項(xiàng)分布
4.3.2 多項(xiàng)分布
4.3.3 超幾何分布
4.3.4 Poisson分布
4.4 連續(xù)型隨機(jī)變量的分布
4.4.1 均勻分布
4.4.2 正態(tài)分布
4.4.3 總體分位數(shù)和尾概率
4.5 簡(jiǎn)單概率計(jì)算例子
4.6 用小概率事件進(jìn)行判斷
4.7 習(xí)題
第五章 抽樣分布
5.1 樣本函數(shù)的分布
5.1.1 樣本均值的分布
5.1.2 樣本均值的性質(zhì)和中心極限定理
5.1.3 樣本比例的抽樣分布
5.2 常用的抽樣分布
5.2.1 χ2分布
5.2.2 t分布
5.2.3 F分布
5.3 非正態(tài)數(shù)據(jù)的正態(tài)化變換
5.4 統(tǒng)計(jì)量的一些常用函數(shù)
5.5 習(xí)題
第六章 簡(jiǎn)單統(tǒng)計(jì)推斷:對(duì)總體參數(shù)的估計(jì)
6.1 點(diǎn)估計(jì)
6.2 區(qū)問估計(jì)
6.2.1 正態(tài)分布總體均值μ的區(qū)間估計(jì)
6.2.2 兩個(gè)獨(dú)立正態(tài)分布總體均值差μ1-μ2的區(qū)間估計(jì)
6.2.3 配對(duì)正態(tài)分布總體均值差μD=μ1一μ2的區(qū)間估計(jì)
6.2.4 總體比例(BeTnoulli試驗(yàn)成功概率)p的區(qū)間估計(jì)
6.2.5 如何概算調(diào)查所需的樣本量
6.2.6 總體比例(Bernoulli試驗(yàn)成功概率)之差p1一p2的區(qū)間估計(jì)
6.3 習(xí)題
第七章 簡(jiǎn)單統(tǒng)計(jì)推斷:總體參數(shù)的假設(shè)檢驗(yàn)
7.1 假設(shè)檢驗(yàn)的過程和邏輯
7.2 正態(tài)總體均值的檢驗(yàn)
7.2.1 對(duì)一個(gè)正態(tài)總體均值μ的t檢驗(yàn)
7.2.2 對(duì)兩個(gè)正態(tài)總體均值之差μ1-μ2的t檢驗(yàn)
7.2.3 配對(duì)正態(tài)分布總體均值差μD=μl-μ2的t檢驗(yàn)
7.3 總體比例(Bernoulli試驗(yàn)成功概率)p的檢驗(yàn)
7.3.1 一個(gè)總體比例p的檢驗(yàn)
7.3.2 兩個(gè)總體比例之差m-p2的檢驗(yàn)
7.4 關(guān)于中位數(shù)的非參數(shù)檢驗(yàn)
7.4.1 非參數(shù)檢驗(yàn)簡(jiǎn)介
7.4.2 單樣本的關(guān)于總體中位數(shù)(或總體α分位數(shù))的符號(hào)檢驗(yàn)
7.4.3 單樣本的關(guān)于對(duì)稱總體中位數(shù)(總體均值)的Wilcoxon符號(hào)秩檢驗(yàn)
7.4.4 比較兩獨(dú)立樣本總體中位數(shù)的Wilcoxon秩和檢驗(yàn)
7.5 習(xí)題
第八章 變量之間的關(guān)系
8.1 定性變量之間的相關(guān)
8.1.1 列聯(lián)表
8.1 X2檢驗(yàn)
8.2 定量變量之間的相關(guān)
8.2.1 相關(guān)關(guān)系的圖形描述
8.2.2 相關(guān)關(guān)系的數(shù)字刻畫:Pearson線性相關(guān)系數(shù)
8.2.3 相關(guān)關(guān)系的數(shù)字刻畫:Kendau.T相關(guān)系數(shù)
8.3 習(xí)題
第九章 經(jīng)典回歸和分類
9.1 回歸和分類概述
9.1.1 “黑匣子”說法
9.1.2 試圖破解“黑匣子”的實(shí)踐
9.1.3 回歸和分類的區(qū)別
9.2 線性回歸模型
9.2.1 因變量和自變量均為數(shù)量型變量的情形
9.2.2 因變量是數(shù)量型變量而自變量包含分類變量的情形
9.2.3 對(duì)于回歸利用交叉驗(yàn)證的例子
9.3 Loglstic回歸
9.4 判別分析
9.5 習(xí)題
第十章 現(xiàn)代回歸和分類:數(shù)據(jù)挖掘方法
10.1 決策樹:分類樹和回歸樹
10.1.1 分類樹
10.1.2 回歸樹
10.2 組合方法:adaboost,bagging和隨機(jī)森林
10.2.1 為什么組合?
10.2.2 Boosting
10.2.3 Bagging
10.2.4 隨機(jī)森林
10.3 對(duì)于例9.6和例9.3的交叉驗(yàn)證結(jié)果
10.4 習(xí)題
附錄:熟練使用R軟件
參考文獻(xiàn)
《統(tǒng)計(jì)學(xué):從概念到數(shù)據(jù)分析(第二版)》:
我們天天都在使用“科學(xué)”這個(gè)詞語,但是,有多少人認(rèn)真考慮過科學(xué)的真正含義呢?
人們對(duì)世界的認(rèn)識(shí)來源于他們所獲得的信息(或數(shù)據(jù))。而在總結(jié)這些信息時(shí)人們頭腦中會(huì)形成一些模型(也稱假說或理論)。這些模型會(huì)指導(dǎo)人們做進(jìn)一步的探索,直到遇到這些模型無法解釋的現(xiàn)象。這時(shí),人們會(huì)改進(jìn)這些模型,或者干脆建立新的模型使得新模型不僅可以解釋舊模型可以解釋的現(xiàn)象,而且還能解釋舊模型無法解釋的現(xiàn)象。這就是科學(xué)的方法,而只有用科學(xué)方法進(jìn)行的探索才叫科學(xué)。下面舉兩個(gè)人們熟知的例子。
·天文學(xué):公元2世紀(jì),托勒玫致力于傳播宇宙地心說,這一思想影響了1300多年,地心說可以對(duì)當(dāng)時(shí)條件下的一些天文觀測(cè)提供解釋。1543年,在哥白尼的《天體運(yùn)行論》-書中闡明了日心說,把托勒玫的理論大大改進(jìn)了。隨后,開普勒發(fā)現(xiàn)行星運(yùn)動(dòng)原理,伽利略開始將望遠(yuǎn)鏡用于天文觀測(cè),牛頓又建立了運(yùn)動(dòng)和萬有引力定律。在新的觀測(cè)的基礎(chǔ)上,賴特在1750年提出宇宙是由眾多星系構(gòu)成的看法。18世紀(jì)末,赫歇爾首先用望遠(yuǎn)鏡進(jìn)行了巡天觀測(cè),奠定了現(xiàn)代恒星天文學(xué)的基礎(chǔ)。
·從牛頓到愛因斯坦:牛頓發(fā)現(xiàn)了運(yùn)動(dòng)定律和萬有引力定律,這些定律在當(dāng)時(shí)可以解釋相當(dāng)一部分觀測(cè)的現(xiàn)象。然而,后來在亞原子尺度上,以及在行星觀測(cè)中出現(xiàn)了一些用牛頓的慣性定律或萬有引力定律無法解釋的現(xiàn)象,這就導(dǎo)致了愛因斯坦狹義和廣義相對(duì)論的產(chǎn)生,相對(duì)論是建立在光速在真空中不變的假定前提之下的。如果人們觀測(cè)到光速在真空中可變,則又會(huì)對(duì)相對(duì)論進(jìn)行修正。
從上面的例子可以看出科學(xué)的一些特點(diǎn),科學(xué)可以定義為對(duì)關(guān)于宇宙的所有方面的知識(shí)的認(rèn)真的、系統(tǒng)的、合乎邏輯的研究。這些知識(shí)則是由考察最好的可利用的證據(jù)得到的,并且這些知識(shí)總是應(yīng)該在發(fā)現(xiàn)更有力的證據(jù)時(shí)隨時(shí)予以糾正和改進(jìn),科學(xué)也可以定義為任何知識(shí)系統(tǒng),這些知識(shí)涉及物理世界及其可經(jīng)受無偏見觀測(cè)和系統(tǒng)實(shí)驗(yàn)的現(xiàn)象。
科學(xué)方法是目前已知的篩去謊言和錯(cuò)覺的最好方式,對(duì)其步驟可做如下大致的描述:
。1)觀測(cè)宇宙的某些方面。
(2)發(fā)明或提出可以解釋這些觀測(cè)的假說或假設(shè),它必須和觀測(cè)結(jié)果相容。
。3)利用該假說進(jìn)行預(yù)測(cè)。
。4)用實(shí)驗(yàn)來檢驗(yàn)這些預(yù)測(cè),或者做進(jìn)一步觀測(cè)并根據(jù)結(jié)果修正假說。
。5)重復(fù)第(3),(4)步直到在理論和實(shí)驗(yàn)或觀測(cè)中沒有發(fā)現(xiàn)矛盾為止。
……