欧美free性护士vide0shd,老熟女,一区二区三区,久久久久夜夜夜精品国产,久久久久久综合网天天,欧美成人护士h版

首頁綜合 正文
目錄

柚子快報(bào)邀請(qǐng)碼778899分享:數(shù)據(jù)挖掘 數(shù)據(jù)分析的統(tǒng)計(jì)推斷

柚子快報(bào)邀請(qǐng)碼778899分享:數(shù)據(jù)挖掘 數(shù)據(jù)分析的統(tǒng)計(jì)推斷

http://yzkb.51969.com/

數(shù)據(jù)分析的統(tǒng)計(jì)推斷

前言一、提出問題二、統(tǒng)計(jì)歸納方法三、統(tǒng)計(jì)推斷四、統(tǒng)計(jì)推斷步驟如何進(jìn)行統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷的基本問題點(diǎn)估計(jì)區(qū)間估計(jì)總體方差已知總體方差未知

假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)的假設(shè)顯著性水平

五、檢驗(yàn)統(tǒng)計(jì)量常見的檢驗(yàn)統(tǒng)計(jì)量

六、檢驗(yàn)方法七、拒絕域八、假設(shè)檢驗(yàn)步驟九、重要假設(shè)檢驗(yàn)方法z檢驗(yàn)t檢驗(yàn)F檢驗(yàn)卡方檢驗(yàn)

前言

推薦一個(gè)網(wǎng)站給想要了解或者學(xué)習(xí)人工智能知識(shí)的讀者,這個(gè)網(wǎng)站里內(nèi)容講解通俗易懂且風(fēng)趣幽默,對(duì)我?guī)椭艽蟆N蚁肱c大家分享這個(gè)寶藏網(wǎng)站,請(qǐng)點(diǎn)擊下方鏈接查看。 https://www.captainbed.cn/f1 數(shù)據(jù)分析的統(tǒng)計(jì)推斷是科學(xué)研究中的重要環(huán)節(jié),它通過對(duì)樣本數(shù)據(jù)的分析,對(duì)總體參數(shù)進(jìn)行估計(jì),并對(duì)假設(shè)進(jìn)行檢驗(yàn)。這一過程旨在從數(shù)據(jù)中提取有意義的信息,為決策提供科學(xué)依據(jù)。

在統(tǒng)計(jì)推斷中,我們通常會(huì)遇到兩類問題:參數(shù)估計(jì)和假設(shè)檢驗(yàn)。參數(shù)估計(jì)是通過樣本數(shù)據(jù)對(duì)總體參數(shù)進(jìn)行點(diǎn)估計(jì)或區(qū)間估計(jì)。點(diǎn)估計(jì)是對(duì)總體參數(shù)的具體數(shù)值進(jìn)行預(yù)測(cè),而區(qū)間估計(jì)則是給出一個(gè)包含總體參數(shù)的置信區(qū)間。這兩種估計(jì)方法都基于大數(shù)定律和中心極限定理,保證了估計(jì)的準(zhǔn)確性和可靠性。

假設(shè)檢驗(yàn)則是通過樣本數(shù)據(jù)對(duì)某個(gè)關(guān)于總體的假設(shè)進(jìn)行檢驗(yàn)。其基本思想是在一定的顯著性水平下,根據(jù)樣本數(shù)據(jù)計(jì)算出的統(tǒng)計(jì)量來判斷原假設(shè)是否成立。如果統(tǒng)計(jì)量的值落在拒絕域內(nèi),則拒絕原假設(shè);否則,接受原假設(shè)。假設(shè)檢驗(yàn)可以幫助我們了解樣本數(shù)據(jù)所反映的總體特征是否具有統(tǒng)計(jì)意義上的顯著性。

在進(jìn)行統(tǒng)計(jì)推斷時(shí),我們還需要注意一些重要的概念和方法,如置信水平、顯著性水平、P值等。置信水平表示我們對(duì)參數(shù)估計(jì)的把握程度,顯著性水平則用于確定假設(shè)檢驗(yàn)中拒絕原假設(shè)的閾值。P值則是假設(shè)檢驗(yàn)中的一個(gè)重要指標(biāo),表示觀察到的效應(yīng)由隨機(jī)誤差引起的概率。通過比較P值與顯著性水平,我們可以判斷原假設(shè)是否應(yīng)該被拒絕。

總之,數(shù)據(jù)分析的統(tǒng)計(jì)推斷是一種基于樣本數(shù)據(jù)對(duì)總體進(jìn)行推斷的方法。通過參數(shù)估計(jì)和假設(shè)檢驗(yàn)等手段,我們可以從數(shù)據(jù)中提取有用的信息,為決策提供科學(xué)依據(jù)。在實(shí)際應(yīng)用中,我們需要根據(jù)具體問題和數(shù)據(jù)特點(diǎn)選擇合適的統(tǒng)計(jì)方法和工具,以確保推斷結(jié)果的準(zhǔn)確性和可靠性。同時(shí),我們也需要不斷學(xué)習(xí)和掌握新的統(tǒng)計(jì)理論和方法,以適應(yīng)日益復(fù)雜的數(shù)據(jù)分析需求。

在進(jìn)行數(shù)據(jù)分析的統(tǒng)計(jì)推斷時(shí),我們還需要關(guān)注一些潛在的陷阱和誤區(qū)。例如,過度擬合、樣本偏差、數(shù)據(jù)造假等問題都可能影響推斷結(jié)果的準(zhǔn)確性。因此,在進(jìn)行數(shù)據(jù)分析時(shí),我們需要保持謹(jǐn)慎和客觀的態(tài)度,遵循科學(xué)的研究方法和原則。

此外,隨著大數(shù)據(jù)和人工智能技術(shù)的快速發(fā)展,數(shù)據(jù)分析的統(tǒng)計(jì)推斷方法也在不斷演進(jìn)和創(chuàng)新。例如,基于機(jī)器學(xué)習(xí)的預(yù)測(cè)模型、深度學(xué)習(xí)算法等新型方法為數(shù)據(jù)分析提供了更多的可能性。這些方法可以在更復(fù)雜的場(chǎng)景下處理更龐大的數(shù)據(jù)集,提取更多有價(jià)值的信息。

總之,數(shù)據(jù)分析的統(tǒng)計(jì)推斷是一門具有挑戰(zhàn)性和實(shí)用性的科學(xué)。它需要我們具備扎實(shí)的統(tǒng)計(jì)理論基礎(chǔ)和豐富的實(shí)踐經(jīng)驗(yàn),同時(shí)也需要我們保持開放和創(chuàng)新的思維。只有這樣,我們才能更好地利用數(shù)據(jù)分析的統(tǒng)計(jì)推斷方法,為科學(xué)研究和實(shí)際應(yīng)用提供有力的支持。

一、提出問題

為了對(duì)首都經(jīng)濟(jì)貿(mào)易大學(xué)本科一年級(jí)2500學(xué)生的微積分成績(jī)進(jìn)行考察,準(zhǔn)備隨機(jī)抽取10名學(xué)生來研究所有學(xué)生微積分的平均成績(jī),也就是用不完全歸納推理來獲得平均成績(jī)。我們有如下信息:

總體:2500名學(xué)生。

總體服從正態(tài)分布,均值和方差都是未知。

待估計(jì)總體參數(shù):平均成績(jī)。

樣本容量:10名學(xué)生。

抽樣方式:隨機(jī)抽樣。

抽樣值: 85, 78, 90, 81, 83, 89, 77, 85, 72, 80。

統(tǒng)計(jì)量:樣本均值。

目標(biāo)一:通過統(tǒng)計(jì)歸納推理獲得總體參數(shù), 2500名學(xué)生微積分的平均成績(jī)的估計(jì)。

目標(biāo)二:在95%是置信度,及著性水平為5%的情況下,計(jì)算2500名學(xué)生的平均成績(jī)進(jìn)行區(qū)間估計(jì)

目標(biāo)三:對(duì)微積分的平均成績(jī)進(jìn)行假設(shè)檢驗(yàn)。

二、統(tǒng)計(jì)歸納方法

統(tǒng)計(jì)歸納是根據(jù)樣本具有的一些屬性推出總體具有這些屬性的歸納推理方法。所謂樣本就是從總體中抽選出來的那一部分對(duì)象。使用這種方法時(shí),首先要選好樣本,處理好樣本的代表性與樣本數(shù)量之間的關(guān)系。樣本的數(shù)量越大,樣本的代表性就越大。

總的來說,統(tǒng)計(jì)歸納推理是由部分推出全部的歸納推理,我們不知道總體是什么樣的,但是我們已經(jīng)知道我拿在手里的樣本是什么樣的,我們想依靠我們掌握的樣本的屬性去推斷總體屬性是什么。

統(tǒng)計(jì)歸納的結(jié)論不可能百分之百正確,也就是說結(jié)論是或然的。利用概率論,我們可以研究通過樣本推測(cè)總體的時(shí)候所犯得錯(cuò)誤是多少。

比如說,在隨機(jī)抽取的100萬選民中, 60%支持現(xiàn)任總統(tǒng),因此在總統(tǒng)競(jìng)選中現(xiàn)任總統(tǒng)會(huì)得到60%選民的支持。

三、統(tǒng)計(jì)推斷

統(tǒng)計(jì)推斷包括:對(duì)總體的未知參數(shù)進(jìn)行估計(jì),對(duì)關(guān)于參數(shù)的假設(shè)進(jìn)行檢查和驗(yàn)證,對(duì)總體進(jìn)行預(yù)測(cè)??茖W(xué)的統(tǒng)計(jì)推斷所使用的樣本,通常通過隨機(jī)抽樣方法得到。

統(tǒng)計(jì)推斷的理論和方法論的基礎(chǔ)是來自于概率論和數(shù)理統(tǒng)計(jì)學(xué)。統(tǒng)計(jì)推斷的一個(gè)基本特點(diǎn)是其所依據(jù)的條件中包含有帶隨機(jī)性的觀測(cè)數(shù)據(jù)。

如何理解帶隨機(jī)性的觀測(cè)數(shù)據(jù)?

我們手里有的就是樣本信息,比如,我們從2500名學(xué)生中抽取10個(gè)學(xué)生樣本。在這里要注意樣本的兩重性,樣本既可看成具體的數(shù),又可以看成隨機(jī)變量。在完成抽樣后,它是具體的數(shù),在實(shí)施抽樣之前,它被看成隨機(jī)變量。因?yàn)樵趯?shí)施具體抽樣之前無法預(yù)料抽樣的結(jié)果,只能預(yù)料它可能取值的范圍,所以可把它看成一個(gè)隨機(jī)變量,因此才有概率分布可言。

四、統(tǒng)計(jì)推斷步驟

如何進(jìn)行統(tǒng)計(jì)推斷

那么我們?nèi)绾芜M(jìn)行統(tǒng)計(jì)推斷?

當(dāng)我們獲得有效樣本數(shù)據(jù)后,統(tǒng)計(jì)推斷問題可以按照如下的步驟進(jìn)行:

確定用于統(tǒng)計(jì)推斷的合適統(tǒng)計(jì)量。尋找統(tǒng)計(jì)量的精確分布。如果出現(xiàn)統(tǒng)計(jì)量的精確分布難以求出的情況下,可考慮利用中心極限定理或其它極限定理找出統(tǒng)計(jì)量的極限分布?;谠摻y(tǒng)計(jì)量的精確分布或極限分布,求出統(tǒng)計(jì)推斷問題的精確解或近似解。根據(jù)統(tǒng)計(jì)推斷結(jié)果對(duì)問題作出解釋。

統(tǒng)計(jì)推斷的基本問題

統(tǒng)計(jì)推斷的基本問題可以分為兩大類

一類是參數(shù)估計(jì)問題,包括點(diǎn)估計(jì)和區(qū)間估計(jì);另一類是假設(shè)檢驗(yàn)問題。我們將分別進(jìn)行介紹。

點(diǎn)估計(jì)

點(diǎn)估計(jì)是以抽樣得到的樣本統(tǒng)計(jì)量作為總體參數(shù)的估計(jì)量,并以樣本統(tǒng)計(jì)量的實(shí)際值直接作為總體未知參數(shù)的估計(jì)值的一種推理方法。

常見點(diǎn)估計(jì)方法有矩估計(jì),最小二乘估計(jì),極大似然估計(jì),貝葉斯估計(jì),在本節(jié)中,我們討論矩估計(jì)的基本概念。

矩估計(jì)法的理論依據(jù)是大數(shù)定理,是基于一種簡(jiǎn)單的“替換”思想,即用樣本矩估計(jì)總體矩。其特點(diǎn)是簡(jiǎn)單易行,并不需要事先知道總體是什么分布。最常見的矩估計(jì)是利用均值或方差來計(jì)算總體未知參數(shù)。

矩估計(jì)就是用樣本的矩函數(shù)作為統(tǒng)計(jì)量,其原理就是構(gòu)造樣本矩和總體矩,然后用樣本矩去估計(jì)總體矩。

設(shè)有樣本:X1,X2,…,X 由于樣本均值就是1階原點(diǎn)矩,樣本方差是2階中心矩,所以在以下的關(guān)于矩估計(jì)的討論主要集中數(shù)學(xué)期望和方差的估計(jì)。

由于矩估計(jì)不考慮抽樣誤差,直接用樣本矩估計(jì)總體參數(shù)的一種推斷方法。因?yàn)閭€(gè)別樣本的抽樣統(tǒng)計(jì)值不等于總體的參數(shù),所以,用樣本矩直接估計(jì)總體的參數(shù),不可避免的會(huì)有誤差。

點(diǎn)估計(jì)具有的標(biāo)準(zhǔn)特點(diǎn)為無偏性和有效性。

從數(shù)學(xué)上不難證明,樣本均值(一階原點(diǎn)矩)是關(guān)于總體數(shù)學(xué)期望的一個(gè)無偏估計(jì)。但是,樣本的方差(二階中心矩)并非總體的方差的無偏估計(jì)。在實(shí)際應(yīng)用中,我們通常用樣本均值估計(jì)總體均值,用樣本方差估計(jì)總體方差,用樣本標(biāo)準(zhǔn)差估計(jì)總體標(biāo)準(zhǔn)差。

我們繼續(xù)討論關(guān)于學(xué)生微積分成績(jī)的例子。我們將通過統(tǒng)計(jì)歸納推理獲得2500名學(xué)生的平均成績(jī)。由于抽樣數(shù)據(jù)為: 85, 78, 90, 81, 83, 89, 77, 85,72, 80,我們可以計(jì)算出樣本均值為82,我們就可以認(rèn)為總體均值,即2500名學(xué)生微積分的平均成績(jī)?yōu)?2分。

區(qū)間估計(jì)

區(qū)間估計(jì)是在點(diǎn)估計(jì)的基礎(chǔ)上,給出總體參數(shù)估計(jì)的一個(gè)區(qū)間范圍,該區(qū)間通常由樣本統(tǒng)計(jì)量加減估計(jì)誤差得到。與點(diǎn)估計(jì)不同,進(jìn)行區(qū)間估計(jì)時(shí),根據(jù)樣本統(tǒng)計(jì)量的抽樣分布可以對(duì)樣本統(tǒng)計(jì)量與總體參數(shù)的接近程度給出一個(gè)概率意義上的度量。

為了理解區(qū)間估計(jì),我們來討論關(guān)于置信度,置信區(qū)間,和顯著性水平的相關(guān)概念。置信區(qū)間是根據(jù)樣本信息推導(dǎo)出來的可能包含總體參數(shù)的數(shù)值區(qū)間,置信度表示置信區(qū)間的可信度。置信度一般用百分?jǐn)?shù)來表示,表示成(1-a) 100%,其中a指的是顯著性水平,表示總體參數(shù)不落在置信區(qū)間的可能性。

比如,一個(gè)學(xué)校學(xué)生的平均身高的區(qū)間估計(jì)情況,有95%的置信度可以認(rèn)為該校學(xué)生的平均身高為1.4米到1.5米之間,那么[1.4,1.5]是置信區(qū)間, 95%是置信度,著性水平為5%。如果抽樣100次,有信心認(rèn)為這個(gè)區(qū)間大約有95次包含該校學(xué)生的平均身高。有5次不包括。

置信度越大,置信區(qū)間包含總體參數(shù)真值的概率就越大,同時(shí)區(qū)間的長(zhǎng)度就越大,對(duì)未知參數(shù)估計(jì)的精度就越差。計(jì)算置信區(qū)間的基本思想為在點(diǎn)估計(jì)的基礎(chǔ)上,構(gòu)造合適的函數(shù),并針對(duì)給定的置信度計(jì)算出置信區(qū)間。

我們來討論關(guān)于總體均值的區(qū)間估計(jì)問題,假設(shè)容量為n的樣本,是從正態(tài)分布總體中隨機(jī)抽取。為了計(jì)算總體均值的區(qū)間估計(jì),我們需要考慮二種情況,一是正態(tài)總體的標(biāo)準(zhǔn)差已知,二是標(biāo)準(zhǔn)差未知。

總體方差已知

在大樣本情況下,總體服從正態(tài)分布,總體方差已知,總體均值在置信水平(1-a)下的置信區(qū)間為:

總體方差未知

當(dāng)正態(tài)總體的方差未知,且為小樣本條件下,總體均值在置信水平(1-a)下的置信區(qū)間為:

我們繼續(xù)討論關(guān)于學(xué)生微積分成績(jī)的例子。我們將計(jì)算2500名學(xué)生的平均成績(jī)估計(jì)值的置信區(qū)間。由于總體方差是未知,我們將利用樣本方差和t分布來計(jì)算置信度為95%的置信區(qū)間。由于樣本方差標(biāo)準(zhǔn)差s=5.49, n=10, t1-a/2 =2.26 我們有: 所以, 2500名學(xué)生微積分的平均成績(jī)82分的置信區(qū)間為: [82-3.92,82+3.92]

假設(shè)檢驗(yàn)

假設(shè)檢驗(yàn)是用來判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成的統(tǒng)計(jì)推斷方法。顯著性檢驗(yàn)是假設(shè)檢驗(yàn)中最常用的一種方法,也是一種最基本的統(tǒng)計(jì)推斷形式,其基本原理是先對(duì)總體的特征做出某種假設(shè),然后通過抽樣研究的統(tǒng)計(jì)推理,對(duì)此假設(shè)應(yīng)該被拒絕還是接受做出推斷。

假設(shè)檢驗(yàn)這種統(tǒng)計(jì)推斷方法是帶有概率性質(zhì)的反證法,是利用“小概率事件”的原理。所謂小概率思想是指小概率事件在一次試驗(yàn)中基本上不會(huì)發(fā)生。反證法思想是先對(duì)總體參數(shù)提出一個(gè)假設(shè)值,再用樣本信息和適當(dāng)?shù)慕y(tǒng)計(jì)方法,利用小概率原理,確定假設(shè)是否成立。如果樣本觀察值導(dǎo)致了“小概率事件”發(fā)生,就應(yīng)拒絕提出的假設(shè),否則應(yīng)接受假設(shè)。

在實(shí)踐中,常用的假設(shè)檢驗(yàn)方法有基于正態(tài)分布的Z檢驗(yàn),t分布的t檢驗(yàn),卡方分布的卡方檢驗(yàn),F分布的F檢驗(yàn)。

假設(shè)檢驗(yàn)的假設(shè)

由定義可知,我們需要對(duì)結(jié)果進(jìn)行假設(shè),然后拿樣本數(shù)據(jù)去驗(yàn)證這個(gè)假設(shè)。所以做假設(shè)檢驗(yàn)時(shí)會(huì)設(shè)置兩個(gè)假設(shè),一種叫原假設(shè),通常用HO表示。原假設(shè)一般是設(shè)計(jì)者想要拒絕的假設(shè)。原假設(shè)的設(shè)置條件一般有:等于(=),大于等于(>=) ,和小于等于(<=)。

另外一種叫備擇假設(shè),一般用H1表示。備則假設(shè)是設(shè)計(jì)者想要接受的假設(shè)。

備擇假設(shè)的設(shè)置一般為不等于(≠),大于(>),小于(<)的形式。

為什么設(shè)計(jì)者想要拒絕的假設(shè)放在原假設(shè)呢?

如果原假設(shè)備被拒絕,結(jié)果是錯(cuò)誤的話,只能犯第1類錯(cuò)誤,而犯第1類錯(cuò)誤的概率已經(jīng)被規(guī)定的顯著性水平所控制。

我們通過樣本數(shù)據(jù)來判斷總體參數(shù)的假設(shè)是否成立,但樣本是隨機(jī)抽取的,因而有可能出現(xiàn)小概率的錯(cuò)誤。

這種錯(cuò)誤分兩種,

一種是棄真錯(cuò)誤,也稱為第一類錯(cuò)誤,另一種是取偽錯(cuò)誤,也稱為第二類錯(cuò)誤。

棄真錯(cuò)誤是指原假設(shè)實(shí)際上是真的,但通過樣本估計(jì)總體后,拒絕了原假設(shè)。明顯這是錯(cuò)誤的,我們拒絕了真實(shí)的原假設(shè),所以叫棄真錯(cuò)誤,這個(gè)錯(cuò)誤的概率記為a。這個(gè)值也是顯著性水平,在假設(shè)檢驗(yàn)之前會(huì)規(guī)定這個(gè)概率的大小。

取偽錯(cuò)誤它是指原假設(shè)實(shí)際上假的,但通過樣本估計(jì)總體后,接受了原假設(shè)。顯然是錯(cuò)誤的,我們接受的原假設(shè)實(shí)際上是假的,所以叫取偽錯(cuò)誤,這個(gè)錯(cuò)誤的概率記為β。

這就是為什么原假設(shè)一般都是想要拒絕的假設(shè)了么?如果原假設(shè)備被拒絕,如果出錯(cuò)的話,只能犯棄真錯(cuò)誤,而犯棄真錯(cuò)誤的概率已經(jīng)被規(guī)定的顯著性水平所控制了。這樣對(duì)設(shè)計(jì)者來說更容易控制,將錯(cuò)誤影響降到最小。

顯著性水平

單理解就是犯棄真錯(cuò)誤的概率。這個(gè)值是我們做假設(shè)檢驗(yàn)之前數(shù)據(jù)分析人員根據(jù)業(yè)務(wù)情況事先確定好的。

顯著性水平是指當(dāng)原假設(shè)實(shí)際上正確時(shí),檢驗(yàn)統(tǒng)計(jì)量落在拒絕域的概率,簡(jiǎn)我們通常把假設(shè)檢驗(yàn)中的顯著性水平顯著性水平用a表示,也就是決策中所面臨的風(fēng)險(xiǎn)。a越小,犯第一類錯(cuò)誤的概率也就越小。

五、檢驗(yàn)統(tǒng)計(jì)量

假設(shè)檢驗(yàn)需要借助樣本統(tǒng)計(jì)量進(jìn)行統(tǒng)計(jì)推斷,我們也稱這樣的通緝令為檢驗(yàn)統(tǒng)計(jì)量。不同的假設(shè)檢驗(yàn)問題需要選擇不同的檢驗(yàn)統(tǒng)計(jì)量。

檢驗(yàn)統(tǒng)計(jì)量是用于假設(shè)檢驗(yàn)計(jì)算的統(tǒng)計(jì)量,是根據(jù)對(duì)原假設(shè)和備擇假設(shè)作出決策的某個(gè)樣本統(tǒng)計(jì)量。

檢驗(yàn)統(tǒng)計(jì)量是用于進(jìn)行假設(shè)檢驗(yàn)的計(jì)算量,通常根據(jù)樣本數(shù)據(jù)計(jì)算得出,用于衡量樣本數(shù)據(jù)與假設(shè)之間的差異。

常見的檢驗(yàn)統(tǒng)計(jì)量

常見的檢驗(yàn)統(tǒng)計(jì)量包括:

t值:用于檢驗(yàn)樣本均值與總體均值之間是否有顯著差異,適用于小樣本情形。F值:用于檢驗(yàn)多個(gè)總體方差是否相等,適用于方差分析??ǚ街担河糜跈z驗(yàn)觀測(cè)值和期望值的偏差程度,適用于卡方檢驗(yàn)。Z值:用于檢驗(yàn)樣本比例與總體比例之間是否有顯著差異,適用于大樣本情形。

以上檢驗(yàn)統(tǒng)計(jì)量都有其特定的計(jì)算公式和應(yīng)用范圍,具體使用時(shí)需要根據(jù)問題類型和數(shù)據(jù)情況進(jìn)行選擇。

六、檢驗(yàn)方法

假設(shè)檢驗(yàn)方法有兩種,雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)。單側(cè)檢驗(yàn)又可分為左側(cè)檢驗(yàn)和右側(cè)檢驗(yàn)。

如果檢驗(yàn)的目的是檢驗(yàn)抽樣的樣本統(tǒng)計(jì)量與假設(shè)參數(shù)的差是否過大(無論正方向,還是負(fù)方向) ,我們都會(huì)把風(fēng)險(xiǎn)分?jǐn)偟阶笥覂蓚?cè)。比如顯著性水平為5%,則概率曲線的左右兩側(cè)各占2.5%,也就是95%的置信區(qū)間。

雙側(cè)檢驗(yàn)的備擇假設(shè)沒有特定的方向性,通常的形式為“豐”,這種檢驗(yàn)假設(shè)被稱為雙側(cè)檢驗(yàn)。

如果檢驗(yàn)的目的只是注重驗(yàn)證是否偏高,或者偏低,也就是說只注重驗(yàn)證單一方向,我們就檢驗(yàn)單側(cè)。比如顯著性水平為5%,概率曲線只需要關(guān)注某一側(cè)占5%即可,即90%的置信區(qū)間。

單側(cè)檢驗(yàn)的備擇假設(shè)帶有特定的方向性,通常的形式為">“或”<“的假設(shè)檢驗(yàn),一般來說單側(cè)檢驗(yàn)”<“被稱為左側(cè)檢驗(yàn),而單側(cè)檢驗(yàn)”>"被稱為右側(cè)檢驗(yàn)。

在實(shí)踐中,我們會(huì)根據(jù)問題的性質(zhì)來決定使用雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)。比如,為了檢驗(yàn)中學(xué)生男女生身高是否有性別差異。如果問題是在中學(xué)生中,男女生的身高是否存在性別差異,這個(gè)時(shí)候我們需要用雙側(cè)檢驗(yàn),因?yàn)閷?shí)際的差異可能是男生平均身高比女生高,也可能是男生平均比女生矮。這兩種情況都屬于存在性別差異。而如果問題變?yōu)樵谥袑W(xué)生中,男生的身高是否比女生高,這個(gè)時(shí)候我們只需要檢驗(yàn)單側(cè)即可。

七、拒絕域

在假設(shè)檢驗(yàn)中,用來拒絕原假設(shè)的統(tǒng)計(jì)量的取值范圍,拒絕域是由顯著性水平圍成的區(qū)域。拒絕域的功能主要用來判斷假設(shè)檢驗(yàn)是否拒絕原假設(shè)的。如果通過樣本數(shù)據(jù)計(jì)算出來的檢驗(yàn)統(tǒng)計(jì)量的具體數(shù)值落在拒絕域內(nèi),就拒絕原假設(shè),否則不拒絕原假設(shè)。給定顯著性水平a后,查表就可以得到具體臨界值,將檢驗(yàn)統(tǒng)計(jì)量與臨界值進(jìn)行比較,判斷是否拒絕原假設(shè)。

八、假設(shè)檢驗(yàn)步驟

假設(shè)檢驗(yàn)首先需要對(duì)問題做出假設(shè),對(duì)照樣本數(shù)據(jù)進(jìn)行檢驗(yàn),主要分為以下基本步驟。

提出原假設(shè)(HO)與備擇假設(shè)(H1)從總體中出抽取一個(gè)隨機(jī)樣本構(gòu)造檢驗(yàn)統(tǒng)計(jì)量根據(jù)顯著性水平確定拒絕域臨界值計(jì)算檢驗(yàn)統(tǒng)計(jì)量與臨界值進(jìn)行比較

九、重要假設(shè)檢驗(yàn)方法

z檢驗(yàn)

z檢驗(yàn)是有關(guān)總體平均值參數(shù)的假設(shè)檢驗(yàn),檢驗(yàn)是一般用于大樣本,即樣本容量大于30,總體的方差已知的方法。它是用標(biāo)準(zhǔn)正態(tài)分布的理論來推斷差異發(fā)生的概率,從而比較樣本平均數(shù)和總體均值的差異是否顯著。

z檢驗(yàn)首先比較根據(jù)樣本計(jì)算所得z值與理論z值之間關(guān)系,推斷發(fā)生的概率,依據(jù)z值與差異顯著性關(guān)系表作出判斷。比如,在顯著性水平a=0.05的情況下,通過查表獲得理論z值=1.96,如果計(jì)算所得z值大于1.96,則拒絕原假設(shè)。

例:一種零配件,要求使用壽命不低于1000小時(shí),現(xiàn)從一批這種零配件中抽取25件,測(cè)得其使用壽命的平均值為950小時(shí),已知該零配件服從標(biāo)準(zhǔn)差S=100小時(shí)的正態(tài)分布,在顯著性水平a=0.05下確定這批零配件是否合格。

解:使用壽命小于1000小時(shí)即為不合格,我們可以使用左單側(cè)檢驗(yàn),這時(shí)我們有: 原假設(shè)HO:μ>1000;備選假設(shè):H1<1000 計(jì)算統(tǒng)計(jì)量:

而在顯著性水平a=0.05下的真值為Z=-1.65,由于z=-2.5

t檢驗(yàn)

t檢驗(yàn)是在總體方差未知的情況下有關(guān)總體均值參數(shù)的假設(shè)檢驗(yàn),主要用于樣本含量較小(n<30),總體標(biāo)準(zhǔn)差σ未知的正態(tài)分布。目的是用來比較樣本均值所代表的未知總體均值和已知總體均數(shù)。

我們可以將原假設(shè)假設(shè)為樣本均值與總體均值之間沒有顯著差異。然后,在給定理論值差異的顯著水平下,比如選擇 a=0.05,根據(jù)自由度n-1,查T值表,找出對(duì)應(yīng)的T理論值。

根據(jù)樣本數(shù)據(jù)計(jì)算t統(tǒng)計(jì)量的t值,比較計(jì)算得到的t值和理論T值,推斷發(fā)生的概率,如果t值大于T值,作出原假設(shè)不成立的判斷。

F檢驗(yàn)

F檢驗(yàn)是對(duì)兩個(gè)正態(tài)分布的方差齊性檢驗(yàn),簡(jiǎn)單來說,就是檢驗(yàn)兩個(gè)分布的方差是否相等接下來我們討論F檢驗(yàn),最典型的F檢驗(yàn)是用于分析一系列服從正態(tài)分布總體的樣本是否都有相同的標(biāo)準(zhǔn)差。具體來說,對(duì)于正態(tài)總體,兩個(gè)總體的方差比較可以用F-分布來檢驗(yàn)。

檢驗(yàn)結(jié)果說明甲乙兩人檢測(cè)結(jié)果差別不顯著。

卡方檢驗(yàn)

根據(jù)卡方統(tǒng)計(jì)量的定義,卡方值描述兩個(gè)事件的獨(dú)立性或者描述實(shí)際觀察值與期望值的偏離程度??ǚ街翟酱?表名實(shí)際觀察值與期望值偏離越大,也說明兩個(gè)事件的相互獨(dú)立性越弱??ǚ綑z驗(yàn)屬于非參數(shù)檢驗(yàn),主要是比較兩個(gè)變量的關(guān)聯(lián)性分析。根本思想在于比較觀測(cè)值和理論值的擬合程度。原假設(shè)認(rèn)為觀測(cè)值與理論值的差異是由于隨機(jī)誤差所致。

確定數(shù)據(jù)間的實(shí)際差異,即求出卡方值,如卡方值大于某特定顯著性標(biāo)準(zhǔn),則拒絕原假設(shè),認(rèn)為實(shí)測(cè)值與理論值的差異在該顯著水平下是顯著的。

利用卡方分布進(jìn)行假設(shè)檢驗(yàn)的基本步驟。

確定原假設(shè)HO和備選假設(shè)H1計(jì)算期望頻數(shù)和自由度通過自由度和顯著水平確定拒絕域計(jì)算檢驗(yàn)統(tǒng)計(jì)量查看統(tǒng)計(jì)量是否位于拒絕域內(nèi)

柚子快報(bào)邀請(qǐng)碼778899分享:數(shù)據(jù)挖掘 數(shù)據(jù)分析的統(tǒng)計(jì)推斷

http://yzkb.51969.com/

好文閱讀

評(píng)論可見,查看隱藏內(nèi)容

本文內(nèi)容根據(jù)網(wǎng)絡(luò)資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點(diǎn)和立場(chǎng)。

轉(zhuǎn)載請(qǐng)注明,如有侵權(quán),聯(lián)系刪除。

本文鏈接:http://gantiao.com.cn/post/19479006.html

發(fā)布評(píng)論

您暫未設(shè)置收款碼

請(qǐng)?jiān)谥黝}配置——文章設(shè)置里上傳

掃描二維碼手機(jī)訪問

文章目錄