高一數(shù)學(xué)獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用知識(shí)點(diǎn)
獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用是高中數(shù)學(xué)的一個(gè)難點(diǎn),有些知識(shí)點(diǎn)需要同學(xué)們了解,下面是學(xué)習(xí)啦小編給大家?guī)?lái)的高一數(shù)學(xué)獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用知識(shí)點(diǎn),希
高一數(shù)學(xué)獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用知識(shí)點(diǎn)(一)
獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)
分類變量與列聯(lián)表:
變量的不同“值”表示個(gè)體所屬的不同類別,像這類變量稱為分類變量;
列出的兩個(gè)分類變量的頻數(shù)表,稱為列聯(lián)表。
獨(dú)立性檢驗(yàn):
為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評(píng)判標(biāo)準(zhǔn),構(gòu)造一個(gè)隨機(jī)變量
,其中n=a+b+c+d為樣本容量。利用隨機(jī)變量K2來(lái)確定在多大程度上可以認(rèn)為“兩個(gè)分類變量有關(guān)系”的方法,稱為兩個(gè)分類變量的獨(dú)立性檢驗(yàn)。
利用獨(dú)立性檢驗(yàn)來(lái)考察兩個(gè)分類變量是否有關(guān)系,并且能較精確地給出這種判斷的可靠程度,具體做法是:
(1)根據(jù)實(shí)際問(wèn)題需要的可信程度確定臨界值k0;
(2)利用公式(1),由觀測(cè)數(shù)據(jù)計(jì)算得到隨機(jī)變量K2的觀測(cè)值;
(3)如果k>k0,就以(1-P(K2≥k0))×100%的把握認(rèn)為“X與Y有關(guān)系”;否則就說(shuō)樣本觀測(cè)數(shù)據(jù)沒(méi)有提供“X與Y有關(guān)系”的充分證據(jù)。
獨(dú)立性檢驗(yàn)的性質(zhì):
獨(dú)立性檢驗(yàn)沒(méi)有直觀性,必須依靠K2的觀測(cè)值k作判斷。
獨(dú)立性檢驗(yàn)的一般步驟:
(1)根據(jù)樣本數(shù)據(jù)制成2×2列聯(lián)表;
(2)根據(jù)公式
,計(jì)算K2的值;
(3)查表比較K2與臨界值的大小關(guān)系,作統(tǒng)計(jì)判斷。
高一數(shù)學(xué)獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用知識(shí)點(diǎn)(二)
統(tǒng)計(jì)學(xué)的一種檢驗(yàn)方式。與適合性檢驗(yàn)同屬于X2檢驗(yàn)(即卡方檢驗(yàn),英文名:chi square test)
它是根據(jù)次數(shù)資料判斷兩類因子彼此相關(guān)或相互獨(dú)立的假設(shè)檢驗(yàn)。
假設(shè)有兩個(gè)分類變量X和Y,它們的值域分另為{x1, x2}和{y1, y2},其樣本頻數(shù)列聯(lián)表為:
y1y2總計(jì)
x1aba+b
x2cdc+d
總計(jì)a+cb+da+b+c+d
若要推斷的論述為H1:“X與Y有關(guān)系”,可以利用獨(dú)立性檢驗(yàn)來(lái)考察兩個(gè)變量是否有關(guān)系,并且能較精確地給出這種判斷的可靠程度。具體的做法是,由表中的數(shù)據(jù)算出隨機(jī)變量K^2的值(即K的平方)
K^2 = n (ad - bc) ^ 2 / [(a+b)(c+d)(a+c)(b+d)] 其中n=a+b+c+d為樣本容量
K^2的值越大,說(shuō)明“X與Y有關(guān)系”成立的可能性越大。
當(dāng)表中數(shù)據(jù)a,b,c,d都不小于5時(shí),可以查閱下表來(lái)確定結(jié)論“X與Y有關(guān)系”的可信程度:
P(K^2≥k)0.500.400.250.150.10
k0.4550.7081.3232.0722.706
P(K^2≥k)0.050.0250.0100.0050.001
k3.8415.0246.6357.87910.828
例如,當(dāng)“X與Y有關(guān)系”的K^2變量的值為6.109,根據(jù)表格,因?yàn)?.024≤6.109<6.635,所以“X與Y有關(guān)系”成立的概率為1-0.025=0.975,即97.5%。
與列表相關(guān)聯(lián)的概念
分類變量
其不同“值”表示相應(yīng)對(duì)象所屬的不同類別的變量,分類變量的取值一定是離散的,而且不同的取值僅表示相應(yīng)對(duì)象所屬的類別,如性別變量只取男、女兩個(gè)“值”,某商品的等級(jí)變量只取一級(jí)、二級(jí)、三級(jí)三個(gè)“值”,等等。分類變量的取“值”有時(shí)可用數(shù)字來(lái)表示,但這時(shí)的數(shù)字除了類別以外,沒(méi)有其他的含義.如用“0”表示“男”,用“1”表示“女”?
列聯(lián)表
分類變量的統(tǒng)計(jì)匯總表(頻數(shù)表).在獨(dú)立性檢驗(yàn)中,一般只研究?jī)蓚€(gè)分類變量,且每個(gè)分類變量只有兩個(gè)可取的值;這時(shí)得到的列聯(lián)表稱為2×2列聯(lián)表,如后面的案例中的關(guān)于患肺癌與否與吸煙與否的列聯(lián)表.?
獨(dú)立性檢驗(yàn)的基本思想
獨(dú)立性檢驗(yàn)的必要性
獨(dú)立性檢驗(yàn)的學(xué)習(xí)目標(biāo):了解獨(dú)立性檢驗(yàn)的基本思想
獨(dú)立性檢驗(yàn)的學(xué)習(xí)重點(diǎn):會(huì)對(duì)兩個(gè)分類變量進(jìn)行獨(dú)立性檢驗(yàn)
即為什么不能只憑列聯(lián)表中的數(shù)據(jù)和由其繪出的圖形下結(jié)論, 由列聯(lián)表可以粗略地估計(jì)出兩個(gè)變量(兩類對(duì)象)是否有關(guān)(即粗略地進(jìn)行獨(dú)立性檢驗(yàn)),但2×2列聯(lián)表中的數(shù)據(jù)是樣本數(shù)據(jù),它只是總體的代表,具有隨機(jī)性,故需要用獨(dú)立性檢驗(yàn)的方法確認(rèn)所得結(jié)論在多大程度上適用于總體.關(guān)于這一點(diǎn),在后面的案例中還要進(jìn)一步說(shuō)明.
獨(dú)立性檢驗(yàn)的原理及步驟
獨(dú)立性檢驗(yàn)是一種假設(shè)檢驗(yàn)(先假設(shè),再推翻假設(shè)),它的原理及步驟與反證法類似.
反證法假設(shè)檢驗(yàn)
要證明結(jié)論A想說(shuō)明假設(shè)H1(兩個(gè)分類變量,即兩類對(duì)象有關(guān))成立
在A不成立的前提下進(jìn)行推理
在H1不成立,即H0(兩類對(duì)象無(wú)關(guān),即相互獨(dú)立)成立的條件下進(jìn)行推理,
推出矛盾,意味著結(jié)論A成立,
推出小概率事件(概率不超過(guò)α,α一般為0.001,0.01,0.05或0.1)發(fā)生,意味著H1成立的可能性很大(可能性為1-α),
沒(méi)有找到矛盾,意味著不能確定A成立,
沒(méi)有推出小概率事件發(fā)生,意味著不能確定H1成立。
望對(duì)你有幫助。