Kaj je Fisherjev natančen test?

Fisherjev natančen test je test statistične pomembnosti, ki se uporablja za majhne velikosti vzorcev. Je eden od številnih testov, ki se uporabljajo za analizo tabel kontingentnosti, ki prikazujejo interakcijo dveh ali več spremenljivk. Ta test je izumil angleški znanstvenik Ronald Fisher in se imenuje natančen, ker natančno izračuna statistično pomembnost in ne z uporabo približka.

Da bi razumeli, kako deluje Fisherjev natančen test, je bistveno razumeti, kaj je tabela izrednih razmer in kako se uporablja. V najpreprostejšem primeru obstajata samo dve spremenljivki, ki ju je treba primerjati v tabeli kontingentnosti. Običajno so to kategorične spremenljivke. Na primer, predstavljajte si, da izvajate študijo o tem, ali je spol povezan z lastništvom hišnih ljubljenčkov. V tej študiji sta dve kategorični spremenljivki: spol, moški ali ženska, in lastništvo hišnih ljubljenčkov.

Kontingenčna tabela je postavljena z eno spremenljivko na vrhu, drugo pa na levi strani, tako da je za vsako kombinacijo spremenljivk polje. Vsote so navedene spodaj in skrajno desno. Evo, kako bi izgledala tabela izrednih razmer za primer študije, ob predpostavki ankete 24 posameznikov:

Lastnik hišnih ljubljenčkov
Ni lastnik hišnih ljubljenčkov
Skupaj za plačilo
Moški
1
9
10
Moški
11
3
14
Skupaj za plačilo
12
12
24

Fisherjev natančen test izračuna odstopanje od ničelne hipoteze, ki trdi, da v podatkih ni pristranskosti ali da obe kategorični spremenljivki nimata nobene korelacije med seboj. V primeru tega primera je ničelna hipoteza, da imajo moški in ženske enako verjetnost, da imajo hišne ljubljenčke. Fisherjev natančen test je bil zasnovan za tabele izrednih razmer z majhno velikostjo vzorca ali velikimi neskladji med številkami celic, kot je prikazano zgoraj. Za tabele izrednih razmer z veliko velikostjo vzorca in dobro uravnoteženimi številkami v vsaki celici tabele Fisherjev natančen test ni natančen, zato je prednosten test hi-kvadrat.

Pri analizi podatkov v zgornji tabeli Fisherjev natančen test služi za določitev verjetnosti, da je lastništvo hišnih ljubljenčkov neenakomerno porazdeljeno med moške in ženske v vzorcu. Vemo, da ima deset od 24 anketiranih ljudi hišne ljubljenčke in da je 12 od 24 samic. Verjetnost, da bo deset naključno izbranih ljudi iz vzorca sestavljalo devet žensk in en moški, bo nakazala statistično pomembnost porazdelitve lastnikov hišnih ljubljenčkov v vzorcu.

Verjetnost je označena s črko p. Fisherjev natančen test določi p-vrednost za zgornje podatke tako, da pomnožimo faktoriale vsakega mejnega vsota — v zgornji tabeli 10, 14, 12 in 12 — in rezultat delimo z zmnožkom faktorialov vsake številke celice in skupnega seštevka. Faktorial je zmnožek vseh pozitivnih celih števil, ki so manjša ali enaka danemu številu. 10!, ki se izgovarja kot »deset faktorial«, je torej enako 10X9X8X7X6X5X4X3X2X1 ali 3,628,800.
Za zgornjo tabelo je torej p= (10!)(14!)(12!)(12!)/(1!)(9!)(11!)(3!)(24!). Z uporabo kalkulatorja lahko ugotovimo, da je verjetnost, da dobimo številke v zgornji tabeli, pod 2 %, precej pod možnostjo, če je ničelna hipoteza resnična. Zato je zelo malo verjetno, da v vzorcu študije ni nobene nepredvidenosti ali pomembne povezave med spolom in lastništvom hišnih ljubljenčkov.