Kaj so inferencialne statistike?

Inferencialna statistika so podatki, ki se uporabljajo za posploševanje populacije na podlagi vzorca. Zanašajo se na uporabo tehnike naključnega vzorčenja, ki je zasnovana tako, da zagotovi reprezentativnost vzorca. Preprost primer inferencialne statistike je verjetno mogoče najti na prvi strani skoraj vsakega časopisa, pri čemer kateri koli članek trdi, da »X % populacije Y misli/deluje/čuti/verjame Z«. Izjava, kot je “33 % 24-30 letnikov raje torto kot pito”, se opira na inferencialne statistike. Bilo bi nepraktično spraševati vsakega posameznika, starega od 24 do 30 let, o njegovih željah po sladicah, zato je bil namesto tega anketiran reprezentativni vzorec populacije, da bi sklepali o populaciji kot celoti.

Inferencialna in deskriptivna statistika
Drug način uporabe anketnih podatkov je v obliki deskriptivne statistike. V tem primeru so podane izjave, ki preprosto opisujejo zbrane podatke. Možno je, da se isti niz podatkov uporabi na opisni ali sklepajoči način. Na primer, pred volitvami v ZDA bi lahko bilo 1,000 ljudi v mestu zaslišanih o njihovih volilnih namerah, tako da jih je 430 reklo, da bi glasovali za demokrate, 410 jih je reklo, da bi glasovali za republikance, 160 pa jih je neodločenih ali noče povedati. . Primer opisne uporabe teh podatkov bi bil, če bi preprosto navedli, da namerava 43 % od 1,000 anketiranih ljudi v tem mestu glasovati za demokrate. Izjava sklepa bi bila “Demokrati imajo 2-odstotno prednost” – sklep o volilnih namerah na splošno je bil izpeljan iz vzorca.

Metode
Preden naredite kakršne koli splošne zaključke iz vzorca, je pomembno, da uporabite pravilne metode, sicer ti sklepi morda ne bodo veljavni. Pogosti viri napak so v načinu sestavljanja vzorca, številni dejavniki pa lahko vplivajo na veljavnost vzorčne populacije. Velikost je kritična, saj manjša kot je velikost, večje je tveganje, da vzorec ne bo reprezentativen za celotno populacijo. Prav tako je treba paziti na odpravo virov pristranskosti. V zgornjem primeru imajo lahko dejavniki, kot so starost, spol in dohodek, precejšen vpliv na volilne namene, tako da če vzorec ni bil sestavljen tako, da bi odražal splošno populacijo, sklep morda ne bo veljaven.

Metode vzorčenja je treba izbrati previdno; na primer, če je nekdo vzel primerni vzorec, ki vključuje vsako 10. ime v telefonskem imeniku ali vsakega 10. mimoidočega v nakupovalnem središču, ta vzorec morda ne bo veljaven. Upoštevati je treba tudi pristranskost vzorca. Možno je na primer, da bodo ljudje, stari od 24 do 30 let, ki se udeležijo konvencije ljubiteljev pite, bolj verjetno uživali v piti kot v torti, kar bi pomenilo, da raziskava o željah po sladicah, ki je kot vzorec uporabila udeležence konference, ne bi bila zelo reprezentativna.

uporabljate
Uporaba inferencialne statistike je temelj raziskovanja populacij in dogodkov, saj je običajno težko in pogosto nemogoče raziskati vsakega člana populacije ali opazovati vsak dogodek. Namesto tega raziskovalci poskušajo dobiti reprezentativen vzorec in ga uporabijo kot osnovo za splošnejše sklepe. Na primer, ne bi bilo mogoče preveriti zdravstvene kartoteke vsakega kadilca, da bi ugotovili povezavo med kajenjem in pljučnim rakom, vendar so številni naključni vzorci, ki primerjajo kadilce z nekadilci in odpravljajo druge dejavnike tveganja, trdno ugotovljeni. ta povezava.

Raziskovalci, ki delajo z inferencialno statistiko, poskušajo ohraniti svoje metode in prakse pregledne in čim bolj stroge, da zagotovijo celovitost svojih rezultatov. Izjave, ki temeljijo na neformalnih anketah in hitrih anketah, morda niso zelo uporabne, vendar so na področjih, kot so medicinske raziskave in klinična preskušanja, standardi veliko strožji, inferenčna statistika pa je zagotovila ogromno dragocenih informacij. Na drugih področjih se uporabljajo vsak dan za obsežne posplošitve o populacijah, ki lahko oblikujejo javno politiko, oblikovanje izdelkov, trženje in politične kampanje.