Kaj je neparametrični test?

Neparametrični test je vrsta testiranja statističnih hipotez, ki ne predpostavlja normalne porazdelitve. Zaradi tega se neparametrični testi včasih imenujejo brez distribucije. Neparametrični test je bolj robusten kot standardni test, na splošno zahteva manjše vzorce, manj verjetno je, da bodo nanj vplivala skrajna opazovanja in ga je mogoče uporabiti z manj predpostavkami. Po drugi strani so lahko neparametrični testi manj učinkoviti kot njihovi standardni kolegi, zlasti če je populacija resnično normalno porazdeljena. Neparametrično testiranje je še posebej učinkovito pri vprašanjih, ki se ukvarjajo s frekvencami in razmerji.

Standardno testiranje hipoteze primerja vzorec iz testne populacije z vzorcem iz kontrolne populacije, da ugotovi, ali je testna populacija statistično primerljiva s kontrolno populacijo. Če je razlika med parametrom ali parametri vzorca – običajno povprečjem in/ali varianco – dovolj velika, se lahko oceni, da se preskusni vzorec razlikuje od kontrolne populacije. Takšno parametrično testiranje zahteva, da parametri izhajajo iz normalne porazdelitve.

Matematično je bilo dokazano, da se bo velikost vzorca 30 ali več obnašala približno kot normalna porazdelitev, zato se ta zahteva na splošno domneva. Če pa domneva ni upravičena, rezultati testiranja morda ne bodo veljavni. Neparametrično testiranje se izogiba tej predpostavki.

Namesto tega neparametrično testiranje hipotez običajno preučuje podatke tako, da jih kategorizira ali razvrsti. Če sta vzorčna in kontrolna populacija enaki in če so bili podatki pravilno zbrani, so vse razlike med njunimi kategorijami ali uvrstitvami izključno rezultat naključja. Če je verjetnost, da bi se te razlike lahko pojavile po naključnem naključju, imenovana tudi P-vrednost, manjša od izbrane pomembne verjetnosti, običajno 5 odstotkov ali 1 odstotek, potem preizkuševalec zavrne hipotezo, da sta vzorčna in kontrolna populacija enaki in sklepa, da so različni.

Eden od pogostih neparametričnih testov je Hi-kvadrat test, ki se uporablja za primerjavo opazovanih frekvenc ali razmerij. Ko se pregleda samo en niz frekvenc, se to pogosto imenuje test dobrote prileganja in se uporablja za ugotavljanje, ali opazovane frekvence ustrezajo obsegu, ki bi ga pričakovali. Na primer, lahko uporabimo test dobrote prileganja, da ugotovimo, ali je bila miza za ruleto prirejena s primerjavo rezultatov mize z rezultati, ki jih napoveduje teorija verjetnosti, ali da se ugotovi, ali je bilo zdravilo proti glavobolu učinkovito s primerjavo deleža ljudi, ki imajo glavobol. izboljšalo zdravilo glede na delež ljudi, ki se jim je glavobol izboljšal, ko so jemali placebo. Če se preučita dve frekvenci, se lahko uporabi neparametrični test hi-kvadrat za testiranje korelacije ali neodvisnosti med faktorji. Politični anketarji pogosto iščejo korelacijo med socialnimi, ekonomskimi ali demografskimi dejavniki in političnimi prepričanji, na primer ugotavljajo, ali obstaja povezava med izobrazbo osebe in ali se strinja s tem, kako deluje izvoljeni uradnik.

Drug neparametrični test je Wilcoxonov test vsote rangov, ki se na splošno uporablja v istih situacijah kot standardno testiranje parametričnih hipotez. Namesto da bi preučili povprečje vsakega vzorca, Wilcoxonov test preuči rang vsake vrednosti, če sta dva vzorca razvrščena od najmanjšega do največjega. Če sta dva vzorca enaka, je treba vsako skupino enakomerno razporediti po razvrstitvi. Če je ena skupina združena na spodnjem ali zgornjem koncu razvrstitve, to pomeni, da sta skupini različni.
Recimo, da je nekdo želel ugotoviti, ali so animirani filmi daljši ali krajši od neanimiranih filmov. Za standardni test bi določil povprečno trajanje za vzorec animiranih filmov in za vzorec filmov v živo ter primerjal razliko z varianco vzorcev. Za Wilcoxonov neparametrični test se časi filma razvrstijo od najmanjšega do največjega in seštejejo vrste časov animiranega filma.

Oseba bi lahko izračunala verjetnost, da bi bila vsota rangov tolikšna ali manjša, tako da bi določila število možnih naročil z dano vsoto ranga in skupno število možnih naročil, izračun, ki je preprost glede na dovolj moč izračuna surove sile. Z dvema majhnima vzorcema po šest filmov je na voljo že 924 možnih razvrstitev, število, ki se z dodajanjem filmov hitro povečuje. Druga možnost je, da so objavljene tabele, ki podajajo verjetnosti, ki ustrezajo danim vsotam rangov za dane velikosti vzorcev. Te je mogoče najti v statističnih besedilih ali na spletu.
Neparametrično testiranje je rastoče področje. Uporablja se lahko na katerem koli področju, na katerem so bile uporabljene tudi bolj konvencionalne statistike. Aplikacije so še posebej pogoste v družboslovju in medicini, še posebej, kadar normalna distribucija ne velja.