Ali je lahko statistika zavajajoča?

Obstaja star pregovor, da številke ne lažejo, ampak lažnivci znajo ugotoviti. V nekem smislu to predstavlja previdnost ljudi glede statistike. Statistična razlaga lahko povzroči, da se podatki zdijo zavajajoči. Odvisno je od statistične interpretacije podatkov in od tega, katere številke so v ospredju kot ključne točke statističnega poročila.
Na primer, v gimnaziji učenci zdaj preučujejo mere osrednje težnje, ki so povprečje, mediana, način in razpon. Srednja vrednost je vsota vseh podatkov, deljena s številom podatkov. Na primer, lahko dobite vsoto rezultatov testov osebe in jo delite s številom testov, da določite oceno. Vendar pa lahko na povprečje vpliva tako imenovano izstopajoče, število, ki je daleč zunaj običajnega obsega testiranja. To lahko nakazuje, da je lahko povprečna vrednost zavajajoč način ocenjevanja uspešnosti.

Če oseba odlično opravi pet testov in ne opravi šestega testa in tako zasluži nič, povprečje odraža to. Če so na primer vsi testi vredni 100 točk, je povprečna ocena približno 85%. Vendar to v resnici ne nakazuje povprečne uspešnosti v tem primeru zaradi izstopa nič.

Drugo merilo osrednje težnje, ki se lahko uporabi, je ocena mediane. Mediana je srednja številka v skupini podatkov, razporejenih številčno. Če statistik ocenjuje za mediano, to morda ni reprezentativno za pravo povprečje uspešnosti ali karkoli, kar se ocenjuje. Mediana ne more upoštevati obsega podatkov, ki je lahko ogromen in je zato lahko zavajajoč.

Osrednja težnja, ovrednotena z načinom, pomeni zgolj ogled števila, ki se najpogosteje pojavlja v nizu podatkov. Tako ima izpit na primer način 100. Vendar to ne odraža, da oseba, ki opravlja test, ni opravila enega, kar je zavajajoče.

Drugi načini, na katere je statistika lahko zavajajoča, je način, na katerega se postavljajo vprašanja, morda v anketi, in stopnja, do katere je raziskava reprezentativen vzorec skupnosti. Če anketirate skupino srednješolcev in vprašate: “Kako ste zadovoljni s svojo izobrazbo na lestvici od 1 do 5?” lahko dobimo zelo različne odgovore, odvisno od tega, ali je skupina reprezentativna za »povprečnega« študenta.

Če anketiramo skupino učencev, ki vsi dobijo naravnost As in hodijo v fantastično, dobro financirano šolo, je objava takšnih podatkov kot reprezentativnega vzorca namerno zavajajoča. Če vprašamo učence različnih šol z različnimi ocenami, bo anketa verjetno bolj reprezentativna in pravičnejša. Če pa študente vprašamo, kaj mislijo o šolah, in nato objavimo rezultate kot reprezentativni vzorec splošne populacije, bodo odgovori zelo izkrivljeni.
Številke se lahko zdijo zelo konkretne, nekatere pa številke zavedejo preprosto zato, ker se zdijo dejstva in imajo nesporno vrednost. Tako se lahko statistični podatki pogosto uporabljajo na zavajajoč način, da ljudi navdušijo s številkami in da se sporne stvari zdijo bolj podobne resnici. Ugledni statistiki vedo, da je treba vprašanja posploševati in jih je treba zastaviti tudi ljudem, ki predstavljajo populacije.

Številke in statistike pa so lahko zavajajoče, ker ne predstavljajo posameznika. Lahko pokažejo, kako se ljudje »na splošno« odzivajo na idejo, izdelek ali političnega kandidata. Ne morejo pokazati, kako se bo počutila ena sama oseba v vseh svojih neskončno spremenljivih lastnostih.