Kaj je distribucija histograma?

Porazdelitev histograma v statistiki se nanaša na vzorce, oblike in lokacije enosmernih podatkovnih vrstic na histogramu. Kako in kje so vrstice porazdeljene, je mogoče uporabiti za analizo in sklepanje o podatkih. Analiza porazdelitve histograma je pomembna pri prepoznavanju lastnosti, kot so normalnost podatkov, multimodalne porazdelitve in izkrivljeni podatki.

Histogram je enosmerni prikaz podatkov, ki uporablja pravokotnike, sorazmerne po površini z razredom ali frekvencami koša, da vizualno prikaže značilnosti podatkov. Podatkovne točke v histogramu so organizirane v koše, sama porazdelitev histograma pa je vizualni približek frekvenčne porazdelitve podatkov ali funkcije gostote verjetnosti. Oblika porazdelitve se lahko spremeni glede na število zabojnikov.

Analiza porazdelitve histograma se pogosto uporablja kot kvalitativno preverjanje normalnosti podatkov. Čeprav obstajajo analitične metode za določanje normalnosti, se lahko histogrami uporabijo za hitro in zdravorazumsko preverjanje, da prihranijo čas. Če se podatki histograma zdijo približno enakomerni in osredotočeni na povprečje, se domneva, da so podatki normalni. Čeprav je ta vrsta kvalitativnega preverjanja hitra in relativno enostavna, je subjektivna, zato je treba uporabiti analitične metode, če je potreben višji standard natančnosti.

Določanje, ali nabor podatkov kaže poševnost, je še en način, kako se lahko uporabi analiza porazdelitve histograma. Asimetrija podatkov je opredeljena kot izrazita asimetrija podatkov. Negativna poševnost ali poševnica v levo je vidna v nizih podatkov z zelo malo nizkimi vrednostmi. Pozitivna poševnost ali poševnica v desno se pojavi v nizih podatkov z nekaj visokimi vrednostmi. Opazovanje porazdelitve histograma lahko razkrije izstope in napačne podatke.

Poleg razkrivanja značilnosti podatkov z enim načinom lahko oblika histograma razkrije tudi značilnosti multimodalnih podatkov. Multimodalni nabori podatkov vsebujejo več kot en način in so značilne po frekvenčnih porazdelitvah, ki imajo več kot en vrh ali maksimume. Politične pripadnosti v mestu, javnomnenjske raziskave odobravanja in telesne velikosti čebel so primeri nizov podatkov, ki so lahko multimodalni. Opazovanje oblike histograma in opazovanje različnih vrhov v multimodalnih podatkih lahko raziskovalcu pogosto zagotovi več vpogleda kot preprosti enosmerni statistični izračuni.

Analiza histogramov in porazdelitev podatkov sta močno odvisni od izbranih velikosti pladnja. V praksi je mogoče število zabojnikov oceniti tako, da vzamemo kvadratni koren iz števila opazovanj, čeprav se lahko uporabijo druge velikosti zabojnikov. Učitelj se lahko na primer odloči za analizo testnih ocen tako, da izbere velikosti koša, ki odražajo ocene črk.