Kaj je krivulja frekvenčne porazdelitve?

Krivulja porazdelitve frekvenc je vrsta deskriptivne statistike, prikazane kot graf, ki prikazuje pogostost pojavljanja dane spremenljivke, kjer x predstavlja neko mero pojavljanja spremenljivke, y pa število primerov na vsaki frekvenci. Pri zelo velikih populacijah naj bi krivulja frekvenčne porazdelitve podobna statističnemu idealu zvonaste krivulje in prevzema lastnosti normalne porazdelitve. Zvonasta krivulja – znana tudi kot normalna krivulja – je primerno poimenovana. Podoben je zaobljenemu zvoncu s simetričnimi konci, ki se zožijo navzdol in navzven proti ničelni frekvenci na osi x. Zvonova krivulja je prepolovljena z idealizirano identično srednjo vrednostjo (μ), mediano in načinom vseh izmerjenih podatkov, s polovico vsakega grafa na obeh straneh.

Če se domneva, da ima krivulja porazdelitve frekvence vzorca lastnosti idealne zvonaste krivulje, se lahko domnevajo tudi vidiki preučevane populacije. Poleg tega lahko standardne statistične formule zagotovijo stopnjo, do katere se je mogoče zanesti na takšne predpostavke. Z idealno zvonasto krivuljo se domneva, da so povprečje populacije, mediana in modus enaki. Izračun standardne deviacije, σ, nato poda mero »širjenja« podatkov o populaciji. V idealni krivulji se vse razen 0.25 odstotka skupnih podatkov populacije nahajajo znotraj plus ali minus treh standardnih odstopanj od srednje vrednosti krivulje porazdelitve frekvenc ali med μ-3σ in μ+3σ.

Medtem ko se idealna zvonova krivulja razlikuje od krivulje porazdelitve frekvence vzorca na več načinov, omogoča nekaj domnevnega razumevanja tako vzorčne populacije kot celo lokacije posamezne meritve znotraj celotne vzorčne populacije. V idealni krivulji bo 68 odstotkov vrednosti za spremenljivko, izmerjeno v vzorcu in verjetno v populaciji, znotraj enega standardnega odklona od povprečja v katero koli smer ali μ-1σ in μ+1σ. Če se premikamo naprej po zvonovi krivulji, bodo vrednosti za 95 odstotkov vzorca in populacije locirane znotraj plus ali minus dveh standardnih odstopanj od povprečja ali μ-2σ in μ+2σ. Na samih robovih krivulje frekvenčne porazdelitve vse razen 0.25 odstotka spadajo v plus ali minus tri standardne deviacije. Tiste redke meritve, ki ležijo v 0.25 odstotka, ki presegajo mere treh standardnih odstopanj, so znane kot izstopajoči in se pogosto odstranijo iz podatkov, ko se izvedejo sklepni izračuni.