Kaj je poševna distribucija?

Poševna porazdelitev se nanaša na porazdelitev verjetnosti, ki je po naravi neenakomerna in asimetrična. Za razliko od standardne normalne porazdelitve, ki po obliki spominja na zvonasto krivuljo, so poševne porazdelitve premaknjene na eno stran in imajo na eni strani daljši rep glede na drugo stran mediane. Druga stran krivulje bo imela gručast vrh vrednosti, kjer se nahaja večina podatkovnih točk. Ta vrsta porazdelitvene krivulje je običajno razvrščena kot ima pozitivno ali negativno poševnost, odvisno od smeri premika krivulje.

Na splošno velja, da ima poševna porazdelitev pozitivno poševnost, če je rep krivulje daljši na desni strani v primerjavi z levo stranjo. Ta nagnjena porazdelitev se imenuje tudi nagnjena v desno, ker ima desna stran širšo razširitev podatkovnih točk. Pozitivne poševne krivulje imajo največje število vrednosti proti levi strani krivulje.

Nasprotno pa imajo negativno poševne distribucije največ podatkovnih točk na desni strani krivulje. Te krivulje imajo daljše repove na levi strani, zato naj bi bile poševne v levo. Pomembno pravilo pri določanju smeri nagiba je upoštevati dolžino repa in ne lokacijo povprečja ali mediane. To je zato, ker poševnost na koncu povzročijo najbolj oddaljene vrednosti, ki raztezajo krivuljo proti tej strani grafa.

Razumevanje lastnosti poševne porazdelitve je pomembno v številnih statističnih aplikacijah. Mnogi ljudje domnevajo, da podatki sledijo zvonasti krivulji ali normalni porazdelitvi, zato tudi domnevajo, da ima graf nič poševnosti. Te predpostavke pa bi jih lahko pripeljale do napačne razlage informacij o dejanski distribuciji.

Poševna porazdelitev je sama po sebi neenakomerna, zato ne bo sledila standardnim normalnim vzorcem, kot je standardna deviacija. Normalne porazdelitve vključujejo eno standardno deviacijo, ki velja za obe strani krivulje, vendar bodo poševne porazdelitve imele različne vrednosti standardnega odklona za vsako stran krivulje. To je zato, ker obe strani nista zrcalni podobi ena druge, zato enačb, ki opisujejo eno stran, ni mogoče uporabiti za drugo. Vrednost standardnega odklona je na splošno večja za stran z daljšim repom, ker je na tej strani širše razpršenost podatkov v primerjavi s krajšim repom.