Kaj je Box Plot?

Škatla ali diagram škatle in brkov je metoda za organiziranje številskih podatkov vzdolž ene številske premice, ki je lahko vodoravna ali navpična. Dejansko polje, ko je ploskev vodoravno, leži nekoliko nad številsko črto in je sestavljeno iz treh navpičnih črt, povezanih z vodoravnimi črtami. Vodoravne meje polja predstavljajo prvi in ​​tretji kvartil (25. in 75. percentil), ločeni s srednjo črto, ki je mediana podatkov ali 50. percentil. Na obeh straneh okvirja od sredine vodoravnih črt se raztezajo navpične črte, včasih imenovane brki. Ko ti dosežejo minimalno in največje število nabora podatkov, se končajo z manjšimi vodoravnimi črtami, čeprav se to lahko nekoliko razlikuje glede na razpršenost podatkov.

Obstaja nekaj pomembnih elementov, ki sestavljajo dober okvirni načrt, in nekaj številk, ki jih morajo ljudje vedeti, ko ustvarjajo te grafikone. Prvi od njih se imenuje povzetek petih številk, pogosto skrajšano kot pet številk. vsota. To je seznam prvega in tretjega kvartila, mediane ter najmanjšega in največjega števila podatkov. V nekaterih aplikacijah jih bodo morali ljudje navesti v bližini grafa, čeprav lahko analiza grafa z dobro številsko premico te številke izpelje tudi s pogledom na tri vodoravne črte in končne brke. To ni vprašanje kokoš/jajce za osebo, ki riše zaplet, ker pet štev. vsota. je treba uporabiti za ustvarjanje ploskve.

Ljudje morajo poznati tudi številko, imenovano interkvartilni razpon (IQR). Če odštejemo prvi kvartil od tretjega kvartila, dobimo IQR, z uporabo različne programske opreme ali znanstvenih kalkulatorjev pa lahko to številko in povzetek petih številk dobimo tudi z vnosom vseh podatkov. IQR je pomemben, ker se črte, ki segajo od polja, običajno raztezajo le do 1.5-kratnega IQR. Podatki nad to točko so označeni s pikami namesto neprekinjene črte. Te pike pogosto kažejo, da imajo podatki izstopajoče.

Obstajajo različne uporabe za škatlo. Nad eno številsko premico je mogoče narisati več grafov in bi lahko primerjali podobne nize podatkov, ki jih razlikuje kakšen pomemben dejavnik. Na primer, znanstveniki ali statistiki lahko zabeležijo srčni utrip moških in žensk, nato pa sestavijo dva zložena okvirja, da poiščejo pomembne razlike v razponu in kvartilih.

Škatle ne obravnavajo frekvence podatkov. Pomanjkanje dodatne lestvice (navpične ali vodoravne) izpušča informacije o ponavljajočih se številkah, velikosti nabora podatkov in večini posameznih številk. Oseba, ki si ogleduje okvirni graf, bo najbolj razumela povzetek petih številk, obseg in ali imajo podatki kakršne koli izstopajoče. Velikost škatle, razmerje med mediano in kvartili in dolžina brkov lahko pokažejo, ali so podatki izkrivljeni, vendar ne morejo govoriti o stvareh, kot so povprečje, način ali standardni odklon. Drugi grafikoni, kot so histogrami, so lahko bolj uporabni, če želijo ljudje predstaviti stvari, kot je frekvenca, ali izpeljati boljšo sliko o porazdelitvi podatkov.