Kaj je zakon velikih števil?

Zakon velikih števil je statistični izrek, ki domneva, da se bo vzorčno povprečje naključnih spremenljivk približevalo teoretičnemu povprečju, ko se bo število naključnih spremenljivk povečalo. Z drugimi besedami, večji kot je statistični vzorec, večja je verjetnost, da dobimo natančnejše rezultate celotne slike. Nižje vzorčne številke lažje izkrivljajo rezultat, čeprav so lahko tudi precej natančne.

Kovanec je dober primer, ki ga lahko uporabimo za prikaz zakona velikih števil. Pogosto se uporablja v začetnih tečajih statistike, da se pokaže, kako učinkovit je lahko ta zakon. Večina kovancev ima dve strani, glavo in rep. Če je kovanec obrnjen, bi logika rekla, da so možnosti, da kovanec pristane na strani z glavo ali repom, enake. Seveda je to odvisno od ravnotežja kovanca, njegovih magnetnih lastnosti in drugih dejavnikov, a na splošno je to res.

Če kovanec obrnete le nekajkrat, rezultati morda ne kažejo, da so enake možnosti, da bi pristal na glavi in ​​repu. Na primer, če štirikrat vržete kovanec, lahko dobite tri glave in en rep. Lahko bi dal celo štiri glave in brez repa. To je statistična anomalija.

Vendar zakon velikih števil pravi, da ko se vzorec povečuje, bodo ti rezultati najverjetneje v skladu z resnično predstavitvijo možnosti. Če kovanec obrnete 200-krat, obstaja velika verjetnost, da bo število krat, ko bo pristal na glavi in ​​repu, približno 100. Vendar zakon ali velika števila ne predvidevajo, da bo vsaka natanko 100, le da bo verjetno bolj reprezentativna za resnični obseg možnosti kot manjše povprečje.

Zakon velikih števil kaže, zakaj je potreben ustrezen vzorec. Statistični podatki se uporabljajo, ker ni dovolj časa ali pa je nepraktično, da bi celotno populacijo uporabili kot vzorec. Vendar vzorec populacije pomeni, da bodo reprezentativni člani populacije, ki se ne štejejo. Da bi zagotovili, da vzorec odraža celotno populacijo, je potrebno ustrezno število naključnih spremenljivk.

Določanje, kako velik vzorec je običajno potreben, je odvisno od številnih dejavnikov, glavni je interval zaupanja. Na primer, statistični interval zaupanja je stopnja gotovosti, da bo populacija spadala v določene parametre. Določanje intervala zaupanja 95 odstotkov bi pomenilo, da obstaja razumna gotovost, da bo 95 odstotkov prebivalstva sodilo v te parametre. Vzorec, potreben za določene intervale zaupanja, je določen s formulo, ki upošteva število v populaciji in želeni interval zaupanja.
Čeprav je zakon velikih številk preprost koncept, so lahko izreki in formule, ki ga upravičijo, precej zapleteni. Preprosto povedano, zakon ali velika števila je najboljša razlaga, zakaj so večji vzorci boljši od manjših. Nihče ne more pozitivno zagotoviti, da bo statistično vzorčenje popolnoma natančno, vendar ta zakon pomaga preprečiti številne netočne rezultate.