Kaj je hipergeometrična porazdelitev?

Hipergeometrijska porazdelitev opisuje verjetnost določenih dogodkov, ko je zaporedje predmetov izvlečeno iz fiksnega niza, kot je izbira igralnih kart iz krova. Ključna značilnost dogodkov po hipergeometrični verjetnostni porazdelitvi je, da se predmeti med žrebanjem ne zamenjajo. Ko je določen predmet izbran, ga ni mogoče ponovno izbrati. Ta lastnost je najbolj pomembna pri delu z majhnimi populacijami.

Revizorji za oceno kakovosti uporabljajo hipergeometrično porazdelitev pri analizi števila izdelkov z napako v določeni skupini. Izdelke po testiranju pustimo na stran, ker ni razloga, da bi isti izdelek testirali dvakrat. Tako se izbira opravi brez zamenjave.

Poker verjetnosti se izračunajo z uporabo hipergeometrične porazdelitve, ker se karte v dani igri ne premešajo nazaj v krov. Sprva je na primer ena četrtina kart v standardnem kompletu piki, vendar verjetnost, da dobite dve karti in ugotovite, da sta obe piki, ni 1/4 * 1/4 = 1/16. Ko prejmete prvi pik, je v krovu manj pik, zato je verjetnost, da boste prejeli še en pik, le 12/51. Zato je verjetnost, da dobite dve karti in ugotovite, da sta obe piki, 1/4 * 12/51 = 1/17.

Predmeti se med žrebanjem ne zamenjajo, zato je verjetnost ekstremnih scenarijev zmanjšana za hipergeometrično porazdelitev. Lahko primerjamo, da dobimo rdeče ali črne karte iz standardnega kompleta z metanjem kovanca. Pošten kovanec bo polovico časa pristal na “glave”, polovica kart v standardnem kompletu pa je črna. Vendar pa je verjetnost, da boste pri metanju kovanca dobili pet zaporednih glav, večja kot verjetnost, da boste prejeli kombinacijo petih kart in ugotovili, da so vse črne karte. Verjetnost petih zaporednih glav je 1/2 * 1/2 * 1/2 * 1/2 * 1/2 = 1/32 ali približno 3 odstotke, verjetnost petih črnih kart pa je 26/52 * 25/ 51 * 24/50 * 23/49 * 22/48 = 253/9996 ali približno 2.5 odstotka.

Vzorčenje brez zamenjave zmanjša verjetnost ekstremnih primerov, vendar ne vpliva na aritmetično sredino porazdelitve. Povprečno pričakovano število glav, ko nekdo petkrat vrže kovanec, je 2.5, kar je enako povprečnemu številu črnih kart, pričakovanih v igri s petimi kartami. Tako kot je zelo malo verjetno, da je vseh pet kartic črnih, je tudi malo verjetno, da nobena od njih ni. To je opisano v matematičnem jeziku z besedo, da zamenjava zniža varianco, ne da bi vplivala na pričakovano vrednost distribucije.