Idee
Während die Binomialverteilung für Experimente mit gleichbleibender Wahrscheinlichkeit für „Erfolg“ verwendet wird, wendet man die hypergeometrische Verteilung dann an, wenn sich die Grundgesamtheit im Laufe des Experiments verändert. Anders ausgedrückt: Mit der Binomialverteilung beschreibt man Experimente mit Zurücklegen, und mit der hypergeometrischen Verteilung Experimente ohne Zurücklegen.
Habe ich also einen Beutel mit 10 roten und 5 weißen Kugeln, und nehme viermal hintereinander eine Kugel aus dem Beutel, die ich danach wieder zurücklege, so dass wieder insgesamt 15 Kugeln im Beutel sind, dann kann ich mit der Binomialverteilung die Verteilung der Anzahl der gezogenen weißen Kugeln beschreiben. Das wäre nämlich eine Binomialverteilung mit
Möchte man stattdessen die Kugeln nicht zurücklegen, verwendet man die hypergeometrische Verteilung. Das Experiment, das man mit ihr modellieren kann, sieht also zum Beispiel wie folgt aus: Man hat einen Beutel mit 15 Kugeln, wovon 5 Kugeln weiß sind. Man nimmt nun nacheinander vier Kugeln aus dem Beutel, ohne sie danach zurückzulegen. Nun kann ich mit Hilfe der hypergeometrischen Verteilung ausrechnen, mit welcher Wahrscheinlichkeit ich keine, eine, zwei, drei, oder vier weiße Kugeln in meiner Stichprobe erhalte.
Parameter
Für die hypergeometrische Verteilung ist es nun im Gegensatz zur Binomialverteilung wichtig, wieviele Kugeln jeder Sorte im Beutel liegen. Daher hat diese Verteilung drei Parameter:
, die Anzahl der Elemente insgesamt. Im oberen Beispiel haben wir Kugeln. , die Anzahl der Elemente, die die gewünschte Eigenschaft besitzen („Treffer“). Hier ist , die Anzahl der weißen Kugeln. , die Anzahl der Kugeln, die als Stichprobe gezogen wird. Hier ist .
Wenn wir unser Beispiel mit der Zufallsvariablen
Träger
Die hypergeometrische Verteilung hat denselben Träger wie die Binomialverteilung: Wenn man
Dichte
Die Dichte einer hypergeometrisch verteilten Zufallsvariable
In unserem Beispiel ist also die Wahrscheinlichkeit, bei 4 gezogenen Kugeln 2 weiße Kugeln darunter zu finden, gleich

Die Dichte
Beachte hier, dass die Werte
Verteilungsfunktion
Für die Verteilungsfunktion gibt es hier, wie bei der Binomialverteilung, keine kürzere Formel, sondern man summiert einfach die Dichte über alle möglichen Ausprägungen aus:

Die Verteilungsfunktion
Möchte ich also die Wahrscheinlichkeit wissen, höchstens drei weiße Kugeln in meiner Stichprobe zu erhalten, muss ich die einzelnen Wahrscheinlichkeiten aufsummieren:
Einen Trick gibt es allerdings in den Fällen, in denen man viele einzelne Wahrscheinlichkeiten im Taschenrechner berechnen müsste: Über die Gegenwahrscheinlichkeit lässt sich derselbe Wert viel schneller berechnen:
Erwartungswert
Der Erwartungswert ist, analog zur Binomialverteilung, einfach
Varianz
Die Varianz berechnet man durch
Beispielaufgabe
Mit Hilfe der hypergeometrischen Verteilung können wir zum Beispiel die folgenden Fragen beantworten:
- Wie hoch ist die Wahrscheinlichkeit, beim deutschen Lotto (6 aus 49) drei gerade und drei ungerade Zahlen zu ziehen?
- Wie hoch ist dort die Wahrscheinlichkeit für sechs gerade Zahlen?
In beiden Fragen verwenden wir eine Zufallsvariable mit der Verteilung
Denn es gibt insgesamt
Hallo
Der Träger ist mit 0,1,…n angegeben. Wenn es aber insgesamt weniger Erfolge als Ziehungen gibt wäre der Träger doch nur 0,1,…M. Wie würde man dies richtig ausdrücken?
T = { 0,…min[n,M] } ?
Hallo Daniel,
stimmt, wenn man 7 Kugeln aus einem Eimer mit 6 schwarzen und 4 weißen Kugeln zieht, dann sind 0 Treffer (Treffer = weiße Kugel) unmöglich, und 5, 6, 7 Treffer auch unmöglich.
Ganz korrekt ist der Träger dann T = { max(0, n+M-N) , …, min(n, M) }
Viele Grüße
Alex
Hei,
wenn die Dichtefunktion doch nur die Dichte einer Wahrscheinlichkeit in einem bestimmten Intervall angibt und die Wahrscheinlichkeit eines einzelnen Punktes = 0 ist, wie kann es dann sein, dass wir die Wahrscheinlichkeit für den genauen „Punkt“ (Fall) berechnen können, dass wir 2 weiße Kugeln ziehen?
Danke 🙂
Hi,
dass die Wahrscheinlichkeit für einen bestimmten Punkt Null ist, gilt nur für stetige Verteilungen. Für alle diskreten Verteilungen (auch die hypergeometrische Verteilung) ist das nicht der Fall.
VG
Alex
Hallo, in dem Beispiel unten müsste man doch bei der Aufgabenstellung „drei gerade und drei ungerade“ zuerst die ZV mit der Verteilung X – HG(49,24,6) für die UNGERADEN Zahlen wählen und dann zusätzlich eine weitere ZV nehmen mit der Verteilung HG(49,25,6), da es beim Lotto 6 aus 49 jeweils 24 gerade Zahlen und 25 ungerade Zahlen gibt?
Eine Zufallsvariable reicht da. Man modelliert mit f(3) z.B. die Wahrscheinlichkeit dass genau drei gerade Zahlen dabei sind. Das bedeutet aber automatisch dass die übrigen drei Zahlen dann ungerade sind.
Stimmt, klingt logisch 🙂
Vielen Dank für die schnelle Antwort
Gruß
Hi, in dem Beispiel der Dichte Funktion müsste doch bei N=15, n=4 und M=5 das Ergebnis 0,32967 rauskommen. oder was sachst du dazu?
Gruß Andre
Yes. Da habe ich wohl was falsch abgetippt. Ist korrigiert – vielen Dank! 🙂
– Alex
Hallo 🙂
Bei der Dichtefunktion, wenn man x=2 macht gibt es ja diese 0.32…. in der Grafik ist das aber viel tiefer.
Hat das einen Grund, mache ich einen Überlegungsfehler oder ist die Grafik falsch?
Danke 🙂
Hi,
in der Grafik war tatsächlich ein Fehler – sorry 🙂
Ich hab sie gerade korrigiert, jetzt sollte es passen!
VG,
Alex