Idee
Die Binomialverteilung entsteht, wenn man ein Bernoulli-Experiment mehrere Male wiederholt, und an der gesamten Anzahl der Erfolge interessiert ist.
Im vorherigen Artikel zur Bernoulliverteilung haben wir ein Beispiel betrachtet, in dem wir auf einem Schießstand am Jahrmarkt einen einmaligen Schuß mit einer Trefferwahrscheinlichkeit von \(p=0.2\) abgeben. Wenn wir nun sechs Schüsse kaufen, folgt die Gesamtzahl der Treffer einer Binomialverteilung mit \(n=6\) und \(p=0.2\), oder:
\[ X \sim B(6, 0.2) \]
Träger
Bei sechs Schüssen auf dem Schießstand können wir zwischen 0 und 6 jede Trefferzahl haben. Man darf hier die Null nicht vergessen, das kann leicht vorkommen. Es ist nämlich durchaus möglich, gar keine Treffer zu landen. Der Träger im allgemeinen Fall sind alle Ganzzahlen von \(0\) bis \(n\), also
\[ \mathcal{T} = \{0, 1, \ldots, n\} \]
Dichte
Die Dichte der Binomialverteilung mit den Parametern \(n\) und \(p\) lautet
\[ f(x) = {n \choose x} p^x (1-p)^{n-x} \]
Erinnert euch, dass für diskrete Zufallsvariablen die Bezeichnungen \(f(x)\) und \(\mathbb{P}(X=x)\) dasselbe bedeuten. Die Wahrscheinlichkeit für drei Treffer ist also \(\mathbb{P}(X=3)\), oder kurz \(f(3)\).
Der Wert \({n \choose k}\) ist dabei der Binomialkoeffizient, der im Artikel Mathematische Symbole erklärt wird, und auch in der Kombinatorik angewendet wird.
Wenn man versteht, wie diese Formel zustandekommt, kann man sie sich sogar selbst herleiten, und muss nicht in einer Formelsammlung nachsehen (wenn nicht, ist das aber auch nicht so schlimm).
Am Beispiel des Schießstandes: Die Wahrscheinlichkeit, dass wir zwei Treffer erhalten werden, ist laut Formel \(f(2) = {6 \choose 2} (0.2)^2 (0.8)^4\). Interpretiert wird das so:
Die Wahrscheinlichkeit für einen Treffer (kurz: „T“) ist 0.2, die für eine Niete (kurz: „N“) ist 0.8. Wenn wir nun die Wahrscheinlichkeit für die Ergebnisfolge „TTNNNN“ ausrechnen, multiplizieren wir die Wahrscheinlichkeiten, und landen bei \(0.2^2 \cdot 0.8^4\). Dies ist aber nur eine von vielen Möglichkeiten, zwei Treffer zu erhalten. Zum Beispiel liefern die Schussfolgen „TNNNNT“, oder „TNTNNN“ dasselbe Ergebnis, und haben alle dieselbe Wahrscheinlichkeit: \(0.2^2 \cdot 0.8^4\).
Wieviele solcher Folgen mit zwei Treffern aus sechs Schüssen gibt es nun? Es sind genau \({6 \choose 2} = 15\), wie im Artikel Kombinationen erklärt wird.
So erklärt man sich also nacheinander die drei Faktoren der Formel, zuerst \(p^x\) (die Wahrscheinlichkeit für einen Treffer, potenziert mit der Anzahl an Treffern), dann \((1-p)^{n-x}\) (die Wahrscheinlichkeit für eine Niete, potenziert mit der Anzahl an Nieten), und dann \(n \choose k\)
Zwischenaufgabe
Berechne für das Beispiel Schießstand die Wahrscheinlichkeit, gar keinen Treffer zu erhalten, und überprüfe anhand der Abbildung oben, ob das Ergebnis plausibel ist.
Verteilungsfunktion
Für die Verteilungsfunktion gibt es hier keine einfache Formel. In manchen Büchern (oder Klausuren) gibt es eine Verteilungstabelle zum einfachen Ablesen. In allen anderen Fällen muss man die einzelnen Wahrscheinlichkeiten also von Hand summieren. Das heisst, wenn man die Wahrscheinlichkeit für höchstens zwei Treffer berechnen möchte, also \(\mathbb{P}(X \leq 2)\), rechnet man sich die Wahrscheinlichkeit für null Treffer, einen Treffer, und zwei Treffer aus, und summiert sie:
\[ \begin{align*} \mathbb{P}(X \leq 2) &= \sum_{x=0}^2 \mathbb{P}(X = x) \\ &= \mathbb{P}(X = 0) + \mathbb{P}(X = 1) + \mathbb{P}(X = 2) \end{align*} \]
Zwischenaufgabe
Berechne die Wahrscheinlichkeit für höchstens fünf Treffer, d.h. \(\mathbb{P}(X \leq 5)\).
Das war ziemlich aufwändig, oder? Bei der Binomialverteilung gibt es einen Trick, der die Berechnung der Verteilungsfunktion oft schneller machen kann. Solche Aufgaben kommen oft in Klausuren vor, so dass man diesen Trick am besten verinnerlicht:
Statt alle Wahrscheinlichkeiten von \(x=0\) bis \(x=5\) aufzusummieren, kann man äquivalent die Wahrscheinlichkeiten aller „Gegenereignisse“, also in diesem Fall \(f(6)\), von 1 abziehen, und man erhält dieselbe Zahl. Denn wenn die Wahrscheinlichkeit für höchstens fünf Treffer 0.9999 ist, dann ist die Wahrscheinlichkeit für mehr als fünf (also 6) Treffer genau die Gegenwahrscheinlichkeit, d.h. 1-0.9999 = 0.0001.
Ein weiteres Beispiel (und wer das nachvollziehen kann, hat die Idee vollständig kapiert):
Uns interessiert nun die Wahrscheinlichkeit, zwischen einem und fünf Treffern (inklusive der eins und der fünf) zu erhalten. Die folgenden drei Formulierungen entsprechen den jeweiligen Formeln, und alle drei Formeln drücken genau dasselbe aus:
- \(\mathbb{P}(1 \leq X \leq 5)\)
- Die Wahrscheinlichkeit, eine Trefferzahl zwischen (inklusive) 1 und 5 zu erhalten
- \(\mathbb{P}(X=1) + \mathbb{P}(X=2) + \mathbb{P}(X=3) + \mathbb{P}(X=4) + \mathbb{P}(X=5)\)
- Die Wahrscheinlichkeit für einen, zwei, drei, vier, oder fünf Treffer
- \(1 – \mathbb{P}(X=0) – \mathbb{P}(X=6)\)
- Die Wahrscheinlichkeit, alles außer 0 und 6 Treffer zu erhalten
Ausrechnen kann man diesen Wert nun über die zweite oder dritte Formel dieser Liste. Es kommt natürlich dieselbe Zahl raus, wobei der letztere Weg der schnellere ist. Wichtig ist hier aber, dass man die Wahrscheinlichkeit für null Treffer, also \(f(0)\), nicht vergisst. Das passiert im Eifer des Gefechts nämlich gerne.
Erwartungswert
Der Erwartungswert der Binomialverteilung ist einfach:
\[ \mathbb{E}(X) = n \cdot p \]
Da der Erwartungswert für ein einzelnes Experiment \(p\) ist (siehe Bernoulliverteilung), erwartet man bei \(n\) Wiederholungen genau die \(n\)-fache Anzahl, also \(n\cdot p\) Treffer.
Varianz
Die Varianz der Binomialverteilung ist
\[ \mathbb{V}(X) = n \cdot p \cdot (1-p). \]
Die Herleitung ist etwas aufwändiger, weshalb wir sie uns hier ersparen.
Erst einmal Danke für die Unterstützung, die diese Seite bietet!
Ich habe eine Frage zum Beispiel des Schießstandes: Weshalb heißt es dort 6 über 2 und nicht 7 über 2?
Da es auch die Möglichkeit gib, gar nicht zu treffen, müsste doch n = 7 sein, oder?
Hallo! Es gibt tatsächlich 7 verschiedene Möglichkeiten, aber nur 6 Schüsse, also 6 Versuche.
Die Möglichkeiten sind 0, 1, 2, 3, 4, 5, 6, das sind insgesamt 7.
In der Formel der Binomialverteilung wird aber n=6, also die Anzahl der Versuche (nicht: die Anzahl der Möglichkeiten) verwendet.
Ich hoffe das ist so verständlich erklärt 🙂
Viele Grüße
Alex
Hey Alex,
vielen Dank für deine Beiträge, die Beispiele sind wirklich gut erklärt.
Aber eine Frage habe ich noch: Hast du auch ein Beispiel zur Negativbinomialverteilung? Oder übersehe ich das nur? 🙂
z. Bsp. „wie viel Schüsse braucht man bis man den 4. Treffer erzielt hat bei p=0,2“
Und ist dies dann immer an eine fest vorgegebene Anzahl an Schussversuchen gebunden?
Lieben Dank und viele Grüße,
Diana
Hi Diana,
die Negative Binomialverteilung habe ich nicht mit in die Themen aufgenommen, da ich sie im Stoff für Nicht-Statistiker nie gesehen habe. Aber sie ist ja eine Weiterführung der Geometrischen Verteilung (nicht der Binomialverteilung – der Name ist nur ungünstig gewählt).
Die Anzahl der Schussversuche ist in der NB nicht vorgegeben, sondern ist das X das in die Dichte kommt. f(x=7) wäre also die Wahrscheinlichkeit, 7 Schussversuche zu brauchen, bis der 4. Treffer fällt.
Viele Grüße
Alex
Es gibt noch die Formel X + Y ~ B(n + m, p) . Diese gilt bei Unabhängigkeit. Könntest DU dazu evtl. ein Beispiel erklären?
Beim ersten Diagramm steht in der Beschreibung offenbar versehentlich Bernoulli anstatt Binomial.
Oh, richtig. Ich habs gerade korrigiert, vielen Dank!
Hallo,
Sollte die Lösung für die Wahrscheinlichkeit bei höchstens fünf Treffern nicht eigentlich lauten:
∑5i=0P(X=i)=0.2621+0.3932+0.2458+0.0819+0,0154+0.0015=0.9999
So wie es da steht, würde bei der Addition nicht 0,9999 heraus kommen
Mit freundlichen Grüßen
Hi Marvin,
ja, da habe ich beim Abschreiben P(X=4) übersehen 🙂
Vielen Dank für die Info, ich habs gerade korrigiert!
Gruß,
Alex
Müsste über dem Summenzeichen nicht auch statt der 4 eine 5 stehen?
Sind übrigens alles super Erklärungen hier!!!
Ups. Ja. Ich habs korrigiert, danke 🙂
Hallo!
Sollte die Formel für die Dichte heißen :
(n über k)*p^k*(1-p)^n-k
also entweder alles mit k, oder alles mit x, dann sollte es aber auch n über x sein.
Viele Grüße
Oh, das war ein Tippfehler. Vielen Dank, ich habs gerade korrigiert!
Viele Grüße,
Alex