Das KI für den Erwartungswert folgt einem ähnlichen Prinzip wie das bereits besprochene KI für einen Anteilswert:
In den meisten Fällen in der Realität ist die wahre Varianz nicht bekannt, und wird auch einfach aus der Stichprobe geschätzt. In einer Klausur wird der Fall, dass die Varianz
Die Formeln für die Konfidenzintervalle der beiden Varianten unterscheiden sich nur minimal:
- Wenn die wahre Varianz
bekannt ist, nehmen wir in der Formel direkt die wahre Varianz – anderenfalls schätzen wir sie durch die Stichprobenvarianz und nehmen diesen Wert. - Wenn die wahre Varianz
bekannt ist, dann nehmen wir das Quantil der Normalverteilung – anderenfalls nehmen wir das Quantil der t-Verteilung mit Freiheitsgraden.- Wenn wir allerdings eine ausreichend große Stichprobe haben, z.B.
, dann können wir doch wieder das Quantil der Normalverteilung verwenden.
- Wenn wir allerdings eine ausreichend große Stichprobe haben, z.B.
Sehen wir uns die Formeln der beiden KIs also an:
KI für den Erwartungswert , falls Varianz bekannt
Für das Konfidenzintervall brauchen wir die folgenden Werte:
- Die Stichprobengröße
- Den Mittelwert der Stichprobe
- Die wahre Varianz
- In der Formel brauchen wir allerdings ihre Wurzel, die Standardabweichung, also
. Diese beiden Werte zu verwechseln, ist ein häufiger Fehler in der Klausur.
- In der Formel brauchen wir allerdings ihre Wurzel, die Standardabweichung, also
- Die gewünschte Irrtumswahrscheinlichkeit
- Damit berechnen wir das passende
-Quantil der Normalverteilung, das wir in der Formel brauchen – also den Wert . Für eine gewünschte Irrtumswahrscheinlichkeit von 5% brauchen wir also später das 97,5%-Quantil (das ist 1.96, wer es nachprüfen möchte).
- Damit berechnen wir das passende
Die untere Grenze des Intervalls ist dann:
Für die obere Grenze ersetzen wir einfach das erste Minus durch ein Plus:
Insgesamt lautet das Konfidenzintervall also
Oder, in Kurzschreibweise mit dem
Beispielaufgabe
Der Intelligenzquotient (IQ) ist so erstellt worden, dass er in der Gesamtbevölkerung normalverteilt ist mit einem Mittelwert von 100 und einer Standardabweichung von 15 (d.h. einer Varianz von
Wir können die Varianz in der Gruppe als bekannt annehmen, nämlich als
Die Formel dafür kennen wir:
Dort tragen wir jetzt einfach alle geforderten Werte nacheinander ein. Manche müssen wir berechnen, andere aus einer Tabelle ablesen, und wieder andere einfach einsetzen:
, das steht in der Aufgabe , denn da wir ein 95%-KI brauchen, ist die Irrtumswahrscheinlichkeit 5%, also 0.05. ist , also das 97,5%-Quantil der Normalverteilung. Aus der Verteilungstabelle lesen wir ab, dass das 1.96 ist. ist die Standardabweichung (Vorsicht: Die Wurzel aus der Varianz! Nicht verwechseln!). Bei uns ist
Damit können wir das Intervall berechnen:
Das gesuchte Konfidenzintervall ist also
KI für den Erwartungswert , falls Varianz unbekannt
Wie bereits erwähnt: Das Prinzip ist hier dasselbe, das KI wird berechnet durch
Die einzigen beiden Unterschiede sind, dass statt dem
Die Formel für das Konfidenzintervall ist von der Bedeutung her identisch mit dem Fall, wenn die wahre Varianz
Die Bezeichnung
Anmerkung: Falls die Stichprobe mehr als 30 Beobachtungen hat, kann man im Normalfall doch wieder das
Beispielaufgabe
Wir interessieren uns für den mittleren Intelligenzquotienten (IQ) in einer Förderschule für Hochbegabte. In der breiten Bevölkerung ist zwar bekannt, dass der IQ normalverteilt ist mit
Berechne nun ein 95%-Konfidenzintervall für den mittleren IQ von Hochbegabten in Förderklassen.
Wir verwenden ganz einfach die Formel für das KI, und setzen alle Werte nacheinander ein:
Die Werte, die wir brauchen sind:
, das steht direkt im Aufgabentext , denn da wir ein 95%-KI brauchen, ist die Irrtumswahrscheinlichkeit 5%, also 0.05. ist das -Quantil, also das 97,5%-Quantil der t-Verteilung mit , also mit 21 Freiheitsgraden. In der Verteilungstabelle lesen wir ab, dass dieser Wert ist
Wir setzen also diese Werte ein und rechnen aus:
Das gesuchte Konfidenzintervall ist also
Sehr geehrter Herr Alexander Engelhardt, meine Frage ist:
Gibt es eine Regel, wann davon ausgegangen werden kann oder darf, dass die Varianz bekannt ist?
Wann kann ich sicher sein (was braucht man dazu), dass ich die Varianz wirklich kenne, und mein Wissen auch von anderen außer mir akzeptiert wird.
Die zu Beta = 0,95 Sicherheit gehörende Zufallsvariable muss mit einer anderen Formel berechnet werden, wenn die Varianz bekannt ist, und mit einer anderen Formel, wenn sie unbekannt ist. Zum Beispiel der Faktor „t“ in Student-Verteilung hängt davon.
Ich wäre Dankbar für einen Rat in diese Frage.
Mit freundlichen Grüßen, Tibor Kausay, Budapest
Hallo Tibor,
ich kenne keine Regel, nach der man davon ausgehen kann. In Aufgaben steht meistens drin, dass „man davon ausgehen kann, die Varianz ist bekannt und (z.B.) sigma = 0.5“.
Ich denke, in der Realität kann man davon ausgehen dass sie bekannt ist, wenn man einen bestimmten Test regelmäßig, z.B. in der Qualitätskontrolle täglich rechnet, und immer dieselbe Varianz dafür verwendet.
Normalerweise (z.B. in der Forschung) ist es aber so, dass die Varianz nie als bekannt genommen wird, sondern immer neu berechnet wird. Damit macht man eigentlich nie etwas falsches.
Viele Grüße
Alex
In der Aufgabenstellung von den hochbegabten steht: n=22. Wenn man die Formel mit s/wurzel(n) ausrechnet, kommen als Intervallgrenzen 138,7285 und 129,9114 heraus.
Wenn man s/wurzel(n-1) einsetzt, dann kommen auch die Werte heraus, die als Lösung der Beispielaufgabe notiert sind.
Was ist richtig? Wird durch die Wurzel (n), also die Wurzel der Stichprobenanzahl geteilt, oder wird durch die Wurzel(n-1), also durch die Anzahl der Freiheitsgrade geteilt?
Hi Simon,
du hast einen Fehler entdeckt. Mit n=22 ist es richtig, und mit den Grenzen 129.91 bis 138.73. Ich habe es im Artikel korrigiert.
Vielen Dank für den Hinweis! 🙂
VG
Alex
Hallo bei mir in der Formelsammlung steht : x¯± (σx/√n) * z1−(α/2) falls die wahre Varianz bekannt ist.. was ist denn nun richtig?
Ich seh es mit der Formatierung nicht genau, aber das müsste dieselbe Formel sein 🙂
In den Lösungen zu b) ist ein kleiner Fehler. Dort steht für n=22, in der Aufgabenstellung jedoch n=24.
Dies führt natürlich nur zu minimalen Fehlern, jedoch könnte es den einen oder anderen verwirren.
Hi Esra,
vielen Dank für den Hinweis. Ich hab die Zahl in der Aufgabenstellung zu 22 korrigiert 🙂
Viele Grüße
Alex