Konfidenzintervall für Varianz
Wenn wir eine Stichprobe zur Berechnung einer Statistik verwenden, schätzen wir einen Populationsparameter. Es handelt sich nur um eine Schätzung, und die Stichprobe erzeugt aufgrund der Art des Zeichnens einer Stichprobe möglicherweise keinen Wert (Statistik), der dem tatsächlichen Wert (Parameter) nahe kommt.
Wir können das Konfidenzintervall über die Statistik berechnen, um zu bestimmen, wo der wahre und oft unbekannte Parameter existieren kann. Dies beinhaltet die Berechnung einer Varianzstatistik.
Wenn Sie viele verschiedene Stichproben derselben Größe aus einer Grundgesamtheit ziehen und die Varianzstatistik zeichnen, passt die resultierende Verteilung wahrscheinlich zu einer χ2-Verteilung. Das Zeichnen der Mittelwerte erzeugt eine Normalverteilung, die symmetrisch ist und symmetrische Konfidenzintervalle erzeugt. Die χ2-Verteilung ist nicht symmetrisch und erzeugt asymmetrische Intervalle.
Die Formel
Die Konfidenzintervallformel ist
$$ \large\displaystyle \frac{\left( n-1 \right){{s}^{2}}}{\chi _{\frac{\alpha }{2},\text{ }n-1}^{2}}\le {{\sigma }^{2}}\le \frac{\left( n-1 \rechts){{s}^{2}}}{\chi _{1-\frac{\alpha }{2},\text{ }n-1}^{2}}$$
Wobei s2 die Stichprobenvarianz und n die Stichprobengröße ist. Die Freiheitsgrade sind n-1. Hinweis Sie müssen die χ2-Tabelle für jede Seite des Intervalls zweimal eingeben.
Beispiel
Angenommen, wir haben 25 Stichproben und haben die Stichprobenvarianz auf 47 berechnet. Was ist das 90% -Konfidenzintervall für die Varianz? Mit anderen Worten, in welchem Bereich ist die wahre Populationsvarianz wahrscheinlich vorhanden?
Die Freiheitsgrade sind df = 25 – 1 = 24. Unter Verwendung der χ2-Tabelle finden wir also, dass der untere χ2-Wert 36,42 und der obere 13,85 beträgt. Mit der obigen Formel können wir dann das Konfidenzintervall berechnen.
$$ \large\displaystyle \begin{array}{l}\frac{\links( 25-1 \rechts)47}{\chi _{\frac{0,1}{2},\text{ 25}-1}^{2}}\ le {{\sigma }^{2}}\le \frac{\links( 25-1 \rechts)47}{\chi _{1-\frac{0.1}{2},\text{ 25}-1}^{2}}\\\ frac{\links( 24 \rechts)47}{\chi _{0.05,\text{ 24}}^{2}}\ le {{\sigma }^{2}}\le \frac{\links( 24 \rechts)47}{\chi _{0.95,\text{ 24}}^{2}}\\\ frac{\left( 24 \rechts)47}{36.42}\le {{\sigma }^{2}}\le \frac{\left( 24 \rechts)47}{13.85}\\30.97\ le {{\sigma }^{2}}\le 81.44\end{array}$$
Stellen Sie sicher, dass Sie die Beispielvarianz direkt verwenden. In diesem Fall müssen Sie diesen Wert quadrieren und die Stichprobenvarianz in der obigen Formel verwenden.
Verwandt:
Konfidenzintervalle für MTBF (Artikel)
Toleranzintervalle für normalverteilungsbasierte Datensätze (Artikel)
Punkt- und Intervallschätzungen (Artikel)