Intervallo di confidenza per varianza

Intervallo di confidenza per varianza

Quando si utilizza un campione per calcolare una statistica, si stima un parametro di popolazione. È solo una stima e il campione a causa della natura del disegno di un campione potrebbe non creare un valore (statistica) vicino al valore effettivo (parametro).

Possiamo calcolare l’intervallo di confidenza sulla statistica per determinare dove può esistere il parametro vero e spesso sconosciuto. Questo include il calcolo di una statistica della varianza.

Se si dovesse disegnare molti campioni diversi della stessa dimensione da una popolazione e tracciare la statistica della varianza, è probabile che la distribuzione risultante si adatti a una distribuzione χ2. Tracciare i mezzi crea una distribuzione normale che è simmetrica e produce intervalli di confidenza simmetrici. La distribuzione χ2 non è simmetrica e produrrà intervalli asimmetrici.

Formula

L’intervallo di confidenza è la formula

$$ \large\displaystyle \frac{\left( n-1 \right){{s}^{2}}}{\chi _{\frac{\alpha }{2},\text{ }n-1}^{2}}\le {{\sigma }^{2}}\le \frac{\left( n-1 \right){{s}^{2}}}{\chi _{1-\frac{\alpha }{2},\text{ }n-1}^{2}}$$

Dove s2 è la varianza campionaria e n è la dimensione del campione. Il grado di libertà è n-1. Nota è necessario inserire la tabella χ2 due volte una volta per ciascun lato dell’intervallo.

Esempio

Diciamo che abbiamo 25 campioni e abbiamo calcolato la varianza del campione per essere 47. Qual è l’intervallo di confidenza del 90% sulla varianza? In altre parole, entro quale intervallo è probabile che esista la vera varianza della popolazione?

I gradi di libertà sono df = 25-1 = 24. Quindi usando la tabella χ2 troviamo il valore χ2 inferiore è 36.42 e quello superiore è 13.85. Usando la formula sopra possiamo quindi calcolare l’intervallo di confidenza.

$$ \large\displaystyle \begin{array}{l}\frac{\left( 25-1 \right)47}{\chi _{\frac{0.1}{2},\text{ 25}-1}^{2}}\le {{\sigma }^{2}}\le \frac{\left( 25-1 \right)47}{\chi _{1-\frac{0.1}{2},\text{ 25}-1}^{2}}\\\frac{\left( 24 \right)47}{\chi _{0.05,\text{ 24}}^{2}}\le {{\sigma }^{2}}\le \frac{\left( 24 \right)47}{\chi _{0.95,\text{ 24}}^{2}}\\\frac{\left( 24 \right)47}{36.42}\le {{\sigma }^{2}}\le \frac{\left( 24 \a destra)47}{13.85}\\30.97\le {{\sigma }^{2}}\le 81.44\end{array}$$

Essere sicuri di utilizzare la varianza del campione direttamente. A volte si può essere data la deviazione standard del campione – in questo caso, è necessario quadrare quel valore e utilizzare la varianza del campione nella formula sopra.

Correlati:

Intervalli di confidenza per MTBF (articolo)

Intervalli di tolleranza per il normale set di dati basato sulla distribuzione (articolo)

Stime puntuali e di intervallo (articolo)

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.