Intervalo de Confianza para Varianza
Al usar una muestra para calcular una estadística, estamos estimando un parámetro de población. Es solo una estimación y la muestra debido a la naturaleza de dibujar una muestra puede no crear un valor (estadística) que se acerque al valor real (parámetro).
Podemos calcular el intervalo de confianza sobre la estadística para determinar dónde puede existir el parámetro verdadero y a menudo desconocido. Esto incluye el cálculo de una estadística de varianza.
Si tuviera que dibujar muchas muestras diferentes, todas del mismo tamaño, de una población y trazar la estadística de varianza, es probable que la distribución resultante se ajuste a una distribución χ2. El trazado de los medios crea una distribución normal que es simétrica y produce intervalos de confianza simétricos. La distribución χ2 no es simétrica y producirá intervalos asimétricos.
La Fórmula
El intervalo de confianza de la fórmula es
$$ \large\displaystyle \frac{\left( n-1 \right){{s}^{2}}}{\chi _{\frac{\alpha }{2},\text{ }n-1}^{2}}\le {{\sigma }^{2}}\le \frac{\left( n-1 \right){{s}^{2}}}{\chi _{1-\frac{\alpha }{2},\text{ }n-1}^{2}}$$
Donde s2 es la varianza de la muestra y n es el tamaño de la muestra. Los grados de libertad son n-1. Tenga en cuenta que deberá ingresar la tabla χ2 dos veces una vez para cada lado del intervalo.
Ejemplo
Digamos que tenemos 25 muestras y hemos calculado que la varianza de la muestra es 47. ¿Cuál es el intervalo de confianza del 90% sobre la varianza? En otras palabras, ¿dentro de qué rango es probable que exista la varianza real de la población?
Los grados de libertad son df = 25-1 = 24. Así, utilizando la tabla χ2, encontramos que el valor de la χ2 inferior es 36,42 y el superior es 13,85. Usando la fórmula anterior, podemos calcular el intervalo de confianza.
\ \ large\displaystyle \begin {array} {l}\frac {\left( 25-1 \right)47} {\chi _ {\frac{0.1} {2},\text{ 25}-1}^{2}}\le {{\sigma} ^{2}}\le \ frac {\left( 25-1 \ right)47} {\chi _ {1 – \frac{0.1}{2},\text{ 25}-1}^{2}}\\\frac{\left( 24 \derecho)47}{\chi _{0.05,\text{ 24}}^{2}}\le {{\sigma }^{2}}\le \frac{\left( 24 \derecho)47}{\chi _{0.95,\text{ 24}}^{2}}\\\frac{\left( 24 \derecho)47}{36.42}\le {{\sigma }^{2}}\le \frac{\left( 24 \derecho)47}{13.85}\\30.97\le {{\sigma }^{2}}\le 81.44\end{array}$$
asegúrese de usar la varianza de la muestra directamente. A veces se le puede dar la desviación estándar de la muestra, en este caso, debe cuadrar ese valor y usar la varianza de la muestra en la fórmula anterior.
Relacionados:
Intervalos de confianza para MTBF (artículo)
Intervalos de Tolerancia para un Conjunto de Datos Basado en la Distribución Normal (artículo)
Estimaciones de Puntos e Intervalos (artículo)