Intervalle de confiance pour la Variance
Lorsque nous utilisons un échantillon pour calculer une statistique, nous estimons un paramètre de population. Ce n’est qu’une estimation et l’échantillon en raison de la nature du dessin d’un échantillon peut ne pas créer une valeur (statistique) proche de la valeur réelle (paramètre).
Nous pouvons calculer l’intervalle de confiance sur la statistique pour déterminer où le paramètre vrai et souvent inconnu peut exister. Cela inclut le calcul d’une statistique de variance.
Si vous deviez tirer de nombreux échantillons différents de la même taille d’une population et tracer la statistique de variance, la distribution résultante est susceptible de correspondre à une distribution χ2. Le tracé des moyens crée une distribution normale qui est symétrique et produit des intervalles de confiance symétriques. La distribution du χ2 n’est pas symétrique et produira des intervalles asymétriques.
La Formule
La formule de l’intervalle de confiance est
$$\large\displaystyle\frac {\left(n-1\right) {{s}^{2}}} {\chi_{\frac{\alpha}{2}, \text{}n-1}^{2}}\le{{\sigma}^{2}} \le\frac{\left(n- 1\ droite) {{s}^{2}}} {\chi_ {1-\frac {\alpha}{2}, \text{}n-1}^{2}}$$
Où s2 est la variance de l’échantillon et n est la taille de l’échantillon. Les degrés de liberté sont n-1. Remarque vous devrez entrer la table χ2 deux fois pour chaque côté de l’intervalle.
Exemple
Disons que nous avons 25 échantillons et avons calculé la variance de l’échantillon à 47. Quel est l’intervalle de confiance à 90% sur la variance? En d’autres termes, dans quelle fourchette la variance réelle de la population est-elle susceptible d’exister?
Les degrés de liberté sont df = 25 – 1 = 24. Ainsi, en utilisant la table χ2, nous trouvons que la valeur χ2 inférieure est 36,42 et la valeur supérieure est 13,85. En utilisant la formule ci-dessus, nous pouvons ensuite calculer l’intervalle de confiance.
$$\large\displaystyle\begin {array}{l}\frac {\left(25-1\right) 47} {\chi_{\frac{0.1}{2}, \text{ 25}-1}^{2}}\ le {{\sigma}^{2}}\le\frac {\gauche (25-1\droite) 47} {\chi_{1-\frac{0.1 } {2}, \texte{ 25}-1}^{2}}\\\ frac {\ left (24\right) 47} {\chi_{0.05,\text{ 24}}^{2}}\ le {{\sigma}^{2}}\le\frac {\left (24\right) 47} {\chi_{0.95,\text{ 24}}^{2}}\\\ frac {\left (24\right) 47}{36.42}\le{{\sigma}^{2}} \le\frac{\left (24\right)47}{13.85}\\30.97\ le {{\sigma}^{2}}\ le 81.44\end{array}$$
Assurez-vous d’utiliser directement la variance de l’échantillon. Parfois, on peut vous donner l’écart-type de l’échantillon – dans ce cas, vous devez équarrir cette valeur et utiliser la variance de l’échantillon dans la formule ci-dessus.
Liés:
Intervalles de confiance pour MTBF (article)
Intervalles de tolérance pour un Ensemble de Données Basé sur la Distribution Normale (article)
Estimations ponctuelles et d’intervalles (article)