domingo, 26 de enero de 2014

Contraste de hipótesis ( inferencias ) sobre la media de poblaciones no necesariamente normales y tamaños muestrales grandes.

Enunciado:
En el proceso de calibración de una balanza se ha pesado cien veces una pesa de prueba y se ha obtenido una media ( muestral ) de $1001\,\text{g}$ y una cuasidesviación típica de $4\,\text{g}$. A nivel de significación del $1\,\%$, ¿ podemos aceptar que la pesa de prueba sea de $1000\,\text{g}$ ?

Resolución:
Tratándose de muestras grandes y realizaciones independientes ( muestreo ) de la misma varianza, se cumplen las condiciones de validez del Teorema Central del Límite, luego podemos estimar la media poblacional mediante el estimador $\overline{x} \sim N(\mu\,,\,\sigma / \sqrt{n})$. Sin embargo, al desconocer la desviación típica, $\sigma$, de la población, empleamos con buena aproximación el estimador $\overline{x} \approx N(\mu\,,\,S / \sqrt{n})$, donde $S$ representa la cuasidesviación muestral la cual, sí tenemos como dato.

Planteamos el contraste de la hipótesis nula $H_0:\,\mu = \mu_0$, siendo $\mu_0=1000$ frente a la hipótesis alternativa $H_1:\,\mu \neq \mu_0$ ( contraste bilateral ), y por lo dicho arriba, podemos utilizar como estadístico del contraste la variable aleatoria $\overline{x}$ tipificada:
    $\dfrac{\overline{x}-\mu_0}{S/ \sqrt{n}} \approx N(0,1)$
de tal forma que aceptaremos $H_0$ si el valor observado de dicho estadístico $\overline{x}$ cae dentro del intervalo de aceptación de $H_0$, dado por
    $C^{*}=[\;\overline{x}-z_{\alpha / 2} \cdot \dfrac{S}{\sqrt{n}}\,,\,\overline{x}+z_{\alpha / 2} \cdot \dfrac{S}{\sqrt{n}} \;]$
esto es, si el valor del estadístico
    $\dfrac{\overline{x}-\mu_0}{S/ \sqrt{n}} \approx N(0,1)$
pertenece al intervalo
    $[-z_{\alpha /2}\,,\,z_{\alpha / 2}]$
donde el valor de la abscisa $z_{\alpha /2}$ es tal que
    $P\{ |Z| \ge z_{\alpha /2} \}=\alpha / 2$
( siendo $z_{\alpha / 2}$ la abscisa que deja a su derecha el $(\alpha /2)\cdot 100 \,\%$ - respectivamente a su izquierda, el $(1-\alpha /2)\cdot 100 \,\%$ - de la distribución de probabilidad )
luego, utilizando las tablas de $Z \sim N(0,1)$, encontramos que $z_{\alpha /2}=z_{0'01 /2}=z_{0'005} \approx 2'58$

Calculando el valor del estadístico para la muestra observada obtenemos
    $\dfrac{|1001-1000|}{4 / \sqrt{100}}=2'5 \in [-2'58\,,\,2'58]$
luego decidimos aceptar la hipótesis nula - aunque no con mucha fuerza, por encontrarse el valor observado del estimador muy cerca del extremo superior del intervalo -, es decir, aceptamos que "la masa de la pesa de prueba es de mil gramos", a nivel de significación $0'01$.


-oOo-

Observación (p-valor):     Calculemos, a modo de ampliación, el nivel de significación observado, al que llamamos p-valor ( el menor nivel de significación para poder rechazar la hipótesis nula, esto es, el menor valor de la probabilidad de rechazar la hipótesis nula siendo ésta cierta ), luego lo calculamos de la forma
    p-valor $:=P\{|Z|\succ z_{\alpha / 2}\,|\,H_0\}=P_{H_0}\{|Z|\succ 2'5\}=2\,P_{H_0}\{Z \succ 2'5\}$
                $\underset{\text{tablas } Z \sim N(0,1)}{=}0'0124$
valor que es ligeramente mayor que el nivel de significación impuesto de antemano, luego podemos aceptar la hipótesis nula, pero no con mucha fuerza, tal como ya se había comentado al calcular el intervalo de aceptación; ésto lo confirma. En efecto, por el significado del p-valor, es necesario que no sea pequeño ( pongamos que inferior a $0'01$ ) para poder aceptar la hipótesis nula; en nuestro caso, sobrepasa ligeramente esta cantidad.


[nota del autor]

No hay comentarios:

Publicar un comentario

Gracias por tus comentarios