miércoles, 12 de febrero de 2014

Contraste de hipótesis bilateral para una población aproximadamente normal ( muestras grandes ), siendo la desviación típica desconocida. Reflexiones sobre la necesidad del cálculo del p-valor.

Enunciado:
El porcentaje de un determinado metal que debe contener una cierta aleación es de $5'5\,\%$. Se toma una muestra de $200$ piezas de dicha aleación y se obtiene una media de $\bar{x}=5'2 \, \%$, con una desviación típica de $s=3'0\,\%$.
    a) ¿Se puede afirmar, desde el punto de vista de la inferencia estadística, que la proporción del metal en cuestión que forma parte de la aleación es la correcta, a nivel de significación $\alpha=0'05$?
    b) (Apartado de ampliación). Reflexionar sobre la necesidad del cálculo del nivel de significación observado, esto es, del llamado p-valor y calcularlo

Resolución:
  a)
Tratándose de muestras grandes, $n=200 \gt 30$, podemos aceptar razonablemente que la variable aleatoria de la población proporción del componente $A$ tiene una distribución aproximadamente normal $N(\mu\,,\,\sigma)$, con media $\mu$ desconocida y desviación típica $\sigma$.

De acuerdo con lo que se nos pide, Planteamos el siguiente contraste bilateral: la hipótesis estándar (la aleación tiene la proporción correcta en el metal componente), es decir, la hipótesis nula $H_0:\,\mu = \mu_0$ (donde $\mu_0=5'5$), frente a la hipótesis alternativa $H_1:\,\mu \neq \mu_0$

Por las características antes mencionadas, el estadístico del contraste sigue una distribución $\dfrac{\bar{x}-\mu_0}{S/\sqrt{n}} \approx N(0,1)$, donde $\bar{x}$ es el estadístico de la media muestral, $n$, el tamaño muestral y $S$ la cuasideviación típica de la muestra (que, por ser un estimador centrado, se puede utilizar para estimar bien la desviación típica, $\sigma$, de la población), y, siendo la desviación típica de la muestra $s$ (que es un dato del problema), sabemos que está relacionada con la cuasidesviación de la misma de la forma $S=\sqrt{\dfrac{n}{n-1}}\,\,s$, luego el valor de la cuasidesviación típica $S$ de la muestra es $S=\sqrt{\dfrac{100}{100-1}}\,\cdot 3 = 3'0151$ (aproximando a cuatro cifras decimales).

Teniendo en cuenta que el test es bilateral, aceptaremos $H_0$ si el valor observado del estadístico en la muestra dada cae en el intervalo de aceptación $C^{*}$ de la variable tipificada del estadístico, $Z$, $C_{Z}^{*}=\left[-z_{\alpha / 2}\,,\,z_{\alpha / 2}\right]$; es decir si $\dfrac{|\overline{x}-\mu_0|}{S/\sqrt{n}} \le z_{\alpha / 2}$, siendo el valor crítico $z_{\alpha/2}$ (que consultamos en las tablas de la función de distribución $F(z)$ de $Z \sim N(0,1)$) igual a $z_{0'05/2}=z_{0'025}=1'96$. Calculando el valor del estadístico en la muestra, vemos que $\bigg(\dfrac{|\overline{x}-\mu_0|}{S/\sqrt{n}}\bigg)_{\text{observada}}=\dfrac{|5'2-5'5|}{3'0151}=0'0995 \lt 1'96$, luego decidimos aceptar $H_0$ con un nivel de significación $\alpha=0'05$.

  b) [ Ampliación ]
Se nos pide, ahora, calcular, el nivel de significación observado (el p-valor) en contraposición al nivel de significación prefijado $\alpha$. El p-valor es el mínimo nivel de significación necesario para rechazar la hipótesis fundamental $H_0$. Recordemos que el error de tipo I representa la probabilidad de rechazar la hipótesis nula, siendo ésta cierta. El nivel de significación $\alpha$ (que no el p-valor) viene dado en el enunciado (o lo decidimos de manera razonable), es decir, viene fijado de antemano: en este caso se nos dice que es igual a $\alpha=0'05$. Démonos cuenta, no obstante, de que este nivel de significación prefijado, $\alpha=0'05$, no deja de conllevar cierta arbitrariedad, pues podríamos haber escogido un valor mayor o menor y, por tanto, la decisión de aceptar la hipótesis podría no haberse dado; por ello, y, por lo menos, para reforzar la decisión tomada, siempre es conveniente calcular, además, lo que denominamos p-valor, que es el nivel de significación observado, esto es, el valor del error de tipo I observado, que es el menor nivel de significación que tendríamos que fijar de antemano para rechazar la hipótesis nula con el valor del estadístico observado en la muestra.

En el caso singular en que el nivel de significación tuviese el máximo valor posible, $\alpha=1$ ( máximo error de tipo I), entonces los puntos críticos vendrían dados por $z_{\alpha / 2}=z_{1/2}=z_{0'5}=0$, luego el intervalo de aceptación de $H_0$ expresado en la variable tipificada $Z$ ( variable del estadístico del contraste ) se reduciría a un único valor, que en términos de la variable tipificada, sería el $0$; en otras palabras, el intervalo de aceptación de la hipótesis nula, $H_0$, correspondería a un único valor, esto es, a $C_{Z}^{*}=\{0\}$ y, por tanto, al no coincidir - con casi total probabilidad - el valor de $Z_{observado}$ con dicho valor en la realización del muestreo, cabría rechazar siempre la hipótesis nula - pero, cuidado, con un nivel de confianza en la decisión de $1-\alpha=1-1=0$, es decir del $0\,\%$ -, salvo en el extraño caso - raro, por altamente improbable - que éste fuese igual a cero, es decir, en el caso de que la media muestral observada, $\overline{x}$, coincidiese exactamente con el valor $\mu_0$. Así, pues, cuanto mayor es el nivel de significación del contraste fijado de antemano, $\alpha$, con mayor facilidad decidiremos rechazar la hipótesis nula, $H_0$, pues el intervalo de aceptación, $C^{*}$, tiende a tener amplitud cero, a contraerse en un punto, sin dar pie a que el valor observado del estadístico en la muestra caiga en él; sin embargo, a mayor nivel de significación corresponde menor nivel confianza en el resultado de la inferencia (menor confianza en la decisión tomada de rechazar $H_0$). En el símil sobre un jurado en cuanto a la decisión que debe tomar de un declarar culpable o inocente a un imputado, siendo la hipótesis nula "el imputado es inocente", ésto aseguraría la decisión de declararle culpable en cualquier caso; algo que da, ciertamente, mucho miedo.

Por el contrario, si el nivel de significación $\alpha$, fuese, también en caso extremo, igual a $\alpha=0$, caeríamos en una posición absolutamente conservadora: fe ciega en la hipótesis nula, $H_0$, anulando de plano el error de tipo I, es decir, conviniendo que es imposible rechazar la hipótesis nula, supuesta ésta cierta, pase lo que pase y, por tanto, por contra, haciendo máximo el error de tipo II; entonces los puntos críticos estarían en $-\infty$ y $+\infty$ (en un contraste bilateral), luego el intervalo de aceptación de la hipótesis nula sería toda la recta real, luego sería imposible rechazar la hipótesis nula a un nivel de confianza de $1-\alpha=1-0=1$, esto es, del $100\%$. En el caso del símil de aplicación a la toma de decisión de un jurado de declarar culpable o inocente a un imputado, esto correspondería a declarar inocente al imputado, al margen de que éste pueda ser o no culpable, lo cual, evidentemente, sería inquietante.

Es evidente, pues, que plantear un contraste de hipótesis en estos términos, tanto en un extremo como en otro, no tendría ningún sentido. Sin embargo, plantear dichos casos singulares y reflexionar sobre ellos nos puede ayudar a entender los conceptos y a poner las ideas en claro; de ahí que se hayan comentado, en este apartado de ampliación, aspectos referentes a: a) el error de tipo I (probabilidad de rechazar la hipótesis nula, siendo ésta cierta), y, por tanto, en relación directa con ésto, se ha tratado del nivel de significación prefijado, $\alpha$, así como del nivel de significación observado o p-valor, y del significado del coeficiente de confianza que cabe depositar en la decisión a tomar; y, b) el error de tipo II (probabilidad de aceptar la hipótesis alternativa siendo ésta falsa) y su relación con el error de tipo-I.

Luego, por lo que acabamos de decir, el nivel de significación prefijado $\alpha$, vendría a ser, pues, una aproximación al error de tipo I, es decir, al p-valor, que es, de hecho, en el que deberíamos fijarnos para decidir aceptar o rechazar la hipótesis nula (respectivamente aceptar la hipótesis alternativa). Veamos cómo: Un p-valor demasiado pequeño, (en particular, inferior a $\alpha$) o simplemente muy pequeño, pongamos inferior a $0'01$, nos llevaría a tener que rechazar la hipótesis nula $H_0$ (que se supone cierta), por no ser suficiente dicha probabilidad para poder acreditarla. Es decir, en realidad, para tomar la decisión de aceptar o rechazar la hipótesis nula, debemos guiarnos por el p-valor, más que por el nivel de significación que, eventualmente, se pueda fijar. En muchos problemas, como por ejemplo, en éste, el nivel de significación - como cota del p-valor - viene dado, por lo que - en principio - podríamos obviar su cálculo. Ésto, sin embargo, no es recomendable, pues el valor de significación fijado de antemano podría no ser, digamos, el acertado.


Así pues, entendemos el p-valor o nivel de significación observado (por contraposición al nivel de riesgo o nivel de significación prefijado $\alpha$) de una prueba de verificación/contraste de la hipótesis por inferencia estadística como el error de tipo I observado, y, por tanto, ha de venir dado por la probabilidad de obtener un valor igual o más extremo que el observado en la muestra, en el supuesto de que la hiótesis nula $H_0$ (que queremos verificar/contrastar frente a la hipótesis alternativa $H_1$) sea cierta/verdadera. Así, para poder rechazar la hipótesis nula $H_0$, en buena lógica deberemos encontrar que $\text{p-valor}\le \alpha$, teniendo que reafirmarla si encontramos que $\text{p-valor}\gt \alpha$.

Calcularemos pues el p-valor utilizando la distribución de probabilidad en el muestreo del estadístico de prueba asumiendo que la hipótesis fundamental es cierta. Al cálcular el p-valor nos podemos encontrar, según el caso, que el contraste se tenga que realizar por la cola superior, por la cola inferior, o bien de manera bilateral.

Llamando genéricamente $\hat{\theta}$ al estimador (estadístico) del test/contraste (y conocida su función de distribución de probabilidad, $F(\hat{\theta})$) —recordemos que en nuestro problema en concreto nuestro estimador sigue una distribución normal tipificada $Z$— y $\hat{\theta}_{\text{prueba}}$ al valor de dicho estadístico en la prueba (calculado) y que por supuesto depende del valor observado en la muestra:
  (i) Unilateral por la izquierda: $$\text{p-valor}=P\{\hat{\theta} \le \hat{\theta}_{\text{prueba}}|H_o\,\text{es cierta}\}=F(\hat{\theta})$$
  (ii) Unilateral por la derecha: $$\text{p-valor}=P\{\hat{\theta} \ge \theta_{\text{prueba}}|H_o\,\text{es cierta}\}=1-P\{\hat{\theta} \le \hat{\theta}_{\text{prueba}}|H_o\,\text{es cierta}\}=F(\hat{\theta}_{\text{prueba}})=1-F(\hat{\theta}_{\text{prueba}})$$
  (iii) Bilateral, y suponiendo simétrica la función de distribución de probabilidad $f(\hat{\theta})$ de $\hat{\theta}$ alrededor del valor de $\theta$ observado en la muestra y una vez realizada la tipificación de la variable a $Z=N(0,1)$: $$\text{p-valor}=P\{|z|\ge z_{\text{prueba}}\} = 2\,(1-F(z_{\text{prueba}}))$$


Procedamos, pues, a calcular el p-valor para este problema, que, repitámoslo, es la probabilidad de que, asumiendo que la hipótesis fundamental $H_0$ sea cierta, se obtenga un valor del estadístico de contraste más extremo (o igual) que el observado en la muestra. Al tratarse de un contraste unilateral por la derecha, tendremos —estamos en el caso (ii)— que $\text{p-valor}=1-F(z_0)$, donde $F(z)$ es una d. $N(0,1)$. Así que, como ya hemos calculado que $z_0=0'0995$, tenemos que $F(0'0995)=0'5396$, luego $\text{p-valor}=2\cdot(1-0'5396)=0'9208 \gt \alpha=0'05$, por consiguiente y como conclusión final validamos la certeza de la hipótesis fundamental y por tanto, según el test, podemos afirmar que la proporción del metal en cuestión que forma parte de la aleación es la correcta a un nivel de significación $\alpha$ de $0'05$.   $\square$

- - -

Referencias:
  [1] Compta, A., et. al., Matemàtiques II, Barcanova, Barcelona, 1993
  [2] Guàrdia, J.; Viader, M., Estadística, Castellnou, Barcelona, 1999
  [3] García Pérez, A., Estadística Básica con R, UNED, Madrid, 2010
  [4] Allepús, J., et. al., Exercicis d'inferència estadística, Cossetània, Valls, 2002
  [5] Gonick, L.; Smith, W, La Estadística en Cómic, Zendrera Zariquiey, Barcelona, 1999

No hay comentarios:

Publicar un comentario

Gracias por tus comentarios