viernes, 31 de enero de 2014

Contraste de hipótesis basados en diseños experimentales a doble ciego.

Enunciado:
En un estudio mencionado en ( Gonick, 1999 ) sobre la eficacia que tenía el consumo regular de aspirina durante varios años en la prevención del infarto, se pidió la colaboración de voluntarios ( que no presentasen factores de riesgo conocidos ) para realizar un experimento a doble ciego y se ofrecieron $22071$ individuos, todos ellos médicos. Con tal propósito, se formó un grupo de control, seleccionando de forma aleatoria e independiente a $11034$ individuos, a los cuales se les suministró placebo durante todo el experimento ( sin saber sus integrantes si se les trataba con placebo o bien con aspirina ), y un grupo de prueba, con los restantes voluntarios a los cuales se les suministró aspirina ( desconociendo todos ellos si se trataba de aspirina o bien de placebo ). Habiendo concluido el experimento, se observó que en el grupo de control se dieron $239$ infartos y que en el grupo de prueba hubo $139$ infartos. ¿ Se puede afirmar, a nivel de significación del $5\,\%$, que el consumo de aspirina ayuda a prevenir el infarto ?.

Resolución:
Calculando las proporciones de incidencia de infartos en ambas muestras ( se entiende que cada grupo es una muestra de la población respectiva ) encontramos las siguientes proporciones muestrales. Para el grupo de control: $\hat{p_{1}}=\dfrac{239}{11034}=0'0217$ ( tamaño muestral $n_1=11034$ ), y para el grupo de prueba: $\hat{p_{2}}=\dfrac{139}{11037}=0'0126$ ( tamaño muestral del grupo de prueba: $n_2=11037$ )

Es razonable pensar que de no haber diferencias significativas en los resultados de ambos grupos, la diferencia de proporciones ( poblacionales ), $p_1-p_2$, debería ser cero ( hipótesis estándar ), por lo que planteamos un contraste bilateral de la hipótesis nula ( estándar ) $H_0:\,p_1-p_2 = (p_1-p_2)_0$ con $(p_1-p_2)=0$, frente a la hipótesis alternativa $H_1:\,p_1-p_2 \neq 0$, siendo el estadístico del contraste
$$\dfrac{(\hat{p_{1}}-\hat{p_{2}})-(\mu_1-\mu_2)}{\sigma(\hat{p_1}-\hat{p_2})} \approx N(0,1)$$ por tratarse de muestras grandes
donde la desviación del estimador $\sigma(\hat{p_1}-\hat{p_2})$ es igual a $\sqrt{\sigma^{2}(\hat{p_1})+\sigma^{2}(\hat{p_2})}$ y, por tanto, igual a $\sqrt{\dfrac{\hat{p_1}\,(1-\hat{p_1})}{n_1}+\dfrac{\hat{p_2}\,(1-\hat{p_2})}{n_2}}$

En este tipo de test ( bilateral ), recordemos que aceptamos $H_0$ si $\dfrac{|(\hat{p_1}-\hat{p_2})-(p_1-p_2)_0|}{\sigma(\hat{p_1}-\hat{p_2})} \le z_{\alpha / 2}$, es decir, en nuestro caso, si $\dfrac{|(\hat{p_1}-\hat{p_2)}-0|}{\sigma(\hat{p_1}-\hat{p_2})} \le z_{\alpha /2}$, donde $z_{\alpha / 2}$ ( valor que da los dos puntos críticos, esto es, los extremos del intervalo de aceptación de $H_0$ ) se obtienen de la tabla $ Z \sim N(0,1)$, pues $z_{\alpha / 2}$ es la abscisa de la función de densidad, $f(z)$, que deja a su derecha, bajo la curva un área ( probabilidad ) de $\alpha / 2$. En el caso que nos ocupa, $z_{\alpha / 2}=z_{ 0'05 / 2}= z_{0'025}=1'96$.

Calculemos pues el valor observado del estadístico:
$\dfrac{|0'0217-0'0126|}{\sqrt{\dfrac{0'0217\,(1-0'0217)}{11034}+\dfrac{0'0126\,(1-0'0126)}{11037}}}\approx 5'21 \nleqslant z_{0'025}=1'96$
luego decidimos rechazar $H_0$. Observemos, además, que el intervalo de aceptación de $H_0$ es $C^{*}=[\; (p_1-p_2)_0-z_{\alpha / 2} \cdot \sigma(\hat{p_1}-\hat{p_2}) \,,\,(p_1-p_2)_0+z_{\alpha / 2} \cdot \sigma(\hat{p_1}-\hat{p_2})\;]$
y, por tanto, en nuestro caso, $C^{*}=[\;-z_{\alpha / 2} \cdot \sigma(\hat{p_1}-\hat{p_2}) \,,\,z_{\alpha / 2} \cdot \sigma(\hat{p_1}-\hat{p_2})\;]$, que con los datos del problema es, en concreto, $C^{*}=[\; 0'0057 \,,\, 0'0125\;] $ con lo cual vemos que $0 \notin C^{*}$ ( que confirma la conclusión ); por otra parte, al ser $\hat{p_{1}}_{\text{observado}} \succ \hat{p_{2}}_{\text{observado}}$ ( pues es mayor la proporción de infartos en el grupo tratado con placebo que la proporción de infartos tratado con aspirina ), podemos concluir que, a nivel de significación del $5\,%$, el consumo de aspirina ayuda a prevenir el infarto.

Observación:     Con más precisión que operando con un valor prefijado del nivel de significación, podemos proceder a calcular el menor nivel de significación $\alpha$ con que se rechazaría la hipótesis nula, esto es, el p-valor, que representa la probabilidad observada ( dado el valor observado del estadístico de contraste ) de rechazar $H_0$ siendo ésta cierta, es decir, el error de tipo I observado, esto es, $\text{p-valor}:=P\{|Z| \ge z_{\text{observado}}\;|\;H_0 \, \text{cierta}\}$. Calculando pues el p-valor encontramos
$P\{|Z|\ge 5'21 \;|\;H_0\} = 10^{-7}$, probabilidad muy pequeña y, por tanto, una prueba definitiva en contra de $H_0$.

Referencias:    

- - -

Referencias:
  [1] Compta, A., et. al., Matemàtiques II, Barcanova, Barcelona, 1993
  [2] Guàrdia, J.; Viader, M., Estadística, Castellnou, Barcelona, 1999
  [3] García Pérez, A., Estadística Básica con R, UNED, Madrid, 2010
  [4] Allepús, J., et. al., Exercicis d'inferència estadística, Cossetània, Valls, 2002
  [5] Gonick, L.; Smith, W, La Estadística en Cómic, Zendrera Zariquiey, Barcelona, 1999


No hay comentarios:

Publicar un comentario

Gracias por tus comentarios