Enunciado:
En un estudio mencionado en ( Gonick, 1999 ) sobre la eficacia que tenía el consumo regular de aspirina durante varios años en la prevención del infarto, se pidió la colaboración de voluntarios ( que no presentasen factores de riesgo conocidos ) para realizar un experimento a doble ciego y se ofrecieron 22071 individuos, todos ellos médicos. Con tal propósito, se formó un grupo de control, seleccionando de forma aleatoria e independiente a 11034 individuos, a los cuales se les suministró placebo durante todo el experimento ( sin saber sus integrantes si se les trataba con placebo o bien con aspirina ), y un grupo de prueba, con los restantes voluntarios a los cuales se les suministró aspirina ( desconociendo todos ellos si se trataba de aspirina o bien de placebo ). Habiendo concluido el experimento, se observó que en el grupo de control se dieron 239 infartos y que en el grupo de prueba hubo 139 infartos. ¿ Se puede afirmar, a nivel de significación del 5\,\%, que el consumo de aspirina ayuda a prevenir el infarto ?.
Resolución:
Calculando las proporciones de incidencia de infartos en ambas muestras ( se entiende que cada grupo es una muestra de la población respectiva ) encontramos las siguientes proporciones muestrales. Para el grupo de control: \hat{p_{1}}=\dfrac{239}{11034}=0'0217 ( tamaño muestral n_1=11034 ), y para el grupo de prueba: \hat{p_{2}}=\dfrac{139}{11037}=0'0126 ( tamaño muestral del grupo de prueba: n_2=11037 )
Es razonable pensar que de no haber diferencias significativas en los resultados de ambos grupos, la diferencia de proporciones ( poblacionales ), p_1-p_2, debería ser cero ( hipótesis estándar ), por lo que planteamos un contraste bilateral de la hipótesis nula ( estándar ) H_0:\,p_1-p_2 = (p_1-p_2)_0 con (p_1-p_2)=0, frente a la hipótesis alternativa H_1:\,p_1-p_2 \neq 0, siendo el estadístico del contraste
\dfrac{(\hat{p_{1}}-\hat{p_{2}})-(\mu_1-\mu_2)}{\sigma(\hat{p_1}-\hat{p_2})} \approx N(0,1) por tratarse de muestras grandes
donde la desviación del estimador \sigma(\hat{p_1}-\hat{p_2}) es igual a \sqrt{\sigma^{2}(\hat{p_1})+\sigma^{2}(\hat{p_2})} y, por tanto, igual a \sqrt{\dfrac{\hat{p_1}\,(1-\hat{p_1})}{n_1}+\dfrac{\hat{p_2}\,(1-\hat{p_2})}{n_2}}
En este tipo de test ( bilateral ), recordemos que aceptamos H_0 si \dfrac{|(\hat{p_1}-\hat{p_2})-(p_1-p_2)_0|}{\sigma(\hat{p_1}-\hat{p_2})} \le z_{\alpha / 2}, es decir, en nuestro caso, si \dfrac{|(\hat{p_1}-\hat{p_2)}-0|}{\sigma(\hat{p_1}-\hat{p_2})} \le z_{\alpha /2}, donde z_{\alpha / 2} ( valor que da los dos puntos críticos, esto es, los extremos del intervalo de aceptación de H_0 ) se obtienen de la tabla Z \sim N(0,1), pues z_{\alpha / 2} es la abscisa de la función de densidad, f(z), que deja a su derecha, bajo la curva un área ( probabilidad ) de \alpha / 2. En el caso que nos ocupa, z_{\alpha / 2}=z_{ 0'05 / 2}= z_{0'025}=1'96.
Calculemos pues el valor observado del estadístico:
\dfrac{|0'0217-0'0126|}{\sqrt{\dfrac{0'0217\,(1-0'0217)}{11034}+\dfrac{0'0126\,(1-0'0126)}{11037}}}\approx 5'21 \nleqslant z_{0'025}=1'96
luego decidimos rechazar H_0. Observemos, además, que el intervalo de aceptación de H_0 es C^{*}=[\; (p_1-p_2)_0-z_{\alpha / 2} \cdot \sigma(\hat{p_1}-\hat{p_2}) \,,\,(p_1-p_2)_0+z_{\alpha / 2} \cdot \sigma(\hat{p_1}-\hat{p_2})\;]
y, por tanto, en nuestro caso, C^{*}=[\;-z_{\alpha / 2} \cdot \sigma(\hat{p_1}-\hat{p_2}) \,,\,z_{\alpha / 2} \cdot \sigma(\hat{p_1}-\hat{p_2})\;], que con los datos del problema es, en concreto, C^{*}=[\; 0'0057 \,,\, 0'0125\;] con lo cual vemos que 0 \notin C^{*} ( que confirma la conclusión ); por otra parte, al ser \hat{p_{1}}_{\text{observado}} \succ \hat{p_{2}}_{\text{observado}} ( pues es mayor la proporción de infartos en el grupo tratado con placebo que la proporción de infartos tratado con aspirina ), podemos concluir que, a nivel de significación del 5\,%, el consumo de aspirina ayuda a prevenir el infarto.
Observación: Con más precisión que operando con un valor prefijado del nivel de significación, podemos proceder a calcular el menor nivel de significación \alpha con que se rechazaría la hipótesis nula, esto es, el p-valor, que representa la probabilidad observada ( dado el valor observado del estadístico de contraste ) de rechazar H_0 siendo ésta cierta, es decir, el error de tipo I observado, esto es, \text{p-valor}:=P\{|Z| \ge z_{\text{observado}}\;|\;H_0 \, \text{cierta}\}. Calculando pues el p-valor encontramos
P\{|Z|\ge 5'21 \;|\;H_0\} = 10^{-7}, probabilidad muy pequeña y, por tanto, una prueba definitiva en contra de H_0.
Referencias:
Referencias:
[1] Compta, A., et. al., Matemàtiques II, Barcanova, Barcelona, 1993
[2] Guàrdia, J.; Viader, M., Estadística, Castellnou, Barcelona, 1999
[3] García Pérez, A., Estadística Básica con R, UNED, Madrid, 2010
[4] Allepús, J., et. al., Exercicis d'inferència estadística, Cossetània, Valls, 2002
[5] Gonick, L.; Smith, W, La Estadística en Cómic, Zendrera Zariquiey, Barcelona, 1999
No hay comentarios:
Publicar un comentario
Gracias por tus comentarios