martes, 28 de enero de 2014

Contraste de hipótesis bilateral y contrastes unilaterales con estadísticos que tienen una distribución normal o aproximadamente normal

En lo que sigue, supondremos que el estadístico $\hat{\theta}$ - que es una variable aleatoria con la cual planteamos los contrastes de hipótesis y con el que podemos estimar el valor del parámetro $\theta$ de la varibale $X$ en estudio de la población a partir de un muestreo aleatorio simple - tiene una distribución en el muestreo $N(\theta\,,\,\sigma(\hat{\theta}))$, es decir es una distribución normal o aproximadamente normal, y, por tanto, su variable tipificada es $(\hat{\theta} - \theta) / \sigma(\hat{\theta}) \approx N(0,1)$.

En todo contraste, nos proponemos caracterizar los intervalos de aceptación y rechazo de una hipótesis estándar ( que denominamos hipótesis nula ), $H_0$, frente a una hipótesis alternativa, $H_1$, donde supondremos que una y otra se formulan a partir de un valor supuesto $\theta_0$ del parámetro $\theta$ de la variable aleatoria de la población. Ésto se hará suponiendo un coeficiente de confianza de $1-\alpha$ y, por tant, con un coeficiente de singificación $\alpha$.

Una vez hayamos establecido los valores críticos del estadístico que determinan dichos intervalos, decidiremos aceptar la hipótesis nula si el valor observado del estadístico en la muestra seleccionada cae dentro del intervalo de aceptación de dicha hipótesis, y la rechazaremos si cae fuera del mismo.

Según la disposición ( en la recta numérica en la que representamos los valores del estadístico ) de las zonas/intervalos de aceptación y rechazo de la hipótesis nula, describiremos a continuación los tres casos posibles que pueden aparecer, que denominaremos: test bilateral; test unilateral derecho; o bien, test unilateral izquierdo. Para ello, deberemos encontrar los puntos críticos ( puntos de separación de dichas zonas/intervalos ), por tanto describiremos también la condición que se debe cumplir para tomar la decisión de aceptar ( respectivamente, rechazar ) la hipótesis nula de acuerdo con la ubicación del valor observado del estadístico ( medido en la muestra seleccionada ) dentro ( o fuera ) de la zona de aceptación de la hipótesis nula.

Test bilateral a nivel de significación $\alpha$
    Dado un valor supuesto, $\theta_0$, del parámetro $\theta$ de la población ( que es desconocido ), consideremos el siguiente contraste de la hipótesis nula ( fundamental o estándar ) $H_{0}:\,\theta=\theta_0$ frente a la hipótesis alternativa $H_{1}:\,\theta \neq \theta_0$.

El intervalo de aceptación de la hipótesis nula será tal que $\theta_0 - c \le \hat{\theta} \le \theta_0 + c$ con un nivel de confianza $1-\alpha$, donde $c$ es un número real que dependerá del margen de error de la estimación. Como queremos determinar dicho intervalo el objetivo es, precisamente, obtener el valor de $c$ a nivel de significación $\alpha$ ( o en otras palabras, con un nivel de confianza $1-\alpha$ ). Entonces, si se cumple la hipótesis nula a nivel de confianza $1-\alpha$ podremos expresarlo de la siguiente forma:
    $P\{\theta_0 - c \le \hat{\theta} \le \theta_0 + c\}=1-\alpha$
que es lo mismo que
    $P\{\theta_0 - c - \theta_0 \le \hat{\theta} - \theta_0 \le \theta_0 + c - \theta_0\}=1-\alpha$
es decir
    $P\{- c \le \hat{\theta} - \theta_0 \le c \}=1-\alpha$
y, dividiendo por la desviación típica del estadístico en cada miembro de la doble desigualdad del argumento de la probabilidad, podemos también escribir
    $P\{\dfrac{- c}{\sigma({\hat{\theta}})} \le \dfrac{\hat{\theta} - \theta_0}{\sigma({\hat{\theta}})} \le \dfrac{c}{\sigma({\hat{\theta}})}\}=1-\alpha$
y por la tipificación de la variable aleatoria del estadístico $\hat{\theta}$:
    $Z:=\dfrac{\hat{\theta} - \theta_0}{\sigma({\hat{\theta}})} \approx N(0,1)$
podemos expresar la última línea de la forma
    $P\{\dfrac{- c}{\sigma({\hat{\theta}})} \le Z \le \dfrac{c}{\sigma({\hat{\theta}})}\}=1-\alpha$
y operando con la d. normal se obtiene
    $P\{Z \ge \dfrac{c}{\sigma({\hat{\theta}})}\}=\alpha / 2$
denotando por $z_{\alpha /2}$ a la abscisa de la función de densidad de probabilidad $f(z)$ que deja a su derecha el $(\alpha / 2)\cdot 100 \, \% $ de probabilidad ( valor que encontramos en las tablas de $Z \sim N(0,1)$, podemos escribir
    $P\{ Z \ge z_{\alpha / 2} \}=\alpha / 2$
y por tanto, al ser
    $z_{\alpha / 2} = \dfrac{c}{\sigma({\hat{\theta}})}$
obtenemos el valor de $c$
    $c=z_{\alpha / 2} \cdot \sigma({\hat{\theta}})$
Con lo cual, los valores críticos ( extremos del intervalo de aceptación de $H_0$ ) son
    $\theta_0-z_{\alpha / 2} \cdot \sigma({\hat{\theta}})$
y
    $\theta_0+z_{\alpha / 2} \cdot \sigma({\hat{\theta}})$
respectivamente.

Es decir, el intervalo de aceptación de $H_0$, que denotamos por $C^{*}$, es
    $C^{*}=[\;\theta_0-z_{\alpha / 2} \cdot \sigma({\hat{\theta}})\,,\,\theta_0+z_{\alpha / 2} \cdot \sigma({\hat{\theta}})\;]$

Por tanto, si el valor observado del estimador de $\theta$, $\hat{\theta}$, en la muestra seleccionada pertenece a $C^{*}$, decidiremos aceptar $H_0$ a un nivel de significación $\alpha$. En otras palabras, aceptaremos $H_0$ si $\dfrac{|\hat{\theta}_{\text{observado}}-\theta_0|}{\sigma(\hat{\theta})} \le z_{\alpha / 2}$; en caso contrario, rechazaremos $H_0$, aceptando la hipótesis alternativa $H_1$.

Test unilateral a la izquierda a nivel de significación $\alpha$
Sea el siguiente contraste de hipótesis:
$H_0:\,\theta \le \theta_0$ ( hipótesis nula ) frente a $H_1:\,\theta \succ \theta_0$ ( hipótesis alternativa ).
Aceptamos $H_0$ a nivel de significación $\alpha$ - esto es, a nivel de confianza $1-\alpha$ - si $P\{\hat{\theta} \le \theta_0-c\}=1-\alpha$, es decir, si $P\{\dfrac{\theta-\theta_0}{\sigma(\hat{\theta})} \le -\dfrac{c}{\sigma(\hat{\theta})} \}=1-\alpha \Leftrightarrow P\{\dfrac{\theta-\theta_0}{\sigma(\hat{\theta})} \ge -\dfrac{c}{\sigma(\hat{\theta})} \}=\alpha$ siendo $-\dfrac{c}{\sigma(\hat{\theta})}$ el punto crítico $z_{\alpha}$ ( que es la abscisa de $f(z)$ que deja a su derecha el $\alpha \cdot 100 \, \%$ de la distribución ) y que obtenemos de las tablas $Z \sim N(0,1)$.

Por tanto, el intervalo de aceptación de $H_0$ es $C^{*}=(-\infty \,,\, \theta_0-(-z_{\alpha} \cdot \sigma(\hat{\theta})\,]$, es decir, $C^{*}=(-\infty \,,\, \theta_0+z_{\alpha} \cdot \sigma(\hat{\theta}\,]$. Luego, si $\hat{\theta}_{\text{observado}} \in C^{*}$, entonces aceptaremos $H_0$; o lo que es lo mismo, aceptamos $H_0$ si el valor del estadístico en su variable tipificada es tal que $\dfrac{\hat{\theta}_{\text{observado}}-\theta_0}{\sigma(\hat{\theta})} \le z_{\alpha}$; en caso contrario, rechazaremos $H_0$, aceptando la hipótesis alternativa $H_1$.


Test unilateral a la derecha a nivel de significación $\alpha$
Sea el siguiente contraste de hipótesis:
$H_0:\,\theta \ge \theta_0$ ( hipótesis nula ) frente a $H_1:\,\theta \prec \theta_0$ ( hipótesis alternativa ).
Aceptamos $H_0$ a nivel de significación $\alpha$ - esto es, a nivel de confianza $1-\alpha$ - si $P\{\hat{\theta} \ge \theta_0+c\}=1-\alpha$, es decir, si $P\{\dfrac{\theta-\theta_0}{\sigma(\hat{\theta})} \ge \dfrac{c}{\sigma(\hat{\theta})} \}=1-\alpha$, siendo $\dfrac{c}{\sigma(\hat{\theta})}$ el punto crítico $z_{1-\alpha}$ ( que es la abscisa de $f(z)$ que deja a su derecha el $\alpha \cdot 100 \, \%$ de la distribución ) y que obtenemos de las tablas $Z \sim N(0,1)$.

Por tanto, el intervalo de aceptación de $H_0$ es $C^{*}=[\,\theta_0+z_{\alpha} \cdot \sigma(\hat{\theta})\,,\,\infty\,)$. Luego, si $\hat{\theta}_{\text{observado}} \in C^{*}$, entonces aceptaremos $H_0$; en otras palabras, aceptamos $H_0$ si el valor del estadístico en su variable tipificada es tal que $\dfrac{\hat{\theta}_{\text{observado}}-\theta_0}{\sigma(\hat{\theta})} \ge z_{1-\alpha}$; en caso contrario, rechazaremos $H_0$, aceptando la hipótesis alternativa $H_1$.

$\square$


- - -

Referencias:
  [1] Compta, A., et. al., Matemàtiques II, Barcanova, Barcelona, 1993
  [2] Guàrdia, J.; Viader, M., Estadística, Castellnou, Barcelona, 1999
  [3] García Pérez, A., Estadística Básica con R, UNED, Madrid, 2010
  [4] Allepús, J., et. al., Exercicis d'inferència estadística, Cossetània, Valls, 2002
  [5] Gonick, L.; Smith, W, La Estadística en Cómic, Zendrera Zariquiey, Barcelona, 1999

No hay comentarios:

Publicar un comentario

Gracias por tus comentarios