domingo, 22 de diciembre de 2013

Resumen de la aproximación de la distribución binomial por la d. normal

Vamos a resumir algunas cosas importantes para poder hacer los cálculos de los problemas sobre las distribuciones de probabilidad elementales.

Dada una variable aleatoria que siga una distribución binomial ( que es una d. discreta), $X \sim B(n,p)$, puede ésta aproximarse por una variable aleatoria continua que sigue la distribución normal, $Y \sim N \big( pn\,,\,\sqrt{np(1-p)} \big)$, siempre que $n$ sea lo suficientemente grande, pongamos que $n \succ 10$, se cumpla que:
  (1) siendo $p$ mayor o igual que $0,5$, si $n\,(1-q)\ge 5$
  (2) siendo $p$ menor que $0,5$, si $n\,p \ge 5$

Recordemos que al realizar la transformación $Z=\dfrac{Y-\mu}{\sigma}$ ( tipificación de la variable ), siendo $\mu=n\,p$ y $\sigma=\sqrt{n\,p\,(1-p)}$ los parámetros de la distribución que sigue la v.a. $Y$,
se cumple $P\{Y\le k\}=P\{\dfrac{Y-\mu}{\sigma}\le \dfrac{k-\mu}{\sigma}\}$; ésto es, $P\{Z\le \dfrac{k-\mu}{\sigma}\}$, que es el valor de la función de distribución de probabilidad para $Z=k$, ésto es, $F(k)$, siendo $Z \sim N(0,1)$, con lo cual, podemos realizar los cálculos leyendo los valores de la función de distribución de probabilidad $F(z)$ que vienen en las tablas.

Sin embargo, al aproximar una variable aleatoria discreta por una v.a. continua como es una normal, será necesario, además, hacer una corrección de continuidad, que consiste en sumar o restar media unidad a los valores de referencia de cálculo, tal como se indica en los siguientes casos:

    (i) Como $P\{Y=k\}=0$, pues $Y$ es una variable aleatoria continua, siendo, claro está, $P\{X=k\} \neq 0$, surge, pues, la necesidad de realizar una corrección de continuidad al utilizar la variable continua como aproximación, que, en buena lógica, deberá ser la siguiente $P\{X=k\}\approx P\{k-0,5 \le Y \le k+0,5\}$.

    (ii) Luego, para el caso $P\{a\le X\le b\}$, procede hacer la siguiente corrección de continuidad: $P\{a\le X\le b\} \approx P\{ Y \le b+0'5\}-P\{ Y \le a-0,5\}$.

    (iii) Para calcular $P\{X \prec k\}$, aproximamos por la variable continua y, por tanto, $P\{X \prec k\} \approx P\{Y \le k\} \le P\{ Y \le k+0'5\}$, y considerando, pues, dicha cota superior como mejor aproximación, haremos la corrección de continuidad para este caso de la siguiente forma: $P\{X \prec k\} \approx P\{ Y \le k+0'5\}$

    (iv) Y para calcular $P\{X \succ k\}$, tengamos en cuenta que $P\{X \succ k\}=P\{k \prec X\} \approx P\{k \le Y\} \le P\{k-0'5 \le Y\}$, luego considerando dicha cota superior como mejor aproximación, la corrección de continuidad se hará ahora de la forma: $P\{X \succ k \} \approx P\{ Y \ge k-0'5 \}$

          Observación: Con las distribuciones continuas, el que utilicemos desigualdades fuertes o débiles dará lo mismo, pues la probabilidad de un valor puntual es cero; así pues, si $Y$ es una variable aleatoria continua $P\{Y\prec k\}=P\{Y\le k\}$ así como $P\{Y\succ k\}=P\{Y\ge k\}$.

Ejemplo:
Sea $x \sim B(200\,,\,0'6)$. Calcular:
    a) $P\{X=140\}$
    b) $P\{X \prec 100 \}$
    c) $P\{X \prec 130 \}$
    d) $P\{110 \prec X \prec 130 \}$
    e) $P\{X \succ 150 \}$

Resolución:
    a) $P\{X=140\} \approx P\{Y=40\}$ donde $Y \sim N(200\cdot 0'6\,,\,\sqrt{200\cdot 0'6\cdot (1-0'6)}) \approx N(120\,,\,7)$
luego
$P\{X=140\} \approx P\{140-0'5 \le Y \le 140+0'5)$
    $=P\{Y \le 140'5\}-P\{Y \le 139'5)$
    $=P\{Z\le \dfrac{140'5-120}{7}\}-P\{Z\le \dfrac{139'5-120}{7}\}$
    $\approx P\{ Z \le 2'93 \} - P\{ Z \le 2'79 \}$
    $=F(2,93)-F(2'79)$
    $\approx 0'0009$

    b) $P\{X \prec 100 \} \approx P\{Y \le 100'5\}$
      $=P\{Z \le \dfrac{100'5-120}{7} \}$
      $\approx P\{Z \le -2'79\}=P\{Z \ge 2'79\}$
      $=1-P\{Z \le 2'79\}$
      $=1-F(2'79) \approx 1-0'9974=0'0026$

    c) $P\{X \prec 130 \} \approx P\{Y \le 130'5\}$
      $=P\{Z \le \dfrac{130'5-120}{7} \}$
      $\approx P\{Z \le 1'5\}=F(1'5)$
      $\approx 0'9332$

    d) $P\{110 \prec X \prec 130 \} \approx P\{-2'70 \le Z \le 1'5 \}$ ( aprovechando los cálculos de los apartados c) y d) )
      $=F(1'5)-F(-2'70)$
      $\approx 0'9332-0'0026$
      $\approx 0'9306$

    e) $P\{X \succ 150 \} \approx P\{ Y \ge 150-0'5 \} $
      $=P\{ Z \ge \dfrac{149'5-120}{7} \}$
      $=P\{ Z \ge 4'21 \}$
      $=1-P\{ Z \le 4'21 \}$
      $=1-F(4'21)$
      $=1-0'99999$
      $=0'00002$

$\square$

No hay comentarios:

Publicar un comentario

Gracias por tus comentarios