sábado, 22 de febrero de 2014

Calcular los valores del parámetro $\lambda$ para los cuales la siguiente matriz cuadrada no tiene inversa. Calcular dicha matriz inversa para $\lambda=-1$

Enunciado:
Calcular los valores del parámetro $\lambda$ para los cuales la siguiente matriz cuadrada no tiene inversa. Calcular dicha matriz inversa para $\lambda=-1$
$$\begin{pmatrix}
\lambda & -2\\
2 & -\lambda\\
\end{pmatrix}$$

Resolución:
Es sabido que una matriz cuadrada es invertible si y sólo si su determinante es no nulo; el determinante de la matriz dada es $-\lambda^2+2^2$, luego la matriz dada no es invertible si y sólo si $-\lambda^2+2^2=0$, luego no es invertible para $\lambda=\pm2$; para cualquier otro valor de $\lambda$, sí tiene inversa. Así pues, existe matriz inversa para $\lambda=-1$. Sabemos también que si una matriz dada tiene inversa, ésta es única. Procedamos a encontrarla:

La matriz dada ( que denotamos por $A$ ), para $\lambda=-1$, es
$$A=\begin{pmatrix}-1 & -2\\ 2 & -(-1)\\
\end{pmatrix}=\begin{pmatrix}-1 & -2\\ 2 & 1\\\end{pmatrix}$$
Por el método de la matriz adjunta, sabemos que $$A^{-1}=\dfrac{1}{\text{det}(A)}\,\big(\text{Adj}(A^t)\big)$$
o lo que es lo mismo
$$A^{-1}=\dfrac{1}{\text{det}(A)}\,\big(\text{Adj}(A)\big)^t$$
y haciendo los cálculos
$$A^{-1}=\dfrac{1}{3}\,\begin{pmatrix}1 & -2\\ 2 & -1\\\end{pmatrix}^t=\dfrac{1}{3}\,\begin{pmatrix}1 & 2\\ -2 & -1\\\end{pmatrix}=\begin{pmatrix}1/3 & 2/3\\ -2/3 & -1/3\\\end{pmatrix}$$

Observación:   Si bien hemos calculado la matriz inversa por el método de la matriz adjunta, sería mejor - en este caso - utilizar el método de Gauss-Jordan, pues es más económico en cálculos. Recordemos que éste es un método de reducción, que consiste en realizar las operaciones elementales entre filas que nos lleven de $(A|I)$ a $(I|A^{-1})$, donde $I$ indica la matriz identidad. Entonces, partiendo de
$$\left(\begin{array}{cc|cc}
-1 & -2 & 1 & 0 \\
2 & 1 & 0 & 1\\
\end{array}\right)$$
y mediante la operación elemental $2\,e_1+e_2 \rightarrow e_2$ llegamos a
$$\left(\begin{array}{cc|cc}
-1 & -2 & 1 & 0 \\
0 & -3 & 2 & 1\\
\end{array}\right)$$
haciendo, ahora, $-2\,e_2+3\,e\,_1 \rightarrow e_1$, obtenemos
$$\left(\begin{array}{cc|cc}
-3 & 0 & -1 & -2 \\
0 & -3 & 2 & 1\\
\end{array}\right)$$
y, finalmente, para normalizar los coeficientes de la diagonal principal de la submatriz de la izquierda, haremos $-1 \cdot e_1 \rightarrow e_1$ y $-(1/3)\cdot e_2 \rightarrow e_2$, con lo cual
$$\left(\begin{array}{cc|cc}
1 & 0 & 1/3 & 2/3 \\
0 & 1 & -2/3 & -1/3\\
\end{array}\right)$$
y de aquí, concluimos que
$$A^{-1}=\left(\begin{array}{cc}
1/3 & 2/3 \\
-2/3 & -1/3\\
\end{array}\right)$$

Nota:   Se comprueba sin dificualtad que $A\,A^{-1}=A^{-1}\,A=I$
$\square$

En una clase hay $9$ chicas y $8$ chicos. Se elige al azar un comité formado por tres estudiantes de dicha clase. Calcular la probabilidad de que los tres estudiantes elegidos sean chicas.

Enunciado:
En una clase hay $9$ chicas y $8$ chicos. Se elige al azar un comité formado por tres estudiantes de dicha clase. Calcular la probabilidad de que los tres estudiantes elegidos sean chicas.

Resolución:
Denotando por $H_i$ el suceso elegir un chico en la realización i-ésima ($i=1,2,3$ ) y por $M_i$ es suceso elegir una chica en el suceso i-ésimo ($i=1,2,3$ ) , podemos escribir la probabilidad pedida de la forma: $$P(M_1 \cap M_2 \cap M_3)=P(M_1)\cdot P(M_2 | M_1) \cdot P(M_3 | M_1 \cap M_2 )$$
y teniendo en cuenta que
  $P(M_1)=9/(8+7)=9/17$

  $P(M_2|M_1)=(9-1)/(17-1)=8/16$

  $P(M_3|M_1 \cap M_2)=(8-1)/(16-1)=7/15$

$$P(M_1 \cap M_2 \cap M_3)=\dfrac{9}{17}\cdot \dfrac{8}{16} \cdot \dfrac{7}{15}=\dfrac{21}{170}\approx 0'1235$$

Nota:   El problema se puede plantear también dibujando un diagrama de árbol y anotando los coeficientes de probabilidad en las aristas del camino que lleva al único suceso compuesto por el que se está preguntando; de esta forma, puede obviarse el formalismo del lenguaje conjuntista, aunque éste es siempre recomendable atendiendo la circunstancia que el problema se inscribe en el ámbito de Bachillerato.

$\blacksquare$

[nota del autor]

Discutir y resolver el siguiente sistema de ecuaciones lineales (...)

Enunciado:
Discutir y resolver el siguiente sistema de ecuaciones lineales:
$$\left.\begin{matrix}
3\,x &-&3\,y&+&z=&11 \\
2x &-&3\,y&+&2\,z=&9 \\
x &-&2\,y&+&4\,z=&3 \\
\end{matrix}\right\}$$

Resolución:
Reduciendo el sistema por Gauss,
$\left.\begin{matrix}
3\,x &-&3\,y&+&z=&11 \\
2x &-&3\,y&+&2\,z=&9 \\
x &-&2\,y&+&4\,z=&3 \\
\end{matrix}\right\}$

Mediante las siguientes operaciones elementales entre ecuaciones
$\left.\begin{matrix}
-2\,e_1+3\,e_2 \rightarrow e_2\\
-2\,e_3+3\,e_2 \rightarrow e_3\\
\end{matrix}\right.$

obtenemos el siguiente sistema equivalente
$\left.\begin{matrix}
3\,x &-&3\,y&+&z=&11 \\
&&-3\,y&+&4\,z=&5 \\
&&y&-&6\,z=&3 \\
\end{matrix}\right\} $

que acabamos de escalonar haciendo
$\left.\begin{matrix}
2\,e_3+e_2 \rightarrow e_3\\
\end{matrix}\right.$

obteniendo
$\left.\begin{matrix}
3\,x &-&3\,y&+&z=&11 \\
&&-3\,y&+&4\,z=&5 \\
&&&-&14\,z=&14 \\
\end{matrix}\right\} $

sistema escalonado por Gauss que tiene $3$ ecuaciones linealmente independientes, luego el rango del sistema de ecuaciones es $3$; y, como el rango coincide con el número de incógnitas, el sistema es compatible determinado, por lo que la solución es única. Veamos cuál es. De la última ecuación, despejamos $z$ sin dificultad, obteniendo $z=-1$; sustituyendo dicho valor en la segunda ecuación del sistema reducido llegamos a $y=-3$. Y, finalmente, sustituyendo $z=-1$ e $y=-3$ en la primera ecuación y despejando la incógnita $x$ resulta $x=1$.

Nota:   Se comprueba facilmente que la solución satisface las tres igualdades originales.

$\square$

[nota del autor]

Las máquinas $A$ y $B$ producen $50$ y $250$ piezas por hora, con un porcentaje de fallos del $1\,\%$ y del $10\,\%$, respectivamente. Tenemos mezcladas las piezas que se han fabricado en una hora y elegimos una al azar, que resulta no ser defectuosa. Hallar la probabilidad de que haya sido fabricada por la máquina $B$.

Enunciado:
Las máquinas $A$ y $B$ producen $50$ y $250$ piezas por hora, con un porcentaje de fallos del $1\,\%$ y del $10\,\%$, respectivamente. Tenemos mezcladas las piezas que se han fabricado en una hora y elegimos una al azar, que resulta no ser defectuosa. Hallar la probabilidad de que haya sido fabricada por la máquina $B$.

Resolución:
Llamaremos $A$ al suceso "elegir una pieza que provenga de la máquina A"; $B$, al suceso "elegir una pieza que provenga de la maquina B; por $D$ al suceso "elegir una pieza defectuosa" y por $\overline{D}$ al suceso "elegir una pieza no defectuosa".

Entendemos el espacio muestral $\Omega$ formado por los sucesos elementales ( y por tanto incompatibles ) $A$ y $B$, es decir, $\Omega = A \cup B$. Siendo, pues, $\overline{D} \subset \Omega$, podemos escribir ( Teorema de la Probabilidad Total ): $$P(\overline{D})=P(\overline{D}|A)\,P(A)+P(\overline{D}|B)\,P(B)$$
y teniendo en cuenta los datos del problema

    $P(A)=50/300$
    $P(B)=250/300$
    $P(\overline{D}|A)=(100-1)/100=99/100$
    $P(\overline{D}|B)=(100-10)/100=90/100$

luego
$$P(\overline{D})=\dfrac{99}{100}\cdot \dfrac{50}{300}+\dfrac{90}{100}\cdot \dfrac{250}{300}=\dfrac{183}{200}=0'915$$

Finalmente, por el Teorema de Bayes, podemos escribir
$$P(B|\overline{D})=\dfrac{P(\overline{D}|B)\,P(B)}{P(\overline{D})}$$
y poniendo los datos
$$P(B|\overline{D})=\dfrac{(90/100)\cdot (250/300)}{183/200} \approx 0'8197$$

$\blacksquare$

[nota del autor]

viernes, 21 de febrero de 2014

Se sabe que la renta anual ( en unidades monetarias arbitrarias, u.m) de los contribuyentes de una ciudad tiene una distribución de probabilidad normal de media desconocida, y desviación típica $\sigma = 2000$ u.m. Se ha tomado una muestra aleatoria simple de $40$ contribuyentes de esa localidad, observándose una media muestral de $20\,000$ u.m. Realizar un contraste estadístico de hipótesis, a nivel de significación $\alpha=0'05$, con el fin de valorar la validez de la siguiente afirmación: "La media de la población es de $18\,000$ u.m".

Enunciado:
Se sabe que la renta anual ( en unidades monetarias arbitrarias, u.m) de los contribuyentes de una ciudad tiene una distribución de probabilidad normal de media desconocida, y desviación típica $\sigma = 2000$ u.m. Se ha tomado una muestra aleatoria simple de $40$ contribuyentes de esa localidad, observándose una media muestral de $20\,000$ u.m. Realizar un contraste estadístico de hipótesis, a nivel de significación $\alpha=0'05$, con el fin de valorar la validez de la siguiente afirmación: "La media de la población es de $18\,000$ u.m."

Resolución:
Sea $X$ la variable aleatoria renta anual de los individuos de la población. Según el enunciado, debemos considerar que $X \sim N(\mu\,,\,2000)$, con media, $\mu$, desconocida. Entonces, es razonable plantear el siguiente contraste bilateral: la hipótesis nula ( o hipótesis estándar; estándar, en el sentido, que apunta la afirmación propuesta "La media de la población es de $18\,000$ u.m." ), que expresamos como $H_0:\,\mu=\mu_0$, con $\mu_0=18\,000$ u.m., frente a la hipótesis alternativa $H_1:\,\mu \neq 18\,000$ u.m., siendo el estadístico del contraste tal que su variable aleatoria es $\dfrac{\overline{x}-\mu_0}{\sigma / \sqrt{n}}$ que es una v.a. con distribución $Z \sim N(0,1)$ en el muestreo ( Teorema Central del Límite ).

Recordemos que $z_{\alpha/2}=P\{Z \ge z_{\alpha/2}\}=\alpha/2=F(1-\alpha / 2)$, donde $F(z)$ es la función de distribución de probabilidad de $Z \sim N(0,1)$ ( tablas ), con lo cual, al ser $\alpha=0'05$, se obtiene $\alpha/2=\alpha_{0'05/2}=\alpha_{0'025}=F(1-0'025)=F(0'975)=1'96$, luego los puntos críticos ( extremos del intervalo de aceptación de $H_0$ ) son $-1'96$ y $1'96$, es decir, el intervalo de aceptación de la hipótesis nula $H_0$ expresado en la variable $Z$ es $C_{Z}^{*}=[-1'96\,,\,1'96]$.

De la muestra, vemos que el valor observado de la variable tipificada del estadístico de contraste es $Z_{\text{observado}}=\dfrac{20\,000-18\,000}{2000/\sqrt{40}}=6'3246 \notin C^{*}$ y que, por tanto, cae en la región crítica, luego decidimos rechazar la hipótesis nula, aceptando la hipótesis alternativa y concluyendo que no corroboramos la afirmación propuesta a un nivel de significación $\alpha=0'05$.
$\blacksquare$

[nota del autor]

Se desea estimar el tiempo de permanencia de los pacientes en un hospital; para ello, se ha seleccionado una muestra aleatoria simple de $800$ pacientes de dicho hospital y se ha observado una media muestral de la permanencia en el hospital de $4'5$ días, con una desviación típica ( de la muestra ) de $3'2$ días. Obtener un intervalo de confianza al $95\,\%$ para la media de la permanencia en dicho hospital.

Enunciado:
Se desea estimar el tiempo de permanencia de los pacientes en un hospital; para ello, se ha seleccionado una muestra aleatoria simple de $800$ pacientes de dicho hospital y se ha observado una media muestral de la permanencia en el hospital de $4'5$ días, con una desviación típica ( de la muestra ) de $3'2$ días. Obtener un intervalo de confianza al $95\,\%$ para la media de la permanencia en dicho hospital.

Resolución:
Se nos pide estimar la media, $\mu$, del tiempo de permanencia en el hospital, calculando un intervalo de confianza, con un coeficiente $1-\alpha=0'95$. A pesar de no conocer el tipo de modelo de distribución de probabilidad de la variable aleatoria permanencia en el hospital, al tratarse de una muestra grande ( $n=800$ ) y haber realizado un muestreo aleatorio simple, podemos suponer que la distribución en el muestreo del estimador de la media, $\mu$, correspondiente a la variable aleatoria permanencia en el hospital de la población, sigue una distribución aproximadamente normal ( Teorema Central del Límite ), por lo que un buen estimador de la media de la población es $\dfrac{\overline{x}-\mu}{\sigma(\overline{x})}$, siendo la desviación típica del estimador: $\sigma(\overline{x})=\sigma / \sqrt{n}$. Ahora bien, no conocemos tampoco la desviación típica de la población $\sigma$, con lo cual deberemos también estimarla a partir de la información de la muestra, y un buen estimador de la desviación típica de la población es la cuasidesviación típica $S$ ( que es un estimador centrado de $\sigma$ ), que se relaciona con la desviación típica de la muestra, $s$ ( estimador no centrado y cuyo valor es un dato del problema ), de la forma $S=s\,\sqrt{\frac{n}{n-1}}$, y con los datos del problema se obtiene una cuasidesviación típica $S=3'2\cdot \sqrt{\dfrac{800}{800-1}}=3'2020$ ( aproximando por redondeo simétrico con cuatro cifras decimales ).

Así, pues, el estimador $\overline{x}$ de la media $\mu$ de la población tiene una distribución en el muestreo tal que su variable tipificada $Z$ es $Z=\dfrac{\overline{x}-\mu}{S/\sqrt{n}} \approx N(0,1)$; por lo tanto, el intervalo de confianza de $\mu$ es $I=[\overline{x}-E\,,\,\overline{x}+E]$, donde $E$ denota el margen de error en la estimación y viene dado por $E=z_{\alpha/2}\cdot \dfrac{S}{\sqrt{n}}$, y siendo $z_{\alpha / 2}$ la abscisa de $f(z)$ tal que $P\{Z \ge \alpha/2 \}=\alpha/2=F(1-\alpha/2)$, denotando por $F(z)$ la función de distribución de probabilidad de $Z \sim N(0,1)$ ( tablas ). Entonces, al ser $1-\alpha=0'95$ vemos que $\alpha=0'05$ y, por tanto, $\alpha/2=0'025$, luego $F(1-0'025)=F(0'975)=1'96$ ( tablas ), luego $E=1'96 \cdot \dfrac{3'2020}{\sqrt{800}} = 0'2219$ ( es decir, $E \approx 22\,\%$ ), con lo cual obtenemos el intervalo de confianza $I=[4'5-0'2219\,,\,4'5+1'96 \cdot 0'2219]$, es decir, $I=[4'2781\,,\,4'7219]$

En conclusión: podemos afirmar que la media del tiempo de permanencia en el hospital, $\mu$, de la población es tal que $\mu \in [4'2781\,,\,4'7219]$ a nivel de confianza del $95\,\%$ y con un margen de error en la estimación igual a $E \approx 22\,\%$.

$\blacksquare$


[nota del autor]

Realizar los siguientes cálculos de probabilidad, de acuerdo con los modelos de la variable aleatoria indicados en cada uno de los casos: a) Sea $X \sim N(4'2\,,\,2'1)$, calcular: $P\{2\le X \le 3\}$ b) Sea $X \sim N(4'2\,,\,2'1)$, calcular: $P\{|X| \le 2\}$ c) Sea $X \sim N(4'2\,,\,2'1)$, calcular: $P\{|X| \succ 2\}$ d) b) Sea $X \sim B(600\,,\,0'6)$, calcular: $P\{400 \le X \le 500\}$

Enunciado:
Realizar los siguientes cálculos de probabilidad, de acuerdo con los modelos de la variable aleatoria indicados en cada uno de los casos:
a) Sea $X \sim N(4'2\,,\,2'1)$, calcular: $P\{2\le X \le 3\}$
b) Sea $X \sim N(4'2\,,\,2'1)$, calcular: $P\{|X| \le 2\}$
c) Sea $X \sim N(4'2\,,\,2'1)$, calcular: $P\{|X| \succ 2\}$
d) b) Sea $X \sim B(600\,,\,0'6)$, calcular: $P\{400 \le X \le 500\}$

Resolución:
a)
$P\{2\le X \le 3\}=P\{X \le 3\}-P\{X \le 2\}$
Haciendo la transformación $X \sim N(\mu\,,\,\sigma) \rightarrow Z=\dfrac{X-\mu}{\sigma} \sim N(0,1)$ ( tipificación de la variable ) nos queda
$P\{ \dfrac{X-4'2}{2'1} \le \dfrac{3-4'2}{2'1} \}-P\{ \dfrac{X-4'2}{2'1} \le \dfrac{2-4'2}{2'1} \}$
es decir
$P\{2\le X \le 3\}=P\{ Z \le -0'5714 \}-P\{ Z \le -1'0476 \}$
  $=P\{ Z \ge 0'5714 \}-P\{ Z \ge 1'0476 \}$ ( por la simetría de la función de densidad $f(z)$ )
  $=(1-P\{ Z \le 0'5714 \})-(1-P\{ Z \le 1'0476 \})$ ( por la propiedad del contrario )
  $=P\{ Z \le 1'0476 \}-P\{ Z \le 0'5714 \}$
  $=F(1'0476)-F(0'5714)$ ( siendo $F(z)$ la función de distribución de probabilidad, cuyos valores están están en las tablas )
  $=0'8531-0'7157$
  $=0'1374$ que es, aproximadamente, un $14 \,\text{%}$

b)
$P\{ |X|\le 2 \}=P\{ -2\le X \le 2\}=P\{ X \le 2 \}-P\{ X \le -2 \}$
Haciendo la transformación $X \sim N(\mu\,,\,\sigma) \rightarrow Z=\dfrac{X-\mu}{\sigma} \sim N(0,1)$ ( tipificación de la variable ) nos queda
$P\{ \dfrac{X-4'2}{2'1} \le \dfrac{2-4'2}{2'1} \}-P\{ \dfrac{X-4'2}{2'1} \le \dfrac{-2-4'2}{2'1} \}$
es decir
$P\{\|X|\le 2\}=P\{ Z \le -1'0476 \}-P\{ Z \le -2'9524 \}$
  $=P\{ Z \ge 1'0476 \}-P\{ Z \ge 2'9524 \}$ ( por la simetría de la función de densidad $f(z)$ )
  $=(1-P\{ Z \le 1'0476 \})-(1-P\{ Z \le 2'9524 \})$ ( por la propiedad del contrario )
  $=P\{ Z \le 2'9524 \}-P\{ Z \le 1'0476 \}$
  $=F(2'9524)-F(1'0476)$ ( siendo $F(z)$ la función de distribución de probabilidad, cuyos valores están están en las tablas )
  $=0'9984-0'8531$
  $=0'1453$

c)
$P\{ |X|\succ 2 \}=P\{X\succ 2\}+P\{X\prec -2\}$
    $=1-P\{ -2 \le X\le 2 \}$ ( por la propiedad del contrario )
es decir
$P\{ |X|\succ 2 \}=1-P\{|X|\le 2\}$
    $=1-0'1453 = 0'8547 $

d)
Siendo $X \sim B(600\,,\,0'6)$, al ser $p \succ 0'5$ y $n\,p = 600 \cdot 0'6 = 360 \succ 5$, podemos aproximar la variable aleatoria binomial $X$ por una variable aleatoria normal $Y \sim N(\mu\,,\,\sigma)$ con $\mu=n\,p=600\cdot 0'6=360$ y $\sigma=\sqrt{n\,p\,(1-p)}=\sqrt{600\cdot 0'6\cdot 0'4}=12$. Así, pues,
$P\{400 \prec X \prec 500\} \approx P\{400-0'5 \le Y \le 500+0'5\}$ ( donde se ha hecho aquí la corrección de continuidad )
luego
$P\{400 \prec X \prec 500\} \approx P\{Y \le 500'5\}-P\{Y \le 399'5\}$
y, tipificando la variable ( $Z = \dfrac{Y-\mu}{\sigma} \sim N(0,1)$ ), podemos expresar lo anterior de la forma
$P\{\dfrac{Y-360}{12} \le \dfrac{500'5-360}{12}\}-P\{\dfrac{Y-360}{12} \le \dfrac{399'5-360}{12} \}$
en otras palabras, como
$P\{Z \le 11'71\}-P\{Z \le 3'29 \}=F(11'71)-F(3'29)$
y teniendo en cuenta que $F(11'71)$ es, prácticamente, igual a $1$, obtenemos: $1-0'9995$; es decir,
$P\{400 \prec X \prec 500\} \approx 1-0'9995 = 0'0005$
$\blacksquare$


[nota del autor]

La media del valor de las ventas diarias de un dependiente de unos grandes almacenes es de $950$ euros, y la desviación típica de $200$ euros. Suponiendo que la variable aleatoria valor de las ventas diaras sigue una distribución normal, ¿ cuál es la probabilidad de que el valor de las ventas efectuadas en un día sea superior a $1250$ euros ?.

Enunciado:
La media del valor de las ventas diarias de un dependiente de unos grandes almacenes es de $950$ euros, y la desviación típica de $200$ euros. Suponiendo que la variable aleatoria valor de las ventas diaras sigue una distribución normal, ¿ cuál es la probabilidad de que el valor de las ventas efectuadas en un día sea superior a $1250$ euros ?.

Resolución:
$X \sim N(\mu\,,\,\sigma)$ donde $\mu=950$ y $\sigma=200$. Entonces,
    $P \{X \succ 1250 \}=P\{\dfrac{X-950}{200} \succ \dfrac{1250-950}{200}\}$ , donde hemos hecho la tipificación de la variable, es decir, la transformación con la que pasamos de la variable $X \sim N(\mu\,,\,\sigma)$ a $Z=\dfrac{X-\mu}{\sigma} \sim N(0,1)$ para poder usar los valores tabulados de esta función de distribución de probabilidad de la variable normalizada, $Z$, con lo cual podemos escribir:
    $P\{ X \succ 1250 \}=P\{Z \succ 1'5 \}$
        $=1-P\{ Z \le 1'5 \}$
        $=1-F(1'5)$, donde $F(z)$ es la función de distribución de probabilidad ( tablas )
        $=1-0'9332$
        $=0'0668$, que es un $7\,\%$ aproximadamente.
$\blacksquare$


[nota del autor]

De una urna que contiene una bola blanca y dos bolas negras se hacen $5$ extracciones sucesivas con reemplazamiento. Denotamos por $X$ a la variable aleatoria número de bolas blancas extraídas. Se pide:   a) ¿ Cuál es el modelo de distribución de probabilidad de $X$ ?   b) ¿ Cuál es la media y la desviación típica de $X$ ?   c) ¿ Cuál es la probabilidad de obtener al menos una bola blanca ?

Enunciado:
De una urna que contiene una bola blanca y dos bolas negras se hacen $5$ extracciones sucesivas con reemplazamiento. Denotamos por $X$ a la variable aleatoria número de bolas blancas extraídas. Se pide:
  a) ¿ Cuál es el modelo de distribución de probabilidad de $X$ ?
  b) ¿ Cuál es la media y la desviación típica de $X$ ?
  c) ¿ Cuál es la probabilidad de obtener al menos una bola blanca ?

Resolución:
a)
Por la naturaleza de la experiencia aleatoria que se describe en el enunciado, la distribución de probabilidad de la variable aleatoria, $X$, es de tipo discreto; concretamente, sigue el modelo binomial $X \sim B(n,p)$, ya que se nos plantea una sucesión de extracciones independientes o pruebas de Bernoulli $B(1,p)$. Denotamos por $n$ al número de realizaciones (extracciones) y por $p$ la probabilidad de éxito ( sacar bola blanca en una realización ); en el problema, $n=5$ y, por el principio de Laplace, $p=1/3$

b)
La media $E[X]$ es en este modelo, igual a $n\cdot p$, y por tanto es igual a $5\cdot \dfrac{1}{3}=\dfrac{5}{3}\approx 1'67$; la desviación típica $\text{Desv}(X)$, que es igual a la raíz cuadrada de la varianza $V(X)$, es en este modelo igual a $\sqrt{n\,p\,(1-p)}$ y, por tanto, tiene el siguiente valor ( con los datos del problema ): $\text{Desv}(X)=\sqrt{5\cdot \dfrac{1}{3}\,(1-\dfrac{1}{3})}=\dfrac{\sqrt{10}}{3}\approx 1'05$

c)
    $P\{X \ge 1\}=1-P\{X=0\}$
En un modelo discreto ( como el m. binomial ), los valores de la función de masa corresponden a la probabilidad para cada valor de la variable aleatoria $X$, es decir, $P\{X=x\}$, que suele representarse también de la forma $P_{X}(x)$, y que es igual a
    $P_{X}(x)=\binom{n}{x}\,p^{x}\,(1-p)^{n-x}$
luego
    $P\{X=0\}=\binom{5}{0}\cdot (1/3)^2 \cdot (1-1/3)^{5-0}$
con lo cual, por la propiedad del contrario, podemos escribir
    $P\{X \ge \}=1-\binom{5}{0}\cdot (1/3)^2 \cdot (1-1/3)^{5-0} = \dfrac{211}{243} \approx 0'8683$
$\blacksquare$


[nota del autor]

miércoles, 12 de febrero de 2014

Contraste de hipótesis bilateral para una población aproximadamente normal ( muestras grandes ), siendo la desviación típica desconocida. Reflexiones sobre la necesidad del cálculo del p-valor.

Enunciado:
El porcentaje de un determinado metal que debe contener una cierta aleación es de $5'5\,\%$. Se toma una muestra de $200$ piezas de dicha aleación y se obtiene una media de $\bar{x}=5'2 \, \%$, con una desviación típica de $s=3'0\,\%$.
    a) ¿Se puede afirmar, desde el punto de vista de la inferencia estadística, que la proporción del metal en cuestión que forma parte de la aleación es la correcta, a nivel de significación $\alpha=0'05$?
    b) (Apartado de ampliación). Reflexionar sobre la necesidad del cálculo del nivel de significación observado, esto es, del llamado p-valor y calcularlo

Resolución:
  a)
Tratándose de muestras grandes, $n=200 \gt 30$, podemos aceptar razonablemente que la variable aleatoria de la población proporción del componente $A$ tiene una distribución aproximadamente normal $N(\mu\,,\,\sigma)$, con media $\mu$ desconocida y desviación típica $\sigma$.

De acuerdo con lo que se nos pide, Planteamos el siguiente contraste bilateral: la hipótesis estándar (la aleación tiene la proporción correcta en el metal componente), es decir, la hipótesis nula $H_0:\,\mu = \mu_0$ (donde $\mu_0=5'5$), frente a la hipótesis alternativa $H_1:\,\mu \neq \mu_0$

Por las características antes mencionadas, el estadístico del contraste sigue una distribución $\dfrac{\bar{x}-\mu_0}{S/\sqrt{n}} \approx N(0,1)$, donde $\bar{x}$ es el estadístico de la media muestral, $n$, el tamaño muestral y $S$ la cuasideviación típica de la muestra (que, por ser un estimador centrado, se puede utilizar para estimar bien la desviación típica, $\sigma$, de la población), y, siendo la desviación típica de la muestra $s$ (que es un dato del problema), sabemos que está relacionada con la cuasidesviación de la misma de la forma $S=\sqrt{\dfrac{n}{n-1}}\,\,s$, luego el valor de la cuasidesviación típica $S$ de la muestra es $S=\sqrt{\dfrac{100}{100-1}}\,\cdot 3 = 3'0151$ (aproximando a cuatro cifras decimales).

Teniendo en cuenta que el test es bilateral, aceptaremos $H_0$ si el valor observado del estadístico en la muestra dada cae en el intervalo de aceptación $C^{*}$ de la variable tipificada del estadístico, $Z$, $C_{Z}^{*}=\left[-z_{\alpha / 2}\,,\,z_{\alpha / 2}\right]$; es decir si $\dfrac{|\overline{x}-\mu_0|}{S/\sqrt{n}} \le z_{\alpha / 2}$, siendo el valor crítico $z_{\alpha/2}$ (que consultamos en las tablas de la función de distribución $F(z)$ de $Z \sim N(0,1)$) igual a $z_{0'05/2}=z_{0'025}=1'96$. Calculando el valor del estadístico en la muestra, vemos que $\bigg(\dfrac{|\overline{x}-\mu_0|}{S/\sqrt{n}}\bigg)_{\text{observada}}=\dfrac{|5'2-5'5|}{3'0151}=0'0995 \lt 1'96$, luego decidimos aceptar $H_0$ con un nivel de significación $\alpha=0'05$.

  b) [ Ampliación ]
Se nos pide, ahora, calcular, el nivel de significación observado (el p-valor) en contraposición al nivel de significación prefijado $\alpha$. El p-valor es el mínimo nivel de significación necesario para rechazar la hipótesis fundamental $H_0$. Recordemos que el error de tipo I representa la probabilidad de rechazar la hipótesis nula, siendo ésta cierta. El nivel de significación $\alpha$ (que no el p-valor) viene dado en el enunciado (o lo decidimos de manera razonable), es decir, viene fijado de antemano: en este caso se nos dice que es igual a $\alpha=0'05$. Démonos cuenta, no obstante, de que este nivel de significación prefijado, $\alpha=0'05$, no deja de conllevar cierta arbitrariedad, pues podríamos haber escogido un valor mayor o menor y, por tanto, la decisión de aceptar la hipótesis podría no haberse dado; por ello, y, por lo menos, para reforzar la decisión tomada, siempre es conveniente calcular, además, lo que denominamos p-valor, que es el nivel de significación observado, esto es, el valor del error de tipo I observado, que es el menor nivel de significación que tendríamos que fijar de antemano para rechazar la hipótesis nula con el valor del estadístico observado en la muestra.

En el caso singular en que el nivel de significación tuviese el máximo valor posible, $\alpha=1$ ( máximo error de tipo I), entonces los puntos críticos vendrían dados por $z_{\alpha / 2}=z_{1/2}=z_{0'5}=0$, luego el intervalo de aceptación de $H_0$ expresado en la variable tipificada $Z$ ( variable del estadístico del contraste ) se reduciría a un único valor, que en términos de la variable tipificada, sería el $0$; en otras palabras, el intervalo de aceptación de la hipótesis nula, $H_0$, correspondería a un único valor, esto es, a $C_{Z}^{*}=\{0\}$ y, por tanto, al no coincidir - con casi total probabilidad - el valor de $Z_{observado}$ con dicho valor en la realización del muestreo, cabría rechazar siempre la hipótesis nula - pero, cuidado, con un nivel de confianza en la decisión de $1-\alpha=1-1=0$, es decir del $0\,\%$ -, salvo en el extraño caso - raro, por altamente improbable - que éste fuese igual a cero, es decir, en el caso de que la media muestral observada, $\overline{x}$, coincidiese exactamente con el valor $\mu_0$. Así, pues, cuanto mayor es el nivel de significación del contraste fijado de antemano, $\alpha$, con mayor facilidad decidiremos rechazar la hipótesis nula, $H_0$, pues el intervalo de aceptación, $C^{*}$, tiende a tener amplitud cero, a contraerse en un punto, sin dar pie a que el valor observado del estadístico en la muestra caiga en él; sin embargo, a mayor nivel de significación corresponde menor nivel confianza en el resultado de la inferencia (menor confianza en la decisión tomada de rechazar $H_0$). En el símil sobre un jurado en cuanto a la decisión que debe tomar de un declarar culpable o inocente a un imputado, siendo la hipótesis nula "el imputado es inocente", ésto aseguraría la decisión de declararle culpable en cualquier caso; algo que da, ciertamente, mucho miedo.

Por el contrario, si el nivel de significación $\alpha$, fuese, también en caso extremo, igual a $\alpha=0$, caeríamos en una posición absolutamente conservadora: fe ciega en la hipótesis nula, $H_0$, anulando de plano el error de tipo I, es decir, conviniendo que es imposible rechazar la hipótesis nula, supuesta ésta cierta, pase lo que pase y, por tanto, por contra, haciendo máximo el error de tipo II; entonces los puntos críticos estarían en $-\infty$ y $+\infty$ (en un contraste bilateral), luego el intervalo de aceptación de la hipótesis nula sería toda la recta real, luego sería imposible rechazar la hipótesis nula a un nivel de confianza de $1-\alpha=1-0=1$, esto es, del $100\%$. En el caso del símil de aplicación a la toma de decisión de un jurado de declarar culpable o inocente a un imputado, esto correspondería a declarar inocente al imputado, al margen de que éste pueda ser o no culpable, lo cual, evidentemente, sería inquietante.

Es evidente, pues, que plantear un contraste de hipótesis en estos términos, tanto en un extremo como en otro, no tendría ningún sentido. Sin embargo, plantear dichos casos singulares y reflexionar sobre ellos nos puede ayudar a entender los conceptos y a poner las ideas en claro; de ahí que se hayan comentado, en este apartado de ampliación, aspectos referentes a: a) el error de tipo I (probabilidad de rechazar la hipótesis nula, siendo ésta cierta), y, por tanto, en relación directa con ésto, se ha tratado del nivel de significación prefijado, $\alpha$, así como del nivel de significación observado o p-valor, y del significado del coeficiente de confianza que cabe depositar en la decisión a tomar; y, b) el error de tipo II (probabilidad de aceptar la hipótesis alternativa siendo ésta falsa) y su relación con el error de tipo-I.

Luego, por lo que acabamos de decir, el nivel de significación prefijado $\alpha$, vendría a ser, pues, una aproximación al error de tipo I, es decir, al p-valor, que es, de hecho, en el que deberíamos fijarnos para decidir aceptar o rechazar la hipótesis nula (respectivamente aceptar la hipótesis alternativa). Veamos cómo: Un p-valor demasiado pequeño, (en particular, inferior a $\alpha$) o simplemente muy pequeño, pongamos inferior a $0'01$, nos llevaría a tener que rechazar la hipótesis nula $H_0$ (que se supone cierta), por no ser suficiente dicha probabilidad para poder acreditarla. Es decir, en realidad, para tomar la decisión de aceptar o rechazar la hipótesis nula, debemos guiarnos por el p-valor, más que por el nivel de significación que, eventualmente, se pueda fijar. En muchos problemas, como por ejemplo, en éste, el nivel de significación - como cota del p-valor - viene dado, por lo que - en principio - podríamos obviar su cálculo. Ésto, sin embargo, no es recomendable, pues el valor de significación fijado de antemano podría no ser, digamos, el acertado.


Así pues, entendemos el p-valor o nivel de significación observado (por contraposición al nivel de riesgo o nivel de significación prefijado $\alpha$) de una prueba de verificación/contraste de la hipótesis por inferencia estadística como el error de tipo I observado, y, por tanto, ha de venir dado por la probabilidad de obtener un valor igual o más extremo que el observado en la muestra, en el supuesto de que la hiótesis nula $H_0$ (que queremos verificar/contrastar frente a la hipótesis alternativa $H_1$) sea cierta/verdadera. Así, para poder rechazar la hipótesis nula $H_0$, en buena lógica deberemos encontrar que $\text{p-valor}\le \alpha$, teniendo que reafirmarla si encontramos que $\text{p-valor}\gt \alpha$.

Calcularemos pues el p-valor utilizando la distribución de probabilidad en el muestreo del estadístico de prueba asumiendo que la hipótesis fundamental es cierta. Al cálcular el p-valor nos podemos encontrar, según el caso, que el contraste se tenga que realizar por la cola superior, por la cola inferior, o bien de manera bilateral.

Llamando genéricamente $\hat{\theta}$ al estimador (estadístico) del test/contraste (y conocida su función de distribución de probabilidad, $F(\hat{\theta})$) —recordemos que en nuestro problema en concreto nuestro estimador sigue una distribución normal tipificada $Z$— y $\hat{\theta}_{\text{prueba}}$ al valor de dicho estadístico en la prueba (calculado) y que por supuesto depende del valor observado en la muestra:
  (i) Unilateral por la izquierda: $$\text{p-valor}=P\{\hat{\theta} \le \hat{\theta}_{\text{prueba}}|H_o\,\text{es cierta}\}=F(\hat{\theta})$$
  (ii) Unilateral por la derecha: $$\text{p-valor}=P\{\hat{\theta} \ge \theta_{\text{prueba}}|H_o\,\text{es cierta}\}=1-P\{\hat{\theta} \le \hat{\theta}_{\text{prueba}}|H_o\,\text{es cierta}\}=F(\hat{\theta}_{\text{prueba}})=1-F(\hat{\theta}_{\text{prueba}})$$
  (iii) Bilateral, y suponiendo simétrica la función de distribución de probabilidad $f(\hat{\theta})$ de $\hat{\theta}$ alrededor del valor de $\theta$ observado en la muestra y una vez realizada la tipificación de la variable a $Z=N(0,1)$: $$\text{p-valor}=P\{|z|\ge z_{\text{prueba}}\} = 2\,(1-F(z_{\text{prueba}}))$$


Procedamos, pues, a calcular el p-valor para este problema, que, repitámoslo, es la probabilidad de que, asumiendo que la hipótesis fundamental $H_0$ sea cierta, se obtenga un valor del estadístico de contraste más extremo (o igual) que el observado en la muestra. Al tratarse de un contraste unilateral por la derecha, tendremos —estamos en el caso (ii)— que $\text{p-valor}=1-F(z_0)$, donde $F(z)$ es una d. $N(0,1)$. Así que, como ya hemos calculado que $z_0=0'0995$, tenemos que $F(0'0995)=0'5396$, luego $\text{p-valor}=2\cdot(1-0'5396)=0'9208 \gt \alpha=0'05$, por consiguiente y como conclusión final validamos la certeza de la hipótesis fundamental y por tanto, según el test, podemos afirmar que la proporción del metal en cuestión que forma parte de la aleación es la correcta a un nivel de significación $\alpha$ de $0'05$.   $\square$

- - -

Referencias:
  [1] Compta, A., et. al., Matemàtiques II, Barcanova, Barcelona, 1993
  [2] Guàrdia, J.; Viader, M., Estadística, Castellnou, Barcelona, 1999
  [3] García Pérez, A., Estadística Básica con R, UNED, Madrid, 2010
  [4] Allepús, J., et. al., Exercicis d'inferència estadística, Cossetània, Valls, 2002
  [5] Gonick, L.; Smith, W, La Estadística en Cómic, Zendrera Zariquiey, Barcelona, 1999