martes, 17 de mayo de 2016

Estimación de la media de la población por intervalo de confianza

ENUNCIADO. Se sabe que la variable aleatoria asociada a una cierta característica de una población sigue una distribución $N(\mu\,,\,2{'}51)$. Se ha extraído ( de la población ) una muestra aleatoria simple, al objeto de realizar una estimación por intervalo ( de confianza ) de la media de la población $\mu$, al $95\,\%$ de confianza. El intervalo de confianza de $\mu$ ha resultado ser $$\text{IC}=(5{'}34\,,\,5{'}86)$$ Se pide:
a) El valor de $\bar{x}$ ( media medida en la muestra )
b) El máximo error, $E$, que se comete en la estimación de $\mu$
c) El tamaño, $n$, de la muestra

SOLUCIÓN.
a) La media medida en la muestra es igual al centro del intervalo de confianza, luego $$\bar{x}=\dfrac{5{'}34+5{'}86}{2}=5{'}6$$
b) El máximo error en la estimación es la amplitud del intervalo de confianza, por tanto $$E=\dfrac{5{'}86-5{'}34}{2}=0{'}26$$
c) Despejando $n$ la fórmula del error, $E=z_{\alpha/2}\cdot \dfrac{\sigma}{\sqrt{n}}$, obtenemos $$n=\left(\dfrac{z_{\alpha/2}\cdot \sigma}{E}\right)^2 \quad \quad (1)$$
Sólo nos falta determinar el valor de la abscisa $z_{\alpha/2}$, que despejamos de $1-\alpha=0{'}95$, obteniendo $\alpha=0{'}05$ y, por tanto, $\alpha/2=0{'}025$. Ahora, sabiendo que $F(z_{\alpha/2})\equiv P\{Z \le z_{\alpha/2}\}=1-0{'}025=0{'}975$, consultando las tablas de la función de distribución de probabilidad $F(z)$ ( siendo $Z$ una d. $N(0,1)$ ), encontramos que $z_{\alpha/2}=1{'}96$

Sustituyendo, pues, los datos en (1), obtenemos el tamaño de la muestra $n=\left( \dfrac{1{'}96 \cdot 2{'}51}{0{'}26} \right)^2 \approx 359$ ( aproximando por exceso a las unidades ). $\square$

Probabilidad condicionada

ENUNCIADO. Se nos informa de que, en una empresa, el $45\,\%$ de las personas empleadas son hombres, y el $55\,\%$ son mujeres. Se sabe, también, que, entre las personas empleadas que tienen menos de treinta años, el $60\,\%$ son hombres, y el $70\,\%$ son mujeres. Hemos elegido, al azar, una persona que está empleada en dicha empresa. Se pide:
a) Calcular la probabilidad de que la persona elegida ( al azar ) tenga menos de treinta años
b) En el supuesto de que la persona elegida ( al azar ) haya resultado tener menos de treinta años, ¿ cuál es la probabilidad de que sea una mujer ? ¿ Y de que sea un hombre ?.

SOLUCIÓN.
Llamemos $T$ al suceso "ser un trabajador menor de $30$ años"; $H$, al suceso "ser un trabajador de genero masculino"; y, $M$, al suceso "ser un trabajador de genero femenino".

a)
Como $\{M\,,\,H\}$ constituye una partición de $\Omega$, tenemos que $T=(T \cap M ) \cup (T \cap H)$, luego por el Teorema de la Probabilidad Total, $$P(T)=P(T|M)\cdot P(M) + P(T|H)\cdot P(H)$$ y teniendo en cuenta que $P(H)=0{,}55$; $P(M)=0{,}45$; $P(T|M)=0{,}7$, y $P(T|H)=0{,}6$, obtenemos: $$P(T)=0{,7}\cdot 0{,}45 + 0{,}6\cdot 0{,}55 = 0{,}645$$

b)
Por el teorema de Bayes, podemos escribir $$P(M|T)=\dfrac{P(T|M)\cdot P(M)}{P(T)}$$ y poniendo los datos, obtenemos $P(M|T)=\dfrac{0{,}7 \cdot 0{,}45}{0{,}645}\approx 0{,}488$
y, de forma similar, $$P(H|T)=\dfrac{P(T|H)\cdot P(H)}{P(T)}$$ y, con los datos, $P(H|T)=\dfrac{0{,}6 \cdot 0{,}55}{0{,}645}\approx 0{,}512$
$\square$

Ejercicio de programación lineal

ENUNCIADO. En un cierto problema de programación lineal, la función objetivo es $$f(x,y)=-3x+10\,y$$ siendo la región factible, el cuadrilátero convexo del plano cuyos vértices son $A(1,4)$, $B(2,6)$, $C(4,3)$ y $D(3,2)$ . Se pide:
a) Representar la región factible y determinar el sistema de desigualdades ( restricciones ) correspondiente
b) Representar la gráfica de una de las rectas del az de rectas paralelas asociadas a la función objetivo en el mismo diagrama que se ha representado la región factible
c) ¿ Qué punto de la región factible corresponde al máximo de la función ? ¿ Cuál es el valor de dicho máximo ?
d) ¿ Qué punto de la región factible corresponde al mínimo de la función ? ¿ Cuál es el valor de dicho mínimo ?

SOLUCIÓN.
a)


Las recta que pasa por los puntos $A(1,4)$ y $B(2,6)$ tiene por ecuación $y=2\,x+2$, y para los puntos con abscisas comprendidas entre $x_A=1$ y $x_B=2$, las correspondientes ordenadas de los puntos que quedan por debajo del segmento $AB$ han de cumplir $y \le 2x+2$

Las recta que pasa por los puntos $B(2,6)$ y $C(4,3)$ tiene por ecuación $y=-\dfrac{3}{2}\,x+9$, y para los puntos con abscisas comprendidas entre $x_B=2$ y $x_C=4$, las correspondientes ordenadas de los puntos que quedan por debajo del segmento $BC$ han de cumplir $y \le -\dfrac{3}{2}\,x+9$

Las recta que pasa por los puntos $C(4,3)$ y $D(3,2)$ tiene por ecuación $y=x-1$, y para los puntos con abscisas comprendidas entre $x_D=3$ y $x_C=4$, las correspondientes ordenadas de los puntos que quedan por encima del segmento $CD$ han de cumplir $y \ge x-1$

Las recta que pasa por los puntos $A(1,4)$ y $D(3,2)$ tiene por ecuación $y=-x+5$, y para los puntos con abscisas comprendidas entre $x_A=1$ y $x_D=3$, las correspondientes ordenadas de los puntos que quedan por debajo del segmento $AD$ han de cumplir $y \ge -x+5$

Así, el sistema de restricciones viene dado por $$\left\{\begin{matrix}y & \le & 2x&+&2 \\ y& \le &-\dfrac{3}{2}\,x&+&9\\ y &\ge &x&-&1 \\ y & \ge &-x &+& 5\end{matrix}\right.$$

b)
Sea $f(x,y):=c$; entonces, despejando $y$ de $c=-3x+10\,y$, obtenemos $y=\dfrac{3}{10}\,x+\dfrac{c}{10}$. Llamando ( por comodidad ) $k$ a $\dfrac{c}{10}$, podemos escribir la ecuación del az de rectas paralelas de la función objetivo de la forma $y=\dfrac{3}{10}\,x+k$. La recta roja discontinua ( en el gráfico ) es una de las rectas de dicho az. Dando valores arbitrarios a $k$ ( y por lo tanto a $c$, que es el valor de función ) podemos explorar la región factible para visualizar cuáles son los puntos de la misma donde se alcanza el máximo y el mínimo pedidos.

En la construcción, hecha con GeoGebra, se ha preparado una barra deslizadora para cambiar el valor de $k$ y, así, realizar el desplazamiento de dicha recta paralela a sí misma, dando lugar a las otras rectas del az. El segmento de color rojo sobre el eje de ordenadas indica el valor de $k$, que es proporcional al valor de $c$ ( esto es, de $f(x,y)$ ), observándose que el máximo de $f(x,y)$ ( proporcional al máximo de $k$ ) se obtiene en el punto $B(2,6)$; y, el mínimo en el punto $D(3,2)$


c)-d)
Evaluando la función en los cuatro vértices del cuadrilátero convexo que forma la región factible al objeto de determinar el valor del máximo ( que ya sabemos que corresponde a $B$ ) y del mínimo ( que ya sabemos que corresponde a $D$ ), obtenemos:
$$f_{\text{máx}}=f(x_B,y_B)=-3 \cdot 2 + 10 \cdot 6 = 54$$
$$f_{\text{mín}}=f(x_D,y_D)=-3 \cdot 3 + 10 \cdot 2 = 11$$

$\square$


Analizar la función, calcular la recta tangente en el punto (...), y determinar el área delimitada por (...)

ENUNCIADO. Sea la función real, de una variable real, $f(x)=x^3-4\,x$. Se pide:
a) Calcular los extremos relativos de la función y clasificarlos según su naturaleza. ¿ Cuáles son los intervalos de crecimiento/decrecimiento ? ¿ Está acotada esta función ?
b) Calcular las raíces de la función y la ordenada en el origen
c) ¿ Tiene esta función algún punto de inflexión ? En caso afirmativo, calcular sus coordenadas. Determinar los intervalos de concavidad/convexidad
d) Representar la gráfica de la función
e) Determinar la ecuación de la recta tangente a la gráfica de la función en el punto de abscisa $x=-2$
f) Calcular el área de la región del plano delimitada por la gráfica de la función y el eje de abscisas

SOLUCIÓN.
La función propuesta es un polinomio, su dominio de definición está formado por todos los números reales, y es continua y derivable en todo su dominio.
a)
Sabemos que el conjunto de extremos relativos es $\{x \in \mathbb{R}: f'(x)=0\}$. Entonces, $f'(x)=3\,x^2-4$; por tanto ( imponiendo la condición ), $$3\,x^2-4 = 0 \Leftrightarrow x_{1}^{*}=-\dfrac{2}{\sqrt{3}}\;\text{ó}\; x_{2}^{*}=-\dfrac{2}{\sqrt{3}}$$ Veamos, ahora, que tipo de extremos relativos son; para ello emplearemos el criterio del signo de la segunda derivada en dichos puntos ( pues es fácil derivar este tipo de funciones ). La función segunda derivada es $f''(x)=6\,x$. Como $f''(-2/\sqrt{3}) \prec 0$, de ello se sigue que $x_{1}^{*}=-2/\sqrt{3}$ corresponde a un máximo local, y la ordenada de dicho máximo es $f(-2/\sqrt{3})\approx 3{,}1$; por otra parte, $f''(2/\sqrt{3}) \succ 0$, por lo que $x_{2}^{*}=2/\sqrt{3}$ corresponde a un mínimo local, y la ordenada de dicho máximo es $f(2/\sqrt{3})\approx -3{,}1$

La función crece en los intervalos $(-\infty\,,\,-2/\sqrt{3})\subset \mathbb{R}$ y $(2/\sqrt{3}\,,\,+\infty)\subset \mathbb{R}$; por otra parte, decrece en el intervalo $(-2/\sqrt{3}\,,\,2/\sqrt{3})\subset \mathbb{R}$

A pesar de tener un máximo y un mínimo locales, observemos que la función no está acotada, ni inferior ni superiormente ( $\displaystyle \lim_{x\rightarrow -\infty}\,f(x)=-\infty$ y $\displaystyle \lim_{x\rightarrow +\infty}\,f(x)=+\infty$ ), por lo que no tiene máximo absoluto ni mínimo absoluto; de ello se sigue, también, que el recorrido de la función está formado por todos los números reales.

b)
El conjunto de raíces de la función viene dado por $\{x \in \mathbb{R}: f(x)=0\}$. Imponiendo la condición, $$x^3-4\,x=0 \Leftrightarrow x\,(x^2-4)=0 \Leftrightarrow x_1=0\;\text{ó}\;x_2=-2\;\text{ó}\;x_3=2$$ encontrando, pues, tres raíces.

Nota: Observemos que la función es impar, pues $f(-x)=-x^3-4\,(-x)=-x^3+4\,x=-f(x)$, y ello explica el por qué las tres raíces están igualmente espaciadas, siendo dos de ellas iguales en valor absoluto, y la tercera cero; por otra parte los puntos del plano que corresponden al máximo y el mínimo relativos son simétricos con respecto al origen de coordenadas. Esta circunstancia facilita la representación gráfica ( que realizaremos en el cuarto apartado ).

La ordenada en el origen viene dada por la imagen de $x=0$, esto es, es $f(0)=0^3-4\cdot 0=0$, lo cual indica que la gráfica de la función pasa por el origen de coordenadas.

c)
El conjunto de puntos de inflexión viene dado por $\{x \in \mathbb{R}: f''(x)=0\}$. Imponiendo la condición, $6x=0 \Leftrightarrow x=0$, luego sólo hay un punto de inflexión, que corresponde al punto $D$ del gráfico ( el origen de coordenadas ). Hay un intervalo de concavidad, que es $(-\infty\,,\,0) \subset \mathbb{R}$; y un intervalo de convexidad, que es $(0\,,\,+\infty)\subset \mathbb{R}$

d)

Los puntos $A$ y $B$ corresponden a los extremos relativos encontrados; y los puntos $C$, $D$ y $E$ a los puntos de intersección con el eje de abscisas ( $D$ también interseca al eje de ordenadas ).

e)
La recta tangente a la gráfica de la función en el punto de abscisa $0$ tiene por ecuación $y=m\,x+k$; donde $k$, aquí, es $0$, pues es evidente que pasa por el origen de coordenadas. Por otra parte $m=f'(0)=(3\,x^2-4)_{x=0}=-4$. Así, $\text{r.t. en x=0}: y=-4\,x$


f)
El área del dominio de integración ( que vemos en la figura ), por simetría, puede calcularse de la forma $$\mathcal{A}=2 \cdot \displaystyle \int_{-2}^{0}\,f(x)\,dx$$

Nota: Cuidado. El valor de la integral definida $\displaystyle \int_{-2}^{2}\,f(x)\,dx$ no da el área pedida, pues por tratarse de un dominio simétrico y ser la función impar, esta integral es nula ( la región de la derecha y la de la izquierda dan igual contribución en valor absoluto, pero una es negativa y la otra positiva ).


Calculando la integral indefinida, vemos que una primitiva de la función $f(x)=x^3-4\,x$ es $F(x)=\dfrac{1}{4}\,x^4-2\,x^2$; por lo que, aplicando la regla de Barrow, $$\displaystyle \int_{-2}^{0}\,f(x)\,dx=F(0)-F(-2)=0-(\dfrac{1}{4}(-2)^4-2\cdot (-2)^2)=4$$ por consiguiente $$\mathcal{A}=2 \cdot 4 = 8 \; \text{unidades de área}$$

$\square$

Discutir en función de los valores de un parámetro y, después, resolver el sistema para un valor dado de dicho parámetro

ENUNCIADO. Sea el siguiente sistema de ecuaciones lineales:
$$\left\{\begin{matrix}
x&+&y&-&3\,z&=&1\\
2\,x&-&y&+&a\,z&=&0\\
x&+&2\,y&+&z&=&-1\end{matrix}\right.$$
donde $a \in \mathbb{R}$ es un parámetro. \par Se pide:
a) Discutir el sistema, en función de los valores de $a$
b) Resolver el sistema para $a:=-1$

SOLUCIÓN.
a)
Intercambiamos la segunda y la tercera ecuación ( por comodidad ) y, a continuación, procedemos a reducir el sistema por el método de Gauss
$\left\{\begin{matrix}
x&+&y&-&3\,z&=&1\\
2\,x&-&y&+&a\,z&=&0\\
x&+&2\,y&+&z&=&-1\end{matrix}\right.
\sim \left\{\begin{matrix}
x&+&y&-&3\,z&=&1\\
x&+&2\,y&+&z&=&-1\\
2\,x&-&y&+&a\,z&=&0\end{matrix}\right. $
mediante las operaciones elementales entre filas $-e_1+e_2 \rightarrow e_2$ y $-2\,e_1+e_3 \rightarrow e_3$ obtenemos el siguiente sistema equivalente
$\left\{\begin{matrix}
x&+&y&-&3\,z&=&1\\
&&y&+&4\,z&=&-2\\
&&-3\,y&+&(6+a)\,z&=&-2\end{matrix}\right. $
y mediante la operación elemental entre filas $3\,e_2+e_3 \rightarrow e_3$ llegamos al sistema equivalente escalonado
$\left\{\begin{matrix}
x&+&y&-&3\,z&=&1\\
&&y&+&4\,z&=&-2\\
&&&&(18+a)\,z&=&-8\end{matrix}\right. $
Entonces, si $a=-18$, obtenemos una contradicción en la última ecuación: $0=-8$, luego para ese valor de $a$, el sistema es incompatible; y, es evidente, que para cualquier otro valor de $a$ distinto de $-18$, el sistema es compatible ( las tres ecuaciones son independientes ) y determinado ( el número de ecuaciones independientes es igual al número de incógnitas, que es $3$ ).

b)
Si $a=-1 \neq -18$, el sistema es compatible determinado ( la solución consta de un sólo valor para cada variable ). Vamos a resolverlo.
$\left\{\begin{matrix}
x&+&y&-&3\,z&=&1\\
&&y&+&4\,z&=&-2\\
&&&&17\,z&=&-8\end{matrix}\right. $
De la última ecuación, obtenemos $z=-\dfrac{8}{17}$; y, sustituyendo en la segunda ecuación y despejando $y$, llegamos a $y=-2-4\cdot (-\dfrac{8}{17})=-\dfrac{2}{17}$. Finalmente, sustituyendo estos dos valores en la primera ecuación, obtenemos $x=1-(\dfrac{-2}{17})+3\cdot ( -\dfrac{8}{17})=-\dfrac{5}{17}$
$\square$

lunes, 9 de mayo de 2016

Calcular el intervalo de confianza de estimación de la media y el máximo error en la estimación

ENUNCIADO. En una muestra aleatoria simple de $200$ personas, se ha medido la aptitud para una determinada tarea, y las puntuaciones ( en una cierta escala ) tienen una
media de $33$ puntos. Sabemos, también, que la desviación típica ( de dicha característica ), en la población, es de $13$ puntos.
a) Calcular a partir de estos datos el correspondiente intervalo de confianza, a un nivel del $95\,\%$, para la estimación de la media de la población.
b) ¿ Cuál es el máximo error cometido en dicha estimación ?.

SOLUCIÓN. El estimador ( estadístico ), $\bar{X}$, de la media de la población $\mu$, sigue una distribució $N(\mu\,,\,\sigma/\sqrt{n})$ ( de acuerdo con el Teorema Central del Límite ). Así, para un nivel de confianza $1-\alpha=0{,}95$ ( y por tanto con un nivel de riesgo $\alpha=0{,}05$ ), el intervalo de confianza correspondiente a la estimación de la media de la población $\mu$ es $$\text{IC}=(\bar{x}-E\,,\,\bar{x}+E)$$ donde $E=z_{\alpha/2}\cdot \sigma/\sqrt{n}$ es el máximo error en la estimación ( la amplitud del intervalo de confianza ); $z_{\alpha/2}$ y $-z_{\alpha/2}$ son los valores de las abscisas críticas ( en el intervalo expresado en la variable tipificada $Z$ ) y que encontraremos en las tablas $N(0,1)$, y $\bar{x}$ representa el valor de la media medido en la muestra.

Calculemos el valor de la abscisa $z_{\alpha/2}$: Como $\alpha/2=0{,}05/2=0{,}025$, entonces $F(z_{\alpha/2})=P\{Z \le z_{\alpha/2}\}=1-\alpha/2=0{,975}$; y, consultando las tablas de la función de distribución de probabilidad $N(0,1)$, encontramos que $z_{\alpha/2}=1{,}96$.

a)
Así, $E=z_{\alpha/2}\cdot \sigma/\sqrt{n}=1{,}96 \cdot 13/\sqrt{200 }\approx 1{,}8$, y, por tanto, los extremos del intervalo de confianza son $33-1{,}8=31{,}2$ y $33+1{,}8)=34{,}8$, con lo cual el intervalo de confianza para la estimación de la media poblacional $\mu$ al $95\,\%$ de confianza es $\text{IC}=(31{,}2\,,\,34{,}8)$

b)
El máximo error cometido en la estimación es $E$, esto es, $1{,}8$. $\square$

Distribución de la media muestral

ENUNCIADO. La variable aleatoria $X$ de una cierta característica de una población sigue una distribución $N(10\,,\,3)$. Se toma una muestra de la población, de tamaño $50$. Se pide:
a) ¿ Qué tipo distribución corresponde al estadístico \emph{media muestral} ? ¿ Cuáles son los valores de los parámetros de la misma ?
b) ¿ Cuál es la probabilidad de que la media medida en dicha muestra, $\bar{x}$, sea mayor que $12$ ?

SOLUCIÓN.
a) Siendo la variable aleatoria $X$ ( de la población ) una distribución $N(\mu\,,\,\sigma)$, donde $\mu=10$ y $\sigma=3$, podemos afirmar que, de acuerdo con el Teorema Central del Límite, la distribución del estadístico media muestral, $\bar{X}$, es $N(\mu\,,\,\dfrac{\sigma}{\sqrt{n}})$, esto es, $N(10\,,\,\dfrac{3}{\sqrt{50}})$.

b) Así pues, $P\{X \succ 12\} \overset{\text{tipificando}}{=} P\{Z \ge \dfrac{12-10}{3/\sqrt{50}}\}\overset{\text{4 cifras decimales}}{\approx} P\{Z \ge 4,7140\}$
$=1-P\{Z \le 4,7140\}=1-F(4,7140) \overset{\text{tablas}\;N(0,1)}{\approx} 1-1 = 0$, donde $F(z)$ denota la función de distribución de probabilidad de la variable tipificada $Z$, que es $N(0,1)$
$\square$

domingo, 8 de mayo de 2016

¿ Son representativas las siguientes muestras ?

ENUNCIADO. En una facultad con $1500$ alumnos, se quiere obtener una muestra representativa para realizar una encuesta sobre la percepción que los estudiantes tienen de sí mismos acerca del compromiso personal en el seguimiento del curso. Para ello, se proponen dos maneras alternativas para seleccionar las personas que formarán la muestra: a) escoger los cien primeros alumnos que lleguen a la facultad entre las $07:50$ y las $07:55$ horas de la mañana ( la primera clase empieza a las $08:00$ horas ) ; y, b) escoger los cien primeros alumnos que hagan alguna consulta bibliográfica en la base de datos de la biblioteca de la facultad el último día laboral de la semana, durante las tres últimas horas de la jornada. ¿ Se podría aceptar que alguna de estas dos muestras es representativa ?: ¿ Sólo una de las dos ? ( y, en ese caso, ¿ cuál de ellas lo es ? ) ¿ Ninguna de las dos lo es ? ¿ Ambas los son ?.

SOLUCIÓN. Ninguna de las dos formas de muestreo propuestas dan lugar a una muestra representativa, pues se introduce sesgo en los dos casos. Este sesgo se produce por seleccionar un perfil de estudiante comprometido con su trabajo ( los muy puntuales ) o los que, aún no siéndolo necesariamente, se interesan por los recursos bibliográficos y apuran las últimas horas de la jornada semanal; es decir, por los estudiantes con una gran dedicación en la facultad. $\square$