viernes, 27 de marzo de 2015

Una bolsa cerrada contiene tres fichas iguales en tamaño, peso y textura ...

ENUNCIADO:
Una bolsa cerrada contiene tres fichas iguales en tamaño, peso y textura: $A$, $B$ y $C$. Una de las caras de $A$ es blanca y la otra roja; las dos caras de $B$ son blancas, y en cuanto a $C$, sus dos caras son rojas. Consideremos dos jugadores; uno de ellos saca al azar ( sin mirar ) una de las tres fichas de la bolsa y la deposita sobre la mesa, observando ambos jugadores el color que aparece en la cara que mira hacia arriba. A continuación, el otro jugador debe apostar por el color de la cara que queda oculta, de modo que gana si acierta y pierde en caso contrario ( el juego se repite alternando el papel de ambos jugadores y se lleva un recuento de los aciertos de cada uno de ellos ).

Pues bien, supongamos que el color que ha aparecido al sacar la ficha es rojo. ¿ A qué color debería apostar su compañero al objeto de tener ventaja ? Esto es, ¿ es mejor apostar por el color blanco o bien por el rojo ? ¿ Cuál es la mejor estrategia para ganar ( en la repetición indefinida de dicho juego ) ?.

SOLUCIÓN:
Calculemos, primero, cuál es la probabilidad de que aparezca el color rojo al extraer la ficha de la bolsa y ponerla ( sin mirar ) encima de la mesa. Basta la aplicación directa de la regla de Laplace, para ver que dicha probabilidad es $\dfrac{1}{2}$, ya que hay el mismo número de caras rojas que de caras blancas en el conjunto de todas las caras ( tres caras blancas y tres caras rojas en total ).

También podemos obtener este resultado razonando en términos del Teorema de la Probabilidad Total, pues ello nos llevará a resolver el problema con claridad recurriendo, al final, al Teorema de Bayes. Procedemos a ello.

El espacio muestral se puede particionar mediante el conjunto completo de sucesos: elegir la ficha A ( que denotaremos por $A$ ), elegir la ficha B ( que denotamos por $B$ ) o elegir la ficha C ( que designamos por $C$ ), los tres con la misma probabilidad, que es $\dfrac{1}{3}$. Luego, denotando por $R$ el suceso compuesto ( obtener el color rojo al poner la ficha sobre la mesa y observar el color del anverso ), podemos escribir que
$$P(R)=P(R|A)\,P(A)+P(R|B)\,P(B)+P(R|C)\,P(C)$$
y como
$P(R|A)=\dfrac{1}{2}$ ( por tener A una cara roja y otra blanca )
$P(R|B)=0$ ( por no tener B ninguna cara roja )
$P(R|A)=1$ ( por ser ambas caras de C de color rojo )
y
$P(A)=P(B)=P(C)=\dfrac{1}{3}$
obtenemos
$$P(R)=\dfrac{1}{2}\cdot \dfrac{1}{3}+0 \cdot \dfrac{1}{3}+1 \cdot \dfrac{1}{3}=\dfrac{1}{2}$$

Mediante el Teorema de Bayes, calculemos ahora las siguientes probabilidades: $P(A|R)$ -- recordemos que A tiene una cara roja y otra blanca --; $P(B|R)$, que, naturalmente, es $0$ ( B no tiene ninguna cara roja ), y $P(C|R)$ -- recordemos que C tiene sus dos caras rojas --. Necesitamos conocer el valor de dichas probabilidades al objeto de apostar por el color ( blanco o bien rojo ) del reverso de la ficha, pues entendemos que si $P(A|R) \succ P(C|R)$ optaremos por el blanco ( una de las caras de A es blanca ) y, en caso contrario, por el rojo ( pues ninguna de las caras de C es blanca ). Veámoslo.

$P(A|R)=\dfrac{P(R|A)}{P(R)}=\dfrac{1/6}{1/2}=\dfrac{1}{3}$
y
$P(C|R)=\dfrac{P(R|C)}{P(R)}=\dfrac{1/3}{1/2}=\dfrac{2}{3}$

Entonces, como $P(C|R) \succ P(A|R)$, nos conviene apostar por el color rojo.

De haber sido blanco ( en vez de rojo ) el color aparecido al depositar la ficha sobre la urna, es evidente que, ahora, deberíamos apostar por el blanco. Por lo tanto, podemos afirmar que la estrategia favorable es la de apostar por el mismo color que aparece ( en el anverso ) al extraer la ficha al objeto maximizar el éxito al intentar acertar el color del reverso de la misma.

OBSERVACIÓN: Si los dos jugadores adoptan esta estrategia ( en un número indefinido de jugadas sucesivas ), el número de partidas ganadas por uno y otro vendrá a ser el mismo ( salvo fluctuaciones debidas a las rachas ). Sin embargo, si uno de ellos no sigue la estrategia descrita, el número de partidas ganadas del mismo será muy inferior al número de partidas ganadas por su adversario.

$\square$

[nota del autor]

Problema de los dados del Caballero de Méré ( s. XVII )

Los problemas de apuestas en los juegos de azar constituyeron importantes estímulos para los matemáticos en los orígenes de la teoría del cálculo de probabilidades ( siglo XVII ); así, por ejemplo, cabe destacar los problemas históricos que el escritor, matemático aficionado y jugador Antoine Gambaud, Chevalier de Méré ( 1607-1684 ) planteaba al gran matemático aficionado Pierre de Fermat ( 1601-1665 ) y al matemático y filósofo Blaise Pascal ( 1623-1684 ). Uno de estos problemas es el conocido como el problema de la partida inacabada ( no hablaremos de éste ahora ). Y, otro de ellos se conoce como el problema de las apuestas en el juego de los dados, del cual sí vamos a hablar a continuación. Dice así:

ENUNCIADO:
¿ Qué es más probable: a) sacar al menos un seis en 4 lanzamiento de un dado, o bien, b) sacar al menos dos seises en 24 lanzamientos de dos dados ? Esto es, ¿ cuál de las dos apuestas es la más ventajosa ?.

SOLUCIÓN:
Vamos a calcular la probabilidad de (a). La probabilidad de no sacar un '6' en un lanzamiento es $\dfrac{5}{6}$, luego la de no sacar ningún '6' en cuatro lanzamientos es $\left(\dfrac{5}{6}\right)^4$, con lo cual, y por la propiedad del contrario, vemos que la probabilidad de sacar al menos un '6' es $1-\left(\dfrac{5}{6}\right)^4 \approx 0,52$

Veamos ahora cuál es la probabilidad de (b). Al lanzar una vez dos dados, la probabilidad de sacar dos seises es $\dfrac{1}{36}$, luego la de no sacarlos es $1-\dfrac{1}{36}=\dfrac{35}{36}$; por lo tanto, la probabilidad de no sacar ningún par de seises en 24 tiradas ( de dos dados ) es $\left(\dfrac{35}{36}\right)^{24}$, con lo cual - por la propiedad de la probabilidad del suceso contrario - vemos que la probabilidad de sacar al menos un par de seises es $1-\left(\dfrac{35}{36}\right)^{24} \approx 0'49$

Como la probabilidad en este segundo caso es menor que la del primero, concluimos que es más ventajoso apostar por lo primero ( lanzar cuatro veces un dado, contemplando la posibilidad de que aparezcan al menos dos seises ) que no por lo segundo ( lanzar 24 veces una pareja de dados, contemplando la posibilidad de que aparezca al menos dos seises ).

$\square$

domingo, 22 de marzo de 2015

Cálculo de límites de función

ENUNCIADO:
Calcular los siguientes límites:
a) $\displaystyle \lim_{x \rightarrow 0}\, \dfrac{\sin x}{x}$

b) $\displaystyle \lim_{x \rightarrow 0}\, \dfrac{1-\cos x}{x^2}$

c) $\displaystyle \lim_{x \rightarrow 0}\, \dfrac{1-\cos x}{1-\dfrac{e^x+e^{-x}}{2}}$

SOLUCIÓN:
En cada uno de los tres casos, al pasar al límite nos encontramos con una indeterminación del tipo $\dfrac{0}{0}$ , que podemos resolver utilizando la regla de l'Hôpital:

a)
$\displaystyle \lim_{x \rightarrow 0}\, \dfrac{\sin x}{x}=\lim_{x \rightarrow 0}\, \dfrac{(\sin x)'}{(x)'}=\lim_{x \rightarrow 0}\, \dfrac{\cos x}{1}=\cos 0=1$

b)
$\displaystyle \lim_{x \rightarrow 0}\, \dfrac{1-\cos x}{x^2}=\lim_{x \rightarrow 0}\, \dfrac{(1-\cos x)'}{(x^2)'}=\lim_{x \rightarrow 0}\, \dfrac{\sin x}{2x}\overset{\frac{0}{0}}{=}\lim_{x \rightarrow 0}\, \dfrac{(\sin x)'}{(2x)'}=\lim_{x \rightarrow 0}\, \dfrac{\cos x}{2}=\dfrac{1}{2}$

c)
$\displaystyle \lim_{x \rightarrow 0}\, \dfrac{1-\cos x}{1-\dfrac{e^x+e^{-x}}{2}}=\lim_{x \rightarrow 0}\, \dfrac{(1-\cos x)'}{\left(1-\dfrac{e^x+e^{-x}}{2}\right)'}=\lim_{x \rightarrow 0}\, \dfrac{\sin x}{-\dfrac{e^x-e^{-x}}{2}}=$
    $=\displaystyle-2\,\lim_{x \rightarrow 0}\, \dfrac{\sin x}{e^x-e^{-x}}\overset{\frac{0}{0}}{=}-2\,\displaystyle \lim_{x \rightarrow 0}\, \dfrac{(\sin x)'}{(e^x-e^{-x})'}=-2\,\displaystyle \lim_{x \rightarrow 0}\, \dfrac{\cos x}{e^x+e^{-x}}=-2\cdot \dfrac{1}{2}=-1$

$\square$

[nota del autor]

Ejercicio de clasificación de puntos de discontinuidad. ( Artículo escrito en catalán )

Exercici de classificació de punts de discontinuïtat:


Ajut: Feu ús d'algun progrma de representació gràfica (GeoGebra, MAXIMA, Wiris, ...) per visualitzar el traç de la funció

Per cada una de les funcions $f:\,\mathbb{R} \mapsto \mathbb{R}$ proposades, determineu els valors de $x$ per als quals hi ha algun tipus de discontinuïtat en cada una de les següents funcions. Classifiqueu (enraonadament) de quin tipus són:

    1.1

        $f_{1}(x)=\left[x\right]$     ( funció part entera d'un nombre real )


Observació:
La funció part entera assigna a un nombre real $x$ el major nombre enter més petit o igual que $x$; es representa per $[x]$. Per exemple: $[-2,6]=-3$, $[4,1]=4$, etcètera. A les calculadores, programes de càlcul, i llenguatges de programació correspon a la instrucció $\text{floor}\,(\square)$; per exemple, per calcular $[-2,6]$ teclejarem $\text{floor:}\,(-2,6)$ i obtindrem el valor $-3$, i per representar gràficament la funció $f(x)=[x]$ ( fent ús d'algun programa de represantació gràfica, com ara MAXIMA, o GeoGebra ) escriurem $f(x)=\text{floor}\,(x)$.



Observem que tots valors de la v.i. $x$ tals que $x \in \mathbb{Z}$ presenten discontinuïtats essencials de primera espècie i, concretament, de salt finit: no existeix el límit global en aquests punts perquè els límits laterals, malgrat existeixen, no tenen el mateix valor


    1.2

        $f_{2}(x)=\tan(x)$


Observem que tots valors de la v.i. tals que
    $x=\dfrac{(2\,n-1)\cdot \pi}{2} \quad \text{per a} \quad (n=1,2,3,\ldots) $
presenten discontinuïtats essencials de primera espècie i, en concret, de tipus asimptòtic: no existeix el límit global en aquests punts perquè els límits laterals per l'esquerra i per la dreta valen $-\infty$ i $+\infty$, respectivament


    1.3

        $f_{3}(x)=\left|\sqrt{x}\right|$


Com que els nombres negatius no formen part del domini d'existència de la funció
$\displaystyle \nexists \, \lim_{x \rightarrow 0^{-}}\,\left|\sqrt{x}\right|$
per tant, no existeix el límit globlal quan $x \rightarrow 0$
Concloem que la funció és contínua en tots els punts del seu domini d'existència, a excepció del punt $x=0$, on la funció té una discontinuïtat essencial (no existeix el límit global en aquest punt) de segona espècie, atès que un dels límits laterals no existeix.


    1.4

        $f_{4}(x)=\dfrac{x^2+1}{x^2-1}$


Els valors de la v.i. $x=\pm 1$ anul·len el denominador, però no el numerador, amb la qual cosa fan divergir la funció; els límits laterals divergeixen en sentits oposats i, doncs, la funció presenta discontinuïtats de essencials de primera espècie i, concretament, de tipus asimptòtic: no existeix el límit global en aquests punts perquè els límits laterals no coincideixen, és a dir

$\displaystyle \lim_{x \rightarrow -1^{-}}\,f(x)=+\infty$
$\displaystyle \lim_{x \rightarrow -1^{+}}\,f(x)=-\infty$
i
$\displaystyle \lim_{x \rightarrow 1^{-}}\,f(x)=-\infty$
$\displaystyle \lim_{x \rightarrow 1^{+}}\,f(x)=+\infty$

i, en particular, són de tipus asimptòtic.

Observació 1.4.1:
Observeu, al gràfic, la presència de les rectes asímptotes:
$\text{av}_1:\,x=-1$
i
$\text{av}_2:\,x=1$


    1.5

        $f_{5}(x)=\Big(1+\dfrac{1}{x}\Big)^x$



Aquesta funció presenta una discontinuïtat per a $x=\pm 0$ atès que els límits laterals no coincideixen
$\displaystyle \lim_{x \rightarrow 0^{-}}\,f(x)=+\infty$
i
$\displaystyle \lim_{x \rightarrow 0^{+}}\,f(x)=e$
i, per tant, no existeix el límit global
$\displaystyle \nexists \lim_{x \rightarrow 0 }\,f(x)$
La funció té, doncs, una discontinuïtat essencial de salt infinit (un dels límits laterals divergeix i l'altre no) en el punt d'abscissa $x=0$



    1.6

       
$f_{6}(x)=\left\{ \begin{matrix} -x-1 \quad \text{si} \; x \le -3\\ \\ 3 \quad \text{si} \; -1< x < 1\\ \\ x-2 \quad \text{si} \; x \ge 1\\ \end{matrix} \right.$



Hi ha dos punts de discontinuïtat essencial, els punts d'abcisses $x=-3$ i $x=3$, on els límits globals no existeixen). Això, en aquest cas, és degut al fet que els següents límits laterals no existeixen [ observem que això és degut al fet que $D = \mathbb{R}-(-3,-1)$   ] i són, per tant, discontinuïtats de segona espècie:

$\displaystyle \nexists \lim_{x \rightarrow -3^{+}}\,f(x)$
i
$\displaystyle \nexists \lim_{x \rightarrow -1^{-}}\,f(x)$

Per altra banda, en el punt d'abcsissa $x=1$ hi ha una tercera discontinuïtat essencial; el límit global no existeix, ara, perquè el valor dels límits laterals - malgrat que aquests existeixen - no coincideix . Aquesta d. és, doncs, de primera espècie i, concretament, de salt finit perquè els límits laterals són finits (per bé que - fem-ne remarca - no coincideixen).

$\displaystyle \lim_{x \rightarrow 1^{-}}\,f(x) \neq \lim_{x \rightarrow 1^{+}}\,f(x)$

Vegeu el gràfic:
$\displaystyle \lim_{x \rightarrow 1^{-}}\,f(x)=3$
$\displaystyle \lim_{x \rightarrow 1^{+}}\,f(x)=-1$



    1.7

       
$f_{7}(x)=\left\{\begin{matrix} x^2 \quad \text{si} \; x \le 0\\ \\ -x^2+1 \quad \text{si} \; x >0\\ \end{matrix}\right.$



Aquesta funció presenta un punt de discontinuïtat essencial (de primera especie i, concretament, de salt finit) en el punt d'abscissa $x=0$ atès que els límits laterals existeixen i tenen valors finits, però no coincideixen (no existeix el límit global)

$\displaystyle \lim_{x \rightarrow 0^{-}}\,f(x)=0$

$\displaystyle \lim_{x \rightarrow 0^{+}}\,f(x)=1$



    1.8

        $f_{8}(x)=x-\left[x\right]$
   
( funció part decimal d'un nombre real )



Tots els valors de la v.i. $x \in \mathbb{Z}$ presenten discontinuïtats essencials (el límit global no existeix en aquests punts) pel fet que els límits laterals - malgrat que existeixen, i prenen valors finits - no coincideixen; en efecte (observeu el gràfic):

$\forall x \in \mathbb{Z} \subset D_f$
es compleix que
$\displaystyle \lim_{x \rightarrow x^{-}}\,f(x)=1$

$\displaystyle \lim_{x \rightarrow 0^{+}}\,f(x)=0$

Concloem, doncs, que hi ha infinits punts (tots els nombres enters) de discontinuïtat essencial de primera espècie i, en concret, de salt finit.



    1.9

        $\text{sign}(x)=\left\{\begin{matrix} 1 \quad \text{si} \; x > 0\\ \\ 0 \quad \text{si} \; x =0\\ \\ \\ -1 \quad \text{si} \; x<0\\ \end{matrix}\right.$     ( funció part decimal d'un nombre real )



En el punt d'abscissa $x=0$, aquesta funció presenta un discontinïtat essencial de primera espècie i, concretament, de salt finit, atès que el límit global de la funció no existeix en aquest punt (els límits laterals existeixen i són finits, però no tenen el mateix valor):

$\displaystyle \lim_{x \rightarrow 0^{-}}\,f(x)=-1$

$\displaystyle \lim_{x \rightarrow 0^{+}}\,f(x)=1$


    1.10

       
$f_{7}(x)=\left\{\begin{matrix} x^2 \quad \text{si} \; x \neq 1\\ \\ 4 \quad \text{si} \; x =1\\ \end{matrix}\right.$



Aquesta funció presenta un únic punt de discontinuïtat, de tipus no essencial (o evitable) per a $x=1$, atès que el límit en aquest punt existeix i és igual a $1$; en efecte

$\displaystyle \lim_{x \rightarrow 1^{-}}\,f(x)=1$

$\displaystyle \lim_{x \rightarrow 1^{+}}\,f(x)=1$

però, no obstant això, aquest valor (del límit) no coincideix amb el valor de la funció ( en $x=1$ ) que és igual a $f(1)=4$

$\displaystyle \lim_{x \rightarrow 1}\,f(x) \neq f(1)$


    1.11

       
$f_{11}(x)=x^3 \; \text{si} \; x \neq -1 $



Aquesta funció presenta un únic punt de discontinuïtat, de tipus no essencial (o evitable) per a $x=-1$, atès que el límit en aquest punt existeix i és igual a $-1$; en efecte

$\displaystyle \lim_{x \rightarrow 1^{-}}\,f(x)=-1$

$\displaystyle \lim_{x \rightarrow 1^{+}}\,f(x)=-1$

però, no obstant això, la funció no està definida per a $x=-1$

[nota del autor]

miércoles, 18 de marzo de 2015

Introducción al contraste de hipótesis

ENUNCIADO:
Consideremos una urna que contiene un número muy grande de bolas, la mitad de las cuales son blancas y la otra mitad rojas. Se han extraído $40$ bolas de dicha urna y se nos informa que han aparecido $8$ bolas rojas ( y $32$ bolas blancas ). ¿ Es razonable considerar representativa a dicha muestra ? Razonar la respuesta.

SOLUCIÓN:
Consideremos la hipótesis La muestra es representativa, esto es: la elección de las bolas, una a una, se ha realizado con reemplazamiento - las extracciones sucesivas son independientes - y removiendo bien las bolas antes de extraer la siguiente bola, es decir, de manera aleatoria.

Llamamos a esta hipótesis, hipótesis fundamental ( que denotamos por $H_0$ ), pues ésta respalda la presunción de que la muestra no ha sido amañada ( la muestra es representativa ), atribuyendo a la casualidad el hecho de que aparecen en la muestra menos bolas blancas de lo que podríamos aventurar, de acuerdo con el valor esperado, que rondaría la cantidad de unas $20$ bolas rojas.

En oposición a la hipótesis fundamental surge, lógicamente, la hipótesis alternativa, $H_{1}$: la muestra ha sido amañada, es decir, la muestra no es representativa.

De acuerdo con la medida de la muestra, y recurriendo a la teoría de la probabilidad, debemos contrastar una hipótesis frente a la otra. Para ello, razonamos del siguiente modo: Como la variable aleatoria número de bolas rojas que aparecen en la muestra debe seguir el modelo binomial $B(40,0'5)$ ( pruebas sucesivas e independientes de Bernouilli ), entonces al calcular la probabilidad de obtener a lo sumo $8$ bolas rojas en la muestra de tamaño $40$, si ésta ( a la que denominamos $p$-valor ) resulta lo suficientemente pequeña, será muy razonable rechazar la hipótesis fundamental.

Veamos qué obtenemos:
$$\displaystyle P\lbrace X \le 8 | H_0 \rbrace = \sum_{i=0}^{8}\,\binom{40}{i}\,0'5^{i}\,(1-0'5)^{40-i} \approx 0'00009$$
Como este valor ( $p$-valor ) es lo suficientemente pequeño ( muy pequeña, realmente ), es razonable rechazar la hipótesis nula, concluyendo, por lo que se ha expuesto arriba, que la muestra de bolas adolece de sesgo, posiblemente voluntario ( la muestra ha sido amañada ) y, por tanto, debemos concluir que dicha muestra no es representativa.


OBSERVACIÓN:
Como no siempre obtendremos valores de dicha probabilidad tan claramente pequeños, a menudo, para poder concluir si aceptamos o no la hipótesis fundamental, tendremos que decidir el valor de una cota -- que denominaremos nivel de significación del test ( y que denotaremos por $\alpha$ ) -- de tal modo que para valores mayores de la probabilidad calculada para el valor medido en la muestra ( aparecen $8$ bolas blancas ), nos lleve a aceptar la hipótesis fundamental ( o hipótesis nula ) y, por consiguiente, a emitir, como conclusión del test que, de acuerdo con dicho nivel de significación, debemos dar por válida la hipótesis fundamental.

Por ejemplo, ¿ qué decisión habríamos tomado de ser dicha probabilidad no tan pequeña ?, pongamos que $0'0534$, que es el resultado de plantear el mismo problema con una muestra de $25$ bolas, pues
$$\displaystyle P\lbrace X \le 8 | H_0 \rbrace = \sum_{i=0}^{8}\,\binom{25}{i}\,0'5^{i}\,(1-0'5)^{25-i} \approx 0'0534$$
Démonos cuenta de que, en esta nueva situación ( la probabilidad calculada ya no es tan pequeña como en la situación original ), conviniendo que para el nivel de significación del test, $\alpha$, que éste sea de $0'01$, es evidente que al ser menor que el de la probabilidad calculada, deberíamos, ahora, aceptar la hipótesis nula ( concluir que la muestra es representativa, a dicho nivel de significación ).

Y, por por el contrario, en el caso de ser dicha probabilidad calculada ( para el valor medido en la muestra, esto es, para $8$ bolas rojas ) menor que el nivel de significación, $\alpha$, pongamos que convengamos $\alpha=0'1$, deberíamos, para este otro nivel de significación, rechazar la hipótesis nula y, por tanto, aceptar la hipótesis alternativa.

COMENTARIOS:
a) Denominamos error de tipo I a $P( \text{rechazar} \, H_0 | H_0 \, \text{cierta} ) $ y, precisamente, es éste el valor del nivel de significación $\alpha$; por lo tanto, el $p-\text{valor}$ ( calculado arriba en el primer supuesto ) representa el nivel de significación observado, esto es, el error de tipo I observado; con lo cual, debemos entender el nivel de significación preestablecido del test, $\alpha$, como una cota del dicho nivel de significación, lo razonablemente pequeña. Tengamos en cuenta que de ser $\alpha$ muy pequeño, el test siempre conducirá a validar la hipótesis fundamental, mientras que si, por el contrario, es demasiado grande, el test siempre conducirá a rechazarla, en favor de la hipótesis alternativa. Así pues, cuánto más dudemos de la validez de la hipótesis fundamental, mayor debería ser el nivel de significación preestablecido, $\alpha$, del test.

b) Denominamos error de tipo II a $P( \text{aceptar} \, H_0 | H_0 \, \text{falsa} )$, que abreviamos como $\beta$, y, potencia del test, a $P( \text{rechazar} \, H_0 | H_0 \, \text{falsa})$, esto es, $1-\beta$. De esto se deduce que al disminuir el error de tipo II ( evitar el considerar como no significativos hechos no casuales ), aumenta la potencia del test; sin embargo, debemos tener en cuenta que al reducir el error de tipo II, aumenta, por contra, el error de tipo I ( es decir $\alpha$ ), que es el que se debería minimizar con preferencia a minimizar el de tipo II, pues de establecer dicha cota de error de tipo I grande ( de manera preestablecida ), ello abocaría a considerar indebidamente como significativas lo que podrían ser meras casualidades ( en el caso de un juicio, esto podría llevar a tomar la decisión de considerar culpable a un inocente [!] ).


$\square$

- - -

Referencias:
  [1] Compta, A., et. al., Matemàtiques II, Barcanova, Barcelona, 1993
  [2] Guàrdia, J.; Viader, M., Estadística, Castellnou, Barcelona, 1999
  [3] García Pérez, A., Estadística Básica con R, UNED, Madrid, 2010
  [4] Allepús, J., et. al., Exercicis d'inferència estadística, Cossetània, Valls, 2002
  [5] Gonick, L.; Smith, W, La Estadística en Cómic, Zendrera Zariquiey, Barcelona, 1999

martes, 17 de marzo de 2015

Ejercicio de álgebra lineal. Sistemas de ecuaciones lineales. ( artículo escrito en catalán )

Enunciat:
Sabem que $\{x=2,y=1,z=-1\}$ és la solució del sistema compatible determinat
    $\left.\begin{matrix}a\,x &+ &b\,y&+&c\,z&=&a+c \\ b\,x &- &y&+&b\,z&=&a-b-c\\ c\,x &- &b\,y&+&2\,z&=&b \\ \end{matrix}\right\}$
Calculeu el valor dels paràmetes $a$, $b$ i $c$.

Solució:
Substituint les variables pels seus valors ( de la solució ) arribem al següent sistema d'equacions
    $\left.\begin{matrix}2\,a &+ &b&-&c&=&a+c \\ 2\,b &- &1&-&b&=&a-b-c \\ 2\,c &- &b&-&2&=&b \\ \end{matrix}\right\}$
i, ordenant i simplificant, queda
    $\left.\begin{matrix}a &+ &b&-&2\,c&=&0 \\ a & -&2\,b &- &c&=&-1 \\ & &2\,b &- &2\,c&=&-2 \\ \end{matrix}\right\}$
l'arreglem convenientment
    $\left.\begin{matrix}a &+ &b&-&2\,c&=&0 \\ -a & +&2\,b &+ &c&=&1 \\ & &-b &+ &c&=&1 \\ \end{matrix}\right\}$
i el reduïm fins obtenir la forma esglaonada ( pel mètode de Gauss ) fent les següents operacions elementals entre equacions:
    $e_2 \leftarrow e_2+e_1$
podem escriure
    $\left.\begin{matrix}a &+ &b&-&2\,c&=&0 \\ & & 3\,b &- &c&=&1 \\ & & -b &+ &c&=&1 \\ \end{matrix}\right\}$
i escollint la següent combinació entre la segona i la tercera
    $e_3 \leftarrow 3\,e_3+e_2$
arribem a
    $\left.\begin{matrix}a &+ &b&-&2\,c&=&0 \\ & & 3\,b &- &c&=&1 \\ & & & &2\,c&=&4 \\ \end{matrix}\right\}$

Un cop esglaonat, és clar que el el nombre d'equacions no nul·les és $3$ i, doncs, totes tres equacions són linealment independents, per tant el rang del sistema d'equacions és $3$, que coincideix amb el nombre d'incògnites; llavors, pel teorema de Rouché-Fröbenius, el sistema és compatible i determinat i, doncs, té solució única, que és la següent:
de la tercera equació, trobem el valor de $b$
    $c=2$
Posant aquest valor a la segona equació del sistema reduït
    $3\,b-2=1 \Rightarrow b=1$
i, finalment, posant els dos valors que hem trobat ( de $c$ i $b$ ) a la primera equació, determinem el valor de $a$:
    $a=+1-2\cdot 2=0 \Rightarrow a=3$
$\square$

[nota del autor]

Evolución del número de individuos de una población ( artículo escrita en catalán )

Enunciat:
El nombre d'individus d'una determinada població evoluciona segons els model següent:
    $P(t)=400+18\,t-6\,t^{\frac{3}{2}}$
on $t$ indica el nombre d'anys transcorreguts des de l'inici de l'estudi.
  (a) Determineu el valor la població quan va començar l'estudi, calculeu el valor de la població al cap d'un any i calculeu el valor de la taxa de creixement en aquest període.
  (b) Al cap de quants anys després del començament de l'estudi va deixar de créixer la població de l'illa ? Quin va ser el nombre màxim d'individus ?.

Solució:
  (a)
    $P(0)=400+18\cdot 0-6\cdot 0^{\frac{3}{2}}=400+0-0=400 \, \text{individus}$
    $P(1)=400+18\cdot 1-6\cdot 1^{\frac{3}{2}}=400+18-6=412\,\text{individus}$
Càlcul de la taxa de creixement, $\alpha$, en aquest període ( d'un any ):
    $\alpha=\dfrac{P(1)-P(0)}{P(0)}$
            $=\dfrac{412-400}{400}=0,03 \rightarrow 3\,\%$

  (b)
La funció del model és contínua i derivable en tots els punts del domini d'existència, per tant trobarem els punts estacionaris ( extrems relatius ), la condició necessària dels quals és $P^{'}(t)=0$
Derivem $P(t)$:
    $P^{'}(t)=18-9\,t^{\frac{1}{2}}$
i igualem a zero
    $0=18-9\,t^{\frac{1}{2}} \Rightarrow t=4\, \text{anys}$
Com que sabem d'antuvi que la funció és creixent, l'extrem relatiu que acabem de trobar ha de correspondre a un màxim, punt a partir del qual la funció $P(t)$ deixa de créixer.
Per acabar el problema, calculem l'ordenada corresponent, que serà el valor del màxim relatiu i, donat que és l'únic, també correspondrà a l'extrem absolut
    $P_{m\,ax}=P(4)=400+18\cdot 4-6\cdot 4^{\frac{3}{2}}$
              $=400+72-2^3=464 \,\text{individus}$
$\square$

[nota del autor]

Ejercicio práctico sobre máximos y mínimos de función. ( artículo escrito en catalán )

Enunciat:
Els beneficis d'una companyia de transport de viatgers són donats per la funció
    $B(x)=a\,x^2+b\,x+c$
on $x$ és el preu que la companyia cobra per cada viatge.
Sabem que si cobren $40\,\text{euros}$ per viatge, els beneficis són $19\,000 \, \text{euros}$. A més, si augmentem el preu un $25\,\%$, el benefici que sobté és el màxim, $20\,000\; \text{euros}$. Tenint en compte aquestes dades, determineu els valors dels paràmetres $a$, $b$ i $c$.

Solució:
La funció donada correspon a una f. polinòmica de segon grau i, doncs, el màxim ha de correspondre al vèrtex de la paràbola, l'abscissa del qual és igual a
    $x_v=-\dfrac{b}{2\,a}$
tal com és ben sabut de la secundària obligatòria
===
Nota:   Això es pot demostrar de vàries maneres; una d'elles, apropiada aquí, consisteix a imposar la condició necessària d'extrem relatiu:
    $B^{'}(x)=0$
és a dir
    $2\,a\,x+b=0$
i resolent l'equació, determinem l'abscissa de l'extrem relatiu
    $x^{*} = -\dfrac{b}{2a} $
( que, en aquest cas, és un sol valor )
===
Llavors, tenint en compte els beneficis obtinguts cobrant a quaranta euros per viatge, i d'acord amb la informació del benefici màxim que se'ns dóna a l'enunciat ( el nou preu és, ara, de $1,25\cdot 40 = 50 \; \text{\euro}$ ) i de l'abscissa corresponent ( que acabem de comentar ) podem escriure el següent sistema d'equacions:
    $\left\{\begin{matrix}19\,000 & = & 40^2\,a &+&40\,b&+&c \\ 20\,000 & = & 50^2\,a &+&50\,b&+&c \\ 50 &=&-\dfrac{b}{2\,a}\end{matrix}\right.$
De la tercera equació,
    $b=-100\,a$
i substituint l'expressió del segon membre en les altres dues equacions anem a parar a un sistema de dues equacions amb dues incògnites ( en $a$ i $c$ ) molt fàcil de resoldre, trobant que
    $a=-10$ i $c=-5000$
finalment, posant aquests valors a la segona, determinem el valor de $b$, $b=1000$
per tant, la funció de beneficis és
    $B(x)=-10\,x^2+1000\,x-5000$

Comprovació:   Si $x=40$,
    $B(40)=-10\cdot 40^2+40\cdot 1000 - 5000 = 19\,000$
tal i com ha de ser.

$\square$

[nota del autor]

miércoles, 11 de marzo de 2015

El modelo normal ( de Gauss ) de variable aleatoria en la distribución en el muestro

Considerando un muestreo aleatorio simple, según el Teorema Central del Límite, la distribución en el muestreo de la variable aleatoria suma de variables independientes $\lbrace X_i \rbrace$, para $i=1,\ldots,n$, con la misma media y la misma varianza que la variable aleatoria $X$ de la población ( las cuales aparecen en el muestreo de una población de media $\mu$ y desviación estándar $\sigma$ ) tiende a una distribución normal $N(n\mu,\sigma\,\sqrt{n})$.

En otras palabras, el estadístico media muestral, $\bar{X}$, es una variable aleatoria que tiene una distribución de probabilidad ( en el muestreo ) normal, $N(\mu,\sigma/\sqrt{n})$, con lo cual podemos decir también que la variable tipificada $\dfrac{\bar{X}-\mu}{\sigma/\sqrt{n}}$ ( de dicho estadístico ) tiene distribución de probabilidad $N(0,1)$

Mediante una medida, $\bar{x}$, del estadístico media muestral $\bar{X}$, en una muestra de tamaño $n$ de una población podemos estimar el valor del parámetro $\mu$ de la población ( media poblacional ); por esa razón, denominamos estimador al estadístico media muestral.

Esto, no sólo podemos hacerlo con la media: en general, se puede hacer con cualquier parámetro, $\theta$, de la población ( cuyo estadístico estimador es $\hat{\Theta}$ ), por ejemplo con la varianza de la población, $\sigma^2$, que se puede estimar mediante el estadístico/estimador $\hat{S^2}$ ( denominado cuasivarianza muestral ); sin embargo, en este curso, nos ocuparemos solamente de la estimación de la media y, alguna que otra vez, de la varianza ( en las situaciones menos complicadas ).

Expondremos cuatro aplicaciones/ejemplos relacionadas con el Teorema Central del Límite en cuanto a los estadísticos muestrales que tienen como modelo de variable aleatoria una función de distribución ( en el muestreo ) de tipo normal:

a) Distribución en el muestreo, de tamaño $n$, del estadístico $\bar{X}$ que sirve para estimar la media, $\mu$, poblacional. Este estadístico ( estimador ), $\bar{X}$, es $N \left( \mu, \sigma/\sqrt{n} \right)$

b) Distribución en el muestreo, de tamaño $n$, del estadístico $\hat{S}$ que sirve para estimar una suma poblacional $p$. Este estadístico ( estimador ), $\hat{S}$, es $N \left( n\mu, \sigma\,\sqrt{n} \right)$

c) Distribución en el muestreo, de tamaño $n$, del estadístico $\hat{P}$ que sirve para estimar una proporción poblacional. Este estadístico ( estimador ), $\hat{P}$, es $N \left( p,\sqrt{\dfrac{p\,(1-p)}{n}} \right)$

d) Distribución en el muestreo, de tamaño $n$, del estadístico $\bar{X_1}-\bar{X_2}$ que sirve para estimar la diferencia de dos medias, $\mu-\mu_2$, correspondientes a dos poblaciones. Este estadístico ( estimador ), $\bar{X_1}-\bar{X_2}$, es $N \left( \mu_1-\mu_2 , \sqrt{\dfrac{\sigma_1}{n_1}+\dfrac{\sigma_2}{n_2}} \right)$

$\square$

[nota del autor]

viernes, 6 de marzo de 2015

martes, 3 de marzo de 2015

Sea la variable discreta $X$ con la siguiente distribución de probabilidad: $\lbrace x_i=i, P_{X}(x_i)=k/2^i \rbrace$, $i=1,2,\ldots,n,\ldots$. Se pide ...

ENUNCIADO:
Sea la variable discreta $X$ con la siguiente distribución de probabilidad: $\lbrace x_i=i, P_{X}(x_i)=k/2^i \rbrace$, $i=1,2,\ldots,n,\ldots$. Se pide:
a) Calcular el valor de la constante de normalización, $k$, para que la función de masa $P_{X}(i)$ esté bien definida
b) Calcular la esperanza matemática $E[X]$

SOLUCIÓN:
(a)
Para que la función de masa esté bien definida debe estar normalizada a la unidad, por tanto
$$\displaystyle \sum_{i=1}^{\infty}\,\dfrac{k}{2^i}=1$$
como $k$ es constante,
$$\displaystyle k\,\sum_{i=1}^{\infty}\,\left(\dfrac{1}{2}\right)^i=1$$
y despejando,
$$\displaystyle k = \dfrac{1}{\displaystyle \sum_{i=1}^{\infty}\,\left(\dfrac{1}{2}\right)^i}$$
El denominador es la suma de los $n$ términos consecutivos de una sucesión geométrica de razón $1/2$ y primer término igual a $1/2$, con $n \rightarrow \infty$, y que, por tanto es igual a $$\lim_{n \rightarrow \infty} \, \dfrac{1}{2}\left(\dfrac{\left(1/2\right)^{n}-1}{1/2-1}\right)=1$$
y por tanto
$$k=1$$
con lo cual
$$P_{X}(x_i)=1/2^i, i=1,2,\ldots,n,\ldots$$

(b)
Por definición de esperanza matemática de una variable aleatoria,
$$E[X]=\displaystyle \sum_{i=1}^{\infty}\,i\,\dfrac{1}{2^i} \quad \quad (1)$$

Así, pues, debemos averiguar ahora el valor de la suma de los infinitos términos de la sucesión aritmético-geométrica cuyos términos son $\dfrac{i}{2^i}$, para $i=1,2,\ldots, n, \ldots $

Denotando por $S_n$ a $\displaystyle \sum_{i=1}^{\infty}\,\dfrac{i}{2^i}$, podemos escribir:

$S_n=\dfrac{1}{2}+\dfrac{2}{2^2}+\dfrac{3}{2^3}+\dfrac{4}{2^4}+\ldots+\dfrac{n}{2^n}+\dfrac{n+1}{2^{n+1}}+\ldots$   (2)
y multiplicando ambos términos por $1/2$,
$\dfrac{1}{2}\,S_n=\quad \dfrac{1}{2^2}+\dfrac{2}{2^3}+\dfrac{3}{2^4}+\dfrac{4}{2^5}+\ldots+\dfrac{n}{2^{n+1}}+\ldots$   (3)

Restando la (3) de (2), miembro a miembro
$$\dfrac{1}{2}\,S_n=\dfrac{1}{2}+\dfrac{2-1}{2^2}+\dfrac{3-2}{2^3}+\dfrac{4-3}{2^4}+\ldots+\dfrac{n-(n-1)}{2^n}+\dfrac{(n+1)-1}{2^{n+1}}+\ldots$$
esto es
$$S_n=1+\dfrac{1}{2}+\dfrac{1}{2^2}+\dfrac{1}{2^3}+\ldots+\dfrac{1}{2^n}+\ldots$$
y como el segundo miembro es la suma de los infinitos términos de una sucesión geométrica de razón $r=\dfrac{1}{2}$ ( menor que uno y por tanto convergente ) y primer término igual a $1$, obtenemos
$$\displaystyle S_n=\lim_{n \rightarrow \infty}\,\dfrac{\left(1/2\right)^n-1}{1/2-1}=2$$

Por tanto, de (1),
$$E[X]=2$$

$\square$

[nota del autor]

lunes, 2 de marzo de 2015

Cálculo de la abscisa dado el valor de la función de distribución de probabilidad de una variable aleatoria normal

ENUNCIDADO:
Sea una variable aleatoria $X$ con una distribución $N(1040,50)$. Calcular el valor de la abscisa $\alpha$ tal que $P\lbrace X \le \alpha \rbrace = 0'975$

SOLUCIÓN:
En términos de la variable aleatoria $Z$ ( normal tipificada, $N(0,1)$ ), podemos escribir $P\lbrace Z \le \alpha' \rbrace = 0'975$

Con este valor de probabilidad acumulada, consultamos las tablas de la función de distribución de probabilidad, $F(z)$, encontrando la siguiente abscisa: $\alpha'=1'96$.

Y, finalmente, de acuerdo con la transformación de tipificación, $Z=\dfrac{X-\mu}{\sigma}$,
$$1'96=\dfrac{\alpha-1040}{50}$$

con lo que, despejando, obtenemos $$\alpha=1'96\cdot 50+1040=1138$$
$\square$

[nota del autor]

Ejercicios con el modelo de distribución de probabilidad normal

ENUNCIADO:
Los salarios de los trabajadores de una cierta población, A, siguen una distribución $N(2000,\sigma)$. Se pide:
a) Calcular el valor de la desviación estándar, $\sigma$, para que la probabilidad de ganar más de $2100$ euros sea de $0'33$
b) Sabiendo que los salarios de otra población, B, siguen una distribución $N(2000,200)$, ¿ en cuál de las dos poblaciones es más fácil ganar más de $2100$ euros al mes ?

SOLUCIÓN:
(a)
Como $P\lbrace X_A \succ 2100 \rbrace = 0'33$ ( información del enunciado ), podemos escribir $P\lbrace X_A \le 2100 \rbrace = 1-0'33=0'67$
Veamos ahora cuál es la abscisa en las tablas de la función de distribución de $Z \sim N(0,1)$. Encontramos: $z_{0'67}=0'44$. Y como, al tipificar la variable aleatoria normal $X_A$, hacemos $Z=\dfrac{X_A-\mu}{\sigma}$, esto corresponde a
$z_{0'67}=\dfrac{x_{0'67}-2000}{\sigma}$, y teniendo en cuenta que $x_{0'67}$ es $2100$
encontramos
$$0'44=\dfrac{2100-2000}{\sigma}$$
despejando $\sigma$,
$$\sigma=\dfrac{100}{0'44} \approx 227 \, \text{euros}$$

(b)
Para contestar esta pregunta es necesario comparar los valores de $P\lbrace X_A \succ 2100 \rbrace $ y $P\lbrace X_B \succ 2100 \rbrace $, donde $X_A \sim N(2000, 227)$ y $X_B \sim N(2000, 200)$.

$P\lbrace X_A \succ 2100 \rbrace = P\lbrace Z_A \succ\dfrac{2100-2000}{227} \rbrace $ ( tipificando la variable $X_A$ ), que es igual a $P\lbrace Z_A \succ 0'44 \rbrace $, y por tanto a $1- P\lbrace Z_A \le 0'44 \rbrace \overset{\text{tablas} \, N(0,1)}{=} 1-0'6700 = 0'33$

Por otra parte, $P\lbrace X_B \succ 2100 \rbrace = P\lbrace Z_A \succ\dfrac{2100-2000}{200} \rbrace $ ( tipificando la variable $X_B$ ), que es igual a $P\lbrace Z_B \succ 0'5 \rbrace $, y por tanto a $1- P\lbrace Z_B \le 0'5 \rbrace \overset{\text{tablas} \, N(0,1)}{=} 1-0'6915 = 0'3085$

Y como $0'33 = P \lbrace X_A \succ 2100 \rbrace \succ P \lbrace X_B \succ 2100 \rbrace = 0'3085$, es más "fácil" ( probable ) ganar un salario de $2100$ euros en la población A que en la población B. $\square$


[nota del autor]