Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. Variable aleatoria
Una variable aleatoria X es una funcin que asocia a cada elemento del espacio muestral E un nmero
real:
X: E
Ejemplo:
Consideremos el experimento aleatorio consistente en lanzar 3 monedas al aire. Podemos definir la
variable aleatoria X=nmero de caras obtenido. Esta variable toma los valores del conjunto{0,1,2,3}.
Se trata de una variable aleatoria discreta porque su recorrido es un nmero finito de valores.
Cuando el recorrido est formado por los infinitos nmeros reales de un intervalo hablaremos de variable
aleatoria continua.
p(X=1)=3/8
p(X=2)=3/8
p(X=3)=1/8
# nicamente se observa si se cumple un suceso, A (xito), o si, por el contrario, no se cumple A (fracaso).
# La probabilidad del suceso A es constante, es decir, no vara al repetir el experimento.
Si p(A) = p entonces p( A ) = 1- p = q
La variable aleatoria que expresa el nmero de xitos obtenidos en cada realizacin del experimento recibe
el nombre de variable de la distribucin binomial. Si se realizan n pruebas del experimento hablaremos de
una binomial de parmetros n y p: B( n, p)
Funcin de probabilidad
La funcin de probabilidad de una distribucin binomial B( n, p) viene dada por la expresin:
p( k exitos) = p( X = k ) =
( ). p
n
k
. q n k
Ejercicio
Cuatro de cada diez trabajadores de una determinada empresa son mujeres. Si elegimos 8 personas de esa
empresa al azar, calcula la probabilidad de que sean:
a) 3 mujeres.
b) ms de 5 mujeres.
c) al menos 2 mujeres.
Solucin:
Sea A el suceso A= Elegir una mujer. Es claro que p(A) = 0,4 = p y que p( A ) = 0,6 = q
La variable aleatorria X=Nmero de mujeres elegidas es una binomial B(8, 0,4). Por tanto:
a) p(X=3)=
( ) . 0,4
8
3
.0,65
8
6
6
b) p(X>5)= p(X=6) + p(X=7) + p(X=8)= ( 6 ) .0,4 . 0,6 +
( ) .0,4
8
7
. 0,6 + ( 88 ) .0,4 8
8
1
: = n.p
F2 = n.p.q
F = n. p. q
1 x 2
1
2
f ( x) =
.e
. 2
- Su dominio es .
- Es una funcin simtrica respecto de la recta x = :
- El eje de abscisas es una asntota horizontal.
- Tiene un mximo en x = :.
- El rea encerrada entre la curva f(x) y el eje de abscisas es 1.
La ms sencilla, denominada normal estndar, es la normal de media 0 y desviacin tpica 1: N(0,1) de la
cual se han tabulado las probabilidades.
Con el manejo de las tablas se pueden calcular probabilidades del tipo p(Z#k).
Ejercicio 1
Sea Z una variable aleatoria N(0,1). Calcula:
b) p(Z$-1,32)
c) p(1,52<Z<2,03)
a) p(Z$1,32)
d) p(-2,03<Z#1,52)
Solucin: a) 0,0934
d) 0,9146
b) 0,9066
c) 0,0431
Ejercicio 2
a) Para qu valor de k se cumple p(Z#k)=0,84 ?
b) Para qu valor de k se cumple p(-k#Z#k)=0,8 ?
Solucin: a) k=0,995 b) k=1,28 El intervalo (-1,28, 1,28) encierra un 80% del rea total en una N(0,1)
Intervalo caracterstico y nivel de confianza
Si un intervalo (-k, k) encierra un rea igual a p, recibe el nombre de intervalo caracterstico correspondiente
a la probabilidad p, y k es el valor crtico.
Habitualmente la probabilidad p se designa por 1- " y se llama nivel de confianza. De la misma forma, el
valor crtico k se designa por z"/2.
p(Z$z"/2)="/2
p(-z"/2 #Z#z"/2)=1- "
Ejercicio 3
Calcula z"/2 para 1- "= 0,9
Solucin:
Si el intervalo abarca un rea de 0,9, fuera de l deber haber un rea de 0,1 ; el rea de cada una de las
colas es 0,05.
"/2
z"/2
Intervalo caracterstico
0,9
0,05
1,645
(-1,645, 1,645)
0,95
0,025
1,96
(-1,96, 1,96
0,99
0,005
2,575
(-2,575, 2,575)
Tipificacin de la variable
Las distribuciones normales que nos encontramos ms a menudo no son del tipo N(0,1).
Para calcular las probabilidades de una distribucin normal N( :,F ) utilizando la tabla se debe efectuar el
cambio de variable Z =
X
. En este caso se dice que se ha tipificado la variable. Una vez tipificada,
X 25 26 25
P(X#26) = p(
= p( Z 0,5) = 0,6915
2
2
4
3000.0,02.0,98 )
80,5 60
)= 1- p(Z#2,67) =1- 0,9962=0,0038
7,67
Teora de muestras
1. Distribucin de variables aleatorias en el muestreo
1.1 Distribucin de medias muestrales
Dada una variable estadstica observada en una poblacin, se puede calcular se media x y su
desviacin tpica F.
Si tomamos una muestra aleatoria de la poblacin y calculamos su media, sta no tiene por qu coincidir con
la media de la poblacin x .
Si consideramos k muestras del mismo tamao de una poblacin y calculamos sus medias xi , la distribucin
de estas medias muestrales constituye una nueva variable aleatoria llamada distribucin de medias
muestrales. Los valores xi no son iguales a x ,sin embargo, cuanto mayores sean las muestras, ms se
aproximarn sus medias a la media poblacional.
Su desviacin tpica es s =
.
n
Cuando n>30, se aproxima a una distribucin normal si la poblacin de partida no lo era. (Por supuesto es
normal si la poblacin de partida ya lo era cualquiera que sea el valor de n).
5
Este teorema nos permitir, conociendo la distribucin de las medias muestrales de tamao n, extraer
conclusiones de la media de la poblacin. Debemos observar tambin que cuando n aumenta, la desviacin
tpica disminuye.
Ejercicio 1
El cociente intelectual de unos universitarios se distribuye normalmente con media 100 y desviacin tpica
11.
a) Se elige una persona al azar. Halla la probabilidad de que si C.I est entre 100 y 103.
b) Se elige al azar una muestra de 25 personas. Halla la probabilidad de que la media de sus cocientes
intelectuales est entre 100 y 103.
Solucin:
La poblacin de partida es N(100, 11).
a)
103 100
100 100
p(100 < X 103) = p
< Z
= p(0 < Z 0,27) = p( z 0,27) p( z 0) = 0,6064 0,5 = 0,1064
11
11
11
Los parmetros de esta distribucin son: : = 100 ;
=
= 2,2
n
25
Por tanto, la distribucin de la media muestral es N(100, 2,2)
103 100
100 100
p(100 X 103) = p
Z
= p(0 Z 1,36) = p( Z 1,36) p( Z 0) = 0,9131 0,5 = 0,4131
2,2
2,2
Ejercicio 2
En una urna hay 3 bolas con los nmeros 1,2 y 3.
a) Calcula la media y la desviacin tpica de esta poblacin
b) Forma todas las muestras posibles que podemos extraer con devolucin de esta poblacin de tamao 2.
c) Forma la distribucin de las medias de las muestras, halla la media, la desviacin tpica y confirma el
teorema central de lmite.
Solucin:
a) Media poblacional :=
x
N
1+ 2 + 3
= 2 donde N es el nmero total de poblacin.
3
x
N
2
i
2 =
12 + 2 2 + 32
14
22 =
4=
3
3
2
= 0,8165
3
12 + 1,52 . 2 + 2 2 . 3 + 2,52 . 2 + 32
2 2 = 0,5774
Desviacin tpica de esta distribucin s =
9
Se confirma el teorema central del lmite porque si la poblacin tena media : = 2 ,la distribucin de las
6
medias muestrales tambin tiene media 2 y si la desviacin tpica de la poblacin era F = 0,8165, la
0,8165
desviacin tpica de la distribucin de medias centrales es s =
=
= 0,5774
n
2
Ejercicio 3
En una universidad se sabe que las tallas de los alumnos se distribuyen normalmente con media 172 cm y
desviacin tpica 17,5 cm. Se toman muchas muestras de 35 estudiantes.
a) Cul es la media y la desviacin tpica de la distribucin de las medias muestrales?.
b) Halla la probabilidad de que la media muestral sea inferior a 171 cm.
c) Si se eligen 150 muestras de 35 alumnos, en cuntas de ellas cabe esperar que la media muestral sea mayor
que 170 cm y menor que 171,5 cm?.
Solucin:
a) Las tallas siguen una N(172, 17,2).
La distribucin de las mediales muestrales seguir una normal de media x = 172 cm y desviacin tpica
s=
17,5
=
= 2,96 ,esto es, N(172, 2,96)
n
35
171 172
2,96
171,5 172
170 172
c) p(170 < x 171,5) = p
< Z
= p( 0,67 < Z 0,17) = 0,1833
2,96
2,96
Por lo tanto 150. 0,1833 .27 muestras.
Es decir, cabe esperar que en 27 muestras de las 150 seleccionadas, la media muestral ser mayor que 170
y menor que 171,5.
)
n
x
presentar una distribucin N(0,1) donde p(-z"/2 #Z#z"/2)=1 - " como
/ n
se vio anteriormente. Sustituyendo la expresin de Z, tenemos:
Si se tipifica la variable, Z =
p(-z"/2 #
x
#z"/2) =1 - " , p(-z"/2 A / n # x - : # z"/2 A / n )=1 - " ,
/ n
, p( x - z"/2 .
x + z"/2 . / n ) = 1 - "
Por tanto el intervalo de confianza para el parmetro : de una poblacin N( :, F ) a un nivel de confianza
1 - " es un intervalo centrado en x y de radio z / 2 . /
n ,esto es:
IC = x z / 2 . / n , x + z / 2 . / n
Si F es desconocida y n >30 se usa en su lugar la cuasivarianza s 2 = 2 .
n
n 1
Ejercicio
Un psiclogo escolar ha estudiado que el tiempo de reaccin de 1 de Primaria se distribuye normalmente.
Con una muestra de 100 alumnos, la media de tiempo de reaccin fue de 45 segundos y la desviacin tpica
de 0,04 segundos. Halla un intervalo de confianza para la media de tiempos de reaccin al nivel de confianza
de:
a) 90%
b) 95%
c) Interpretar los resultados
Solucin: IC = x z / 2 . / n , x + z / 2 . / n
Sabemos que se trata de una normal N( 45, 0,04). Por tanto x = 45 y = 0,04
a) Calculemos z"/2 para un nivel de confianza del 90%:
Si el intervalo abarca un rea de 0,9, fuera de l deber haber un rea de 0,1 ; el rea de cada una de las
colas es 0,05.
Se trata de buscar el valor de k tal que p(Z$k)=0,05 , esto es, p(Z#k)=0,95
En las tablas encontramos:
p(Z#1,64)=0,9495
p(Z#1,65)=0,9505
El valor promedio entre 1,64 y 1,65 es 1,645. Por tanto z"/2 =1,645
0,04
0,04
100
100
El tiempo de reaccin est entre 44,993 y 45,007 con una confianza del 90% o lo que es lo mismo, este
intervalo cubre el valor de la media con una probabilidad de 0,9.
b) Para calcular z"/2 para un nivel de confianza del 95% se procede de forma anloga obteniendo z"/2 =1,96
0,04
0,04
100
100
c) Cuanto mayor es el nivel de confianza, mayor es la amplitud del intervalo, con lo que aumenta el margen
de error.
E = z / 2
n
Ejercicio 1
En un determinado barrio se seleccion al azar una muestra de 100 personas cuya media de ingresos
mensuales era de 600 i, con una desviacin tpica de 120 i.
8
a) Si se toma un nivel de confianza del 95 %, cul es el intervalo de confianza para la media de los ingresos
mensuales de toda la poblacin?.
b) Si se toma un nivel de confianza del 99 %, cul es el tamao muestral necesario para estimar la media de
ingresos mensuales con un error menor a 18 i ?.
Solucin
a) Se trata de una normal N(600, 120)
Sabemos ya que a un nivel de confianza del 95% le corresponde z"/2 =1,96.
120
120
100
100
b) A un nivel de confianza de 99 % le corresponde z"/2 =2,575
120 . 2,575
120
18 = 2,575
n=
= 17,17 n = 294,69
El error es E = z / 2
18
n
n
Por tanto se necesita una muestra de 295 personas.
Ejercicio 2
Un fabricante de pilas alcalinas sabe que el tiempo de duracin, en horas, de las pilas que fabrica sigue una
distribucin normal de media desconocida y varianza 3600. Con una muestra de su prouccin, elegida al azar,
y un nivel de confianza del 95% ha obtenido para la media el intervalo de confianza (372,6 392,2).
a) Calcula el valor que obtuvo para la media de la muestra y el tamao muestral utilizado.
b) Cul ser el error de su estimacin, si hubiese utilizado una muestra de tamao 225 y un nivel de
confianza del 86,9%?.
Solucin
a) Un intervalo de confianza para la media tiene la forma ( x z / 2 . / n , x + z / 2 . / n )
A un nivel de confianza del 95% le corresponde un z"/2 =1,96.
Igualando con el intervalo dado tenemos:
60
x 1,96
= 372,6
n
n
Sustituyendo el valor de x en, por ejemplo la primera ecuacin: 382,4 1,96
60
= 372,6 n = 144
n
b) E = z / 2
n
Si el nivel de confianza es de un 86,9%, el intervalo abarca un rea de
1- "=0,869; fuera de l deber haber un rea de 0,131 ; el rea de cada
una de las colas es 0,0655.Se trata de buscar el valor de k tal que
p(Z$k)=0,0655 , esto es, p(Z#k)=0,9345En las tablas encontramos:
p(Z#1,64)=0,9345
60
= 6,04
Por tanto z"/2 =1,51 y el error E = 1,51
15
9
Ejercicio 3
Las alturas, expresadas en cm, de los estudiantes de segundo de bachiller se distribuyen normalmente con una
desviacin tpica de 20 cm. En un colectivo de 500 estudiante de segundo de bachiller se ha obtenido una
media de 160 cm.
a) Calcula, con una probabilidad del 98%, entre qu valores estar la media de la altura de la poblacin total
de estudiantes de segundo de bachiller,
b) Interpreta el resultado del intervalo obtenido.
Solucin:
a) Nos piden un intervalo de confianza para la media. Su forma es ( x z / 2 . / n , x + z / 2 . / n )
A una probabilidad del 98% le corresponde un z"/2 =2,33.
El intervalo de confianza ser
b) En el 98% de las posibles 160 2,33 20 ,160 + 2,33 20 = (157,16, 162,08 )
500
500
muestral, la media de la altura
de la poblacin est entre
157,16 cm y 162,08 cm.
Inferencia estadstica
1 Hiptesis estadstica
Cuando en un estudio estadstico queremos determinar si una poblacin cumple una determinada
caracterstica, previamente debemos plantear un test estadstico que ser el procedimiento que nos permitir
evaluar, a partir de una muestra, si una determinada hiptesis formulada sobre una caracterstica de la
poblacin se verifica o no.
Una vez concluido el test podemos considerar la hiptesis que, en principio, admitimos como vlida, y que
llamaremos hiptesis nula, H0 y una hiptesis contraria a sta, que denominaremos hiptesis alternativa, H1,
que es la que admitiremos como vlida si nos vemos obligados a rechazar la hiptesis H0.
2 Contraste de hiptesis
Es un procedimiento del que depende la decisin de aceptar o rechazar la hiptesis nula y esta
aceptacin o rechazo depender, a su vez, de cul sea la discrepancia entre la hiptesis y la informacin
muestral que tengamos. Si la discrepancia es menor que un determinado valor que consideramos aceptable,
la hiptesis se dar por cierta; este valor se llama valor de significacin y se representa por ".
Es evidente que una hiptesis estadstica no se puede aceptar o rechazar con una certeza del 100%, sino que
se define un nivel crtico para ", que nos marcar los lmites para aceptar o rechazar la hiptesis nula.
As, por ejemplo, si el nivel de significacin es "= 0,05, rechazaremos como improbables el 5% de los casos
extremos; por esta razn, en ocasiones, tambin se dice que estamos trabajando con un nivel de confianza
del 95%.
Nosotros trabajaremos con hiptesis nulas relativas a la media. Los valores de la media que nos lleven a
aceptar la hiptesis nula H0, forman la regin de aceptacin, y los que nos conducen a rechazarla, constituyen
la regin de rechazo.
Contraste bilateral
Contrate unilateral
Contraste unilateral
. El intervalo de
n
0 + z / 2
n
n
Si el valor de la media x , se encuentra en ese intervalo, se aceptar la hiptesis nula; en caso contrario, se
rechazar.
Ejercicio 1
Se quiere estimar la media de la nmina mensual que reciben los directivos de las compaas multinacionales
que operan en Europa.
11
10
1000
=
= 10 . Por tanto, la varianza de la media muestral
100
n
= 10
, 0 + z / 2
0 z / 2
= 4000 1,96 10 , 4000 + 1,96 10 = (3993,8, 4006,2)
n
n
Se rechaza la hiptesis de que la nmina media es de 4000 i con un nivel de confianza de 0,95 ya que x =
4008 (3996,8, 4006,2).
Ejercicio 2
El peso medio de una muestra aleatoria de 100 naranjas de una determinada variedad es de 272 g. Se sabe que
la desviacin tpica poblacional es de 20 g. A un nivel de significacin de 0,05, hay suficiente evidencia para
refutar la afirmacin de que el peso medio poblacional es de 275 d?.
Solucin:
Se trata de un test de hiptesis bilateral para la media:
H0: := 275
H1: : 275
La zona de aceptacin de la hiptesis nula, H0,es:
20
20
10
10
n
n
Como x = 272 0(271,08, 278,92), no hay suficiente evidencia para rechazar la hiptesis nula.
12
y en el segundo 0 z
,+
n
Ejercicio
En los ltimos aos el consumo familiar diaria de cierta ciudad en electricidad (en Kw) segua una Normal
de media 6,3 y desviacin tpica 1,2. Sin embargo, desde hace unos meses las tarifas elctricas han
experimentado varias reducciones, y se piensa que esto ha podido repercutir en un aumento del consumo.
Recientemente, para una muestra de 47 familias se ha obtenido un consumo medio diario de 6,8. Suponiendo
que el consumo sigue siendo aproximadamente Normal y que la desviacin tpica se ha mantenido:
a) Plantea en test para contrastar que el abaratamiento de las tarifas no ha influido en el consumo, frente a que
ha tenido la repercusin que se piensa, como parecen indicar los datos. Si se concluyera que la media de
consumo se ha mantenido y realmente subi, cmo se llama al error cometido?.
b) A qu conclusin se llega en el test planteado en el apartado anterior con un nivel de significacin del
1%?.
Solucin:
a) Se trata de plantear un test de hiptesis unilateral para la media:
H0: 6,3
H1: > 6,3
Si se concluye que la media del consumo se ha mantenido cuando realmente subi, se est aceptando que la
hiptesis nula es verdadera cuando realmente es falsa. Se comete un error de tipo II segn la tabla:
H0 cierta
H0 falsa
Aceptamos H0
No hay error
Error de tipo II
Aceptamos H1
Error de tipo I
No hay error
13
1,2
= ( , 6,7)
47
Como 6,8 ( , 6,7), se rechaza la hiptesis, es decir, el abaratamiento de las tarifas ha repercutido en
un aumento del consumo, con un nivel de significacin del 1%.
14