Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2018
Probabilidad
Algunos descriptivos
Probabilidad
Distribución Normal
Probabilidad
Curva normal
Probabilidad
Caracterı́sticas
Probabilidad
Áreas bajo la curva normal
La curva de cualquier distribución de probabilidad continua o función
de densidad se construye de manera que el área bajo la curva limitada
por las dos ordenadas x = x1 y x = x2 sea igual a la probabilidad de
que la variable aleatoria X tome un valor entre x = x1 y x = x2 . Es
decir:
Z x2 Z x2 (x − µ)2
1 −
P(x1 < X < x2 ) = n(x; µ, σ)dx = √ e 2σ 2 dx
x1 σ 2π x1
Probabilidad
Áreas bajo la curva normal
Probabilidad
Normal Estándar
Probabilidad
Normal Estándar
Probabilidad
Ejemplos
1 Dada una distribución normal estándar, calcular el área bajo la
curva que se localiza:
a) A la izquierda de z = 1,24
b) A la derecha de z = 1,84
c) Entre z = −1,97 y z = 0,86
2 Una variable aleatoria X tiene una distribución normal con
µ = 50 y σ = 10. Calcular la probabilidad de que X tome un
valor entre 45 y 62.
3 Dada una distribución normal estándar, calcular el valor de k tal
que:
a) P(Z > k) = 0,3015
b) P(k < Z < −0,18) = 0,4197
4 Dada una distribución normal con µ = 40 y σ = 6, calcular el
valor de x que tiene:
a) 45 % del área a la izquierda
b) 14 % del área a la derecha
Probabilidad
Problemas
Probabilidad
Problemas
Probabilidad
Inferencias sobre la media
Probabilidad
Inferencias sobre la media
Estimación puntual
Ejemplo. Uno de los indicadores de la calidad del aire es el núme-
ro medio de microgramos de partı́culas en suspensión por metro
cúbico de aire. Interesa el valor de µ, la media de la variable alea-
toria X , el número de microgramos de partı́culas en suspensión
por metro cúbico de aire. Para controlar la situación se hace una
lectura cada seis dı́as, determinando por metro cúbico, el núme-
ro de microgramos de partı́culas en suspensión concentradas en
él. Después de un perı́odo de treinta dı́as, se ha generado una
muestra aleatoria X1 , X2 , X3 , X4 , X5 de tamaño 5. Los valores
observados de estas variables, para el perı́odo dado de 30 dı́as
son:
X1 = 58, X2 = 70, X3 = 57, X4 = 61, X5 = 59
Probabilidad
Estimación
Probabilidad
Intervalos de confianza
Probabilidad
Intervalos de confianza
Ejemplo
Se encuentra que la concentración promedio de zinc que se obtiene
en una muestra de mediciones en 36 sitios diferentes de un rı́o es de
2.6 gramos por mililitro. Calcule los intervalos de confianza del 95 %
y 99 % para la concentración media de zinc en el rı́o. Suponga que la
desviación estándar de la población es de 0.3 gramos por mililitro.
Probabilidad
Error
Teorema
Si utilizamos x como una estimación de µ, podemos tener 100(1−α) %
σ
de confianza en que el error no excederá a zα/2 √ .
n
Probabilidad
Tamaño de la muestra
Es decir que: z
α/2 σ
2
n=
e
Ejemplo
Qué tan grande debe ser la muestra del ejemplo anterior si queremos
tener 95 % de confianza en que nuestra estimación de µ diferirá por
menos de 0.05?
Probabilidad
σ 2 desconocida
Si x y s son la media y la desviación estándar de una muestra aleatoria
de una población normal de la que se desconoce la varianza σ 2 , un
intervalo de confianza del 100(1 − α) % para µ es:
s s
x − tα/2 √ < µ < x + tα/2 √
n n
Ejemplo
El contenido de ácido sulfúrico de 7 contenedores similares es de 9.8,
10.2, 10.4, 9.8, 10.0, 10.2, y 9.6 litros. Calcule un intervalo de
confianza del 95 % para el contenido promedio de todos los
contenedores suponiendo una distribución aproximadamente normal.
Probabilidad
σ 2 desconocida
Probabilidad
Dos muestras: estimación de la diferencia entre dos
medias
Probabilidad
Intervalo de confianza para µ1 − µ2
Probabilidad
Ejemplo
Probabilidad
Varianzas desconocidas e iguales
Probabilidad
Varianzas desconocidas e iguales
Ejemplo
En el artı́culo “Estructura comunitaria de los macroinvertebrados co-
mo un indicador de la contaminación de minas ácidas”, publicado en el
Journal of Environmental Pollution, se informa sobre una investigación
realizada para determinar la relación entre parámetros fı́sicoquı́micos
seleccionados y diversas mediciones de la estructura de la comunidad
de macroinvertebrados. Una faceta de la investigación consistió en eva-
luar la efectividad de un ı́ndice numérico de la diversidad de especies
para indicar la degradación del agua debida al desagüe ácido de una
mina. Conceptualmente, un ı́ndice elevado de la diversidad de especies
macroinvertebradas deberı́a indicar un sistema acuático no contamina-
do; mientras que un ı́ndice bajo de esta diversidad indicarı́a un sistema
acuático contaminado.
Probabilidad
Varianzas desconocidas e iguales
Ejemplo
Se eligieron 2 estaciones de muestreo independientes para este estudio:
una que se localiza corriente abajo del punto de descarga ácida de la
mina y la otra ubicada corriente arriba. Para 12 muestras mensuales
reunidas en la estación corriente abajo el ı́ndice de diversidad de espe-
cies tuvo un valor medio de x1 = 3,11 y una desviación estándar de
s1 = 0,771; mientras que 10 muestras reunidas mensualmente en la
estación corriente arriba tuvieron un valor medio del ı́ndice x2 = 2,04
y una desviación estándar de s2 = 0,448. Calcular un intervalo de con-
fianza del 90 % para la diferencia entre las medias de la población de
los dos sitios, suponiendo que las poblaciones se distribuyen de forma
aproximadamente normal y que tienen varianzas iguales.
Probabilidad
Varianzas desconocidas y diferentes
Probabilidad
Varianzas desconocidas y diferentes
Ejemplo
Se llevó a cabo un estudio para estimar la diferencia en la cantidad
de ortofosfato medido en dos estaciones diferentes del rı́o Cauca. El
ortofosfato se mide en miligramos por litro. Se reunieron 15 muestras
de la estación 1 y 12 muestras de la estación 2. Las 15 muestras de
la estación 1 tuvieron un contenido promedio de ortofosfato de 3.84
miligramos por litro y una desviación estándar de 3.07 miligramos por
litro; mientras que las 12 muestras de la estación 2 tuvieron un conte-
nido promedio de 1.49 miligramos por litro y una desviación estándar
de 0.80 miligramos por litro. Determinar un intervalo de confianza de
95 % para la diferencia en el contenido promedio verdadero de ortofos-
fato en estas dos estaciones. Suponga que las observaciones provienen
de poblaciones normales con varianzas diferentes.
Probabilidad
Observaciones pareadas
Probabilidad
Observaciones pareadas
Intervalo de confianza
Si d y sd son la media y la desviación estándar, respectivamente, de
las diferencias distribuidas normalmente de n pares aleatorios de medi-
ciones, un intervalo de confianza del 100(1 − α) % para µD = µ1 − µ2
es
sd sd
d − tα/2 √ < µD < d + tα/2 √ < µD
n n
donde tα/2 es el valor t con v = n − 1 grados de libertad, que deja un
área de α/2 a la derecha.
Probabilidad
Observaciones pareadas
Ejemplo
Un estudio reporta los niveles de dioxina TCDD en 20 personas, quienes
posiblemente estuvieron expuestos a un agente quı́mico. En la siguiente
tabla se presentan los niveles de TCDD en sangre y tejido adiposo.
Calcular un intervalo de confianza del 95 % para µ1 − µ2 , donde µ1
y µ2 representan las medias de los niveles de TCDD en sangre y en
tejido adiposo, respectivamente. Suponga que la distribución de las
diferencias es casi normal.
Probabilidad
Observaciones pareadas
Probabilidad
Estimación de una Proporción
Ejemplo
En una muestra aleatoria de n = 500 familias que tienen televisores en
la ciudad de Cali, se encuentra que x = 340 tiene suscripción con el
operador de cable A. Calcular un intervalo de confianza del 95 % para
la proporción real de familias que tienen televisores en esta ciudad y
están suscritas al operador A.
Probabilidad
Estimación de una Proporción
Probabilidad
Estimación de una Proporción
Teorema
Si p̂ se utiliza como un estimado de p, podemosptener un 100(1 − α) %
de confianza en que el error no excederá a zα/2 p̂ q̂/n.
Qué tan grande debe ser una muestra para poder estar seguros de que
el error al estimar p será menor que una cantidad especı́fica e?.
Por p medio del teorema anterior debemos elegir un n tal que
zα/2 p̂ q̂/n = e.
Probabilidad
Estimación de la diferencia entre dos proporciones
Probabilidad
Estimación de la diferencia entre dos proporciones
Definición
Si pˆ1 y pˆ2 son las proporciones de éxitos en muestras aleatorias de
tamaños n1 y n2 , respectivamente, un intervalo de confianza aproxi-
mado del 100(1−α) % para la diferencia de dos parámetros binomiales
p1 − p2 es:
s s
pˆ1 qˆ1 pˆ2 qˆ2 pˆ1 qˆ1 pˆ2 qˆ2
(pˆ1 − pˆ2 ) − zα/2 + < p1 − p2 < (pˆ1 − pˆ2 ) + zα/2 +
n1 n2 n1 n2
Probabilidad
Estimación de la Varianza
Definición
Si s 2 es la varianza de una muestra aleatoria de tamaño n de una
población normal, un intervalo de confianza del 100(1 − α) % para σ 2
es:
(n − 1)s 2 2 (n − 1)s 2
< σ <
χ2α/2 χ21−α/2
donde χ2α/2 y χ21−α/2 son valores χ2 con v = n − 1 grados de libertad,
que dejan áreas de α/2 y 1 − α/2, respectivamente, a la derecha.
Probabilidad
Intervalos de confianza
Error estándar
σ
σx = √ Población infinita
rn
N −n σ
σx = √ Población finita
N −1 n
Probabilidad