Está en la página 1de 40

Probabilidad - Introducción

2018

Probabilidad
Algunos descriptivos

La medida de localización más común es la media o valor me-


dio. La media de una muestra es el promedio aritmético de las
observaciones:
x1 +2 + · · · + xn
x=
n
Varianza muestral:
n
X
(xi − x)2
i=1
s2 =
n−1

Desviación estándar: s = s2

Probabilidad
Distribución Normal

Probabilidad
Curva normal

Probabilidad
Caracterı́sticas

La moda, que es el punto sobre el eje horizontal donde la curva


tiene su punto máximo, ocurre en x = µ.
La curva es simétrica alrededor de un eje vertical.
La curva normal se aproxima al eje horizontal de manera asintóti-
ca.
El área total bajo la curva y sobre el eje horizontal es igual a uno.

Probabilidad
Áreas bajo la curva normal
La curva de cualquier distribución de probabilidad continua o función
de densidad se construye de manera que el área bajo la curva limitada
por las dos ordenadas x = x1 y x = x2 sea igual a la probabilidad de
que la variable aleatoria X tome un valor entre x = x1 y x = x2 . Es
decir:
Z x2 Z x2 (x − µ)2
1 −
P(x1 < X < x2 ) = n(x; µ, σ)dx = √ e 2σ 2 dx
x1 σ 2π x1

Probabilidad
Áreas bajo la curva normal

El área bajo la curva entre dos ordenadas también depende de los


valores µ y σ.
Las dos regiones sombreadas tienen tamaños diferentes, por lo
tanto, la probabilidad asociada con cada distribución será diferente
para los dos valores dados de X .

Probabilidad
Normal Estándar

Serı́a inútil tratar de establecer tablas separadas para cada posible


valor de µ y σ.
Podemos transformar todas las observaciones de cualquier variable
aleatoria normal X en un nuevo conjunto de datos de una variable
aleatoria normal Z con media 0 y varianza 1.
Z se llama distribución normal estándar n(z; 0, 1).
La transformación de los valores por medio de:
x −µ
Z=
σ
Es decir que:

P(x1 < X < x2 ) = P(z1 < X < z2 )

Probabilidad
Normal Estándar

Figura: Distribuciones normales, original y transformada

Probabilidad
Ejemplos
1 Dada una distribución normal estándar, calcular el área bajo la
curva que se localiza:
a) A la izquierda de z = 1,24
b) A la derecha de z = 1,84
c) Entre z = −1,97 y z = 0,86
2 Una variable aleatoria X tiene una distribución normal con
µ = 50 y σ = 10. Calcular la probabilidad de que X tome un
valor entre 45 y 62.
3 Dada una distribución normal estándar, calcular el valor de k tal
que:
a) P(Z > k) = 0,3015
b) P(k < Z < −0,18) = 0,4197
4 Dada una distribución normal con µ = 40 y σ = 6, calcular el
valor de x que tiene:
a) 45 % del área a la izquierda
b) 14 % del área a la derecha
Probabilidad
Problemas

1) Cierto tipo de baterı́a dura, en promedio, 3 años, con una desvia-


ción estándar de 0.5 años. Suponga que la duración de la baterı́a
se distribuye normalmente. Calcular la probabilidad de que una
baterı́a determinada dure menos de 2.3 años.
2) Se utilizan medidores para rechazar todos los componentes en los
que cierta dimensión no esté dentro de la especificación 1,50 ± d.
Se sabe que esta medida se distribuye normalmente con una media
de 1.50 y una desviación estándar de 0.2. Determine el valor d tal
que las especificaciones cubran el 95 % de las mediciones.

Probabilidad
Problemas

3) Un estudio hospitalario analiza el porcentaje de pureza del oxı́geno


de cierto proveedor. La media fue de 99.61, con una desviación
estándar de 0.08. Suponga que la distribución del porcentaje de
pureza fue aproximadamente normal.
a) ¿Qué porcentaje de los valores de pureza se esperarı́a que estu-
vieran entre 99.5 y 99.7?
b) ¿Qué valor de pureza se esperarı́a que excediera exactamente 5 %
de la población?

Probabilidad
Inferencias sobre la media

Qué es la distribución muestral de X ?


La distribución muestral de X con tamaño muestral n es la dis-
tribución que resulta cuando un experimento se lleva a cabo una
y otra vez (siempre con una muestra de tamaño n) resultan los
diversos valores de X . Por lo tanto, esta distribución muestral
describe la variabilidad de los promedios muestrales alrededor de
la media de la población µ.

Probabilidad
Inferencias sobre la media

Estimación puntual
Ejemplo. Uno de los indicadores de la calidad del aire es el núme-
ro medio de microgramos de partı́culas en suspensión por metro
cúbico de aire. Interesa el valor de µ, la media de la variable alea-
toria X , el número de microgramos de partı́culas en suspensión
por metro cúbico de aire. Para controlar la situación se hace una
lectura cada seis dı́as, determinando por metro cúbico, el núme-
ro de microgramos de partı́culas en suspensión concentradas en
él. Después de un perı́odo de treinta dı́as, se ha generado una
muestra aleatoria X1 , X2 , X3 , X4 , X5 de tamaño 5. Los valores
observados de estas variables, para el perı́odo dado de 30 dı́as
son:
X1 = 58, X2 = 70, X3 = 57, X4 = 61, X5 = 59

Probabilidad
Estimación

La estimación puntual de algún parámetro (estadı́stico) θ de la


población es un solo valor θ0 . Por ejemplo, el valor x del estadı́stico
X que se calcula a partir de una muestra de tamaño n, es una
estimación puntual del parámetro de la población µ.
Se puede esperar que una estimación puntual de una muestra
dada sea exactamente igual al parámetro de la población que se
quiere. Hay muchas situaciones en que es preferible determinar
un intervalo dentro del cual esperarı́amos encontrar el valor del
parámetro. Tal intervalo se conoce como estimación por intervalo
o intervalo de confianza.

Probabilidad
Intervalos de confianza

Intervalo de confianza de µ - σ 2 conocida


Si x es la media de una muestra aleatoria de tamaño n de una población
de la que se conoce su varianza σ 2 , un intervalo de confianza de 100(1−
α) % para µ es:
σ σ
x − zα/2 √ < µ < x + zα/2 √
n n

donde zα/2 es el valor z que deja un área de α/2 a la derecha.

Probabilidad
Intervalos de confianza

Ejemplo
Se encuentra que la concentración promedio de zinc que se obtiene
en una muestra de mediciones en 36 sitios diferentes de un rı́o es de
2.6 gramos por mililitro. Calcule los intervalos de confianza del 95 %
y 99 % para la concentración media de zinc en el rı́o. Suponga que la
desviación estándar de la población es de 0.3 gramos por mililitro.

Probabilidad
Error

Teorema
Si utilizamos x como una estimación de µ, podemos tener 100(1−α) %
σ
de confianza en que el error no excederá a zα/2 √ .
n

En el ejemplo anterior tenemos una confianza del 95 % en que la media


muestral x = 2,6√difiere de la media verdadera µ en una cantidad menor
que (1,96)(0,3)/ 36 = 0,098.
Con frecuencia queremos saber qué tan grande necesita ser una mues-
tra para poder estar seguros de que el error al estimar µ será me-
nor que una cantidad especı́fica e, debemos elegir n de manera que
σ
zα/2 √ = e.
n

Probabilidad
Tamaño de la muestra

Es decir que: z
α/2 σ
2
n=
e

Ejemplo
Qué tan grande debe ser la muestra del ejemplo anterior si queremos
tener 95 % de confianza en que nuestra estimación de µ diferirá por
menos de 0.05?

Probabilidad
σ 2 desconocida
Si x y s son la media y la desviación estándar de una muestra aleatoria
de una población normal de la que se desconoce la varianza σ 2 , un
intervalo de confianza del 100(1 − α) % para µ es:
s s
x − tα/2 √ < µ < x + tα/2 √
n n

donde tα/2 es el valor t con v = n − 1 grados de libertad que deja un


área de α/2 a la derecha.

Ejemplo
El contenido de ácido sulfúrico de 7 contenedores similares es de 9.8,
10.2, 10.4, 9.8, 10.0, 10.2, y 9.6 litros. Calcule un intervalo de
confianza del 95 % para el contenido promedio de todos los
contenedores suponiendo una distribución aproximadamente normal.
Probabilidad
σ 2 desconocida

Con frecuencia se recomiendan que incluso cuando no sea posible su-


poner la normalidad, se desconozca σ y n ≥ 30, σ se puede reemplazar
con s para poder utilizar el intervalo de confianza
s
x ± zα/2 √
n

A menudo se hace referencia a esto como un intervalo de confianza


para una muestra grande.
Ejemplo: Se obtienen las calificaciones de matemáticas de las prue-
bas Saber de una muestra aleatoria de 500 estudiantes. Se calculan la
media y la desviación estándar muestrales, que son 501 y 112, respecti-
vamente. Calcular un intervalo de confianza del 99 % de la calificación
promedio de matemáticas.

Probabilidad
Dos muestras: estimación de la diferencia entre dos
medias

Si tenemos dos poblaciones con medias µ1 y µ2 , y varianzas σ12 y


σ22 , respectivamente, el estadı́stico que da un estimador puntual de la
diferencia entre µ1 y µ2 es X 1 − X 2 . Por lo tanto, para obtener una
estimación puntual de µ1 − µ2 , se seleccionan dos muestras aleatorias
independientes, una de cada población, de tamaños n1 y n2 , y se calcula
X 1 − X 2 , la diferencia de las medias muestrales.

Probabilidad
Intervalo de confianza para µ1 − µ2

Cuando se conocen σ12 y σ22


Si x1 y x2 son las medias de muestras aleatorias independientes de
tamaños n1 y n2 , de poblaciones que tienen varianzas conocidas σ12 y
σ22 , respectivamente, un intervalo de confianza del 100(1 − α) % para
µ1 − µ2 está dado por
s s
σ12 σ2 σ12 σ2
(x1 − x2 ) − zα/2 + 2 < µ1 − µ2 < (x1 − x2 ) + zα/2 + 2
n1 n2 n1 n2

donde zα/2 es el valor z que deja un área de α/2 a la derecha.

Si las varianzas no se conocen y las dos distribuciones implicadas son


aproximadamente normales, la distribución t resulta implicada como
en el caso de una sola muestra. Si no se supone normalidad, muestras
grandes (mayores que 30) permitirán usar s1 y s2 .

Probabilidad
Ejemplo

Se llevó a cabo un experimento donde se compararon dos tipos de mo-


tores tipo A y tipo B. Se midió el rendimiento de combustible en millas
por galón. Se realizaron 50 experimentos con el motor A y 75 con el
motor B. La gasolina utilizada y las demás condiciones se mantuvieron
constantes. El rendimiento promedio de gasolina para el motor A fue
de 36 millas por galón y el promedio para el motor B fue de 42 millas
por galón. Calcule un intervalo de confianza del 96 % sobre µA − µB ,
donde µA y µB corresponden a la media de la población del rendimiento
de millas por galón para los motores A y B, respectivamente. Suponga
que las desviaciones estándar de la poblacion son 6 y 8 para A y B
respectivamente.

Probabilidad
Varianzas desconocidas e iguales

Si x1 y x2 son las medias de muestras aleatorias independientes con ta-


maños n1 y n2 , respectivamente, tomadas de poblaciones aproximada-
mente normales con varianzas iguales pero desconocidas, un intervalo
de confianza del 100(1 − α) % para µ1 − µ2 está dado por
s s
1 1 1 1
(x1 − x2 ) − (tα/2 )Sp + < µ1 − µ2 < (x1 − x2 ) + (tα/2 )Sp +
n1 n2 n1 n2

donde Sp es la estimación agrupada de la desviación estándar de la


población y tα/2 es el valor t con v = n1 + n2 − 2 grados de libertad,
que deja un área de α/2 a la derecha.

(n1 − 1)S12 + (n2 − 1)S22


Sp2 =
n1 + n2 − 2

Probabilidad
Varianzas desconocidas e iguales

Ejemplo
En el artı́culo “Estructura comunitaria de los macroinvertebrados co-
mo un indicador de la contaminación de minas ácidas”, publicado en el
Journal of Environmental Pollution, se informa sobre una investigación
realizada para determinar la relación entre parámetros fı́sicoquı́micos
seleccionados y diversas mediciones de la estructura de la comunidad
de macroinvertebrados. Una faceta de la investigación consistió en eva-
luar la efectividad de un ı́ndice numérico de la diversidad de especies
para indicar la degradación del agua debida al desagüe ácido de una
mina. Conceptualmente, un ı́ndice elevado de la diversidad de especies
macroinvertebradas deberı́a indicar un sistema acuático no contamina-
do; mientras que un ı́ndice bajo de esta diversidad indicarı́a un sistema
acuático contaminado.

Probabilidad
Varianzas desconocidas e iguales

Ejemplo
Se eligieron 2 estaciones de muestreo independientes para este estudio:
una que se localiza corriente abajo del punto de descarga ácida de la
mina y la otra ubicada corriente arriba. Para 12 muestras mensuales
reunidas en la estación corriente abajo el ı́ndice de diversidad de espe-
cies tuvo un valor medio de x1 = 3,11 y una desviación estándar de
s1 = 0,771; mientras que 10 muestras reunidas mensualmente en la
estación corriente arriba tuvieron un valor medio del ı́ndice x2 = 2,04
y una desviación estándar de s2 = 0,448. Calcular un intervalo de con-
fianza del 90 % para la diferencia entre las medias de la población de
los dos sitios, suponiendo que las poblaciones se distribuyen de forma
aproximadamente normal y que tienen varianzas iguales.

Probabilidad
Varianzas desconocidas y diferentes

σ12 6= σ12 desconocidas


s s
s12 s22 s12 s2
(x1 − x2 ) − (tα/2 ) + < µ1 − µ2 < (x1 − x2 ) + (tα/2 ) + 2
n1 n2 n1 n2

donde tα/2 es el valor t con:

(s12 /n1 + s22 /n2 )2


v=
[(s12 /n1 )2 /(n1 − 1)] + [(s22 /n2 )2 /(n2 − 1)]

grados de libertad, que deja un área de α/2 a la derecha.

Probabilidad
Varianzas desconocidas y diferentes

Ejemplo
Se llevó a cabo un estudio para estimar la diferencia en la cantidad
de ortofosfato medido en dos estaciones diferentes del rı́o Cauca. El
ortofosfato se mide en miligramos por litro. Se reunieron 15 muestras
de la estación 1 y 12 muestras de la estación 2. Las 15 muestras de
la estación 1 tuvieron un contenido promedio de ortofosfato de 3.84
miligramos por litro y una desviación estándar de 3.07 miligramos por
litro; mientras que las 12 muestras de la estación 2 tuvieron un conte-
nido promedio de 1.49 miligramos por litro y una desviación estándar
de 0.80 miligramos por litro. Determinar un intervalo de confianza de
95 % para la diferencia en el contenido promedio verdadero de ortofos-
fato en estas dos estaciones. Suponga que las observaciones provienen
de poblaciones normales con varianzas diferentes.

Probabilidad
Observaciones pareadas

Consideremos el caso de estimación para la diferencia de dos medias


cuando las muestras no son independientes y las varianzas de las dos
poblaciones no son necesariamente iguales. La situación que se consi-
dera hace referncia a las observaciones pareadas.
En este caso cada unidad experimental homogénea recibe ambas con-
diciones de la población; como resultado, cada unidad experimental
tiene un par de observaciones, una para cada población. Por ejemplo,
si realizamos una prueba de una nueva dieta con 15 individuos, los pe-
sos antes y después de seguir la dieta conforman la información de las
dos muestras. Las dos poblaciones son antes y después y la unidad
experimental es el individuo.

Probabilidad
Observaciones pareadas

Intervalo de confianza
Si d y sd son la media y la desviación estándar, respectivamente, de
las diferencias distribuidas normalmente de n pares aleatorios de medi-
ciones, un intervalo de confianza del 100(1 − α) % para µD = µ1 − µ2
es
sd sd
d − tα/2 √ < µD < d + tα/2 √ < µD
n n
donde tα/2 es el valor t con v = n − 1 grados de libertad, que deja un
área de α/2 a la derecha.

Probabilidad
Observaciones pareadas

Ejemplo
Un estudio reporta los niveles de dioxina TCDD en 20 personas, quienes
posiblemente estuvieron expuestos a un agente quı́mico. En la siguiente
tabla se presentan los niveles de TCDD en sangre y tejido adiposo.
Calcular un intervalo de confianza del 95 % para µ1 − µ2 , donde µ1
y µ2 representan las medias de los niveles de TCDD en sangre y en
tejido adiposo, respectivamente. Suponga que la distribución de las
diferencias es casi normal.

Probabilidad
Observaciones pareadas

Ind. Sangre TA di Ind. Sangre TA di


1 2.5 4.9 -2.4 11 6.9 7.0 -0.1
2 3.1 5.9 -2.8 12 3.3 2.9 0.4
3 2.1 4.4 -2.3 13 4.6 4.6 0.0
4 3.5 6.9 -3.4 14 1.6 1.4 0.2
5 3.1 7.0 -3.9 15 7.2 7.7 -0.5
6 1.8 4.2 -2.4 16 1.8 1.1 0.7
7 6.0 10.0 -4.0 17 20 11 9.0
8 3.0 5.5 -2.5 18 2.0 2.5 -0.5
9 36 41 -5.0 19 2.5 2.3 0.2
10 4.7 4.4 0.3 20 4.1 2.5 1.6

Probabilidad
Estimación de una Proporción

Ejemplo
En una muestra aleatoria de n = 500 familias que tienen televisores en
la ciudad de Cali, se encuentra que x = 340 tiene suscripción con el
operador de cable A. Calcular un intervalo de confianza del 95 % para
la proporción real de familias que tienen televisores en esta ciudad y
están suscritas al operador A.

Probabilidad
Estimación de una Proporción

Si p̂ es la proporción de éxitos en una muestra aleatoria de tamaño n,


y q̂ = 1 − p̂, un intervalo de confianza aproximado del 100(1 − α) %
para el parámetro binomial p se obtiene por medio de
r r
p̂ q̂ p̂ q̂
p̂ − zα/2 < p < p̂ + zα/2
n n
x
donde p̂ = (x representa el número de éxitos en n ensayos) y zα/2
n
es el valor z que deja un área de α/2 a la derecha.

Probabilidad
Estimación de una Proporción

Teorema
Si p̂ se utiliza como un estimado de p, podemosptener un 100(1 − α) %
de confianza en que el error no excederá a zα/2 p̂ q̂/n.
Qué tan grande debe ser una muestra para poder estar seguros de que
el error al estimar p será menor que una cantidad especı́fica e?.
Por p medio del teorema anterior debemos elegir un n tal que
zα/2 p̂ q̂/n = e.

Probabilidad
Estimación de la diferencia entre dos proporciones

Consideremos el problema en el que se busca estimar la diferencia


entre dos parámetros binomiales p1 y p2 . Por ejemplo, p1 podrı́a ser la
proporción de fumadores con cáncer de pulmón y p2 la proporción de
no fumadores con cáncer de pulmón, y el problema consiste en estimar
la diferencia entre estas dos proporciones. Para esto, seleccionamos
muestras aleatorias independientes de tamaños n1 y n2 a partir de las
dos poblaciones binomiales con medias n1 p1 y n2 p2 , y varianzas n1 p1 q1
y n2 p2 q2 , respectivamente. Luego, determinamos los números x1 y x2
de personas con cáncer de pulmón en cada muestra, y formamos las
proporciones pˆ1 = x1 /n1 y pˆ2 = x2 /n2 .
El estadı́stico pˆ1 − pˆ2 provee un estimador puntual de la diferencia
entre las dos proporciones, p1 − p2 .

Probabilidad
Estimación de la diferencia entre dos proporciones

Definición
Si pˆ1 y pˆ2 son las proporciones de éxitos en muestras aleatorias de
tamaños n1 y n2 , respectivamente, un intervalo de confianza aproxi-
mado del 100(1−α) % para la diferencia de dos parámetros binomiales
p1 − p2 es:
s s
pˆ1 qˆ1 pˆ2 qˆ2 pˆ1 qˆ1 pˆ2 qˆ2
(pˆ1 − pˆ2 ) − zα/2 + < p1 − p2 < (pˆ1 − pˆ2 ) + zα/2 +
n1 n2 n1 n2

donde zα/2 es el valor z que deja un área de α/2 a la derecha.

Probabilidad
Estimación de la Varianza

Definición
Si s 2 es la varianza de una muestra aleatoria de tamaño n de una
población normal, un intervalo de confianza del 100(1 − α) % para σ 2
es:
(n − 1)s 2 2 (n − 1)s 2
< σ <
χ2α/2 χ21−α/2
donde χ2α/2 y χ21−α/2 son valores χ2 con v = n − 1 grados de libertad,
que dejan áreas de α/2 y 1 − α/2, respectivamente, a la derecha.

Probabilidad
Intervalos de confianza

Error estándar
σ
σx = √ Población infinita
rn
N −n σ
σx = √ Población finita
N −1 n

Probabilidad

También podría gustarte