Está en la página 1de 42

ANÁLISIS DE DATOS II

DISTRIBUCIONES MUESTRALES

KEYLA VANESSA ALBA MOLINA


ESP. EN ESTADÍSTICA APLICADA
BARRANQUILLA-ATLÁNTICO
Distribución muestral.

La distribución de un estadístico muestral recibe


el nombre de distribución muestral, o
distribución en el muestreo y se defíne como la
distribución de Probabilidades de los Valores
que puede tomar el estadístico a lo largo de
todas las posibles muestras con el mismo
numero de observaciones que pueden ser
extraídas de la población.
DISTRIBUCIONES DE PROBABILIDAD

• Las distribuciones mas conocidas son:


1. Distribución T-student
2. Distribución Normal
3. Distribución CHI-cuadrado
4. Distribución F- Fisher
Distribución T-student.
•• Es
  un modelo teórico utilizado
para aproximar o estimar:

• Media
• Diferencia de Medias

• En una población normalmente


distribuida cuando el tamaño de
la muestra es pequeño y se
desconoce la desviación típica.
Su variable aleatoria es:
t=
Distribución Normal
• La distribución Normal o
distribución de Gauss es un
modelo teórico capaz de estimar:
• Media
• Diferencia de Medias
• Proporción Muestral
• Diferencia de Proporciones
En una población continua con mas
frecuencia en la teoría de
probabilidades.
su variable Principal de estudio es:
Z = (X−µ)/ σ
DISTRIBUCIÓN CHI-CUADRADO
• La distribución de Pearson o JI-
cuadrado es una distribución
de probabilidad continua ,muy
útil para estimar:
• La Varianza Muestral.
con un parámetro que
representa los grados de libertad
de la variable aleatoria:

donde son variables normales


independientes de madia cero y
varianza uno.
Distribución F- FISHER
• La distribución F-Fisher es
una distribución de
probabilidad continua de
muestreo de la relación de
dos variables aleatorias
independientes fue
funcional para:
• Comparar varianzas entre
dos poblaciones.
Su variable aleatoria es:
DISTRIBUCIONES MUESTRALES
• Las distribuciones mas comunes son las siguientes:

1. Distribución de la media muestral


2. Distribución de la diferencias de medias
3. Distribución de la media y diferencias de medias de
las proporciones
4. Distribución de varianzas muestral chi y la razón de
varianzas F.
1.DISTRIBUCION MUESTRAL DE LA MEDIA
MUESTRAL
DISTRIBUCION DE LA MEDIA MUESTRAL
1.1 CASO PARA MUESTRAS GRANDES
 
Ejemplo
Supongamos que el incremento porcentual de los salarios de los funcionarios de todas las
corporaciones medianas se distribuye siguiendo una normal con media 12,2% y desviación
típica 3,6%. Se toma una muestra aleatoria de nueve observaciones de esta población de
incrementos porcentuales de salario. ¿Cuál es la probabilidad de que la media muestral sea
mayor del 10%?.
Solución:
Tenemos que µ = 12,2, σ = 3,6 y n = 9.
Nos piden calcular P(X > 10). Como no conocemos el tamaño de la población, supondremos
que esta es infinita. Entonces, por el teorema, la media y el error estándar de la distribución
muestral de X son:
= µ = 12,2 y = σ /= 3,6/= 1,2.

Y la variable aleatoria a trabajar es


Z = (X−µ)/ σ

Z= (10−12,2) /1,2 = −1,83

P(Z > -1,83)= 0,9664 con un 97%


Concluimos, entonces, que la probabilidad de que la media muestral sea mayor que un 10% es
aproximadamente del 97%.
YA SE ENCUENTRA RESUELTO
Un fabricante declara que la duración de las bujías que él fabrica sigue una distribución normal
con una media de 36.000 kilómetros y una desviación estándar de 4.000 kilómetros. Para una
muestra aleatoria de dieciséis bujías, se obtuvo una duración media de 34.500 kilómetros. Si la
afirmación del fabricante es correcta, ¿cuál es la probabilidad de obtener una media muestral
tan pequeña como esta o menor?
1.2 CASO PARA MUESTRAS PEQUEÑAS
  Ejemplo
Suponga que de una población normal con media 20 se toma una muestra de tamaño 16. Si la
desviación estándar muestral es 4, encuentre la probabilidad de que la media muestral sea
estrictamente mayor que 21,753.

Solución:
Tenemos que µ = 20, s = 4 y n = 16.
Debido a que la población es normal con σ desconocida y a que n < 30, entonces, aplicaremos
el teorema. Es decir,
la distribución muestral de la media muestral es la t de Student con v= n−1 = 15 grados de
libertad.
Entonces: = µ = 20 y = s / =4 = 1.
Con esto, encontramos el valor de t para 21,753. Teniendo en cuenta que:

t=

t = (X −)/ = 21,753−20 /1 = 1,753 entonces en la tabla este valor de t corresponde a una


probabilidad de 0,05 es decir 5%
  Ejemplo:
Los tiempos requeridos para que unos trabajadores terminen cierta labor, se
distribuyen normalmente con media de 30 minutos y una desviación estándar de 9
minutos. Si de la planta de trabajadores se toma una muestra aleatoria de 25,
encuentre la probabilidad de que la media del tiempo requerido para concluir la tarea
en la muestra, esté entre 28 y 33 minutos.

Solución:
En este ejemplo
µ = 30, σ=9 y n = 25.

Nos piden calcular P(28 < X < 33).


Como no conocemos el tamaño de la población, supondremos que esta es infinita.
Entonces, por el teorema, la media y el error estándar de la distribución muestral de X
son:
= µ = 30 y = σ /= 9 / = 1,8
  consiguiente, la probabilidad requerida es:
Por
Z1= (28−)/ = (28−30) / 1,8 = −1,11.

Z2= (33−) / = (33−30) / 1,8= 1,67

P (Z ≥ −1,11) - P(Z ≥ 1,67)

0,8665 – 0,0475 = 0,819 ~ 0,82= 82%


Existe una probabilidad del 82% de que la media de la muestra de los 25 trabajadores
este entre 28-33
  Propuesto #3
Una muestra aleatoria de seis autos de un determinado modelo consumen las siguientes
cantidades en kilómetros por litro:
18,6 18,4 19,2 20,8 19,4 20,5. Determine la probabilidad de que el consumo de gasolina medio
muestral de los automóviles de este modelo sea menor que 17,6 kilómetros por litro,
suponiendo que la distribución de la población es normal con media 17.

DATOS
= 17,6 para estimar
= 19,48 la media de la muestra de los 6 autos
n= 6 v=n-1=5 u= 17 == 0,96
s=√0,96= 0,98

t = == 1,5 en la aplicación o tabla es una probabilidad de 0,0969 en porcentaje es 9,6%


Con un 9,6% se puede decir que el consumo medio de la muestra de los seis autos es menor
que 17,6 km por cada litro
2.DISTRIBUCION MUESTRAL DE LAS DIFERENCIAS DE
MEDIAS
MUESTRAS PAREADAS O DEPENDIENTES
EJEMPLO
•  
La tabla de abajo recoge los datos de consumo de gasolina correspondiente a una
muestra aleatoria de 8 automóviles norteamericanos de dos modelos diferentes. Se
formaron pares con las dos muestras y cada elemento de un determinado par fue
conducido por la misma ruta y por el mismo piloto.

Diferencias -0,2 1,3 2,2 0,1 1,2 0,9 -0,5 1,2


• (a) Determine la media y la desviación muestral de las diferencias en el consumo
de gasolina.
== 0,775 la media de las diferencias en el consumo de gasolina de los autos A y B

= = = 0,816 varianza del consumo promedio de aut


=√0,816=0,903 la desviación esta marcada en un 0,903 es decir en un 90% de
dispersión o diferencias en los consumos de los autos .
MUESTRAS INDEPENDIENTES
•  
Consideremos dos poblaciones con medias , y varianzas y respectivamente, y
supongmos que se seleccionan dos muestra aleatorias independientes de tamaños , ,
con medias , y varianzas y, respectivamente. El objetivo también es determinar la
distribución muestral de −. Para ello distinguiremos los siguientes casos:
• Primer caso: varianzas poblacionales conocidas o desconocidas y muestras
grandes.
Si las dos poblaciones son normales, entonces, − también es normal. Por tanto, la
variable aleatoria,
Z = ,tiene una distribuci´on normal estándar.
EJEMPLO
• Suponga que dos drogas A y B de las que se dice que reducen el tiempo de
respuesta de las ratas a determinado estimulo, se están comparando en un
experimento de laboratorio. El experimentador sabe que en las respectivas
poblaciones los tiempos de respuestas al estimulo están distribuidos normalmente.
Se administra que la droga A a 30 ratas y B a 40 ratas. Cuando se lleva a cabo el
experimento de reducción de promedio de tiempo de respuesta al estimulo por
parte de las ratas que están recibiendo la droga A es 30,45 con una desviación
típica de 5 milisegundos. Los datos correspondientes a las droga B son 24,9 y 6
milisegundos ¿Cuál es la probabilidad de que la diferencia entre la reducción
promedio de respuesta al estimulo por parte de las ratas que están recibiendo la
droga A y de las ratas que están recibiendo la droga B sea menor o igual a la
observada en el experimento?
• Suponga que no hay diferencia alguna entre las dos drogas con respecto a la
reducción promedio en tiempos de respuestas y que las drogas son igualmente
efectivas, además suponga que las poblaciones tienen distribución con varianzas
iguales desconocidas.
Solución

• 1= Drogas A
 2= Drogas B

• n1=30 1= 30,45 S1= 5
• n2=40 = 24,9 S2= 6

• Z = = = = 4,21
• P( 5,55)= P(z ≤ 4,21)= 0,99 en probabilidad seria daría un porcentaje de
0,99 es decir con un 99% esta diferencia de las medias muestrales en el
tiempo de respuesta del efecto de las drogas va a tender a cero o se va a
igualar a la del experimento poblacional.
 
Segundo caso: varianzas poblacionales desconocidas, iguales y
muestras pequeñas.

Considere el caso en que se desconocen y , pero iguales, digamos, Entonces, la variable


aleatoria tiene − media y varianza:

+ , Además, se puede probar que si las dos poblaciones son normales, entonces, −
también es normal. Por tanto, la variable aleatoria-

t =

= ; varianza muestral combinada.


EJEMPLO

•  
Tomando de referencia el ejemplo anterior, que las poblaciones tienen distribución normal y que los tamaños muestrales
son menores que 30, nA=12 y nB=13 y que las varianzas poblacionales son desconocidas pero iguales.

• t = = 30,7
• n1=12 1= 30,45 S1=5
• n2=13 = 24,9 S2=6
= = 30,7
t = = = 2,51
P( 5,55)= P(t ≤ 2,51)= 0,00978 es decir que la probabilidad de que la
diferencia entre el tiempo de reducción promedio de las drogas A y B sea
menor o igual a la que se observo en el experimento es de 0,978 es decir un
0,1%
Tercer caso: varianzas poblacionales desconocidas, diferentes y muestras
pequeñas.
Ejemplo

•  
Tomando de referencia el problema de las drogas pero ahora suponiendo que las poblaciones son normales y que tienen
tamaños muestrales menores que 30 y na=12 y nB= 13 y que las varianzas poblacionales son diferentes.

• n1=12 1= 30,45 S1=5


• n2=13 = 24,9 S2=6
• t = = = = 2,52
• V= = V= = 22,78 ~ 23 grados de libertad
• P( 5,55)= P(t ≤ 2,52)= 0,00956 es decir que la probabilidad de que la
diferencia entre el tiempo de reducción promedio de las drogas A y B sea
menor o igual a la que se observo en el experimento es de 0,95 es decir un
0,95 %
3. DISTRIBUCION MUESTRAL DE LA PROPORCIÓN Y LA
DIFERENCIA DE PROPORCIONES MUESTRALES
La media y varianza de proporciones
muestrales
Sea X el número de éxitos en una muestra binomial de n observaciones, donde la
probabilidad de éxito es p. Entonces, la proporción de éxitos en la muestra p= X/ n
recibe el nombre de proporción muestral.
  Ejemplo
Se toma una muestra de 250 casas de una población de edificios antiguos para estimar la
proporción de casas de este tipo cuya instalación eléctrica resulta insegura. Supongamos que,
de hecho, el 30% de todos los edificios de esta población tienen una instalación insegura. Hallar
la probabilidad de que la proporción de edificios de la muestra con instalación insegura esté
entre 0,25 y 0,35.

Solución
Tenemos que p= 0,30 y n = 250 = 0,25 y 0,35. Por consiguiente, tenemos que:
= = = 0,029

Z= = = -1,72

Z= = = 1,72

P(0,25 < < 0,35) = = P( -1,72 < Z < 1,72 ) = P(Z <-1,72 ) − P(Z < 1,72 ).
=0,9573 – 0,0427 = 0,9146 con un 91,4% de probabilidad, esta muestra de las 250 casas tienen
un porcentaje de tener instalación insegura entre 25% y 35%.
  Ejemplo ( Propuesto)
Se desea estudiar una muestra de 20 personas para saber la proporción de ellas que tienen
más de 40 años. Sabiendo que la proporción en la población es del 40%, ¿cuál es la
probabilidad de que la proporción en la muestra sea menor del 50%?

= = = 0,1095

Z= = = 0,913

P(Z > 0,5 )= P(Z > 0,913 ) = 0,819 Es decir con una porcentaje del 91,13%, la proporción de personas
mayores a 40 años en la muestra de 20 personas es menor a 50%
Diferencia de medias de dos proporciones
  EJEMPLO
Los hombres y mujeres adultos radicados en una ciudad grande del norte de cierto país difieren en sus opiniones sobre la
promulgación de la pena de muerte para personas culpables de asesinato. Se cree que el 12% de los hombres adultos están
a favor de la pena de muerte, mientras que sólo el 10% de las mujeres adultas lo están. Si se pregunta a dos muestras
aleatorias, una de 150 hombres y otra de 100 mujeres, su opinión sobre la promulgación de la pena de muerte para
personas culpables de asesinato, determine la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor
que el de mujeres.
P1= hombres
P2= mujeres
= 0,03
− = 0,12 -0,10= 0,02

z = = = 0,25

= = = 0,04
P()= P(Z ≥ 0,25)= 0,4013

Con una probabilidad del 40,13% el porcentaje de los hombre a favor de la pena de muerte de
muerte respecto al de las mujeres en las muestras tomadas difieren o esta por encima del 3%.
4. DISTRIBUCION MUESTRAL DE LA VARIANZA Y DE LA RAZON
DE VARIANZAS MUESTRALES
4.1 DISTRIBUCIÓN MUESTRAL DE LA VARIANZA
  EJEMPLO
Cuando un proceso de producción esta funcionando correctamente, la resistencia en ohmios
de los componentes que produce, sigue una distribución normal con desviación típica 3,6. si
toma una muestra aleatoria de 4 componentes ¿Cuál es la probabilidad de que la varianza
muestral sea mayor 27?

= = = 6,25

P()= P() = 0,10


La probabilidad de que la varianza muestral sea mayor a 27 es de Aprox 10 %
4.2 DISTRIBUCION MUESTRAL DE LA RAZON DE
DOS VARIANZAS.
  EJEMPLO:
En una prueba sobre la efectividad de dos tipos de píldoras para dormir A y B, la píldora A un
grupo de tamaños 61 y el otro grupo B, de tamaño 41 , se le administrara la píldora B,
registrándose el numero de horas de sueño de cada individuo participante en el estudio.
Suponiendo que el numero de horas de sueño de quienes usan cada tipo de píldoras se
distribuye normalmente y que las varianzas P son iguales, calcule la probabilidad de que la razón
de las varianzas muestrales de A y B SEA MAYOR QUE 1,64.

P( > 1,64) = P(F (60,40) > 1,64) = 0,049

La probabilidad de que la razón de las varianzas muestrales A y B sean mayores que 1,64 es de
0,05 es decir un 5%