Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística
Sesión 4
Introducción a la Inferencia
estadística
Universidad Javeriana
Inferencia Estadística
Inferencia Estadística
Inferencia Estadística
Obtener conclusiones acerca de características de poblaciones a partir de
datos muestrales
Población Muestra
Censo Muestreo
Inferencia Estadística
Inferencia Estadística
Población Muestra
Características
• Media
• Mediana
• Moda
• Otras
Parámetros Estadística
(letras mayúsculas/griegas) (letras minúsculas/latinas)
Inferencia Estadística
Inferencia Estadística
Población
? Parámetro
•
•
•
•
Media
Varianza
Proporción
Otra
?
Muestra
Muestreo aleatorio simple
Cada elemento de la población Estadística
tiene la misma oportunidad de
incluirse en la muestra y cada
Función
muestra tiene igual probabilidad
de ser seleccionada
Estadístico
Inferencia Estadística
Distribución de muestreo
Una distribución de muestreo corresponde a la distribución de la estadística
de interés de la muestra, es decir, a las distribución de probabilidad de todas
las estadísticas posibles dadas cada una de las muestras
Inferencia Estadística
Distribución de muestreo
Una distribución de muestreo corresponde a la distribución de la estadística
de interés de la muestra, es decir, a las distribución de probabilidad de todas
las estadísticas posibles
Muestra 1 (
Muestra 2 (
Muestra 3 (
Población Distribución de muestreo
(μ , σ) Muestra 4 ( (
.
.
. Error estándar de la estadística
Muestra n (
Inferencia Estadística
Distribución de muestreo
Inferencia Estadística
Distribución de muestreo
Ejemplos
Inferencia Estadística
Distribución de muestreo de la
Población normalmente distribuida
media
Propiedades
Inferencia Estadística
Distribución de muestreo de la
media
¿ Población NO normal ?
Inferencia Estadística
Teorema de Límite Central
La distribución de muestreo de la media se aproxima a la normal al incrementar el
tamaño de la muestra
Formalmente:
Sean X1, X2, …, Xn, una secuencia de n variables aleatorias independientes e idénticamente
distribuidas (i.i.d.), con media y varianza finita. Entonces el promedio muestral tiene una
distribución de probabilidad con media y varianza:
Inferencia Estadística
Teorema de Límite Central (TLC)
Sean una colección de n variables aleatorias INDEPENDIENTES e IDENTICAMENTE DISTRIBUIDAS (iid), con
y.
Inferencia Estadística
Propiedades
Inferencia Estadística
Ejemplo
Inferencia Estadística
Ejemplo
T.L.C
Inferencia Estadística
Ejemplo
Datos históricos muestran que un viaje en autobús desde el campus de una universidad hasta el campus
de otra toma, en promedio, 28 minutos, con una varianza de 25. En cierto mes un autobús realizó 40
viajes. Calcule la probabilidad de que el tiempo de todos los recorridos del mes haya sido mayor a 1150
minutos.
𝑃 (∑ 𝑋𝑖>1150 )= 1−P (∑ 𝑋𝑖<1150)=1−𝑃 ( 𝑍<0,95 ) =1−0,8289=0,1711
Inferencia Estadística
Ejemplo
Inferencia Estadística
Ejemplo
En una compañía, el salario de los empleados se distribuye de manera desconocida con media de
439.000 y desviación de 25.500. Si se toma una muestra de 49 empleados, calcule el valor del salario
promedio de la muestra si se sabe que éste corresponde al 13,57% inferior.
1,1= ´𝑥 − 𝜇 ´𝑥 − 439.000
− = ´𝑥 = 434.993
𝜎 25.500
√𝑛 √ 49
Inferencia Estadística
Distribución de muestreo de la
Estadístico
varianza (
Inferencia Estadística
Distribución de muestreo de la
varianza (
es la varianza de una muestra de tamaño n obtenida a partir de una población con
Si
función de probabilidad normal y varianza finita , entonces la variable
Tiene una función de probabilidad (distribución) ji cuadrado, con n-1 grados de libertad*
Distribución Chi-cuadrado
varianza (
Inferencia Estadística
Distribución de muestreo de la
Inferencia Estadística
Ejercicio
Calcular las probabilidades asociadas a las distribuciones muestrales que se indican a continuación:
• Hallar el percentil del 90% para una distribución Chi-cuadrado de 15 gl.
• Hallar el percentil del 10% para una distribución Chi-cuadrado de 15 gl.
• Hallar la probabilidad para una distribución Chi-cuadrado de 18 gl. cuando toma el valor de 28,869
• Hallar los grados de libertad para una distribución Chi-cuadrado cuando toma el valor de 19,337 y una
probabilidad de 0,5.
• Hallar la probabilidad para una distribución Chi-cuadrado de 35 gl. cuando toma el valor de 53,1605.
Inferencia Estadística
Ejemplo
Inferencia Estadística
Ejemplo
Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una población normal con
varianza 6 tenga una varianza muestral mayor que 9,1
Inferencia Estadística
Ejemplo
Suponga que los tiempos requeridos por una ruta de bus de servicio público para realizar su recorrido forman
una distribución normal con desviación estándar de 2. Para 17 observaciones de la ruta encuentre el valor de
la varianza muestral cuya probabilidad abarque el 95 %.
26.296
2
𝑃 ( 𝜒 (17 −1 )< 𝑥 ) =0,95 x=26,296
2
26,296 = 𝑠 ( 16 ) 𝑠 2=6,574
4
Inferencia Estadística
Distribución de muestreo de la
Con Varianza poblacional desconocida media
Variable T de Student:
Variable T de Student:
Inferencia Estadística
Distribución de muestreo de la
Con Varianza poblacional desconocida media
Variable T de Student:
Inferencia Estadística
Distribución de muestreo de la
Distribución t media
Inferencia Estadística
Distribución de muestreo de la
Distribución t media
Inferencia Estadística
Ejercicio
Calcular las probabilidades asociadas a las distribuciones muestrales que se indican a continuación:
• Hallar el percentil del 95% para una distribución t de 30 gl.
• Hallar el percentil del 95% para una distribución t de 120 gl.
• Hallar la probabilidad de una distribución t de 150 gl cuando toma el valor de 1,655
• Hallar el percentil del 95% para una distribución Normal Estándar.
• Hallar los grados de libertad de una distribución t cuando toma el valor de 0,695 y una probabilidad de
0,75
Inferencia Estadística
Ejercicio
Una prueba sicotécnica para la selección de personal de una empresa tiene una calificación promedio
histórico de 60,1 puntos. Calcule la probabilidad de que en cierto proceso realizado a 25 personas, el
promedio de la prueba haya sido superior a 61,8 puntos si se sabe que la desviación estándar de dicho
proceso fue de 5,84.
= 0,08
Inferencia Estadística
Ejercicio
Inferencia Estadística
Ejercicio
Inferencia Estadística
Resumen
Distribuciones para la media
Inferencia Estadística
Ejercicio
Inferencia Estadística
Ejercicio
µ = 80 Si
aumenta $10.000
σ=6 Si descuento de $9.000
n = 41
Aumento del servicio:
Si S compra de regulador
Inferencia Estadística
Ejercicio
Inferencia Estadística
Ejercicio
Un proceso de control de calidad en la producción de cierto tipo de tuerca se basa en los resultados de
una inspección por muestreo de un lote. Se seleccionan 18 tuercas al azar y se les mide su diámetro
interno. Si la desviación estándar de dichos diámetros es superior a 5 mm, se rechaza el lote y debe ser
reprocesado; en caso contrario, el lote se acepta. Si el lote se reprocesa, la ganancia unitaria pro tuerca se
reduce a $1; si el lote no se reprocesa, la ganancia es de $40. Suponga que la función de probabilidad del
diámetro de las tuercas es normal y que la varianza poblacional es de 11,899. Calcule la probabilidad de
reprocesar el lote y el valor esperado de la ganancia por tuerca.
Reprocesar lote:
Inferencia Estadística
Ejercicio
En la bolsa de valores se afirma que el crecimiento promedio de ciertas acciones es de $100 COP,
distribuidos normalmente. Un comisionista de bolsa selecciona aleatoriamente los resultados de 15 días,
en el último semestre y obtiene una desviación estándar de crecimiento de $90 COP. A él se le pagan
comisiones quincenalmente. Si durante esos quince días las acciones subieron menos de $50, en
promedio, se le pagarán $5 por acción; si aumentan entre $50 y $120, se le pagará $7 por acción; si
aumentan más de $120 se le pagará $8 por acción. ¿Cuál es el valor de comisión esperado por acción?
Menor de $50:
61
Inferencia Estadística
Distribución de muestreo de la
proporción
Supuestos:
• Distribución Binomial o Bernoulli
• Tamaño de muestra muy grande
Por lo tanto, la variable que representa la proporción poblacional va a estar dada por:
Inferencia Estadística
Distribución de muestreo de la
proporción
Inferencia Estadística
Distribución de muestreo de la
proporción
Se sabe que el 10 % de los habitantes de una pequeña ciudad va frecuentemente a teatro. Si se toma una
muestra al azar de 100 habitantes, ¿cuál es la probabilidad de que al menos el 13 % de ellos vaya
regularmente a teatro?
Inferencia Estadística
Distribución de muestreo de la
diferenciaParade medias
poblaciones independientesmuestrales
Inferencia Estadística
Distribución de muestreo de la
diferencia de medias muestrales
• Variables aleatorias X y Y normales o y varianzas poblacionales desconocidas (y diferentes)
Inferencia Estadística
Ejemplo
gerente de una refinería piensa modificar el proceso de producir gasolina a partir de petróleo
El
crudo, pero hará tal cambio sólo si la gasolina promedio que se obtiene por este nuevo proceso
aumenta su valor respecto del proceso actual. Con base en un experimento de laboratorio y mediante
el empleo de dos muestras aleatorias de tamaño 12, una para cada proceso, la cantidad de gasolina
promedio del proceso actual es de 24,6 con una desviación estándar de 2,3, y para el nuevo proceso
fue de 28,2 con una desviación de 2,7. El gerente piensa que los resultados proporcionados son
variables aleatorias independientes normalmente distribuidas, con varianzas iguales. Con base en la
evidencia, ¿debe adoptarse el nuevo proceso?
(𝑋
´ −𝑌
´ ) − ( 𝜇 𝑋 − 𝜇𝑌 ) ( 28,2 − 24,6 ) − ( 0 )
𝑃
( 𝑆𝑝
√ 1
𝑛𝑋
+
1
𝑛𝑌
>
2,508
√ 1
12
+
1
12 )= 𝑃 ( 𝑡 (12+12 − 2 ) >3,516 )= 1 − 𝑃 ¿
Inferencia Estadística
Ejemplo
Inferencia Estadística
Distribución de muestreo de la
diferenciaPara
de medias
poblaciones dependientesmuestrales
Inferencia Estadística
Ejemplo
Inferencia Estadística
Ejemplo
Inferencia Estadística
Ejemplo
Inferencia Estadística
Ejemplo
Inferencia Estadística
Distribución de muestreo de la
diferencia deindependientes
Para poblaciones proporciones
Comparación entre proporciones
Inferencia Estadística
Distribución de muestreo de la
razón de varianzas
Comparación de varianzas
• Asimétrica positiva
• Parámetros: v1 y v2, grados de libertad del numerador y del denomimador
Inferencia Estadística
Distribución de muestreo de la
Sean
razón de varianzas
dos variables aleatorias independientes y . La variable aleatoria .
Propiedad 4: Si entonces:
Inferencia Estadística
Distribución de muestreo de la
razón de varianzas
hacer un cociente entre variables X y Y, independientes, con distribución chi-cuadrado, divididas
Al
entre sus grados de libertad, se obtiene la variable F que relaciona las varianzas de las variables:
Inferencia Estadística
Distribución de muestreo de la
razón
𝑃 (𝑉 ≤de𝑣 varianzas
) =0.95
Inferencia Estadística
Distribución de muestreo de la
razón
𝑃 ( 𝑉 ≤de varianzas
𝑣 ) =0.975
Inferencia Estadística
Ejercicio
Calcular las probabilidades asociadas a las distribuciones muestrales que se indican a continuación:
• Hallar la probabilidad asociada a una función F con 13 y 20 grados de libertad para un valor de la variable
aleatoria menor o igual a 3,18
• Hallar el valor de la variable aleatoria F cuya probabilidad es del 95 %, v1= 17, v2=10
Inferencia Estadística
Ejercicio
Calcular las probabilidades asociadas a las distribuciones muestrales que se indican a continuación:
• Hallar el valor de la variable aleatoria F cuya probabilidad es del 95 %, v1= 7, v2=15
• Hallar el valor de la variable aleatoria F cuya probabilidad es del 95 %, v1= 15, v2=7
Inferencia Estadística
Ejercicio
Inferencia Estadística
Ejercicio
Inferencia Estadística
Ejercicio
Otro conjunto de cables conductores que forman un dispositivo se encapsuló y se probó para determinar si
el encapsulado aumentaba la resistencia a la tracción. Las pruebas dieron los siguientes resultados:
Cuál es la probabilidad de que la varianza en la resistencia de todo el lote de los cables con el dispositivo
encapsulado sea el doble de la varianza de los cables sin encapsular.
Inferencia Estadística
Ejercicio
Inferencia Estadística
Ejercicio
Si el resultado muestral indica que la duración promedio muestral del producto excede en 2,8 o menos días
a la duración promedio muestral del no refrigerado, la investigación concluirá que no vale la pena refrigerar
el producto. ¿Cuál es la probabilidad de que ello suceda?
Tras realizar el experimento, se obtuvo una desviación estándar de 2,3 días para el producto refrigerado y
0,685 para el no refrigerado. Suponiendo normalidad en las variables de duración del producto, indique si
usted rechazaría o no la suposición de que la desviación del producto refrigerado es 2,5 veces la desviación
del producto no refrigerado.
Inferencia Estadística
Ejercicio
Dos compañías A y B fabrican bombillas. La duración para A tiene una desviación de 40 horas mientras que
la duración de B tiene una desviación de 50 horas. Una muestra de 8 bombillas se toma de la fabrica A y 16
bombillas se toma de la fábrica B. Determine la probabilidad de que la varianza de la primera muestra sea
mayor que
a. Dos veces la de la segunda
b. 1,2 veces la de la segunda
c. Repita a. para desviaciones estándar de 40 horas para las dos fábricas
d. Repita a. para desviaciones estándar de 50 horas para ambas fábricas
a. < 0,01.
b. >0,01
c. <0,01
d. <0,01
Inferencia Estadística
Resumen
Distribuciones para la media
Inferencia Estadística
Resumen
Distribuciones para la diferencia de medias
Pero iguales
Inferencia Estadística
Resumen
Distribuciones para la proporción
Inferencia Estadística
Resumen
Distribuciones para la razón entre varianzas
Inferencia Estadística