Está en la página 1de 73

Inferencia

Estadística

Sesión 4
Introducción a la Inferencia
estadística
Universidad Javeriana
Inferencia Estadística

Obtener conclusiones acerca de características de poblaciones a partir de


datos muestrales

Inferencia Estadística
Inferencia Estadística
Obtener conclusiones acerca de características de poblaciones a partir de
datos muestrales

Población   Muestra

Conjunto de TODOS los Conceptualmente: una muestra aleatoria de


tamaño n de una población es un subconjunto de n
elementos escogidos para el elementos de la población seleccionados de
estudio del cual se quieren acuerdo con un procedimiento aleatorio que
estudiar todas las propiedades garantice su representatividad.
características
Formalmente: Una muestra aleatoria de una
población , consiste en un conjunto n de n Variables
Aleatorias independientes que tienen la misma
distribución que la VA X.

Censo Muestreo

Inferencia Estadística
Inferencia Estadística

Población Muestra

Características
• Media
• Mediana
• Moda
• Otras

Parámetros Estadística
(letras mayúsculas/griegas) (letras minúsculas/latinas)

Inferencia Estadística
Inferencia Estadística
Población
? Parámetro




Media
Varianza
Proporción
Otra
?
Muestra
Muestreo aleatorio simple
Cada elemento de la población Estadística
tiene la misma oportunidad de
incluirse en la muestra y cada
Función
muestra tiene igual probabilidad
de ser seleccionada
Estadístico

Inferencia Estadística
Distribución de muestreo
Una distribución de muestreo corresponde a la distribución de la estadística
de interés de la muestra, es decir, a las distribución de probabilidad de todas
las estadísticas posibles dadas cada una de las muestras

Inferencia Estadística
Distribución de muestreo
Una distribución de muestreo corresponde a la distribución de la estadística
de interés de la muestra, es decir, a las distribución de probabilidad de todas
las estadísticas posibles

  Muestra 1 (

  Muestra 2 (

  Muestra 3 (
Población  Distribución de muestreo
(μ , σ)   Muestra 4 ( (

.
.
. Error estándar de la estadística

  Muestra n (

Inferencia Estadística
Distribución de muestreo

Distribución de la población Distribución de Distribución de


frecuencias de la muestra muestreo de la media

Inferencia Estadística
Distribución de muestreo
Ejemplos

Inferencia Estadística
Distribución de muestreo de la
Población normalmente distribuida
media

Propiedades

Inferencia Estadística
Distribución de muestreo de la
media

¿ Población NO normal ?

Inferencia Estadística
Teorema de Límite Central
 La distribución de muestreo de la media se aproxima a la normal al incrementar el
tamaño de la muestra

Formalmente:

Sean X1, X2, …, Xn, una secuencia de n variables aleatorias independientes e idénticamente
distribuidas (i.i.d.), con media y varianza finita. Entonces el promedio muestral tiene una
distribución de probabilidad con media y varianza:

Y dicha distribución tiene una distribución normal conforme n tiende a infinito.

Inferencia Estadística
Teorema de Límite Central (TLC)

 Sean una colección de n variables aleatorias INDEPENDIENTES e IDENTICAMENTE DISTRIBUIDAS (iid), con
y.

Entonces, para n suficientemente grande, (), se tiene que:

Inferencia Estadística
Propiedades
 

Inferencia Estadística
Ejemplo

Inferencia Estadística
Ejemplo

T.L.C

Inferencia Estadística
Ejemplo

Datos históricos muestran que un viaje en autobús desde el campus de una universidad hasta el campus
de otra toma, en promedio, 28 minutos, con una varianza de 25. En cierto mes un autobús realizó 40
viajes. Calcule la probabilidad de que el tiempo de todos los recorridos del mes haya sido mayor a 1150
minutos.

 
𝑃 (∑ 𝑋𝑖>1150 )= 1−P (∑ 𝑋𝑖<1150)=1−𝑃 ( 𝑍<0,95 ) =1−0,8289=0,1711

Inferencia Estadística
Ejemplo

Inferencia Estadística
Ejemplo

En una compañía, el salario de los empleados se distribuye de manera desconocida con media de
439.000 y desviación de 25.500. Si se toma una muestra de 49 empleados, calcule el valor del salario
promedio de la muestra si se sabe que éste corresponde al 13,57% inferior.

 𝑃 ( 𝑍 < 𝑧 ) =0,1357 𝑧=− 1,1

  1,1= ´𝑥 − 𝜇 ´𝑥 − 439.000
− = ´𝑥 = 434.993
𝜎 25.500
√𝑛 √ 49

Inferencia Estadística
Distribución de muestreo de la
 

 
Estadístico
varianza (

Supuesto: Muestra obtenida de una población normal con media y varianza

Inferencia Estadística
Distribución de muestreo de la
 

varianza (
  es la varianza de una muestra de tamaño n obtenida a partir de una población con
Si
función de probabilidad normal y varianza finita , entonces la variable

Tiene una función de probabilidad (distribución) ji cuadrado, con n-1 grados de libertad*

*Ver demostración en Alvarado, Obagi (2008)


Inferencia Estadística
Distribución de muestreo de la
 

Distribución Chi-cuadrado
varianza (

Inferencia Estadística
Distribución de muestreo de la
 

Distribución Chi-cuadrado varianza (

Inferencia Estadística
Ejercicio
 Calcular las probabilidades asociadas a las distribuciones muestrales que se indican a continuación:
 
• Hallar el percentil del 90% para una distribución Chi-cuadrado de 15 gl.

 
• Hallar el percentil del 10% para una distribución Chi-cuadrado de 15 gl.

• Hallar la probabilidad para una distribución Chi-cuadrado de 18 gl. cuando toma el valor de 28,869

• Hallar los grados de libertad para una distribución Chi-cuadrado cuando toma el valor de 19,337 y una
probabilidad de 0,5.

• Hallar la probabilidad para una distribución Chi-cuadrado de 35 gl. cuando toma el valor de 53,1605.

Inferencia Estadística | 2019-10


Ejemplo

Inferencia Estadística
Ejemplo

Inferencia Estadística
Ejemplo

Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una población normal con
varianza 6 tenga una varianza muestral mayor que 9,1

Inferencia Estadística
Ejemplo

Suponga que los tiempos requeridos por una ruta de bus de servicio público para realizar su recorrido forman
una distribución normal con desviación estándar de 2. Para 17 observaciones de la ruta encuentre el valor de
la varianza muestral cuya probabilidad abarque el 95 %.

26.296

2
 𝑃 ( 𝜒 (17 −1 )< 𝑥 ) =0,95 x=26,296

2
 26,296 = 𝑠 ( 16 ) 𝑠 2=6,574
4

Inferencia Estadística
Distribución de muestreo de la
Con Varianza poblacional desconocida media

Variable T de Student:

*Ver demostración en Alvarado, Obagi (2008)


Inferencia Estadística
Distribución de muestreo de la
Con Varianza poblacional desconocida media

Variable T de Student:

Inferencia Estadística
Distribución de muestreo de la
Con Varianza poblacional desconocida media

Variable T de Student:

X1, X2, …, Xn normales

Inferencia Estadística
Distribución de muestreo de la
Distribución t media

Inferencia Estadística
Distribución de muestreo de la
Distribución t media

Inferencia Estadística
Ejercicio
 Calcular las probabilidades asociadas a las distribuciones muestrales que se indican a continuación:
 
• Hallar el percentil del 95% para una distribución t de 30 gl.

 
• Hallar el percentil del 95% para una distribución t de 120 gl.

 
• Hallar la probabilidad de una distribución t de 150 gl cuando toma el valor de 1,655

 
• Hallar el percentil del 95% para una distribución Normal Estándar.

• Hallar los grados de libertad de una distribución t cuando toma el valor de 0,695 y una probabilidad de
0,75

Inferencia Estadística
Ejercicio

Una prueba sicotécnica para la selección de personal de una empresa tiene una calificación promedio
histórico de 60,1 puntos. Calcule la probabilidad de que en cierto proceso realizado a 25 personas, el
promedio de la prueba haya sido superior a 61,8 puntos si se sabe que la desviación estándar de dicho
proceso fue de 5,84.

  = 0,08

Inferencia Estadística
Ejercicio

Inferencia Estadística
Ejercicio

Inferencia Estadística
Resumen
Distribuciones para la media

Distribución para la varianza

Inferencia Estadística
Ejercicio

Inferencia Estadística
Ejercicio
µ = 80 Si
  aumenta $10.000
σ=6 Si descuento de $9.000
n = 41
  Aumento del servicio:

  Descuento del servicio:

  Si S compra de regulador

  Aumento del servicio:

Inferencia Estadística
Ejercicio

Inferencia Estadística
Ejercicio
Un proceso de control de calidad en la producción de cierto tipo de tuerca se basa en los resultados de
una inspección por muestreo de un lote. Se seleccionan 18 tuercas al azar y se les mide su diámetro
interno. Si la desviación estándar de dichos diámetros es superior a 5 mm, se rechaza el lote y debe ser
reprocesado; en caso contrario, el lote se acepta. Si el lote se reprocesa, la ganancia unitaria pro tuerca se
reduce a $1; si el lote no se reprocesa, la ganancia es de $40. Suponga que la función de probabilidad del
diámetro de las tuercas es normal y que la varianza poblacional es de 11,899. Calcule la probabilidad de
reprocesar el lote y el valor esperado de la ganancia por tuerca.

  Reprocesar lote:

Inferencia Estadística
Ejercicio
En la bolsa de valores se afirma que el crecimiento promedio de ciertas acciones es de $100 COP,
distribuidos normalmente. Un comisionista de bolsa selecciona aleatoriamente los resultados de 15 días,
en el último semestre y obtiene una desviación estándar de crecimiento de $90 COP. A él se le pagan
comisiones quincenalmente. Si durante esos quince días las acciones subieron menos de $50, en
promedio, se le pagarán $5 por acción; si aumentan entre $50 y $120, se le pagará $7 por acción; si
aumentan más de $120 se le pagará $8 por acción. ¿Cuál es el valor de comisión esperado por acción?

  Menor de $50:

  Entre $50 y $120:

  61

Inferencia Estadística
Distribución de muestreo de la
proporción
 Supuestos:
• Distribución Binomial o Bernoulli
• Tamaño de muestra muy grande

Estimador de p: con varianza

Por lo tanto, la variable que representa la proporción poblacional va a estar dada por:

Inferencia Estadística
Distribución de muestreo de la
proporción

Inferencia Estadística
Distribución de muestreo de la
proporción
Se sabe que el 10 % de los habitantes de una pequeña ciudad va frecuentemente a teatro. Si se toma una
muestra al azar de 100 habitantes, ¿cuál es la probabilidad de que al menos el 13 % de ellos vaya
regularmente a teatro?

Inferencia Estadística
Distribución de muestreo de la
  diferenciaParade medias
poblaciones independientesmuestrales

Para comparar poblaciones

• Variables aleatorias X y Y normales o muy grandes y de varianzas poblacionales conocidas

• Variables aleatorias X y Y normales y varianzas poblacionales desconocidas pero iguales (o


supuestamente iguales)

Inferencia Estadística
Distribución de muestreo de la
diferencia de medias muestrales
 
• Variables aleatorias X y Y normales o y varianzas poblacionales desconocidas (y diferentes)

Inferencia Estadística
Ejemplo
  gerente de una refinería piensa modificar el proceso de producir gasolina a partir de petróleo
El
crudo, pero hará tal cambio sólo si la gasolina promedio que se obtiene por este nuevo proceso
aumenta su valor respecto del proceso actual. Con base en un experimento de laboratorio y mediante
el empleo de dos muestras aleatorias de tamaño 12, una para cada proceso, la cantidad de gasolina
promedio del proceso actual es de 24,6 con una desviación estándar de 2,3, y para el nuevo proceso
fue de 28,2 con una desviación de 2,7. El gerente piensa que los resultados proporcionados son
variables aleatorias independientes normalmente distribuidas, con varianzas iguales. Con base en la
evidencia, ¿debe adoptarse el nuevo proceso?

  (𝑋
´ −𝑌
´ ) − ( 𝜇 𝑋 − 𝜇𝑌 ) ( 28,2 − 24,6 ) − ( 0 )
𝑃
( 𝑆𝑝
√ 1
𝑛𝑋
+
1
𝑛𝑌
>
2,508
√ 1
12
+
1
12 )= 𝑃 ( 𝑡 (12+12 − 2 ) >3,516 )= 1 − 𝑃 ¿

Inferencia Estadística
Ejemplo

Inferencia Estadística
Distribución de muestreo de la
  diferenciaPara
de medias
poblaciones dependientesmuestrales

• La variable aleatoria D se distribuye normal:

Inferencia Estadística
Ejemplo

Inferencia Estadística
Ejemplo

Inferencia Estadística
Ejemplo

Inferencia Estadística
Ejemplo

estándar de la competencia es más de un


20 % superior que la suya. Justifique
claramente. Suponga normalidad de los
mililitros de contenido en ambas
poblaciones

Inferencia Estadística
Distribución de muestreo de la
diferencia deindependientes
Para poblaciones proporciones
Comparación entre proporciones

Inferencia Estadística
Distribución de muestreo de la
razón de varianzas
Comparación de varianzas

Sean X y Y dos variables aleatorias independientes, con disribución de probabilidad chi-cuadrado,


con grados de libertad v1 y v2 respectivamente. Entonces la variable aleatoria que representa la
relación entre tales variables se denomina F de Fisher y se describe como:

Con función de probabilidad:

• Asimétrica positiva
• Parámetros: v1 y v2, grados de libertad del numerador y del denomimador

Inferencia Estadística
Distribución de muestreo de la
Sean
 
razón de varianzas
dos variables aleatorias independientes y . La variable aleatoria .

: Grados de libertad que tiene la variable aleatoria del numerador.


: Grados de libertad que tiene la variable aleatoria del denominador.

Propiedad 1: Su FDP tiene la forma:

Propiedad 2: El valor esperado y la varianza


están dados por:

Propiedad 3: Si V es una variable aleatoria con distribución , entonces

Propiedad 4: Si entonces:

Inferencia Estadística
Distribución de muestreo de la
razón de varianzas
  hacer un cociente entre variables X y Y, independientes, con distribución chi-cuadrado, divididas
Al
entre sus grados de libertad, se obtiene la variable F que relaciona las varianzas de las variables:

Con grados de libertad v1 = nx-1 y v2 = ny-1

Inferencia Estadística
Distribución de muestreo de la
  razón
𝑃 (𝑉 ≤de𝑣 varianzas
) =0.95

Inferencia Estadística
Distribución de muestreo de la
  razón
𝑃 ( 𝑉 ≤de varianzas
𝑣 ) =0.975

Inferencia Estadística
Ejercicio
 Calcular las probabilidades asociadas a las distribuciones muestrales que se indican a continuación:
 
• Hallar la probabilidad asociada a una función F con 13 y 20 grados de libertad para un valor de la variable
aleatoria menor o igual a 3,18

 
• Hallar el valor de la variable aleatoria F cuya probabilidad es del 95 %, v1= 17, v2=10

• Hallar el valor de la variable aleatoria para F (0,995;11;25)

• Hallar el valor de la variable aleatoria para F (0,025;13;7)

Inferencia Estadística
Ejercicio
 Calcular las probabilidades asociadas a las distribuciones muestrales que se indican a continuación:
  
• Hallar el valor de la variable aleatoria F cuya probabilidad es del 95 %, v1= 7, v2=15

• Hallar el valor de la variable aleatoria F cuya probabilidad es del 95 %, v1= 15, v2=7

• Hallar el valor de la variable aleatoria F(0,99 ; 24 ; 19)

• Hallar el valor de la variable aleatoria F(0,05 ; 19 ; 24)

• Hallar el valor de la variable aleatoria F(0,01 ; 28 ; 12)

Inferencia Estadística
Ejercicio

 Si S1 y S2 representan las desviaciones estándar de muestras aleatorias independientes de


tamaños n1 = 8 y n2 = 12, tomadas de poblaciones normales con varianzas iguales, calcule:

Inferencia Estadística
Ejercicio

 Si S1 y S2 representan las desviaciones estándar de muestras aleatorias independientes de tamaños n1 =


25 y n2 = 31, tomadas de poblaciones normales con varianzas poblacionales 10 y 15, respectivamente,
calcule:

Inferencia Estadística
Ejercicio

Se aplican pruebas a 10 cables conductores soldados a un dispositivo semiconductor con el fin de


determinar su resistencia a la tracción. La varianza en la fuerza de tracción para este experimento fue de 3.

Otro conjunto de cables conductores que forman un dispositivo se encapsuló y se probó para determinar si
el encapsulado aumentaba la resistencia a la tracción. Las pruebas dieron los siguientes resultados:

24,9 22,8 23,6 22,1 20,4 21,6 21,8 22,5

Cuál es la probabilidad de que la varianza en la resistencia de todo el lote de los cables con el dispositivo
encapsulado sea el doble de la varianza de los cables sin encapsular.

Inferencia Estadística
Ejercicio

Inferencia Estadística
Ejercicio

Se desea comparar el tiempo promedio de duración de un producto alimenticio dependiendo si es


refrigerado o no. En principio se supone que la duración promedio del producto será 3 días mayor si es
refrigerado que si no lo es, y que las desviaciones estándar toman valores de 2 (refrigerado) y 0,8 (no
refrigerado). Se realiza un experimento con 61 productos refrigerados y 41 productos no refrigerados.

Si el resultado muestral indica que la duración promedio muestral del producto excede en 2,8 o menos días
a la duración promedio muestral del no refrigerado, la investigación concluirá que no vale la pena refrigerar
el producto. ¿Cuál es la probabilidad de que ello suceda?

Tras realizar el experimento, se obtuvo una desviación estándar de 2,3 días para el producto refrigerado y
0,685 para el no refrigerado. Suponiendo normalidad en las variables de duración del producto, indique si
usted rechazaría o no la suposición de que la desviación del producto refrigerado es 2,5 veces la desviación
del producto no refrigerado.

Inferencia Estadística
Ejercicio

Dos compañías A y B fabrican bombillas. La duración para A tiene una desviación de 40 horas mientras que
la duración de B tiene una desviación de 50 horas. Una muestra de 8 bombillas se toma de la fabrica A y 16
bombillas se toma de la fábrica B. Determine la probabilidad de que la varianza de la primera muestra sea
mayor que
a. Dos veces la de la segunda
b. 1,2 veces la de la segunda
c. Repita a. para desviaciones estándar de 40 horas para las dos fábricas
d. Repita a. para desviaciones estándar de 50 horas para ambas fábricas

a. < 0,01.
b. >0,01
c. <0,01
d. <0,01

Inferencia Estadística
Resumen
Distribuciones para la media

Distribución para la varianza

Inferencia Estadística
Resumen
Distribuciones para la diferencia de medias

Pero iguales

Inferencia Estadística
Resumen
Distribuciones para la proporción

Distribuciones para la diferencia de proporciones

Inferencia Estadística
Resumen
Distribuciones para la razón entre varianzas

Inferencia Estadística

También podría gustarte