Está en la página 1de 161

Segunda parte:

Estadística Inferencial
Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Alba Isabel García Giraldo | Economista
¿Por qué la inferencia estadística?
Introducción
• La estadística descriptiva se limita a describir propiedades de muestras sin intentar hacer
deducciones hacia la población de la que fue extraída.
• La inferencia estadística busca emplear datos muestrales para sacar conclusiones hacia una
población. Permite ahorrar tiempo, dinero, y otros recursos.
• Como dichas conclusiones no siempre son certeras es necesario emplear el término de
probabilidad.
• Conclusión: el objetivo de la inferencia estadística es obtener información de una población a
través de una muestra; la estimación de parámetros a través de estadísticos

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
¿Por qué la inferencia estadística?
Introducción

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
¿Por qué la inferencia estadística?
Introducción

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
La probabilidad
• Camino para cuantificar resultados que no pueden predecirse.
• Medida numérica de la posibilidad de ocurrencia de un evento/suceso.
• Se relaciona con la estadística porque apoya toma de decisiones en condiciones de
incertidumbre.

0 0.5 1
Improbable Tan probable como improbable Muy probable

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Definiciones de probabilidad
Existen tres formas de definir la probabilidad:
1. Clásica:
• Número de formas en que se presenta un evento sobre el total de las posibilidades.
• 𝑃 𝐸 = ℎΤ𝑁.
• Dentro de una bolsa hay 5 bolas rojas, 3 azules y 1 negra. ¿Cuál es la probabilidad de
extraer una bola de color azul?

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Definiciones de probabilidad
Existen tres formas de definir la probabilidad:
2. Como frecuencia relativa:
• Cuando el experimento se repite indefinidamente.
• Registros de 1000 nacimientos corroborarán que la probabilidad de que un recién nacido sea
mujer u hombre es del 50%.
• Cuando se aplican encuestas.
• Una encuesta a 1000 personas sobre su grado de acuerdo con una aseveración.
• En este escenario la probabilidad se asume como una proporción (en el lenguaje de
frecuencia relativa).

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Definiciones de probabilidad
Existen tres formas de definir la probabilidad:
2. Como frecuencia relativa:
• “Considero que el fenómeno de la inmigración es una amenaza contra la identidad de una
región”.
• “Considero que los inmigrantes tienen derecho a crear sus propios partidos políticos”.

Escala Frecuencia absoluta Frecuencia relativa


Total acuerdo 250 0.25
De acuerdo 500 0.5
Indiferente 133 0.133
En desacuerdo 72 0.072
Total desacuerdo 45 0.045
Total 1000 1

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Definiciones de probabilidad
Existen tres formas de definir la probabilidad:
3. Subjetiva
• Emplea la experiencia y la intuición.
• Expresa el grado de confianza que tiene un individuo.
• Es de esperarse que diferentes personas asignen diferentes probabilidades a un mismo
evento ya que es un juicio personal.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Variable aleatoria
• Es un número que expresa el resultado de un experimento aleatorio.
• Un experimento aleatorio es un experimento cuyo resultado no puede predecirse,
depende de la probabilidad.
• Las variables aleatorias deben tomar valores numéricos.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Variable aleatoria
Experimento aleatorio Variable aleatoria x Valores posibles para x
• Lanzamiento de un dado Posibles valores de la cara del dado {1, 2, 3, 4, 5, 6}
• Llamar a cinco clientes Número de clientes que hacen un pedido {0, 1, 2, 3, 4, 5}
• Inspeccionar un lote de 2500 unidades Número de elementos defectuosos {0 a 2500}
• Lanzamiento de una moneda Cara de la moneda Cara (0), sello (1)
• Vender un automóvil Edad del cliente {18, 19…}
• Fecundación de un óvulo Género del feto Hombre (0), mujer (1)
• Tiempo de espera en una sala de urgencias Tiempo de espera en minutos {1, 1.30, 2, 2.30, 3…}

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Variable aleatoria
Las variables aleatorias pueden ser discretas o continuas, dependiendo de los valores
numéricos que asuman.
• Discreta ⇒ asume un valor finito de valores {0, 1, 2, 3, …, n}
• Continua ⇒ asume cualquier valor dentro de un intervalo de valores {0, 0.5, 1, 1.5, …, n}

Experimento aleatorio Variable aleatoria x Valores posibles para x Tipo de variable


• Llamar a cinco clientes Número de clientes que hacen un pedido 0, 1, 2, 3, 4, 5 Discreta
• Vender un automóvil Género del cliente 0 si es hombre, 1 si es mujer Discreta
• Hacerse cargo de un restaurante un día Número de clientes 0, 1, 2, 3… Discreta
• Operar un banco Tiempo en minutos entre llegada de los clientes 𝑥≥0 Continua
• Llenar un frasco de 12.5 onzas Cantidad de onzas 0 ≤ 𝑥 ≤ 12.5 Continua

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Describen cómo se distribuye la probabilidad de que la variable aleatoria tome
determinado valor tras un experimento aleatorio.
• Discreta ⇒ Función de probabilidad/masa
• Continua ⇒ Función de densidad

Cara del dado 1 2 3 4 5 6


Probabilidad 1/6 1/6 1/6 1/6 1/6 1/6
Función de probabilidad 0.1667 0.1667 0.1667 0.1667 0.1667 0.1667

Por ejemplo 𝑓 1 = 0.1667


Es de notar que σ 𝑓(𝑥) = 1

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Discretas
Como ejemplo consideramos el caso de ventas de automóviles Renault en Colombia.
Durante los últimos 300 días de operación, los datos muestran que hubo 57 días en los que no se
vendió ningún automóvil, 117 días en los que se vendió 1 automóvil, 72 en los que se vendieron 2, 42
en los que se vendieron 3, 9 en los que se vendieron 4 y 3 días en los que se vendieron 5. ¿Cuál es la
variable aleatoria? Número de carros vendidos en un día. ¿Cómo determinar cuál es el número de
carros vendidos más probable al día?

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Discretas

¿Cuál es entonces el número de automóviles vendidos al día más probable?


Valor de x Días 𝒇(𝒙) 𝑓 1 = 0.39
0 57 0.19
1 117 0.39 ¿Cuál es la probabilidad de que el número de automóviles vendidos sea 2?
2 72 0.24
𝑝 𝑥 = 2 = 𝑓 2 = 0.24
3 42 0.14
4 9 0.03
5 3 0.01 ¿Cuál la de que sean 3 o más?
300 1 𝑝 𝑥 ≥ 3 = 𝑓 3 + 𝑓 4 + 𝑓 5 = 0.18

Por ejemplo: 𝑓 0 = 0.19 Siempre:


𝑓(𝑥) ≥ 0 y σ 𝑓 𝑥 = 1

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Discretas Función de probabilidad
0,45
0,40
0,35
Valor de x Días 𝒇(𝒙) 0,30

Probabilidad
0 57 0.19
1 117 0.39 0,25
2 72 0.24 0,20
3 42 0.14 0,15
4 9 0.03
5 3 0.01 0,10
300 1 0,05
0,00
Por ejemplo: 𝑓 0 = 0.19 0 1 2 3 4 5
Número de automóviles vendidos
𝑝(1 ≤ 𝑥 ≤ 3)

𝑝(2 ≤ 𝑥 < 5)

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Discretas
Una variable aleatoria además de tener una distribución de probabilidad, tiene un
valor esperado y una varianza.

• Valor esperado: es el valor promedio de la variable aleatoria


➢𝐸 𝑥 = σ 𝑥 ∙ 𝑓 𝑥 = 𝜇

• Varianza:
➢ 𝑉𝑎𝑟 𝑥 = 𝜎 2 = σ(𝑥 − 𝜇)2 ∙ 𝑓(𝑥)

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Discretas
Valor de x Días 𝒇(𝒙) 𝒙 ∙ 𝒇(𝒙)
0 57 0.19 0
1 117 0.39 0.39
2 72 0.24 0.48
3 42 0.14 0.42
4 9 0.03 0.12
5 3 0.01 0.05
300 1 1.46

• El número promedio o esperado de carros vendidos por día es 1.46.


• El valor esperado nos sirve para pronosticar cómo serán las ventas por decir algo en 30 días:

1.46 30 = 43.8 ≈ 44

• Si en un día se venden 1.46 carros en promedio, en 30 días se venderán en promedio 44.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Discretas
Existen principalmente tres distribuciones:
1. Binomial
2. Poisson
3. Hipergeométrica

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Discretas: binomial
Características:
• Es un experimento que acepta sólo dos posibilidades de respuesta.
➢ Éxito o fracaso.
• Se dispone de una probabilidad “empírica”.
➢ Ésta no varía a lo largo del experimento. La obtención de un éxito en un ensayo no
condiciona el resultado del siguiente ensayo.
• Se tiene un número de ensayos determinado.
➢ Número de ensayos fijo.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Discretas: binomial
La función de probabilidad está definida por:

𝑛!
𝑝 𝑥 = 𝑛 𝐶𝑥 𝑝 𝑥 𝑞𝑛−𝑥 = 𝑝 𝑥 𝑞 𝑛−𝑥
𝑥! 𝑛 − 𝑥 !

𝑛 ⇒ número de ensayos (fijo)


𝑥 ⇒ valor que toma la variable aleatoria
𝑝 ⇒ probabilidad de éxito empírica (dada)
𝑞 ⇒ 1 − 𝑝 (probabilidad de fracaso)

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Discretas: binomial
Ejemplo:
Por experiencia se sabe que 4 de 50 artículos son defectuosos. Hallar la probabilidad
de que en un lote de producción de 25 elementos, 7 sean defectuosos.

• ¿Cuál es el experimento aleatorio?


• ¿Cuál la variable aleatoria 𝑥? ¿Cuáles sus posibles valores?
• ¿Cuál es el valor de la 𝑝 empírica? 𝑝 = 4Τ50 = 0.08
• ¿Cuál es el valor de la variable aleatoria 𝑥? 𝑥 = 7
• ¿Cuál es el número de ensayos 𝑛? 𝑛 = 25

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Discretas: binomial

Función de probabilidad Función de probabilidad acumulada


0,30 1,20

0,25 1,00

0,20 0,80
Probabilidad

Probabilidad
0,15 0,60

0,10 0,40

0,05 0,20

0,00 0,00
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Elementos defectuosos Elementos defectuosos
(Valores de x) (Valores de x)

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Discretas: binomial
Con la distribución de probabilidad binomial es posible hallar:
• Función de probabilidad (de probabilidad acumulada) fp o fpa.
• 𝑝(𝑥) = 0, 1, 2, 3 … 𝑛
• 𝑝 𝑥 > ó ≥ 0, 1, 2, 3 … 𝑛
• 𝑝 𝑥 < ó ≤ 0, 1, 2, 3 … 𝑛
• 𝑝 𝑎 >𝑥 >𝑏 ó𝑝 𝑎 ≥𝑥 ≥𝑏
• 𝑝 𝑎 < 𝑥 < 𝑏 ó 𝑝(𝑎 ≤ 𝑥 ≤ 𝑏) donde 𝑎 y 𝑏 son ℤ+ .

Excel permite el cálculo mediante la función +DISTR.BINOM.N

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Discretas: binomial
• Valor esperado ⇒ 𝐸 𝑥 = 𝑛𝑝 = 𝜇
• Varianza ⇒ 𝑉𝑎𝑟 𝑥 = 𝜎 2 = 𝑛𝑝(1 − 𝑝)

Para el ejemplo anterior el número esperado (promedio) de elementos defectuosos


es 2, lo cual quiere decir que en 25 elementos se espera encontrar en promedio 2
que sean defectuosos.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Continuas
• Existe una gran diferencia entre las distribuciones de probabilidad discreta y continua.
• Cuando se calcula la función de probabilidad discreta se halla la probabilidad de que la variable
aleatoria tome determinado valor.
• Para variables aleatorias continuas se calcula la función de densidad de probabilidad.
• Esta función muestra la probabilidad de que la variable aleatoria tome un valor dentro de un
intervalo de valores.
• La probabilidad está dada por un área bajo una curva 𝑓(𝑥).
• Para variables aleatorias continuas, la probabilidad de que la variable tome un valor determinado
será cero.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Continuas
Existen principalmente cinco distribuciones:
1. Normal
2. Normal estándar
3. t-Student
4. Chi cuadrado 𝜒 2
5. La F.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Continuas: normal
Es la distribución de probabilidad más común debido la normalidad aproximada con la que ocurren
naturalmente muchas situaciones.
Muchos análisis estadísticos requieren que los datos provengan de poblaciones normalmente
distribuidas.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Continuas: normal
La función de densidad de probabilidad normal está determinada por:

1 − 𝑥−𝜇 2 /(2𝜎 2 )
𝑓 𝑥 = 𝑒
𝜎 2𝜋

𝑥 ~ 𝑁 (𝜇 , 𝜎)

𝜇 ⇒ media Determinantes de la
𝜎 ⇒ desviación estándar distribución
𝜋 ⇒ 3.1416
𝑒 ⇒ 2.71828

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Continuas: normal
Características:
• Toda la familia de distribuciones normales se diferencia por dos parámetros: media 𝜇, y
desviación estándar 𝜎.
• El punto más alto de la curva se encuentra en la media, que es igual a la mediana y a la moda.
• La distribución es simétrica: coeficiente de asimetría cero.
• El área bajo la curva normal es 1, el área a la izquierda de la media es de 0.5, y a la derecha de
la media será 0.5.
• Sus colas se extienden hacia el infinito positivo y negativo y jamás tocan el eje horizontal.
• La desviación estándar determina qué tan plana y ancha es la curva normal. Desviaciones
estándar grandes corresponden a curvas más planas y anchas, lo cual indica mayor
variabilidad en los datos.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Continuas: normal
Ejemplo:
La base de datos proporcionada contiene información sobre el precio de un medicamento en 5200
droguerías de un país. Hallar la tabla de resumen de estadísticas y trazar un histograma de
frecuencias. ¿Qué rasgos de una distribución normal observamos en los datos?

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Continuas: normal
Histograma de distribución de frecuencias Resumen de estadísticas
Precio de un medicamento en 5200 droguerías
250 Media $ 53.018
1 2 /(2𝜎2 )
𝑓 𝑥 = 𝑒 − 𝑥−𝜇 Error típico 20,93
200 𝜎 2𝜋 Mediana $ 53.030
Moda $ 55.455
Frecuencia

150 Desviación estándar $ 1.509


Varianza de la muestra 2278030,82
100 Curtosis -0,03
Coeficiente de asimetría 0,01
50
Rango $ 10.518
Mínimo $ 47.898
0
Máximo $ 58.417

y mayor...
$47.898
$48.337
$48.775
$49.213
$49.651
$50.090
$50.528
$50.966
$51.405
$51.843
$52.281
$52.719
$53.158
$53.596
$54.034
$54.472
$54.911
$55.349
$55.787
$56.225
$56.664
$57.102
$57.540
$57.979
Suma $ 275.691.515
Cuenta 5200
Clase

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Continuas: normal
Histograma de distribución de frecuencias Resumen de estadísticas
Precio de un medicamento en 5200 droguerías
250 Media $ 53.018
1 2 /(2𝜎2 )
𝑓 𝑥 = 𝑒 − 𝑥−𝜇 Error típico 20,93
200 𝜎 2𝜋 Mediana $ 53.030
Moda $ 55.455
Frecuencia

150 Desviación estándar $ 1.509


Varianza de la muestra 2278030,82
100 Curtosis -0,03
Coeficiente de asimetría 0,01
50
Rango $ 10.518
Mínimo $ 47.898
0
Máximo $ 58.417

y mayor...
$47.898
$48.337
$48.775
$49.213
$49.651
$50.090
$50.528
$50.966
$51.405
$51.843
$52.281
$52.719
$53.158
$53.596
$54.034
$54.472
$54.911
$55.349
$55.787
$56.225
$56.664
$57.102
$57.540
$57.979
Suma $ 275.691.515
Cuenta 5200
Clase

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
𝜇1 𝜇2 𝜇3 𝜇1 𝜇2 𝜇3

Diferentes medias 𝜇 pero desviaciones estándar 𝜎 iguales Diferentes medias 𝜇 y desviaciones estándar 𝜎

𝜇
Medias 𝜇 iguales pero desviaciones estándar 𝜎 diferentes

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Continuas: normal estándar
Histograma de distribución de frecuencias
Precio de un medicamento en 5200 droguerías
250

200
Frecuencia

150

100

50

y mayor...
$47.898
$48.337
$48.775
$49.213
$49.651
$50.090
$50.528
$50.966
$51.405
$51.843
$52.281
$52.719
$53.158
$53.596
$54.034
$54.472
$54.911
$55.349
$55.787
$56.225
$56.664
$57.102
$57.540
$57.979 Clase

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Continuas: normal estándar
• Hemos dicho que para cada 𝜇 y 𝜎 se tendrá una función de densidad diferente, lo cual dificultaría
hallar las áreas (probabilidades) bajo la curva de la distribución.
• Se estandariza la variable 𝑥 a la variable 𝑧, y se tiene que la variable ahora sigue una distribución
normal estándar.

𝑥𝑖 − 𝜇
𝑧=
𝜎

• Para la variable 𝑧 las probabilidades ya han sido calculadas, estandarizadas, responden a:

1 2 Τ2
𝑓 𝑧 = 𝑒 −𝑧
𝜎 2𝜋

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Continuas: normal estándar

1 − 𝑥−𝜇 2 /(2𝜎2 )
1 2 Τ2
𝑓 𝑥 = 𝑒 𝑓 𝑧 = 𝑒 −𝑧
𝜎 2𝜋 𝜎 2𝜋

𝜎 1

𝜇 0

𝑥 𝑧

En la distribución normal estándar, la probabilidad también puede ser considerada como una proporción.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Continuas: normal estándar
Ejemplo:
La media de estatura para un grupo de 250 mujeres es de 1.62 metros, con una desviación estándar
de 0.17 metros. Vamos a hallar:
1. La probabilidad de que las mujeres de este grupo midan más de 1.65 metros ⇒ 𝒑(𝒙 > 𝟏. 𝟔𝟓)
2. Cuántas mujeres de este grupo miden más de 1.65 metros
3. La probabilidad de que las mujeres de este grupo midan entre 1.67 y 1.60 ⇒ 𝒑(𝟏. 𝟔𝟎 < 𝒙 < 𝟏. 𝟔𝟕)
4. La probabilidad de que midan menos de 1.59 metros ⇒ 𝒑(𝒙 < 𝟏. 𝟓𝟗)
5. La probabilidad de que midan menos de 1.59 metros o menos ⇒ 𝒑(𝒙 ≤ 𝟏. 𝟓𝟗)
6. La probabilidad de que las mujeres de este grupo midan 1.64 metros o menos ⇒ 𝒑(𝒙 ≤ 𝟏. 𝟔𝟒)
7. 1.63 metros exactamente ⇒ 𝒑(𝒙 = 𝟏. 𝟔𝟑)

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Aproximación normal de la binomial
Regresando a la situación donde 𝑝 = 0.08 y 𝑛 = 25, tenemos que la función de probabilidad se comporta así.

En los casos en los que 𝑛𝑝 ≥ 5 y 𝑛(1 − 𝑝) ≥ 5 la


Función de probabilidad para n=25 y p=0.08
0,30
distribución normal proporciona una buena
aproximación de las probabilidades binomiales.
0,25

0,20 Cuando esto ocurre:


Probabilidad

0,15 𝜇 = 𝑛𝑝
0,10
𝜎 = 𝑛𝑝(1 − 𝑝)
0,05
En el presente caso 𝑛𝑝 = 2 con lo cual la función de
0,00
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 probabilidad no tiene forma normal.
Elementos defectuosos
(Valores de x)
¿Qué ocurre si 𝑝 = 0.06 ahora?

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
Aproximación normal de la binomial

Función de probabilidad para n=25 y p=0.08 Función de probabilidad para n=25 y p=0.6
0,30 0,18
0,16
0,25 𝑛𝑝 = 2 𝑛𝑝 = 15
0,14

0,20
𝑛 1 − 𝑝 = 23 0,12
𝑛 1 − 𝑝 = 10

Probabilidad
Probabilidad

0,10
0,15
0,08

0,10 0,06
0,04
0,05
0,02

0,00 0,00
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Elementos defectuosos Elementos defectuosos
(Valores de x) (Valores de x)

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones de probabilidad
¿Preguntas?

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Muestreo y distribuciones
muestrales

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones muestrales
Caso:
El problema de muestreo de Electronics Associates, Inc (EAI). Página 259.

¿Cómo puede obtener el director de personal, estimaciones de los parámetros poblacionales usando
una muestra de administrador en vez de usar los 2500 de la población?

Si existe la certeza de que una muestra de 30 administradores proporciona información certera


acerca de los 2500 de la población, será preferible trabajar con una muestra que con la población
entera.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones muestrales
Muestreo
Aleatorio simple:
• Todos los elementos tienen la misma probabilidad de ser elegidos.
• Puede desarrollarse con o sin reemplazamiento.
• Con reemplazamiento ⇒ Cada objeto es regresado a la muestra / Posibilidad de reelección / Es el más usado
• Sin reemplazamiento ⇒ Cada objeto al ser muestreado sale de la muestra

• Puede darse en una población finita o infinita.


• Finita ⇒ Se conoce el tamaño de la población 𝑁
• Infinita ⇒ 𝑁 es desconocido / Cada elemento debe seleccionarse independientemente de los otros / Suelen
asociarse con procesos que ocurren a lo largo del tiempo.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones muestrales
Estimación puntual
• Es el proceso mediante el cual se calcula un estadístico para estimar su correspondiente
parámetro.
• Las estimaciones puntuales provienen de muestras, por lo tanto no se espera que sean iguales a los
parámetros, pero sí una aproximación.

𝑥ҧ ⟹ 𝜇
𝑝ҧ ⟹ 𝑝
𝑠 ⟹ 𝜎
𝑠2 ⟹ 𝜎2
Estadísticos Parámetros
(Estimador puntual) (Valor poblacional)

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones muestrales
Introducción
• Surgen de considerar todas las posibles muestras que pueden extraerse de una
población.
• Para cada muestra es posible calcular estadísticos que varían de una muestra a
otra, obteniendo la distribución muestral del estadístico.
• Indican todos los posibles valores que puede tomar un estadístico de una muestra
a otra, en muestreo repetido.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones muestrales
Introducción
Una población consta de los cinco números 2, 3, 6.
Considerar todas las posibles muestras de tamaño 2 que pueden extraerse de esta
población (con reemplazamiento), calcular:

1. La media de la población.
2. La desviación estándar de la población
3. La media de las medias muestrales.
4. La desviación estándar de las medias muestrales.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones muestrales
Introducción

𝜇 Media poblacional

𝜎 Desviación estándar poblacional

𝜇𝑥ҧ Media de la distribución muestral de medias

𝜎𝑥ҧ Desviación estándar de la distribución muestral de medias (error estándar).

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones muestrales
Introducción
Para nuestro ejemplo:
• Media poblacional ⇒ 𝜇 = 3,66ത
• Desvest poblacional ⇒ 𝜎 = 1,70
• Media de las medias ⇒ 𝜇𝑥ҧ = 3,66ത
• Desvest de la distribución muestral (error estándar) ⇒ 𝜎𝑥ҧ = 1,20

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones muestrales
Introducción

Distribución muestral de la media

Las distribuciones muestrales permiten


conocer cómo se distribuyen los posibles
Frecuencia relativa

valores muestrales alrededor del parámetro.

Recordemos que la media de todas las medias,


es decir 𝜇𝑥ҧ , es igual al valor de la media
poblacional (parámetro) 𝜇.

𝑥ҧ1 𝑥ҧ 2 𝑥ҧ 3 𝜇𝑥ҧ 𝑥ҧ 4 𝑥ҧ 5 𝑥ҧ 6
Posibles valores de la media muestral en muestreo
repetido

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones muestrales
Introducción
Volviendo al caso de EAI.
El director de personal obtuvo 500 muestras cada una con 30 administradores y encontró la
frecuencia con que determinados valores para el salario promedio 𝒙ഥ y la proporción poblacional 𝒑

de administradores que habían culminado el programa, se repetía dentro de cada muestra.

¿Hasta este punto qué podría obtener el director de personal?

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Tabla de frecuencias relativas de los valores de 𝑥ҧ obtenidos en las 500 muestras de 30
administradores cada una • Si el proceso de seleccionar una
muestra aleatoria simple se
considera como un experimento
aleatorio, los posibles resultados
de 𝑥ҧ y 𝑝ҧ pueden considerarse
como una variable aleatoria.

• La distribución de probabilidad de
ambos estimadores se conoce
como distribución muestral de ഥ𝒙y
distribución muestral de 𝒑
ഥ.

• Podemos evidenciar que la


Histograma de frecuencias relativas de los valores de 𝑥ҧ obtenidos Histograma de frecuencias relativas de los valores de 𝑝ҧ obtenidos distribución muestral de los
en las 500 muestras de 30 administradores cada una en las 500 muestras de 30 administradores cada una
estimadores distribuye
normalmente o se aproxima.

• Si distribuye normalmente, es
posible hallar la probabilidad de
que la media o la proporción
(muestrales) tome determinado
valor dentro de una muestra, dado
un muestreo repetido.

• Ese es el fundamento de las


distribuciones muestrales.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones muestrales
De medias
• Para la distribución muestral de la media 𝑥ҧ tenemos:
• 𝑥ҧ variable aleatoria.
• La forma de la distribución muestral ⇒ Puede o no ser normal
• Valor esperado ⇒ 𝐸 𝑥ҧ = 𝜇 = 𝜇𝑥ҧ
• Desviación estándar ⇒ Depende del tipo de población

𝜎 𝑁−𝑛
𝜎𝑥ҧ = ⟹ Población finita | 𝑛Τ𝑁 > 0,05
𝑛 𝑁−1

𝜎
𝜎𝑥ҧ = ⟹ Población infinita
𝑛

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones muestrales
De medias: forma de la distribución
Caso 1:
La población de la que se extrae la muestra distribuye normalmente
• La distribución muestral de la media también distribuirá normalmente.
• Es posible hallar probabilidades bajo la curva normal.

Caso 2:
No se conoce la forma en que distribuye la población
• ¿Cómo distribuye la distribución muestral de la media? ¿Es posible hallar probabilidades?
• Distribuirá normalmente siempre y cuando el tamaño de la muestra sea ≥ 30. Se podrán
hallar probabilidades. Esto se conoce como teorema del límite central.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones muestrales
De medias
Relación entre el tamaño de la muestra y la distribución muestral de 𝑥:ҧ
• A mayor 𝑛, mejor estimación de 𝜇.
• 𝜇 siempre será la misma, independientemente de 𝑛.
• 𝜎𝑥ҧ sí está relacionado con el tamaño de la muestra.
• Mientras 𝑛 crezca, 𝜎𝑥ҧ será menor.
• Si 𝑛 es grande la variabilidad entre las muestras será menor y habrá mayor precisión en la
estimación de de 𝜇.

𝜎 4000 4000
𝜎𝑥ҧ = 𝜎𝑥ҧ = = 400 𝜎𝑥ҧ = = 730,3
𝑛 100 30

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones muestrales
De medias:
Ejemplo:
Una escuela cuenta con un total de 400 estudiantes, su altura promedio es de 1.50 metros, con una
desviación típica de 0.25 m. Determinar la probabilidad de que en una muestra de 36 alumnos, el
promedio de la altura sea superior a 1.60 m.

¿A quién podría interesarle el cálculo de esta probabilidad?

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones muestrales
De medias:
Planteamiento:
1. ¿Se conoce el total de la población?
2. ¿Cuál es el 𝑛 muestral? ¿𝑛/𝑁 ≥ 0,05?
3. ¿Cuál es el valor de la media 𝜇?
4. ¿Cuál es el valor de la desviación estándar 𝜎?
5. ¿Cuál es el valor de la media 𝑥ҧ que queremos probar?
Solución:
1. Hallamos 𝜎𝑥ҧ .
2. Dado que buscamos una probabilidad que es un área bajo la curva normal, debemos estandarizar a 𝑧
la media 𝑥ҧ que queremos probar.
3. Hallamos el área pedida.
4. Multiplicamos por 100 para obtener la probabilidad en términos de porcentaje.
5. Interpretamos.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones muestrales
De proporciones
• Para la distribución muestral de la proporción 𝑝ҧ tenemos:
• 𝑝ҧ variable aleatoria
• La forma de la distribución ⇒ Puede aproximarse a la normal
• Valor esperado ⇒ 𝐸 𝑝ҧ = 𝑝
• Desviación estándar ⇒ Depende del tipo de población

𝑝(1 − 𝑝) 𝑁 − 𝑛
𝜎𝑝ҧ = ⟹ Población finita | 𝑛Τ𝑁 > 0,05
𝑛 𝑁−1

𝑝(1 − 𝑝)
𝜎𝑝ҧ = ⟹ Población infinita
𝑛

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones muestrales
De proporciones: forma de la distribución
• Para la distribución muestral de la proporción 𝑝ҧ tenemos:
• 𝑝ҧ es una variable aleatoria que distribuye binomialmente.
• Hemos dicho que puede aproximarse a la distribución normal siempre y cuando se cumpla
que 𝑛𝑝 ≥ 5 o 𝑛(1 − 𝑝) ≥ 5.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones muestrales
De proporciones: forma de la distribución

𝑝, 𝑝ҧ Proporción poblacional / muestral

𝜇𝑝ҧ Media de la distribución muestral de proporciones

𝜎𝑝ҧ Desviación estándar de la distribución muestral de proporciones (error


estándar).

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones muestrales
De proporciones:
Ejemplo:
Se sabe que el 2% de los elementos producidos por una máquina son defectuosos. ¿Cuál es la
probabilidad de que en un pedido de 400 elementos, el 3% o más resulte defectuoso?

¿A quién podría interesarle el cálculo de esta probabilidad?

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones muestrales
De proporciones:
Planteamiento:
1. ¿Se conoce el total de la población?
2. ¿Cuál es el 𝑛 muestral? ¿𝑛/𝑁 ≥ 0,05?
3. ¿Cuál es el valor de la proporción 𝑝 poblacional con la cualidad?
4. ¿Cuál es el valor de la proporción 𝑝ҧ que queremos probar?
5. ¿Es 𝑛𝑝 ≥ 5? ¿Es 𝑛(1 − 𝑝) ≥ 5?
Solución:
1. Hallamos 𝜎𝑝ҧ .
2. Dado que buscamos una probabilidad que es un área bajo la curva normal, debemos estandarizar a 𝑧
la proporción 𝑝ҧ que queremos probar.
3. Hallamos el área pedida.
4. Multiplicamos por 100 para obtener la probabilidad en términos de porcentaje.
5. Interpretamos.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Estimación puntual
Propiedades de los estimadores
Supongamos:

𝜃መ ⇒ 𝜃
𝜃෠ será un buen estimador de 𝜃 si cumple con las propiedades de:
1. Insesgadez
2. Eficiencia
3. Consistencia

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Estimación puntual
Propiedades de los estimadores
1. Insesgadez:
• El valor esperado (promedio) de la distribución muestral del estadístico, es igual al valor del
parámetro.

𝐸 𝜃መ = 𝜃

• Hemos visto que 𝐸 𝑥ҧ = 𝜇, 𝐸 𝑝ҧ = 𝑝 así que la media y la proporción muestrales son


estimadores insesgados de sus respectivos parámetros poblacionales.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Estimación puntual
Propiedades de los estimadores
2. Eficiencia:
• Varianza mínima: tendrá el menor error estándar, habrá una menor variabilidad entre las
muestras.
• La varianza de la distribución muestral de un estimador es menor que la de otro estimador.
• Un estimador insesgado y eficiente se conoce como mejor estimador insesgado.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Estimación puntual
Propiedades de los estimadores
3. Consistencia:
• El estimador puntual se aproxima al verdadero valor del parámetro cuando 𝑛 aumenta.
• Una muestra grande tiende a proporcionar mejor estimación puntual que una pequeña.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Distribuciones muestrales
Muestreo: otros tipos
• Aleatorio estratificado
• Conglomerados
• Sistemático
• Por conveniencia
• Subjetivo

Cuando se aplican muestreos no probabilísticos se debe tener cuidado al hacer


inferencias, ya que las muestras no siempre garantizan la representatividad de la
población.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Muestreo Aleatorio simple

Tipos de muestreo Aleatorio


sistemático
Probabilístico
Aleatorio
estratificado

Aleatorio por
Tipos de conglomerados
muestreo

Por conveniencia

No probabilístico En cadena

Discrecional

Alba Isabel García Giraldo | Economista | Curso de Estadística Descriptiva y Probabilidad | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Tipos de muestreo:
Probabilísticos
Se fundamentan en el principio de la equiprobabilidad. Son los tipos de muestreo más
recomendables.

Aleatorio simple

Aleatorio
sistemático
Probabilístico
Aleatorio
estratificado

Aleatorio por
conglomerados

Alba Isabel García Giraldo | Economista | Curso de Estadística Descriptiva y Probabilidad | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Tipos de muestreo:
Probabilísticos
1. Aleatorio simple:
• Es la técnica de muestreo probabilístico más representativa.
• Todo el proceso de muestreo se realiza en un paso.
• Cada sujeto es seleccionado independientemente de los otros miembros de la población.

2. Aleatorio sistemático:
• El primer sujeto es obtenido mediante MAS.
• A continuación se selecciona un sujeto de acuerdo a un intervalo 𝑘 (salto sistemático):
• 𝑘 = 𝑁Τ𝑛
𝑁: tamaño de la población
𝑛: tamaño deseado de la muestra

Alba Isabel García Giraldo | Economista | Curso de Estadística Descriptiva y Probabilidad | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Tipos de muestreo:
Probabilísticos
2. Aleatorio sistemático:
Ejemplo:
• Se tiene una población de 64 individuos. 𝑁 = 64
• Se re quiere una muestra de 12 unidades experimentales. 𝑛 = 12
• El salto sistemático corresponde a: 𝑘 = 64Τ12 = 5,33෠ ≈ 5

Alba Isabel García Giraldo | Economista | Curso de Estadística Descriptiva y Probabilidad | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Tipos de muestreo:
Probabilísticos
3. Aleatorio estratificado:
• Separa los elementos de la población en grupos/estratos de acuerdo con características.
• Respeta el principio de fracción de muestreo constante.
• Se utiliza MAS dentro de cada subgrupo.
• Género, religión, estrato social, edad, nacionalidad, nivel de estudios, raza: ejemplos de grupos.

Estratos
A B C Total n necesario:
Tamaño poblacional 100 200 300 600 565
Fracción de muestreo 0,17 0,33 0,50
Tamaño muestral 94 188 283

Alba Isabel García Giraldo | Economista | Curso de Estadística Descriptiva y Probabilidad | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Tipos de muestreo:
Probabilísticos
3. Aleatorio estratificado:
1

Alba Isabel García Giraldo | Economista | Curso de Estadística Descriptiva y Probabilidad | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Tipos de muestreo:
Probabilísticos
3. Aleatorio estratificado:
¿Cuándo y para qué emplearlo?
• La población es heterogénea y el MAS no permite reflejar esta heterogeneidad.
• Garantizar la participación de todos los subgrupos de una población, inclusive lo más pequeños e
inaccesibles.
• Resaltar un determinado subgrupo.
• Observar relaciones entre dos o más subgrupos.

Alba Isabel García Giraldo | Economista | Curso de Estadística Descriptiva y Probabilidad | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Tipos de muestreo:
Probabilísticos
4. Aleatorio por conglomerados:
• Se muestrean conglomerados geográficos: ciudades, estados, barrios, manzanas.
• Se elaboran los conglomerados y su elección se hace mediante MAS o aleatorio sistemático.
• Su diferencia con el aleatorio estratificado: no utiliza todos los estratos de la población, pueden o no
estar incluidos todos los subgrupos o estratos.
• Algunos individuos no estarán representados: es una técnica de muestreo no representativa de la
población.

Alba Isabel García Giraldo | Economista | Curso de Estadística Descriptiva y Probabilidad | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Tipos de muestreo:
Probabilísticos
4. Aleatorio por conglomerados:

Alba Isabel García Giraldo | Economista | Curso de Estadística Descriptiva y Probabilidad | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Tipos de muestreo:
No probabilísticos
Se fundamentan en la discreción de quien toma la muestra. No todos los individuos tienen la misma
posibilidad de ser elegidos. No garantizan la representatividad de la muestra.

Por conveniencia

No En cadena
probabilísticos

Discrecional

Alba Isabel García Giraldo | Economista | Curso de Estadística Descriptiva y Probabilidad | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Tipos de muestreo:
No probabilísticos
1. Por conveniencia:
• Selecciona los individuos que le conviene al investigador por proximidad geográfica o por cualquier otro
motivo.

2. En cadena (bola de nieve):


• Para muestrear sujetos que poseen características poco comunes o raras.
• La muestra se conforma a partir de sugerencias sucesivas.
• No garantiza la representatividad de la muestra, quien la toma no conoce la verdadera distribución de la
población con el rasgo.

3. Discrecional o subjetivo:
• Quien toma la muestra lo hace con base a su juicio profesional.
• Se elige a los individuos intencionalmente porque cumplen con la característica estudiada.

Alba Isabel García Giraldo | Economista | Curso de Estadística Descriptiva y Probabilidad | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Muestreo y distribuciones
muestrales
¿Preguntas?

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Estimación por intervalo

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Estimación por intervalo
Estimadores puntuales:
• No proporcionan el valor exacto de un parámetro poblacional
• El motivo: la limitación de la muestra, las fluctuaciones muestrales.

𝜃መ ≠ 𝜃 ; 𝑥ҧ ≠ 𝜇 ; 𝑝ҧ ≠ 𝑝 ; 𝑠≠𝜎 ; 𝑠2 ≠ 𝜎 2

Estimación por intervalos:


• Plantea límites alrededor de la estimación puntual.
• Toma el estimador puntual, suma y resta una cantidad conocida como margen de error.
• Estimación puntual ± Margen de error.
• Las distribuciones muestrales son claves en el proceso.

𝜃መ ± 𝛿 ; 𝑥ҧ ± 𝛿 ; 𝑝ҧ ± 𝛿 ; 𝑠±𝛿 ; 𝑠2 ± 𝛿

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Estimación por intervalo
Intervalos de confianza

• Intervalo dentro del que se espera se encuentre


el valor de un parámetro con una probabilidad
de acierto. Margen de Margen de
error error
• El coeficiente de confianza hace referencia al “delta” “delta”
nivel de confianza elegido.
• Los niveles de confianza más empleados son Límite inferior
“alfa”
90%, 95% o 99%.
𝑃𝑟(𝜃መ − 𝛿 ≤ 𝜃 ≤ 𝜃መ + 𝛿) = 1 − 𝛼 probabilidad
de errar
Límite superior

Estimador Valor del Coeficiente de


puntual parámetro confianza

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Estimación por intervalo
Intervalos de confianza: para la media
Caso 1: 𝜎 conocida
• Se cuenta con una gran cantidad de datos históricos que permiten calcular la desviación
estándar poblacional antes de tomar la muestra.
• Se emplea la distribución normal estándar.

Caso 2: 𝜎 desconocida
• Es lo que por lo general ocurre.
• La muestra se emplea para calcular la desviación estándar.
• Se emplea la distribución t.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Estimación por intervalo
Intervalos de confianza: para la media
Caso 1: 𝜎 conocida
Compras semanales promedio en las tiendas de café especial “Amor perfecto”.
Cada semana las tiendas de café especial “Amor perfecto” selecciona una muestra aleatoria simple de 100
clientes con objeto de conseguir información acerca de la cantidad que gastan en cada visita a la tienda.
Con base en sus datos históricos la tienda supone que la desviación estándar poblacional es de $9500, datos
históricos confirman también que el valor de las compras es una variable que distribuye normalmente. En la
última semana, la tienda de café especial obtuvo como media muestral 𝑥,ҧ $25000. Ésta permite a la tienda una
estimación puntual de la media poblacional 𝜇.
¿Cómo calcular un intervalo de confianza para la media poblacional a través de la información proporcionada
por la muestra?

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Estimación por intervalo
Intervalos de confianza: para la media

𝑃𝑟 −1,96 ≤ 𝑧 ≤ 1,96 = 0,95

𝑥ҧ − 𝜇
𝑃𝑟 −1,96 ≤ ≤ 1,96 = 0,95
𝜎𝑥ҧ
95%
𝜎 𝜎
𝑃𝑟 𝑥ҧ − 1,96 ≤ 𝜇 ≤ 𝑥ҧ + 1,96 = 0,95
−1,96 1,96 √𝑛 𝑛
El parámetro poblacional
se supone dentro de esta 𝑃𝑟 𝜃መ − 𝛿 ≤ 𝜃 ≤ 𝜃መ + 𝛿 = 1 − 𝛼
área

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Estimación por intervalo
Intervalos de confianza: para la media, 𝜎 conocida

𝑥ҧ = 25.000; 𝜎 = 9.500; 𝜎𝑥ҧ = 950

𝑃𝑟 −1,96 ≤ 𝑧 ≤ 1,96 = 0.95

25.000 − 𝜇
95% 𝑃𝑟 −1,96 ≤
950
≤ 1,96 = 0,95

𝝁 =? 𝑃𝑟 25.000 − 1.862 ≤ 𝜇 ≤ 25.000 + 1.862 = 0,95


−1,96 1,96
El parámetro poblacional 𝑃𝑟 23.138 ≤ 𝜇 ≤ 26.862 = 0,95
se supone dentro de esta
área

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
𝜇

95%

Intervalo dado por


𝑥ҧ1 ± 1,96𝜎𝑥ҧ 𝑥ҧ1
Intervalo dado por
𝑥ҧ2 𝑥ҧ 2 ± 1,96𝜎𝑥ҧ
Intervalo dado por
Intervalo dado por 𝑥ҧ3 𝑥ҧ 3 ± 1,96𝜎𝑥ҧ
𝑥ҧ 4 ± 1,96𝜎𝑥ҧ 𝑥ҧ4
Intervalo dado por
𝑥ҧ5 𝑥ҧ 5 ± 1,96𝜎𝑥ҧ

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Estimación por intervalo
Intervalos de confianza: para la media, 𝜎 conocida
El intervalo para 𝜇 será:

𝜎 𝜎
𝑃𝑟 𝑥ҧ − 𝑧𝛼Τ2 ≤ 𝜇 ≤ 𝑥ҧ + 𝑧𝛼Τ2 =1−𝛼
𝑛 𝑛

Los valores más comunes para 𝑧𝛼Τ2 :


𝑧𝛼Τ2 ⇒ valor de 𝑧 que proporciona un área de 𝛼 Τ2 en la cola superior de la distribución normal.

Nivel de confianza 𝛼 𝛼Τ2 𝑧𝛼Τ2


90% 0,1 0,05 1,645
95% 0,05 0,025 1,960
99% 0,01 0,005 2,576

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Estimación por intervalo
Intervalos de confianza: para la media, 𝜎 conocida
Recomendación práctica:
• Si la población tiene una distribución normal, el intervalo de confianza creado mediante la
distribución normal es exacto.
• Si la población no sigue una distribución normal el intervalo es aproximado.
• En la mayoría de las aplicaciones 𝑛 ≥ 30 basta para una buena estimación de la media
poblacional.
• Si la población no sigue una distribución normal pero es más o menos simétrica, con tamaños
de muestra de 15 puede esperarse una buena aproximación al intervalo de confianza.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Estimación por intervalo
Intervalos de confianza: para una proporción
Caso:
Opinión de los golfistas acerca de los horarios para cursos de golf.
Un estudio realizado por la Federación Colombiana de Gold –FCG- encuestó a 900 golfistas para
conocer su opinión acerca del nivel de satisfacción con los horarios de los cursos de golf. En el
estudio se encontró que 396 golfistas estaban satisfechos con la disponibilidad de horarios. Así, la
estimación puntual de golfistas satisfechos sería 396/900 = 0,44.
¿Cómo poder conocer la proporción poblacional de golfistas que están satisfechos con los horarios?

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Estimación por intervalo
Determinación de 𝑛
En las recomendaciones prácticas hemos hablado de la importancia del tamaño de la muestra, a
continuación dos fórmulas para hallar el tamaño de muestra deseado:

2 2
𝑧𝛼Τ2 𝜎 𝑧𝛼Τ2 2 𝜎 2 𝑁
𝑛= 𝑛= 2
𝐸2 𝐸 𝑁 − 1 + 𝑧𝛼Τ2 2 𝜎 2

𝑧𝛼Τ2 ⇒ • Valor de 𝑧 correspondiente a un nivel de confianza.

• Usar 𝑠 de una muestra previa.


𝜎2 ⇒ • Cuando se desconoce se toma como 0.5

• Límite aceptable de error muestral.


𝐸2 ⇒ • Varía entre el 1% (0,01) y 9% (0,09).
• Queda a criterio del encuestador.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Estimación por intervalo
¿Preguntas?

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Pruebas de hipótesis

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Pruebas de hipótesis
Generalidades
• Las PH sirven para confirmar si una afirmación acerca del valor un parámetro debe o no ser
rechazada.
• A estas afirmaciones (que pueden ser o no correctas) se les conoce como hipótesis estadísticas.
• Lo primero que se debe hacer es formular un valor tentativo para el parámetro.
• Surgen así la hipótesis nula y la hipótesis alternativa.

𝐻0 ⇒ Hipótesis nula
𝐻1 ⇒ Hipótesis alternativa: contradice 𝐻0

• Conclusión: 𝐻0 y 𝐻1 son contrarias, una de las dos es verdadera no ambas.


• Las PH se basan en información muestral existe la probabilidad de errar.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Pruebas de hipótesis
Generalidades
• Las PH para un parámetro asumen una de las siguientes formas, donde 𝜇0 es el valor supuesto
para el parámetro:

𝐻0 : 𝜇 = 𝜇0 𝐻0 : 𝜇 ≤ 𝜇0 𝐻0 : 𝜇 ≥ 𝜇0
𝐻1 : 𝜇 ≠ 𝜇0 𝐻1 : 𝜇 > 𝜇0 𝐻1 : 𝜇 < 𝜇0
Prueba de dos colas Pruebas de una cola

• Importante resaltar: la igualdad siempre figurará en la hipótesis nula 𝑯𝟎 .


• Las PH se basan en información muestral existe la probabilidad de errar.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Tipos de errores
Las PH tienen como finalidad aceptar 𝐻0 cuando es verdadera, rechazar 𝐻0 cuando
𝐻1 es verdadera.

Situación en la población
𝐻0 verdadera 𝐻1 verdadera
Se acepta 𝐻0 Conclusión Error tipo II
correcta
Conclusión
Se rechaza 𝐻0 Error tipo I. Conclusión
correcta

El nivel de significancia 𝛼 es la probabilidad de cometer un error tipo I cuando 𝐻0 es


considerada verdadera como igualdad.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Pruebas de hipótesis
Para la media
Caso 1: 𝜎 conocida
• Se cuenta con una gran cantidad de datos históricos que permiten calcular la desviación
estándar poblacional antes de tomar la muestra.
• Se emplea la distribución normal estándar.

Caso 2: 𝜎 desconocida
• Es lo que por lo general ocurre.
• La muestra se emplea para calcular la desviación estándar.
• Se emplea la distribución t.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Pruebas de hipótesis
Para la media: 𝜎 conocida ⇒ prueba de una cola
𝐻1 será quien determina la dirección de la prueba:

Prueba de cola derecha Prueba de cola izquierda

𝐻0 : 𝜇 ≤ 𝜇0 𝐻0 : 𝜇 ≥ 𝜇0
𝐻1 : 𝜇 > 𝜇0 𝐻1 : 𝜇 < 𝜇0

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Pruebas de hipótesis
Para la media: 𝜎 conocida ⇒ prueba de una cola
Caso:
Llenado de las latas de café.
La Superintendencia de Industria y Comercio SIC, realiza periódicamente estudios estadísticos con
objeto de comprobar las afirmaciones de los fabricantes acerca de sus productos.
La etiqueta de una lata grande de café dice que la lata contiene 3 libras de café. La SIC sabe que el
proceso de producción no permite llenar las latas con 3 libras exactas de café por lata. Mientras la
media poblacional del peso de llenado sea por lo menos 3 libras por lata, los derechos del
consumidor estarán protegidos.
La SIC interpreta que la información de la etiqueta de una lata grande de café tiene una media
poblacional del peso de llenado de por lo menos 3 libras por lata. Se toma una muestra de 36 latas, y
se encuentra que su media muestral es de 2,92 libras por lata, con una desviación estándar histórica
de 0,18.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Pruebas de hipótesis
Para la media: 𝜎 conocida ⇒ prueba de una cola
1. Generación de 𝐻0 y 𝐻1 , la media hipotética 𝜇0 es 3.

𝐻0 : 𝜇 ≥ 3
𝐻1 : 𝜇 < 3

2. Selección de un nivel de significancia 𝛼:


Por lo general se emplea 1% o 5%.
Es la probabilidad de cometer un error tipo 1.

𝛼 = 0,01

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Pruebas de hipótesis
Para la media: 𝜎 conocida ⇒ prueba de una cola
Se cuenta con la siguiente información:

𝑛 = 36
𝜇0 = 3
𝑥ҧ = 2,92
𝜎 = 0,18

Si 𝑥ҧ < 3, los resultados muestrales despiertan dudas sobre lo que establece la


hipótesis nula. Lo que se busca saber es cuánto menor que 3 libras debe ser la
media muestral para declarar que la diferencia es significativa.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Pruebas de hipótesis
Para la media: 𝜎 conocida ⇒ prueba de una cola
3. Cálculo del estadístico de prueba
Servirá para responder si la media muestral se aleja lo suficiente del valor hipotético como
para rechazar 𝐻0 .

𝑥ҧ − 𝜇0
𝑧=
𝜎Τ 𝑛

2,92 − 3
𝑧= = −2,67
0,18Τ 36

𝑧
−2,67 0

𝑥
2,92 3

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Pruebas de hipótesis
Para la media: 𝜎 conocida ⇒ prueba de una cola
4. Método del p-valor:
Indica la probabilidad de obtener un valor del estadístico de prueba tan pequeño o menor
que el obtenido con la muestra.
Valor del p-valor:
0,0038 ¿interpretación?

Regla de decisión:
Rechazar 𝐻0 si p-valor ≤ 𝛼

Nivel de significancia elegido:


𝛼 = 0,01
𝑧
−2,67 0 Decisión:
0,0038 Se rechaza 𝐻0 : 𝜇 ≥ 3 a un nivel de
𝑥 significancia del 1%.
2,92 3
Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Pruebas de hipótesis
Para la media: 𝜎 conocida ⇒ prueba de una cola
5. Método del valor crítico:
Es el mayor valor del estadístico de prueba que hará que se rechace 𝐻0 .
Depende del nivel de significancia elegido.

Nivel de confianza 𝛼 𝑧𝛼
90% 10% 1,285
95% 5% 1,645
99% 1% 2,325

𝑧0,01 = 2,325

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Pruebas de hipótesis
Para la media: 𝜎 conocida ⇒ prueba de una cola
5. Método del valor crítico:

Valor crítico:
−2,325 ¿interpretación?

Zona de aceptación Regla de decisión:


de 𝑯𝟎 Rechazar 𝐻0 si z ≤ −𝑧𝛼
Zona de rechazo
de 𝑯𝟎
Decisión:
𝑧 Se rechaza 𝐻0 : 𝜇 ≥ 3 a un nivel de
−2,67 −2,325
significancia del 1%.
0,0038

0,01
𝑥
2,92 3
Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Pruebas de hipótesis
Para la media: 𝜎 conocida ⇒ prueba de una cola
5. Conclusión:
A un nivel de significancia del 1% la media del peso de llenado de las latas de café es
significativamente inferior a tres libras por lata. ¿Deberá la SIC tomar medidas correctivas
contra la empresa?

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Pruebas de hipótesis
Para la media: 𝜎 conocida ⇒ prueba de dos colas
𝐻1 será quien determina la dirección de la prueba:

Prueba de dos colas

𝐻0 : 𝜇 = 𝜇0
𝐻1 : 𝜇 ≠ 𝜇0

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Pruebas de hipótesis
Para la media: 𝜎 conocida ⇒ prueba de dos colas
1. Generación de 𝐻0 y 𝐻1 , la media hipotética 𝜇0 es 3.

𝐻0 : 𝜇 = 3
𝐻1 : 𝜇 ≠ 3

2. Selección de un nivel de significancia 𝛼:


Por lo general se emplea 1% o 5%.
Es la probabilidad de cometer un error tipo 1.
𝛼 = 0,01

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Pruebas de hipótesis
Para la media: 𝜎 conocida ⇒ prueba de dos colas
Se cuenta con la siguiente información:

𝑛 = 36
𝜇0 = 3
𝑥ҧ = 2,92
𝜎 = 0,18

Si 𝑥ҧ ≠ 3, los resultados muestrales despertarán dudas sobre lo que establece la


hipótesis nula. La empresa podría ser multada, o podría estar llenando las latas con
más de lo establecido generando pérdidas.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Pruebas de hipótesis
Para la media: 𝜎 conocida ⇒ prueba de dos colas
4. Método del p-valor:
Indica la probabilidad de obtener un valor del estadístico de prueba tan pequeño o
menor/tan grande o mayor que el obtenido con la muestra.

Valor del p-valor:


0,0076 ¿interpretación?

Regla de decisión:
Rechazar 𝐻0 si p-valor ≤ 𝛼

Nivel de significancia elegido:


𝑧 𝛼 = 0,01
−2,67 0 2,67
0,0038 0,0038 Decisión:
𝑥 Se rechaza 𝐻0 : 𝜇 = 3 a un nivel de
2,92 3 3,08 significancia del 1%.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Pruebas de hipótesis
Para la media: 𝜎 conocida ⇒ prueba de dos colas
4. Método del valor crítico: Regla de decisión:
Rechazar 𝐻0 si 𝑧 ≤ −𝑧𝛼Τ2 o si 𝑧 ≥ 𝑧𝛼Τ2

Nivel de 𝛼 𝛼 Τ2 𝑧𝛼Τ2
confianza

Zona de aceptación 90% 0,1 0,05 1,645


de 𝑯𝟎 95% 0,05 0,025 1,960
Zona de rechazo Zona de rechazo
de 𝑯𝟎 de 𝑯𝟎 99% 0,01 0,005 2,576
𝑧
−2,67 −2,58 2,58 2,67 Decisión:
0,0038 0,0038 Se rechaza 𝐻0 : 𝜇 = 3 a un nivel de
significancia del 1%.
0,005 0,005
𝑥
2,92 3 3,08
Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Pruebas de hipótesis
Para la media: 𝜎 conocida ⇒ prueba de dos colas
5. Conclusión:
A un nivel de significancia del 1% la media del peso de llenado de las latas de café es
significativamente diferente a tres libras por lata.
¿Deberá la SIC tomar medidas correctivas contra la empresa?
¿Podría estar la empresa incurriendo en pérdidas?

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Pruebas de hipótesis
Para la media: 𝜎 conocida ⇒ reglas de decisión
Las reglas de decisión dependen del tipo de prueba.
Prueba de cola inferior Prueba de cola superior Prueba de dos colas
𝐻0 : 𝜇 ≥ 𝜇0 𝐻0 : 𝜇 ≤ 𝜇0 𝐻0 : 𝜇 = 𝜇0
Hipótesis
𝐻1 : 𝜇 < 𝜇0 𝐻1 : 𝜇 > 𝜇0 𝐻1 : 𝜇 ≠ 𝜇0
𝑥ҧ − 𝜇0 𝑥ҧ − 𝜇0 𝑥ҧ − 𝜇0
Estadístico de prueba 𝑧= 𝑧= 𝑧=
𝜎Τ 𝑛 𝜎Τ 𝑛 𝜎Τ 𝑛
Regla de decisión mediante Rechazar 𝐻0 si: Rechazar 𝐻0 si: Rechazar 𝐻0 si:
p-valor p-valor ≤ 𝛼 p-valor ≤ 𝛼 p-valor ≤ 𝛼

Rechazar 𝐻0 si:
Regla de decisión mediante Rechazar 𝐻0 si: Rechazar 𝐻0 si: 𝑧 ≤ −𝑧𝛼Τ2
valor crítico 𝑧 ≤ −𝑧𝛼 𝑧 ≥ 𝑧𝛼 o si
𝑧 ≥ 𝑧𝛼Τ2

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Pruebas de hipótesis
Para una proporción
• Buscan probar la diferencia entre 𝑝ҧ y un valor hipotético 𝑝0 .
• Pueden asumir cualquiera de estas formas:

𝐻0 : 𝑝ҧ = 𝑝0 𝐻0 : 𝑝ҧ ≤ 𝑝0 𝐻0 : 𝑝ҧ ≥ 𝑝0
𝐻1 : 𝑝ҧ ≠ 𝑝0 𝐻1 : 𝑝ҧ > 𝑝0 𝐻1 : 𝑝ҧ < 𝑝0
Prueba de dos colas Pruebas de una cola

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Pruebas de hipótesis
Para una proporción
Caso:
Participación de las mujeres en las pistas de karts.
En los años anteriores 20% de los corredores de karts eran mujeres. Para aumentar la proporción de
mujeres, se realizó una promoción especial. Un mes después de realizada la promoción, el directivo
de la pista solicita un estudio estadístico para determinar si la proporción de mujeres ha aumentado
en la pista. Se considera una muestra de 400 corredores, donde 100 de ellos son mujeres.
Como el objetivo es determinar si la proporción de mujeres ha aumentado, ¿cuáles son las hipótesis
que deben ponerse a prueba?

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Pruebas de hipótesis
Para una proporción
1. Generación de 𝐻0 y 𝐻1
𝐻0 : 𝑝 ≤ 0,20
𝐻1 : 𝑝 > 0,20

2. Elección de 𝛼
𝛼 = 0,05

3. Cálculo del estadístico de prueba 𝑧:


𝑝ҧ − 𝑝0 𝑝ҧ − 𝑝0 0,25 − 0,20
𝑧= = = = 2,50
𝜎𝑝ҧ 𝑝0 (1 − 𝑝0 ) 0,20(1 − 0,20)
𝑛 400

4. Probar mediante el p-valor y el valor crítico.


5. Concluir.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Pruebas de hipótesis
Para una proporción ⇒ reglas de decisión
Las reglas de decisión dependen del tipo de prueba.
Prueba de cola inferior Prueba de cola superior Prueba de dos colas
𝐻0 : 𝑝 ≥ 𝑝0 𝐻0 : 𝑝 ≤ 𝑝0 𝐻0 : 𝑝 = 𝑝0
Hipótesis
𝐻1 : 𝑝 < 𝑝0 𝐻1 : 𝑝 > 𝑝0 𝐻1 : 𝑝 ≠ 𝑝0
𝑝ҧ − 𝑝0 𝑝ҧ − 𝑝0 𝑝ҧ − 𝑝0
𝑧= 𝑧= 𝑧=
Estadístico de prueba 𝑝0 (1 − 𝑝0 ) 𝑝0 (1 − 𝑝0 ) 𝑝0 (1 − 𝑝0 )
𝑛 𝑛 𝑛
Regla de decisión mediante Rechazar 𝐻0 si: Rechazar 𝐻0 si: Rechazar 𝐻0 si:
p-valor p-valor ≤ 𝛼 p-valor ≤ 𝛼 p-valor ≤ 𝛼

Rechazar 𝐻0 si:
Regla de decisión mediante Rechazar 𝐻0 si: Rechazar 𝐻0 si: 𝑧 ≤ −𝑧𝛼Τ2
valor crítico 𝑧 ≤ −𝑧𝛼 𝑧 ≥ 𝑧𝛼 o si
𝑧 ≥ 𝑧𝛼Τ2

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Pruebas de hipótesis:
¿Preguntas?

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Teoría de pequeñas muestras

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Teoría de pequeñas muestras
Empleo de la t-Student
Usar la normal estándar.

Si 𝜎 desconocida usar 𝑠

𝑛 ≥ 30
Usar la normal

estándar
no
sí 𝜎 conocida

𝑋~𝑁 no Usar la t-Student

Usar una prueba


no
no paramétrica
Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Teoría de pequeñas muestras
Intervalos de confianza: para la media, 𝜎 desconocida
• Hemos dicho que cuando 𝜎 es desconocida, debemos emplear la muestra para
calcular no solo la estimación puntual sino además la desviación estándar.
• Ya no usamos la distribución normal estándar sino la distribución t.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Teoría de pequeñas muestras
Intervalos de confianza: para la media, 𝜎 desconocida
La distribución t
• Es una familia de curvas, cada una determinada por un parámetro llamado grados de libertad
𝑔𝑙.
• 𝑔𝑙 = (𝑛 − 1)
• A medida que crecen los grados de libertad la diferencia entre la distribución t y la normal
desaparece.

𝑥෤ − 𝜇 𝑥෤ − 𝜇
𝑧= 𝑡=
Normal 𝜎Τ 𝑛 𝑠Τ 𝑛
t-Student

Colas más pesadas que la normal


Media en el centro de la campana

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Teoría de pequeñas muestras
Intervalos de confianza: para la media, 𝜎 desconocida

𝑠 𝑠
𝑃𝑟 𝑥ҧ − 𝑡𝛼Τ2 ≤ 𝜇 ≤ 𝑥ҧ + 𝑡𝛼Τ2 =1−𝛼
𝑛 𝑛
1−𝛼
𝑡𝛼Τ2 ⇒ valor de 𝑡 que proporciona un área de 𝛼 Τ2
en la cola superior de la distribución t
−𝑡𝛼Τ2 𝝁 =? 𝑡𝛼Τ2
Página 563 (Apéndice III)
Murray R. Spiegel y Larry J. Stephens

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Teoría de pequeñas muestras
Intervalos de confianza: para la media, 𝜎 desconocida
Crear un IC del 95% para 𝑥 ̅= 9.312 con 𝑠 = 4.007 con 𝑛 = 25.

Desarrollo:
Sabemos que 𝛼 = 0,05 por lo tanto 𝛼Τ2 = 0,025
Necesitamos hallar en la tabla el valor de 𝑡0,025:24 .
Éste será 2,06, es decir 𝑡0,025:24 = 2,06

El IC estará dado por:


𝑠 𝑠
𝑃𝑟 𝑥ҧ − 𝑡𝛼Τ2 ≤ 𝜇 ≤ 𝑥ҧ + 𝑡𝛼Τ2 =1−𝛼
𝑛 𝑛

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Teoría de pequeñas muestras
Intervalos de confianza: conclusión
• Para la media poblacional:
• Con 𝜎 conocida:
𝜎 𝜎
𝑃𝑟 𝑥ҧ − 𝑧𝛼Τ2 ≤ 𝜇 ≤ 𝑥ҧ + 𝑧𝛼Τ2 =1−𝛼
𝑛 𝑛

• Con 𝜎 desconocida
𝑠 𝑠
𝑃𝑟 𝑥ҧ − 𝑡𝛼Τ2 ≤ 𝜇 ≤ 𝑥ҧ + 𝑡𝛼Τ2 =1−𝛼
𝑛 𝑛

• Para una proporción:


𝑃𝑟 𝑝ҧ − 𝑧𝛼Τ2 𝜎𝑝ҧ ≤ 𝑝 ≤ 𝑝ҧ + 𝑧𝛼Τ2 𝜎𝑝ҧ = 1 − 𝛼

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Teoría de pequeñas muestras
P.H. para la media: 𝜎 desconocida ⇒ prueba de una cola
Caso:
Calificación del aeropuerto José María Córdoba
Una revista de viajes de negocios desea clasificar los aeropuertos nacionales de Colombia de acuerdo
con una evaluación hecha por la población de viajeros de negocios. Se usa una escala de evaluación
que va desde un mínimo de 0 hasta un máximo de 10, y aquellos aeropuertos que obtengan una
media mayor que 7 serán considerados como aeropuertos de servicio superior.
Para obtener los datos de evaluación, el personal de la revista entrevista una muestra de 25 viajeros
de negocios de cada aeropuerto.
En la muestra tomada en el aeropuerto José María Córdoba de Rio Negro, la media muestral es 7,25 y
la desviación estándar muestral es 1,052. De acuerdo con estos datos muestrales, ¿deberá ser
designado como un aeropuerto de servicio superior?

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Teoría de pequeñas muestras
P.H. para la media: 𝜎 desconocida ⇒ prueba de una cola
1. Generación de 𝐻0 y 𝐻1 Regla de decisión:
𝐻0 : 𝜇 ≤ 7 Rechazar 𝐻0 si 𝑡 ≥ 𝑡𝛼
𝐻1 : 𝜇 > 7

2. Elección de 𝛼
𝛼 = 0,05

3. Cálculo del estadístico de prueba 𝑡. Zona de


𝑥ҧ − 𝜇0 7,25 − 7 aceptación de
𝑡= = ≈ 1,19 Zona de
𝑠Τ 𝑛 1,052Τ25 𝑯𝟎
rechazo de 𝑯𝟎

4. Método del valor crítico. 𝑡


𝑡0,05 ; 24 = 1,71 0 1,19 1,71

𝑥
5. ¿Conclusión? 7 7,25

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Teoría de pequeñas muestras
P.H. para la media: 𝜎 desconocida ⇒ prueba de dos colas
1. Generación de 𝐻0 y 𝐻1 Regla de decisión:
𝐻0 : 𝜇 = 7 Rechazar 𝐻0 si 𝑡 ≤ −𝑡𝛼Τ2 ó 𝑡 ≥ 𝑡𝛼Τ2
𝐻1 : 𝜇 ≠ 7

2. Elección de 𝛼
𝛼 = 0,05

3. Cálculo del estadístico de prueba 𝑡.


𝑥ҧ − 𝜇0 7,25 − 7
𝑡= = ≈ 1,19 Zona de aceptación
𝑠Τ 𝑛 1,052Τ25 de 𝑯𝟎
Zona de rechazo Zona de rechazo
de 𝑯𝟎 de 𝑯𝟎
4. Método del valor crítico.
𝑡0,025 ; 24 = 2,06 𝑡
−2,06 −1,19 0 1,19 2,06
5. ¿Conclusión? 𝑥
7 7,25
Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Teoría de pequeñas muestras
P.H. para la media: 𝜎 desconocida ⇒ reglas de decisión
Las reglas de decisión dependen del tipo de prueba.
Prueba de cola inferior Prueba de cola superior Prueba de dos colas
𝐻0 : 𝜇 ≥ 𝜇0 𝐻0 : 𝜇 ≤ 𝜇0 𝐻0 : 𝜇 = 𝜇0
Hipótesis
𝐻1 : 𝜇 < 𝜇0 𝐻1 : 𝜇 > 𝜇0 𝐻1 : 𝜇 ≠ 𝜇0
𝑥ҧ − 𝜇0 𝑥ҧ − 𝜇0 𝑥ҧ − 𝜇0
Estadístico de prueba 𝑡= 𝑡= 𝑡=
sΤ 𝑛 sΤ 𝑛 sΤ 𝑛
Regla de decisión mediante Rechazar 𝐻0 si: Rechazar 𝐻0 si: Rechazar 𝐻0 si:
p-valor p-valor ≤ 𝛼 p-valor ≤ 𝛼 p-valor ≤ 𝛼

Rechazar 𝐻0 si:
Regla de decisión mediante Rechazar 𝐻0 si: Rechazar 𝐻0 si: 𝑡 ≤ −𝑡𝛼Τ2
valor crítico 𝑡 ≤ −𝑡𝛼 𝑡 ≥ 𝑡𝛼 o si
𝑡 ≥ 𝑡𝛼Τ2

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Tercera parte:
Estadística Inferencial Intermedia
Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Alba Isabel García Giraldo | Economista
Inferencia estadística
Para 𝜇1 − 𝜇2
• Lo que interesa ahora es hallar la diferencia entre dos medias o proporciones
poblacionales.
• ¿Existe realmente una diferencia entre el salario devengado por hombres y
mujeres? ¿Cuáles son los límites de esta diferencia?
• ¿Existe diferencia entre el número de piezas defectuosas producidas por dos
máquinas?
• También es posible para proporciones.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
Para 𝜇1 − 𝜇2 ⇒ Para muestras independientes ⇒ 𝜎1 y 𝜎2 conocidas:

• Las dos muestras deben provenir de poblaciones diferentes.


• Las poblaciones deben seguir una distribución normal.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
Para 𝜇1 − 𝜇2 ⇒ Para muestras independientes ⇒ 𝜎1 y 𝜎2 conocidas:
Intervalo de confianza:

𝑥ҧ1 − 𝑥ҧ2 ⇒ estimador puntual de ⇒ 𝜇1 − 𝜇2 ¿Qué ocurre si dentro del intervalo está el número
0?
𝜎2 1 𝜎2 2
𝜎𝑥ҧ1−𝑥ҧ2 = + ⇒ error estándar Es importante considerar quién es 𝑥ҧ1 y quién 𝑥ҧ2
𝑛1 𝑛2
de tal manera que sepamos si la diferencia es
𝑥ҧ1 − 𝑥ҧ2 ± 𝑀𝑎𝑟𝑔𝑒𝑛 𝑑𝑒 𝑒𝑟𝑟𝑜𝑟 negativa o positiva y poder concluir
correctamente.
𝑥ҧ1 − 𝑥ҧ2 ± 𝛿
Funcionan para esta prueba tamaños de muestra
𝑥ҧ1 − 𝑥ҧ2 ± 𝑧𝛼Τ2 𝜎𝑥ҧ1−𝑥ҧ2 𝑛1 ≥ 30 y 𝑛2 ≥ 30

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
Para 𝜇1 − 𝜇2 ⇒ Para muestras independientes ⇒ 𝜎1 y 𝜎2 conocidas:
Prueba de hipótesis:
• Lo que por lo general se quiere saber es si realmente existe diferencia entre las medias.
• Conviene así suponer que 𝐷0 = 0
• La prueba puede tomar cualquiera de estas formas:

𝐻0 : 𝜇1 − 𝜇2 = 𝐷0 𝐻0 : 𝜇1 − 𝜇2 ≤ 𝐷0 𝐻0 : 𝜇1 − 𝜇2 ≥ 𝐷0
𝐻1 : 𝜇1 − 𝜇2 ≠ 𝐷0 𝐻1 : 𝜇1 − 𝜇2 > 𝐷0 𝐻1 : 𝜇1 − 𝜇2 < 𝐷0

Prueba de dos colas Pruebas de una cola

𝑥ҧ1 − 𝑥ҧ2 − 𝐷0
• El estadístico de prueba será ⇒ 𝑧 =
𝜎 21 𝜎 2 2
+
𝑛1 𝑛2

• Se toma la decisión de acuerdo al p-valor y al valor crítico.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
Para 𝜇1 − 𝜇2 ⇒ Para muestras independientes ⇒ 𝜎1 y 𝜎2 conocidas:

Prueba de hipótesis en Excel:


Prueba z para medias de dos muestras

ARGELIA ARIGUANÍ
Media 282,14 282,43
Varianza (conocida) 696 2537
Observaciones 21 7
Diferencia hipotética de las medias 0
z -0,0144
P(Z<=z) una cola 0,49
Valor crítico de z (una cola) 1,64
P(Z<=z) dos colas 0,99
Valor crítico de z (dos colas) 1,96

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
Para 𝜇1 − 𝜇2 ⇒ Para muestras independientes ⇒ 𝜎1 y 𝜎2 desconocidas:
Intervalo de confianza:

𝑥ҧ1 − 𝑥ҧ2 ⇒ estimador puntual de ⇒ 𝜇1 − 𝜇2 Para hallar el valor de 𝑡𝛼Τ2 necesitamos el


número de grados de libertad gl.
𝑠21 𝑠2 2
𝑠𝑥ҧ1−𝑥ҧ2 = + ⇒ error estándar Los software estadísticos los calculan fácilmente
𝑛1 𝑛2

𝑥ҧ1 − 𝑥ҧ2 ± 𝑀𝑎𝑟𝑔𝑒𝑛 𝑑𝑒 𝑒𝑟𝑟𝑜𝑟

𝑥ҧ1 − 𝑥ҧ2 ± 𝛿

𝑥ҧ1 − 𝑥ҧ2 ± 𝑡𝛼Τ2 𝑠𝑥ҧ1−𝑥ҧ2

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
Para 𝜇1 − 𝜇2 ⇒ Para muestras independientes ⇒ 𝜎1 y 𝜎2 desconocidas:
Prueba de hipótesis:
𝑥ҧ1 − 𝑥ҧ2 − 𝐷0
• El estadístico de prueba será ⇒ 𝑡 =
𝑠 21 𝑠 2 2
𝑛1 + 𝑛2

• Se toma la decisión de acuerdo al p-valor y al valor crítico.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
Para 𝜇1 − 𝜇2 ⇒ Para muestras independientes ⇒ 𝜎1 y 𝜎2 desconocidas:

Prueba de hipótesis en Excel:


Prueba t para dos muestras suponiendo varianzas desiguales Preferiblemente usar tamaños de muestras
iguales.
ARGELIA ARIGUANÍ
Media 282,14 282,43 Los resultados son buenos siempre y cuando
Varianza 730,93 2960,95 𝑛1 + 𝑛2 ≥ 20 aún cuando la población no sea
Observaciones 21 7 normal.
Diferencia hipotética de las medias 0
Grados de libertad 7
Estadístico t -0,0134
P(T<=t) una cola 0,49
Valor crítico de t (una cola) 1,89
P(T<=t) dos colas 0,99
Valor crítico de t (dos colas) 2,36

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
Para 𝜇1 − 𝜇2 ⇒ Para muestras pareadas
• En esta oportunidad no se emplean dos muestras de poblaciones diferentes sino que se emplea
una muestra bajo dos métodos que se prueban en condiciones similares.
• Por ejemplo: cuál es el tiempo promedio que toma un grupo de trabajadores en realizar un
proceso con un método A y con un método B.
• Este diseño conduce a menores errores muestrales.
• El IC y la PH se aplica sobre la columna de la diferencia.
• En este tipo de diseño cada elemento de la muestra proporciona dos observaciones.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
Para 𝜇1 − 𝜇2 ⇒ Para muestras pareadas:
Prueba de hipótesis:
• Puede presentarse bajo la siguiente forma, ya que se quiere mirar cuál es mayor que otra.

𝐻0 : 𝜇𝑑 = 𝐷0 𝐻0 : 𝜇𝑑 ≤ 𝐷0 𝐻0 : 𝜇𝑑 ≥ 𝐷0
𝐻1 : 𝜇𝑑 ≠ 𝐷0 𝐻1 : 𝜇𝑑 > 𝐷0 𝐻1 : 𝜇𝑑 < 𝐷0
Prueba de dos colas Pruebas de una cola

𝑑ҧ − 𝜇𝑑
• El estadístico de prueba será ⇒ 𝑡 =
𝑠𝑑 Τ 𝑛
• Los grados de libertad equivalen a 𝑛 − 1

• Se toma la decisión de acuerdo al p-valor y al valor crítico.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
Para 𝜇1 − 𝜇2 ⇒ Para muestras pareadas:
Prueba de hipótesis en Excel: ഥ ± 𝒕𝜶Τ𝟐 𝒔𝒅 Τ 𝒏
Intervalo de confianza ⇒ 𝒅
Prueba t para medias de dos muestras emparejadas

Método A Método B
Media 11 10
Varianza 5 4
Observaciones 18 18
Coeficiente de correlación de Pearson -0,34
Diferencia hipotética de las medias 0
Grados de libertad 17
Estadístico t 1,1125
P(T<=t) una cola 0,14
Valor crítico de t (una cola) 1,74
P(T<=t) dos colas 0,28
Valor crítico de t (dos colas) 2,11

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
Acerca de una varianza poblacional
Caso:
Tiempos de llegada.
Una empresa produce y envasa jabón líquido en unos recipientes. Según estudios realizados, la media
de llenado de 25 recipientes fue de 275 ml, la cual es aceptable. La empresa descubrió que a pesar de
que la media muestral es aceptable, la varianza poblacional calculada es de 4,5 ml. La empresa desea
que haya poca variabilidad en los envases, desea que la varianza poblacional sea de 5 ml o menos.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
Acerca de una varianza poblacional
𝑠 2 ⇒ estimador puntual de ⇒ 𝜎 2

Para hacer inferencia estadística para 𝜎 2 a través de 𝑠 2 es necesario reconocer la distribución


muestral de la cantidad:

(𝑛 − 1)𝑠 2
𝜎2

La cual sigue una distribución 𝜒 2 con 𝑛 − 1 gl, siempre y cuando se tome una muestra aleatoria de
tamaño 𝑛 de una población normal.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
Acerca de una varianza poblacional ⇒ Distribución 𝜒 2 (chi-cuadrado)
Supongamos para 𝑛 = 20
es decir 19 gl.

97,5%
𝜒 2 0,975 = 8,91

Donde 𝛼 denota un área a la derecha


del valor chi cuadrado.

2,5%
𝜒 2 0,025 = 32,9
𝜒2𝛼

10%
𝜒 2 0,1 = 27,2
Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
Acerca de una varianza poblacional ⇒ Distribución 𝜒 2 (chi-cuadrado)
Supongamos para 𝑛 = 45
es decir 44 gl.

Donde 𝛼 denota un área a la derecha


del valor chi cuadrado.

90%

𝜒2𝛼 𝜒 2 0,95 = 34,8 𝜒 2 0,05 = 67,5

𝜒 2 0,95 ≤ 𝜒 2 ≤ 𝜒 2 0,05

2
(𝑛 − 1)𝑠 2
𝜒 0,95 ≤ 2
≤ 𝜒 2 0,05
𝜎

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
Acerca de una varianza poblacional ⇒ Distribución 𝜒 2 (chi-cuadrado)

Supongamos para 𝑛 = 45
es decir 44 gl.
𝜒 2 0,95 ≤ 𝜒 2 ≤ 𝜒 2 0,05

(𝑛 − 1)𝑠 2
𝜒2 0,95 ≤ ≤ 𝜒 2
0,05
𝜎2

90%
(𝑛 − 1)𝑠 2 𝑛 − 1 𝑠 2

2 ≤ 𝜎2 ≤ 2 ⇒ Intervalo de confianza
𝜒 2 0,95 = 34,8 𝜒 2 0,05 = 67,5 𝜒 𝛼 Τ2 𝜒 1−𝛼Τ2

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
Acerca de una varianza poblacional ⇒ Distribución 𝜒 2 (chi-cuadrado)
Prueba de hipótesis:
• Puede tomar cualquiera de las siguientes formas:

𝐻0 : 𝜎 2 = 𝜎 2 0 𝐻0 : 𝜎 2 ≤ 𝜎 2 0 𝐻0 : 𝜇𝑑 ≥ 𝐷0
𝐻1 : 𝜎 2 ≠ 𝜎 2 0 𝐻1 : 𝜎 2 > 𝜎 2 0 𝐻1 : 𝜇𝑑 < 𝐷0
Prueba de dos colas Pruebas de una cola
2
2
(𝑛 − 1)𝑠
• El estadístico de prueba será ⇒ 𝜒 =
𝜎 20
• Los grados de libertad serán 𝑛 − 1

• Se toma la decisión de acuerdo al p-valor y al valor crítico.

• Ejemplos: caso página 440 (una cola), caso página 442 (dos colas).

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
Acerca de una varianza poblacional ⇒ reglas de decisión
Las reglas de decisión dependen del tipo de prueba.
Prueba de cola inferior Prueba de cola superior Prueba de dos colas
𝐻0 : 𝜎 2 ≥ 𝜎02 𝐻0 : 𝜎 2 ≤ 𝜎02 𝐻0 : 𝜎 2 = 𝜎02
Hipótesis
𝐻1 : 𝜎 2 < 𝜎02 𝐻1 : 𝜎 2 > 𝜎02 𝐻1 : 𝜎 2 ≠ 𝜎02
(𝑛 − 1)𝑠 2 (𝑛 − 1)𝑠 2 (𝑛 − 1)𝑠 2
Estadístico de prueba 2
𝜒 = 2
𝜒 = 2
𝜒 =
𝜎 20 𝜎 20 𝜎 20
Regla de decisión mediante Rechazar 𝐻0 si: Rechazar 𝐻0 si: Rechazar 𝐻0 si:
p-valor p-valor ≤ 𝛼 p-valor ≤ 𝛼 p-valor ≤ 𝛼

Rechazar 𝐻0 si:
Regla de decisión mediante Rechazar 𝐻0 si: Rechazar 𝐻0 si: 2
𝜒 2 ≤ 𝜒(1−𝛼)
2
valor crítico 𝜒 2 ≤ 𝜒(1−𝛼) 𝜒 2 ≤ 𝜒𝛼2 o si
𝜒 2 ≤ 𝜒𝛼2

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
Acerca de dos varianzas poblacionales
Caso:
Tiempo en dejar/recoger pasajeros
Un colegio está por renovar el contrato del servicio de autobús para el año entrante y debe decidirse
entre dos empresas que prestan el servicio, la empresa A y la empresa B. Como medida de la calidad
del servicio se emplea la varianza en los tiempos en que llega a recoger/dejar a los estudiantes. Poca
varianza indica un mejor servicio, un servicio de mayor calidad.
Si las varianzas de las dos empresas son iguales, el colegio elegirá la empresa que ofrezca mejores
condiciones financieras. Pero si hay una diferencia significativa en las varianzas, el colegio preferirá
la empresa con la menor varianza o mejor servicio.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
Acerca de dos varianzas poblacionales ⇒ Distribución 𝐹
• Para comparar dos varianzas poblacionales es necesario obtener dos muestras
aleatorias independientes.
• Se requiere suponer que las varianzas son iguales y que provienen de poblaciones
normalmente distribuidas.
• Las pruebas de la distribución 𝐹 siempre serán una prueba de cola derecha.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
Acerca de dos varianzas poblacionales ⇒ Distribución 𝐹
La distribución muestral de la razón:

𝑠 21
𝑠22

De dos muestras aleatorias independientes sigue una distribución 𝐹 con (𝑛 − 1) gl en el numerador


y (𝑛 − 1) gl en el denominador.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
Acerca de dos varianzas poblacionales ⇒ Distribución 𝐹
Prueba de hipótesis:
• Puede tomar cualquiera de las siguientes formas:

𝐻0 : 𝜎 21 = 𝜎 2 2 𝐻0 : 𝜎 21 ≤ 𝜎 2 2
𝐻1 : 𝜎 21 ≠ 𝜎 2 2 𝐻1 : 𝜎 21 > 𝜎 2 2
Prueba de dos colas Prueba de una cola
• La población 1 debe indicar la varianza muestral mas grande.

• El estadístico de prueba será ⇒ 𝑠 21 Τ𝑠 2 2

• Se toma la decisión de acuerdo al p-valor y al valor crítico.

• La distribución 𝐹 siempre se basará en pruebas de cola derecha.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
Acerca de dos varianzas poblacionales ⇒ Distribución 𝐹 ⇒ Dos colas
Caso (continuación):
Tiempo en dejar/recoger pasajeros
En una muestra de 26 tiempos de llegada de la empresa A la varianza muestral es de 48, y en una
muestra de 16 tiempos de llegada de la empresa B la varianza muestral es de 20.

Como la varianza de la empresa A es mayor será la población 1. Planteamos una prueba de hipótesis
de dos colas ya que estamos suponiendo que las dos varianzas son iguales.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
Acerca de dos varianzas poblacionales ⇒ Distribución 𝐹 ⇒ Dos colas
Prueba de hipótesis:

𝐻0 : 𝜎 21 = 𝜎 2 2
𝐻1 : 𝜎 21 ≠ 𝜎 2 2

Empresa A ⇒ 𝑛 = 26, 𝜎 21 = 48
Empresa B ⇒ 𝑛 = 16, 𝜎 2 2 = 20
Estadístico de prueba ⇒ 𝑠 21 Τ𝑠 2 2 = 48Τ20 = 2,4
Suponiendo 𝛼 = 0,10 con 25 gl en el numerador y 15 gl en el denominador el valor crítico 𝐹𝛼Τ2 será
2,28.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
Acerca de dos varianzas poblacionales ⇒ Distribución 𝐹 ⇒ Dos colas
Prueba de hipótesis:

𝐻0 : 𝜎 21 = 𝜎 2 2
𝐻1 : 𝜎 21 ≠ 𝜎 2 2

El estadístico de prueba cae en la zona de


rechazo de 𝐻0 .
Zona de
aceptación de 𝐻0 Se recomienda al colegio optar por la
Zona de empresa que tiene menor varianza.
rechazo de 𝐻0

2,28 2,4

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
Acerca de dos varianzas poblacionales ⇒ Distribución 𝐹 ⇒ Una cola
Caso:
Actitudes de los hombres y las mujeres frente a asuntos políticos
Para estudiar las actitudes frente a los asuntos políticos actuales se emplea una muestra de 31 hombres y otra de
41 mujeres. Al investigador que realiza el estudio le interesa saber si los datos muestrales indican que entre las
mujeres hay mayor variación en las actitudes respecto de los asuntos políticos que entre los hombres. En la
forma de la prueba de hipótesis dada arriba, las mujeres serán la población 1 y los hombres la población 2.
Rechazar 𝐻0 dará al investigador el respaldo estadístico necesario para concluir que las mujeres muestran
mayor variación en las actitudes respecto a los asuntos políticos.
Con la varianza muestral de las mujeres en el numerador y la varianza muestral de los hombres en el
denominador, la distribución 𝐹 tendrá 40 grados de libertad en el numerador y 30 grados de libertad en el
denominador.
En esta prueba de hipótesis se usa 𝛼 = 0,05 como nivel de significancia. Como resultado de la prueba se
encontró una varianza muestral para las mujeres 𝑠 21 = 120 y una varianza muestral para los hombres 𝑠 2 2 =
80.

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
Acerca de dos varianzas poblacionales ⇒ Distribución 𝐹 ⇒ Una cola
𝐻0 : 𝜎 2 𝑚𝑢𝑗𝑒𝑟𝑒𝑠 ≤ 𝜎 2 ℎ𝑜𝑚𝑏𝑟𝑒𝑠
𝐻1 : 𝜎 2 𝑚𝑢𝑗𝑒𝑟𝑒𝑠 > 𝜎 2 ℎ𝑜𝑚𝑏𝑟𝑒𝑠

2
El estadístico de prueba será ⇒ 𝑠 1 120
= = 1,50
𝑠22 80
Valor crítico 𝐹0,05 para 40 gl en el numerador y 30 gl en el denominador ⇒ 1,79

Zona de
aceptación de 𝐻0
Zona de
rechazo de 𝐻0

1,50 1,79
Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
Acerca de dos varianzas poblacionales ⇒ Distribución 𝐹 ⇒ Una cola

Prueba de hipótesis en Excel:

Prueba F para varianzas de dos muestras

Hombres Mujeres
Media 2,9729898 3,5208356
Varianza 5,2844162 4,6346371
Observaciones 26 31
Grados de libertad 25 30
F 1,1402006
P(F<=f) una cola 0,3625301
Valor crítico para F (una cola) 1,8782491

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ
Inferencia estadística
Acerca de dos varianzas poblacionales ⇒ reglas de decisión
Las reglas de decisión dependen del tipo de prueba.
Prueba de cola superior Prueba de dos colas
𝐻0 : 𝜎12 ≤ 𝜎22 𝐻0 : 𝜎12 = 𝜎22
Hipótesis
𝐻1 : 𝜎12 > 𝜎22 𝐻1 : 𝜎12 ≠ 𝜎22

𝑠12 𝑠12
Estadístico de prueba 𝐹= 2 𝐹= 2
𝑠2 𝑠2
Regla de decisión mediante Rechazar 𝐻0 si: Rechazar 𝐻0 si:
p-valor p-valor ≤ 𝛼 p-valor ≤ 𝛼

Regla de decisión mediante Rechazar 𝐻0 si: Rechazar 𝐻0 si:


valor crítico 𝐹 ≥ 𝐹𝛼 𝐹 ≥ 𝐹𝛼Τ2

Alba Isabel García Giraldo | Economista | Curso de Estadística Inferencial | Facultad de Ciencias Económicas y Administrativas | USBBOGOTÁ

También podría gustarte