Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA APLICADA
3 créditos
Profesor Autor:
Ing. Víctor Márquez, Msc, PhD
Titulaciones Semestre
• ECONOMÍA
Tercero
1
Índice
Tabla de contenido
2
Resultado de aprendizaje de la asignatura
ESTADÍSTICA APLICADA
Tema 1. Introducción
3
Conceptos Básicos
Cuadro Resumen
Parámetro Estimador ˆ
Descripción (Desconocido) Distribución
Poblacional (Conocido)
Hipótesis Muestral
Z (Normal)
Promedio X y
“T” (T Student)
Z (Normal)
Diferencia de
dos Promedios
1 − 2 X1 − X 2 y
“T” (T Student)
Varianza 2 S2
2
(Chi-Cuadrado)
Cociente de 2
1 S 1
2
F
dos Varianzas 2
2 S 2
2
(F de Snedecor)
Proporción Z
(Normal)
4
Diferencia de
Z
dos 1 − 2 1 − 2 (Normal)
proporciones
𝑿=12.5 horas
𝜎= 1.8 horas
95% de confianza
Formula:
𝜎
𝑋̅ ± 𝑧1−𝛼/2 ∙
√𝑛
5
Se sustituye en la fórmula:
1.8
12.5 ± 𝑧0,975*
√48
S
X t n −1, 2
n
Ejemplo:
Se desea hacer un estudio del tiempo que se tarda un cliente haciendo fila para comprar
un producto en un establecimiento determinado. Para ello se muestrea a siete clientes y
se le toma el tiempo que tardaron en la fila antes de pagar su producto (en minutos): 9.8;
10.2; 10.4; 9.8; 10.0; 10.2 y 9.6 horas. Encuentre un intervalo de confianza del 95% para
la media del tiempo.
Datos:
n= 7
Para poder obtener el promedio (𝑋) y desviación estándar (S ) se debe utilizar los
siguientes datos: 9.8; 10.2; 10.4; 9.8; 10.0; 10.2; 9.6 horas.
𝑿= 10
S= 0.28
6
95% de confianza
Formula:
S
X t n −1, 2
n
Se sustituye en la fórmula:
0.28
10 ± (𝑡7−1;𝛼/2 )*
√7
10 ± (𝑡6;0,025) * 0.1058
10 ± 2.447 * 0.1058
10 ± 0.2588
0.2588 = 10.2588
10 ± {
0.2588 = 9.7412
Se interpreta el intervalo:
(9.7412 < 𝜇 < 10.2588)
El verdadero promedio del tiempo de demora en la fila esta entre 9.7412 y 10.2588
minutos; con una confianza del 95%.
Para la estimación por intervalos de confianza para la diferencia de medias, igual que en
la sección anterior, existen dos casos.
• Las varianzas son conocidas: Si las varianzas de las poblaciones de estudio son
conocidas la fórmula para estimar la diferencia de medias a través de un intervalo
de confianza es la siguiente:
𝜎12 𝜎22
𝑋̅1 − 𝑋̅1 ± 𝑍1−𝛼 ∙ √ +
2 𝑛1 𝑛2
7
Ejercicio: Se desea estudiar el tiempo de efecto de dos marcas de sedantes de fuerte
impacto para pacientes críticos. Cuarenta observaciones de la marca A mostraron un
tiempo medio efectivo de 32 horas, 45 observaciones de la marca B mostraron un tiempo
medio de 30 horas. La experiencia indica que las desviaciones estándar para ambas
marcas son iguales a cuatro horas. Calcule un intervalo de confianza del 95% para la
diferencia media del tiempo efectivo de las dos marcas? ¿Cuál marca recomienda usted?
Datos:
• 𝑋̅1 = 32
• 𝑋̅2 = 30
• 𝑛1 =40
• 𝑛1 =45
• 𝜎1 =4
• 𝜎2 =4
• 𝑍1−𝛼 = 𝑍0,975 = 1,96
2
16 16
32 − 30 ± 1,96 ∙ √ +
40 45
2 ± 1,70
El intervalo de la diferencia del tiempo promedio de efectividad de las marcas A y B es
(0,3 ; 3,70) horas. Como en el intervalo no incluye el cero. Podemos afirmar con un 95%
de confianza que la efectividad promedio de ambas marcas es diferente, siendo mayor la
de la marca A (esto por ser un intervalo netamente positivo).
8
• Las varianzas son desconocidas: En el caso de que las varianzas son
desconocidas, existen dos métodos para estimar las diferencias de medias:
o Asumiendo varianzas iguales (𝜎12 = 𝜎22 )
1 1
𝑋̅1 − 𝑋̅1 ± 𝑡𝑛1 +𝑛2 −2;𝛼/2 ∙ 𝑆𝑝 √ +
𝑛1 𝑛2
𝑆12 𝑆22
𝑋̅1 − 𝑋̅1 ± 𝑡𝑣;𝛼/2 ∙ √ +
𝑛1 𝑛2
2
𝑆2 𝑆2
( 1 + 2)
𝑛1 𝑛2
𝑣= 2 2
𝑆2 𝑆2
( 1) ( 2)
𝑛1 𝑛2
𝑛1 − 1 + 𝑛2 − 1
EJEMPLO:
Se desea hacer una comparar el número de clientes atendidos en dos sucursales en un
día. Para ello se seleccionan 10 días de cada sucursal y se registra el número de clientes
atendidos:
sucursal A: 200 230 220 190 202 105 300 206 199 186
sucursal B: 409 290 390 380 310 420 530 430 396 402
𝑆𝑎 =47,74 𝑆𝑏 =65,67
9
Como se asumen varianzas iguales se usará la siguiente formula:
1 1
𝑋̅1 − 𝑋̅1 ± 𝑡𝑛1 +𝑛2 −2;𝛼/2 ∙ 𝑆𝑝 √ +
𝑛1 𝑛2
Primero calculamos 𝑆𝑝
1 1
203,8 − 395,7 ± 𝑡18;0,025 ∙ 57,40√ +
10 10
1 1
−191,9 ± 2,1009 ∙ 57,40√ +
10 10
−191,9 ± 53,93
10
PRUEBA DE HIPÓTESIS
La aceptación de una hipótesis simplemente implica que los datos no dan suficiente
evidencia para rechazarla
El rechazo de una hipótesis implica que los datos dan suficiente evidencia para
rechazarla.
Hipótesis Nula H 0
H 0 : = 5kg ;
H 0 : = 0,5 ;
11
Hipótesis Alternativa H
H : > 8cm;
H : < 0,80;
H : 6meses
Error tipo I
Rechazar H0 Correcto
( )
12
PRUEBA DE HIPOTESIS PARA LA MEDIA DE UNA POBLACIÓN CON
DISTRIBUCIÓN NORMAL
𝑋̅ − 𝜇𝑜
𝑡= 𝑝𝑎𝑟𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒𝑠𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑎
𝑆
√𝑛
4. Se determina la región de rechazo: La región de rechazo se determina
dependiendo del sistema de hipotesis planteado:
𝐻𝑜: 𝜇 = 𝜇𝑜 𝑣𝑠 𝐻𝐴 : 𝜇 ≠ 𝜇𝑜
𝐻𝑜: 𝜇 = 𝜇𝑜 𝑣𝑠 𝐻𝐴 : 𝜇 > 𝜇𝑜
𝐻𝑜: 𝜇 = 𝜇𝑜 𝑣𝑠 𝐻𝐴 : 𝜇 < 𝜇𝑜
13
En el caso de desconocer la varianza poblacional. La región de rechazo se construye con
una distribución t-student con n-1 grado de libertad.
Ejemplo: Un consulto bursátil afirma que tarda, en promedio, 14 horas en analizar la bolsa
de valores en busca de estrategias financieras. Para probar esa afirmación se tomó una
muestra de 48 operaciones, a los cuales se le pregunto el tiempo que tarda en realizar el
análisis. Se obtuvo un promedio de 12.5 días. Se sabe por experiencia que la desviación
estándar poblacional del tiempo es 1.8 horas. Realice una prueba de hipotesis para
confirmar la afirmación del consultor. Use un nivel de significancia del 5%.
𝐻𝑜: 𝜇 = 14 𝑣𝑠 𝐻𝐴 : 𝜇 < 14
𝑋̅ − 𝜇𝑜
𝑍= 𝜎
√𝑛
12,5 − 14
𝑍= = −5,77
1,8
√48
14
4. Determinar la región de rechazo:
Gráfica de distribución
Normal; Media=0; Desv.Est.=1
0,4
0,3
Densidad
0,2
0,1
0,05
0,0
-1,645 0
X
15