Está en la página 1de 15

ECONOMÍA EN LINEA

ESTADÍSTICA APLICADA
3 créditos

Profesor Autor:
Ing. Víctor Márquez, Msc, PhD

Titulaciones Semestre

• ECONOMÍA
Tercero

Tutorías: El profesor asignado se publicará en el entorno virtual de aprendizaje


online.utm.edu.ec), y sus horarios de conferencias se indicarán en la sección CAFETERÍA
VIRTUAL.

1
Índice

Tabla de contenido

Resultado de aprendizaje de la asignatura ................................................................................................... 3


...................................................................................................................................................................... 3
Unidad 3 Inferencia Estadística ..................................................................................................................... 3
Tema 1. Introducción .................................................................................................................................... 3
Conceptos Básicos ........................................................................................................................................ 4
Estimación para la media de una Población.................................................................................................. 5
Estimación para la diferencia de dos promedios poblacionales 1 −  2 ..................................................... 7

cuando las muestras son independientes ..................................................................................................... 7


PRUEBA DE HIPÓTESIS ................................................................................................................................ 11
PRUEBA DE HIPOTESIS PARA LA MEDIA DE UNA POBLACIÓN CON DISTRIBUCIÓN NORMAL ..................... 13

2
Resultado de aprendizaje de la asignatura

Dotar al estudiante de las capacidades y destrezas necesarias para aplicar técnicas de


análisis estadístico a la resolución de problemas de diversa índole en los que es necesario
realizar gran variedad de tareas específicas que acompañan a cualquier proceso de
análisis de datos, con el objeto de elaborar conclusiones que faciliten la toma de
decisiones en situaciones complejas que se caracterizan por estar sometidas a distintos
grados de incertidumbre.

ESTADÍSTICA APLICADA

Unidad 3 Inferencia Estadística

Resultado de aprendizaje de la unidad: Construir estimaciones y pruebas de hipótesis


con la finalidad de pronosticar y refutar afirmaciones, con un nivel de confianza, sobre los
parámetros desconocidos bajo supuestos de normalidad

Tema 1. Introducción

La estimación consiste en un número obtenido mediante el estadístico muestral,


llamado estimación puntual o por medio de dos valores numéricos que definen un
intervalo, el cual contiene el parámetro estimado con cierto grado de confianza, llamado
intervalo de confianza.
Razón para estimar
Las estimaciones se utilizan porque se deben tomar decisiones racionales, sin que tengan
la información pertinente completa y con una gran incertidumbre acerca de lo que pueda
deparar el futuro, pero con la intención de que las estimaciones constituyan una buena
aproximación de los parámetros desconocidos de la población.

3
Conceptos Básicos

Parámetro: (  ) Es una característica de la población, es por lo general desconocido.


Ejemplos:
• 𝜇: media poblacional
• 𝜋: Proporción Poblacional
• 𝜎 2 : Varianza poblacional
También se puede estimar funciones de parámetros poblacionales. Esto con la
finalidad de comparar características de dos poblaciones. Ejemplo:
• 𝜇1 − 𝜇2 : Diferencia de medias poblacionales
𝜎12
• : Razón de varianzas poblacionales
𝜎22

Estadístico: Es una función de la muestra aleatoria ejemplo:

• 𝑋̅: Media Muestral


• 𝑆 2 : Varianza muestral

Estimador: ( ˆ ) Es un estadístico que tiene como objetivo predecir (estimar) un


parámetro desconocido o una función de parámetros desconocidos. Ejemplo:
• 𝑋̅: Estimador de la media poblacional
• 𝑆 2 : Estimador de la varianza poblacional
• 𝑋̅1 -𝑋̅2 : Estimador de la diferencia de medias poblacional
Estimación: Es el valor que da cuando se evalúa el estimador Ejemplo: X = 55kg

Cuadro Resumen

Parámetro  Estimador ˆ
Descripción (Desconocido) Distribución
Poblacional (Conocido)
Hipótesis Muestral
Z (Normal)
Promedio  X y
“T” (T Student)
Z (Normal)
Diferencia de
dos Promedios
1 −  2 X1 − X 2 y
“T” (T Student)

Varianza 2 S2
2
(Chi-Cuadrado)
Cociente de  2
1 S 1
2

F
dos Varianzas  2
2 S 2
2
(F de Snedecor)
Proporción   Z
(Normal)

4
Diferencia de
Z
dos 1 −  2 1 −  2 (Normal)
proporciones

Estimación para la media de una Población 


Estimación Puntual: El mejor estimador puntual de la media poblacional  esta dado
por la media muestral X

Estimación por Intervalo de confianza.


Para estimar la media poblacional suponiendo normalidad en la población de estudio,
existen dos casos, Cuando la varianza e conocida o desconocida.

• Caso 1 Varianza conocida: Cuando se conoce la desviación estándar poblacional,


sin importar que el tamaño de la muestra sea grande o pequeño y la población de
donde se extrae la muestra es normal. La fórmula para construir una estimación
mediante un intervalo y in nivel de confianza especifico es:
𝜎
𝑋̅ ± 𝑧1−𝛼/2 ∙
√𝑛
Donde:
• 𝑋̅: es la media muestral
𝛼
• 𝑧1−𝛼/2 : es el percentil (1 − 2 ) de la distribución normal estándar
• 𝜎: desviación estándar poblacional
• 𝑛: tamaño de la muestra
Ejemplo: Se toma una muestra de 48 consultores bursátiles, a los cuales se les pregunto
el tiempo que necesitan para analizar la bolsa de valores para nuevas estrategias
financieras. Se obtuvo un promedio de 12.5 horas. Se sabe por experiencia que la
desviación estándar poblacional del tiempo es 1.8 horas. Hallar un intervalo para estimar
el tiempo de recorrido con un 95% de confianza.
Datos:
n=48 consultores.

𝑿=12.5 horas
𝜎= 1.8 horas
95% de confianza
Formula:
𝜎
𝑋̅ ± 𝑧1−𝛼/2 ∙
√𝑛

5
Se sustituye en la fórmula:
1.8
12.5 ± 𝑧0,975*
√48

Buscar el valor de 𝑧0,975 en la tabla “Z”, el cual es 1,96

12.5 ± 1.96 * 0.26


12.5 ± 0.51
0.51 = 11.99
12.5 ± {
0.51 = 13.01
Se interpreta el intervalo:
(11.99 < 𝜇 < 13.01)
El verdadero promedio del tiempo que necesitan para analizar la bolsa de valores entre
11.99 y 13.01 horas con una confianza del 95 %.

• Caso 2: Varianza desconocida.


Cuando se desconoce la desviación estándar poblacional 𝜎, la formula del intervalo
𝛼
de confianza cambia. Se utiliza el percentil de la distribución t de student; y
2
además se sustituye la desviación estándar poblacional ( 𝜎) por la desviación
estándar muestral (S):

S
X  t n −1, 2
n

Ejemplo:
Se desea hacer un estudio del tiempo que se tarda un cliente haciendo fila para comprar
un producto en un establecimiento determinado. Para ello se muestrea a siete clientes y
se le toma el tiempo que tardaron en la fila antes de pagar su producto (en minutos): 9.8;
10.2; 10.4; 9.8; 10.0; 10.2 y 9.6 horas. Encuentre un intervalo de confianza del 95% para
la media del tiempo.

Datos:
n= 7

Para poder obtener el promedio (𝑋) y desviación estándar (S ) se debe utilizar los
siguientes datos: 9.8; 10.2; 10.4; 9.8; 10.0; 10.2; 9.6 horas.

𝑿= 10
S= 0.28

6
95% de confianza

Formula:
S
X  t n −1, 2
n

Se sustituye en la fórmula:

0.28
10 ± (𝑡7−1;𝛼/2 )*
√7

10 ± (𝑡6;0,025) * 0.1058

Buscar el valor de (𝑡6;0,025) en la tabla “t de Student”

10 ± 2.447 * 0.1058
10 ± 0.2588
0.2588 = 10.2588
10 ± {
0.2588 = 9.7412
Se interpreta el intervalo:
(9.7412 < 𝜇 < 10.2588)
El verdadero promedio del tiempo de demora en la fila esta entre 9.7412 y 10.2588
minutos; con una confianza del 95%.

Estimación para la diferencia de dos promedios poblacionales 1 −  2


cuando las muestras son independientes

Para la estimación por intervalos de confianza para la diferencia de medias, igual que en
la sección anterior, existen dos casos.

• Las varianzas son conocidas: Si las varianzas de las poblaciones de estudio son
conocidas la fórmula para estimar la diferencia de medias a través de un intervalo
de confianza es la siguiente:

𝜎12 𝜎22
𝑋̅1 − 𝑋̅1 ± 𝑍1−𝛼 ∙ √ +
2 𝑛1 𝑛2

7
Ejercicio: Se desea estudiar el tiempo de efecto de dos marcas de sedantes de fuerte
impacto para pacientes críticos. Cuarenta observaciones de la marca A mostraron un
tiempo medio efectivo de 32 horas, 45 observaciones de la marca B mostraron un tiempo
medio de 30 horas. La experiencia indica que las desviaciones estándar para ambas
marcas son iguales a cuatro horas. Calcule un intervalo de confianza del 95% para la
diferencia media del tiempo efectivo de las dos marcas? ¿Cuál marca recomienda usted?
Datos:
• 𝑋̅1 = 32
• 𝑋̅2 = 30
• 𝑛1 =40
• 𝑛1 =45
• 𝜎1 =4
• 𝜎2 =4
• 𝑍1−𝛼 = 𝑍0,975 = 1,96
2

Sustituyendo en la formula tenemos:

16 16
32 − 30 ± 1,96 ∙ √ +
40 45

2 ± 1,70
El intervalo de la diferencia del tiempo promedio de efectividad de las marcas A y B es
(0,3 ; 3,70) horas. Como en el intervalo no incluye el cero. Podemos afirmar con un 95%
de confianza que la efectividad promedio de ambas marcas es diferente, siendo mayor la
de la marca A (esto por ser un intervalo netamente positivo).

NOTA: en el caso que el intervalo de confianza hubiese contenido el cero. Entonces


afirmaríamos con un 95% de confianza que la duración media del efecto del sedante
en ambas marcas es igual.

8
• Las varianzas son desconocidas: En el caso de que las varianzas son
desconocidas, existen dos métodos para estimar las diferencias de medias:
o Asumiendo varianzas iguales (𝜎12 = 𝜎22 )

1 1
𝑋̅1 − 𝑋̅1 ± 𝑡𝑛1 +𝑛2 −2;𝛼/2 ∙ 𝑆𝑝 √ +
𝑛1 𝑛2

(𝑛1 − 1) ∙ 𝑆12 + (𝑛2 − 1) ∙ 𝑆22


𝑆𝑝 = √
𝑛1 + 𝑛2 − 2

Asumiendo varianzas diferentes (𝜎12 ≠ 𝜎22 )

𝑆12 𝑆22
𝑋̅1 − 𝑋̅1 ± 𝑡𝑣;𝛼/2 ∙ √ +
𝑛1 𝑛2
2
𝑆2 𝑆2
( 1 + 2)
𝑛1 𝑛2
𝑣= 2 2
𝑆2 𝑆2
( 1) ( 2)
𝑛1 𝑛2
𝑛1 − 1 + 𝑛2 − 1
EJEMPLO:
Se desea hacer una comparar el número de clientes atendidos en dos sucursales en un
día. Para ello se seleccionan 10 días de cada sucursal y se registra el número de clientes
atendidos:

sucursal A: 200 230 220 190 202 105 300 206 199 186
sucursal B: 409 290 390 380 310 420 530 430 396 402

Obtenga el intervalo de confianza para la diferencia del número de clientes atendidos en


las sucursales A y B. con un nivel de confianza del 95%. Asumir varianzas iguales.
Desarrollo:
Primero debemos calcular las medias u desviaciones muestrales.
𝑋̅𝑎 = 203,8 𝑋̅𝑏 =395,7
𝑛𝑎 = 10 𝑛𝑏 =10

𝑆𝑎 =47,74 𝑆𝑏 =65,67

9
Como se asumen varianzas iguales se usará la siguiente formula:

1 1
𝑋̅1 − 𝑋̅1 ± 𝑡𝑛1 +𝑛2 −2;𝛼/2 ∙ 𝑆𝑝 √ +
𝑛1 𝑛2

(𝑛1 − 1) ∙ 𝑆12 + (𝑛2 − 1) ∙ 𝑆22


𝑆𝑝 = √
𝑛1 + 𝑛2 − 2

Primero calculamos 𝑆𝑝

9 ∙ 47,742 + (9) ∙ 65,672


𝑆𝑝 = √ = 57,40
10 + 10 − 2

Ahora sustituimos en la fórmula:

1 1
203,8 − 395,7 ± 𝑡18;0,025 ∙ 57,40√ +
10 10

1 1
−191,9 ± 2,1009 ∙ 57,40√ +
10 10

−191,9 ± 53,93

La verdadera diferencia de los promedios del número de clientes atendidos promedio


entre A y B esta entre (-245,83 y -137,97) con un nivel de confianza de 95%.

Como el intervalo es totalmente negativo, el promedio de la sucursal A es menor que el


B; por lo tanto; La sucursal B atiende más clientes, en promedio, que la sucursal A.

10
PRUEBA DE HIPÓTESIS

¿Qué es una hipótesis?

Es una afirmación con respecto a una característica o parámetro de una o más


poblaciones.

La verdad o falsedad de una hipótesis estadística nunca se sabe con absoluta


certidumbre a menos que examinemos a toda la población

La aceptación de una hipótesis simplemente implica que los datos no dan suficiente
evidencia para rechazarla
El rechazo de una hipótesis implica que los datos dan suficiente evidencia para
rechazarla.

Hipótesis Nula H 0

Una hipótesis nula con respecto a un parámetro poblacional siempre se establecerá de


modo específico un valor “exacto” del parámetro. Ejemplo:

H 0 :  = 5kg ;

H 0 :  = 0,5 ;

11
Hipótesis Alternativa H 

Permite la posibilidad de varios valores al parámetro. Ejemplo:

H  :  > 8cm;

H  :  < 0,80;

H  :   6meses

¿En qué consiste una prueba de hipótesis?


Es una serie de procedimientos que se realiza para probar una hipótesis que se asume
cierta, partiendo de esta premisa se toma una muestra de la población y si la probabilidad
es muy pequeña (digamos menor a un nivel de significancia α) de que esa muestra
pertenece a la población con la hipotesis nula cierta, entonces se rechaza la hipótesis nula
y se acepta la hipótesis alternativa.
En una prueba de hipotesis se pueden cometer dos tipos de errores:
Error Tipo I. Es el rechazo de la hipótesis Nula cuando es verdadera.
Error Tipo II. El no rechazo de la hipótesis nula (aceptarla) cuando es falsa.

H0: VERDADERA H0: FALSA

No rechazar H0 Error tipo II


Correcto
(Aceptar H0) ( )

Error tipo I
Rechazar H0 Correcto
( )

12
PRUEBA DE HIPOTESIS PARA LA MEDIA DE UNA POBLACIÓN CON
DISTRIBUCIÓN NORMAL

La prueba de hipotesis se realiza en cinco pasos sencillos:


1. Se plantea el sistema de hipotesis: Existen tres posibles planteamientos de
hipotesis, dependiendo de la afirmación que se desea contrastar con respecto a la
hipotesis nula. Esto es:
a. 𝐻𝑜: 𝜇 = 𝜇𝑜 𝑣𝑠 𝐻𝐴 : 𝜇 ≠ 𝜇𝑜
b. 𝐻𝑜: 𝜇 = 𝜇𝑜 𝑣𝑠 𝐻𝐴 : 𝜇 > 𝜇𝑜
c. 𝐻𝑜: 𝜇 = 𝜇𝑜 𝑣𝑠 𝐻𝐴 : 𝜇 < 𝜇𝑜
2. Se determina el nivel de significancia: En este paso se fija el nivel del error tipo
1. Por lo general se determina un 1, 5 o 10%. A este nivel de significancia se denota
como α.
3. Se calcula el estadístico de prueba:
𝑋̅ − 𝜇𝑜
𝑍= 𝜎 𝑝𝑎𝑟𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑎
√𝑛

𝑋̅ − 𝜇𝑜
𝑡= 𝑝𝑎𝑟𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒𝑠𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑎
𝑆
√𝑛
4. Se determina la región de rechazo: La región de rechazo se determina
dependiendo del sistema de hipotesis planteado:

𝐻𝑜: 𝜇 = 𝜇𝑜 𝑣𝑠 𝐻𝐴 : 𝜇 ≠ 𝜇𝑜

𝐻𝑜: 𝜇 = 𝜇𝑜 𝑣𝑠 𝐻𝐴 : 𝜇 > 𝜇𝑜

𝐻𝑜: 𝜇 = 𝜇𝑜 𝑣𝑠 𝐻𝐴 : 𝜇 < 𝜇𝑜

13
En el caso de desconocer la varianza poblacional. La región de rechazo se construye con
una distribución t-student con n-1 grado de libertad.

5. Decisión: se rechaza la hipotesis nula si el estadístico de prueba pertenece a la


región de rechazo.

Ejemplo: Un consulto bursátil afirma que tarda, en promedio, 14 horas en analizar la bolsa
de valores en busca de estrategias financieras. Para probar esa afirmación se tomó una
muestra de 48 operaciones, a los cuales se le pregunto el tiempo que tarda en realizar el
análisis. Se obtuvo un promedio de 12.5 días. Se sabe por experiencia que la desviación
estándar poblacional del tiempo es 1.8 horas. Realice una prueba de hipotesis para
confirmar la afirmación del consultor. Use un nivel de significancia del 5%.

1. Primer paso se plantea el sistema de hipotesis:

𝐻𝑜: 𝜇 = 14 𝑣𝑠 𝐻𝐴 : 𝜇 < 14

2. Se determina el nivel de significancia α=0,05

3. Se calcula el estadístico de prueba: Como se conoce la varianza se utiliza:

𝑋̅ − 𝜇𝑜
𝑍= 𝜎
√𝑛

12,5 − 14
𝑍= = −5,77
1,8
√48

14
4. Determinar la región de rechazo:

Gráfica de distribución
Normal; Media=0; Desv.Est.=1

0,4

0,3
Densidad

0,2

0,1

0,05
0,0
-1,645 0
X

Como -5,77 es menor a -1,645. Es decir, la región de rechazo contiene al estadístico de


prueba. Por lo tanto, se rechaza la hipotesis nula y se acepta la alternativa. Se concluye
que la afirmación del consultor es cierta.

15

También podría gustarte