Está en la página 1de 42

Universidad Nacional de San Agustín

Asignatura
ECONOMETRÍA I

Sesión 6
Mg. José Luis Rojas López
Temario:

 Distribución F
 Distribución ANOVA
Logro de la Sesión

Al final de la sesión, el estudiante comprenderá la


prueba de ANOVA
INICIO

Cuando se trata de dinero solo hay una frase hecha: ¡Mas!


(André Kostolany)
Transformación
Caso. Resolver el Aula.

• Citrus Calen es un nuevo limpiador multiusos a prueba en el mercado, del cual se han
colocado exhibidores en tres lugares distintos dentro de varios supermercados. A
continuación se reporta la cantidad de botellas de 12 onzas que se vendieron en cada
lugar del supermercado. A un nivel de significancia de 0.05, ¿hay alguna diferencia
entre los promedios de botellas que se vendieron en los tres lugares?
a) Formule las hipótesis nula y alternativa.
b) ¿Cuál es la regla de decisión?
c) Calcule los valores de SS total, SST y SSE.
d) Elabore una tabla ANOVA.
e) ¿Cuál es su decisión respecto de la hipótesis nula?
Cerca de otros
Cerca del pan Cerca de la cerveza
limpiadores

18 12 26
14 18 28
19 10 30
17 16 32
5.- Tratamiento e inferencia sobre pares de medias.

• Esto permite concluir que no todas las medias de tratamiento son iguales. Algunas veces
esta conclusión sería satisfactoria, pero otras se desea conocer cuáles medias de
tratamiento difieren.

INTERVALO DE CONFIANZA DE LA DIFERENCIA ENTRE LAS MEDIAS DE TRATAMIENTO.

1 1
𝑋ത1 − 𝑋ത2 ± 𝑡 𝑀𝑆𝐸 +
𝑛1 𝑛2
donde:
𝑋ത1 = Es la media de la primera muestra.
𝑋ത2 = Es la media de la segunda muestra.
t = Se obtiene del apéndice B.2. Los grados de libertad son iguales a n – k.
MSE es el error medio cuadrático que se obtuvo de la tabla ANOVA [SSE/(n – k)].
𝑛1 = Es el número de observaciones en la primera muestra.
𝑛2 = Es el número de observaciones en la segunda muestra.
• Use el ejemplo anterior sobre las aerolíneas para calcular el intervalo de confianza de la
diferencia entre las calificaciones medias de los pasajeros de las aerolíneas Northern y
Branson. Con un nivel de confianza de 95%,
1 1
87.25 − 69.00 ± 2.101 33.0 + = 18.25 ± 7.79 = 10.46 𝑦 26.04
4 6

Caso. Resolver el Aula.

• Los siguientes datos son las colegiaturas por semestre (en miles de dólares) de una muestra de
universidades privadas en varias regiones de Estados Unidos. A un nivel de significancia de 0.05,
¿se puede concluir que hay una diferencia entre las colegiaturas medias de las diversas
regiones?
a) Formule las hipótesis nula y alternativa.
b) ¿Cuál es la regla de decisión?
c) Elabore una tabla ANOVA. ¿Cuál es el valor del estadístico de prueba?
d) ¿Cuál es su decisión respecto de la hipótesis nula?
e) ¿Puede existir una diferencia significativa entre la colegiatura media en el noreste en
comparación
con la del oeste? Si la hay, desarrolle el intervalo de confianza de 95% de esa diferencia.

Noreste (en miles de Sureste (en miles de Oeste (en miles de


dólares) dolares) dólares)

10 8 7
11 9 8
12 10 6
10 8 7
12 6
6.- Análisis de la varianza de dos vías.

• El beneficio al considerar otros factores es que se reduce la varianza del error. Es decir, si se
reduce el denominador del estadístico F (al reducir la varianza del error o, de manera más
directa, el término SSE), el valor de F será mayor, lo que ocasionará el rechazo de la hipótesis
del tratamiento de medias iguales. En otras palabras, si se puede explicar más la variación,
habrá menos “error”.
Caso. Ejemplo.

• El director de WARTA, Warren Área Tránsito Autos, considera ampliar el servicio de


autobuses del suburbio de Lima al distrito comercial central de Miraflores. Se
consideran cuatro rutas de Miraflores al centro de Lima: 1) por la carretera 6, 2) por
el West Endo, 3) por Hockey, y 4) por la ruta 59. El director realizó varias pruebas
para determinar si había una diferencia entre los tiempos de recorrido medios por las
cuatro rutas. Como habrá muchos conductores distintos, la prueba se diseñó para
que cada conductor manejara a lo largo de todas ellas. A continuación se presenta el
tiempo del recorrido, en minutos, de cada combinación conductor-ruta. A un nivel de
significancia de 0.05, ¿hay alguna diferencia entre los tiempos de recorrido medios a
lo largo de las cuatro rutas? Si elimina el efecto de los conductores, ¿hay alguna
diferencia entre los tiempos de recorrido medios?
ANOVA DE DOS VIAS

Tiempo de recorrido de Miraflores a Lima (minutos)

Conductor Carretera 6 West Endo Hockey Ruta 59

1 Dante 18 17 21 22

2 Zubia 16 23 23 22

3 Carlos 21 21 26 22

4 Salas 23 22 29 25

5 Fidel 25 24 28 28

Paso 1:
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4
𝐻1 : No todas las calificaciones son iguales
Paso 2: Seleccione el nivel de significancia. 𝛼 = 0.5
Paso 3: Determine el estadístico de prueba. El estadístico de prueba es la distribución F

Paso 4: Formule la regla de decisión.

𝐺𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 𝑑𝑒𝑙 𝑛𝑢𝑚𝑒𝑟𝑎𝑑𝑜𝑟 = 𝑘 − 1 = 4 − 1 = 3

𝐺𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 𝑑𝑒𝑙 𝑑𝑒𝑛𝑜𝑚𝑖𝑛𝑎𝑑𝑜𝑟 = 𝑛 − 𝑘 = 20 − 4 = 16

• El valor en esta intersección es 3.24. Por lo tanto, la regla de decisión es rechazar 𝐻0 si el


valor calculado de F es mayor que 3.24.

• Paso 5: Seleccione la muestra, realice los cálculos y tome una decisión. Es conveniente
resumir los cálculos del estadístico F en una tabla ANOVA

• VARIABLE DE BLOQUEO Una segunda variable de tratamiento que, cuando se incluye en el


análisis ANOVA, tendrá el efecto de reducir el término SSE.
𝑆𝑆𝐵 = 𝑘 ෍ 𝑋ത𝑏 − 𝑋ത𝐺 2

Donde:
K = Es el número de tratamientos.
B = Es el número de bloqueos.
𝑋ത𝑏 = Es la media muestral del bloque b.
𝑋ത𝐺 = Es la media global o total.

• SUMA DE ERRORES CUADRÁTICOS, DOS VÍAS. 𝑺𝑺𝑬 = 𝑺𝑺𝒕𝒐𝒕𝒂𝒍 − 𝑺𝑺𝑻 − 𝑺𝑺𝑩

• Para desarrollar este ejercicio vamos a ir paso a paso trabajar con Excel.
ANOVA DE DOS VIAS
Tiempo de recorrido de Miraflores a Lima (minutos)
Conductor Carretera 6 West Endo Hockey Ruta 59 TOTAL
1 Dante 18 17 21 22
456 2 Zubia 16 23 23 22
𝑋ത𝐺 = = 22.8
20 3 Carlos 21 21 26 22
4 Salas 23 22 29 25
5 Fidel 25 24 28 28
Total de la
columna 103 107 127 119 456
n 5 5 5 5 20
Media 20.6 21.4 25.4 23.8 91.2

Tiempo de recorrido de Star a Warren (minutos)

Conductor Carretera 6 West Endo Hocker Ruta 59 TOTAL

Dante 18 23.04 17 33.64 21 3.24 22 0.64


456
22.8 Zubia 16 46.24 23 0.04 23 0.04 22 0.64 𝑋ത𝐺 = = 22.8
20
Carlos 21 3.24 21 3.24 26 10.24 22 0.64

Salas 23 0.04 22 0.64 29 38.44 25 4.84

Fidel 25 4.84 24 1.44 28 27.04 28 27.04

TOTAL 77.4 39.0 79.0 33.8 229.2SStotal


Tiempo de recorrido de Star a Warren (minutos)
Conductor Carretera 6 𝑋 − 𝑋ത𝑁 𝑋 − 𝑋ത𝑁 2 West Endo 𝑋 − 𝑋ത𝑁 𝑋 − 𝑋ത𝑁 2 Hocker 𝑋 − 𝑋ത𝑁 𝑋 − 𝑋ത𝑁 2
Ruta 59 𝑋 − 𝑋ത𝑁 𝑋 − 𝑋ത𝑁 2
TOTAL
1 Dante 18 -2.6 6.76 17 -4.4 19.36 21 -4.4 19.36 22 -1.8 3.24
2 Zubia 16 -4.6 21.16 23 1.6 2.56 23 -2.4 5.76 22 -1.8 3.24
3 Carlos 21 0.4 0.16 21 -0.4 0.16 26 0.6 0.36 22 -1.8 3.24
4 Salas 23 2.4 5.76 22 0.6 0.36 29 3.6 12.96 25 1.2 1.44
5 Fidel 25 4.4 19.36 24 2.6 6.76 28 2.6 6.76 28 4.2 17.64
Total de la
columna 103 0 107 127 119
n 5 0 5 5 5
Media 20.6 53.2 21.4 29.2 25.4 45.2 23.8 28.8 156.4 SSE

SST 72.8

TABLA ANOVA

Fuente de variación Suma de Cuadrados Grados de Libertad Media Cuadrática F

Tratamientos SST k–1 SST/(k – 1) = MST MST/MSE

Error SSE n-k SSE/(n – k) = MSE

Total SS total n-1


TABLA ANOVA

Fuente de variación Suma de Cuadrados Grados de Libertad Media Cuadrática F

Tratamientos 72.8 3 24.27 2.48


Error 156.4 16 9.78
Total 229.20 19

Tiempo de recorrido de Star a Warren (minutos)


Suma de los Media de los
Conductor Carretera 6 West Endo Hocker Ruta 59
conductores conductores

1 Dante 18 17 21 22 78 19.50 43.56


2 Zubia 16 23 23 22 84 21.00 12.96
22.8 3 Carlos 21 21 26 22 90 22.50 0.36
4 Salas 23 22 29 25 99 24.75 15.21
5 Fidel 25 24 28 28 105 26.25 47.61

114.00 119.70 SSB


TABLA ANOVA DE DOS VIAS

Fuente de variación Suma de Cuadrados Grados de Libertad Media Cuadrática F

Tratamientos SST k–1 SST/(k – 1) = MST MST/MSE


Bloques SSB b-1 SSB/(b - 1) = MSB MSB/MSE
Error SSE (k - 1)(b - 1) SSE/(k -1)(b-1) = MSE

Total SS total n-1

TABLA ANOVA DE DOS VIAS

Fuente de variación Suma de Cuadrados Grados de Libertad Media Cuadrática F

Tratamientos 72.80 3 24.27 7.93


Bloques 119.70 4 29.93 9.78
Error 36.70 12 3.06

Total 229.20 19
Caso. Resolver el Aula.

• Riddick Shampoo vende tres tipos de champús: para cabello seco, normal y graso. En la
tabla siguiente se presentan las ventas, en millones de dólares, de los últimos cinco meses.
Con un nivel de significancia de 0.05, compruebe si las ventas medias difieren entre los tres
tipos de champús o según el mes.
VENTAS (MILLONES DE SOLES)

MES SECO NORMAL GRASO

1 Junio 7 9 12

2 Julio 11 12 14

3 Agosto 13 11 8

4 Setiembre 8 9 7

5 Octubre 9 10 13
7.- ANOVA de dos vías con interacción.

• Los resultados muestrales indicaron distintos tiempos medios según las rutas. Quizás esto tan
sólo se relacione con diferencias entre la distancia por las rutas. Los resultados también
indicaron diferencias entre los tiempos de conducción medios de los diversos conductores.

• Tal vez esta diferencia se explique al diferenciar las velocidades promedio de los conductores,
sin importar la ruta. Existe otro efecto que influye en el tiempo de recorrido. A éste se le
denomina efecto de interacción entre la ruta y el conductor sobre el tiempo de recorrido.

• INTERACCIÓN El efecto de un factor sobre una variable de respuesta difiere según el valor
de otro factor.
• Prueba de hipótesis para detectar interacción.
• El siguiente paso es realizar pruebas estadísticas para investigar aún más los efectos de
interacciones posibles.
• ¿Hay alguna interacción entre rutas y conductores?
• ¿Los tiempos de recorrido de los conductores son iguales?
• ¿Los tiempos de recorrido de las rutas son iguales?

• Ahora ANOVA tiene tres conjuntos de hipótesis que se deben probar:

1. 𝐻0 : No hay interacción entre conductores y rutas.


𝐻1 : Hay interacción entre conductores y rutas.
2. 𝐻0 : Las medias de los conductores son iguales.
𝐻1 : Las medias de los conductores no son iguales.
3. 𝐻0 : Las medias de las rutas son iguales.
𝐻1 : Las medias de las rutas no son iguales.:
• La suma cuadrática debida a una posible interacción es:
𝑛 2
𝑆𝑆𝐼 = ෍ ෍ 𝑋ത𝑖𝑗 − 𝑋ത𝑖. − 𝑋ത.𝑗 + 𝑋ത𝐺
𝑏𝑘
Donde:
i = es un subíndice o identificación que representa una ruta.
j = es un subíndice o identificación que representa a un conductor.
k = es el número de niveles del factor A (efecto de la ruta).
b = es el número de niveles del factor B (efecto del conductor).
n = es el número de observaciones.
𝑋ത𝑖𝑗 es el tiempo de recorrido medio en la ruta, i, por el conductor, j. Observe que éstas son las
medias que se trazaron en la grafica anterior.
𝑋ത𝑖. es el tiempo de recorrido medio por la ruta i. Observe que el punto muestra que la media se
calculó el tiempo de todos los conductores. Éstas son las medias de las rutas que se compararon
en la página 434.
𝑋ത.𝑗 es el tiempo de recorrido medio del conductor j. Observe que el punto muestra que la media
se calculó sobre todas las rutas.
• Una vez que se tiene SSI, entonces SSE se determina como:
𝑆𝑆𝐸 = 𝑆𝑆𝑡𝑜𝑡𝑎𝑙 − 𝑆𝑆 𝑓𝑎𝑐𝑡𝑜𝑟 𝐴 − 𝑆𝑆 𝑓𝑎𝑐𝑡𝑜𝑟 𝐵 − 𝑆𝑆𝐼

Caso. Ejemplo.

• Considere los siguientes datos muestrales de un experimento ANOVA de dos factores:


Utilice el nivel de significancia de 0.05 para responder las siguientes preguntas.
a) ¿Hay alguna diferencia entre las medias del tamaño?
b) ¿Hay alguna diferencia entre las medias del peso?
c) ¿Hay alguna interacción significativa entre peso y tamaño?
TAMAÑO
CHICO MEDIANO GRANDE
23 20 11
PESADO 21 32 20
25 26 20
PESO
13 20 11
LIGERO 32 17 23
17 15 8

TAMAÑO
CHICO MEDIANO GRANDE
23 20 11
PESADO 21 32 20
354
25 26 20 𝑋ത𝐺 = = 19.6667
18
PESO
13 20 11
LIGERO 32 17 23
17 15 8
Suma 131 130 93 354
Numero 6 6 6 18
Media 21.8333 21.6667 15.5000
TAMAÑO

CHICO MEDIANO GRANDE


23 11.1109 20 0.1111 11 75.1117
PESADO 21 1.7777 32 152.1103 20 0.1111
25 28.4441 26 40.1107 20 0.1111
19.6667 PESO
13 44.4449 20 0.1111 11 75.1117
LIGERO 32 152.1103 17 7.1113 23 11.1109
17 7.1113 15 21.7781 8 136.1119
244.9991 221.3325 297.6683 764.0000 SStotal

TAMAÑO
CHICO MEDIANO GRANDE
23 1.3611 20 2.7778 11 20.2500
PESADO 21 0.6944 32 106.7778 20 20.2500
25 10.0278 26 18.7778 20 20.2500
𝑋 − 𝑋ത𝑁 2
PESO
13 78.0278 20 2.7778 11 20.2500
LIGERO 32 103.3611 17 21.7778 23 56.2500
17 23.3611 15 44.4444 8 56.2500
Suma 131 216.8333 130 197.3333 93 193.5000 607.6667 SSE
Numero 6 6 6
Media 21.8333 21.6667 15.5000

SST 156.3333
TAMAÑO

CHICO MEDIANO GRANDE SUMA MEDIA


23 20 11 54 18.0000 8.3337
PESADO 21 32 20 73 24.3333 65.3324 22.0000 48.9986
25 26 20 71 23.6667 47.9992 17.3333 49.0014
19.6667 PESO 98.0000 SSB
13 20 11 44 14.6667 75.0010
LIGERO 32 17 23 72 24.0000 56.3325
17 15 8 40 13.3333 120.3346

373.3333
PESADO LIGERO TOTAL
PEQUEÑO 23 21 25 23.0000 13 32 17 20.6667 21.8333
TAMAÑO MEDIANO 20 32 26 26.0000 20 17 15 17.3333 21.6667
GRANDE 11 20 20 17.0000 11 23 8 14.0000 15.5000
22.0000 17.3333 19.6667 MEDIA GLOBAL

19.6667

529 441 625 169 1024 289


400 1024 676 400 289 225
121 400 400 4616 121 529 64 3110 764.0000 SSTotal

FACTOR A 156.3333 SSB 98.0000 FACTOR B 36.3333 SSI SSE 473.3333


TABLA ANOVA CON INTERACCIÓN
Fuente de Suma de
Grados de Libertad Media Cuadrática F
variación Cuadrados

Ruta Factor A k–1 SST/(k – 1) = MSA MSA/MSE


Conductor Factor B b-1 SSB/(b - 1) = MSB MSB/MSE
Interacion SSI (k - 1)(b - 1) SSI/(k - 1)(b - 1) = MSI MSI/MSE
Error SSE n - kb SSE/(n - kb) = MSE
Total SS total n-1

TABLA ANOVA CON INTERACCÓN


Fuente de Suma de
Grados de Libertad Media Cuadrática F
variación Cuadrados

Tamaño 156.3333 2 78.1667 1.98

Peso 98.0000 1 98.0000 2.48

Interacion 36.3333 2 18.1667 0.46

Error 473.3334 12 39.4445

Total 764.0000 17
Caso. Resolver el Aula.

• La American Accor Asociación realizó un estudio para comparar los salarios semanales de
hombres y mujeres empleados en el sector público o privado en contabilidad.
A un nivel de significancia de 0.05:
a) Trace una gráfica de interacción de las medias de los hombres y las mujeres según el sector.
b) Pruebe el efecto de interacción del género y el sector en los salarios.
c) Con base en los resultados del inciso b), realice las pruebas de hipótesis adecuadas para
detectar las diferencias entre las medias de los factores. SECTOR
d) Interprete los resultados en un reporte breve. GENERO PUBLICO PRIVADO
978 1335
1035 1167
HOMBRES 964 1236
996 1317
1117 1192

863 1079
975 1160
MUJERES 999 1063
1019 1110
1037 1093
1.- ¿Qué es el análisis de correlación?

• Cuando se estudia la relación entre dos variables en escala de intervalo (o de razón), es usual
comenzar con un diagrama de dispersión. Este procedimiento proporciona una representación
visual de la relación entre las variables.

• El gerente selecciona una muestra aleatoria de 10 representantes de ventas y determina el


número de llamadas de ventas que cada uno hizo el mes pasado y el número de copiadoras
que vendió. La información muestral esta en el siguiente cuadro.
Número de
Representante de Número de
copiadoras
ventas llamadas de ventas
vendidas

Tom Kely 20 30
Jefry Hall 40 60
Brian Viro 20 40
Gregorio Fins 30 60
Susan Welch 10 30
Carlos Ramirez 10 40
Rich Nilo 20 40
Mike Kien 20 50

Marck Reynolds 20 30
Soni Jones 30 70

• Al revisar los datos se observa que parece haber una relación entre el número de llamadas de
ventas y el número de unidades vendidas. Es decir, los vendedores que hicieron más
llamadas de venta vendieron más unidades. Sin embargo, la relación no es “perfecta” o
exacta. Este grupo de técnicas estadísticas se denomina análisis de correlación.
• ANÁLISIS DE CORRELACIÓN Grupo de técnicas para medir la asociación entre dos variables.

• La idea básica del análisis de correlación es reportar la asociación entre dos variables. Por lo
general, el primer paso es trazar los datos en un diagrama de dispersión.

80 Analisis de Regresion
70

60

50

40

30

20

10

0
0 5 10 15 20 25 30 35 40 45
2.- Coeficiente de correlación.

• El coeficiente de correlación, creado por Karl Pearson alrededor de 1900, describe la fuerza
de la relación entre dos conjuntos de variables en escala de intervalo o de razón. Se designa
con la letra r, y con frecuencia se le conoce como r de Pearson y coeficiente de correlación
producto-momento. Puede adoptar cualquier valor de -1.00 a +1.00, inclusive. Un coeficiente
de correlación de -1.00 o bien de +1.00 indica una correlación perfecta
• COEFICIENTE DE CORRELACIÓN.- Medida de la fuerza de la relación lineal entre dos
variables.
CARACTERÍSTICAS DEL COEFICIENTE DE CORRELACIÓN
1. El coeficiente de correlación de la muestra se identifica con la letra minúscula r.
2. Muestra la dirección y fuerza de la relación lineal (recta) entre dos variables en escala de
intervalo o en escala de razón.
3. Varía de -1 hasta +1, inclusive.
4. Un valor cercano a 0 indica que hay poca asociación entre las variables.
5. Un valor cercano a 1 indica una asociación directa o positiva entre las variables.
6. Un valor cercano a -1 indica una asociación inversa o negativa entre las variables..
FORMULA:
σ 𝑋 − 𝑋ത 𝑌 − 𝑌ത
𝑟=
𝑛 − 1 𝑆𝑋 𝑆𝑌 𝑋 − 𝑋ത 2 𝑌 − 𝑌ത 2
𝑆= 𝑆=
𝑛 −1 𝑛 −1
Representante de Número de llamadas de Número de copiadoras
ventas ventas X vendidas Y 𝑋 − 𝑋ത 𝑌 − 𝑌ത 𝑋 − 𝑋ത 𝑌 − 𝑌ത 𝑋 − 𝑋ത 2 𝑌 − 𝑌ത 2

1 Tom Kely 20 30 -2 -15 30 4 225


2 Jefry Hall 40 60 18 15 270 324 225
3 Brian Viro 20 40 -2 -5 10 4 25
4 Gregorio Fins 30 60 8 15 120 64 225
5 Susan Welch 10 30 -12 -15 180 144 225
6 Carlos Ramirez 10 40 -12 -5 60 144 25
7 Rich Nilo 20 40 -2 -5 10 4 25
8 Mike Kien 20 50 -2 5 -10 4 25
9 Marck Reynolds 20 30 -2 -15 30 4 225
10 Soni Jones 30 70 8 25 200 64 625
220 450 900 760 1850
22 45
S 84.4444 205.5556
S 9.1894 14.3372
REEMPLAZANDO VALORES:
900
𝑟= = 0.759
9 9.1894 14.3372
Caso. Resolver el Aula.

• Hébert Fornitura es un negocio familiar que vende a clientes minoristas en el área de Chicago
desde hace muchos años. Tanto en radio como en televisión e internet, la compañía destaca
sus precios bajos y fáciles términos de crédito. El propietario desea analizar la relación entre las
ventas y la suma de dinero que gastó en publicidad. A continuación se presenta la información
de las ventas y de los gastos publicitarios durante los últimos cuatro meses.
a) El propietario desea pronosticar las ventas con base en los gastos publicitarios. ¿Cuál es la
variable dependiente? ¿Cuál es la variable independiente?
b) Trace un diagrama de dispersión.
c) Determine el coeficiente de correlación.
d) Interprete la fuerza del coeficiente de correlación.
Gastos Ingresos por
Mes
publicitarios ventas

Julio 2 7

Agosto 1 3

Setiembre 3 8

Octubre 4 10
3.- Prueba de la importancia del coeficiente de correlación.

• Recuerde que la gerente de ventas de Copiar Sales de América determinó que la correlación
entre el número de llamadas de ventas y el número de copiadoras vendidas era 0.759, lo que
indicaba una asociación fuerte entre ambas variables.

• Sin embargo, en la muestra había sólo 10 vendedores. ¿Puede ser que la correlación entre la
población sea 0? Esto significaría que la correlación de 0.759 se debió a la casualidad.

Prueba t del Coeficiente de Correlación. FORMULA:


𝑟 𝑛−2
𝑡=
1 − 𝑟2
Práctica

1.- Realizar la practica correspondiente que se encuentra en la actividad 4


Conclusiones:
• La econometría nos propone modelos para aplicarlos en la población
• Se esta conociendo las pruebas de hipotesis de una muestra

También podría gustarte