Está en la página 1de 31

UNIDAD 4

REGRESIÓN Y CORRELACIÓN
LINEAL SIMPLE

Lic. Alejandro F. Grahl


Regresión Lineal Simple
• En la práctica, es frecuente tener que resolver problemas que involucran un
conjunto de variables, de las cuales se sabe que tienen alguna relación entre sí.
Nos ocuparemos de aquellos en los que se vinculan dos variables: x (variable,
independiente o explicativa) e y (variable dependiente o explicada). Entre ellas,
analizaremos únicamente (porque existen otros) el modelo lineal:
• 𝑌 = 𝛽0 + 𝛽1 𝑋 + 𝜀 (recta de regresión lineal poblacional)

𝛽0 𝑒𝑠 𝑙𝑎 𝑜𝑟𝑑𝑒𝑛𝑎𝑑𝑎 𝑎𝑙 𝑜𝑟𝑖𝑔𝑒𝑛 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙


• Donde: ൞ 𝛽1 𝑒𝑠 𝑙𝑎 𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙
𝜀 𝑒𝑠 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑟𝑒𝑠𝑖𝑑𝑢𝑎𝑙 𝑜 𝑝𝑒𝑟𝑡𝑢𝑟𝑏𝑎𝑐𝑖ó𝑛

• Los tres valores son poblacionales; es decir, parámetros de la recta de regresión


lineal poblacional. La ordenada y la pendiente podrán estimarse.
• Se parte de algunos supuestos:
𝜀 𝑡𝑖𝑒𝑛𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑁𝑜𝑟𝑚𝑎𝑙, 𝑒𝑠𝑝𝑒𝑟𝑎𝑛𝑧𝑎 𝑚𝑎𝑡𝑒𝑚á𝑡𝑖𝑐𝑎 𝑛𝑢𝑙𝑎 𝑦 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝜎 2 (𝑙𝑙𝑎𝑚𝑎𝑑𝑎
𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑟𝑒𝑠𝑖𝑑𝑢𝑎𝑙 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙)
Lic. Alejandro F. Grahl
Diagrama de COSTOS VENTAS
40 385
dispersión (o 20 400
nube de puntos) 25 395
20 365
• Un comerciante decide
realizar un estudio acerca 30 475
de la relación entre sus 50 440
ventas (variable explicada)
y los gastos de publicidad 40 490
semanales (en U$S). Elige 20 420
una muestra aleatoria de 12
50 560
semanas del año pasado y
obtiene los siguientes datos: 40 525
25 480
50 510
Lic. Alejandro F. Grahl
• Considerando cada par ordenado 𝑥𝑖 ; 𝑦𝑖 en el que la primera componente es
un valor de la variable explicativa (costos) y la segunda componente un valor de
la variable explicada (ventas), construye el respectivo DIAGRAMA DE
DISPERSIÓN, donde cada para ordenado representa un punto del plano:
600

500

400
ventas

300

200

100

0
0 10 20 30 40 50 60
costos

Lic. Alejandro F. Grahl


Lic. Alejandro F. Grahl
Como no se trata de un modelo determinista, ya que existe una componente aleatoria,
el objetivo del análisis de regresión es encontrar una recta de regresión muestral, que
permita estimar los valores de Y, conocido un valor de X:
𝑦ො = 𝑏0 + 𝑏1 . 𝑥
Como se desconocen los parámetros 𝛽0 y 𝛽1 , deberán calcularse sus respectivos
estimadores 𝑏0 𝑦 𝑏1 . Ellos surgen de la aplicación del llamado “método de los mínimos
cuadrados”. Estos valores minimizan la suma de los cuadrados de los residuos. En esencia,
un residuo es un error en el ajuste del modelo muestral.
Si el conjunto de los n residuos es grande, el ajuste del modelo no es bueno.
Los residuos pequeños son señal de un buen ajuste.
Lo que en definitiva logra dicho método, es que todas las distancias entre cada punto
del diagrama de dispersión y la recta de regresión muestral sean las mínimas posibles.

Lic. Alejandro F. Grahl


Cálculo de las medidas básicas en la regresión
• La aplicación del método de los mínimos cuadrados arroja que:
1 1
• 𝑥 = σ 𝑥𝑖 (promedio o media de x) 𝑦 = σ 𝑦𝑖 (promedio o media de y)
𝑛 𝑛
2 2 2 2
1
𝑆𝑥𝑥 = ෍ 𝑥𝑖 − 𝑥 = ෍ 𝑥𝑖 − ෍ 𝑥𝑖 = ෍ 𝑥𝑖 − 𝑛. 𝑥ҧ 2
𝑛
1
𝑆𝑥𝑦 = ෍ 𝑥𝑖 − 𝑥 ⋅ 𝑦𝑖 − 𝑦 = ෍ 𝑥𝑖 𝑦𝑖 − ෍ 𝑥𝑖 ෍ 𝑦𝑖 = ෍ 𝑥𝑖 𝑦𝑖 − 𝑛. 𝑥.ҧ 𝑦ത
𝑛
2 2 2 2
1
𝑆𝑦𝑦 = ෍ 𝑦𝑖 − 𝑦 = ෍ 𝑦𝑖 − ෍ 𝑦𝑖 = ෍ 𝑦𝑖 − 𝑛. 𝑦ത 2
𝑛

𝑆𝑥𝑥 : 𝑠𝑢𝑚𝑎 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑥


Siendo: ൞ 𝑆𝑥𝑦 : 𝑠𝑢𝑚𝑎 𝑑𝑒 𝑝𝑟𝑜𝑑𝑢𝑐𝑡𝑜𝑠 𝑥𝑦
𝑆𝑦𝑦 : 𝑠𝑢𝑚𝑎 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑦 (𝑜 𝑠𝑢𝑚𝑎 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑡𝑜𝑡𝑎𝑙𝑒𝑠)

Lic. Alejandro F. Grahl


En el ejemplo:
1 2
• 𝑥 = σ 𝑥𝑖 =34,17 • 𝑆𝑥𝑥 = σ 𝑥𝑖 − 𝑛. 𝑥ҧ 2 =1638,9332
𝑛
1 • 𝑆𝑥𝑦 = σ 𝑥𝑖 𝑦𝑖 − 𝑛. 𝑥.ҧ 𝑦=5269,35

• 𝑦 = σ 𝑦𝑖 =453,75
𝑛 2
• 𝑆𝑦𝑦 = σ 𝑦𝑖 − 𝑛. 𝑦ത 2 =42256,25
• σ 𝑥𝑖 2 =15650
𝑆𝑥𝑦
• σ 𝑦𝑖 2 =2512925 • Definimos: ቐ
𝑏1 =
𝑆𝑥𝑥
• σ 𝑥𝑖 𝑦𝑖 =191325 𝑏0 = 𝑦ത − 𝑏1 𝑥ҧ
• Con estos valores: • En el ejemplo: 𝑏1 =3,22 y 𝑏0 =343,71
• Entonces: 𝐲ො = 𝟑𝟒𝟑, 𝟕𝟏 + 𝟑, 𝟐𝟐. 𝐱

Lic. Alejandro F. Grahl


Lic. Alejandro F. Grahl
Algunas conclusiones de la recta de regresión muestral
• 𝐲ො = 𝟑𝟒𝟑, 𝟕𝟏 + 𝟑, 𝟐𝟐. 𝐱
• La pendiente muestral es positiva; esto implica que a
mayor costo en publicidad, mayor venta
• El valor de la pendiente, interpretada en los términos del
problema, indica que: por cada dólar adicional invertido
en publicidad, las ventas aumentan U$S 3,22
• El valor de la ordenada al origen muestral, interpretada en
los términos del problema, indica que si los costos en
publicidad fuesen nulos, las ventas serían de U$S 343,71

Lic. Alejandro F. Grahl


Otras definiciones
• Suma de cuadrados totales: 𝑆𝑦𝑦 = 𝑆𝐶𝑇
• Suma de cuadrados residual: 𝑆𝑦𝑦 − 𝑏1 2 . 𝑆𝑥𝑥 = 𝑆𝐶𝑅
• Suma de cuadrados explicada: 𝑏1 2 . 𝑆𝑥𝑥 = 𝑆𝐶𝐸
• COEFICIENTE DE DETERMINACIÓN:
• Mide la proporción de la dispersión total que se explica por el modelo de
regresión. El porcentaje restante, se debe a la componente aleatoria o
perturbación. Varía entre 0 y 1. Cuanto más cercano a 1 sea, mejor es el ajuste
del modelo lineal a los datos del problema:
2
𝑆𝐶𝐸
𝑅 =
𝑆𝐶𝑇
• El estimador de la varianza residual poblacional 𝜎 2 es la varianza residual
2 𝑆𝐶𝑅
muestral: 𝑆 =
𝑛−2

Lic. Alejandro F. Grahl


En el ejemplo anterior:
• 𝑆𝐶𝑇 = 42256,25
• 𝑆𝐶𝑅 = 25263,13501
• 𝑆𝐶𝐸 = 16993,11499
• 𝑅2 = 0,4021 ≅ 40%
• Es decir, un pobre ajuste del modelo lineal a los datos
• Aproximadamente, el 60% de la dispersión total se debe a
la componente aleatoria o perturbación 𝜀

Lic. Alejandro F. Grahl


Inferencias sobre los parámetros de la recta de
regresión
• Cálculo de la Varianza Residual Muestral:
𝑆𝐶𝑅 25263,13501
• 𝑆2 = = = 2526,313501
𝑛−2 10

• Intervalos de confianza:

• a) Para la ordenada al origen poblacional (𝛽0 ): 𝑏0 ± 𝑡𝑛−2 . 𝑉෠𝑏0


1 𝑥ҧ 2
෠𝑏 =
siendo 𝑉 𝑆2 +
0 𝑛 𝑆𝑥𝑥

• b) Para la pendiente poblacional (𝛽1 ): 𝑏1 ± 𝑡𝑛−2 . 𝑉෠𝑏1


𝑆2
siendo 𝑉෠𝑏1 =
𝑆𝑥𝑥

Lic. Alejandro F. Grahl


• c) Para un valor de la variable explicada 𝑦0 , dado un valor de la variable
explicativa 𝑥0 :
• Hallo el estimador, usando el modelo de regresión muestral: 𝑦0 = 𝑏0 + 𝑏1 . 𝑥0

• El intervalo de confianza será: 𝑦0 ± 𝑡𝑛−2 . 𝑉෠𝑦0


1 𝑥0 −𝑥ҧ 2
siendo 𝑉෠𝑦0 = 𝑆2 1+ +
𝑛 𝑆𝑥𝑥

• Pruebas de hipótesis
• a) Para la ordenada al origen poblacional (𝛽0 ), el estadígrafo de prueba será:
𝑏0 − 𝛽0
𝑡𝑛−2 =
𝑉෠𝑏0

• b) Para la pendiente poblacional (𝛽1 ), el estadígrafo de prueba será:


𝑏1 − 𝛽1
𝑡𝑛−2 =
𝑉෠𝑏1

Lic. Alejandro F. Grahl


Análisis de Correlación lineal simple
• a) Cálculo del coeficiente de correlación lineal Muestral (estimador del
coeficiente de correlación lineal Poblacional ρ (rho):
𝑆𝑥𝑦
𝑟=
𝑆𝑥𝑥 . 𝑆𝑦𝑦
Tanto r como ρ son números reales que pertenecen al intervalo [-1;1]
Si r tiende a -1, la correlación es alta y negativa
Si r tiende a 0, la correlación es baja
Si r tiende a 1, la correlación es alta y positiva
• b) Pruebas de hipótesis sobre el coeficiente de correlación poblacional (ρ):
• b-1) Prueba de significatividad: ρ es distinto de 0. Es siempre bilateral, pero no
usamos el procedimiento tradicional, sino que comparamos r con un valor crítico
(𝑟𝑐 ) que surge de una tabla en la página 130 de las Tablas para Estadística. Si se
verifica que 𝑟 ≥ 𝑟𝑐 , se puede asegurar que ρ es significativo (distinto de 0).

Lic. Alejandro F. Grahl


• b-2) Prueba de comparación con un valor dado (o de contraste): puede
plantearse cualquier caso de los ya vistos para pruebas de hipótesis, aunque en
general se trata de probar si ρ es mayor que un valor dado 𝜌0
• El procedimiento para la prueba de hipótesis es el tradicional, siendo el
estadígrafo de prueba:
Ζ𝑟 − Ζ𝜌
𝑧=
1
𝑛−3
Siendo Ζ𝑟 𝑦 Ζ𝜌 valores transformados del coeficiente de correlación lineal, que se
obtienen de la tabla de la página 132 en las Tablas para Estadística
• Para el ejemplo anterior, realizamos las inferencias ya explicadas (intervalos de
confianza y pruebas de hipótesis:

Lic. Alejandro F. Grahl


Intervalos de confianza (nivel de confianza 95%)
• a) Para Para la ordenada al origen poblacional (𝛽0 ):

1 𝑥ҧ 2 1 34,17 2
𝑉෠𝑏0 = 𝑆 2
+ = 2526,313501 + = 2010,29173
𝑛 𝑆𝑥𝑥 12 1638,9332

𝑏0 ± 𝑡𝑛−2 . 𝑉෠𝑏0 ⇒ 343,71 ± 2,228. 2010,29173 ⇒ 343,71 ± 𝟗𝟗, 𝟗𝟎

• b) Para la pendiente poblacional (𝛽1 ):


𝑆2 2526,313501
𝑉෠𝑏1 = = = 1,54144
𝑆𝑥𝑥 1638,9332

𝑏1 ± 𝑡𝑛−2 . 𝑉෠𝑏1 ⇒ 3,22 ± 2,228 1,54144 ⇒ 𝟑, 𝟐𝟐 ± 𝟐, 𝟕𝟕

Lic. Alejandro F. Grahl


• c) Para un valor de la variable explicada 𝑦0 , dado un valor de la variable
explicativa 𝑥0 = 60 :
Hallo el estimador, usando el modelo de regresión muestral:
𝑦0 = 343,71 + 3,22.60 = 536,91

1 𝑥0 − 𝑥ҧ 2 1 60 − 34,17 2
𝑉෠𝑦0 = 𝑆 2 1+ + = 2526,313501 1 + + = 3765,269782
𝑛 𝑆𝑥𝑥 12 1638,9332

El intervalo de confianza será:

𝑦0 ± 𝑡𝑛−2 . 𝑉෠𝑦0 ⇒ 536,91 ± 2,228 3765,269782 ⇒ 𝟓𝟑𝟔, 𝟗𝟏 ± 𝟏𝟑𝟔, 𝟕𝟏

Lic. Alejandro F. Grahl


Pruebas de Hipótesis (nivel de significación del 5%)
• a) Para 𝛽0 :
• 𝐻0 : 𝛽0 ≤ 300
• 𝐻𝑎 : 𝛽0 > 300
𝑏0 −𝛽0 343,71−300
• 𝑡𝑛−2 = = = 0,975 𝑁𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑜 𝐻0 𝛽0 𝑛𝑜 𝑒𝑠 𝑚𝑎𝑦𝑜𝑟 𝑎 300
෡𝑏 2010,29173
𝑉 0

Lic. Alejandro F. Grahl


• b) Para 𝛽1 :
• 𝐻0 : 𝛽1 ≥ 8
• 𝐻𝑎 : 𝛽1 < 8
𝑏1 −𝛽1 3,22−8
• 𝑡𝑛−2 = = = −3,85 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝐻0 𝛽1 𝑒𝑠 𝑚𝑒𝑛𝑜𝑟 𝑎 8
෡𝑏 1,54144
𝑉 1

Lic. Alejandro F. Grahl


Pruebas de hipótesis acerca del coeficiente de correlación
poblacional (nivel de significación del 10%)
• a) Para la significatividad:
𝐻0 : 𝜌 = 0
𝐻𝑎 : 𝜌 ≠ 0

𝑆𝑥𝑦 5269,35
𝑟= = = 0,63
𝑆𝑥𝑥 . 𝑆𝑦𝑦 1638,9332 .42256,25

(𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑚𝑒𝑑𝑖𝑎 𝑦 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑎)

De la tabla de puntos críticos (pág. 130): 𝑟𝑐 = 0,497


𝑟 > 𝑟𝑐 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑟𝑒𝑐ℎ𝑎𝑧𝑜 𝐻0 : 𝜌 ES SIGNIFICATIVO

Lic. Alejandro F. Grahl


• a) Contraste con un valor dado:
𝐻0 : 𝜌 ≤ 0,50
𝐻𝑎 : 𝜌 > 0,50

Ζ𝑟 − Ζ𝜌 0,741416 − 0,549306
𝑧= = = 0,5763
1 1
𝑛−3 9
𝑁𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑜 𝐻0 Entonces 𝜌 NO ES MAYOR A 0,50

Lic. Alejandro F. Grahl


Ejercicio completo
• Se realizó un estudio sobre la cantidad de azúcar convertida (en gramos), en
cierto proceso, a distintas temperaturas (variable explicativa, en grados
centígrados). Una muestra aleatoria de 11 procesos, arrojó los siguientes valores:
• 𝑥=1,5
• 𝑦=9,13
2
• σ 𝑥𝑖 =25,85
2
• σ 𝑦𝑖 =923,58
• σ 𝑥𝑖 𝑦𝑖 =152,59
• Resolver lo que se indica a continuación

Lic. Alejandro F. Grahl


1. Hallar el modelo de regresión lineal muestral e interpretar sus
parámetros en los términos del problema
• Se calculan las medidas necesarias: • Interpretamos los parámetros de la
2 recta hallada, EN LOS TÉRMINOS DEL
• 𝑆𝑥𝑥 = σ 𝑥𝑖 − 𝑛. 𝑥ҧ 2 = 1,1
PROBLEMA:
• 𝑆𝑥𝑦 = σ 𝑥𝑖 𝑦𝑖 − 𝑛. 𝑥.ҧ 𝑦=
ത 1,945
• Ordenada al origen: si la
• 𝑆𝑦𝑦 = σ 𝑦𝑖
2
− 𝑛. 𝑦ത 2 = 6,6541 temperatura fuese de 0 grados
centígrados, la cantidad de azúcar
• Se calculan la pendiente y la convertida sería de 6,48 gramos
ordenada al origen (muestrales):
• Pendiente: Por cada grado
𝑆𝑥𝑦
𝑏1 = centígrado que aumenta la
• ቐ 𝑆𝑥𝑥
temperatura, la cantidad de azúcar
𝑏0 = 𝑦ത − 𝑏1 𝑥ҧ
convertida aumenta en 1,77 gramos
• En el ejemplo: 𝑏1 = 1,77 y 𝑏0 = 6,48
• La recta pedida será:
• 𝐲ො = 𝟔, 𝟒𝟖 + 𝟏, 𝟕𝟕. 𝐱

Lic. Alejandro F. Grahl


2. Hallar e interpretar el coeficiente de determinación
𝑆𝐶𝐸
• Sabemos que: 𝑅 = 2
𝑆𝐶𝑇
• Calculamos:
• 𝑏1 2 . 𝑆𝑥𝑥 = 𝑆𝐶𝐸 = 3,44619
y sabemos que: 𝑆𝑦𝑦 = 𝑆𝐶𝑇 = 6,6541
• Entonces: 𝑅2 = 0,5179 ≅ 0,52
• Interpretación:
• El 52 % de la dispersión se debe al modelo de regresión, mientras que el 48%
de la misma se debe a la componente aleatoria o perturbación.
• Esto permite afirmar que existe un buen ajuste del modelo a los datos.

Lic. Alejandro F. Grahl


3. Estimar, con una confianza del 95%, la ordenada al
origen poblacional
• Se pide: 𝑏0 ± 𝑡𝑛−2 . 𝑉෠𝑏0

1 𝑥ҧ 2
siendo 𝑉෠𝑏0 = 𝑆2 +
𝑛 𝑆𝑥𝑥

Hallamos la Varianza Residual Muestral:


𝑆𝑦𝑦 − 𝑏1 2 . 𝑆𝑥𝑥 = 𝑆𝐶𝑅 = 6,6541 − 3,44619=3,20791
2
𝑆𝐶𝑅
𝑆 = = 0,356434
𝑛−2
Entonces: 𝑉෠𝑏 = 0,7614736
0

Usando el fractil 2,262:


6,48 ± 1,97

Lic. Alejandro F. Grahl


4. Estimar, con una confianza del 95%, la pendiente
poblacional

• Se pide: 𝑏1 ± 𝑡𝑛−2 . 𝑉෠𝑏1

𝑆2
siendo 𝑉෠𝑏1 = = 0,3240309
𝑆𝑥𝑥

Con el mismo fractil, ya que el nivel


de confianza no cambió:
1,77 ± 1,29

Lic. Alejandro F. Grahl


5. Estimar, con una confianza del 95%, la cantidad de
azúcar transformada en la población, si la temperatura es
de 2,5 grados centígrados

• Se pide: 𝑦0 ± 𝑡𝑛−2 . 𝑉෠𝑦0


1 𝑥0 −𝑥ҧ 2
siendo 𝑉෠𝑦0 = 𝑆 2 1 + +
𝑛 𝑆𝑥𝑥

Usando el modelo de regresión


muestral, hallo 𝑦0 :

𝐲ො𝟎 = 𝟔, 𝟒𝟖 + 𝟏, 𝟕𝟕. 𝟐, 𝟓 = 𝟏𝟎, 𝟗𝟎𝟓 ≅ 𝟏𝟎, 𝟗𝟏

𝑉෠𝑦0 = 0,712868
Entonces:
10,91 ± 1,91

Lic. Alejandro F. Grahl


6. Probar, al 5% de significación, si puede afirmarse que la
ordenada al origen poblacional es mayor a 5
• 𝐻0 : 𝛽0 ≤ 5
• 𝐻𝑎 : 𝛽0 > 5
𝑏0 −𝛽0 6,48−5
• 𝑡𝑛−2 = = = 1,69
෡𝑏 0,7614736
𝑉 0

• 1,69 < 1,8331


• No rechazo 𝑯𝟎
• No puede afirmarse que 𝜷𝟎 > 𝟓, en base
a la evidencia muestral y con un nivel de
significación del 5%

Lic. Alejandro F. Grahl


7. Probar, al 5% de significación, si puede afirmarse que la
pendiente poblacional es menor a 3
• 𝐻0 : 𝛽1 ≥ 3
• 𝐻𝑎 : 𝛽1 < 3
𝑏1 −𝛽1 1,77−3
• 𝑡𝑛−2 = = = −2,16
෡𝑏 0,3240309
𝑉 1

• -2,16 < -1,8331


• Rechazo 𝑯𝟎
• Puede afirmarse que 𝜷𝟏 < 𝟑, en base
a la evidencia muestral y con un nivel de
significación del 5%

Lic. Alejandro F. Grahl


8. Probar, al 10 % de significación, si puede afirmarse que
el coeficiente de correlación poblacional es significativo y
mayor a 0,80
• Prueba de significatividad • Prueba de contraste
𝐻0 : 𝜌 ≤ 0,80
• Calculo el coeficiente de
𝐻𝑎 : 𝜌 > 0,80
correlación muestral:
𝑆𝑥𝑦 Buscamos en la tabla de la página 132 los valores
• 𝑟= = 0,71 (alta correlación positiva) transformados de z:
𝑆𝑥𝑥 .𝑆𝑦𝑦 Ζ𝑟 − Ζ𝜌 0,887184 − 1,098612
𝐻0 : 𝜌 = 0 𝑧= = = −0, 598
1 1
𝑛−3 8
𝐻𝑎 : 𝜌 ≠ 0
• En la tabla de fractiles de la distribución
Buscamos el punto crítico en la tabla de la Normal (página 83): 𝒛𝒄 = 𝟏, 𝟐𝟖𝟐
página 130, con n=11 y α = 0,10: 𝑟𝑐 = 0,521
• -0,598 < 1,282
Comparamos: 𝑟 ≥ 𝑟𝑐 0,71 > 0,521 • No Rechazo 𝐻0
Rechazo 𝑯𝟎 • No puede afirmarse que 𝝆 > 𝟎, 𝟖𝟎, en base
𝝆 es significativo a la evidencia muestral y con un nivel de
significación del 10%

Lic. Alejandro F. Grahl

También podría gustarte