Está en la página 1de 7

Análisis de correlación y regresión simple 177

Ahora sí se tiene la seguridad que 90% del valor real de los gastos anuales de mantenimiento en una patrulla con
seis años de antigüedad se encontrará entre $9,182.81 y $12,599.69; sin embargo, es importante recordar que este
intervalo de estimación es lo que se espera que ocurra.

Estimación del intervalo de confianza para la media de Y con el error estándar exacto
El error estándar de la estimación Se es, como su nombre lo indica, sólo una estimación y no se debe confundir
con la desviación estándar de la población. En estadística se puede conocer el error estándar exacto (Sp) para
conocer los intervalos de estimación mediante la expresión siguiente:

Sp =
1
+
(X - X) i
2

(4.19)
n
∑(X - X)
n 2
i
i =1   
La amplitud del intervalo de confianza depende del nivel de confianza seleccionado, pero también la variación
mayor (incrementada) alrededor de la recta de predicción, medida por la estimación del error estándar da origen
a un intervalo de confianza más amplio; sin embargo, no se debe olvidar que la amplitud del intervalo varía con
los diferentes valores de X.
Al realizar una predicción de Y para los valores de X cercanos a la media el intervalo es más angosto que cuan-
do los valores de X son más lejanos a la media .
Si retomamos el ejemplo se podrá calcular el límite inferior y superior del intervalo de confianza para el gasto de re-
paración en el año de 2009 para la patrulla con seis años de antigüedad, considerando el error estándar exacto (Sp).

1 ( X - X )2 1 ( 6 - 4 )2 1 ( 2 )2
Sp = + n i = + = + = 0.125 + .333 = 0.458 = 0.677
n 8 12 8 12
∑ ( Xi - X )
i =1
2

∑ ( y - yˆ ) 2
4637932.5
Se = i =1
= = 772988.6 = $879.20
n-2 8-2
• Límite superior del intervalo de confianza o de predicción al 90% sería de
yˆ + (t )(Se )(S p ) = 10, 891.25 + (1.943)(879.20 )(0.677 ) = $12, 047.87

Copyright © 2014. Grupo Editorial Patria. All rights reserved.

• Límite inferior del intervalo de confianza o de predicción al 90% sería de


yˆ - (t )(Se )(S p ) = 10, 891.25 - (1.943)(879.20 )(0.677 ) = $9, 734.63

Ahora se tiene la seguridad de que 90% del valor real de los gastos anuales de mantenimiento en una patrulla con
seis años de antigüedad se encontrará entre $9,734.63 y $12,047.87; sin embargo, es importante recordar que ésta
es la estimación del intervalo de confianza para la media de Y, calculado con el error estándar exacto.

Inferencia de parámetros de la población


Al estudiar el análisis de regresión y de correlación para relacionar dos variables X y Y con base en los datos de
una muestra, los datos sólo representan una parte de la población.
Ahora bien, se puede considerar que cuando se tiene la línea de regresión lineal de la muestra como una estimación
de la línea de regresión de la población, debemos recordar que no conocemos la línea de regresión poblacional
(Yi = ß0 + ß1Xi).

Rodríguez, Franco, Jesús, and Rodríguez, Alberto Isaac Pierdant. <i>Estadística aplicada II: estadística en administración para la toma de decisiones</i>, Grupo Editorial Patria,
2014. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3227358.
Created from unadsp on 2019-09-08 07:42:03.
178 Estadística aplicada II

En el problema de las patrullas de Los Cabos, Baja California Sur se tiene la antigüedad de las patrullas y el gasto
por mantenimiento, el cual se divide en dos grupos o partes del gasto:

1. Mantenimiento preventivo
(No importa la antigüedad). Lavado, cambio de aceites y lubricantes, afinación, alineación y balanceo de
llantas, verificación, tenencia, entre otros; gastos que se representan con la ordenada (β0) de la línea de regre-
sión de la población.

2. Mantenimiento correctivo
Gastos de reparación por el uso, antigüedad e imprevistos; cambio de frenos, llantas, amortiguadores, rótulas,
bomba del agua, bandas de transmisión, ajuste o cambio de motor, transmisión, batería, torretas, calaveras,
espejos, defensas, pintura, vestiduras, robo de partes, choques o daños originados en los operativos, entre
otros, en donde el gasto de mantenimiento correctivo le corresponde al término β1 Xi de la línea de regresión
de la población.

Como sabemos existen puntos individuales en las patrullas dentro de los gastos de mantenimiento (sin importar la
antigüedad) como choques o robo de partes. Otros gastos de las patrullas se presentan cuando sufren un desgaste
mayor en alguna o algunas de las partes; es decir, que el desgaste no se produce al mismo tiempo o de manera
uniforme en todas las patrullas.

Por ejemplo, el desgaste de llantas, amortiguadores, rótulas y otras partes de la suspensión; cuando una patrulla,
dentro de su área de vigilancia, transita por calles no asfaltadas o empedradas, las partes de la suspensión tendrán
mayor desgaste, lo que indica que los puntos individuales (gastos) probablemente no caen en la línea de regresión
de la población, ya que en algunos casos estarán ubicados en la parte superior de la línea de regresión y en otros en
la parte inferior, de tal forma que no satisfacen la ecuación de la línea de regresión poblacional (Yi = βo + β1Xi ).

Por tanto, se deberá plantear la ecuación de línea de regresión con variaciones aleatorias con los puntos indivi-
duales y con los que presenten variaciones aleatorias:
(Yi = β0 + β1Xi + εi )

Donde:
β1 = Pendiente que representa la línea (para la población) y el cambio esperado en Y por unidad de cambio
en X, o la cantidad media que cambia Y (positiva o negativa) por una unidad de cambio en X.
β0 = Intersección en Y de la línea, que representa el valor promedio de Y cuando X = 0.
Copyright © 2014. Grupo Editorial Patria. All rights reserved.

εi = Error, perturbación, variación aleatoria en Y para cada observación i que ocurra o distancia Yi por de-
bajo o por arriba de la línea de regresión de la población.

Las variaciones por arriba de la línea de regresión de la población se anulan con las situadas por abajo, entonces
el valor esperado de la variación aleatoria sería igual a cero (εi = 0). Si lo anterior se cumple, entonces se puede
plantear la ecuación de la recta de regresión de la población; en donde, la línea de regresión de la población (4.20)
proporciona el valor medio de Y asociado a cada valor de X, de la siguiente manera:
Yi = β0 + β1Xi   (4.20)
Si tuviéramos varias patrullas con la misma antigüedad (X) se esperaría que el gasto anual de mantenimiento se
realizará a partir de la ecuación 4.20.
Ahora bien, si la línea de regresión de la muestra ŷ = a + bx , estima la línea de regresión de la población, enton-
ces se podría usar la ecuación 4.20 para realizar inferencias sobre la línea de regresión de la población.

Rodríguez, Franco, Jesús, and Rodríguez, Alberto Isaac Pierdant. <i>Estadística aplicada II: estadística en administración para la toma de decisiones</i>, Grupo Editorial Patria,
2014. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3227358.
Created from unadsp on 2019-09-08 07:42:03.
Análisis de correlación y regresión simple 179

Prueba de hipótesis para la pendiente β1 de población mediante la prueba t


Esta prueba sirve para determinar la existencia de una regresión lineal significativa entre X y Y, en donde se tiene
que probar que βi = 0.
Al pensar en realizar inferencias con respecto a la pendiente ( β1) de la línea de regresión poblacional se toma
como base la pendiente (b) de la línea de regresión estimada de una muestra. Donde usar el valor de la pendiente
(b) calculado a partir de la muestra permite probar hipótesis respecto al valor de ( β1), vale la pena recordar que la
prueba de la hipótesis respecto a ( β1) es similar a lo estudiado en el capítulo de prueba de hipótesis:
H0: βi = valor, Hipótesis nula.
H1: βi ≠ valor, Hipótesis alternativa.
La hipótesis nula y alternativa se plantean de la siguiente forma:
H0: βi = 0  No existe una relación lineal.
H1: βi ≠ 0  Existe una relación lineal.
Lo anterior indica que al rechazar la hipótesis nula existe evidencia de una relación lineal.
Por otra parte, el estadístico de prueba t se define como:
b - β1
t= 1 (4.21)
Sb   
Que representa la diferencia entre la pendiente de la muestra y el valor hipotético de la pendiente de la población
entre el error estándar de la pendiente. El estadístico de prueba t sigue la distribución t con n - 2 grados de liber-
tad, donde el error estándar de la pendiente se define con:
Se
Sb =
n
   (4.22)
∑ (X
i =1
i - nX ) 2

Se
Sb =    (4.22a)
n

∑X 2 2
i - nX
i =1

Donde:
Sb = error estándar del coeficiente de regresión
Se = error estándar de estimación
Copyright © 2014. Grupo Editorial Patria. All rights reserved.

Xi = variable independiente
= media de los valores de la variable independiente
n = número de datos

Ejemplo
Con los datos del problema de las patrullas de Los Cabos, probar si existe una relación importante o significativa
entre la antigüedad de las patrullas y el gasto por mantenimiento, con un nivel de significancia de 0.05.
Se 879.20
Sb = = = 253.80
n
12
∑ (X
i =1
i - nX )2

b1 - β1 1573 - 0 1573
t= = = = 6.197
Sb 253.80 253.8

Rodríguez, Franco, Jesús, and Rodríguez, Alberto Isaac Pierdant. <i>Estadística aplicada II: estadística en administración para la toma de decisiones</i>, Grupo Editorial Patria,
2014. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3227358.
Created from unadsp on 2019-09-08 07:42:03.
180 Estadística aplicada II

De donde se concluye que:


• En el nivel de significancia de 0.05, el valor crítico de t con n - 2 = 8 - 2 = 6 grados de libertad es 2.4469.
• Si t = 6.1977 > 2.4469, se rechaza H0 y se acepta H1.
• Por tanto, existe una relación lineal significativa entre la antigüedad de las patrullas y el gasto por mante-
nimiento.
Otra forma de confirmar el resultado consiste en utilizar la salida de “Resultados” de Excel (Estadístico t) y del spss
(Coefficients), en donde se calculan los valores t para β0 y β1 (véanse las figuras 4.19a y 4.19b, respectivamente).

Figura 4.19a  Estadístico t = 6.197732.

Figura 4.19b  Estadístico t = 6.198 y p =0.001.


Coefficientsa
Standardized
Unstandardized Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 1453.250 1061.732 1.369 .220
Años de antigüedad
1573.000 253.803 .930 6.198 .001
de las patrullas
a. Dependent Variable: Gastos de reparación ($)

En spss también se puede usar el estadístico de prueba p,7 para el ejemplo (p < a); es decir, 0.001 < 0.05, por lo
Copyright © 2014. Grupo Editorial Patria. All rights reserved.

que se debe rechazar la hipótesis nula (H0), con lo que se confirma la existencia de una relación lineal significativa
entre la antigüedad de las patrullas y el gasto por mantenimiento.

Estimación del intervalo de confianza de la pendiente b1


La estimación del intervalo de confianza es una alternativa para comprobar la existencia de una relación lineal
entre dos variables (X y Y). Al construir la estimación del intervalo de confianza de β1 se conocerá si el valor
hipotético de β1 se encuentra dentro del intervalo, por lo que se utiliza la expresión:
b ± (t n -2 )(Sb )    (4.23)
Con esta expresión podemos construir una estimación del intervalo de confianza de 95% (o de cualquier otro
intervalo), en donde α = 0.05.

7 Recuerde que, en pruebas de hipótesis, debemos rechazar H 0 (hipótesis nula) si p < a.

Rodríguez, Franco, Jesús, and Rodríguez, Alberto Isaac Pierdant. <i>Estadística aplicada II: estadística en administración para la toma de decisiones</i>, Grupo Editorial Patria,
2014. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3227358.
Created from unadsp on 2019-09-08 07:42:03.
Análisis de correlación y regresión simple 181

Por lo que primero se deberán establecer los valores críticos tn-2, donde n = 8. Con el cuadro de distribución t o
con la función inversa t de Excel (=distr.t.inv(0.05,6)), obtenemos:
tn-2, α = t6,0.05 = 2.4469
Y si para el problema tenemos que:
Sb = 253.80 y b = 1,573
Sustituimos estos valores en (4.23) para obtener los límites del intervalo de confianza.
El límite superior es:
b + (tn - 2)(Sb ) = 1,573 + (2.4469)(253.8) = 1,573 + 621.02 = 2,194.02
El límite inferior sería:
b - (tn - 2)(Sb ) = 1,573 - (2.4469)(253.8) = 1,573 - 621.02 = 951.98
– Entonces, se estima que con un nivel de confianza de 95%, la pendiente de la población está dentro del
intervalo 951.98 ≤ β1 ≤ 2,194.02
• Si los valores son mayores de cero, como en el problema de estudio, entonces se concluye que existe una
relación lineal significativa entre la antigüedad de las patrullas y el gasto por mantenimiento.
• En caso de que el intervalo incluyera el cero se concluye que no existe una relación significativa entre las
variables de estudio.
• Si los valores fueran menores que cero, entonces se tendría el caso de una relación inversa.
Esta estimación del intervalo de confianza también puede obtenerse con los paquetes Excel y spss:
– En Excel el Resumen de resultados lo muestra en la sección de los coeficientes (véase figura 4.19a):
• β1 (Años (X)), columna Inferior, donde 95% del valor es igual a 951.9676.
• Columna Superior, donde 95% del valor es 2194.0323.
En spss, debemos solicitar su cálculo mediante el menú de estadísticas de la regresión lineal, con el siguiente
procedimiento :
• Definir las variables dependiente (Y) e independiente (X), para solicitar el cálculo del modelo (véase la
figura 4.20a).
• Oprimir en esta ventana el botón Statistics… (véase la figura 4.20b), que nos lleva a la ventana de estadís-
ticas de la regresión lineal (Linear regression: statistics).

Figura 4.20  Menú de estadísticas de la regresión en spss.


Copyright © 2014. Grupo Editorial Patria. All rights reserved.

b
a

Rodríguez, Franco, Jesús, and Rodríguez, Alberto Isaac Pierdant. <i>Estadística aplicada II: estadística en administración para la toma de decisiones</i>, Grupo Editorial Patria,
2014. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3227358.
Created from unadsp on 2019-09-08 07:42:03.
182 Estadística aplicada II

• En esta ventana debemos seleccionar la opción intervalos de confianza (Confidence intervals) y oprimir el
botón Continue, lo que nos regresa a la ventana anterior (véase la figura 4.21a).

Figuras 4.21a y 4.21b  Selección de la opción intervalos de confianza (Confidence intervals).

b
a

• En la figura 4.21a, solicitamos el cálculo de la regresión al oprimir el botón OK.


• El resultado del intervalo de confianza (951.968 ≤ β1 ≤ 2194.032) se muestra en la sección de coeficientes,
variable Años de antigüedad (véase la figura 4.22).

Figura 4.22  Resultado del intervalo de confianza (951.968 ≤ β1 ≤ 2194.032).


Coefficientsa
Standardized
Unstandardized Coefficients Coefficients 95% Confidence Interval for B
Model B Std. Error Beta t Sig. Lower Bound Upper Bound
1 (Constant) 1453.250 1061.732 1.369 .220 –1144.715 4051.215
Años de antigüedad
1573.000 253.803 .930 6.198 .001 951.968 2194.032
de las patrullas
a. Dependent Variable: Gastos de reparación ($)

Prueba t para el coeficiente de correlación simple8


El coeficiente de correlación simple se utiliza para determinar la existencia de una relación significativa entre
dos variables (X y Y) y para probar esta relación se plantea la hipótesis de que el coeficiente de correlación de la
Copyright © 2014. Grupo Editorial Patria. All rights reserved.

población (ρ) es cero, por lo que se conoce como hipótesis nula H0.
En la hipótesis nula H0 no existe relación entre variables, mientras que en H1, la hipótesis alternativa, indica que
sí existe correlación entre las variables estudiadas.
H0: ρ = 0, no existe una correlación.
H1: ρ ≠ 0, existe correlación.
La ecuación (4.24) representa al estadístico de prueba t con el que se puede conocer la existencia de una corre-
lación significativa:
r- ρ
t= (4.24)
1 - r 2   
n-2

8
Este estadístico t es equivalente al estadístico t calculado cuando se prueba si la pendiente de la población β1 es igual a cero.

Rodríguez, Franco, Jesús, and Rodríguez, Alberto Isaac Pierdant. <i>Estadística aplicada II: estadística en administración para la toma de decisiones</i>, Grupo Editorial Patria,
2014. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3227358.
Created from unadsp on 2019-09-08 07:42:03.
Análisis de correlación y regresión simple 183

Donde:
r = + r 2 , si b > 0 o r = - r 2 si b < 0 y el estadístico de prueba t sigue una distribución de probabilidad t con
n - 2 grados de libertad.

Ejemplo
Si aplicamos la ecuación (4.24) al problema de la antigüedad de las patrullas y sus gastos de mantenimiento,
tendríamos que hacer lo siguiente para probar la hipótesis nula H0; es decir, que no existe relación entre las va-
riables:
• Datos de la regresión:
n = 8, b = 1573
r2 = 0.8649
r = 0.93
Sustituyendo valores se tiene:

r- ρ 0.93 - 0 0.93 0.93


t= = = = = 6.2
1 - r2 1 - 0.8649 0.02252 0.15
n-2 8-2

• Con una confianza de 90% y un nivel de significancia de α = 0.01, los valores críticos de tn -2,0.1 que se ob-
tienen de los cuadros o con la función inversa de t en Excel sería de 1.9432.
• El valor de t es menor que el valor de prueba calculado con (4.24); es decir, t = 6.2 > 1.9432.
• Por tanto, se deberá rechazar la hipótesis nula y aceptar la hipótesis alternativa.
• Y finalmente se concluye que existe evidencia de una correlación entre la antigüedad de las patrullas y el
gasto por mantenimiento.

Ejemplo de un cambio en el valor de la pendiente


De nuevo se retomará el ejemplo de las patrullas en Los Cabos, donde se mostrarán los resultados que se obtienen
al cambiar el valor de la pendiente (β1) en un modelo ya calculado de regresión lineal simple.
• La ecuación del mejor ajuste tiene como pendiente b = 1,573 en el modelo:
yˆ = 1, 453.25 + 1, 573x
Copyright © 2014. Grupo Editorial Patria. All rights reserved.

Si partimos del supuesto de que la pendiente de la relación entre X y Y cambia a 1,620 durante un tiempo prolon-
gado, entonces se debe probar si en estos momentos todavía se mantiene el valor de la relación o ésta ha cambia-
do, por lo que para probarlo se plantean las hipótesis de la siguiente forma:
H0: β1 = 1620, Hipótesis nula.
H1: β ≠ 1620, Hipótesis alternativa.
Para encontrar el estadístico de prueba para β1 es necesario encontrar primero el error estándar del coeficiente de
regresión:
Se
Sb =    (4.23a)
n

∑x
i =1
2
i - nx 2

Rodríguez, Franco, Jesús, and Rodríguez, Alberto Isaac Pierdant. <i>Estadística aplicada II: estadística en administración para la toma de decisiones</i>, Grupo Editorial Patria,
2014. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3227358.
Created from unadsp on 2019-09-08 07:42:03.

También podría gustarte