Está en la página 1de 29

Universidad Nacional Autnoma de Mxico

Facultad de Estudios Superiores Cuautitln

PRESENTACIN

Regresin y Correlacin lineal simple es el noveno fascculo, de una serie de


guas de estudio en las que se desarrollan los temas de los programas de las
asignaturas del rea de Probabilidad y Estadstica, as como temas selectos
que complementan el aprendizaje de de esta disciplina. Tienen la
caracterstica de que el estudiante adquiera slo aquella que trate el tema
que necesite reforzar o el que sea de su propio inters.
Estas guas de estudio pretenden reorientar y actualizar el enfoque con el que
se debe abordar el estudio de los mtodos estadsticos, despertando la
inquietud por aprender y resolver los problemas y casos planteados.
Cada gua integra el desarrollo del tema con ejercicios, casos de estudio y con
la seccin llamada Aprendiendo.com. En esta ltima seccin se le proporciona
al estudiante un ambiente interactivo, utilizando los recursos disponibles en
Internet, de tal forma que los casos planteados los desarrolle en ambientes
de aprendizaje que le permitan encontrarse con el conocimiento,
manipularlo, hacerlo suyo. Con esta filosofa se utilizan applets, sitios de
internet con acceso a bases de datos reales, software de uso libre y en
general los recursos de la Web 2.0, que se refieren a una segunda generacin
en la historia de la Web basada en comunidades de usuarios, que fomentan la
colaboracin y el intercambio gil de informacin entre los mismos.
Nuestro reconocimiento a la Direccin General de Asuntos del Personal
Acadmico de nuestra Casa de Estudios, que a travs del Programa de Apoyo
a Proyectos para la Innovacin y Mejoramiento de la Enseanza (PAPIME) ha
apoyado nuestro proyecto Implantacin de un Laboratorio Virtual de
Estadstica y Elaboracin de las Guas de Estudio con Soporte Multimedia
clave PE302709.
Los Autores

Regresin y Correlacin Lineal Simple

http://www.cuautitlan.unam.mx

Universidad Nacional Autnoma de Mxico


Facultad de Estudios Superiores Cuautitln

REGRESIN Y CORRELACIN LINEAL SIMPLE


Es comn que las personas tomen decisiones personales y profesionales
basadas en predicciones de sucesos futuros. Para hacer estos pronsticos, se
basan en la relacin intuitiva y calculada entre lo que ya se sabe y lo que se
debe estimar. Si los responsables de la toma de decisiones pueden
determinar cmo lo conocido se relaciona con un evento futuro, pueden
ayudar considerablemente al proceso de toma de decisiones.
Cualquier mtodo estadstico que busque establecer una ecuacin que
permita estimar el valor desconocido de una variable a partir del valor
conocido de una o ms variables, se denomina anlisis de regresin.
Los anlisis de regresin y correlacin mostrarn como determinar la
naturaleza y la fuerza de una relacin entre dos variables.
El trmino regresin fue utilizado por primera vez por el genetista y
estadstico ingls Francis Galton (1822-1911) en 1877 Galton efecto un
estudio que demostr que la altura d los hijos de padres altos tenda a
retroceder, o regresar, hacia la talla media de la poblacin. Regresin fue
el nombre que le dio al proceso general de predecir una variable,(la talla de
los nios) a partir de otra (la talla de los padres).
Hoy en da, esta tendencia de miembros de cualquier poblacin que estn
en una posicin extrema (arriba o debajo de la media poblacional) en un
momento, y luego en una posicin menos extrema en otro momento, (ya sea
por s o por medio de sus descendientes), se llama efecto de regresin.
El anlisis de regresin se desarrolla una ecuacin de estimacin, es decir,
una formula matemtica que relaciona las variables conocidas con las
desconocidas. Luego de obtener el patrn de dicha relacin, se aplica el
anlisis de correlacin para determinar el grado de relacin que hay entre las
variables.

Regresin y Correlacin Lineal Simple

http://www.cuautitlan.unam.mx

Universidad Nacional Autnoma de Mxico


Facultad de Estudios Superiores Cuautitln

REGRESIN LINEAL SIMPLE


Una tcnica estadstica que establece una ecuacin para estimar el
valor desconocido de una variable, a partir del valor conocido de otra
variable, (en vez de valores de muchas otras variables) se denomina anlisis
de regresin simple.
Por lo tanto el anlisis de regresin lineal simple, es el proceso general de
predecir una variable (Y) a partir de otra (X).
Las relaciones entre las variables pueden ser directas o tambin inversas.
Relacin directa: la pendiente de esta lnea es positiva, por que la variable
Y crece a medida que la variable X tambin lo hace.

Relacin inversa: La pendiente de esta lnea es negativa, por que a medida


que aumenta el valor de la variable Y, el valor de la variable X disminuye.

Regresin y Correlacin Lineal Simple

http://www.cuautitlan.unam.mx

Universidad Nacional Autnoma de Mxico


Facultad de Estudios Superiores Cuautitln

VARIABLE INDEPENDIENTE (X)


En el anlisis de regresin una variable cuyo valor se suponga conocido y
que se utilice para explicar o predecir el valor de otra variable de inters se
llama variable independiente; se simboliza con la letra X.
Otros nombres alternativos para la variable independiente (X), son
variable explicatoria, variable predictora y en ocasiones variable regresora.
VARIABLE DEPENDIENTE (Y)
En el anlisis de regresin una variable cuyo valor se suponga desconocido
y que se explique o prediga con ayuda de otra se llama variable dependiente
y se simboliza con la letra Y.
La variable dependiente, al igual que la variable independiente es llamada
de diferentes maneras algunas de ellas son: variable explicada o variable
pronosticada.

Regresin y Correlacin Lineal Simple

http://www.cuautitlan.unam.mx

Universidad Nacional Autnoma de Mxico


Facultad de Estudios Superiores Cuautitln

DIAGRAMAS DE DISPERSIN
Un diagrama de dispersin es una ilustracin grfica que se usa en el
anlisis de regresin. Consta de una dispersin de puntos tal que cada punto
representa un valor de la variable independiente (medido a lo largo del eje
horizontal), y un valor asociado de la variable dependiente (medido a lo largo
del eje vertical).
El diagrama de dispersin, tambin llamado nube de puntos, brinda dos
tipos de informacin, visualmente se pueden determinar los patrones que
indican como las variables estn relacionadas (lineal o mediante una curva) y
por otro lado si existe una relacin entre ellas visualizando la clase de lnea o
ecuacin de estimacin que describe a dicha relacin.
A continuacin se ilustran algunas relaciones en los diagramas de
dispersin:

Regresin y Correlacin Lineal Simple

http://www.cuautitlan.unam.mx

Universidad Nacional Autnoma de Mxico


Facultad de Estudios Superiores Cuautitln

METODO DE MINIMOS CUADRADOS


El mtodo que por lo comn se utiliza para ajustar una lnea a los datos
muestrales indicados en el diagrama de dispersin, se llama mtodo de
mnimos cuadrados. La lnea se deriva en forma tal que la suma de los
cuadrados de las desviaciones verticales entre la lnea y los puntos
individuales de datos se reduce al mnimo.
El mtodo de mnimos cuadrados sirve para determinar la recta que
mejor se ajuste a los datos muestrales, y los supuestos de este mtodo son:
El error es cero.
Los datos obtenidos de las muestra son estadsticamente independientes.
La varianza del error es igual para todos los valores de X.
Una lnea de regresin calculada a partir de los datos muestrales, por el
mtodo de mnimos cuadrados se llama lnea de regresin estimada o lnea
de regresin muestral.
Dicha lnea recta es la que mejor se ajusta al conjunto de datos (X, Y) y es
aquella en que la distancia que hay entre los datos y la supuesta recta es la
menor posible, y se calcula mediante la siguiente formula:

y = a + bx

Para calcular el valor de b (pendiente), que representa el grado de


inclinacin que tiene la recta, se emplea la siguiente formula:

xy n x y

b=
x nx
2

Para calcular el valor de a (ordenada al origen), que representa el punto


en que la recta corta al eje de las Y, se emplea la siguiente formula:

a = y + bx
Las variables a y b son constantes numricas que son las que se calculan
mediante el mtodo de mnimos cuadrados.
Regresin y Correlacin Lineal Simple

http://www.cuautitlan.unam.mx

Universidad Nacional Autnoma de Mxico


Facultad de Estudios Superiores Cuautitln

ERROR ESTANDAR DE ESTIMACIN


El siguiente proceso que se necesita en el anlisis de la regresin lineal
simple es cmo medir la confiabilidad de la ecuacin de estimacin que
hemos desarrollado.
El error estndar de estimacin mide la variabilidad o dispersin de los
valores observados alrededor de la lnea de regresin y se representa como
Se. Su formula es la siguiente:

Se =

(a y ) (b xy )
n2

Cuanto mayor sea el error estndar de la estimacin, ms grande ser la


dispersin (o esparcimiento) de puntos alrededor de la lnea de regresin.
Por el contrario, si Se= 0, se espera que la ecuacin de estimacin sea un
estimador perfecto de la variable dependiente, en este caso todos los
puntos caeran directamente sobre la lnea de regresin y no habra puntos
dispersos, como se muestra en la siguiente figura:

El error estndar de estimacin tiene la misma aplicacin que de la


desviacin estndar que se vio en los temas anteriores. Esto es, suponiendo
que los puntos observados tienen una distribucin normal alrededor de la
recta de regresin, podemos esperar que:

Regresin y Correlacin Lineal Simple

http://www.cuautitlan.unam.mx

Universidad Nacional Autnoma de Mxico


Facultad de Estudios Superiores Cuautitln

68% de los puntos estn dentro de 1se


95.5% de los puntos estn dentro de 2se
99.7% de los puntos estn dentro de 3se
El error estndar de la estimacin se mide a lo largo del eje Y, y no
perpendicularmente desde la recta de regresin.
Las suposiciones son:
1. Los valores observados para Y tienen distribucin normal alrededor
de cada valor estimado de y
2. La varianza de las distribuciones alrededor de cada valor posible de
y es la misma.
Si esta segunda suposicin no fuera cierta, entonces el error estndar en un
punto de la recta de regresin podra diferir del error estndar en otro punto.

PROCEDIMIENTO PARA REALIZAR UN ANLISIS DE REGRESIN LINEAL


SIMPLE
1. Obtencin de los datos muestrales.

Regresin y Correlacin Lineal Simple

http://www.cuautitlan.unam.mx

Universidad Nacional Autnoma de Mxico


Facultad de Estudios Superiores Cuautitln

2. Los datos obtenidos se tabulan. (tener cuidado en determinar


correctamente quien es la variable independiente y dependiente)
X

3. La informacin se grfica en un diagrama de


establecindose la posible relacin entre las dos variables

dispersin,

4. Se calcula la pendiente.

b=

xy n x y
x n(x )
2

5. Se calcula la ordenada al origen.

a = y + bx

Regresin y Correlacin Lineal Simple

http://www.cuautitlan.unam.mx

Universidad Nacional Autnoma de Mxico


Facultad de Estudios Superiores Cuautitln

6. Se obtiene la ecuacin que mejor se ajusta a la informacin obtenida.

y = a + bx
7. Se traza la lnea estimada en el diagrama de dispersin.

8. Se calcula el error estndar de estimacin.

Se =

(a y ) (b xy )
n2

Por ejemplo:
Una cadena de Pizzeras toma una muestra de diez de sus sucursales
para tratar de encontrar un modelo matemtico que le permita predecir sus
ventas y obtuvo los siguientes datos: la poblacin de personas en miles fue
de 2, 6, 8, 8, 12, 16, 20, 20, 22, 26; y las ventas trimestrales en miles de pesos
fue de: 58, 105, 88, 118, 117, 137, 157, 169, 169, 149, 202.
Realice una regresin para estimar las ventas de dos sucursales que tienen
14,000 y 30,000 personas como potenciales clientes respectivamente.
Solucin
Datos
n=10

Regresin y Correlacin Lineal Simple

http://www.cuautitlan.unam.mx

Universidad Nacional Autnoma de Mxico


Facultad de Estudios Superiores Cuautitln

X: Poblacin de personas en miles


Y: Ventas trimestrales en miles de pesos
1. Tabular los datos obtenidos:
Sucursal

58

105

88

118

12

117

16

137

20

157

20

168

22

149

10

26

202

2. Graficar los datos en un diagrama de dispersin y determinar la posible


relacin entre las variables X Y.

Se puede observar una relacin lineal directa.

Regresin y Correlacin Lineal Simple

http://www.cuautitlan.unam.mx

Universidad Nacional Autnoma de Mxico


Facultad de Estudios Superiores Cuautitln

3. Realizar los clculos correspondientes

Sucursal

XY

58

116

3364

105

630

36

11025

88

704

64

7744

118

944

64

13924

12

117

1404

144

13689

16

137

2192

256

18769

20

157

3140

400

24649

20

168

3380

400

28224

22

149

3278

484

22201

10

26

202

5252

676

40804

140

1300

21040

2528

184393

4. Calculo de la pendiente.

140
= 14 mil personas
10
1300
y=
= 130 mil pesos
10

x=

Por lo tanto la pendiente es

b=

21040 10(14 )(130 )


2528 10(14 )

=5

5. Calculo de la ordenada al origen.

a = 130 5(14) = 60
6. Obtener la ecuacin que mejor se ajuste.

y = 60 + 5( x )

Regresin y Correlacin Lineal Simple

http://www.cuautitlan.unam.mx

Universidad Nacional Autnoma de Mxico


Facultad de Estudios Superiores Cuautitln

7. Trazar la lnea estimada.

8. Calcular el error estndar de estimacin.

Se =

184393 (60 1300) (5 21040)


= 12.21
10 2

Tiene un error de estimacin de 12,210 pesos.


Para una N = 14,000 1
y = 60 + 5(14 ) = 130
(14,130 )

Para una N = 30,000


y = 60 + 5(30 ) = 210
(30,210 )

Recuerda que estamos trabajando con miles de pesos, en este ejercicio.

Regresin y Correlacin Lineal Simple

http://www.cuautitlan.unam.mx

Universidad Nacional Autnoma de Mxico


Facultad de Estudios Superiores Cuautitln

CORRELACIN SIMPLE
Mientras que el anlisis de regresin simple establece una ecuacin
precisa que enlaza dos variables, el anlisis de correlacin es la herramienta
estadstica que podemos usar para describir el grado o fuerza en el que una
variable esta linealmente relacionada con otra.
Dependiendo del tamao de esta medida cuantitativa se puede decir, que
tan cercanamente se mueven dos variables, y por lo tanto, con cuanta
confiabilidad se puede estimar una variable con ayuda de la otra.
Una tcnica estadstica que establece un ndice que proporciona, en un
solo nmero, una medida de la fuerza de asociacin entre dos variables de
inters, se llama anlisis de correlacin simple.
El anlisis de correlacin es la herramienta estadstica de que nos valemos
para describir el grado de relacin que hay entre dos variables.
A menudo el anlisis de correlacin simple se utiliza junto con el anlisis de
regresin lineal simple para medir la eficacia con que la lnea de regresin
explica la variacin de la variable dependiente, Y.

Diagramas de dispersin con correlacin dbil y fuerte.

Existen dos medidas para describir la correlacin entre dos variables: el


coeficiente de determinacin y el coeficiente de correlacin.

Regresin y Correlacin Lineal Simple

http://www.cuautitlan.unam.mx

Universidad Nacional Autnoma de Mxico


Facultad de Estudios Superiores Cuautitln

COEFICIENTE MUESTRAL DE DETERMINACIN


La medida ms importante de que tambin ajusta la lnea de regresin
estimada en los datos muestrales en los que esta basada, es el coeficiente de
determinacin muestral, este es igual a la proporcin de la variacin total de
los valores de la variable dependiente, Y, que puede explicarse por medio
de la asociacin de Y con X medida por la lnea de regresin estimada.
El coeficiente de determinacin es la manera primaria de medir el
grado, o fuerza, de la relacin que existe entre dos variables, X y Y.
El coeficiente de determinacin muestral se representa como r2, y mide
exclusivamente la fuerza de una relacin lineal entre dos variables.
El Calculo del coeficiente de determinacin se lleva a cabo con la siguiente
formula:

(a y ) + (b xy ) (n y
=
y (n y )
2

COEFICIENTE MUESTRAL DE CORRELACIN


La raz cuadrada del coeficiente de determinacin muestral, r 2 , es un
ndice alternativo comn del grado de asociacin entre dos variables
cuantitativas. Esta mediad se llama coeficiente de correlacin muestral (r) y
es un estimador puntual del coeficiente de correlacin poblacional ().
El coeficiente de correlacin muestral es la segunda medida con que
puede describirse la eficacia con que una variable es explicada por otra, as
pues el signo de r indica la direccin de la relacin entre las dos variables X y
Y.

Regresin y Correlacin Lineal Simple

http://www.cuautitlan.unam.mx

Universidad Nacional Autnoma de Mxico


Facultad de Estudios Superiores Cuautitln

El siguiente esquema representa adecuadamente la intensidad y la


direccin del coeficiente de correlacin muestral.

El calculo del coeficiente de correlacin muestral se lleva a cavo con la


siguiente formula:

r = r2
INTERVALO DE CONFIANZA
Debido a que la recta estimada de regresin, no es del todo real, es
necesario elaborar un intervalo de confianza que le de seguridad a nuestros
clculos.
Como se ha visto, cuando se utilice el mtodo de mnimos cuadrados,
los coeficientes de regresin, a y b son estimadores insesgados, eficientes y
consistentes de y , tambin aqu es muchas ocasiones es deseable
establecer intervalos de confianza.
Los intervalos de confianza se calculan con la siguiente frmula:

S
yc = y t / 2 , gln 2 e
n

Regresin y Correlacin Lineal Simple

http://www.cuautitlan.unam.mx

Universidad Nacional Autnoma de Mxico


Facultad de Estudios Superiores Cuautitln

INTERVALO DE PREDICCIN
El intervalo de prediccin, como su nombre lo indica, se utiliza para
predecir un intervalo de valores de Y, dado un valor de X.
El intervalo de prediccin se calcula con la siguiente frmula:

(X x )
1
y p = y (t 2 (n 2)) S e 1 + +
n x 2 n(x )2
2

PROCEDIMIENTO PARA REALIZAR UN ANLISIS DE CORRELACIN LINEAL


SIMPLE
1. Obtencin y tabulacin de los datos muestrales.
2. La informacin se grfica en un diagrama de dispersin.
3. Calcular la pendiente y ordenada al origen.
4. Se obtiene la ecuacin que mejor se ajusta a la informacin obtenida.
5. Se traza la lnea estimada en el diagrama de dispersin.
6. Calcular el error estndar de estimacin.
7. Calcular el coeficiente de determinacin.
8. Determinar el coeficiente de correlacin.
9. Determinar el intervalo de confianza.
10. Determinar el intervalo de prediccin.

Regresin y Correlacin Lineal Simple

http://www.cuautitlan.unam.mx

Universidad Nacional Autnoma de Mxico


Facultad de Estudios Superiores Cuautitln

Por ejemplo:
Un gerente de ventas reuni los datos siguientes relacionados con las
ventas anuales en miles de pesos y los aos de experiencia de diez
vendedores. Estime las ventas anuales para un vendedor con 7 aos de
experiencia.
Solucin
1. Obtencin y tabulacin de los datos muestrales.
X: Aos de experiencia
Y: Ventas anuales en miles de pesos.
Vendedor
1
2
3
4
5
6
7
8
9
10
=

X
1
3
4
4
6
8
10
10
11
13
70

Y
80
97
92
102
103
111
119
123
117
136
1080

2. Diagrama de dispersin.

Regresin y Correlacin Lineal Simple

http://www.cuautitlan.unam.mx

Universidad Nacional Autnoma de Mxico


Facultad de Estudios Superiores Cuautitln

3. Realizar los clculos correspondientes y determinar la pendiente y


ordenada al origen.
Vendedor
1
2
3
4
5
6
7
8
9
10
=

X
1
3
4
4
6
8
10
10
11
13
70

Y
80
97
92
102
103
111
119
123
117
136
1080

X2
1
9
16
16
36
64
100
100
121
169
632

XY
80
291
368
408
618
888
1190
1230
1287
1768
8128

Y2
6400
9409
8464
10404
10609
12321
14161
15129
13689
18496
119082

1080
= 108
10
70
=7
x=
10
y=

b=

8128 10(7 )(108)


632 10(7 )

=4

a = 108 4(7 ) = 80

4. Ecuacin que mejor se ajusta.

y = 80 + 4( x )
Para un vendedor con 7 aos de experiencia, sus ventas estimadas seran:

y = 80 + 4(7 ) = 108 ventas anuales

Regresin y Correlacin Lineal Simple

http://www.cuautitlan.unam.mx

Universidad Nacional Autnoma de Mxico


Facultad de Estudios Superiores Cuautitln

5. Trazo de la lnea estimada en el diagrama de dispersin

6. Calcular el error estndar de estimacin.

Se =

119082(80 1080) (4 8128)


= 4.61
10 2

7. Calcular el Coeficiente de Determinacin.

(
80 1080 ) + (4 8128) (10 1082 )
=
=

119082 10 1082

r 2 = 93.03%

El 93% de las ventas anuales se deben a la experiencia de los vendedores y


el 7% restante de debe a otros factores.
8. Calcular el Coeficiente de Correlacin

r = 0.9303 = 0.9645
Este nmero nos indica que las variables X Y tienen una correlacin positiva
intensa.

Regresin y Correlacin Lineal Simple

http://www.cuautitlan.unam.mx

Universidad Nacional Autnoma de Mxico


Facultad de Estudios Superiores Cuautitln

9. Determinar el intervalo de confianza al 95%.


Considerando

y = 108 ventas anuales

4.61
yc = 108 2.306

10
108 3.3617 yc 108 + 3.3617
104.6383 yc 111.3617
Se puede asegurar con un nivel de confianza del 95% que las ventas de los
vendedores con 7 aos de experiencia estn entre 104.6 y 111.4 miles pesos
anuales.
10. Determinar el intervalo de prediccin para un vendedor con 9 aos de
experiencia se tiene

(X x )
1
y p = y (t 2 (n 2)) S e 1 + +
n x 2 n(x )2
2

Sustituyendo:

(9 7 )
1
y p = 108 2.306 4.61 1 + +
10 632 10(7) 2
2

108 11.291 y p 108 + 11.291


96.709 y p 119.291

Se puede asegurar con un nivel de confianza del 95% que las ventas
pronosticadas de un vendedor con 9 aos de experiencia estn entre 96.71
y 119.3 miles pesos anuales.

Regresin y Correlacin Lineal Simple

http://www.cuautitlan.unam.mx

Universidad Nacional Autnoma de Mxico


Facultad de Estudios Superiores Cuautitln

Ejercicios propuestos:
1. El jefe del departamento de aguas de una ciudad desea establecer una
relacin entre el consumo mensual domiciliario de agua Y, y el tamao de las
familias X, Dados los datos muestrales, determine:
Galones
de
Agua
Y
650
1200
1300
430
1400
900
1800
640
793
925
a)
b)
c)
d)
e)
f)
g)
h)
i)

Tamao
de
familia.
X
2
7
9
4
12
6
9
3
3
2

Elabora el diagrama de dispersin.


Calcula la pendiente y ordenada al origen.
Obtener la ecuacin que mejor se ajusta a los datos.
Traza la lnea estimada en el diagrama de dispersin.
Calcula el error estndar de estimacin.
Calcula el coeficiente de determinacin.
Determina el coeficiente de correlacin.
Determina el intervalo de confianza al 99%.
Determina el intervalo de prediccin 99%

Regresin y Correlacin Lineal Simple

http://www.cuautitlan.unam.mx

Universidad Nacional Autnoma de Mxico


Facultad de Estudios Superiores Cuautitln

2. El gerente de una compaa de seguros desea establecer la relacin entre


el seguro de vida de las personas Y, y sus salarios X. Realice una regresin con
los datos muestrales:

a)
b)
c)
d)
e)
f)
g)
h)
i)

Seguro Salario
Anual.
de
vida
Y
X
50
10
80
29
100
30
130
31
150
36
Elabora el diagrama de dispersin.
Calcula la pendiente y ordenada al origen.
Obtener la ecuacin que mejor se ajusta a los datos.
Traza la lnea estimada en el diagrama de dispersin.
Calcula el error estndar de estimacin.
Calcula el coeficiente de determinacin.
Determina el coeficiente de correlacin.
Determina el intervalo de confianza al 90%.
Determina el intervalo de prediccin 90%

3. Un economista desea establecer la relacin entre la tasa de desempleo Y, y


la tasa de cuentas vencidas de la Tesoreras, Determine la regresin y
correlacin con los datos muestrales.
Y
6.7
7.3
8.9
9.1
7.2
5.2
6.9
6.9
7.1

X
9.7
9.8
7.6
6.1
10.2
12.7
14.3
7.9
8.9

1. Elabora el diagrama de dispersin.


2. Calcula la pendiente y ordenada al origen.
3. Obtener la ecuacin que mejor se ajusta a los datos.
Regresin y Correlacin Lineal Simple

http://www.cuautitlan.unam.mx

Universidad Nacional Autnoma de Mxico


Facultad de Estudios Superiores Cuautitln

4.
5.
6.
7.
8.
9.

Traza la lnea estimada en el diagrama de dispersin.


Calcula el error estndar de estimacin.
Calcula el coeficiente de determinacin.
Determina el coeficiente de correlacin.
Determina el intervalo de confianza al 95%.
Determina el intervalo de prediccin 95%

4. Un director de ventas desea establecer la relacin entre las ventas del


segundo ao de vendedores Y, y sus ventas del primer ao X. Realice un
anlisis de regresin.
Y
X
a)
b)
c)
d)
e)
f)
g)
h)
i)

69 75
170 133

86
86

111 129 133


161 112 133

Elabora el diagrama de dispersin.


Calcula la pendiente y ordenada al origen.
Obtener la ecuacin que mejor se ajusta a los datos.
Traza la lnea estimada en el diagrama de dispersin.
Calcula el error estndar de estimacin.
Calcula el coeficiente de determinacin.
Determina el coeficiente de correlacin.
Determina el intervalo de confianza al 95%.
Determina el intervalo de prediccin 95%

5. Un gerente de comercializacin desea establecer la relacin entre las


ventas Y, y el precio de un producto similar fabricado por la competencia
X, Realice un anlisis de correlacin.
Ventas
Y
520
550
600
610
620
724
680
300
962
270
Regresin y Correlacin Lineal Simple

Precio de
competencia
X
13
13
15
15
16
21
21
14
40
12

http://www.cuautitlan.unam.mx

Universidad Nacional Autnoma de Mxico


Facultad de Estudios Superiores Cuautitln

1.
2.
3.
4.
5.
6.
7.
8.
9.

Elabora el diagrama de dispersin.


Calcula la pendiente y ordenada al origen.
Obtener la ecuacin que mejor se ajusta a los datos.
Traza la lnea estimada en el diagrama de dispersin.
Calcula el error estndar de estimacin.
Calcula el coeficiente de determinacin.
Determina el coeficiente de correlacin.
Determina el intervalo de confianza al 99%.
Determina el intervalo de prediccin 99%

6. Se hizo una encuesta a una muestra de 10 los estudiantes de 3er. Semestre


de la carera de Lic. En administracin del grupo 1301 del semestre 2009-1 y se
encontraron los siguientes datos:

a)
b)
c)
d)
e)
f)
g)
h)
i)

Estudiante
Altura (mts)
Peso (Kg)
1
1.50
48
2
1.54
50
3
1.60
52
4
1.72
70
5
1.80
72
6
1.50
50
7
1.61
57
8
1.54
54
9
1.63
80
10
1.70
62
Elabora el diagrama de dispersin.
Calcula la pendiente y ordenada al origen.
Obtener la ecuacin que mejor se ajusta a los datos.
Traza la lnea estimada en el diagrama de dispersin.
Calcula el error estndar de estimacin.
Calcula el coeficiente de determinacin.
Determina el coeficiente de correlacin.
Determina el intervalo de confianza al 95%.
Determina el intervalo de prediccin 95%

Regresin y Correlacin Lineal Simple

http://www.cuautitlan.unam.mx

Universidad Nacional Autnoma de Mxico


Facultad de Estudios Superiores Cuautitln

7. Los datos siguientes muestran las ventas (en miles de cajas) y los costos de
un anuncio publicitario para la televisin (en millones de pesos) para 7 marcas
principales de refrescos.
Marca
Gastos de
Ventas de cajas
publicidad ($)
(miles)
Coca-Cola
13.0
19.3
Pepsi-Cola
9.4
13.8
Sprite
6.4
8.4
Diet Coke
5.7
5.5
7-Up
4.2
5.9
Jarritos
2.9
5.3
Boing
1.6
2.5
a) Dibuje el diagrama de dispersin, que parece indicar este diagrama
acerca de la relacin entre las dos variables?
b) Trace una recta que pase por los datos, para aproximar una relacin
lineal entre los gastos del anuncio y las ventas.
c) Aplique el mtodo de los cuadrados mnimos para plantear la ecuacin
estimada de regresin.
d) Prediga las ventas para una marca que decida gastar $7 millones de
pesos en un anuncio publicitario.
e) Calcule el error estndar en la regresin.
f) Calcule el coeficiente de determinacin y correlacin e interprtelos.
g) Determina el intervalo de confianza al 95%.
h) Determina el intervalo de prediccin 95%
8. La revista del consumidor publico en su nmero 381 del mes de noviembre
del 2008 la siguiente informacin acerca del uso de los telfonos celulares:
Ao
2000
2001
2002
2003
2004
2005
2006
2007

Regresin y Correlacin Lineal Simple

Usuarios que compran


tiempo aire en (miles de
usuarios)
1628
1784
2006
2029
2508
3268
4035
5199

http://www.cuautitlan.unam.mx

Universidad Nacional Autnoma de Mxico


Facultad de Estudios Superiores Cuautitln

a) Trace un diagrama de dispersin para estos datos,


b) Aplique el mtodo de mnimos cuadrados para plantear la ecuacin
estimada de regresin.
c) Trace una recta que pase por los datos, para aproximar una relacin
lineal entre la altura y el peso.
d) Prediga cuantos usuarios compraran tiempo aire para su telfono
celular para el ao 2009.
e) Calcule el error estndar en la regresin.
f) Calcule el coeficiente de correlacin y el coeficiente de determinacin
e interprtelos.
g) Determina el intervalo de confianza al 92%.
h) Determina el intervalo de prediccin 92%
9. Un vendedor de Century 21 desea establecer la relacin entre el tiempo en
meses que estn a la venta los departamentos antes de lograr su venta y el
precio pedido por ellos. Los datos de una muestra de 9 departamentos se
muestran a continuacin:

Meses en venta
6.5 7.0
8.6 12.1 9.0 9.5 8.6 10.6 15.0
Precio pedido (en 800 1000 990 1250 1400 1100 990 990 1250
miles de pesos)
a) Trace un diagrama de dispersin para estos datos,
b) Aplique el mtodo de mnimos cuadrados para plantear la ecuacin
estimada de regresin.
c) Prediga cuanto tiempo se tardara en vender un departamento que
cueste $ 1500,000 pesos.
d) Calcule el error estndar en la regresin.
e) Calcule el coeficiente de correlacin y el coeficiente de determinacin
e interprtelos.
f) Determina el intervalo de confianza al 95%.
g) Determina el intervalo de prediccin 95%

Regresin y Correlacin Lineal Simple

http://www.cuautitlan.unam.mx

Universidad Nacional Autnoma de Mxico


Facultad de Estudios Superiores Cuautitln

10. El Orgamismo Operador de agua en el Muncipio de cuautitln Izcalli


OPERAGUA quiere conocer la relacin entre en consumo mensual domiciliario
de agua y el tamao de las familias, toma una muestra de 10 familias elegidas
al azar y encuentra los siguientes datos:
Metros cbicos
65 120 130 43 140 90 180 64 79 92
consumidos
Tamao de la
2
7
9
4
12 6
9
3
3
4
familia
a) Trace un diagrama de dispersin para estos datos,
b) Aplique el mtodo de mnimos cuadrados para plantear la ecuacin
estimada de regresin.
c) Prediga cuantos metros cbicos al mes consumir una familia que tiene
10 miembros.
d) Calcule el error estndar en la regresin.
e) Calcule el coeficiente de correlacin y el coeficiente de determinacin
e interprtelos.
f) Determina el intervalo de confianza al 95%.
g) Determina el intervalo de prediccin 95%
11- El gerente de una mueblera FAMSA quiere conocer la relacin de las
ventas logradas por un vendedor en dos aos, toma una muestra de 8
vendedores que lograron la etiqueta de (vendedor del mes) y encontr los
siguientes datos:
Unidades vendidas en el ao 2007

170

133

86

161

112

133

136

82

Unidades vendidas en el ao 2006

99

95

50

80

92

88

130

100

a) Trace un diagrama de dispersin para estos datos,


b) Aplique el mtodo de mnimos cuadrados para plantear la ecuacin
estimada de regresin.
c) Calcule el error estndar en la regresin.
d) Calcule el coeficiente de correlacin y el coeficiente de determinacin e
interprtelos.
e) Determina el intervalo de confianza al 95%.
f) Determina el intervalo de prediccin 95%

Regresin y Correlacin Lineal Simple

http://www.cuautitlan.unam.mx

Universidad Nacional Autnoma de Mxico


Facultad de Estudios Superiores Cuautitln

12. Segn el INEGI los nacimientos registrados en el pas en el 2007 fueron:

a)
b)

c)
d)
e)
f)
g)

Nacimientos
Mes de registro Registrados
1 Enero
220,670
2 Febrero
211,330
3 Marzo
213,299
4 Abril
270,819
5 Mayo
225,298
6 Junio
205,572
7 Julio
211,180
8 Agosto
249,626
9 Septiembre 220,666
10 Octubre
241,529
11 Noviembre 211,857
12 Diciembre 173,237
Aplique el mtodo de mnimos cuadrados para plantear la ecuacin
estimada de regresin.
El INEGI reporto que en julio de 2007 se registraron 211,330
nacimientos, utiliza la ecuacin obtenida y predice cuantos debieron
de haberse registrado en ese mes, compara resultados y obtn tus
conclusiones.
Estime cuantos nacimientos se registraron en enero de 2008.
Calcule el error estndar en la regresin.
Calcule el coeficiente de correlacin y el coeficiente de determinacin
e interprtelos.
Determina el intervalo de confianza al 95%.
Determina el intervalo de prediccin 95%

Regresin y Correlacin Lineal Simple

http://www.cuautitlan.unam.mx

También podría gustarte