P. 1
Ejercicios de Regresion Lineal

Ejercicios de Regresion Lineal

3.0

|Views: 22.061|Likes:
Publicado porJuan Pablo

More info:

Published by: Juan Pablo on Jul 11, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

08/20/2013

pdf

text

original

233 [233

]
Introducción
En el capítulo anterior se vio que es muy frecuente encontrar varia-
bles que están relacionadas o asociadas entre sí; por ejemplo, las
calificaciones de los estudiantes están relacionadas con el tiempo
que dedican al estudio, el gasto familiar está relacionado con el
ingreso familiar, etc.
Existen muchas variables, en especial cuantitativas, que se
relacionan en algún grado con otras; entonces, es posible que una
de las variables pueda expresarse matemáticamente en función de
la otra. Frecuentemente se nos formulan las siguientes preguntas:
¿El peso de las personas está relacionado con la estatura? ¿El tiem-
po de servicio de trabajo activo tiene relación con la edad? ¿El
ingreso o salario está relacionado con el nivel educativo? ¿El aho-
rro familiar tiene relación con los ingresos? ¿La demanda de un
producto dependerá de los precios?, etc.
Estadísticamente nos interesa analizar la relación entre dos o
más variables, siempre que se tenga un indicio de que entre ellas
existe por lo menos cierto grado de dependencia o asociación. Lo
importante es medir y expresar funcionalmente esta relación me-
diante una función o modelo matemático.
En el presente capítulo estudiaremos el análisis de regresión
entre dos variables X e Y, y el grado de relación entre ellas me-
diante el análisis de correlación.
Capítulo V
Análisis de regresión y correlación lineal
05_cap5.p65 31/03/2006, 02:48 p.m. 233
234
Análisis de regresión lineal simple
Si se trata de predecir o explicar el comportamiento de una variable
Y, a la que se denomina dependiente o variable respuesta, en fun-
ción de otra variable X denominada independiente o regresora,
Y =f( X), estamos frente a un problema de análisis de regresión
lineal simple; pero si deseamos investigar el grado de asociación
entre las variables X e Y estamos frente a un problema de análisis
de correlación.
Diagrama de dispersión
¿Cómo encontrar la relación entre X e Y ? Una de las formas grá-
ficas más sencillas es realizando el diagrama de dispersión, deno-
minado también diagrama de nube de puntos.
Este tipo de gráfico se utiliza para visualizar la relación entre
las variables y, a partir de dicha relación, observar en qué medida
se mantiene el incremento o disminución de una variable a partir
del aumento de otra variable.
Para su construcción, se trazan en el plano cartesiano los ejes
de la abscisa ( X) y de la ordenada ( Y ). En el eje X se colocan los
valores de una de las variables y, en el eje Y , los valores de la otra
variable. En la intersección correspondiente a cada valor de X y a
cada valor de Y se coloca un punto, y así tendremos la nube de
puntos.
Mostraremos a continuación algunas formas que adquiere el
diagrama de dispersión.
Figura 1. Diagramas de dispersión
Y
Y
. . . . .
. . . . . . .
. . . . . .
. . . . . .

X

X

Y a bX · +

Y a bX · −
a) Relación lineal positiva b) Relación lineal negativa

05_cap5.p65 31/03/2006, 02:48 p.m. 234
235
Y

Y
. . . . .
. . . . . . . . . . .. .
. . . . . . . . . . .. .
. . .
. . . . . .

X

X
Y a ·

2
Y a bX cX · + +
c) No hay relación lineal d) Relación no lineal
entre X e Y
Como se puede ver en el gráfico (a), los valores de Y se
incrementan linealmente conforme X crece, es decir, el conjunto
de datos se puede representar por una línea recta ascendente. Por
ejemplo, al aumentar la partida presupuestal asignada por el go-
bierno a un colegio, aumenta la posibilidad de atender una mayor
demanda escolar.
Es diferente en el gráfico (b), porque cuando los valores de X
crecen, los valores de Y decrecen, es decir, el conjunto de datos se
puede representar por una línea recta descendente. Así, por ejem-
plo, cuando aumenta el número de horas semanales que los es-
tudiantes dedican a las distracciones, su rendimiento académico
disminuye.
En el gráfico (c) no hay ninguna relación entre X e Y ; mien-
tras que el gráfico (d) muestra una relación de tipo curvilínea entre
X e Y . Así, por ejemplo, cuando los estudiantes dedican diaria-
mente un mayor número de horas a ver programas de televisión,
disminuye su rendimiento académico en el colegio.
Como se observa en los diagramas de dispersión, el término
lineal empleado se refiere al tipo de relación entre X e Y .
Una vez visualizada la relación, los diagramas de dispersión
no son suficientes para determinar el grado de la relación entre las
variables, por lo que debemos utilizar procedimientos estadísticos
para determinar el modelo mas apropiado que exprese el compor-
tamiento del conjunto de datos ( ) ,
i i
x y .

05_cap5.p65 31/03/2006, 02:48 p.m. 235
236
Ajust e de una función de regresión:
Mét odo de mínimos cuadrados
Ajustar una función de regresión significa encontrar, la función
que exprese con mayor precisión la relación entre las variables
X e Y . Gráficamente será aquella función que mejor se adecue a
la nube de puntos. En este sentido, es recomendable como primer
paso construir el diagrama de dispersión o diagrama de nube de
puntos para, luego de analizar su forma, decidir por el tipo de
función matemática (modelo) o la ecuación de regresión que expre-
se la relación entre las variables X e Y . Luego, se estiman los
parámetros del modelo, para lo cual existen varios métodos, sien-
do el más usado el método de mínimos cuadrados.
Intentamos describir la dependencia de una variable Y sobre
una variable independiente X . Emplearemos la ecuación de regre-
sión a fin de apoyar la hipótesis que postula la posible causalidad
de los cambios de Y mediante los cambios en X ; para propósitos
de predicción de Y en función de X ; y para propósitos de explica-
ción de parte de la variación de Y por X utilizando la última va-
riable como control estadístico. Los estudios de los efectos de la
temperatura en el rendimiento académico, el contenido de nitróge-
no en el suelo sobre la tasa de crecimiento de una planta, la edad de
un estudiante sobre su presión sanguínea, la dosis de un insectici-
da sobre la mortalidad de una población de insectos, el número de
horas de estudio sobre el rendimiento académico, son ejemplos típi-
cos de regresión para los propósitos señalados.
Supondremos que el diagrama de dispersión sugiere que la
relación entre las dos variables se puede expresar mediante una
recta L: Y a bX · + . El método de mínimos cuadrados garantiza
que la recta que representa el comportamiento del conjunto de da-
tos es la recta L, donde la suma de los cuadrados de las diferencias
de las ordenadas
i
y de los puntos observados ( ,
i i
x y ), y de las
ordenadas
ˆ
ˆ ˆ
i
y a bx · + de los puntos (
ˆ
ˆ ,
i i
x a bx + ) que están en la
recta L, sea mínimo. Esto es, se trata de obtener los valores de a y
b de tal manera que el valor de la suma de cuadrados de los resi-
duos, SSE, sea mínimo. Es decir:
( )
2
1
ˆ
n
i i
i
SSE y y
·
· −
∑ sea mínimo, (5.1)
05_cap5.p65 31/03/2006, 02:48 p.m. 236
237
donde:
i
y : son los valores observados de la variable dependiente Y ,
ˆ
i
y : son los valores estimados de Y ,
b
: es la pendiente de la recta, llamada también coeficiente de
regresión, para predecir la variable Y ,
a : es la constante o intercepto
Entonces la ecuación de regresión estimada se expresa como:
ˆ ˆ
ˆ Y a bX · +
Y
recta de regresión
para predecir Y .
.........................................
.
.
.
.
10 .
.

0

X
0 5 10 15 20 25 30
Según el método de mínimos cuadrados, se demuestra que ˆ a
y
ˆ
b valores de a y b que hacen mínima la SSE , satisfacen el
denominado sistema de ecuaciones normales:
1 1
n n
i i
i i
y an b x
· ·
· +
∑ ∑
2
1 1 1
n n n
i i i i
i i i
x y a x b x
· · ·
· +
∑ ∑ ∑ . (5.2)
Resolviendo el sistema se deducen los siguientes valores para
las constantes a y
b
, denominados valores estimados de los co-
eficientes de regresión:
2
1 1 1 1
2
2
1 1
ˆ
n n n n
i i i i i
i i i i
n n
i i
i i
y x x x y
a Y bX
n x x
· · · ·
· ·

· · −
| `


. ,
∑ ∑ ∑ ∑
∑ ∑
(5.3)

05_cap5.p65 31/03/2006, 02:48 p.m. 237
238
1 1 1
2
2
1 1
ˆ
,
n n n
i i i i
i i i
n n
i i
i i
n x y x y
b
n x x
· · ·
· ·

·
| `


. ,
∑ ∑ ∑
∑ ∑
(5.4)
La recta de regresión nos permite, basándonos en los datos de
la muestra, estimar un valor de la variable Y —que denotaremos
con ˆ
i
y — correspondiente a un valor dado
i
x de la variable X .
Para ello es suficiente reemplazar el valor de
i
x en la recta de
regresión y encontraremos el correspondiente valor estimado ˆ
i
y .
Ejemplo 1
Con los datos de la tabla 1, correspondiente al rendimiento acadé-
mico en el nivel superior ( Y ) y al rendimiento académico en el
nivel secundario ( X ) de 8 estudiantes:
a) Construiremos el diagrama de dispersión.
b) Aplicaremos el método de mínimos cuadrados para encon-
trar los coeficientes de regresión lineal.
c) Averiguaremos: ¿Cuál será el rendimiento en educación su-
perior de un estudiante con nota promedio de 12 en la edu-
cación secundaria?
Tabla 1: Rendimiento académico en secundaria
y en educación superior de un grupo de alumnos
Est ud iant es
X Y
1 16 15
2 13 11
3 15 17
4 12 14
5 11 11
6 16 14
7 13 15
8 10 12
Solución
a) Usando los comando del SPSS presentados en el capítulo VII, se
obtiene el diagrama de dispersión presentado en la figura 2. Tam-
bién presentamos los cálculos para encontrar los valores ˆ a y
05_cap5.p65 31/03/2006, 02:48 p.m. 238
239
ˆ
b de la ecuación de regresión estimada por el método de mínimos
cuadrados.
Figura 2
Di agrama de dispersión de rendi mi ento en secundar ia
y rendi mi ento en e ducación superior
Rendimiento en educación superior
1 8 1 6 1 4 1 2 1 0
R
e
n
d
i
m
i
e
n
t
o
e
n
s
e
c
u
n
d
a
r
i
a
1 7
1 5
1 3
11
9
El diagrama de dispersión nos sugiere que los datos se pue-
den representar mediante una recta
Y a bX · +
.
b) Cálculos necesarios para estimar los coeficientes de regre-
sión y usando el método de mínimos cuadrados

i
x
i
y
2
i
x
i i
x y
16 15 256 240
13 11 169 143
15 17 225 255
12 14 144 168
11 11 121 121
16 14 256 224
13 15 169 195
10 12 100 120
Total 106 109 1440 1466
( )
8 8 8 8
2
1 1 1 1
2 2
8 8
2
1 1
109 1440 106 1466
ˆ 5, 51
8 1440 106
i i i i i
i i i i
i i
i i
y x x x y
a
n x x
· · · ·
· ·

× − ×
· · ·
× − | `


. ,
∑ ∑ ∑ ∑
∑ ∑
05_cap5.p65 31/03/2006, 02:48 p.m. 239
240
( )
1 1 1
2 2
2
1 1
8 1466 106 109
ˆ
0, 61
8 1440 106
n n n
i i i i
i i i
n n
i i
i i
n x y x y
b
n x x
· · ·
· ·

× − ×
· · ·
× − | `


. ,
∑ ∑ ∑
∑ ∑
Entonces, la recta de regresión de Y sobre X queda expresada
como:
ˆ
5, 51 0, 61 Y X · +
Si un estudiante obtiene un rendimiento de 12 en secundaria,
entonces su rendimiento esperado en educación superior se obtie-
ne reemplazando X por el valor 12 en la recta definida, es decir:
ˆ
5, 51 0, 61 12 5, 51 7, 32 12, 83 Y · + × · + ·
.
Puede decirse que se estima que un alumno que tiene un ren-
dimiento de 12 puntos en educación secundaria, en educación
superior tendrá un rendimiento de 12,83 puntos.
Análisis de correlación lineal
Nos proponemos investigar si dos variables son independientes o
covarían, esto es, si varían conjuntamente. No expresamos una va-
riable como función de la otra, así como tampoco hacemos distin-
ción alguna entre variables dependientes e independientes. Puede
muy bien suceder que, de una pareja de variables cuya correlación
se estudia, una sea causa de la otra, aunque nosotros no lo sepamos
ni lo sospechemos. Una hipótesis importante, aunque no esencial,
es que las dos variables sean efectos de una causa común y lo que se
desea conocer es el grado en el que ambas variables varían conjunta-
mente. Así, podríamos estar interesados en la correlación entre las
longitudes de las extremidades superiores y extremidades inferio-
res en una población de estudiantes, o entre el peso y la estatura de
un grupo de estudiantes, o entre los días necesarios para la madu-
rez y el número de semillas en una siembra.
La correlación lineal mide el grado de la asociación lineal en-
tre dos variables denotadas con X e Y . Analizando el diagrama
de dispersión o nube de puntos podemos visualizar el tipo de co-
rrelación lineal entre las variables involucradas.
05_cap5.p65 31/03/2006, 02:48 p.m. 240
241
Figura 3. Tipos de correlación lineal
Y Y
. .
... .. . .
. . . . . .
. . . . ..

. . .
X X
a) Correlación positiva b) Correlación negativa
Y
. . .
. . . . . . .
. . . . . . . .
. . : : : .
. . . . . . . .
X
c) Correlación nula
Correlación positiva o directa
En la figura 3(a), las variables X e Y están correlacionadas posi-
tivamente o su variación está en razón directa; es decir, el aumento
de la medida de la variable X implica el aumento de la medida de
la variable Y .
Ejemplo 2
En la tabla 2 se presentan las puntuaciones en Literatura ( X ) y
las puntuaciones en Lenguaje ( Y ) de un grupo de alumnos de un
centro educativo. Se observará su relación a través de un diagrama
de dispersión.


05_cap5.p65 31/03/2006, 02:48 p.m. 241
242
Tabla 2: Puntuaciones en Literatura y en
Lenguaje de un grupo de alumnos
Nº Estudiante X Y
1 5 12
2 8 20
3 12 30
4 16 30
5 16 42
6 24 40
7 28 50
Solución
El diagrama de dispersión, usando los comandos del SPSS presen-
tados en el capítulo VII es el siguiente:
Figura 4
Puntuaciones en Literatura y Lenguaje de un grupo de alumnos
Puntu aciones en Li teratura
30 20 10 0
P
u
n
t
u
a
c
i
o
n
e
s
e
n
L
e
n
g
u
a
j
e
60
50
40
30
20
10
Como se puede observar, cuando aumenta el valor de la va-
riable X (puntuaciones en Literatura) también aumenta el valor
de la variable Y (puntuaciones en Lenguaje); luego, visualizando
que el tipo de correlación entre las puntuaciones en literatura y
lenguaje es positiva.
Correlación negat iva o inversa
Se dice que las variables X e Y están correlacionadas negativa-
mente o su variación está en razón inversa, cuando el aumento de
05_cap5.p65 31/03/2006, 02:48 p.m. 242
243
la medida de la variable X implica la disminución de la medida
de la variable Y , o la disminución de la medida de la variable X
implica el aumento de la variable Y , como se puede observar en la
figura 3(b).
Ejemplo 3
La tabla 3 nos muestra las puntuaciones en Literatura (
X
) y las
puntuaciones en Matemática ( Y ) de un grupo de alumnos de un
determinado centro educativo. Mostraremos el diagrama de dis-
persión.
Tabla 3
Puntuaciones en Literatura y en Matemática de un grupo de alumnos
Nº Estudiante
i
x
i
y
1 10 30
2 30 15
3 38 37
4 40 25
5 60 35
6 65 05
7 80 20
8 90 10
Solución
El diagrama de dispersión, usando los comandos del SPSS presen-
tados en el capítulo VII es el siguiente:
Figura 5
Puntuaciones en Literatura y Matemática de un grupo de alumnos
Puntuaci ones en Lite ratura
10 0 80 60 40 20 0
P
u
n
t
u
a
c
i
o
n
e
s
e
n
M
a
t
e
m
á
t
i
c
a
40
30
20
10
0
05_cap5.p65 31/03/2006, 02:48 p.m. 243
244
Como se puede apreciar, frente al aumento de las puntuaciones
en literatura ( X ) disminuyen las puntuaciones en Matemática (
Y
),
visualizando la correlación entre X e Y es negativa o inversa.
Correlación nula
En la figura 3(c) las variables no están correlacionadas entre sí; es
este caso, diremos que la correlación entre X e Y es nula; esto lo
podemos observar en el siguiente ejemplo.
Ejemplo 4
En la tabla 4, la variable X corresponde a las puntuaciones en
deporte y la variable Y corresponde a las puntuaciones en Mate-
mática de un grupo de alumnos. Mostraremos el diagrama de dis-
persión para identificar el tipo de correlación.
Tabla 4: Puntuaciones en deporte y en
Matemática de un grupo de alumnos
Nº Estudiante
X Y
1 02 25
2 04 10
3 04 35
4 08 05
5 08 40
6 14 05
7 14 15
8 14 40
9 18 20
10 18 35
Solución
El diagrama de dispersión, usando los comandos del SPSS presen-
tados en el capítulo VII es el siguiente:
05_cap5.p65 31/03/2006, 02:48 p.m. 244
245
Figura 6
Puntuaciones en deporte y en Matemática
de un grupo de alumnos
Punt uaci ones en deport e
20 10 0
P
u
n
t
u
a
c
i
o
n
e
s
e
n
M
a
t
e
m
á
t
i
c
a
50
40
30
20
10
0
Como se puede apreciar, la correlación entre las puntuaciones
en deporte ( X ) y las puntuaciones en matemática ( Y ) es nula.
Coeficient e de correlación de Pearson ( r )
Existen numerosos coeficientes de correlación en Estadística. El
más común de ellos es el denominado coeficiente de correlación
producto-momento, cuya formulación se debe a Karl Pearson.
El coeficiente de correlación de Pearson se utiliza en el análi-
sis de información cuantitativa, cuando se desea medir el grado de
asociación lineal entre dos variables cuantitativas.
Sus valores varían entre –1 y 1. El valor +1 indica que entre X e
Y existe una correlación lineal directa y perfecta; el valor –1, una
correlación lineal inversa y perfecta. El valor 0 indica ausencia de
correlación lineal.
Para obtener este coeficiente hay una gran variedad de expresio-
nes matemáticas que son equivalentes, destacando las siguientes:
a) Para puntuaciones directas o datos originales:
( )( )
( ) ( )
2 2
2 2
i i i i
i i i i
n x y x y
r
n x x n y y

·
] ]
− −
] ]
] ]
∑ ∑ ∑
∑ ∑ ∑ ∑
(5.5)
05_cap5.p65 31/03/2006, 02:48 p.m. 245
246
b) para puntuaciones Z (puntuaciones tipificadas):
x y
x
Z Z
r
S
·

, (5.6)
donde:
i
x
x
x X
Z
S

· .
i
y
y
y Y
Z
S

·
Propiedades
El valor de r se encuentra entre –1 y +1, de donde se deduce que:
a) Si r > 0, existe correlación directa o correlación positiva,
b) Si r < 0, existe correlación inversa o correlación negativa.
En la interpretación clásica del coeficiente de correlación se
deduce, por ejemplo, que si:
a) 0 0, 20 r ≤ < , la correlación es muy baja,
b) 0, 20 0, 40 r ≤ < , existe una correlación baja,
c) 0, 40 0, 70 r ≤ < , existe una moderada correlación positiva,
d) 0, 70 1, 00 r ≤ < , existe de moderada a buena correlación
positiva,
e) 1, 00 r · , existe una perfecta correlación positiva,
f) 1, 0 0, 70 r − ≤ < − , existe de moderada a buena correlación
inversa,
g) 1, 00 r · − , existe una perfecta correlación inversa.
Ejemplo 5
Se desea saber el grado de relación entre los años de escolaridad de
la madre ( X ) y las calificaciones de sus hijos en una prueba de
Matemática ( Y ). Los datos se presentan en la siguiente tabla.
Tabla 5: Años de escolaridad de la madre y calificaciones
de sus hijos en una prueba de Matemática
Est ud iant es X Y
1 8 12
2 5 8
3 3 8
4 6 10
5 7 10
05_cap5.p65 31/03/2006, 02:48 p.m. 246
247
Solución
En la siguiente tabla se presentan los cálculos auxiliares:
Est ud iant es
i
x
i
y
i i
x y
2
i
x
2
i
y
1 8 12 96 64 144
2 5 8 40 25 64
3 3 8 24 9 64
4 6 10 60 36 100
5 7 10 70 49 100
n= 5 29 48 290 183 472
Reemplazando los valores obtenidos en la ecuación (5.5) para
puntuaciones directas obtenemos:
( ) ( )( )
( ) ( ) [ ]( ) ( )
2 2
5 290 29 48
58
0, 9
74x56
5 183 29 5 472 8
r

· · ·
]
− −
]
El valor del coeficiente de correlación es 0,9, significa una alta
correlación positiva; es decir, el nivel de escolaridad de la madre
está fuertemente relacionado al rendimiento académico de sus
hijos en Matemática.
Ejemplo 6
En la segunda y tercera columna de la Tabla 6 se tiene la informa-
ción sobre coeficientes de inteligencia y puntajes en Matemáticas
para una muestra aleatoria de 12 estudiantes que estudiaron el
primer año de secundaria en el colegio Cabrera Tapia en el año
2000. Encontraremos el coeficiente de correlación de Pearson.
El primer día de clases, a todos ellos se les aplicó una prueba
para obtener sus coeficientes de inteligencia ( X ) en la escala
Stanford-Binet y al término del año se les aplicó una prueba de 35
ítems para evaluar su rendimiento en Matemática.
Solución
X
: puntajes obtenidos en la prueba Stanford-Binet
Y : rendimiento en Matemáticas
05_cap5.p65 31/03/2006, 02:48 p.m. 247
248
Tabla 6: Rendimiento de los estudiantes en Matemática y puntajes
obtenidos en la prueba Stanford-Binet

i
x
i
y
2
i
x
2
i
y
i i
x y
1 120 17 14400 289 2040
2 112 15 12544 225 1680
3 110 15 12100 225 1650
4 120 19 14400 361 2280
5 103 12 10609 144 1236
6 126 20 15876 400 2520
7 113 15 12769 225 1695
8 114 17 12996 289 1938
9 106 14 11236 196 1484
10 108 14 11664 196 1512
11 128 19 16384 361 2432
12 109 14 11881 196 1526
Totales 1369 191 156859 3107 21993
Con la fórmula (5.5) obtenemos el coeficiente de correlación de
Pearson:
( )
( )
( )
( )
2 2
12(21993) 1369(191)
0, 953
12(156859) 1369 12(3107) 191
r

· ·
− −
Se observa muy buena correlación directa y positiva entre co-
eficiente de inteligencia y el rendimiento académico en el curso de
matemática.
Ejemplo 7
En la tabla 7 se tiene información de una muestra aleatoria de 15
alumnos del centro educativo Teresa Gonzales de Fanning. Se de-
sea obtener el coeficiente de correlación entre los puntajes obteni-
dos en Aritmética y Lenguaje para medir su grado de relación.
05_cap5.p65 31/03/2006, 02:48 p.m. 248
249
Tabla 7: Rendimientos de una muestra de estudiantes
del colegio Teresa Gonzales de Fanning, 1998.
Estudiante Aritmética Lenguaje
1 15 1
2 14 15
3 13 12
4 12 12
5 11 10
6 13 15
7 15 15
8 15 16
9 16 17
10 12 15
11 11 12
12 8 9
13 10 11
14 15 14
15 13 15
Solución
Se ilustran los cálculos auxiliares del coeficiente de correlación de
Pearson con los valores observados de las variables notas en Arit-
mética ( X ) y notas en Lenguaje (Y).
Est ud iant e
i
x
i
y
2
i
x
i i
x y
2
i
y
1 15 16 225 240 256
2 14 15 196 210 225
3 13 12 169 156 144
4 12 12 144 144 144
5 11 10 121 110 100
6 13 15 169 195 225
7 15 15 225 225 225
8 15 16 225 240 256
9 16 17 256 272 289
10 12 15 144 180 225
11 11 12 121 132 144
12 8 9 64 72 81
13 10 11 100 110 121
14 15 14 225 210 196
15 13 15 169 195 225
2 2
i
193 204 2553 x 2691 2856
i i i i i
x y x y y · · · · ·
∑ ∑ ∑ ∑ ∑
Luego, el coeficiente de correlación entre las notas de Aritmética
y Lenguaje es:
05_cap5.p65 31/03/2006, 02:48 p.m. 249
250
( ) ( )
( ) ( ) ( ) ( )
2 2
15 2691 193 204
0, 878
15 2553 193 15 2856 204
r

· ·
− −
Se observa una correlación alta y positiva entre los puntajes
obtenidos en los cursos de Aritmética y Lenguaje.
Ejemplo 8
Para los datos del ejemplo 5, usando comandos del SPSS, se mos-
trará el diagrama de dispersión y ajustará el modelo de regresión
lineal simple.
Solución
a) Usando comandos presentados en el capítulo VII se obtiene
el siguiente diagrama de dispersión.
Figura 7
Años de escolaridad de la madre y calificaciones
de los hijos en una prueba de Matemática
Añ os de esc ola rid ad de l a ma dr e
9 8 7 6 5 4 3 2
C
a
l
i
f
i
c
a
c
i
o
n
e
s
e
n
M
a
t
e
m
á
t
i
c
a
13
12
11
10
9
8
7
Se observa que existe una relación lineal directa y positiva
entre los años de escolaridad de la madre y las calificaciones en
una prueba de Matemática que rinden los hijos.
b) El siguiente cuadro, también obtenido a partir del SPSS, nos
proporciona resultados para encontrar la ecuación de la recta de
regresión ajustada por el método de mínimos cuadrados ordinarios.
05_cap5.p65 31/03/2006, 02:48 p.m. 250
251

Coefficients
a
5,054 1,318 3,834 ,031
,784 ,218 ,901 3,597 ,037
(Constant
)Años de escolaridad
de la madre
Mode
l1
B Std.
E
Unstandardized
Coefficients
Beta
Standardized
Coefficients
t Sig.
Dependent Variable: Calificaciones en una Prueba de Matemática a.

ˆ
b ˆ a
La recta de regresión lineal simple ajustada por el método de
mínimos cuadrados es:
ˆ
Y = 5,054 + 0,784 X ,
donde nos indica que un incremento de un año en los años de
escolaridad de la madre, incrementará en promedio 0,784 puntos
la calificación de sus hijos en la prueba de matemática.
Ejemplo 9
Usando la información que corresponde a las variables califica-
ción promedio y notas en el curso de álgebra de la base DATOS3-
educación, se ajusta la recta de regresión usando el método de
mínimos cuadrados. A continuación se presentan el gráfico y las
salidas proporcionadas por el SPSS.
Solución
a) Usando comandos del SPSS se encuentra el siguiente
diagrama de dispersión:
Figura 8
Notas de Álgebra y calificación promedio de
profesores de educación secundaria
N otas de Á lg ebr a
16 14 12 10 8




05_cap5.p65 31/03/2006, 02:48 p.m. 251
252
Observamos que las notas de Álgebra y las calificaciones pro-
medio de profesores que participaron en el programa de capacita-
ción, tienen una relación directa o positiva.
b) El coeficiente de correlación de Pearson:
Model Summary
,925
a
,855 ,852 ,52
Model
1
R R Squar e
Adjus ted
R Squar e
St d. Er ror of
the Estimat e
Pr edictors: (Cons tant), NOTAS DE ÁLGEBRA
a.
r
= 0,925 coeficiente de correlación lineal.
Se encuentra una correlación alta y positiva entre las notas de
álgebra y las calificaciones promedio que alcanzaron los profeso-
res que participaron en el programa de capacitación.
c) Los coeficientes de la recta de regresión:
Coeffi cients
a
3 ,8 53 ,4 7 7 ,0 0 0
,7 0 8 ,0 4 3 ,9 2 5 1 6, 29 9 ,0 0 0
( C on s ta n t)
N OTAS D E AL GE B R A
M o de l
1
B S td. E rr o r
U n s ta nd a rd i z e d
C o effi c i e n ts
B eta
S tan d ar d i
z e d
C o effi c i e n
ts
t S ig .
D e pe n de nt Var i ab l e : N O TAS P R OM E D IO
a .
ˆ a
ˆ
b
con los que se obtiene la ecuación de la recta de regresión
ajustada por el método de mínimos cuadrados:
ˆ
Y = 3,853 + 0,708 X ,
donde vemos que un incremento en la notas de Álgebra de un
punto, incrementará la calificación promedio de los profesores de
educación secundaria, en promedio en 0,708 puntos.





05_cap5.p65 31/03/2006, 02:48 p.m. 252
253
Análisis de regresión lineal múltiple
La ecuación de regresión lineal simple estudiada en la sección
anterior, se puede generalizar a una ecuación de regresión lineal
múltiple, cuando se tenga dos o más variables independientes o
regresoras
1 2
, ,....,
k
X X X , y una variable independiente o res-
puesta Y .
Explicaremos el análisis de regresión lineal múltiple con los
datos del ejemplo 10, en el que se muestran los coeficientes de inte-
ligencia (IQ), los promedios de las calificaciones y el tiempo que
dedican al estudio 12 estudiantes. Se desea predecir el promedio
de las calificaciones de estos estudiantes en función de sus coefi-
cientes de inteligencia y de los tiempos que dedican al estudio. Se
tienen dos variables regresoras: coeficiente de inteligencia,
1
X y
tiempo dedicado al estudio,
2
X , para explicar el comportamiento
de la variable dependiente o respuesta Y : calificación promedio
de los estudiantes.
Para el problema descrito se postula la forma general de la
ecuación de regresión lineal múltiple:
1 2
ˆ ˆ
ˆ ˆ Y a bX cX · + +
(5.7)
donde:
ˆ
Y : valores estimados de la variable dependiente o respuesta,
ˆ a,
ˆ
b , ˆ c : coeficiente de regresión de la ecuacuón de regre-
sión lineal múltiple,
1
X ,
2
X : variables independientes o regresoras,
Esta ecuación es muy similar a la utilizada en la regresión
lineal simple, excepto que agregamos otra variable independiente.
Para hallar los valores de ˆ a ,
ˆ
b , ˆ c , se toma una muestra de los
valores (
i
y ,
1i
x
2i
x ) 1, ..., i n · , y para cada punto se tiene el
sist ema de ecuaciones,
1 2 i i i
y a bx cx · + + , d onde
i
y es el
i-ésimo valor de la variable Y ,
1i
x ,
2i
x , los i-ésimos valores
de las variables independientes
1
X ,
2
X , . Luego, se usa el método
05_cap5.p65 31/03/2006, 02:48 p.m. 253
254
de mínimos cuadrados para encontrar los valores ˆ a de a,
ˆ
b de
b y ˆ c de c , que hacen mínima la suma de cuadrados de los
errores, es decir, que minimizan
( )
2
1
ˆ
n
i i
i
SSE y y
·
· −
∑ .
Cabe resaltar que el método de mínimos cuadrados conduce a
un sistema de ecuaciones denominadas ecuaciones normales, a
partir de las cuales, utilizando conceptos de algebra matricial se
encuentran los estimadores ˆ a ,
ˆ
b , ˆ c de los parámetros a , b , c
tema que está fuera de los objetivos del presente libro y que no será
abordado aquí.
Todos los problemas de regresión múltiple serán resueltos con
el soporte del SPSS, puesto que en la mayoría de las investigacio-
nes el número de observaciones y el número de variables es gran-
de, lo que dificulta el trabajo manual.
Ejemplo 10
Para una muestra de 12 estudiantes se dispone de sus coeficientes
de inteligencia , tiempo semanal dedicado al estudio y los prome-
dios de sus calificaciones . Vamos a ajustar la ecuación de regre-
sión lineal múltiple, la que explique en función de y , usando el
método de mínimos cuadrados.
Promedio de calificaciones, Coeficiente intelectual y
Tiempo dedicado al estudio
Estudiante IQ Tiempo de estudio Promedio de calificaciones
( ) 1
X ( )
2
X ( ) Y
1 110 8 1, 0
2 112 10 1, 6
3 118 6 1, 2
4 119 13 2, 1
5 122 14 2, 6
6 125 6 1, 8
7 127 13 2, 6
8 130 12 2, 0
9 132 13 3, 2
10 134 11 2, 6
11 136 12 3, 0
12 138 18 3, 6
05_cap5.p65 31/03/2006, 02:48 p.m. 254
255
Solución
Postulamos la ecuación de regresión
1 2
Y a bX cX · + + , para es-
tudiar la relación entre Y y las variables
1
X ,
2
X , donde:
1
X : Coeficiente intelectual (IQ)
2
X : Tiempo de estudio
Y
: Promedio de calificaciones
Usamos las opciones del SPSS:
Activar el SPSS y copiar los datos en un archivo de nombre:
COEFICIENTE.
En VARIABLE VIEW, definir las siguientes variables: IQ, TIEM-
PO y CALIFICA con sus respectivas especificaciones y, en DATA
VIEW, colocar los d at os d e la t abla. Ejecut ar ANALYZE/
REGRESSION/ LINEAR/ ingresar en DEPENDENT la variable
CALIFICA y en INDEPENDENT las variables IQ TIEMPO/ OK.
El output del SPSS es el siguiente:
Coeffi cients
Un st andardized
, , , ,

ˆ a
Las estimaciones de los parámetros son:
ˆ 5, 249 a · − ,
ˆ
b · 0, 049 ˆ c · 0,118
Luego, la ecuación de regresión lineal múltiple ajustada por
el método de mínimos cuadrados es:




ˆ
b
ˆ c
05_cap5.p65 31/03/2006, 02:48 p.m. 255
256
1 2
ˆ
5, 249 0, 049 0,118 Y X X · − + +
donde, manteniendo constante la variable tiempo de estudio,
un incremento en el coeficiente intelectual (IQ) de un punto, por
ejemplo, es acompañado por un incremento en el promedio de ca-
lificaciones de 0,049 puntos. En forma similar, manteniendo cons-
tante la variable coeficiente intelectual, un incremento de 1 hora en
el tiempo de estudio, es acompañado por un incremento en el pro-
medio de calificaciones de 0,118 puntos.
Coeficient e de det erminación
El coeficiente de determinación
2
R , multiplicado por 100, indica
el porcentaje de la variación de la variable dependiente y que es
explicado por las variaciones de las variables independientes del
modelo.
También se dice que mide la bondad del ajuste o de la recta de
regresión ajustada por el método de mínimos cuadrados.
Se puede demostrar que la variabilidad de Y , expresada por
la suma de cuadrados total,
SST · ( )
2
i
y y −

, se puede divi-
dir en dos componentes: la suma de cuadrados debido a la regre-
sión,
( )
2
ˆ
i
SSR y y · −

, y la suma de cuadrados debido a los
residuos,
( )
2
ˆ
i i
SSE y y · −

. Es decir: , donde:
SST
: suma de cuadrados del total
SSR
: suma de cuadrados debido a la regresión
SSE
: suma de cuadrados debido a los residuos
Por ello, resulta natural definir el coeficiente de determina-
ción como:
2
SSR
R
SST
·
Retomando nuestro ejemplo en el que la variable dependiente
es el promedio de calificaciones de un alumno y la variables inde-
05_cap5.p65 31/03/2006, 02:48 p.m. 256
257
pendientes, el coeficiente de inteligencia y el tiempo dedicado al
estudio; calcularemos la SST , SSR , SSE y el coeficiente de
determinación
2
R , usando el SPSS.
El output del SPSS es el siguiente:
ANOVA


Mod el


Su m of
Squares
, , , ,
, ,
,


df

2
SSR
R
SST
·
=
2
6, 389
0, 91
7, 022
R · ·
El coeficiente de determinación 0,91 significa que el 91% de
las variaciones observadas en la calificación promedio de los alum-
nos son explicadas por las variaciones del puntajes de coeficiente
de inteligencia y del tiempo dedicado al estudio.
El valor 0,09 = 1 – 0,91, llamado coeficiente de alienación,
indica que el 9% de las variaciones observadas en la calificación
promedio de los alumnos no son explicables por las variaciones en
los puntajes del coeficiente de inteligencia y del tiempo dedicado
al estudio, sino por otras variables o factores no considerados en el
modelo.
Coeficient e de correlación parcial
A veces, una alta correlación entre dos variables cuantitativas se
interpreta equivocadamente como una relación de causa y efecto
entre ellas; pero esa alta correlación puede deberse a la influencia
de otras variables subyacentes, denominadas variables espurias.
Así, por ejemplo, si se observa una relación positiva entre la asis-
tencia a la iglesia los domingos y la honestidad de las personas
mayores, esto no implica necesariamente que las personas son
honestas porque van a misa los domingos, pues una razón subya-
cente para que las dos variables estén correlacionadas puede en-
05_cap5.p65 31/03/2006, 02:48 p.m. 257
258
contrarse en variables subyacentes como el entrenamiento tempra-
no en asistir a la iglesia y en enseñar a los niños a tener actitudes
honestas.
El coeficiente de correlación parcial mide la relación lineal
entre dos variables, eliminando la influencia que puedan ejercer
otras variables. Así, para las variables X1, X2 y X3, el coeficiente de
correlación parcial entre las dos primeras variables mide la rela-
ción lineal entre las variables X1, X2 eliminando la influencia que
puede ejercer la tercera variable X
3
. La fórmula de cálculo es la
siguiente:
( ) ( )
12 13 23
12 3
2 2
13 23 1 1
r r r
r
r r


·
− −
(5.8)
donde 12.3 r es el coeficiente de correlación parcial entre X1, y
X2, controlando X3.
El coeficiente de correlación parcial entre X1, y X2, controlan-
do X3 y
4
X se define como:
( )( )
12 3 14.3 24 3
12 34
2 2
14 3 24 3 1 1
r r r
r
r r
• •

• •

·
− −
La fórmula de obtención del coeficiente de correlación parcial
ent r e las var iables
i
X y
j
X , cont r olan d o las var iables
1 1 1 1 1
, ..., , , ...., , ,....
i i j j k
X X X X X X
− + − +
,
1,2,...., 1, 1,...., 1, 1,..., ij i i j j k r • − + − +
,
es la siguiente:
1,2,...., 1, 1,...., 1, 1,...,
1,2,...., 1, 1,...., 1, 1,...,
1,2,...., 1, 1,...., 1, 1,..., 1,2,...., 1, 1,...., 1, 1,...,
ij i i j j k
ij i i j j k
ii i i j j k jj i i j j k
s
r
s s
• − + − +
• − + − +
• − + − + • − + − +
·
donde:
1,2,...., 1, 1,...., 1, 1,..., ii i i j j k s • − + − + :varianza de la variable
i
X ,
controlando las variables
1 1 1 1 1
,..., , ,...., , , ....
i i j j k
X X X X X X
− + − +
;
05_cap5.p65 31/03/2006, 02:48 p.m. 258
259
1,2,...., 1, 1,...., 1, 1,..., jj i i j j k s • − + − + : varianza de la variable
j
X , con-
trolando las variables
1 1 1 1 1
, ..., , , ...., , ,....
i i j j k
X X X X X X
− + − +
.
Ejemplo 11
Con la base de DATOS3-educación se ilustra el cálculo del coefi-
ciente de correlación parcial entre la nota promedio y la nota de
Álgebra, controlando la nota de Aritmética.
1
X : notas promedio
2
X : notas de Álgebra
3
X : notas de Aritmética
Solución
a) Considerar la base DATOS3- educación y calcular los coefi-
cientes de correlación simple entre los pares de variables
1
X ,
2
X
3
X , usando los comandos del capítulo VII, la salida es:

1 ,925 ,903
,925 1 ,893
,903 ,893 1
Pearson Correlation
Pearson Correlation
Pearson Correlation
NOTAS PROMEDIO
NOTAS DE ARITMÉTICA
NOTAS
PROMEDIO
NOTAS DE
ÁLGEBRA
NOTAS DE
ARITMÉTICA
NOTAS DE ÁLGEBRA
donde:
12 13 23
0, 925; 0, 903; 0, 893 r r r · · ·
y se obtiene el valor del coeficiente de correlación parcial entre
la nota promedio (
1
X ) y la nota de álgebra (
2
X ), manteniendo
constante la nota en aritmética (
3
X ), usando la ecuación (5.8):
( )
( )( )
12 3
2 2
0, 925 0, 903 0,893
0,1186
0, 6117
0, 0374
1 0, 903 1 0,893
r


· · ·
− −
.
El coeficiente de correlación entre la nota promedio y la nota
en álgebra es 0,925, en tanto que la correlación entre ellas elimi-
nando la influencia de la nota de aritmética es 0,6117; lo que signi-
05_cap5.p65 31/03/2006, 02:48 p.m. 259
260
fica que la correlación lineal entre la nota de Álgebra y la nota
promedio estaba influenciada por la nota en Aritmética.
b) Usando el SPSS, se abre la base de DATOS3-EDUCACION
y con los comandos del capítulo VII se tiene el siguiente cuadro:
Control NOTAS NOTAS DE
Variables PROMEDIO ÁLGEBRA
NOTAS DE NOTAS Correlation 1,000 , 611
ARITMÉTICA PROMEDIO
NOTAS DE Correlation , 611 1,000
ÁLGEBRA
Como puede observarse, el valor del coeficiente de correlación
parcial coincide con el valor ya encontrado.
Ejemplo 12
Se sabe que la disposición de las mujeres a trabajar fuera de casa
no ha sido la misma en todas las épocas, y también que varía de un
lugar a otro y de unos grupos sociales a otros. En estas condicio-
nes, puede preguntarse qué variables influyen para que las muje-
res estén más o menos dispuestas a trabajar fuera de casa. Estas
preguntas se plantean hoy día los sociólogos y consideran que si
la variable dependiente fuera el porcentaje de mujeres trabajado-
ras, estaría explicada por algunas variables como: el salario que
perciben las mujeres, el salario percibido por el marido, el número
de hijos, edad de las mujeres, tasa general de desempleo, entre
otras. En la base DATOS7-mujeres, se tienen los valores observa-
dos de las variables:
3
Z : logaritmo (
2
X /
1
X )
1
X : salario promedio de las mujeres
2
X : salario promedio de los hombres
3
X : número promedio de hijos por familia
4
X : edad promedio de las mujeres, para una muestra de
señoras casadas.
a) Encontrar el coeficiente de correlación lineal entre los sala-
rios de las mujeres y los salarios de los hombres.
05_cap5.p65 31/03/2006, 02:48 p.m. 260
261
b) Se propone encontrar el coeficiente de correlación parcial
entre los salarios de los hombres y las mujeres, controlando la va-
riable edad de las mujeres.
Solución
a) Abrir la base de DATOS7-mujeres y seleccionar los comandos
del SPSS del capítulo VII (procedimientos estadísticos) que permi-
ten obtener el coeficiente de correlación simple. El output del SPSS
nos proporciona el coeficiente de correlación simple entre los sa-
larios de los hombres y las mujeres.
Correlations
Salario de Salario de
mujer es hombres
Salario de mujeres Pearson Correlation 1 , 807
Salario de hombres Pearson Correlation ,807 1
b) Abrir la base DATOS7- mujeres y seleccionar los comandos
del capítulo VII que permiten obtener el coeficiente de correlación
parcial, de
1
X y
2
X controlando
4
X .
El output del SPSS nos proporciona el coeficiente de correla-
ción parcial entre los salarios de los hombres y las mujeres, contro-
lando la edad de las mujeres.
Correlations
Control Salario de Salario de
Variables las mujeres los hombres
Edad de las Salario de las Correlation 1,000 , 806
mujer es mujeres
Salario de Correlation , 806 1,000
los hombres
Así, 12 0,807 r · es el valor del coeficiente de correlación lineal
entre los salarios de las mujeres y los salarios de los hombres, valor
que indica una buena relación directa entre las variables. Por otro
lado,
12 4
0,806 r

· , es el valor del coeficiente de correlación entre
los salarios de los hombres y los salarios de las mujeres controlan-
do la edad de las mujeres. Se observa que la correlación entre los
salarios de las mujeres y de los hombres no está influenciada por la
05_cap5.p65 31/03/2006, 02:48 p.m. 261
262
edad de la mujer, puesto que se sigue manteniendo alta cuando la
variable edad de las mujeres es controlada.
Ejercicios
1. En los siguientes casos identifique en caso de ser posible la(s)
variable(s) dependiente(s) e independiente(s).
a) El presupuesto familiar destinado a la educación de los hi-
jos y los ingresos familiares.
b) El volumen de ventas de una empresa y la inversión en pro-
paganda.
c) El número de hijos por familia y el nivel educativo de los
padres.
d) El analfabetismo, lugar de residencia y la expansión del ser-
vicio educativo.
e) La edad y el tiempo efectivo de servicio de los docentes afi-
liados al sindicato de profesores.
2. A 10 candidatos del programa de doctorado en Psicología se les
aplica una prueba de personalidad ( X ) y un examen general de
conocimientos ( Y ). Las puntuaciones fueron las siguientes:
Cand id at o A B C D E F G H I J
X 2, 96 2, 46 3, 36 3, 40 2, 43 2, 12 2, 85 3, 12 3, 20 2, 75
Y 529 506 591 610 474 509 550 600 575 540
Realice el análisis de regresión y correlación lineal.
3. Un profesor de Estadística realiza un estudio para investigar la
relación que existe entre la ansiedad y el rendimiento de sus
estudiantes en los exámenes. Elige a 10 estudiantes para el expe-
rimento y, antes de asistir al examen final, los 10 estudiantes
respondieron un cuestionario de ansiedad. A continuación se
tienen las calificaciones de la prueba final y los puntajes obteni-
dos en el cuestionario de ansiedad.
Ansied ad 28 41 35 39 31 42 50 46 45 37
Examen 82 58 63 89 92 64 55 70 51 72
Final
05_cap5.p65 31/03/2006, 02:48 p.m. 262
263
a) Elabore el diagrama de dispersión. Utilice la ansiedad como
la variable regresora o independiente.
b) Describa la relación que muestra el diagrama de dispersión.
c) Suponga que la relación es lineal y calcule el valor del co-
eficiente de correlación e interprete.
d) Determine la recta de regresión por mínimos cuadrados
para predecir la calificación del examen final dado el nivel
de ansiedad.
e) Si un estudiante tiene un nivel de ansiedad de 38, ¿qué va-
lor podría predecirse para su calificación en el examen fi-
nal?
4. Se realiza un estudio con 10 estudiantes de postgrado en Educa-
ción.
1
X es el número de problemas resueltos correctamente por
un estudiante en clase,
2
X son las puntuaciones obtenidas al
aplicarles una prueba psicológica que mide la autoestima, e
Y
es el número de problemas que cada estudiante espera resolver
correctamente en el examen final. Con los datos que se presentan
a continuación realice el análisis de regresión lineal múltiple
usando el SPSS.
Est ud iant e Númer o Puntuación en Número de
pr oblemas au t oest ima problemas que espera
resueltos resolver en el examen final
en clase
1 14 5 14
2 8 15 5
3 9 19 8
4 13 33 11
5 10 39 15
6 11 38 14
7 14 74 18
8 15 74 19
9 11 11 7
10 16 78 17
5. Se aplicó a un grupo de 18 adolescentes sordomudos la prueba
de inteligencia de Wechsler para adultos (Wais) y cuatro subtest.
Las puntuaciones de ambas aplicaciones son las siguientes:
05_cap5.p65 31/03/2006, 02:48 p.m. 263
264
Adolescentes Wais Razonamiento Razonamiento Relaciones Velocidad y
mecánico abstracto espaciales exactitud
1 48 22 38 15 25
2 48 19 38 15 40
3 47 20 37 20 21
4 46 20 37 17 20
5 46 17 35 19 18
6 43 21 34 15 17
7 42 21 34 14 31
8 42 19 33 20 35
9 41 17 33 13 35
10 40 15 32 15 27
11 39 15 32 12 17
12 32 11 25 15 28
13 31 17 25 9 29
14 30 16 23 9 37
15 29 15 22 13 29
16 29 15 21 9 39
17 28 16 20 11 28
18 27 16 18 11 38
a) Realice un análisis de regresión lineal simple de Y con cada
uno de los cuatro subtest.
b) Realice un análisis de regresión lineal múltiple.
6. Se conocen las edades (
X
) y la presión sanguínea (
Y
) de 12
mujeres. Si
2 2
628, 1684, 34416, 238822, 89894. i
i i i i i
x y x y x y · · · · ·
∑ ∑ ∑ ∑ ∑
a) Encuentre la recta de regresión de Y sobre X .
b) Si una mujer tiene 49 años, ¿cuál sería su presión sanguí-
nea?
c) Si una mujer tiene 72 años, ¿cuál es la presión sanguínea
esperada?
7. La siguiente tabla muestra las calificaciones obtenidas por 10
estudiantes en dos pruebas de Estadística:
X : Primera prueba 12 10 16 16 14 12 20 8 18 14
Y : Segunda prueba 16 14 14 20 10 16 20 12 16 12
05_cap5.p65 31/03/2006, 02:48 p.m. 264
265
a) Construya el diagrama de dispersión.
b) Obtenga la recta de regresión de Y sobre X .
c) Si un estudiante obtuvo 14,7 en la primera prueba, ¿cuánto
se espera que obtenga en la segunda prueba?
8. Dos profesores, con el propósito de examinar cuál es la influen-
cia que los métodos de enseñanza basados en el trabajo libre y
creativo del alumno ejercen sobre su rendimiento escolar, lleva-
ron a cabo una investigación con 122 niños y niñas, en los que
evaluaron los siguientes aspectos:
Creatividad : CREAT Coeficiente intelectual :C.I.
Capacidad de orden : ORDEN Rendimiento escolar :RENDIM.
CASO ORDEN C.I. RENDIM. CREAT. CASO ORDEN C.I. RENDIM. CREAT.
1 8 114 0, 85 8, 00 31 4 109 0, 84 4, 50
2 6 103 0, 87 4, 00 32 7 113 0, 88 7, 50
3 5 97 0, 90 8, 00 33 7 123 0, 86 6, 00
4 3 94 0, 80 2, 00 34 10 106 0, 91 8, 00
5 4 88 0, 70 9, 00 35 7 110 0, 74 6, 00
6 6 76 0, 70 4, 00 36 6 95 0, 62 5, 50
7 7 116 1, 00 10, 0 37 9 125 0, 92 7, 00
8 4 86 0, 73 5, 50 38 6 100 0, 62 2, 00
9 4 97 0, 99 3, 00 39 7 112 0, 72 2, 00
10 3 91 0, 75 8, 00 40 3 53 0, 14 5, 00
11 6,5 123 1, 50 3, 50 41 3,5 77 0, 21 1, 50
12 5 63 0, 73 1, 00 42 7 100 0, 65 3, 50
13 3 92 0, 90 6, 00 43 8 105 0, 78 5, 00
14 5 86 0, 82 8, 00 44 5 89 0, 48 0, 00
15 5,5 84 0, 81 5, 00 45 6 105 0, 91 4, 50
16 4,5 63 0, 62 5, 00 46 4 92 0, 97 6, 00
17 4 88 0, 77 7, 00 47 3 98 0, 62 2, 00
18 10 128 0, 99 7, 00 48 3 91 0, 84 4, 00
19 7 102 0, 78 6, 00 49 6 90 0, 63 0, 00
20 8 115 0, 98 7, 00 50 6 98 0, 89 6, 50
21 6 93 0, 74 6, 00 51 6 113 1, 05 6, 00
22 10 130 0, 94 7, 00 52 4 92 0, 84 3, 00
23 7 90 0, 76 4, 00 53 8 98 0, 74 5, 00
24 5 90 0, 81 5, 00 54 7 86 0, 58 0, 50
25 9 102 0, 2 8, 00 55 5 88 0, 82 2, 00
26 7 102 0, 85 7, 00 56 5 88 0, 82 1, 50
27 7 99 0, 91 6, 00 57 5 102 0, 75 3, 00
28 6 100 0, 73 6, 00 58 5 101 0, 88 6, 50
29 6 88 0, 64 5, 00 59 6 76 0, 81 4, 00
30 4 74 0, 45 3, 00 60 4 94 0, 65 0, 00
05_cap5.p65 31/03/2006, 02:48 p.m. 265
266
a) Use comandos del SPSS para crear el archivo de datos.
b) ¿Existe relación entre inteligencia y creatividad?
c) Sobre la base de los datos obtenidos en esta experiencia, ¿pode-
mos afirmar que, a mayor creatividad, corresponde una menor
capacidad de orden?
d) Sobre la base de los datos obtenidos en esta experiencia, ¿pode-
mos afirmar que existe relación lineal entre rendimiento escolar
y creatividad?
e) ¿Cuál es la recta que mejor permite predecir la variable rendi-
miento escolar en función de la variable creatividad? Interprete.
f) ¿Manteniendo constante la capacidad intelectual de los alum-
nos, la creatividad está relacionada con el rendimiento escolar?
g) Sobre la base de los datos obtenidos en esta experiencia, ¿pode-
mos afirmar que existe relación lineal entre el rendimiento esco-
lar y la inteligencia?
h) ¿Cuál es la ecuación de la recta que permite predecir el rendi-
miento escolar en función de la variable inteligencia? Interprete.
05_cap5.p65 31/03/2006, 02:48 p.m. 266

Análisis de regresión lineal simple
Si se trata de predecir o explicar el comportamiento de una variable Y , a la que se denomina dependiente o variable respuesta, en función de otra variable X denominada independiente o regresora, Y =f( X ), estamos frente a un problema de análisis de regresión lineal simple; pero si deseamos investigar el grado de asociación entre las variables X e Y estamos frente a un problema de análisis de correlación.

Diagrama de dispersión ¿Cómo encontrar la relación entre X e Y ? Una de las formas gráficas más sencillas es realizando el diagrama de dispersión, denominado también diagrama de nube de puntos. Este tipo de gráfico se utiliza para visualizar la relación entre las variables y, a partir de dicha relación, observar en qué medida se mantiene el incremento o disminución de una variable a partir del aumento de otra variable. Para su construcción, se trazan en el plano cartesiano los ejes de la abscisa ( X ) y de la ordenada ( Y ). En el eje X se colocan los valores de una de las variables y, en el eje Y , los valores de la otra variable. En la intersección correspondiente a cada valor de X y a cada valor de Y se coloca un punto, y así tendremos la nube de puntos. Mostraremos a continuación algunas formas que adquiere el diagrama de dispersión.
Figura 1. Diagramas de dispersión

Y
. . .. .

Y
. . . . .

. . . .

.. .

. . . . . . .

Y = a + bX
a) Relación lineal positiva

X

Y = a − bX
b) Relación lineal negativa

X

234

05_cap5.p65

234

31/03/2006, 02:48 p.m.

Y
. .. . . . . ... . . . . . . . . . . . . . . ..

Y
. . .. . .. . . . . . . .

X

X

Y = a
c) No hay relación lineal entre X e Y

Y = a + bX + cX

2

d) Relación no lineal

Como se puede ver en el gráfico (a), los valores de Y se incrementan linealmente conforme X crece, es decir, el conjunto de datos se puede representar por una línea recta ascendente. Por ejemplo, al aumentar la partida presupuestal asignada por el gobierno a un colegio, aumenta la posibilidad de atender una mayor demanda escolar. Es diferente en el gráfico (b), porque cuando los valores de X crecen, los valores de Y decrecen, es decir, el conjunto de datos se puede representar por una línea recta descendente. Así, por ejemplo, cuando aumenta el número de horas semanales que los estudiantes dedican a las distracciones, su rendimiento académico disminuye. En el gráfico (c) no hay ninguna relación entre X e Y ; mientras que el gráfico (d) muestra una relación de tipo curvilínea entre X e Y . Así, por ejemplo, cuando los estudiantes dedican diariamente un mayor número de horas a ver programas de televisión, disminuye su rendimiento académico en el colegio. Como se observa en los diagramas de dispersión, el término lineal empleado se refiere al tipo de relación entre X e Y . Una vez visualizada la relación, los diagramas de dispersión no son suficientes para determinar el grado de la relación entre las variables, por lo que debemos utilizar procedimientos estadísticos para determinar el modelo mas apropiado que exprese el comportamiento del conjunto de datos ( xi , yi ) .

235

05_cap5.p65

235

31/03/2006, 02:48 p.m.

Intentamos describir la dependencia de una variable Y sobre una variable independiente X .Ajuste de una función de regresión: Método de mínimos cuadrados Ajustar una función de regresión significa encontrar. el número de horas de estudio sobre el rendimiento académico. El método de mínimos cuadrados garantiza que la recta que representa el comportamiento del conjunto de datos es la recta L. Emplearemos la ecuación de regresión a fin de apoyar la hipótesis que postula la posible causalidad de los cambios de Y mediante los cambios en X .p65 236 31/03/2006. Supondremos que el diagrama de dispersión sugiere que la relación entre las dos variables se puede expresar mediante una recta L: Y = a + bX . se trata de obtener los valores de a y b de tal manera que el valor de la suma de cuadrados de los residuos. el contenido de nitrógeno en el suelo sobre la tasa de crecimiento de una planta. son ejemplos típicos de regresión para los propósitos señalados. y para propósitos de explicación de parte de la variación de Y por X utilizando la última variable como control estadístico. Los estudios de los efectos de la temperatura en el rendimiento académico. sea mínimo. i =1 n 2 (5.m. la edad de un estudiante sobre su presión sanguínea. sea mínimo. y de las ˆ ˆ ˆ ordenadas yi = a + bx de los puntos ( xi . Es decir: ˆ SSE = ∑ ( yi − yi ) sea mínimo. luego de analizar su forma. la dosis de un insecticida sobre la mortalidad de una población de insectos. yi ). siendo el más usado el método de mínimos cuadrados. para lo cual existen varios métodos. a + bxi ) que están en la ˆ ˆ recta L. Esto es. 02:48 p. para propósitos de predicción de Y en función de X . se estiman los parámetros del modelo. Gráficamente será aquella función que mejor se adecue a la nube de puntos. Luego. SSE. . es recomendable como primer paso construir el diagrama de dispersión o diagrama de nube de puntos para. En este sentido.1) 236 05_cap5. decidir por el tipo de función matemática (modelo) o la ecuación de regresión que exprese la relación entre las variables X e Y . la función que exprese con mayor precisión la relación entre las variables X e Y . donde la suma de los cuadrados de las diferencias de las ordenadas yi de los puntos observados ( xi .

donde: yi : son los valores observados de la variable dependiente Y ..p65 237 31/03/2006.. . para predecir la variable Y .........2) i =1 i =1 n n Resolviendo el sistema se deducen los siguientes valores para las constantes a y b .3) 237 05_cap5. ˆ yi : son los valores estimados de Y ...... .m... denominados valores estimados de los coeficientes de regresión: ˆ a= ∑ y ∑ x −∑ x ∑ x y i =1 i i =1 n 2 i i =1 i n n n n  n  n∑ x −  ∑ xi  i =1  i =1  2 i i =1 2 i i = Y − bX (5..... 02:48 p... .. b : es la pendiente de la recta. 0 0 5 10 15 20 25 30 X ˆ Según el método de mínimos cuadrados.. satisfacen el y b denominado sistema de ecuaciones normales: ∑y i =1 n i = an + b ∑ xi i =1 n ∑x y i =1 n i i = a ∑ xi + b ∑ xi2 . . se demuestra que a ˆ valores de a y b que hacen mínima la SSE . 10 .... llamada también coeficiente de regresión. ....... a : es la constante o intercepto Entonces la ecuación de regresión estimada se expresa como: ˆ ˆ ˆ Y = a + bX Y recta de regresión para predecir Y .... . (5... ..

02:48 p.ˆ b= n ∑ xi yi − ∑ xi ∑ yi i =1 i =1 i =1 n n n   n ∑ xi2 −  ∑ xi   i =1  i =1 n n 2 . . Tamˆ bién presentamos los cálculos para encontrar los valores a y 238 05_cap5.p65 238 31/03/2006. c) Averiguaremos: ¿Cuál será el rendimiento en educación superior de un estudiante con nota promedio de 12 en la educación secundaria? Tabla 1: Rendimiento académico en secundaria y en educación superior de un grupo de alumnos Estudiantes 1 2 3 4 5 6 7 8 X 16 13 15 12 11 16 13 10 Y 15 11 17 14 11 14 15 12 Solución a) Usando los comando del SPSS presentados en el capítulo VII. basándonos en los datos de la muestra. se obtiene el diagrama de dispersión presentado en la figura 2.m. Ejemplo 1 Con los datos de la tabla 1.4) La recta de regresión nos permite. Para ello es suficiente reemplazar el valor de xi en la recta de ˆ regresión y encontraremos el correspondiente valor estimado yi . b) Aplicaremos el método de mínimos cuadrados para encontrar los coeficientes de regresión lineal. (5. correspondiente al rendimiento académico en el nivel superior ( Y ) y al rendimiento académico en el nivel secundario ( X ) de 8 estudiantes: a) Construiremos el diagrama de dispersión. estimar un valor de la variable Y —que denotaremos ˆ con yi — correspondiente a un valor dado xi de la variable X .

Figura 2 D iag ram a de disp ers ió n d e re ndim iento en s ec un d aria y re ndim iento en e duc ac ió n su pe rio r 17 Rendimiento en secundaria 15 13 11 9 10 12 14 16 18 R endim iento en educ ación superior El diagrama de dispersión nos sugiere que los datos se pueden representar mediante una recta Y = a + bX . b) Cálculos necesarios para estimar los coeficientes de regresión y usando el método de mínimos cuadrados xi 16 13 15 12 11 16 13 10 Total 106 yi 15 11 17 14 11 14 15 12 109 xi2 256 169 225 144 121 256 169 100 1440 xi y i 240 143 255 168 121 224 195 120 1466 ˆ a= ∑ y ∑x −∑x ∑x y i 2 i i i i =1 i =1 8 i =1 8 8 8 8 i   n∑ x −  ∑ xi  i =1  i =1  8 2 i i =1 2 = 109 ×1440 − 106 ×1466 8 ×1440 − (106 ) 2 = 5. .ˆ b de la ecuación de regresión estimada por el método de mínimos cuadrados.p65 239 31/03/2006. 02:48 p.m. 51 239 05_cap5.

83 puntos. en educación superior tendrá un rendimiento de 12. 02:48 p. es decir: ˆ Y = 5. Analizando el diagrama de dispersión o nube de puntos podemos visualizar el tipo de correlación lineal entre las variables involucradas.m. .ˆ b= n∑ xi yi − ∑ xi ∑ yi i =1 i =1 i =1 n n n  n  n∑ xi2 −  ∑ xi  i =1  i =1  n 2 = 8 × 1466 − 106 × 109 8 × 1440 − (106 ) 2 = 0.51 + 7. esto es. Así.p65 240 31/03/2006. aunque nosotros no lo sepamos ni lo sospechemos.51 + 0. No expresamos una variable como función de la otra.32 = 12. una sea causa de la otra. 51 + 0. 61 Entonces. La correlación lineal mide el grado de la asociación lineal entre dos variables denotadas con X e Y . es que las dos variables sean efectos de una causa común y lo que se desea conocer es el grado en el que ambas variables varían conjuntamente. o entre los días necesarios para la madurez y el número de semillas en una siembra. si varían conjuntamente. 61 ×12 = 5. o entre el peso y la estatura de un grupo de estudiantes.83 . aunque no esencial. la recta de regresión de Y sobre X queda expresada como: ˆ Y = 5. podríamos estar interesados en la correlación entre las longitudes de las extremidades superiores y extremidades inferiores en una población de estudiantes. entonces su rendimiento esperado en educación superior se obtiene reemplazando X por el valor 12 en la recta definida. Análisis de correlación lineal Nos proponemos investigar si dos variables son independientes o covarían. 61X Si un estudiante obtiene un rendimiento de 12 en secundaria. Una hipótesis importante. así como tampoco hacemos distinción alguna entre variables dependientes e independientes. 240 05_cap5. de una pareja de variables cuya correlación se estudia. Puede muy bien suceder que. Puede decirse que se estima que un alumno que tiene un rendimiento de 12 puntos en educación secundaria.

.. Ejemplo 2 En la tabla 2 se presentan las puntuaciones en Literatura ( X ) y las puntuaciones en Lenguaje ( Y ) de un grupo de alumnos de un centro educativo. Y . . . .. Tipos de correlación lineal Y .. .. . . .. X c) Correlación nula Correlación positiva o directa En la figura 3(a).... 241 05_cap5. .. ... . . el aumento de la medida de la variable X implica el aumento de la medida de la variable Y ... . .. . .p65 241 31/03/2006........Figura 3.m..... . Se observará su relación a través de un diagrama de dispersión. . 02:48 p.::: .. . . las variables X e Y están correlacionadas positivamente o su variación está en razón directa. ... X a) Correlación positiva X b) Correlación negativa Y . es decir..

Correlación negativa o inversa Se dice que las variables X e Y están correlacionadas negativamente o su variación está en razón inversa. 02:48 p.p65 242 31/03/2006. . visualizando que el tipo de correlación entre las puntuaciones en literatura y lenguaje es positiva. cuando el aumento de 242 05_cap5. usando los comandos del SPSS presentados en el capítulo VII es el siguiente: Figura 4 Puntuaciones en Literatura y Lenguaje de un grupo de alumnos 60 P u n tu a cio n e s e n Le n g ua je 50 40 30 20 10 0 10 20 30 P u n tu ac io n e s e n Lite ra tu ra Como se puede observar.Tabla 2: Puntuaciones en Literatura y en Lenguaje de un grupo de alumnos Nº Estudiante 1 2 3 4 5 6 7 X 5 8 12 16 16 24 28 Y 12 20 30 30 42 40 50 Solución El diagrama de dispersión.m. cuando aumenta el valor de la variable X (puntuaciones en Literatura) también aumenta el valor de la variable Y (puntuaciones en Lenguaje). luego.

m. Mostraremos el diagrama de dispersión. Ejemplo 3 La tabla 3 nos muestra las puntuaciones en Literatura ( X ) y las puntuaciones en Matemática ( Y ) de un grupo de alumnos de un determinado centro educativo. o la disminución de la medida de la variable X implica el aumento de la variable Y .la medida de la variable X implica la disminución de la medida de la variable Y . como se puede observar en la figura 3(b). usando los comandos del SPSS presentados en el capítulo VII es el siguiente: Figura 5 Puntuaciones en Literatura y Matemática de un grupo de alumnos 40 Pu n t u a cio n e s e n M a te m á tica 30 20 10 0 0 20 40 60 80 10 0 P u n tu a cion es e n L ite ratu ra 243 05_cap5. Tabla 3 Puntuaciones en Literatura y en Matemática de un grupo de alumnos Nº Estudiante 1 2 3 4 5 6 7 8 xi 10 30 38 40 60 65 80 90 yi 30 15 37 25 35 05 20 10 Solución El diagrama de dispersión.p65 243 31/03/2006. . 02:48 p.

Como se puede apreciar. Tabla 4: Puntuaciones en deporte y en Matemática de un grupo de alumnos Nº Estudiante 1 2 3 4 5 6 7 8 9 10 X 02 04 04 08 08 14 14 14 18 18 Y 25 10 35 05 40 05 15 40 20 35 Solución El diagrama de dispersión. la variable X corresponde a las puntuaciones en deporte y la variable Y corresponde a las puntuaciones en Matemática de un grupo de alumnos. diremos que la correlación entre X e Y es nula. Mostraremos el diagrama de dispersión para identificar el tipo de correlación. Correlación nula En la figura 3(c) las variables no están correlacionadas entre sí. Ejemplo 4 En la tabla 4. . es este caso. frente al aumento de las puntuaciones en literatura ( X ) disminuyen las puntuaciones en Matemática ( Y ).p65 244 31/03/2006. esto lo podemos observar en el siguiente ejemplo. usando los comandos del SPSS presentados en el capítulo VII es el siguiente: 244 05_cap5. 02:48 p.m. visualizando la correlación entre X e Y es negativa o inversa.

El valor +1 indica que entre X e Y existe una correlación lineal directa y perfecta. Coeficiente de correlación de Pearson ( r ) Existen numerosos coeficientes de correlación en Estadística. Sus valores varían entre –1 y 1. una correlación lineal inversa y perfecta. cuya formulación se debe a Karl Pearson.p65 245 31/03/2006. la correlación entre las puntuaciones en deporte ( X ) y las puntuaciones en matemática ( Y ) es nula. Para obtener este coeficiente hay una gran variedad de expresiones matemáticas que son equivalentes. El valor 0 indica ausencia de correlación lineal.5) 245 05_cap5. El más común de ellos es el denominado coeficiente de correlación producto-momento.m. cuando se desea medir el grado de asociación lineal entre dos variables cuantitativas. El coeficiente de correlación de Pearson se utiliza en el análisis de información cuantitativa. . 02:48 p. destacando las siguientes: a) Para puntuaciones directas o datos originales: r= n∑ xi yi − (∑ xi )(∑ yi )  n x 2 − ( x )2   n y 2 − ( y )2  ∑ i  ∑ i ∑ i   ∑ i    (5.Figura 6 Puntuaciones en deporte y en Matemática de un grupo de alumnos 50 P u n tua c io n e s e n M ate m á tica 40 30 20 10 0 0 10 20 P untuac ion es en de po rte Como se puede apreciar. el valor –1.

p65 246 31/03/2006. que si: a) 0 ≤ r < 0. existe correlación inversa o correlación negativa. 00 . Ejemplo 5 Se desea saber el grado de relación entre los años de escolaridad de la madre ( X ) y las calificaciones de sus hijos en una prueba de Matemática ( Y ). e) r = 1. existe de moderada a buena correlación positiva. f) −1. Sy Propiedades El valor de r se encuentra entre –1 y +1. 40 . 20 . b) Si r < 0. de donde se deduce que: a) Si r > 0. existe una correlación baja. g) r = −1. existe una perfecta correlación positiva. 0 ≤ r < −0. Los datos se presentan en la siguiente tabla. 02:48 p. existe una moderada correlación positiva. (5. 70 ≤ r < 1. b) 0. c) 0. 70 .b) para puntuaciones Z (puntuaciones tipificadas): r = ∑Z Z x y Sx xi − X Sx . En la interpretación clásica del coeficiente de correlación se deduce. . Tabla 5: Años de escolaridad de la madre y calificaciones de sus hijos en una prueba de Matemática Estudiantes 1 2 3 4 5 X 8 5 3 6 7 Y 12 8 8 10 10 246 05_cap5. 40 ≤ r < 0. la correlación es muy baja.6) donde: Zx = Zy = yi − Y . existe correlación directa o correlación positiva. 00 . por ejemplo. existe de moderada a buena correlación inversa. d) 0. 20 ≤ r < 0. existe una perfecta correlación inversa.m. 70 . 00 .

Ejemplo 6 En la segunda y tercera columna de la Tabla 6 se tiene la información sobre coeficientes de inteligencia y puntajes en Matemáticas para una muestra aleatoria de 12 estudiantes que estudiaron el primer año de secundaria en el colegio Cabrera Tapia en el año 2000.9. 02:48 p.m. Encontraremos el coeficiente de correlación de Pearson. significa una alta correlación positiva. .Solución En la siguiente tabla se presentan los cálculos auxiliares: Estudiantes 1 2 3 4 5 n= 5 xi 8 5 3 6 7 29 yi 12 8 8 10 10 48 xi yi 96 40 24 60 70 290 xi 2 yi 2 64 25 9 36 49 183 144 64 64 100 100 472 Reemplazando los valores obtenidos en la ecuación (5. El primer día de clases. el nivel de escolaridad de la madre está fuertemente relacionado al rendimiento académico de sus hijos en Matemática. a todos ellos se les aplicó una prueba para obtener sus coeficientes de inteligencia ( X ) en la escala Stanford-Binet y al término del año se les aplicó una prueba de 35 ítems para evaluar su rendimiento en Matemática. es decir. Solución X : puntajes obtenidos en la prueba Stanford-Binet Y : rendimiento en Matemáticas 247 05_cap5.9 74x56 El valor del coeficiente de correlación es 0.5) para puntuaciones directas obtenemos: r= 5 ( 290 ) − ( 29 )( 48 ) 5 (183 ) − ( 29 )2  [5] ( 472 ) − (8 )2   = 58 = 0.p65 247 31/03/2006.

Se desea obtener el coeficiente de correlación entre los puntajes obtenidos en Aritmética y Lenguaje para medir su grado de relación.m. 02:48 p. Ejemplo 7 En la tabla 7 se tiene información de una muestra aleatoria de 15 alumnos del centro educativo Teresa Gonzales de Fanning.p65 248 31/03/2006.Tabla 6: Rendimiento de los estudiantes en Matemática y puntajes obtenidos en la prueba Stanford-Binet xi 1 2 3 4 5 6 7 8 9 10 11 12 Totales 120 112 110 120 103 126 113 114 106 108 128 109 1369 yi 17 15 15 19 12 20 15 17 14 14 19 14 191 xi 2 yi 2 xi yi 2040 1680 1650 2280 1236 2520 1695 1938 1484 1512 2432 1526 21993 14400 12544 12100 14400 10609 15876 12769 12996 11236 11664 16384 11881 156859 289 225 225 361 144 400 225 289 196 196 361 196 3107 Con la fórmula (5.953 Se observa muy buena correlación directa y positiva entre coeficiente de inteligencia y el rendimiento académico en el curso de matemática. . 248 05_cap5.5) obtenemos el coeficiente de correlación de Pearson: r= ( 12(21993) − 1369(191) 2 12(156859) − (1369 ) )( 12(3107) − (191) 2 ) = 0.

m. Estudiante 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 xi 15 14 13 12 11 13 15 15 16 12 11 8 10 15 13 yi 16 15 12 12 10 15 15 16 17 15 12 9 11 14 15 xi 2 xi yi 240 210 156 144 110 195 225 240 272 180 132 72 110 210 195 yi 2 225 196 169 144 121 169 225 225 256 144 121 64 100 225 169 256 225 144 144 100 225 225 256 289 225 144 81 121 196 225 ∑x i = 193 ∑y i = 204 ∑x 2 i = 2553 ∑x y i i = 2691 ∑y 2 i = 2856 Luego. el coeficiente de correlación entre las notas de Aritmética y Lenguaje es: 249 05_cap5.Tabla 7: Rendimientos de una muestra de estudiantes del colegio Teresa Gonzales de Fanning. Estudiante 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Aritmética 15 14 13 12 11 13 15 15 16 12 11 8 10 15 13 Lenguaje 1 15 12 12 10 15 15 16 17 15 12 9 11 14 15 Solución Se ilustran los cálculos auxiliares del coeficiente de correlación de Pearson con los valores observados de las variables notas en Aritmética ( X ) y notas en Lenguaje ( Y ). . 02:48 p.p65 249 31/03/2006. 1998.

usando comandos del SPSS.m. Figura 7 Años de escolaridad de la madre y calificaciones de los hijos en una prueba de Matemática 13 12 C a lific a c io n e s en M at em á tic a 11 10 9 8 7 2 3 4 5 6 7 8 9 A ñ os de es c ola rid ad de la m a dre Se observa que existe una relación lineal directa y positiva entre los años de escolaridad de la madre y las calificaciones en una prueba de Matemática que rinden los hijos. 250 05_cap5. . nos proporciona resultados para encontrar la ecuación de la recta de regresión ajustada por el método de mínimos cuadrados ordinarios. b) El siguiente cuadro. también obtenido a partir del SPSS.878 Se observa una correlación alta y positiva entre los puntajes obtenidos en los cursos de Aritmética y Lenguaje.r= 15 (2691) − 193 (204 ) 15 (2553 ) − (193) 2 15 (2856 ) − (204 ) 2 = 0. Ejemplo 8 Para los datos del ejemplo 5. Solución a) Usando comandos presentados en el capítulo VII se obtiene el siguiente diagrama de dispersión.p65 250 31/03/2006. 02:48 p. se mostrará el diagrama de dispersión y ajustará el modelo de regresión lineal simple.

A continuación se presentan el gráfico y las salidas proporcionadas por el SPSS.054 + 0. Ejemplo 9 Usando la información que corresponde a las variables calificación promedio y notas en el curso de álgebra de la base DATOS3educación.901 a.784 X .031 . . 02:48 p.054 .597 Sig.784 puntos la calificación de sus hijos en la prueba de matemática. E 1.318 5.037 .218 Coefficients Mode l 1 Beta (Constant ) ños de escolaridad A de la madre t 3.834 3.784 . donde nos indica que un incremento de un año en los años de escolaridad de la madre. .m. incrementará en promedio 0.Coefficientsa Standardized Unstandardized Coefficients B Std. Dependent Variable: Calificaciones en una Prueba de Matemática ˆ b ˆ a La recta de regresión lineal simple ajustada por el método de mínimos cuadrados es: ˆ Y = 5. se ajusta la recta de regresión usando el método de mínimos cuadrados. Solución a) Usando comandos del SPSS se encuentra el siguiente diagrama de dispersión: Figura 8 Notas de Álgebra y calificación promedio de profesores de educación secundaria 8 10 12 14 16 N o ta s d e Á lg e b ra 251 05_cap5.p65 251 31/03/2006.

0 0 0 .m. b) El coeficiente de correlación de Pearson: M ode l S um m a ry A d ju s te d R S q u a re .9 2 5 t 1 6 .9 2 5 a R S q u a re .4 7 7 .708 puntos.8 5 5 a . D e p e n d e n t V a ria b le : N O TA S P R O M E D IO ˆ ˆ a b con los que se obtiene la ecuación de la recta de regresión ajustada por el método de mínimos cuadrados: ˆ Y = 3.0 4 3 S ta n d a rd i zed C o e ffic ie n ts B e ta . P re d ic to rs : (C o n s ta n t). .8 5 3 .0 0 0 a . c) Los coeficientes de la recta de regresión: a C oe fficie nts U n s ta n d a rd iz e d C o e ffic ie n ts M o de l 1 (C o n s ta n t) N O TA S D E A L G E B R A B 3 . incrementará la calificación promedio de los profesores de educación secundaria.Observamos que las notas de Álgebra y las calificaciones promedio de profesores que participaron en el programa de capacitación. Se encuentra una correlación alta y positiva entre las notas de álgebra y las calificaciones promedio que alcanzaron los profesores que participaron en el programa de capacitación.7 0 8 S td .925 coeficiente de correlación lineal. N O TA S D E Á L G E B R A r = 0.853 + 0.p65 252 31/03/2006. en promedio en 0. tienen una relación directa o positiva.5 2 M odel 1 R .2 9 9 S ig . E rro r o f th e E s tim a te . E rro r . .708 X . donde vemos que un incremento en la notas de Álgebra de un punto. 02:48 p.8 5 2 S td . 252 05_cap5.

. los promedios de las calificaciones y el tiempo que dedican al estudio 12 estudiantes. c : coeficiente de regresión de la ecuacuón de regresión lineal múltiple. ˆ c . b . en el que se muestran los coeficientes de inteligencia (IQ).. y una variable independiente o respuesta Y . X 1 y tiempo dedicado al estudio. X 2 . n .. X 2 . se usa el método 253 05_cap5. b . excepto que agregamos otra variable independiente. i-ésimo valor de la variable Y .Análisis de regresión lineal múltiple La ecuación de regresión lineal simple estudiada en la sección anterior.. Luego.. ˆ ˆ Para hallar los valores de a . ˆ ˆ ˆ a . . . X 2 . se puede generalizar a una ecuación de regresión lineal múltiple. y para cada punto se tiene el sistema de ecuaciones. Se desea predecir el promedio de las calificaciones de estos estudiantes en función de sus coeficientes de inteligencia y de los tiempos que dedican al estudio. Se tienen dos variables regresoras: coeficiente de inteligencia. X k . 02:48 p. se toma una muestra de los donde yi es el valores ( yi .m. X 1 . X 2 : variables independientes o regresoras.. cuando se tenga dos o más variables independientes o regresoras X 1 . para explicar el comportamiento de la variable dependiente o respuesta Y : calificación promedio de los estudiantes. x1i ..p65 253 31/03/2006.7) donde: ˆ Y : valores estimados de la variable dependiente o respuesta. Explicaremos el análisis de regresión lineal múltiple con los datos del ejemplo 10... los i-ésimos valores de las variables independientes X1 . Esta ecuación es muy similar a la utilizada en la regresión lineal simple. Para el problema descrito se postula la forma general de la ecuación de regresión lineal múltiple: ˆ ˆ ˆ ˆ Y = a + bX 1 + cX 2 (5. x2i . yi = a + bx1i + cx2i . x1i x2i ) i = 1.

0 1.de mínimos cuadrados para encontrar los valores ˆ a 2 de ˆ a.6 2. Ejemplo 10 Para una muestra de 12 estudiantes se dispone de sus coeficientes de inteligencia . que hacen mínima la suma de cuadrados de los ˆ ∑(y − y ) i =1 i i n errores. Promedio de calificaciones. .6 8 10 6 13 14 6 13 12 13 11 12 18 254 05_cap5. puesto que en la mayoría de las investigaciones el número de observaciones y el número de variables es grande. que minimizan SSE = . b de b y ˆ c de c .1 2.0 3. Coeficiente intelectual y Tiempo dedicado al estudio Estudiante 1 2 3 4 5 6 7 8 9 10 11 12 IQ Tiempo de estudio ( X2 ) Promedio de calificaciones ( X1 ) 110 112 118 119 122 125 127 130 132 134 136 138 (Y ) 1. es decir.0 3. lo que dificulta el trabajo manual. a partir de las cuales.2 2.8 2.6 3. Todos los problemas de regresión múltiple serán resueltos con el soporte del SPSS.m. c tema que está fuera de los objetivos del presente libro y que no será abordado aquí.6 1.p65 254 31/03/2006.6 1.2 2. 02:48 p. utilizando conceptos de algebra matricial se ˆ ˆ ˆ encuentran los estimadores a . b . la que explique en función de y . usando el método de mínimos cuadrados. Cabe resaltar que el método de mínimos cuadrados conduce a un sistema de ecuaciones denominadas ecuaciones normales. tiempo semanal dedicado al estudio y los promedios de sus calificaciones . Vamos a ajustar la ecuación de regresión lineal múltiple. b . c de los parámetros a .

El output del SPSS es el siguiente: C oe fficie nts U n sta n d a rd iz e d . . En VARIABLE VIEW. colocar los datos de la tabla. . . para estudiar la relación entre Y y las variables X1 . en DATA VIEW. b = 0. TIEMPO y CALIFICA con sus respectivas especificaciones y.118 Luego. definir las siguientes variables: IQ. donde: X1 : Coeficiente intelectual (IQ) X 2 : Tiempo de estudio Y : Promedio de calificaciones Usamos las opciones del SPSS: Activar el SPSS y copiar los datos en un archivo de nombre: COEFICIENTE. 02:48 p. la ecuación de regresión lineal múltiple ajustada por el método de mínimos cuadrados es: 255 05_cap5. 049 c = 0.Solución Postulamos la ecuación de regresión Y = a + bX 1 + cX 2 .p65 255 31/03/2006. . Ejecutar ANALYZE/ REGRESSION/LINEAR/ ingresar en DEPENDENT la variable CALIFICA y en INDEPENDENT las variables IQ TIEMPO/OK.m. 249 . ˆ a ˆ b ˆ c Las estimaciones de los parámetros son: ˆ ˆ ˆ a = −5. X 2 .

m. es acompañado por un incremento en el promedio de calificaciones de 0. 049 X 1 + 0. También se dice que mide la bondad del ajuste o de la recta de regresión ajustada por el método de mínimos cuadrados.118 puntos. un incremento en el coeficiente intelectual (IQ) de un punto. es acompañado por un incremento en el promedio de calificaciones de 0.049 puntos. multiplicado por 100. un incremento de 1 hora en el tiempo de estudio. indica el porcentaje de la variación de la variable dependiente y que es explicado por las variaciones de las variables independientes del modelo. donde: ˆ 2 i i SST : suma de cuadrados del total SSR : suma de cuadrados debido a la regresión SSE : suma de cuadrados debido a los residuos Por ello. SSR = 2 2 SST = ∑ ( y − y ) . Es decir: . expresada por la suma de cuadrados total. Se puede demostrar que la variabilidad de Y . manteniendo constante la variable coeficiente intelectual.p65 256 31/03/2006. 02:48 p. .ˆ Y = −5.118 X 2 donde. y la suma de cuadrados debido a los residuos. se puede divi2 i dir en dos componentes: la suma de cuadrados debido a la regrei ˆ ∑ ( y − y ) . manteniendo constante la variable tiempo de estudio. sión. resulta natural definir el coeficiente de determinación como: R2 = SSR SST Retomando nuestro ejemplo en el que la variable dependiente es el promedio de calificaciones de un alumno y la variables inde- 256 05_cap5. 249 + 0. Coeficiente de determinación El coeficiente de determinación R . En forma similar. por ejemplo. SSE = ∑ ( y − y ) .

91. 02:48 p. . por ejemplo. . el coeficiente de inteligencia y el tiempo dedicado al estudio. . una alta correlación entre dos variables cuantitativas se interpreta equivocadamente como una relación de causa y efecto entre ellas.pendientes. pero esa alta correlación puede deberse a la influencia de otras variables subyacentes. Coeficiente de correlación parcial A veces. indica que el 9% de las variaciones observadas en la calificación promedio de los alumnos no son explicables por las variaciones en los puntajes del coeficiente de inteligencia y del tiempo dedicado al estudio. llamado coeficiente de alienación. El output del SPSS es el siguiente: A NO VA Su m of M o d el S q u are s . pues una razón subyacente para que las dos variables estén correlacionadas puede en- 257 05_cap5. 389 SSR 2 = 0.p65 257 31/03/2006. . sino por otras variables o factores no considerados en el modelo. denominadas variables espurias. R2 = 6. calcularemos la SST .09 = 1 – 0. . 022 SST El coeficiente de determinación 0. SSR . . si se observa una relación positiva entre la asistencia a la iglesia los domingos y la honestidad de las personas mayores. usando el SPSS. 91 =R = 7. SSE y el coeficiente de 2 determinación R .91 significa que el 91% de las variaciones observadas en la calificación promedio de los alumnos son explicadas por las variaciones del puntajes de coeficiente de inteligencia y del tiempo dedicado al estudio. Así. El valor 0. df . esto no implica necesariamente que las personas son honestas porque van a misa los domingos.m.

j +1.i −1.3 2 14•3 24•3 2 24•3 ) r ij •1... X k . para las variables X1... El coeficiente de correlación parcial entre X1.... j −1.. X i +1 .k ii•1..k = s s ij•1. i−1......... La fórmula de cálculo es la siguiente: r = 12 •3 (1 − r )(1 − r ) 2 2 13 23 r 12 − r 13r 23 (5. i +1. 258 05_cap5. y X2.....contrarse en variables subyacentes como el entrenamiento temprano en asistir a la iglesia y en enseñar a los niños a tener actitudes honestas. .2... controlando las variables X 1 ..... el coeficiente de correlación parcial entre las dos primeras variables mide la relación lineal entre las variables X1.. X j −1 ..m.. X i −1 . controlando X3 y X 4 se define como: r 12 •34 = r −r r (1 − r )(1 − r 12•3 14... k donde: s ii •1. j−1.i +1. j +1......2...i −1.. X k .2.. controlando X3...3 es el coeficiente de correlación parcial entre X1. es la siguiente: .. j +1.i −1.. k :varianza de la variable Xi ..2.. Así. controlando las variables X 1 .... k s jj •1....i −1...... X2 eliminando la influencia que puede ejercer la tercera variable X3.i +1...... j −1....i +1. eliminando la influencia que puedan ejercer otras variables.2...8) donde r 12........ X i +1 . j +1...... X j +1 ... X j +1 ..2... X2 y X3. r ij •1.p65 258 31/03/2006. y X2. j −1.. j +1...... j −1......i +1. X j −1 ...... j +1..i −1. j −1.... k La fórmula de obtención del coeficiente de correlación parcial entre las variables X i y X j ..i+1.. X i −1 . 02:48 p... El coeficiente de correlación parcial mide la relación lineal entre dos variables..

8): r12•3 = (1 − 0.925 .... X1 : notas promedio X 2 : notas de Álgebra X 3 : notas de Aritmética Solución a) Considerar la base DATOS3. 903 )(1 − 0. r13 = 0..... la salida es: NOTAS PROMEDIO NOTAS DE ÁLGEBRA NOTAS DE ARITMÉTICA NOTAS PROMEDIO Pearson Correlation Pearson Correlation NOTAS DE ÁLGEBRA NOTAS DE ARITMÉTICA Pearson Correlation 1 .893) = 0.educación y calcular los coeficientes de correlación simple entre los pares de variables X 1 .893 ) 2 2 0.903 ( 0. lo que signi- 259 05_cap5...893 y se obtiene el valor del coeficiente de correlación parcial entre la nota promedio ( X1 ) y la nota de álgebra ( X 2 ). Ejemplo 11 Con la base de DATOS3-educación se ilustra el cálculo del coeficiente de correlación parcial entre la nota promedio y la nota de Álgebra.925. X 2 X 3 . k : varianza de la variable X j ..925 1 .. X i +1 .. j +1.893 . X k . X j −1 ..903. j −1. i +1. manteniendo constante la nota en aritmética ( X 3 ).903 . usando los comandos del capítulo VII. con- trolando las variables X 1 .6117...2.893 1 donde: r 12 = 0..... controlando la nota de Aritmética.m.. usando la ecuación (5.p65 259 31/03/2006. 925.. 0. 0374 El coeficiente de correlación entre la nota promedio y la nota en álgebra es 0. r23 = 0. X i −1 ...925 − 0.. 02:48 p.. en tanto que la correlación entre ellas eliminando la influencia de la nota de aritmética es 0.. X j +1 .s jj •1.1186 = 0. .i −1. 6117 ..903 .

el valor del coeficiente de correlación parcial coincide con el valor ya encontrado. el número de hijos. edad de las mujeres. se abre la base de DATOS3-EDUCACION y con los comandos del capítulo VII se tiene el siguiente cuadro: Control Variables NOTAS DE ARITMÉTICA NOTAS PROMEDIO Correlation 1. y también que varía de un lugar a otro y de unos grupos sociales a otros.000 NOTAS PROMEDIO NOTAS DE ÁLGEBRA Como puede observarse. Ejemplo 12 Se sabe que la disposición de las mujeres a trabajar fuera de casa no ha sido la misma en todas las épocas. En la base DATOS7-mujeres. estaría explicada por algunas variables como: el salario que perciben las mujeres. el salario percibido por el marido. puede preguntarse qué variables influyen para que las mujeres estén más o menos dispuestas a trabajar fuera de casa. entre otras. En estas condiciones.000 Correlation . . a) Encontrar el coeficiente de correlación lineal entre los salarios de las mujeres y los salarios de los hombres. b) Usando el SPSS.p65 260 31/03/2006. para una muestra de señoras casadas. 260 05_cap5. se tienen los valores observados de las variables: Z 3 : logaritmo ( X 2 / X1 ) X 1 : salario promedio de las mujeres X 2 : salario promedio de los hombres X 3 : número promedio de hijos por familia X 4 : edad promedio de las mujeres. Estas preguntas se plantean hoy día los sociólogos y consideran que si la variable dependiente fuera el porcentaje de mujeres trabajadoras.m.611 1. tasa general de desempleo.fica que la correlación lineal entre la nota de Álgebra y la nota promedio estaba influenciada por la nota en Aritmética. 02:48 p.611 NOTAS DE ÁLGEBRA .

807 Salario de hombres .806 Salario de los hombres . r12 = 0. . valor que indica una buena relación directa entre las variables. Solución a) Abrir la base de DATOS7-mujeres y seleccionar los comandos del SPSS del capítulo VII (procedimientos estadísticos) que permiten obtener el coeficiente de correlación simple.p65 261 31/03/2006. controlando la edad de las mujeres.806 1.000 . controlando la variable edad de las mujeres. El output del SPSS nos proporciona el coeficiente de correlación simple entre los salarios de los hombres y las mujeres.b) Se propone encontrar el coeficiente de correlación parcial entre los salarios de los hombres y las mujeres. r12•4 = 0. El output del SPSS nos proporciona el coeficiente de correlación parcial entre los salarios de los hombres y las mujeres.mujeres y seleccionar los comandos del capítulo VII que permiten obtener el coeficiente de correlación parcial. es el valor del coeficiente de correlación entre los salarios de los hombres y los salarios de las mujeres controlando la edad de las mujeres. Correlations Salario de mujeres 1 .806 .m. de X 1 y X 2 controlando X 4 . Por otro lado. Se observa que la correlación entre los salarios de las mujeres y de los hombres no está influenciada por la 261 05_cap5. 02:48 p.807 es el valor del coeficiente de correlación lineal entre los salarios de las mujeres y los salarios de los hombres. Correlations Control Variables Edad de las Salario de las mujeres mujeres Salario de los hombres Salario de las mujeres 1.000 Correlation Correlation Así.807 1 Salario de mujeres Salario de hombres Pearson Correlation Pearson Correlation b) Abrir la base DATOS7.

lugar de residencia y la expansión del servicio educativo. los 10 estudiantes respondieron un cuestionario de ansiedad. . Un profesor de Estadística realiza un estudio para investigar la relación que existe entre la ansiedad y el rendimiento de sus estudiantes en los exámenes.43 474 F 2.46 Y 529 506 C D 3. A 10 candidatos del programa de doctorado en Psicología se les aplica una prueba de personalidad ( X ) y un examen general de conocimientos ( Y ). Ansiedad Examen Final 28 82 41 58 35 63 39 89 31 92 42 64 50 55 46 70 45 51 37 72 262 05_cap5.36 3. a) El presupuesto familiar destinado a la educación de los hijos y los ingresos familiares. En los siguientes casos identifique en caso de ser posible la(s) variable(s) dependiente(s) e independiente(s). A continuación se tienen las calificaciones de la prueba final y los puntajes obtenidos en el cuestionario de ansiedad. 02:48 p. antes de asistir al examen final.edad de la mujer. 2. e) La edad y el tiempo efectivo de servicio de los docentes afiliados al sindicato de profesores. 3.p65 262 31/03/2006. b) El volumen de ventas de una empresa y la inversión en propaganda. puesto que se sigue manteniendo alta cuando la variable edad de las mujeres es controlada.12 3.96 2.m. Elige a 10 estudiantes para el experimento y. d) El analfabetismo.20 2. c) El número de hijos por familia y el nivel educativo de los padres. Las puntuaciones fueron las siguientes: Candidato A B X 2.12 509 G 2.40 591 610 E 2.75 600 575 540 Realice el análisis de regresión y correlación lineal. Ejercicios 1.85 550 H I J 3.

b) Describa la relación que muestra el diagrama de dispersión. ¿qué valor podría predecirse para su calificación en el examen final? 4. Las puntuaciones de ambas aplicaciones son las siguientes: 263 05_cap5. Se aplicó a un grupo de 18 adolescentes sordomudos la prueba de inteligencia de Wechsler para adultos (Wais) y cuatro subtest. X 2 son las puntuaciones obtenidas al aplicarles una prueba psicológica que mide la autoestima. Se realiza un estudio con 10 estudiantes de postgrado en Educación. 02:48 p. e) Si un estudiante tiene un nivel de ansiedad de 38. e Y es el número de problemas que cada estudiante espera resolver correctamente en el examen final. c) Suponga que la relación es lineal y calcule el valor del coeficiente de correlación e interprete.p65 263 31/03/2006.m. d) Determine la recta de regresión por mínimos cuadrados para predecir la calificación del examen final dado el nivel de ansiedad. Estudiante Número problemas resueltos en clase 1 14 2 8 3 9 4 13 5 10 6 11 7 14 8 15 9 11 10 16 Puntuación en autoestima Número de problemas que espera resolver en el examen final 14 5 8 11 15 14 18 19 7 17 5 15 19 33 39 38 74 74 11 78 5.a) Elabore el diagrama de dispersión. . Con los datos que se presentan a continuación realice el análisis de regresión lineal múltiple usando el SPSS. Utilice la ansiedad como la variable regresora o independiente. X 1 es el número de problemas resueltos correctamente por un estudiante en clase.

b) Si una mujer tiene 49 años. 6. Si ∑ x = 628. b) Realice un análisis de regresión lineal múltiple.m. ∑ x y = 89894. . i i a) Encuentre la recta de regresión de Y sobre X .Adolescentes Wais Razonamiento Razonamiento Relaciones Velocidad y mecánico abstracto espaciales exactitud 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 48 48 47 46 46 43 42 42 41 40 39 32 31 30 29 29 28 27 22 19 20 20 17 21 21 19 17 15 15 11 17 16 15 15 16 16 38 38 37 37 35 34 34 33 33 32 32 25 25 23 22 21 20 18 15 15 20 17 19 15 14 20 13 15 12 15 9 9 13 9 11 11 25 40 21 20 18 17 31 35 35 27 17 28 29 37 29 39 28 38 a) Realice un análisis de regresión lineal simple de Y con cada uno de los cuatro subtest. Se conocen las edades ( X ) y la presión sanguínea ( Y ) de 12 mujeres. ∑ y i i = 1684. ¿cuál sería su presión sanguínea? c) Si una mujer tiene 72 años.p65 264 31/03/2006. La siguiente tabla muestra las calificaciones obtenidas por 10 estudiantes en dos pruebas de Estadística: X : Primera prueba Y : Segunda prueba 12 10 16 16 14 12 20 8 18 14 16 14 14 20 10 16 20 12 16 12 264 05_cap5. 02:48 p. ∑y 2 i = 238822. ¿cuál es la presión sanguínea esperada? 7. ∑x 2 i = 34416.

78 0.00 1.p65 265 31/03/2006.00 9.74 0.00 6.00 3.00 6. RENDIM. c) Si un estudiante obtuvo 14.87 0.89 1.50 3.90 0.81 0. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 8 6 5 3 4 6 7 4 4 3 6.00 7.00 8.00 8.48 0.0 5.70 0. .5 5 3 5 5.58 0.99 0.50 6. CREAT.00 8.70 1.86 0.00 2.00 5.84 0.00 8. CREAT.00 6.2 0.64 0. CASO ORDEN C.82 0.00 5.73 0.00 0.85 0.00 4.00 7.63 0.00 0.85 0.00 6.50 3.7 en la primera prueba.62 0.00 0.73 0.80 0. 02:48 p.00 7.78 0.50 0.00 0. RENDIM.00 4. Rendimiento escolar :RENDIM.90 0.00 3.5 4.50 1.I.92 0. en los que evaluaron los siguientes aspectos: Creatividad : CREAT Capacidad de orden : ORDEN Coeficiente intelectual :C.00 2.73 0.77 0.00 4.00 1.45 8.00 265 05_cap5.I.65 4.62 0.98 0.81 0.00 5.82 0.72 0.50 6.00 6.00 4.62 0.65 0.50 6.84 0.50 7.74 0.84 0.00 0.97 0.50 4.21 0.88 0.5 7 8 5 6 4 3 3 6 6 6 4 8 7 5 5 5 5 6 4 109 113 123 106 110 95 125 100 112 53 77 100 105 89 105 92 98 91 90 98 113 92 98 86 88 88 102 101 76 94 0. ¿cuánto se espera que obtenga en la segunda prueba? 8.m.94 0.76 0.75 1.88 0.5 4 10 7 8 6 10 7 5 9 7 7 6 6 4 114 103 97 94 88 76 116 86 97 91 123 63 92 86 84 63 88 128 102 115 93 130 90 90 102 102 99 100 88 74 0.91 0.00 5.00 6.05 0.00 3.82 0.00 6.00 7.00 6.00 4.91 0.50 2.00 2.00 7. b) Obtenga la recta de regresión de Y sobre X .00 5.00 5.I.50 5.a) Construya el diagrama de dispersión.91 0. Dos profesores.00 8.74 0.99 0.14 0.81 0.50 7.00 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 4 7 7 10 7 6 9 6 7 3 3.00 10.00 5. con el propósito de examinar cuál es la influencia que los métodos de enseñanza basados en el trabajo libre y creativo del alumno ejercen sobre su rendimiento escolar. llevaron a cabo una investigación con 122 niños y niñas.75 0.50 3. CASO ORDEN C.00 2.62 0.

a) Use comandos del SPSS para crear el archivo de datos. ¿podemos afirmar que existe relación lineal entre rendimiento escolar y creatividad? e) ¿Cuál es la recta que mejor permite predecir la variable rendimiento escolar en función de la variable creatividad? Interprete.p65 266 31/03/2006. . 266 05_cap5. ¿podemos afirmar que. la creatividad está relacionada con el rendimiento escolar? g) Sobre la base de los datos obtenidos en esta experiencia. b) ¿Existe relación entre inteligencia y creatividad? c) Sobre la base de los datos obtenidos en esta experiencia. ¿podemos afirmar que existe relación lineal entre el rendimiento escolar y la inteligencia? h) ¿Cuál es la ecuación de la recta que permite predecir el rendimiento escolar en función de la variable inteligencia? Interprete.m. 02:48 p. corresponde una menor capacidad de orden? d) Sobre la base de los datos obtenidos en esta experiencia. f) ¿Manteniendo constante la capacidad intelectual de los alumnos. a mayor creatividad.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->