Documentos de Académico
Documentos de Profesional
Documentos de Cultura
U5 Downie Coeficiente de Correlación-Desbloqueado
U5 Downie Coeficiente de Correlación-Desbloqueado
En el capítulo anterior se obtuvo un coeficiente de correlación, r, para una serie
de datos mediante un proceso laborioso que trataba sobre todo con el establecimiento
de las ecuaciones de regresión. En este capítulo, se describirá un método directo para
Tabla de contenido obtener r, junto con la naturaleza, usos y limitaciones de la r de Pearson. Este valor
estadístico es uno de varios coeficientes de ese tipo y también el más frecuente. En el
CONDICIÓN GENERAL DE LOS COEFICIENTES DE CORRELACIÓN ............................. 2 capítulo siguiente, se presentarán otros coeficientes de correlación.
Relación positiva perfecta .................................................................................... 3 La correlación es básicamente una medida de la relación entre dos variables. Si
se observan algunas de las cosas comunes que se miden, se ve que, por ejemplo, las
Relación negativa perfecta................................................................................... 4 calificaciones altas en el idioma propio tienden a estar relacionadas con altas
calificaciones en lenguas extranjeras. Ambas tienden a estar asociadas a calificaciones
Otras relaciones ................................................................................................... 4 altas en pruebas de inteligencia. En otros aspectos, la gente alta tiende a tener mayor
Condiciones que intervienen en la interpretación de r ....................................... 5 peso que la gente ‐le baja estatura. El volumen de un gas se relaciona con la presión a la
cual se mantiene. En el campo de la economía, existe una correlación entre el precio de
COEFICIENTE DE CORRELACIÓN PRODUCTO‐MOMENTO DE PEARSON .................. 6 ciertos productos y la cantidad disponible para su venta. De manera que en todos los
aspectos de la vida existen relaciones de un tipo o de otro. Debe advertirse que tales
COEFICIENTES DE CORRELACIÓN Y LA AMPLITUD DE VARIACIÓN .......................... 8 relaciones no necesariamente implican que una sea causa de la otra. Este puede ser el
INTERPRETACIÓN DE UN COEFICIENTE r DE PEARSON ............................................ 9 caso o no. En algunas situaciones se observa que dos variables están relacionadas debido
a que se asocian o son causadas por una tercera variable.
PROMEDIO DE LA r DE PEARSON ........................................................................... 10
OTRAS FÓRMULAS DE REGRESIÓN QUE UTILIZAN r .............................................. 10 CONDICIÓN GENERAL DE LOS COEFICIENTES DE
Fórmula directa para obtener Y ......................................................................... 11 CORRELACIÓN
La mayoría de los coeficientes de correlación señalan dos cosas. Primero, una
Ecuación de predicción basada en puntuaciones estándares ........................... 11 indicación de la magnitud de la relación; vale la pena notar en este punto que un
Coeficiente de correlación y coeficientes b ....................................................... 12 correlación de — 0.88 tiene el mismo tamaño que una de + 0.88; el signo no la magnitud
de la relación, sino sólo indica el sentido de la relación. Cuando dos variables están
Coeficiente de correlación y coeficientes b ....................................................... 13 directa o positivamente relacionadas, a medida que aumenta una, la` otra también lo
hace. Las puntuaciones de pruebas de aptitud se relacionan en forma positiva con las
calificaciones académicas. En general, cuanto mayores sean las puntuaciones en una
prueba de aptitud, tanto mayores serán las calificaciones recibidas en los cursos
regulares. Otras variables están inversamente relacionadas; esto quiere decir que, cuando
aumenta una, la otra disminuye. Como ejemplo, consideremos la relación entre la
velocidad a la que se conduce un automóvil en la posición "tercera" o cuarta de los
cambios y la cantidad de kilómetros que recorre por litro de combustible: cuanto más
rápido conduzca una persona, el rendimiento de gasolina será menor. La ausencia de
cualquier relación entre variables se denota por un coeficiente de correlación de 0.00,
Para profundizar en estos contenidos consulta la obra completa:
Downie, N. M. (1986). Métodos Estadísticos Aplicados. Harla: México
2
Campus Universitario Virtual de Educación a Distancia CUVED
www.aprendevirtual.com/cuved
Métodos Cuantitativos III. Unidad 1. Análisis de Relación entre Variables
casi nulo.
Como se observó anteriormente las distribuciones usadas en la regresión y la
correlación se conocen como distribuciones bivariantes; esto es, se forman con valores
medidos de dos variables. Otro ejemplo de una distribución bivariante se muestra en la
Tabla 7‐1, en la que se presentan las calificaciones de diez estudiantes en una prueba de
capacidad académica (X) y una prueba de conocimientos aritméticos (Y). En la figura 7.1
se han graficado estas puntuaciones en un diagrama de dispersión, como se hizo en el
capítulo anterior. Cada punto en la gráfica representa las dos puntuaciones de una
persona. Por ejemplo, las del primer estudiante se grafican marcando 130 sobre el eje x y
18 sobre el eje y. De esta manera las dos puntuaciones para cada estudiante se
representan en el diagrama.
Relación positiva perfecta
La figura 7.2 muestra la relación entre dos variables. Obsérvese que cualquier
aumento de 2 unidades en la variable X, produce un incremento correspondiente de 1
unidad en la variable Y. Esto es cierto para todos los pares de valores de las variables.
Cuando tales pares de valores se grafican, forman una línea recta, y cuando esta recta se
extiende desde la porción inferior izquierda a la superior derecha del diagrama de
dispersión, se tiene un ejemplo de relación positiva perfecta. El coeficiente de correlación
es igual a + 1.00.
Obsérvese aquí que aun cuando los puntos no coinciden a lo largo de una línea recta, ésta
TABLA 7.1 PUNTUACIONES EN UNA se sigue manifestando. En la figura 7.5 se tiene un ejemplo de relación negativa baja. En
PRUEBA DE CAPACIDAD ACADÉMICA Y EN OTRA este dispersograma los puntos están diseminados por todas partes. Se aprecia que los
DE CONOCIMIENTOS DE ARITMÉTICA puntos caen en general en una zona que va desde la porción superior izquierda a la
Capacidad Conocimiento inferior derecha. Cuando los puntos en el diagrama de dispersión se localizan claramente
Estudiante académica de aritmética en todas direcciones, no existe relación alguna.
1 130 18 Al elaborar tales diagramas, el estudiante obtiene una indicación de la magnitud
2 125 22 del coeficiente de correlación, así como una indicación del sentido de la relación. Esto, en
3 115 16 parte, es una comprobación general de los cálculos.
4 108 17
5 104 14
6 98 12
7 92 8
8 88 10
9 84 8
10 80 4
Para profundizar en estos contenidos consulta la obra completa:
Downie, N. M. (1986). Métodos Estadísticos Aplicados. Harla: México
3
Campus Universitario Virtual de Educación a Distancia CUVED
www.aprendevirtual.com/cuved
Métodos Cuantitativos III. Unidad 1. Análisis de Relación entre Variables
Una descripción más precisa de la regresión lineal es que las puntuaciones
medias de las columnas y filas se localizan sobre una línea recta. Supóngase que se
considera una gráfica de dispersión similar a la de la figura 7.4, y que tal disperso‐ grama
Relación negativa perfecta contiene, en lugar de las puntuaciones de 10 personas, las calificaciones de 250
La figura 7.3 es justamente lo opuesto a la anterior. Nótese que para estos datos, estudiantes. Empezando a la izquierda para una X = 0, es posible determinar la
cualquier incremento de 2 unidades en el eje x, produce una disminución corres‐ puntuación media Y para cada valor de X, y graficar esta media en el dispersograma. Si
pondiente de 1 unidad sobre el eje y. Una vez más, esta relación se conserva en toda la existe regresión lineal, estas medias tenderán a encontrarse en una recta. De manera que
amplitud de variación. Esta vez los puntos caen en una recta, la cual va desde la porción la media de cada fila puede determinarse y luego ser graficada. Hay entonces dos líneas
superior izquierda del dispersograma hasta la parte inferior derecha. Esto representa una de regresión, excepto cuando r = 1, o sea, cuando coinciden.
relación negativa perfecta, con valor del coeficiente de correlación igual a — 1. Esto
significa que la persona con calificación más alta en la variable X tenía la puntuación más
baja en la variable Y. La segunda en puntuación más alta en la X fue la segunda más baja
en Y, y finalmente, la más baja en X fue la más alta en Y.
Otras relaciones
En la práctica generalmente se tienen casos en los que la relación no es perfecta.
La figura 7.4 muestra el diagrama de dispersión de una correlación positiva muy alta.
En el grado en que los datos no son lineales, disminuye el valor de la r calculada.
Condiciones que intervienen en la interpretación de r El valor de r refleja el grado de variancia que puede ser explicado mediante una recta,
sean los datos esencialmente lineales o no. Es posible que una relación muy alta, pero no
Antes de que se calcule r, debe examinarse el diagrama de dispersión y a veces lineal, parezca ser muy baja con base en la r de Pearson. Sin embargo, cuando una
poner a prueba los datos para verificar si se cumplen dos condiciones. La primera es ver si relación bivariante es principalmente curvilínea, puede utilizarse el coeficiente eta, ri,
existe regresión lineal (también conocida como regresión rectilínea). Esto significa que los llamado algunas veces razón de correlación. Este coeficiente, refleja la variancia
puntos del diagrama de dispersión tienden a agruparse en una recta. Esto es lo que representada mediante la línea de mejor ajuste, ya sea curva o recta, y se estudia en
ocurre con los datos mostrados en las figuras 7.1, 7.2, 7.3 y 7.4. Sin embargo, en la figura textos más avanzados.
7.6 se observa que, empezando por la parte inferior izquierda, conforme aumenta la
variable Y, también lo hace la variable X; pero a medida que X continúa incrementándose,
Y, empieza a disminuir; aún más, cuando I X sigue en aumento, Y sigue disminuyendo.
Esta relación se conoce por regresión curvilínea, Tales relaciones no son infrecuentes.
Consideremos las capacidades corporales motoras: a medida que crecemos, podemos
correr con más rapidez, después viene un periodo en el que no ocurre ningún aumento, y
luego a medida que se envejece, la rapidez de locomoción se reduce notablemente.
COEFICIENTE DE CORRELACIÓN PRODUCTO
MOMENTO DE PEARSON
De los diversos coeficientes de correlación que existen, el que se utiliza con más
frecuencia se denomina coeficiente de correlación producto‐momento de Pearson, cuyo
símbolo es también r. La magnitud de este coeficiente de correlación varía de +1a0y‐1.
La segunda condición que debe buscarse es la homoscedasticidad, mencionada La r de Pearson se definió originalmente como:
en el capítulo anterior. Esto significa que la tendencia a la igualdad de las desviaciones
estándares (o variancias) y de las ordenaciones (columnas y filas). En la figura 7.7 se
presentan tres diagramas. En a la variancia de las columnas próximas al centro de la
distribución X es menor que la de las columnas de los extremos. En el diagrama b todas
lo que quiere decir que la r de Pearson es la media del producto de las
las columnas de la izquierda tienen menores variancias que las del centro y que las de la
puntaciones z. A fin de obtener una r para un conjunto de datos mediante este método,
derecha. El diagrama c representa el caso en el que se cumplen ambas condiciones. Se
se convierte toda puntuación en cada distribución en una puntuación z después de
observa que los puntos tienden a formar una elipse alrededor de la línea de regresión.
obtener las dos medias y las dos desviaciones estándares. Posteriormente, las dos pun‐
Cuando los datos no son homoscedásticos, no son aplicables los métodos usuales de
tuaciones z para cada caso se multiplican y se suman los productos. La suma obtenida se
evaluación de los valores predichos sobre el eje y a partir de los valores correspondientes
divide luego entre el número de personas, N, y el cociente es la r de Pearson. Esta no es
sobre el eje x. Por ejemplo, en el diagrama a sería posible realizar predicciones en el
una fórmula tan práctica como las demás fórmulas y métodos que han aparecido desde la
centro de la distribución X con mayor precisión que en cualquiera de los extremos.
época de Pearson.
Mediante diversas operaciones algebraicas, la ecuación (7.1) se transforma en la
siguiente ecuación, que se adapta bien para su manejo en una calculadora de bolsillo o en
otros dispositivos electrónicos.
El uso de esta ecuación se demostrará mediante los datos provenientes de la
Tabla 7.1 los que se han reproducido en la Tabla 7.2. Para facilitar el trabajo, y no
sobrecargar la calculadora, cada valor de la columna 1 se codifica restando una constante
80 a cada puntuación, y a cada otra en la columna 2 se le resta 4. Los valores asociados a
estas puntuaciones codificadas se convierten en las X y Y de la ecuación (7.2). Este tipo de
codificación no afecta la magnitud del coeficiente de correlación. Por tanto, cada X se
eleva al cuadrado, columna (5), cada Y se eleva al cuadrado también, columna (6); y cada
X se multiplica por la Y correspondiente, colocándose el producto en la columna (7).
Posteriormente se suman los datos de las columnas (3) a (7) y la suma se coloca en la
fórmula (7.2). En toda correlación, N siempre representa el número de pares de
puntuaciones, o el número de personas.
TABLA 7.2 DETERMINACIÓN DEL COEFICIENTE r DE PEARSON PARA LOS DATOS DE LA Los valores pueden simplificarse redondeando cada media y utilizándola como
TABLA 7.1 constante para la resta. Sin embargo, esto resultaría en valores negativos que podrían
dificultar el trabajo.
(1) (2) (3) (4) (5) (6) (7) Cuando se calcula r, las medias y las desviaciones estándares de las dos distri‐
X Y X— 80 Y‐ 4 X2 Y2 XY buciones se obtienen de los datos disponibles. Esto se realiza como sigue, utilizando los
130 18 50 14 2500 196 700 datos que se han codificado al restarles las constantes Cx = 80 y Cy = 4.
Adviértase que la correlación entre X y Y es la misma que la correlación entre Y y
X; esto es, rxy = ryz
COEFICIENTES DE CORRELACIÓN Y LA AMPLITUD
DE VARIACIÓN
En la figura 7.8 se grafican las puntuaciones de un grupo sometido a una prueba
predictiva según sus calificaciones en cierta tarea utilizadas como criterio de evaluación.
Considerando la figura conjunto es evidente que existe una relación positiva entre las
puntuaciones y el criterio de predicción. En realidad la correlación es 0.6. La figura se ha
dividido en tres partes; las puntuaciones altas en la predicción, a la derecha de la línea B;
las bajas, a la izquierda de la línea A: y las de nivel promedio, entre A y B. Cuando las tres
partes se consideran por separado es mucho menor la correlación entre las dos variables,
de cada parte. Obsérvese que los puntos no conforman ninguna elipse y se diseminan por
toda el área. Tal dispersión indica una baja correlación. FIGURA 7.8 Diagrama que representa el efecto en r de la amplitud de variación
Los resultados de restringir la amplitud de variación obtenidos al seleccionar restringida (Fuente: Restriction of range: Questions and Answers. Test Service Bulletin No.
conforme a las puntuaciones de prueba son considerables e importantes. Supóngase que 59, New York: The Psychological Corporation, 1972.)
una universidad admite sólo a quienes califiquen a la derecha de la línea B en esta prueba En ocasiones se tienen pruebas selectivas donde los coeficientes de correlación
predictiva. Dado que el criterio de evaluación, las calificaciones de los estudiantes de deben corregirse según amplitudes de variación restringidas. Supóngase que se
primer ingreso, se correlacionarán sólo con respecto a las puntuaciones altas de consideran las pruebas de selección para ingresar en la Fuerza Aérea de Estados Unidos.
predicción, el coeficiente resultante probablemente será muy bajo. Las personas cuyas Para ingresar en la escuela de aviación, una persona tiene que aprobar una serie rigurosa
puntuaciones están a la izquierda de la línea B, no fueron seleccionadas, y por tanto, no de exámenes. Quienes obtengan bajas o muy bajas calificaciones no son admitidos. Los
existe criterio de evaluación para ellos. Cuando se utilizan estas pruebas predictivas, se cadetes del aire son, por consiguiente, un grupo selecto. Después de haber sido
debe advertir que el examen ya ha realizado su función, dado que muchos estudiantes seleccionados, se les somete a diversos entrenamientos y pruebas, y durante este
con baja puntuación no fueron admitidos en esa universidad. Ejemplos como éste periodo, algunos abandonan los estudios o son descartados. Por último, se tiene un grupo
abundan en la operación de instituciones educativas, industriales y militares. Cuando se más selecto aún que consigue su ingreso al servicio activo. Si se aplicaran al grupo final de
llevan a cabo investigaciones con personas que han pasado por un proceso de selección, cadetes las pruebas de selección, se encontraría que los coeficientes de correlación eran
los estudios correlacionales de sus características y desempeños es probable que muy bajos. Sin embargo, existen fórmulas para considerar éstas situaciones, y su empleo
produzcan resultados mucho más bajos que cuando las mismas variables se utilizan con permite corregir los coeficientes obtenidos para una amplitud de variación restringida.
personas de grupos no seleccionados. Tales ecuaciones pueden encontrarse en la obra de Guilford y Fruchter (1973, pp. 315‐
Para profundizar en estos contenidos consulta la obra completa:
Downie, N. M. (1986). Métodos Estadísticos Aplicados. Harla: México
8
Campus Universitario Virtual de Educación a Distancia CUVED
www.aprendevirtual.com/cuved
Métodos Cuantitativos III. Unidad 1. Análisis de Relación entre Variables
316). zapato y la calificación en la prueba de Estadística. Los resultados serían desconcertantes,
La variabilidad del grupo, expresada en términos de desviaciones estándares o pues no hay motivo para que exista alguna correlación entre el tamaño de los pies de una
de variancias, debe considerarse cuando se obtienen los coeficientes de correlación. Esto persona y sus calificaciones en Estadística. El profesor podría repetir este estudio durante
proporciona información acerca de la naturaleza del grupo sobre el que se recopilaron los los próximos 30 años y nunca volvería a obtener tales resultados nuevamente. La única
datos, y ayuda en gran medida a la interpretación de tales coeficientes. forma de considerar está r de 0.92 es simplemente como resultado del azar.
El hecho de que es la amplitud de variación y no el tamaño de la muestra lo que Se indicó antes que los coeficientes 1e correlación se interpretan de manera
afecta la magnitud de r, puede demostrarse eligiendo a una persona de la columna relativa al referirnos a coeficientes altos, moderados o bajos. Sin embargo, la mejor forma
izquierda en la figura 7.8, y después seleccionar un punto o dos de cada columna de evaluar una r es mediante el coeficiente de determinación (r2). Esto se explicó en el
conforme se recorre la figura. De esta manera, aun cuando se eligirán menos puntos, los Capítulo 6. Cuando r = 0.40, el coeficiente de determinación vale: r2 = 0.16. En este caso,
escogidos se ubicarán en una elipse, lo cual indica un coeficiente de correlación 16% de la variancia en X es explicada por Y o viceversa. Esta r = 0.40 no es infrecuente en
razonablemente alto. los estudios de investigación. En este caso, el 84% de la variancia no se puede explicar.
Esto es muy importante de tener en cuenta cuando se consideran correlaciones bajas.
Supóngase que una r = 0.10 se obtiene entre dos variables. Por tanto, r2 = 0.01. En este
INTERPRETACIÓN DE UN COEFICIENTE r DE caso no es posible explicar 99% de la variancia, debido a factores diferentes al
PEARSON considerado. Cuando se considerán la significancia estadística, puede observarse que
Como se señaló anteriormente, un coeficiente de correlación es una medida de este coeficiente de O es estadísticamente significante. No obstante, la significancia
la relación entre dos variables. En la práctica, una r de 0.8 o más se considera un coefi‐ estadística le no tener valor cuando se considera el uso práctico de dicho valor estadístico
ciente alto, una r de aproximadamente 0.5 se considera moderada, y una r de 0.3 o un método de predicción.
menos se considera un coeficiente bajo. Téngase presente que una r de Pearson no es En el Capítulo 18, que se refiere a la evaluación educativa y psicológica, se,
una medida de causalidad, aunque en algunos casos, puede existir una relación causal presentan algunas aplicaciones importantes de los coeficientes de correlación. a de éstas
entre las dos variables. La persona que emplea estos datos tiene que hacer se describe como la confiabilidad de un instrumento de medición. Una definición de
interpretaciones acerca de la causalidad. confiabilidad es como la consistencia de las puntuaciones de Cebas a través del tiempo.
También pueden parecer relacionadas simplemente porque están asociadas a Por ejemplo, si se somete a las mismas personas a una Ceba de inteligencia ahora y un
una tercera. El ingreso monetario es un ejemplo de una variable que origina tales mes después, se debe esperar una alta correlación entre las dos series de calificaciones —
complicaciones. Los ingresos en diversas comunidades o sociedades (variables A), se por ejemplo, 0.9 o más— si la prueba ;considera que produce resultados confiables. Otro
correlacionan positivamente con la cantidad de dinero gastado en educación en las uso importante de los coeficientes de correlación es en el estudio de la validez predictiva
comunidades. La variable C, la cantidad gastada de en bebidas alcohólicas (variable C), de una prueba. En caso, las calificaciones de un examen se correlacionan con el criterio de
también está correlacionada con los ingresos mencionados (variable A). Asimismo, puede evaluación. Un ejemplo de esto es la correlación de puntuaciones en la Prueba de
demostrarse que existe una correlación positiva entre las variables B y C. Esto se debe a Aptitudes Académicas de la comisión examinadora de admisión con la calificación medio
que ambas variables están relacionadas con la tercera, o sea, A. Cuando se suprimen los de los alumnos de primer grado. Normalmente la correlación en situaciones como ésta se
efectos de esta tercera variable, parece haber poca relación entre la cantidad gastada en encuentra entre 0.4 y 0.6, aunque en muchas es menor. Lo importante es que la
educación y lo gastado en bebidas embriagantes. magnitud de la correlación en sí no es lo más significativo, sino aso o finalidad a los que se
Puede considerarse otro grupo de coeficientes de correlación como falso o ba‐ aplica, lo que determina el proceso de evaluación. i de esperar altos coeficientes de
sado en el azar. Supóngase que un profesor de estadística determinó el tamaño del correlación en ciertas situaciones, y pueden tolerarse mucho menores en otras.
calzado de cada uno de los alumnos, y correlacionó estos valores con la calificación
obtenida en el último examen del curso; obtuvo asi una r de 0.92 entre el tamaño de
Para profundizar en estos contenidos consulta la obra completa:
Downie, N. M. (1986). Métodos Estadísticos Aplicados. Harla: México
9
Campus Universitario Virtual de Educación a Distancia CUVED
www.aprendevirtual.com/cuved
Métodos Cuantitativos III. Unidad 1. Análisis de Relación entre Variables
PROMEDIO DE LA r DE PEARSON
Lo que los coeficientes r de Pearson no son unidades uniformes, no deben ser
su‐ los o promediados. Para determinar un coeficiente de correlación promedio, se vierte
cada r a su Z utilizando la tabla del Apéndice G; luego se promedian es‐ valores de Z, y
mediante la misma tabla, se vuelve a convertir esta Z en una r, representa la r promedio.
Por ejemplo, veamos la tabla que se presenta a continuación. La suma y la media en la
culumna r indican la diferencia entre las dos ticas. Si las r fueran muy similares en
magnitud sería poco útil emplear esta lita. Asimismo, si todas fueran pequeñas, podrían
promediarse, ya que la a del Apéndice G señala que hasta para una r de 0.25, los valores
de r y de Z muy semejantes.
Un procedimiento más preciso consiste en ponderar cada Z multiplicándola por
N — 3. Estos resultados se suman, y si se tratara de promediar cuatro Z, esta suma se
dividiría luego entre (N1 — 3) + (N2 — 3) (N3 — 3) + (N4 — 3). Esta Z ponderada se
transformaría a continuación en una r por medio del contenido del Apéndice G.
Un procedimiento más preciso consiste en ponderar cada Z
multiplicándola por N — 3. Estos resultados se suman, y si se tratara de promediar
cuatro Z, esta suma se dividiría luego entre (N1 — 3) + (N2 3) (N3 3) + (N4— — —
OTRAS FÓRMULAS DE REGRESIÓN QUE UTILIZAN
r
En el Capítulo 6, el coeficiente b se definió como:
Para profundizar en estos contenidos consulta la obra completa:
Downie, N. M. (1986). Métodos Estadísticos Aplicados. Harla: México
10
Campus Universitario Virtual de Educación a Distancia CUVED
www.aprendevirtual.com/cuved
Métodos Cuantitativos III. Unidad 1. Análisis de Relación entre Variables
dado que se acaba de demostrar que el numerador es igual a Ixy, y el primer tér‐
mino en el denominador es /x2, ya que el segundo término en el denominador es /y2, al
sustituir resulta:
Ecuación de predicción basada en puntuaciones
Dividiendo ambos términos contenidos en el radical entre N: estándares
Entonces
establece que el coeficiente b al inferir Y a partir de X es igual al producto del
coeficiente de correlación y la razón de las dos desviaciones estándares.
De modo similar:
Fórmula directa para obtener Y
Empezando con la línea de regresión, cuya ecuación es:
y sustituyendo Y — byx (X) por ate, ecuación (6.4, y r (sy /s x) por ecuación (7.4), se
en términos de las puntuaciones estándares, el valor predicho de Y es igual al
deduce que
producto del coeficiente de correlación y la puntuación estándar de X, o sea la predictora.
Coeficiente de correlación y coeficientes b
Al formular las ecuaciones de regresión para el problema ilustrativo en el
Capitule 6 encontramos que:
Para profundizar en estos contenidos consulta la obra completa:
Downie, N. M. (1986). Métodos Estadísticos Aplicados. Harla: México
12
Campus Universitario Virtual de Educación a Distancia CUVED
www.aprendevirtual.com/cuved
Métodos Cuantitativos III. Unidad 1. Análisis de Relación entre Variables
en términos de las puntuaciones estándares, el valor predicho de Yes igual al
producto del coeficiente de correlación y la puntuación estándar de X, o sea la predictora.
Coeficiente de correlación y coeficientes b
Al formular las ecuaciones de regresión para el problema ilustrativo en el
Capitulo 6 encontramos que:
Multiplicando estos dos coeficientes b el resultado es r2:
(.424)(2.05) = .932
.8692 = .8649, dentro del error por redondeo
Por tanto, cuando se establecen ambas ecuaciones de regresión, la
comprobación consiste en multiplicar los dos coeficientes b para ver si el resultado se
aproxima a r2.