Está en la página 1de 13

Unidad 1.

Análisis de Relación entre


Variables  
 
Lectura 1. 
Downie,  N.  M.  (1986).  Coeficiente  de  Correlación  r  de 
Pearson.  Métodos  Estadísticos  Aplicados.  Harla: 
México 
 
 
 
 
 
 
Campus Universitario Virtual de Educación a Distancia CUVED
www.aprendevirtual.com/cuved
Métodos Cuantitativos III. Unidad 1. Análisis de Relación entre Variables

  En el capítulo anterior se obtuvo un coeficiente de correlación, r, para una serie 
de  datos mediante un  proceso laborioso  que trataba  sobre todo con el establecimiento 
de  las  ecuaciones  de  regresión.  En  este  capítulo,  se  describirá  un  método  directo  para 
Tabla de contenido  obtener  r,  junto  con  la  naturaleza,  usos  y  limitaciones  de  la  r  de  Pearson.  Este  valor 
estadístico  es  uno  de  varios  coeficientes  de  ese  tipo  y  también  el  más  frecuente.  En  el 
CONDICIÓN GENERAL DE LOS COEFICIENTES DE CORRELACIÓN ............................. 2  capítulo siguiente, se presentarán otros coeficientes de correlación. 
Relación positiva perfecta .................................................................................... 3  La correlación es básicamente una medida de la relación entre dos variables. Si 
se  observan  algunas  de  las  cosas  comunes  que  se  miden,  se  ve  que,  por  ejemplo,  las 
Relación negativa perfecta................................................................................... 4  calificaciones  altas  en  el  idioma  propio  tienden  a  estar  relacionadas  con  altas 
calificaciones  en  lenguas  extranjeras.  Ambas  tienden  a  estar  asociadas  a  calificaciones 
Otras relaciones ................................................................................................... 4  altas  en  pruebas  de  inteligencia.  En  otros  aspectos,  la  gente  alta  tiende  a  tener  mayor 
Condiciones que intervienen en la interpretación de r ....................................... 5  peso que la gente ‐le baja estatura. El volumen de un gas se relaciona con la presión a la 
cual se mantiene. En el campo de la economía, existe una correlación entre el precio de 
COEFICIENTE DE CORRELACIÓN PRODUCTO‐MOMENTO DE PEARSON .................. 6  ciertos  productos  y  la  cantidad  disponible  para  su  venta.  De  manera  que  en  todos  los 
aspectos  de  la  vida  existen  relaciones  de  un  tipo  o  de  otro.  Debe  advertirse  que  tales 
COEFICIENTES DE CORRELACIÓN Y LA AMPLITUD DE VARIACIÓN .......................... 8  relaciones  no  necesariamente  implican  que  una  sea  causa  de  la  otra.  Este  puede  ser  el 
INTERPRETACIÓN DE UN COEFICIENTE r DE PEARSON ............................................ 9  caso o no. En algunas situaciones se observa que dos variables están relacionadas debido 
a que se asocian o son causadas por una tercera variable. 
PROMEDIO DE LA r DE PEARSON ........................................................................... 10 
OTRAS FÓRMULAS DE REGRESIÓN QUE UTILIZAN r .............................................. 10  CONDICIÓN GENERAL DE LOS COEFICIENTES DE 
Fórmula directa para obtener Y ......................................................................... 11  CORRELACIÓN 
La  mayoría  de  los  coeficientes  de  correlación  señalan  dos  cosas.  Primero,  una 
Ecuación de predicción basada en puntuaciones estándares ........................... 11  indicación  de  la  magnitud  de  la  relación;  vale  la  pena  notar  en  este  punto  que  un 
Coeficiente de correlación y coeficientes b ....................................................... 12  correlación de — 0.88 tiene el mismo tamaño que una de + 0.88; el signo no la magnitud 
de  la  relación,  sino  sólo  indica  el  sentido  de  la  relación.  Cuando  dos  variables  están 
Coeficiente de correlación y coeficientes b ....................................................... 13  directa  o  positivamente  relacionadas,  a  medida  que  aumenta  una,  la`  otra  también  lo 
hace.  Las  puntuaciones  de  pruebas  de  aptitud  se  relacionan  en  forma  positiva  con  las 
calificaciones  académicas.  En  general,  cuanto  mayores  sean  las  puntuaciones  en  una 
prueba  de  aptitud,  tanto  mayores  serán  las  calificaciones  recibidas  en  los  cursos 
regulares. Otras variables están inversamente relacionadas; esto quiere decir que, cuando 
aumenta  una,  la  otra  disminuye.  Como  ejemplo,  consideremos  la  relación  entre  la 
velocidad  a  la  que  se  conduce  un  automóvil  en  la  posición  "tercera"  o  cuarta  de  los 
cambios  y  la  cantidad  de  kilómetros  que  recorre  por  litro  de  combustible:  cuanto  más 
rápido  conduzca  una  persona,  el  rendimiento  de  gasolina  será  menor.  La  ausencia  de 
cualquier  relación  entre  variables  se  denota  por  un  coeficiente  de  correlación  de  0.00, 
Para profundizar en estos contenidos consulta la obra completa:
Downie, N. M. (1986). Métodos Estadísticos Aplicados. Harla: México
2
Campus Universitario Virtual de Educación a Distancia CUVED
www.aprendevirtual.com/cuved
Métodos Cuantitativos III. Unidad 1. Análisis de Relación entre Variables

casi nulo. 
Como  se  observó  anteriormente  las  distribuciones  usadas  en  la  regresión  y  la 
correlación  se  conocen  como  distribuciones  bivariantes;  esto  es,  se  forman  con  valores 
medidos de dos variables. Otro ejemplo de una distribución bivariante se muestra en la 
Tabla 7‐1, en la que se presentan las calificaciones de diez estudiantes en una prueba de 
capacidad académica (X) y una prueba de conocimientos aritméticos (Y). En la figura 7.1 
se  han  graficado  estas  puntuaciones  en  un  diagrama  de  dispersión,  como  se  hizo  en  el 
capítulo  anterior.  Cada  punto  en  la  gráfica  representa  las  dos  puntuaciones  de  una 
persona. Por ejemplo, las del primer estudiante se grafican marcando 130 sobre el eje x y 
18  sobre  el  eje  y.  De  esta  manera  las  dos  puntuaciones  para  cada  estudiante  se 
representan en el diagrama. 

Relación positiva perfecta 
La  figura  7.2  muestra  la  relación  entre  dos  variables.  Obsérvese  que  cualquier 
aumento  de  2  unidades  en  la  variable  X,  produce  un  incremento  correspondiente  de  1 
unidad  en  la  variable  Y.  Esto  es  cierto  para  todos  los  pares  de  valores  de  las  variables. 
Cuando tales pares de valores se grafican, forman una línea recta, y cuando esta recta se 
extiende  desde  la  porción  inferior  izquierda  a  la  superior  derecha  del  diagrama  de 
dispersión, se tiene un ejemplo de relación positiva perfecta. El coeficiente de correlación 
es igual a + 1.00.   
Obsérvese aquí que aun cuando los puntos no coinciden a lo largo de una línea recta, ésta 
TABLA  7.1  PUNTUACIONES  EN  UNA  se sigue manifestando. En la figura 7.5 se tiene un ejemplo de relación negativa baja. En 
PRUEBA  DE  CAPACIDAD  ACADÉMICA  Y  EN  OTRA  este  dispersograma  los  puntos  están  diseminados  por  todas  partes.  Se  aprecia  que  los 
DE CONOCIMIENTOS DE ARITMÉTICA  puntos  caen  en  general  en  una  zona  que  va  desde  la  porción  superior  izquierda  a  la 
  Capacidad  Conocimiento  inferior derecha. Cuando los puntos en el diagrama de dispersión se localizan claramente 
Estudiante  académica  de aritmética  en todas direcciones, no existe relación alguna. 
1  130  18  Al elaborar tales diagramas, el estudiante obtiene una indicación de la magnitud 
2  125  22  del coeficiente de correlación, así como una indicación del sentido de la relación. Esto, en 
3  115  16  parte, es una comprobación general de los cálculos. 
4  108  17   
5  104  14 
6  98  12 
7  92  8 
8  88  10 
9  84  8 
10  80  4 
 
Para profundizar en estos contenidos consulta la obra completa:
Downie, N. M. (1986). Métodos Estadísticos Aplicados. Harla: México
3
Campus Universitario Virtual de Educación a Distancia CUVED
www.aprendevirtual.com/cuved
Métodos Cuantitativos III. Unidad 1. Análisis de Relación entre Variables

 
Una  descripción  más  precisa  de  la  regresión  lineal  es  que  las  puntuaciones 
  medias  de  las  columnas  y  filas  se  localizan  sobre  una  línea  recta.  Supóngase  que  se 
considera una gráfica de dispersión similar a la de la figura 7.4, y que tal disperso‐ grama 
Relación negativa perfecta  contiene,  en  lugar  de  las  puntuaciones  de  10  personas,  las  calificaciones  de  250 
La figura 7.3 es justamente lo opuesto a la anterior. Nótese que para estos datos,  estudiantes.  Empezando  a  la  izquierda  para  una  X  =  0,  es  posible  determinar  la 
cualquier  incremento  de  2  unidades  en  el  eje  x,  produce  una  disminución  corres‐ puntuación  media  Y  para  cada  valor  de  X,  y graficar  esta  media  en  el  dispersograma.  Si 
pondiente de 1 unidad sobre el eje y. Una vez más, esta relación se conserva en toda la  existe regresión lineal, estas medias tenderán a encontrarse en una recta. De manera que 
amplitud de variación. Esta vez los puntos caen en una recta, la cual va desde la porción  la media de cada fila puede determinarse y luego ser graficada. Hay entonces dos líneas 
superior izquierda del dispersograma hasta la parte inferior derecha. Esto representa una  de regresión, excepto cuando r = 1, o sea, cuando coinciden. 
relación  negativa  perfecta,  con  valor  del  coeficiente  de  correlación  igual  a  —  1.  Esto   
significa que la persona con calificación más alta en la variable X tenía la puntuación más 
baja en la variable Y. La segunda en puntuación más alta en la X fue la segunda más baja 
en Y, y finalmente, la más baja en X fue la más alta en Y. 

Otras relaciones 
En la práctica generalmente se tienen casos en los que la relación no es perfecta. 
La figura 7.4 muestra el diagrama de dispersión de una correlación positiva muy alta. 

Para profundizar en estos contenidos consulta la obra completa:


Downie, N. M. (1986). Métodos Estadísticos Aplicados. Harla: México
4
Campus Universitario Virtual de Educación a Distancia CUVED
www.aprendevirtual.com/cuved
Métodos Cuantitativos III. Unidad 1. Análisis de Relación entre Variables

  
 
  En el grado en que los datos no son lineales, disminuye el valor de la r calculada. 
Condiciones que intervienen en la interpretación de r  El  valor  de  r  refleja  el  grado  de  variancia  que  puede  ser  explicado  mediante  una  recta, 
sean los datos esencialmente lineales o no. Es posible que una relación muy alta, pero no 
Antes de que se calcule r, debe examinarse el diagrama de dispersión y a veces  lineal,  parezca  ser  muy  baja  con  base  en  la  r  de  Pearson.  Sin  embargo,  cuando  una 
poner a prueba los datos para verificar si se cumplen dos condiciones. La primera es ver si  relación  bivariante  es  principalmente  curvilínea,  puede  utilizarse  el  coeficiente  eta,  ri, 
existe regresión lineal (también conocida como regresión rectilínea). Esto significa que los  llamado  algunas  veces  razón  de  correlación.  Este  coeficiente,  refleja  la  variancia 
puntos  del  diagrama  de  dispersión  tienden  a  agruparse  en  una  recta.  Esto  es  lo  que  representada  mediante  la  línea  de  mejor  ajuste,  ya  sea  curva  o  recta,  y  se  estudia  en 
ocurre con los datos mostrados en las figuras 7.1, 7.2, 7.3 y 7.4. Sin embargo, en la figura  textos más avanzados. 
7.6  se  observa  que,  empezando  por  la  parte  inferior  izquierda,  conforme  aumenta  la   
variable Y, también lo hace la variable X; pero a medida que X continúa incrementándose, 
Y,  empieza  a  disminuir;  aún  más,  cuando  I  X  sigue  en  aumento,  Y  sigue  disminuyendo. 
Esta  relación  se  conoce  por  regresión    curvilínea,  Tales  relaciones  no  son  infrecuentes. 
Consideremos  las  capacidades  corporales  motoras:  a  medida  que  crecemos,  podemos 
correr con más rapidez, después viene un periodo en el que no ocurre ningún aumento, y 
luego a medida que se envejece, la rapidez de locomoción se reduce notablemente. 
 

Para profundizar en estos contenidos consulta la obra completa:


Downie, N. M. (1986). Métodos Estadísticos Aplicados. Harla: México
5
Campus Universitario Virtual de Educación a Distancia CUVED
www.aprendevirtual.com/cuved
Métodos Cuantitativos III. Unidad 1. Análisis de Relación entre Variables

COEFICIENTE DE CORRELACIÓN PRODUCTO­
MOMENTO DE PEARSON 
De los diversos coeficientes de correlación que existen, el que se utiliza con más 
frecuencia  se  denomina  coeficiente  de  correlación  producto‐momento  de  Pearson,  cuyo 
  símbolo es también r. La magnitud de este coeficiente de correlación varía de +1a0y‐1. 
La  segunda  condición que debe  buscarse es la homoscedasticidad, mencionada  La r de Pearson se definió originalmente como: 
en  el  capítulo  anterior.  Esto  significa  que  la  tendencia  a  la  igualdad  de  las  desviaciones 
estándares  (o  variancias)  y  de  las  ordenaciones  (columnas  y  filas).  En  la  figura  7.7  se 
presentan  tres  diagramas.  En  a  la  variancia  de  las  columnas  próximas  al  centro  de  la 
distribución X es menor que la de las columnas de los extremos. En el diagrama b todas   
lo  que  quiere  decir  que  la  r  de  Pearson  es  la  media  del  producto  de  las 
las columnas de la izquierda tienen menores variancias que las del centro y que las de la 
puntaciones z. A fin de obtener una r para un conjunto de datos mediante este método, 
derecha.  El  diagrama  c  representa  el  caso  en  el  que  se  cumplen  ambas  condiciones.  Se 
se  convierte  toda  puntuación  en  cada  distribución  en  una  puntuación  z  después  de 
observa  que  los  puntos  tienden  a  formar  una  elipse  alrededor  de  la  línea  de  regresión. 
obtener  las dos  medias y  las  dos  desviaciones  estándares.  Posteriormente,  las dos  pun‐
Cuando  los  datos  no  son  homoscedásticos,  no  son  aplicables  los  métodos  usuales  de 
tuaciones z para cada caso se multiplican y se suman los productos. La suma obtenida se 
evaluación de los valores predichos sobre el eje y a partir de los valores correspondientes 
divide luego entre el número de personas, N, y el cociente es la r de Pearson. Esta no es 
sobre  el  eje  x.  Por  ejemplo,  en  el  diagrama  a  sería  posible  realizar  predicciones  en  el 
una fórmula tan práctica como las demás fórmulas y métodos que han aparecido desde la 
centro de la distribución X con mayor precisión que en cualquiera de los extremos. 
época de Pearson. 
Mediante diversas operaciones algebraicas, la ecuación (7.1) se transforma en la 
siguiente ecuación, que se adapta bien para su manejo en una calculadora de bolsillo o en 
otros dispositivos electrónicos. 

Para profundizar en estos contenidos consulta la obra completa:


Downie, N. M. (1986). Métodos Estadísticos Aplicados. Harla: México
6
Campus Universitario Virtual de Educación a Distancia CUVED
www.aprendevirtual.com/cuved
Métodos Cuantitativos III. Unidad 1. Análisis de Relación entre Variables

 
El  uso  de  esta  ecuación  se  demostrará  mediante  los  datos  provenientes  de  la 
Tabla  7.1  los  que  se  han  reproducido  en  la  Tabla  7.2.  Para  facilitar  el  trabajo,  y  no 
sobrecargar la calculadora, cada valor de la columna 1 se codifica restando una constante 
80 a cada puntuación, y a cada otra en la columna 2 se le resta 4. Los valores asociados a 
estas puntuaciones codificadas se convierten en las X y Y de la ecuación (7.2). Este tipo de 
codificación  no  afecta  la  magnitud  del  coeficiente  de  correlación.  Por  tanto,  cada  X  se 
eleva al cuadrado, columna (5), cada Y se eleva al cuadrado también, columna (6); y cada 
X  se  multiplica  por  la  Y  correspondiente,  colocándose  el  producto  en  la  columna  (7). 
Posteriormente  se  suman  los  datos  de  las  columnas  (3)  a  (7)  y  la  suma  se  coloca  en  la 
fórmula  (7.2).  En  toda  correlación,  N  siempre  representa  el  número  de  pares  de 
puntuaciones, o el número de personas. 
 
TABLA 7.2 DETERMINACIÓN DEL COEFICIENTE r DE PEARSON PARA LOS DATOS DE LA  Los  valores  pueden  simplificarse  redondeando  cada  media  y  utilizándola  como 
TABLA 7.1  constante  para  la  resta.  Sin  embargo,  esto  resultaría  en  valores  negativos  que  podrían 
      dificultar el trabajo. 
(1)  (2)  (3)  (4)  (5) (6) (7) Cuando  se  calcula  r,  las  medias  y  las  desviaciones  estándares  de  las  dos  distri‐
X  Y  X— 80  Y‐ 4  X2 Y2 XY buciones se obtienen de los datos disponibles. Esto se realiza como sigue, utilizando los 
130  18  50  14  2500 196 700 datos que se han codificado al restarles las constantes Cx = 80 y Cy = 4. 

125  22  45  18  2025 324 810


115  16  35  12  1225 144 420
108  17  28  13  784 169 364
104  14  24  10  576 100 240
98  12  18  8  324 64 144
92  8  12  4  144 16 48
88  10  8  6  64 36 48
 
84  8  4  4  16 16 16 La desviación estándar se obtiene por la siguiente fórmula: 
80  4  0  0  0 0 0 Nótese que ya se han calculado los valores dentro del radical, siendo éstos el pri‐
    5=224  5=89  5=7658. 5=1065 mero  y  el  segundo  términos  del  denominador  de  la  fórmula  para  la  r  de  Pearson.  De 
modo  que  el  valor  de  este  término  se  reduce  a  una  sola  cifra,  luego  se  extrae  su  raíz 
cuadrada y se le multiplica por el recíproco de N. De esta manera: 

Para profundizar en estos contenidos consulta la obra completa:


Downie, N. M. (1986). Métodos Estadísticos Aplicados. Harla: México
7
Campus Universitario Virtual de Educación a Distancia CUVED
www.aprendevirtual.com/cuved
Métodos Cuantitativos III. Unidad 1. Análisis de Relación entre Variables

 
Adviértase que la correlación entre X y Y es la misma que la correlación entre Y y 
X; esto es, rxy = ryz 

COEFICIENTES DE CORRELACIÓN Y LA AMPLITUD 
DE VARIACIÓN 
En la figura 7.8 se grafican las puntuaciones de un grupo sometido a una prueba 
predictiva según sus calificaciones en cierta tarea utilizadas como criterio de evaluación. 
Considerando  la  figura  conjunto  es  evidente  que  existe  una  relación  positiva  entre  las 
puntuaciones y el criterio de predicción. En realidad la correlación es 0.6. La figura se ha 
dividido en tres partes; las puntuaciones altas en la predicción, a la derecha de la línea B; 
las bajas, a la izquierda de la línea A: y las de nivel promedio, entre A y B. Cuando las tres 
partes se consideran por separado es mucho menor la correlación entre las dos variables, 
de cada parte. Obsérvese que los puntos no conforman ninguna elipse y se diseminan por 
 
toda el área. Tal dispersión indica una baja correlación.  FIGURA 7.8 Diagrama que representa el efecto en r de la amplitud de variación 
Los  resultados  de  restringir  la  amplitud  de  variación  obtenidos  al  seleccionar  restringida (Fuente: Restriction of range: Questions and Answers. Test Service Bulletin No. 
conforme a las puntuaciones de prueba son considerables e importantes. Supóngase que  59, New York: The Psychological Corporation, 1972.) 
una universidad admite sólo a quienes califiquen a la derecha de la línea B en esta prueba  En ocasiones se tienen pruebas selectivas donde los coeficientes de correlación 
predictiva.  Dado  que  el  criterio  de  evaluación,  las  calificaciones  de  los  estudiantes  de  deben  corregirse  según  amplitudes  de  variación  restringidas.  Supóngase  que  se 
primer  ingreso,  se  correlacionarán  sólo  con  respecto  a  las  puntuaciones  altas  de  consideran las pruebas de selección para ingresar en la Fuerza Aérea de Estados Unidos. 
predicción,  el  coeficiente  resultante  probablemente  será  muy  bajo.  Las  personas  cuyas  Para ingresar en la escuela de aviación, una persona tiene que aprobar una serie rigurosa 
puntuaciones están a la izquierda de la línea B, no fueron seleccionadas, y por tanto, no  de  exámenes.  Quienes  obtengan  bajas  o muy bajas  calificaciones no  son  admitidos. Los 
existe  criterio  de  evaluación  para  ellos.  Cuando  se  utilizan  estas  pruebas  predictivas,  se  cadetes  del  aire  son,  por  consiguiente,  un  grupo  selecto.  Después  de  haber  sido 
debe  advertir  que  el  examen  ya  ha  realizado  su  función,  dado  que  muchos  estudiantes  seleccionados,  se  les  somete  a  diversos  entrenamientos  y  pruebas,  y  durante  este 
con  baja  puntuación  no  fueron  admitidos  en  esa  universidad.  Ejemplos  como  éste  periodo, algunos abandonan los estudios o son descartados. Por último, se tiene un grupo 
abundan en la operación de instituciones educativas, industriales y militares. Cuando se  más selecto aún que consigue su ingreso al servicio activo. Si se aplicaran al grupo final de 
llevan a cabo investigaciones con personas que han pasado por un proceso de selección,  cadetes las pruebas de selección, se encontraría que los coeficientes de correlación eran 
los  estudios  correlacionales  de  sus  características  y  desempeños  es  probable  que  muy bajos. Sin embargo, existen fórmulas para considerar éstas situaciones, y su empleo 
produzcan resultados mucho más bajos que cuando las mismas variables se utilizan con  permite  corregir  los  coeficientes  obtenidos  para  una  amplitud  de  variación  restringida. 
personas de grupos no seleccionados.  Tales  ecuaciones  pueden  encontrarse  en  la  obra  de  Guilford  y  Fruchter  (1973,  pp.  315‐
Para profundizar en estos contenidos consulta la obra completa:
Downie, N. M. (1986). Métodos Estadísticos Aplicados. Harla: México
8
Campus Universitario Virtual de Educación a Distancia CUVED
www.aprendevirtual.com/cuved
Métodos Cuantitativos III. Unidad 1. Análisis de Relación entre Variables

316).  zapato y la calificación en la prueba de Estadística. Los resultados serían desconcertantes, 
La  variabilidad  del  grupo,  expresada  en  términos  de  desviaciones  estándares  o  pues no hay motivo para que exista alguna correlación entre el tamaño de los pies de una 
de variancias, debe considerarse cuando se obtienen los coeficientes de correlación. Esto  persona y sus calificaciones en Estadística. El profesor podría repetir este estudio durante 
proporciona información acerca de la naturaleza del grupo sobre el que se recopilaron los  los  próximos  30 años y nunca volvería a  obtener tales resultados nuevamente. La única 
datos, y ayuda en gran medida a la interpretación de tales coeficientes.  forma de considerar está r de 0.92 es simplemente como resultado del azar. 
El hecho de que es la amplitud de variación y no el tamaño de la muestra lo que  Se  indicó  antes  que  los  coeficientes  1e  correlación  se  interpretan  de  manera 
afecta  la  magnitud  de  r,  puede  demostrarse  eligiendo  a  una  persona  de  la  columna  relativa al referirnos a coeficientes altos, moderados o bajos. Sin embargo, la mejor forma 
izquierda  en  la  figura  7.8,  y  después  seleccionar  un  punto  o  dos  de  cada  columna  de  evaluar  una  r  es  mediante  el  coeficiente  de  determinación  (r2).  Esto  se  explicó  en  el 
conforme se recorre la figura. De esta manera, aun cuando se eligirán menos puntos, los  Capítulo 6. Cuando r = 0.40, el coeficiente de determinación vale: r2 = 0.16. En este caso, 
escogidos  se  ubicarán  en  una  elipse,  lo  cual  indica  un  coeficiente  de  correlación  16% de la variancia en X es explicada por Y o viceversa. Esta r = 0.40 no es infrecuente en 
razonablemente alto.  los  estudios  de investigación. En este caso, el 84% de la variancia no  se  puede explicar. 
Esto  es  muy  importante  de  tener  en  cuenta  cuando  se  consideran  correlaciones  bajas. 
Supóngase que una r = 0.10 se obtiene entre dos variables. Por tanto, r2 = 0.01. En este 
INTERPRETACIÓN DE UN COEFICIENTE r DE  caso  no  es  posible  explicar  99%  de  la  variancia,  debido  a  factores  diferentes  al 
PEARSON  considerado.  Cuando  se  considerán  la  significancia  estadística,  puede  observarse  que 
Como se señaló anteriormente, un coeficiente de correlación es una medida de  este  coeficiente  de  O  es  estadísticamente  significante.  No  obstante,  la  significancia 
la relación entre dos variables. En la práctica, una r de 0.8 o más se considera un coefi‐ estadística le no tener valor cuando se considera el uso práctico de dicho valor estadístico 
ciente  alto,  una  r  de  aproximadamente  0.5  se  considera  moderada,  y  una  r  de  0.3  o  un método de predicción. 
menos  se  considera  un  coeficiente  bajo.  Téngase  presente  que  una  r  de  Pearson  no  es  En  el  Capítulo  18,  que  se  refiere  a  la  evaluación  educativa  y  psicológica,  se, 
una  medida  de  causalidad,  aunque  en  algunos  casos,  puede  existir  una  relación  causal  presentan algunas aplicaciones importantes de los coeficientes de correlación. a de éstas 
entre  las  dos  variables.  La  persona  que  emplea  estos  datos  tiene  que  hacer  se  describe  como  la  confiabilidad  de  un  instrumento  de  medición.  Una  definición  de 
interpretaciones acerca de la causalidad.  confiabilidad es como la consistencia de las puntuaciones de Cebas a través del tiempo. 
También  pueden  parecer  relacionadas  simplemente  porque  están  asociadas  a  Por ejemplo, si se somete a  las mismas personas a una Ceba de inteligencia ahora y un 
una  tercera.  El  ingreso  monetario  es  un  ejemplo  de  una  variable  que  origina  tales  mes después, se debe esperar una alta correlación entre las dos series de calificaciones —
complicaciones.  Los  ingresos  en  diversas  comunidades  o  sociedades  (variables  A),  se  por ejemplo, 0.9 o más— si la prueba ;considera que produce resultados confiables. Otro 
correlacionan  positivamente  con  la  cantidad  de  dinero  gastado  en  educación  en  las  uso importante de los coeficientes de correlación es en el estudio de la validez predictiva 
comunidades.  La  variable  C,  la  cantidad  gastada  de  en  bebidas  alcohólicas  (variable  C),  de una prueba. En caso, las calificaciones de un examen se correlacionan con el criterio de 
también está correlacionada con los ingresos mencionados (variable A). Asimismo, puede  evaluación.  Un  ejemplo  de  esto  es  la  correlación  de  puntuaciones  en  la  Prueba  de 
demostrarse que existe una correlación positiva entre las variables B y C. Esto se debe a  Aptitudes Académicas de la comisión examinadora de admisión con la calificación medio 
que ambas variables están relacionadas con la tercera, o sea, A. Cuando se suprimen los  de los alumnos de primer grado. Normalmente la correlación en situaciones como ésta se 
efectos de esta tercera variable, parece haber poca relación entre la cantidad gastada en  encuentra  entre  0.4  y  0.6,  aunque  en  muchas  es  menor.  Lo  importante  es  que  la 
educación y lo gastado en bebidas embriagantes.  magnitud de la correlación en sí no es lo más significativo, sino aso o finalidad a los que se 
Puede considerarse otro grupo de coeficientes de correlación  como falso o ba‐ aplica,  lo  que  determina  el  proceso  de  evaluación.  i  de  esperar  altos  coeficientes  de 
sado  en  el  azar.  Supóngase  que  un  profesor  de  estadística  determinó  el  tamaño  del  correlación en ciertas situaciones, y pueden tolerarse mucho menores en otras. 
calzado  de  cada  uno  de  los  alumnos,  y  correlacionó  estos  valores  con  la  calificación 
obtenida  en  el  último  examen  del  curso;  obtuvo  asi  una  r  de  0.92  entre  el  tamaño  de 
Para profundizar en estos contenidos consulta la obra completa:
Downie, N. M. (1986). Métodos Estadísticos Aplicados. Harla: México
9
Campus Universitario Virtual de Educación a Distancia CUVED
www.aprendevirtual.com/cuved
Métodos Cuantitativos III. Unidad 1. Análisis de Relación entre Variables

PROMEDIO DE LA r DE PEARSON 
Lo  que  los  coeficientes  r  de  Pearson  no  son  unidades  uniformes,  no  deben  ser 
su‐ los o promediados. Para determinar un coeficiente de correlación promedio, se vierte 
cada r  a su  Z utilizando la tabla  del  Apéndice G; luego se promedian es‐ valores  de Z, y 
mediante la misma tabla, se vuelve a convertir esta Z en una r, representa la r promedio. 
Por  ejemplo, veamos la  tabla que se presenta  a continuación. La suma y  la media en la 
culumna  r  indican  la  diferencia  entre  las  dos  ticas.  Si  las  r  fueran  muy  similares  en 
magnitud sería poco útil emplear esta lita. Asimismo, si todas fueran pequeñas, podrían 
promediarse, ya que la a del Apéndice G señala que hasta para una r de 0.25, los valores 
de r y de Z muy semejantes. 

 
Un procedimiento más preciso consiste en ponderar cada Z multiplicándola por 
N  —  3.  Estos  resultados  se  suman,  y  si  se  tratara  de  promediar  cuatro  Z,  esta  suma  se 
dividiría  luego  entre  (N1  —  3)  +  (N2  —  3)  (N3  —  3)  +  (N4  —  3).  Esta  Z  ponderada  se 
transformaría a continuación en una r por medio del contenido del Apéndice G. 
Un procedimiento más preciso consiste en ponderar cada Z
multiplicándola por N — 3. Estos resultados se suman, y si se tratara de promediar
cuatro Z, esta suma se dividiría luego entre (N1 — 3) + (N2 3) (N3 3) + (N4— — —

3). Esta Z ponderada se transformaría a continuación en una r por medio del


contenido del Apéndice G.

OTRAS FÓRMULAS DE REGRESIÓN QUE UTILIZAN 

En el Capítulo 6, el coeficiente b se definió como:

 
Para profundizar en estos contenidos consulta la obra completa:
Downie, N. M. (1986). Métodos Estadísticos Aplicados. Harla: México
10
Campus Universitario Virtual de Educación a Distancia CUVED
www.aprendevirtual.com/cuved
Métodos Cuantitativos III. Unidad 1. Análisis de Relación entre Variables

dado que se acaba de demostrar que el numerador es igual a Ixy, y el primer tér‐
mino en el denominador es /x2, ya que el segundo término en el denominador es /y2, al 
sustituir resulta: 

  Ecuación de predicción basada en puntuaciones 
Dividiendo ambos términos contenidos en el radical entre N:  estándares 

 
Entonces 

 
establece que el coeficiente b al inferir Y a partir de X es igual al producto del 
coeficiente de correlación y la razón de las dos desviaciones estándares. 
De modo similar: 

Fórmula directa para obtener Y 
Empezando con la línea de regresión, cuya ecuación es: 

 
y sustituyendo Y — byx (X) por ate, ecuación (6.4, y r (sy  /s x) por  ecuación (7.4), se   
en  términos  de  las  puntuaciones  estándares,  el  valor  predicho  de  Y  es  igual  al 
deduce que 
producto del coeficiente de correlación y la puntuación estándar de X, o sea la predictora. 

Para profundizar en estos contenidos consulta la obra completa:


Downie, N. M. (1986). Métodos Estadísticos Aplicados. Harla: México
11
Campus Universitario Virtual de Educación a Distancia CUVED
www.aprendevirtual.com/cuved
Métodos Cuantitativos III. Unidad 1. Análisis de Relación entre Variables

Coeficiente de correlación y coeficientes b 
Al formular las ecuaciones de regresión para el problema ilustrativo en el 
Capitule 6 encontramos que: 

 
Para profundizar en estos contenidos consulta la obra completa:
Downie, N. M. (1986). Métodos Estadísticos Aplicados. Harla: México
12
Campus Universitario Virtual de Educación a Distancia CUVED
www.aprendevirtual.com/cuved
Métodos Cuantitativos III. Unidad 1. Análisis de Relación entre Variables

en  términos  de  las  puntuaciones  estándares,  el  valor  predicho  de  Yes  igual  al 
producto del coeficiente de correlación y la puntuación estándar de X, o sea la predictora. 

Coeficiente de correlación y coeficientes b 
Al  formular  las  ecuaciones  de  regresión  para  el  problema  ilustrativo  en  el 
Capitulo 6 encontramos que: 

 
Multiplicando estos dos coeficientes b el resultado es r2: 
(.424)(2.05) = .932 
.8692 = .8649, dentro del error por redondeo 
Por  tanto,  cuando  se  establecen  ambas  ecuaciones  de  regresión,  la 
comprobación  consiste  en  multiplicar  los  dos  coeficientes  b  para  ver  si  el  resultado  se 
aproxima a r2. 

Para profundizar en estos contenidos consulta la obra completa:


Downie, N. M. (1986). Métodos Estadísticos Aplicados. Harla: México
13

También podría gustarte