Está en la página 1de 13

PRACTICA 3

Manual de prácticas Bioestadísticas II Correlación

ITBOCA

Práctica 3
Correlación
Competencias.
Identificar las formas que existen para la transformación de datos.
Distingue el análisis de correlación.
Analiza los diferentes modelos de correlación para determinar bajo ciertas condiciones de las
variables a manipular.

Introducción:
Cuando estamos interesados en ver si existe una relación o una asociación entre dos variables, por
ejemplo la relación entre el pH del agua de mar y la producción de algas en un área marina
determinada, entonces podemos aplicar un índice numérico que nos provea información acerca de
la relación de estas dos variables como el coeficiente de correlación de Pearson. El rango de valores
de este índice estará entre menos uno (-1) y uno (1), pasando por cero. Los coeficientes cercanos a
-1 o +1 indican una fuerte relación lineal, mientras los valores cercanos a cero indican una relación
lineal débil. Para establecer la correlación entre dos variables cuantitativas, x e y podemos hacerlo
aplicando la fórmula.

x y
 xy 
r n

 x2 
 x 2 
  y 2 
 y 2 

 n  n 
  

El valor de xy es el único dato que no habíamos calculado antes. Se obtiene multiplicando
cada valor de x por el valor de y correspondiente y sumamos los productos. El numerador en la
ecuación se llama covarianza y mide cuanto de x ey varían juntos. Reconocerás el denominador
como la raíz cuadrada del producto de las sumas de los cuadrados de las variables x ey.
PRACTICA 3
Manual de prácticas Bioestadísticas II Correlación ITBOCA

Correspondencia de la práctica
Esta práctica está vinculada a la unidad II con los conocimientos de los temas de Correlación,
Regresión lineal simple, Introducción a la regresión no lineal, Regresión múltiple, Transformación y
linealización de datos.
Material y equipo necesario
Computadora cargada con Excel 2007
Base de datos

Metodología
Ejemplo de Problema de investigación

Fueron colectados los datos de una muestra al azar de 11 iguanas grávidas incluyendo su
peso postparto y el número de huevos que cada una produce. Los resultados se dan en la
tabla 8.1 la gráfica de estos datos se muestra en la figura 8.1

Diagramas de dispersión
El primer paso para identificar el tipo de relación que pueda existir entre dos variables es
dibujar una imagen. En el conjunto de datos es representado por un punto en el diagrama de
dispersión. La variable explicativa se grafica en el eje horizontal y la variable de respuesta se grafica
en el eje vertical. Los datos bivariados pueden representarse gráficamente mediante un diagrama
de dispersión, el cual podemos definir cómo un gráfico que muestra la relación entre dos variables
cuantitativas medido en el mismo individuo.

1.- Introducir los datos en una hoja de cálculo de Excel como se muestra en el ejemplo anterior.

Número de Masa (en Número de


especimen Kg) huevos

1 0.9 33
2 1.55 50
3 1.3 46
4 1 33
5 1.55 53
6 1.8 57
7 1.5 44
8 1.05 31
9 1.7 60
10 1.2 40
11 1.45 50
PRACTICA 3
Manual de prácticas Bioestadísticas II Correlación ITBOCA

2.- Seleccione todos los datos y haga clic en Insertar en la barra de herramientas y seleccione del
grupo de Gráficos, el de Dispersión.

3.-Seleccione el primer diagrama de la fila de arriba.

4.-Vamos a mover el gráfico a una nueva hoja. Haga clic con el botón derecho en el espacio en blanco
del gráfico cerca del borde y seleccione Mover Gráfico del menú que aparece.

5.-Seleccione hoja nueva y haga clic en Aceptar.


PRACTICA 3
Manual de prácticas Bioestadísticas II Correlación ITBOCA

6.- Este gráfico ya tiene un título de gráfico en la parte superior (la madre) y una leyenda en el
derecho. Cambiemos el título de gráfico, eliminar la leyenda, y agregar un título al eje Y,
y el eje X. Comencemos con el título de gráfico. Haga un clic sobre la palabra Biomasa gr/m2 de
manera que aparece dentro de un marco.

Correlación de numero de huevos/Masa (en Kg)


70

60

50

40

30

20

10

0
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2

7.- Eliminar Numero de huevos y reemplazarla por Correlación de numero de huevos/Masa (en
Kg)

8.- Haga clic con el botón derecho en el espacio en blanco del gráfico cerca del borde y seleccione
el cuadrito con la cruz verde del menú que aparece Seleccionar títulos de ejes en el grupo de
Etiquetas de ELEMENTOS DE GRAFICO. Seleccione horizontal primario, y elija Título bajo el eje.
PRACTICA 3
Manual de prácticas Bioestadísticas II Correlación ITBOCA

09.- Eliminar título de Eje y reemplazarla por Masa (en Kg)

10.- Seleccione en la opción Agregar elemento de gráfico, Título del eje Vertical primario y elija
Título girado.

12.- Borre el título del eje y sustitúyalo por Número de huevos.

El diagrama de dispersión ya terminado se muestra abajo.


PRACTICA 3
Manual de prácticas Bioestadísticas II Correlación ITBOCA

Modificación de la gráfica de dispersión


Aunque esta dispersión es acertada, es poco atractiva, principalmente debido a la gran
cantidad de espacio en blanco en la parte media de la dispersión de los puntos. Esto se puede
modificar además de otros aspectos de la gráfica.

Formato eje de las X. El valor más bajo de la lluvia en el conjunto de datos fue de 0.9, por lo
tanto vamos a usar 0.8 como el valor mínimo en la escala del eje de las X.

1. Mueva el puntero hacia el área del gráfico que contiene la escala del eje X (0 a 100). Haga clic con
el botón derecho del ratón sobre cualquier valor del eje de las X. En esta práctica se hizo clic sobre
100 Seleccione Dar formato al eje.

2. En Opciones de Eje, sobre limites mínimo escriba 0 .1 en la ventana. Haga clic en Cerrar.

Formato eje de las Y. El valor más bajo de el Num. De huevos en el conjunto de datos fue
de 33, por lo tanto vamos a usar 30 como el valor mínimo en la escala del eje de las Y.

3. Mueva el puntero hacia el área del gráfico que contiene la escala del eje Y (0 a 100). Haga clic con
el botón derecho del ratón sobre cualquier valor del eje de las Y. En esta práctica se hizo clic sobre
20. Seleccione Dar formato al eje.

4. Escriba 33 en la ventana. Haga clic en Cerrar.


PRACTICA 3
Manual de prácticas Bioestadísticas II Correlación ITBOCA

5. Líneas de cuadrícula. Haga clic en Agregar elemento de grafico cerca de la parte superior de la
pantalla y seleccione Líneas de la cuadrícula en Grupo Ejes.

6. Seleccione Líneas de cuadrícula, luego líneas verticales de la cuadrícula primaria. (Pudo haber
escogido también las líneas horizontales de la cuadrícula primaria).

7. Líneas de tendencia. Vamos a agregar una línea de tendencia. Agregar elemento de grafico cerca
de la parte superior de la pantalla y seleccione Línea de tendencia. Opción Lineal.

8. Lineal. Podía ser preseleccionada. Al fondo de la caja de dialogo se observa un despliegue de


opciones. Haga clic en mas Opciones de línea de Tendencia navegue hacia abajo hasta encontrar el
recuadro Presentar el valor de R cuadrado en la gráfica y selecciónelo.
PRACTICA 3
Manual de prácticas Bioestadísticas II Correlación ITBOCA

El valor de R2 (0.96) fue arrastrado y colocado en la parte media de la gráfica para poderse
leer.
La gráfica de dispersión ya terminada se muestra abajo. Podrían hacerse otras modificaciones, como
el tamaño de la fuente, el estilo o la forma de los puntos de la gráfica. Para hacer esto sólo haga clic
con el botón derecho del ratón en el objeto que usted quiera cambiar y seleccione las opciones del
menú que aparecerá.

Interpretando la gráfica de dispersión.


Como se muestra en esta gráfica el valor de r se espera que sea positivo, lo cual significa que entre
más masa tenga el organismo mayor numero de huevos. R2 es el coeficiente de asociación entre la
dos variables, esto quiere decir que entre más grande es el valor de R cuadrado mayor será la
asociación entre ambas variables.
PRACTICA 3
Manual de prácticas Bioestadísticas II Correlación ITBOCA

Ahora vamos a medir matemáticamente la fuerza de la asociación lineal entre estas dos
variables.

Función Coeficiente de Correlación


La función COEF. DE CORREL. de Excel devuelve el valor de r de Pearson para cualquiera de las dos
variables cuantitativas en un conjunto de datos.

1. Regrese a la hoja de Excel que contiene los datos. Haga clic en la hoja 1 en la pestaña del fondo
de la pantalla en su hoja de Excel.

2. Vamos a determinar la correlación entre el promedio mensual de lluvia y el promedio de la


biomasa mensual. Escriba la etiqueta masa-huevos en la celda A 14.

Haga más amplia la columna A a fin de que toda la etiqueta aparezca en la pantalla.

3. Active la celda B14 donde el valor de r será colocado.

4. Haga clic en la ficha Fórmulas, cerca de la parte superior de la pantalla y seleccione Insertar
función.

5. En el cuadro de diálogo Insertar función, seleccione la categoría estadística, seleccione la función


COEF. DE CORREL y haga clic en Aceptar.
PRACTICA 3
Manual de prácticas Bioestadísticas II Correlación ITBOCA

6. Haga clic en la ventana de la matriz 1. Seleccione con un clic y arrastre de la celda A1 a la celda
A10. Si prefiere, puede ingresar manualmente A1:A12 en la ventana.

La inclusión de la columna etiqueta, celda A 1 en este ejemplo, es opcional

7. Haga clic en la ventana de la Matriz 2. Seleccione con un clic y arrastre de la celda B1 a la celda
B10. Si prefiere, puede ingresar manualmente B1:B10 en la ventana.

8. Haga clic en Aceptar y el valor del coeficiente de correlación de Pearson de 0.95181834

será devuelto en la celda B 14 de la hoja de Excel.


PRACTICA 3
Manual de prácticas Bioestadísticas II Correlación ITBOCA

Interpretando la hoja de resultados

Ya que r es 0.95181834 significa que hay asociación entre la masa de los organismos y el
numero de huevos En otras palabras esperamos que entre mayor biomasa mayor num de huevos.
¿Pero cómo podemos saber si este valor de r del coeficiente de Pearson es fuerte o débil?

PRUEBA DE SIGNIFICANCIA DE r.

El coeficiente de correlación es una medida de la fuerza de la relación entre dos variables;


no es una prueba de significancia de la relación, sin embargo mucha gente parece tratarlo
de esa manera. Un valor de r cercano a uno, como se obtuvo en el análisis previo, indica
una fuerte relación, mientras que un valor bajo de r indica una débil relación. Ninguna de
las dos es necesariamente más significativa que la otra, en sentido estadístico. Sin embargo
la relación puede ser débil, con un valor bajo de r, y puede que ninguno de los sea
absolutamente significativo.

Recuerde que en la hipótesis nula en un Análisis de Correlación, el coeficiente de


correlación de la población es cero. El coeficiente de correlación de la muestra r, es un
estimado de este coeficiente de correlación de la población. Cuando la hipótesis nula es
que la correlación de la población es cero (el caso común), r tiene una distribución de tablas
con n-2 grados de libertad. Calculamos t como:

n2
t=r
1 r2

9
para el ejemplo t = = 0.952 = 9.315
1  0.906

El valor crítico de t para alfa = 0.05 y 9 grados de libertad es 2.262 para una probabilidad de dos
colas. Podemos por lo tanto, rechazar la hipótesis nula y concluir que las dos variables están
correlacionadas.
Una forma alternativa de determinar si r es significativo, es consultando la tabla A.8 “Valores
Críticos del Coeficiente de Correlación Pearson r. Esta tabla muestra los valores mínimos
de r que permiten rechazar la hipótesis nula. Si el valor calculado de r es igual o más grande
que el valor tabular para los grados de libertad específicos (n-2) la hipótesis nula es
rechazada.
PRACTICA 3
Manual de prácticas Bioestadísticas II Correlación ITBOCA

Para probar si la correlación entre las variables de respuesta y la explicativa es fuerte, tome
el valor absoluto de r, compare si el valor absoluto del coeficiente de correlación es más grande que
el valor critico de las tablas de probabilidad de los valores de r anexa, para una muestra dada,
podemos decir que hay una correlación lineal entre las dos variables, de forma contraria no existe
una correlación lineal.

Table of Critical values for Pearson correlation

Two-Tailed Probabilities

N 0.1 0.05 0.01 0.001

4 0.900 0.950 0.990 0.999

5 0.805 0.878 0.959 0.991

6 0.729 0.811 0.917 0.974

7 0.669 0.754 0.875 0.951

8 0.621 0.707 0.834 0.925

9 0.582 0.666 0.798 0.898

4 0.549 0.632 0.765 0.872

10 0.549 0.632 0.765 0.872

11 0.521 0.602 0.735 0.847

12 0.497 0.576 0.708 0.823

13 0.476 0.553 0.684 0.801

14 0.458 0.532 0.661 0.780

15 0.441 0.514 0.641 0.760

4 0.412 0.482 0.606 0.725

16 0.426 0.497 0.623 0.742

17 0.412 0.482 0.606 0.725

18 0.400 0.468 0.590 0.708

19 0.389 0.456 0.575 0.693

20 0.378 0.444 0.561 0.679

21 0.369 0.433 0.549 0.665

4 0.344 0.404 0.515 0.629


PRACTICA 3
Manual de prácticas Bioestadísticas II Correlación ITBOCA

22 0.360 0.423 0.537 0.652

23 0.352 0.413 0.526 0.640

24 0.344 0.404 0.515 0.629

25 0.337 0.396 0.505 0.618

26 0.330 0.388 0.496 0.607

27 0.323 0.381 0.487 0.597

28 0.317 0.374 0.479 0.588

29 0.311 0.367 0.471 0.579

30 0.306 0.361 0.463 0.570

35 0.283 0.334 0.430 0.532

40 0.264 0.312 0.403 0.501

45 0.248 0.294 0.380 0.474

50 0.235 0.279 0.361 0.451

60 0.214 0.254 0.330 0.414

70 0.198 0.235 0.306 0.385

80 0.185 0.220 0.286 0.361

90 0.174 0.207 0.270 0.341

100 0.165 0.197 0.256 0.324

200 0.117 0.139 0.182 0.231

300 0.095 0.113 0.149 0.189

400 0.082 0.098 0.129 0.164

500 0.074 0.088 0.115 0.147

1000 0.052 0.062 0.081 0.104

Sugerencias didácticas
 Establecer clara y objetivamente la función y el objetivo de describir una correlación lineal entre
dos variables. Asimismo establecer que además de la correlación lineal podemos encontrar
correlación no lineal.

También podría gustarte