Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ITBOCA
Práctica 3
Correlación
Competencias.
Identificar las formas que existen para la transformación de datos.
Distingue el análisis de correlación.
Analiza los diferentes modelos de correlación para determinar bajo ciertas condiciones de las
variables a manipular.
Introducción:
Cuando estamos interesados en ver si existe una relación o una asociación entre dos variables, por
ejemplo la relación entre el pH del agua de mar y la producción de algas en un área marina
determinada, entonces podemos aplicar un índice numérico que nos provea información acerca de
la relación de estas dos variables como el coeficiente de correlación de Pearson. El rango de valores
de este índice estará entre menos uno (-1) y uno (1), pasando por cero. Los coeficientes cercanos a
-1 o +1 indican una fuerte relación lineal, mientras los valores cercanos a cero indican una relación
lineal débil. Para establecer la correlación entre dos variables cuantitativas, x e y podemos hacerlo
aplicando la fórmula.
x y
xy
r n
x2
x 2
y 2
y 2
n n
El valor de xy es el único dato que no habíamos calculado antes. Se obtiene multiplicando
cada valor de x por el valor de y correspondiente y sumamos los productos. El numerador en la
ecuación se llama covarianza y mide cuanto de x ey varían juntos. Reconocerás el denominador
como la raíz cuadrada del producto de las sumas de los cuadrados de las variables x ey.
PRACTICA 3
Manual de prácticas Bioestadísticas II Correlación ITBOCA
Correspondencia de la práctica
Esta práctica está vinculada a la unidad II con los conocimientos de los temas de Correlación,
Regresión lineal simple, Introducción a la regresión no lineal, Regresión múltiple, Transformación y
linealización de datos.
Material y equipo necesario
Computadora cargada con Excel 2007
Base de datos
Metodología
Ejemplo de Problema de investigación
Fueron colectados los datos de una muestra al azar de 11 iguanas grávidas incluyendo su
peso postparto y el número de huevos que cada una produce. Los resultados se dan en la
tabla 8.1 la gráfica de estos datos se muestra en la figura 8.1
Diagramas de dispersión
El primer paso para identificar el tipo de relación que pueda existir entre dos variables es
dibujar una imagen. En el conjunto de datos es representado por un punto en el diagrama de
dispersión. La variable explicativa se grafica en el eje horizontal y la variable de respuesta se grafica
en el eje vertical. Los datos bivariados pueden representarse gráficamente mediante un diagrama
de dispersión, el cual podemos definir cómo un gráfico que muestra la relación entre dos variables
cuantitativas medido en el mismo individuo.
1.- Introducir los datos en una hoja de cálculo de Excel como se muestra en el ejemplo anterior.
1 0.9 33
2 1.55 50
3 1.3 46
4 1 33
5 1.55 53
6 1.8 57
7 1.5 44
8 1.05 31
9 1.7 60
10 1.2 40
11 1.45 50
PRACTICA 3
Manual de prácticas Bioestadísticas II Correlación ITBOCA
2.- Seleccione todos los datos y haga clic en Insertar en la barra de herramientas y seleccione del
grupo de Gráficos, el de Dispersión.
4.-Vamos a mover el gráfico a una nueva hoja. Haga clic con el botón derecho en el espacio en blanco
del gráfico cerca del borde y seleccione Mover Gráfico del menú que aparece.
6.- Este gráfico ya tiene un título de gráfico en la parte superior (la madre) y una leyenda en el
derecho. Cambiemos el título de gráfico, eliminar la leyenda, y agregar un título al eje Y,
y el eje X. Comencemos con el título de gráfico. Haga un clic sobre la palabra Biomasa gr/m2 de
manera que aparece dentro de un marco.
60
50
40
30
20
10
0
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
7.- Eliminar Numero de huevos y reemplazarla por Correlación de numero de huevos/Masa (en
Kg)
8.- Haga clic con el botón derecho en el espacio en blanco del gráfico cerca del borde y seleccione
el cuadrito con la cruz verde del menú que aparece Seleccionar títulos de ejes en el grupo de
Etiquetas de ELEMENTOS DE GRAFICO. Seleccione horizontal primario, y elija Título bajo el eje.
PRACTICA 3
Manual de prácticas Bioestadísticas II Correlación ITBOCA
10.- Seleccione en la opción Agregar elemento de gráfico, Título del eje Vertical primario y elija
Título girado.
Formato eje de las X. El valor más bajo de la lluvia en el conjunto de datos fue de 0.9, por lo
tanto vamos a usar 0.8 como el valor mínimo en la escala del eje de las X.
1. Mueva el puntero hacia el área del gráfico que contiene la escala del eje X (0 a 100). Haga clic con
el botón derecho del ratón sobre cualquier valor del eje de las X. En esta práctica se hizo clic sobre
100 Seleccione Dar formato al eje.
2. En Opciones de Eje, sobre limites mínimo escriba 0 .1 en la ventana. Haga clic en Cerrar.
Formato eje de las Y. El valor más bajo de el Num. De huevos en el conjunto de datos fue
de 33, por lo tanto vamos a usar 30 como el valor mínimo en la escala del eje de las Y.
3. Mueva el puntero hacia el área del gráfico que contiene la escala del eje Y (0 a 100). Haga clic con
el botón derecho del ratón sobre cualquier valor del eje de las Y. En esta práctica se hizo clic sobre
20. Seleccione Dar formato al eje.
5. Líneas de cuadrícula. Haga clic en Agregar elemento de grafico cerca de la parte superior de la
pantalla y seleccione Líneas de la cuadrícula en Grupo Ejes.
6. Seleccione Líneas de cuadrícula, luego líneas verticales de la cuadrícula primaria. (Pudo haber
escogido también las líneas horizontales de la cuadrícula primaria).
7. Líneas de tendencia. Vamos a agregar una línea de tendencia. Agregar elemento de grafico cerca
de la parte superior de la pantalla y seleccione Línea de tendencia. Opción Lineal.
El valor de R2 (0.96) fue arrastrado y colocado en la parte media de la gráfica para poderse
leer.
La gráfica de dispersión ya terminada se muestra abajo. Podrían hacerse otras modificaciones, como
el tamaño de la fuente, el estilo o la forma de los puntos de la gráfica. Para hacer esto sólo haga clic
con el botón derecho del ratón en el objeto que usted quiera cambiar y seleccione las opciones del
menú que aparecerá.
Ahora vamos a medir matemáticamente la fuerza de la asociación lineal entre estas dos
variables.
1. Regrese a la hoja de Excel que contiene los datos. Haga clic en la hoja 1 en la pestaña del fondo
de la pantalla en su hoja de Excel.
Haga más amplia la columna A a fin de que toda la etiqueta aparezca en la pantalla.
4. Haga clic en la ficha Fórmulas, cerca de la parte superior de la pantalla y seleccione Insertar
función.
6. Haga clic en la ventana de la matriz 1. Seleccione con un clic y arrastre de la celda A1 a la celda
A10. Si prefiere, puede ingresar manualmente A1:A12 en la ventana.
7. Haga clic en la ventana de la Matriz 2. Seleccione con un clic y arrastre de la celda B1 a la celda
B10. Si prefiere, puede ingresar manualmente B1:B10 en la ventana.
Ya que r es 0.95181834 significa que hay asociación entre la masa de los organismos y el
numero de huevos En otras palabras esperamos que entre mayor biomasa mayor num de huevos.
¿Pero cómo podemos saber si este valor de r del coeficiente de Pearson es fuerte o débil?
PRUEBA DE SIGNIFICANCIA DE r.
n2
t=r
1 r2
9
para el ejemplo t = = 0.952 = 9.315
1 0.906
El valor crítico de t para alfa = 0.05 y 9 grados de libertad es 2.262 para una probabilidad de dos
colas. Podemos por lo tanto, rechazar la hipótesis nula y concluir que las dos variables están
correlacionadas.
Una forma alternativa de determinar si r es significativo, es consultando la tabla A.8 “Valores
Críticos del Coeficiente de Correlación Pearson r. Esta tabla muestra los valores mínimos
de r que permiten rechazar la hipótesis nula. Si el valor calculado de r es igual o más grande
que el valor tabular para los grados de libertad específicos (n-2) la hipótesis nula es
rechazada.
PRACTICA 3
Manual de prácticas Bioestadísticas II Correlación ITBOCA
Para probar si la correlación entre las variables de respuesta y la explicativa es fuerte, tome
el valor absoluto de r, compare si el valor absoluto del coeficiente de correlación es más grande que
el valor critico de las tablas de probabilidad de los valores de r anexa, para una muestra dada,
podemos decir que hay una correlación lineal entre las dos variables, de forma contraria no existe
una correlación lineal.
Two-Tailed Probabilities
Sugerencias didácticas
Establecer clara y objetivamente la función y el objetivo de describir una correlación lineal entre
dos variables. Asimismo establecer que además de la correlación lineal podemos encontrar
correlación no lineal.