Está en la página 1de 27

Relación funcional entre variables

cuantitativas

ANÁLISIS DE REGRESIÓN Y
CORRELACIÓN LINEAL
Cátedra de Bioestadística
Carrera de Cs. Veterinarias
Facultad de Ciencias Agrarias y Veterinarias
Universidad Católica de Salta
Lic. Daniela E. Vázquez 1
Algunos ejemplos de relaciones funcionales
La relaciones entre:
1. el peso promedio individual (kg) de cerdos (variable Y,
dependiente) a partir del tamaño de la camada (variable
X, independiente)
2. la presión sanguínea y el nivel de colesterol.
3. La altura (cm) y la edad (años)
4. El contenido de proteína bruta y la caseína en leche.
5. el peso y altura de ciertos animales.
6. un suplemento dado y el aumento de peso que éste
produce en animales.
Si se conoce el comportamiento de una de las variables, ¿se
puede predecir el comportamiento
Lic. Daniela E. Vázquez
de la otra? 2
Lic. Daniela E. Vázquez 3
Dos herramientas que permiten responder a
esta cuestión:
1- EL ANÁLISIS DE REGRESIÓN : estudia la relación funcional
entre dos o más variables.
Identifica el modelo ó función que las liga, estima sus
parámetros y prueba hipótesis acerca de ellos.
Una vez estimado el modelo es posible predecir el valor de la
variable dependiente (Y) en función de la/s variable/s
independientes (X).
Los valores de la variable independiente (X) pueden ser
modificados por el experimentador, puede fijar los
niveles para los cuales desea estudiar la respuesta de la
variable dependiente (Y).
Lic. Daniela E. Vázquez 4
2- EL ANÁLISIS DE CORRELACIÓN

Estudia el grado y sentido de la


asociación entre variables y siempre
se supone lineal.

Ninguna de las variables puede ser


fijada por el experimentador, ya que
podría conducir a una estimación
errada del grado de correlación
Lic. Daniela E. Vázquez 5
Lic. Daniela E. Vázquez 6
Resolución de Ejercicio Un grupo de
investigadores sospecha que hay relación
entre el peso y el volumen sanguíneo de
cabras de la raza BOER. (n=12)
Peso 34 28 19 41 21 20 21 39 37 23 17 48
(kg) X:
Vol 2.3 2.1 1.1 2.8 1.5 1.6 1.4 2.4 2.5 1.5 1.1 3.5
(cm3)Y:

Lic. Daniela E. Vázquez 7


Inciso 1 a):
Realice el diagrama de dispersión de las
variables estudiadas.

¿Observa algún
patrón de
asociación entre
las variables?

Lic. Daniela E. Vázquez 8


¿Qué podemos 4
Diagrama de dispersión

decir de la nube 3.5

de puntos

volumen(cm3)
2.5

representada en
2

1.5

el diagrama de 1

0.5

dispersión? 0
0 5 10 15 20 25 30 35 40 45 50
peso(kg)

Lic. Daniela E. Vázquez 9


En el diagrama de dispersión se puede
observar un indicio del tipo de relación
que existe entre las variables.
La naturaleza de la relación puede
tomar muchas formas. La relación más
sencilla consiste en una línea o relación
lineal.
El modelo lineal puede representarse
como:
Lic. Daniela E. Vázquez 10
MODELO DE REGRESIÓN LINEAL SIMPLE
Yi =  + Xi + i donde:
Yi = observación de la variable dependiente Y.
= parámetro que representa a la intersección con Y para
la población.
= parámetro que representa a la pendiente de la
población.
Xi= i-ésimo valor de la variable independiente.
ij= error aleatorio en Y para la observación i.
Lic. Daniela E. Vázquez 11
Como el modelo de regresión es
poblacional, el 1º objetivo es
estimar los parámetros  y 
Para ello se deben realizar experimentos
y generar los datos muestrales, en base
a los cuales se obtienen los
estimadores de  y  (que son a y b
respectivamente).
Lic. Daniela E. Vázquez 12
¿Cómo se estiman los parámetros del modelo de
regresión lineal simple?
• La ecuación de la recta se puede escribir como:

y = a + b.x , donde
a = ordenada al origen e indica el valor de “y”
para x= 0.

b= es la pendiente de la recta e indica cuánto


cambia “y” por cada incremento en “x”.
Lic. Daniela E. Vázquez 13
El coeficiente de correlación “r”

Lic. Daniela E. Vázquez 14


Lic. Daniela E. Vázquez 15
Inciso 1b) Cálculo del coeficiente de
correlación “r”:
• Con la Calculadora científica:
a) Limpiar memoria !!!
b) Modo “REG”
c) Ingreso pares de datos (x;y) (ver tabla de
datos)
d) SHIFT… STAT luego tecla 7
e) Tecla 3= r= 0,9893
f) Tecla 2= b (pendiente de la recta)
g) Tecla 1 =a (ordenada al origen)
Lic. Daniela E. Vázquez 16
Peso 34 28 19 41 21 20 21 39 37 23 17 48
(kg) X:
Vol 2.3 2.1 1.1 2.8 1.5 1.6 1.4 2.4 2.5 1.5 1.1 3.5
(cm3)Y:

Para el inciso Estadísticas de la regresión


1 b) de la guía Coeficiente de correlación múltiple
Coeficiente de determinación R^2
0,978207663
0,956890232
calculamos el R^2 ajustado 0,952579255
valor de “r” con Error típico 0,161319342
calculadora ó Observaciones 12

Excell
(punto 1c)!!
Lic. Daniela E. Vázquez 17
Coeficientes Error típico Estadístico t Probabilidad
Intercepción (es "a" que estima a ) -0,042257883 0,143713479 -0,294042586 0,774738
Variable X 1 (es "b" que estima a ) 0,069847973 0,004688248 14,898523 3,73E-08

Inciso 1 d):
Se construye entonces la ecuación
de regresión:
y= 0,069x -0,042

Lic. Daniela E. Vázquez 18


Curva de regresión ajustada
4,0

3,5

3,0
y = 0,069x - 0,042
2,5
R² = 1
2,0
Y

1,5

1,0

0,5

0,0
0 10 20 30 40 50 60
Variable X 1

Lic. Daniela E. Vázquez 19


Coeficiente de determinación (R²):

• R² : indica la proporción de la variación


en Y que es explicada por la variable X.
• Varía entre 0 y 1.
• Ej: si el R² entre 2 variables es de 0,921
significa que el 92% de la variabilidad en Y es
explicada, a través de una relación lineal, por
la variación observada en X.

Lic. Daniela E. Vázquez 20


Inciso e) del ejercicio 1: estimar el
valor del volúmen sanguíneo en
una cabra de 30kg.
Si la ecuación de regresión es:
y= 0,069 . x -0,042
y = 0,069 . 30 – 0,042
y = 2,07 – 0,042
el valor estimado de y= 2,02
Lic. Daniela E. Vázquez 21
ERROR ESTÁNDAR DE LA
ESTIMACIÓN

“Es la medida de la variabilidad alrededor de
la línea de regresión ajustada”.

Se mide en las unidades de la variable “Y”.

Lic. Daniela E. Vázquez 22


Puede utilizarse
para inferir
acerca de un
valor predicho de
“Y”, también para
determinar si
existe una
relación
estadísticamente
significativa entre
las dos variables.
Lic. Daniela E. Vázquez 23
SUPOSICIONES PARA APLICAR
ANÁLISIS DE REGRESIÓN LINEAL

1- Normalidad , los valores de Y


deben ser normales para cada valor de X.

Lic. Daniela E. Vázquez 24


2- Homocedasticidad, requiere que la
variación alrededor de la línea de
regresión sea constante para todos los
valores de X.
(Y, varía la misma cantidad cuando X
tiene un valor alto o bajo).
Importante en cuanto al uso del
M.M.Cuadrados para el cálculo del coef. de
regresión
Lic. Daniela E. Vázquez 25
3- Independencia de error, requiere
que el error (la dif. residual entre un valor observ. y uno
predicho de X), sea independiente de cada valor de X.
(cuando los datos son obtenidos en cierto período de
tiempo, los residuos de un período están
correlacionados con los del período anterior)

4- Linealidad, establece que la relación entre las


variables es lineal.

Lic. Daniela E. Vázquez 26


Bibliografía de consulta

Bioestadística: métodos y Aplicaciones, Barón López F. J., F. Riu, E. Sánchez, L.


Parras, Universidad de Málaga. 1999.Disponible on line en:
http://www.mat.uda.cl/hsalinas/cursos/2008/probablilidad/bioestadistica.pdf

Estadística para las Ciencias Agropecuarias, Di Rienzo J., Casanoves F., González
L., Tablada E., Díaz M., Robledo C., Balzarini M. Brujas. 6ª Edición. Córdoba, 2005.
Disponible on line en: http://www.agro.uncor.edu/~estad/libros.htm

Bioestadística Amigable. Segunda Edición, Martínez González M.A., Sánchez


Villegas A., Faulin Fajardo J. Ed. Díaz de Santos. España. 2006.

Recordatorio: existe más bibliografía de


consulta en el aula virtual de la cátedra

Lic. Daniela E. Vázquez 27

También podría gustarte