Está en la página 1de 11

FACULTAD DE CIENCIAS EXACTAS Y

NATURALES

PROFESORADO EN COMPUTACIÓN

CÁTEDRA: ELEMENTOS DE PROBABILIDAD Y


ESTADÍSTICA

UNIDAD Nº 5: REGRESIÓN LINEAL

DOCENTE: Prof. Ayelén Quiroga Hahn

AÑO 2020
OBJETIVOS

 Explorar los datos por medio de un diagrama de


dispersión.

 Comprender los pasos a seguir para obtener el


modelo de regresión lineal.

 Estimar la recta de regresión utilizando software


estadístico.

 Determinar la bondad del ajuste del modelo.


INTRODUCCIÓN

Hasta este momento todo el estudio se basó en una sola


variable. Ahora enfatizaremos el estudio de dos variables.
Estudiaremos si existe relación lineal entre ellas, si esta es
fuerte o débil, directa o inversa. También desarrollaremos
una ecuación para expresar esa relación.
Por ejemplo:
 ¿Existe alguna relación lineal entre el número de horas
que los alumnos estudiaron para el examen y la
calificación que obtuvieron?
 ¿Hay relación lineal alguna entre el promedio con el que se
recibió una persona y el éxito laboral?
ANÁLISIS DE CORRELACIÓN

Es una medida de la asociación lineal entre dos


variables.
Se denota con la letra r al estimador y con ρ al
parámetro.
DIAGRAMA DE DISPERSIÓN
330 100
280 Poca relación 90 Fuerte relación
230 80 directa.
70
180
60
130
50
80 40
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200

Dado un valor de x no se puede decir gran Conocido x sabemos que y se mueve por
cosa sobre y. Baja relación lineal. una nube de puntos estrecha.
Alta relación lineal.

80
70 Cierta relación
60 inversa
50
40 Conocido x sabemos que y se mueve por
30 una nube de puntos estrecha.
20 Moderada relación lineal.
10
0
140 150 160 170 180 190 200
Ejemplo 1: Se desea estudiar la relación entre la altura y el peso de los
alumnos de segundo año de la cátedra Bioestadística de la Facultad
de Ciencias Exactas y Naturales-UNCa. para ello se tomó una
muestra aleatoria de 30 alumnos, obteniéndose los datos que se
encuentran en la base “AlumnosBio.idb”:
a) Calcule el coeficiente de correlación. ¿Existe asociación lineal entre
las variables?
Estadísticas → Análisis de correlación → Coeficientes de
correlación.

Coeficientes de correlación
Correlación de Pearson
Variable(1) Variable(2) n Pearson p-valor
Estatura (cm) Peso (kg) 30 0,82 <0,0001

r = 0,82

Interpretación: Existe un correlación positiva fuerte entre la


estatura y el peso de los alumnos. Es decir, que a medida que
aumenta la estatura aumenta también el peso de los individuos.
b) Identifique las variables dependientes e independientes.
V. Independiente (x): Estatura (cm)
V. Dependiente (y): Peso (kg)
c) Realice el gráfico de dispersión e intreprete.
Gráficos → Diagrama de dispersión
Gráfico N° 1: Diagrama de dispersión del peso en función de la
estatura de alumnos de segundo año de la cátedra Bioestadística de
la Facultad de Ciencias Exactas y Naturales –UNCa
98

82
Peso (kg)

66

50

34
147 160 173 186 199
Estatura (cm)

Interpretación: Se observa una tendencia lineal positiva entre las


variables.
ANÁLISIS DE REGRESIÓN LINEAL

Hasta aquí desarrollamos medidas para expresar la fuerza


y la dirección de la relación lineal entre dos variables.
Ahora, vamos a desarrollar una ecuación para expresar la
relación lineal entre dos variables. Además, queremos
estimar el valor de la variable dependiente, y, en base a un
valor seleccionado de la variable independiente, x.

Definición: “Es una técnica que se utiliza para, desarrollar la


ecuación que expresa la relación lineal entre dos variables,
y para proporcionar los estimados”

Ecuación de la recta de regresión:


𝑦 𝑎 𝑏∙𝑥
Ejemplo: Siguiendo con los datos del ejemplo 1
a) Obtenga la ecuación de la recta.
b) Prediga para un alumno que mide 1,85 m cuál sería
su peso.
a) Estadísticas → Regresión lineal

𝑦 107,83 1,03 ∙ 𝑥

b) Predicción:
𝑥0 185 ⇒ 𝑦 107,83 1,03 ∙ 185

𝑦 82,72 𝑘𝑔
COEFICIENTE DE DETERMINACIÓN

El coeficiente de determinación es una medida, quizás


más importante, de bondad de ajuste, y, como tal,
indica en qué medida la línea de regresión muestral
se ajusta a los datos.
Definición: “Es el porcentaje de la variación total de la
variable dependiente que se explica, o contabiliza, por
la variación en la variable independiente”
Se denota con R2.
Valores de R2 Interpretación de la
bondad de ajuste
>0,80 Muy buena
0,60 -0,80 Alta o buena
0,40 – 0,59 Moderada
< 0,40 Mala
Ejemplo:

R2=0,68.
Es decir,
o El 68% de la variabilidad total de los datos es
explicada por la regresión.
o La bondad de ajuste de la regresión lineal es
buena o alta.

También podría gustarte