Está en la página 1de 26

Estadística

Martes y Viernes de 14 a 18 hs.


Patricia - Alejandra
2023
Regresión y Correlación

• Cuando se quiere estudiar o investigar la cantidad de


relación que existe entre variables, y predecir una
dependiente, en función de otro que es la
independiente, la técnica que se utiliza en estadística se
denomina Análisis de regresión.
Sólo expresan el grado de
CORRELACIÓN asociación de ambas variables
sin tener en cuenta la
naturaleza de las mismas

Investigar la cantidad de la
ANÁLISIS DE relación existente entre ambas
variables, y de estimar o
REGRESIÓN predecir una de las variables
(dependiente) en función del
conocimiento de la otra
(independiente).
Regresión lineal simple

Es un modelo matemático para predecir el efecto de una


variable sobre otra, ambas cuantitativas.
Una variable es la dependiente y otra la independiente
Se grafica con el diagrama de dispersión.
Dice cómo es la relación entre las dos variables.
El análisis consiste en encontrar la “mejor” línea recta de
esos puntos.
DIAGRAMA DE DISPERSIÓN
Correlación directa Correlación inversa

Correlación Débil Correlación Alta Correlación Débil Correlación Alta


Positiva Positiva Negativa Negativa
Diagrama de dispersión
Diagrama de dispersión y recta
El modelo de regresión lineal

• La relación se puede representar gráficamente mediante una línea recta. Se


supone que el error sigue una distribución normal con media cero y varianza
sigma2.
• El modelo de regresión completo es y    x  e
Y es el valor de la variable dependiente
A o alfa es el intercepto, donde cruza el eje Y, es la ordenada al origen. Es el valor
de Y , cuando x es igual a cero.
B o beta es la pendiente o inclinación
X es cualquier valor de la variable independiente que se selecciona
ANÁLISIS DE
REGRESIÓN
Objetivo: encontrar la ecuación de una recta que mejor describe
la relación entre las dos variables. Esta ecuación permitirá hacer
predicciones sobre la variable respuesta.

Criterio de mínimos cuadrados: Es aquel que minimiza las distancias cuadráticas


de los puntos con la línea.
Cálculo de la ecuación de regresión lineal (de Y sobre X)

El criterio de mínimos cuadrados nos


proporciona un valor de A y uno de B, tal
Y’ que

n 2

 Y  Y 
Peso (Y)

'
i i sea mínimo
i 1

talla (X)
¿QUÉ ES EL ERROR?

 Es la distancia entre el valor observado de y y el valor


pronosticado por la recta.
 Su promedio es cero y tiene distribución normal.

ui  yi  yˆi
COEFICIENTES DE LA RECTA

b: coeficiente de la pendiente.
Es una variación de y por cada aumento unitario de
x.
b=r r: es el coeficiente de correlación.
Donde:
Sy: es la desviación estándar de Y (variable dependiente)
Sx: es la desviación estándar de X (variable independiente)

a: coeficiente de la ordenada al origen.


Valor de y cuando x = 0
Donde:
: es la media de Y (variable dependiente)
: es la media de X (variable independiente)
Correlación simple
• Es una extensión de la regresión simple.
• Mide la calidad del ajuste de una línea.
• Dice cuánto se relacionan las dos variables
• r es el coeficiente de correlación
• r2 es el coeficiente de determinación

La correlación es la medida que se registra, de la dependencia entre distintas


variables.
El grado de correlación puede medirse mediante los llamados
coeficientes de correlación.
Varianza y Covarianza

Varianza: Medida de dispersión de una variable.

Covarianza: Medida de dispersión conjunta de dos variables.

Parámetro Estimadores
COEFICIENTE DE CORRELACIÓN
Coeficiente de correlación lineal de
Pearson:

Donde:
Cálculo de covarianza

 Desvío de  Desvío de
: :
Coeficiente r de Pearson
Puede variar de –1 a +1
• -1 correlación negativa perfecta
• -0.75 correlación negativa considerable
• -0.5 correlación negativa media
• -0.1 correlación negativa débil
• 0 no existe correlación lineal entre las variables
• 1 correlación positiva perfecta
• 0.75 correlación positiva considerable
• 0.5 correlación positiva media
• 0.1 correlación positiva débil
COEFICIENTE DE DETERMINACIÓN

2 var iación in exp licada


r 
var iación total

Proporción de la variación total en la variable


dependiente Y que se explica, por la variación
en la variable dependiente X.

Coeficiente de determinación:
Se calcula como r2
Ejercicio
La cátedra de matemática de la Facultad de Bioquímica está
analizando las encuestas de fin de curso a sus estudiantes.
Como parte del análisis, se proponen estimar la nota final
del alumno a partir de las horas totales de estudio de la
asignatura declarados por los estudiantes. Una muestra
aleatoria de 8 encuestas arroja la siguiente información

Hs totals de estudio: 40 50 30 60 90 85 82 55
Nota final de curso: 6 7 6 8 10 9 10 6

a) Calcule la recta de regresión.


b) Encuentre la nota estimada si la dedicación al estudio disponible es de 70 horas.
c) Determine el coeficiente de determinación y el coeficiente de correlación. Interprete.
d) Grafique el diagrama de dispersión y la recta de regresión
Diagrama de
12 dispersión
10

0
0 20 40 60 80 100

Hs totals de estudio
a) Calcule la recta de
regresión
Y (La variable dependiente): Nota final de curso.
X (La variable independiente): Hs totales de
estudio
Cantidad de datos: 8
Variables a relacionar Cálculos para determinar la
covarianza y los desvíos

Hs totals de Nota final de curso


estudio
Encuestas x y (x- )*(y- ) (x- )2 (y- )2
1 40 6 37,625 462,25 3,0625
2 50 7 8,625 132,25 0,5625
3 30 6 55,125 992,25 3,0625
4 60 8 -0,375 2,25 0,0625
5 90 10 64,125 812,25 5,0625
6 85 9 29,375 552,25 1,5625
7 82 10 46,125 420,25 5,0625
8 55 6 11,375 42,25 3,0625
61,5 7,75 252 3416 21,5

Media aritmética de x; y
a) Calcule la recta de
regresión
La ecuación de regresión lineal
Se sabe que la ecuación de una recta es del tipo:

Y=a+bX
b)Encuentre la nota estimada si la dedicación al estudio disponible es de 70
horas.
c) Determine el coeficiente de determinación y el coeficiente de correlación.
Interprete.
d)Grafique el diagrama de dispersión y la recta de
regresión

Gráfico de Dispersión con recta de


12 regresión
10

0
0 10 20 30 40 50 60 70 80 90 100
Hs totals de estudio

y = 0,0738x + 3,2131
R² = 0,8647

También podría gustarte