Está en la página 1de 6

UNIVERSIDAD NACIONAL DE ASUNCIÓN

FACULTAD DE FILOSOFÍA
Carrera: Psicología Módulo: Estadística

UNIDAD V: ANALISIS DE REGRESION


Historia
La primera forma de regresiones lineales documentada fue el método de los mínimos
cuadrados, el cual fue publicado por Legendre en 1805, y por Gauss en 1809. El término
"mínimos cuadrados" proviene de la descripción dada por Legendre "moindres carrés".
Sin embargo Gauss aseguró que conocía dicho método desde 1795.

Tanto Legendre como Gauss aplicaron el método para determinar, a partir de


observaciones astronómicas, las órbitas de cuerpos alrededor del sol. En 1821, Gauss
publicó un trabajo en dónde desarrollaba de manera más profunda el método de los
mínimos cuadrados, y en dónde se incluía una versión del teorema de Gauss-Márkov.

Análisis de Regresión
En estadística la regresión lineal o ajuste lineal es un método matemático que modeliza la
relación entre una variable dependiente , las variables independientes y un término
aleatorio . Este modelo puede ser expresado como:

Donde es la intersección o término "constante", las son los parámetros


respectivos a cada variable independiente, y es el número de parámetros independientes
a tener en cuenta en la regresión. La regresión lineal puede ser contrastada con la
regresión no lineal.

Ejemplo de una regresión lineal con una variable dependiente y una variable independiente.

Esta teoría permite a través de un modelo estadístico PREDECIR O PRONOSTICAR el


valor de una variable (Y, denominada variable dependiente o repuesta) en función de una
o más variables independientes o predictivas (X, conocida como covariables).
Para establecer el modelo de regresión, debe existir correlación entre X e Y .Si el conjunto
de variables predictivas contiene un solo elemento, la regresión se denomina regresión
simple, en caso contrario se denomina regresión múltiple.
Si la relación que existe entre X e Y es lineal, el modelo se denomina REGRESION
LINEAL SIMPLE.

Profesora: Cristina Knoop de Bueno Página 1 de 6 Profesor: Luis Gómez Martinez


UNIVERSIDAD NACIONAL DE ASUNCIÓN

FACULTAD DE FILOSOFÍA
Carrera: Psicología Módulo: Estadística

Supuestos del Modelo de Regresión Lineal


Para poder crear un modelo de regresión lineal, es necesario que se cumpla con
los siguientes supuestos:

* La relación entre las variables es lineal.


* Los errores son independientes.
* Los errores tienen varianza constante.
* Los errores tienen una esperanza matemática igual a cero.
* El error total es la suma de todos los errores.

Aplicación de la Regresión Lineal


Una línea de tendencia representa una tendencia en una serie de datos obtenidos
a través de un largo período. Este tipo de líneas puede decirnos si un conjunto de
datos en particular (como por ejemplo, el PBI, el precio del petróleo o el valor de
las acciones) han aumentado o disminuido en un determinado período. Se puede
dibujar una línea de tendencia a simple vista fácilmente a partir de un grupo de
puntos, pero su posición y pendiente se calcula de manera más precisa utilizando
técnicas estadísticas como las regresiones lineales. Las líneas de tendencia son
generalmente líneas rectas, aunque algunas variaciones utilizan polinomios de
mayor grado dependiendo de la curvatura deseada en la línea.

Relación entre Variables


Con frecuencia, en la práctica se encuentra que existen relaciones entre dos (o más)
variables. Por ejemplo, el peso de los hombres adultos depende de alguna manera de su
estatura; la circunferencia de un círculo depende de su radio, y la presión de una masa de
gas depende de su temperatura y volumen.

Es útil expresar estas relaciones en forma matemática mediante una ecuación que
conecte estas variables.

La ecuación de la recta lineal es , y

La variable dependiente (Y): es la variable que se desea explicar o predecir; también se


le denomina regresando o variable de repuesta.

La variable independiente(X): se utiliza para explicar la variable dependiente, también


se le denomina variable explicativa o regresor.

Para la determinación de los valores “a” y “b”, se utiliza el método de ajuste de Mínimos
Cuadrado Ordinario, este método producirá una recta que se extiende por el centro del
diagrama de dispersión aproximándose a todos los puntos de datos más que cualquier
otra recta.

Donde

∑ ∑ ∑ ∑
∑ ∑

y
∑ ∑ ∑
∑ ∑
Profesora: Cristina Knoop de Bueno Página 2 de 6 Profesor: Luis Gómez Martinez
UNIVERSIDAD NACIONAL DE ASUNCIÓN

FACULTAD DE FILOSOFÍA
Carrera: Psicología Módulo: Estadística

ANÁLISIS DE CORRELACION
Es el grupo de técnicas estadísticas empleado para medir la intensidad de la relación
(correlación) entre dos variables. El principal objetivo del análisis de correlación es
determinar que tan intensa es la relación entre dos variables. Una medida de esta relación
es el coeficiente de correlación ( r ) el cual puede tomar valores en una escala desde -1
hasta +1 inclusive como se indica enseguida.

Tabla 1. Interpretación de los valores de los coeficientes de correlación según el


rango de valores.
Puede variar de –1 a +1

Coeficiente Interpretación

0 Relación nula
0 - 0.20 Relación muy baja
0.20 - 0.40 Relación baja
0.40 - 0.60 Relación moderada
0.60 - 0.80 Relación alta
0.80 - 1.00 Relación muy alta

COEFICIENTE DE CORRELACION (r)


Originado por el investigador Karl Pearson aproximadamente en el año 1900, el
coeficiente de correlación describe la intensidad de la relación entre dos conjuntos de
variables, por lo cual también se le conoce como r de Pearson.
Si r toma los valores de -1 o de +1 indica correlación perfecta como se indica en los
siguientes diagramas de dispersión.

GRÁFICA QUE INDICA LA RELACIÓN ENTRE LAS DOS VARIABLES

Profesora: Cristina Knoop de Bueno Página 3 de 6 Profesor: Luis Gómez Martinez


UNIVERSIDAD NACIONAL DE ASUNCIÓN

FACULTAD DE FILOSOFÍA
Carrera: Psicología Módulo: Estadística

Calculo de la de Pearson
Si r = 0 indica que no existe ninguna correlación entre las dos variables.
El coeficiente de correlación se calcula mediante la siguiente fórmula:

∑ ∑ ∑
√[ ∑ ∑ ][ ∑ ∑ ]

Dónde:
n -> es el número de pares de observaciones (x, y)
x -> valores de la variable independiente x.
y -> valores de la variable dependiente y.

Coeficiente de determinación (r2)


Es una medida descriptiva que sirve para evaluar la bondad de ajuste del modelo a los
datos, ya que mide la capacidad predictiva del modelo ajustado. Se define como el
cociente entre la variabilidad explicada por la regresión y la variabilidad total, esto es:

Recuerda que:
 CORRELACIÓN: Establece la relación mutua entre dos variables de modo que sea
posible obtener información de una de ellas a través de la otra.

 REGRESIÓN: Es un concepto matemáticamente más fuerte debido a que busca


establecer la relación funcional (función matemática) entre dos variables.

Ejemplo:
1- Los siguientes datos se obtienen en un estudio de la relación entre el peso y el
tamaño del tórax de infantes al nacer:

Peso ( Kg. ) Tamaño del tórax ( cm. )


2.75 29.5
2.15 26.3
4.41 32.2
5.52 36.5
3.21 27.2
4.32 27.7
2.31 28.3
4.3 30.3
3.71 28.7

Se Pide:

a) Dibujar un diagrama de dispersión


b) Hallar la recta de regresión ( los valores de a y b)
c) Calcular los coeficientes de correlación y determinación y analizarlos
d) Si el peso es de 3,11 estimar el tamaño del torax.

Solución:
a) Diagrama de dispersión, la variable independiente es el peso en kg y la variable
dependiente es el tamaño del torax.

Profesora: Cristina Knoop de Bueno Página 4 de 6 Profesor: Luis Gómez Martinez


UNIVERSIDAD NACIONAL DE ASUNCIÓN

FACULTAD DE FILOSOFÍA
Carrera: Psicología Módulo: Estadística

38 36,5
36
34 32,2
Tamaño del torax

32 30,3
29,5
30 28,3 28,7
27,2 27,7
28 26,3
26
24
22
20
1,5 2,5 3,5 4,5 5,5 6,5
Peso (kg)

b) Hallar la recta de regresión ( los valores de a y b)


Tamaño del
Peso (X)
tórax (Y)
X.Y x2 y2
2,75 29,5 81,125 7,5625 870,25
2,15 26,3 56,545 4,6225 691,69
4,41 32,2 142,002 19,4481 1036,84
5,52 36,5 201,48 30,4704 1332,25
3,21 27,2 87,312 10,3041 739,84
4,32 27,7 119,664 18,6624 767,29
2,31 28,3 65,373 5,3361 800,89
4,3 30,3 130,29 18,49 918,09
3,71 28,7 106,477 13,7641 823,69
2 2
Σx=32,68 Σy=266,7 Σx.y=990,268 Σ x =128,6602 Σ y =7980,83

∑ ∑ ∑ ∑
∑ ∑

∑ ∑ ∑
∑ ∑

Entonces,

c) Calcular los coeficientes de correlación y determinación y analizarlos


Coeficiente de correlación
∑ ∑ ∑

√[ (∑ ) ∑ ][ (∑ ) ∑ ] √[ ][ ] √

, existe una relación alta entre las variables peso y tamaño del tórax

Profesora: Cristina Knoop de Bueno Página 5 de 6 Profesor: Luis Gómez Martinez


UNIVERSIDAD NACIONAL DE ASUNCIÓN

FACULTAD DE FILOSOFÍA
Carrera: Psicología Módulo: Estadística

Coeficiente de determinación

, aproximadamente el 61% de la variable peso explica el


tamaño del torax.

d) Si el peso es de 3,11 estimar el tamaño del torax.

, donde X (peso) e Y (tamaño del torax),

, entonces si el tamaño del peso es de 3,11 kg el


tamaño del torax sera de 28,44 cm

Profesora: Cristina Knoop de Bueno Página 6 de 6 Profesor: Luis Gómez Martinez

También podría gustarte