Documentos de Académico
Documentos de Profesional
Documentos de Cultura
(UASD)
Nombres
Ambar Lisbeth
Apellidos
Rodríguez Tavarez
Matricula
100439585
Asignatura
Estadística Industrial II (Est-123)
Sección
03
Practica No. 13
Regresión y correlación simples y múltiples
Maestro
Joel A. Patiño De Los Santos
Autoría
Ambar Lisbeth Rodríguez Tavarez
Estudiante de Ingeniería Industrial de la Universidad
Autónoma de Santo Domingo (UASD)
Matrícula 100439585
Análisis de regresión y correlación simple
Regresión Lineal
En estadística la regresión lineal o ajuste lineal es un modelo matemático
usado para aproximar la relación de dependencia entre una variable
dependiente Y, las variables independientes Xi y un término aleatorio ε. Este
modelo puede ser expresado como:
Donde:
Correlación Lineal
La correlación, también conocida como coeficiente de correlación lineal (de
Pearson), es una medida de regresión que pretende cuantificar el grado de
variación conjunta entre dos variables.
Por tanto, es una medida estadística que cuantifica la dependencia lineal
entre dos variables, es decir, si se representan en un diagrama de dispersión
los valores que toman dos variables, el coeficiente de correlación lineal
señalará lo bien o lo mal que el conjunto de puntos representados se
aproxima a una recta.
De una forma menos coloquial, la podemos definir como el número que mide
el grado de intensidad y el sentido de la relación entre dos variables.
Siendo:
Cov (x;y): la covarianza entre el valor «x» e «y».
σ(x): desviación típica de «x».
σ(y): desviación típica de «y».
Valores que puede tomar la correlación
ρ = -1: Correlación perfecta negativa
ρ = 0: No existe correlación
ρ = +1: Correlación perfecta positiva
Hablamos de correlación positiva si siempre que el valor «x» sube, el valor
«y» sube, y además con la misma intensidad (+1).
En el caso opuesto, si siempre que el valor «x» sube, y el valor «y» baja, y
además con la misma intensidad, entonces estamos hablando de correlación
negativa (-1).
Diagrama de dispersión
Analizando el numerador:
Podrán caer en la cuenta de que es la expresión de la varianza, pero con dos
diferencias fundamentales.
La primera diferencia es que la Y lleva un circunflejo o, lo que los profesores
llaman de forma didáctica, “sombrerito”. Ese sombrerito lo que detalla es
que esa Y es la estimación de un modelo sobre lo que según las variables
explicativas vale Y, pero no es el valor real de Y, sino una estimación de Y.
En segundo lugar, faltaría dividir entre T. Que, en otros casos, se nota como
N o número de observaciones. Sin embargo, dado que la fórmula del
denominador también la llevaría, eliminamos los denominadores (parte de
abajo) de ambas fórmulas para simplificar la expresión. De esta manera es
más fácil trabajar con ella.
Utilidad
Observaciones
1. mide la correlación entre y y .
2. Si existe error puro, es imposible que alcance el valor de 1. La
única manera en que podría dar , sería que se tuviera un
perfecto ajuste de los datos en el cual , lo cual es un improbable
evento en la práctica.
3. Si , esto es si (suponiendo que el
modelo ha sido ajustado), entonces .
4. es una medida de la utilidad de los términos en el modelo diferentes
de
Ejemplo