Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PE Módulo V
PE Módulo V
Módulo V
A. Análisis de Correlación
1. Coeficiente de Correlación
2. Coeficiente de Determinación
B. Análisis de Regresión
1. Principio de los Mínimos Cuadrados.
2. Trazo de la Recta de Regresión
3. Error estándar de estimación
4. Suposiciones de la Regresión Lineal
¿ Por qué es importante?
Analizar
relación de
variables para
Regresión y
predecir
correlación futuros
Análisis de Análisis de
regresión correlación
Pruebas de Coef de
hipótesis determinación
Prueba de
Intervalos de
hipótesis para
confianza
correlación
La regresión y la correlación son las dos
herramientas estadísticas más poderosas y
versátiles que se pueden utilizar para
solucionar problemas comunes en los
negocios.
Muchos estudios se basan en la creencia de
que se puede identificar y cuantificar alguna
Para empezar… relación funcional entre dos o más variables.
Se dice que una variable depende de otra.
Se puede decir que Y depende de X en
donde Y y X son dos variables cualquiera.
Esto se puede escribir así
Y = f (X)
Debido a que Y depende de X, Y es la variable dependiente y X es
la variable independiente.
Pero antes…
Variables que intervienen en un estudio
Variable explicativa Variable de respuesta
(Causa) (Efecto)
Variable Variable
independiente dependiente
Se representa en el Se representa en el
eje x eje y
Posibles relaciones entre variables
Estatura vs edad
Consumo de energía vs costo
Gastos vs ingresos
Consumo de combustible vs gasto de combustible
Diagrama de dispersión Un diagrama de dispersión o gráfica de
dispersión o gráfico de dispersión es un tipo de
diagrama matemático que utiliza las
coordenadas cartesianas para mostrar los
valores de dos variables para un conjunto de
datos.
Se emplea cuando una o varias variables están
bajo el control del experimentador.
Si existe un parámetro que se incrementa o
disminuye de forma sistemática, se le
denomina parámetro de control o variable
independiente y habitualmente se representa a
lo largo del eje horizontal (eje de las
abscisas). La variable medida o dependiente
usualmente se representa a lo largo del eje
vertical (eje de las ordenadas). Si no existe
una variable dependiente, cualquier variable
se puede representar en cada eje y el
diagrama de dispersión mostrará el grado de
correlación (no causalidad) entre las dos
variables.
Relación lineal entre variables
de
correlación
El coeficiente no paramétrico de Spearman mide cualquier tipo de
asociación, no necesariamente lineal.
Distribuciones
bidimensional
correlación lineal
(valores agrupados
de 2 en 2) simple
Relación de
dependencia entre
variables
Definir la relación
matemática para el
par de variables
Análisis de correlación lineal simple
Si entre dos variables cuantitativas existe una relación lineal, el análisis de correlación
lineal simple se usa para determinar la dirección y la magnitud de dicha relación.
La dirección de la relación se refiere a si ésta es positiva o negativa.
La magnitud de la relación o grado de relación entre las variables se refiere a la fuerza de
la relación que existe entre las variables. Se trata de expresar cuantitativamente el
grado de relación que existe entre las variables en estudio.
Coeficiente de correlación: expresa de manera cuantitativa el grado y la dirección de la
relación entre dos variables.
Coeficiente de correlación r de Pearson (rxy), se usa cuando los datos están medidos en
una escala de intervalo o de razón.
Coeficiente de correlación rho de Spearman (rs), se utiliza cuando una o ambas
variables están medidas en la escala ordinal, en la escala de intervalo o la de razón.
Características del coeficiente de
correlación
El signo del coeficiente indica si la relación entre las variables es
positiva o negativa: si el coeficiente es positivo, entonces la relación
es positiva. En caso contrario, la relación es negativa.
El valor numérico del coeficiente de correlación varía entre -1 y +1
y éste describe la magnitud de la relación entre las variables.
Si r = -1 entonces existe una relación lineal perfecta negativa entre las
variables.
Si r = 0 entonces no existe relación entre las variables
Si r = +1 entonces existe una relación lineal perfecta positiva entre las
variables
Las relaciones imperfectas, positivas
o negativas, tienen coeficientes de
correlación que varían entre -1 y +1,
de la siguiente manera:
Si r = 0 Nula
Así, si valores altos (o bajos) de X tienden a asociarse con valores altos (o bajos) de Y, el
producto de las desviaciones tenderá a ser positivo y la covarianza será positiva.
Por el contrario, si valores altos de una variable se relacionan con valores bajos de la otra
variable, el producto de las desviaciones tenderá a ser negativo y la covarianza será negativa.
De tal modo que:
Si SXY > 0 las dos variables crecen o decrecen a la vez (nube de puntos creciente).
Si SXY < 0 cuando una variable crece, la otra tiene tendencia a decrecer (nube de puntos
decreciente).
Si los puntos se reparten con igual densidad alrededor del centro de gravedad (x, y), SXY =0 (no
hay relación lineal).
Coeficiente de
Correlación lineal de
Pearson