Está en la página 1de 21

REGRESIÓN LINEAL MÚLTIPLE-

ANALISIS DE ASOCIACIÓN NO
PARAMÈTRICO
-SUPUESTOS EN UNA REGRESIÓN LINEAL
MÚLTIPLE
-ANALISIS DE ASOCIACION POR RANGOS
-ANALISIS DE ASOCIACIÓN PARA VARIABLES
CUALITATIVAS.

Ing. Diana Rebaza Fernández


ANALISIS DE REGRESIÓN LINEAL
MÚLTIPLE
 El modelo poblacional de regresión lineal múltiple es :
Yi   0  1 X i   2 X 2  ...   3 X n i
donde:
- Yi es la variable dependiente;
- Xi son las variable independientes;
- β0 y β1,.. βn son parámetros desconocidos llamados
coeficientes de regresión
- εi son los errores del modelo, independientes y
normalmente distribuidos con media cero y variancia
σ2, esto es, εi ~ N (0, σ2 ).
Ing. Diana Rebaza Fernández
Supuestos:
 1- No autocorrelación:
Un contraste muy importante para detectar la
autocorrelación es el contraste de Durbin Watson:
t 2

 (e t  e t 1 )
D  t2
t

 e t2
Si: t 1

D=0 hay autocorrelación perfecta positiva


D≈2(aproximadamente 2) no hay autocorrelación
D≈4(aproximadamente 4) hay autocorrelación
perfecta negativa
Ing. Diana Rebaza Fernández
Supuestos:
2.-Homocedasticidad:
El modelo comienza por el análisis gráficos de los
residuos, siendo esencial la gráfica de residuos
(estudentizados) respecto a la variable endógena y
respecto a las variables exógenas, que deben de
presentar una estructura aleatoria libre de tendencia.
El gráfico de residuos contra cada variable exógena
permite detectar como variable más culpable de
heterocedasticidad aquella cuyo gráfico se separa más
de la aleatoriedad.

Ing. Diana Rebaza Fernández


 Grafico con diagrama de dispersión y si
los puntos están dispersos entonces hay
homocedasticidad
 Si la varianza de los residuos es constante
hay homocedasticidad. Sino es
hetecedastica.

Ing. Diana Rebaza Fernández


Supuestos:
 3.-Independencia: cuando no se cumple se llama
multicolinealidad.(no cumple independencia)
Como síntomas mas comunes, valores altos en la
matriz de correlaciones, poca significatividad en las
variables X.

 4.- Normalidad:
Gráfico de residuos tipificados , mediante el
histograma y gráfico de probabilidad normal.(si se
ajusta a una recta)
Ing. Diana Rebaza Fernández
ANÁLISIS DE ASOCIACIÓN NO
PARAMÉTRICO

-Coeficiente de correlación r de Spearman


-Análisis de asociación para variables
cualitativas (nominal y ordinal)

Ing. Diana Rebaza Fernández


Definición Análisis no paramétrico:

 Permiten sacar conclusiones sin hacer


suposiciones numerosas ni severas acerca de
los parámetros, podemos decir que
independientemente de la forma de la
población, podemos extraer conclusiones.
Estas técnicas no paramétricas son también
llamadas distribuciones libres.

Ing. Diana Rebaza Fernández


Coeficiente de correlación de Spearman
 Es una medida de asociación que requiere que
ambas variables sean medidas por lo menos en
una escala de orden, de tal manera que los objetos
o individuos en este estudio puedan colocarse en
ds series ordenadas.
 Podemos usar una medida de correlación por
rangos entre X y Y
N Donde:
6* d i
2
di = Xi-Yi
N = número de
rs  1  i 1
individuos
N N
3
Ing. Diana Rebaza Fernández
Método

1ero Se hace una lista de los N sujetos.


2do Se anota su rango en la variable X y en la
variable Y
3ero Se determinan los distintos valores de di
4to Se eleva al cuadro cada di2 para luego sumarlos y
obtener ∑ di2 .
5to Se sustituye este valor y N (nº de sujetos) en la
fórmula.

Ing. Diana Rebaza Fernández


Ejemplo
 Como parte del estudio acerca del efecto de las
presiones de grupo para crear conformidad en un
individuo sujeto a una situación que involucraba
riesgo monetario, los investigadores administran
la bien conocida escala F, una medida de
autoritarismo, y una escala para medir el esfuerzo
por alcanzar posición social de 12 estudiantes
universitarios. Se busca información acerca de la
correlación entre los puntajes de autoritarismo y
las del esfuerzo por alcanzar posición social.

Ing. Diana Rebaza Fernández


Tabla Nº1:Puntajes de autoritarismo y
búsqueda de posición social
Rango
Estudiante Busqueda deposición
Autoritarismo
social
A 82 42
B 98 46
C 87 39
D 40 37
E 116 65
F 113 88
G 111 86
H 83 56
I 85 62
J 126 92
K 106 54
L 117
Ing. Diana Rebaza Fernández 81
Tabla Nº1: Rango de autoritarismo y
búsqueda de posición social
Rango    
Estudiante Búsqueda deposición
Autoritarismo di di2
social
A 2 3 # 1
B 6 4 2 4
C 5 2 3 9
D 1 1 0 0
E 10 8 2 4
F 9 11 # 4
G 8 10 # 4
H 3 6 # 9
I 4 7 # 9
J 12 12 0 0
K 7 5 2 4
L 11 9 2 4
Ing. Diana Rebaza Fernández
 El coeficiente de r de
Pearson quedaría:

N
6 *  d i2 6*52
rs  1  i 1 rs  1 3  0,82
N N
3
12 12
Existe una correlación alta positiva
entre autoritarismo y búsqueda de
posición social.
Ing. Diana Rebaza Fernández
Análisis de asociación para variables
cualitativas
 El procedimiento de asociación para variables
cualitativas utiliza tablas de contingencia tablas
de doble entrada, proporcionan una serie de
pruebas y medidas de asociación. La estructura de
las tablas y el hecho de que las categorías estén
ordenadas o no determinan las pruebas o medidas
que se utilizan.

Ing. Diana Rebaza Fernández


Análisis para variables de nivel nominal

 Coeficiente de
2
correlacion Phi: X
Cuando las dos 
variables son variables n
nominales dicotómicas
(dos categorías), mide el
grado de asociación Donde:
entre las 2 variables. Se X2 chi cuadrado de
calcula: independencia

Ing. Diana Rebaza Fernández


 Coeficiente de
contingencia:
Es una extensión del
coeficiente Phi y es
tambien calculado en 2
X
función de la Chi C
cuadrado. Se usa para X n
2
evaluar la fuerza de
asociación en una tabla
de cualquier tamaño su
valor varía entre 0 y 1.
Ing. Diana Rebaza Fernández
 Coeficiente V de
Cramer:
Es una extensión del
coeficiente Phi. La V de
cramer es una extensión
para cuando las variables 2
X /n
nominales es politómica V
es decir tienen mas de dos (C 1)*(F 1)
categorías. Cuando la
tabla es de 2x2 , el valor
de Cramer es igual de Phi.
El valor oscila entre 0 y 1.
Se calcula:
Ing. Diana Rebaza Fernández
Análisis para variables de nivel ordinal

 Coeficiente de Tau-b de Kendall:


Es una medida de asociación que nos da la
direccionalidad para tablas cuadradas. Se interpreta
únicamente por el signo “a mayor a mejor b”. A
diferencia con el tau –c deKendall . Este ultimo se
utiliza para tablas no cuadradas, el nº de filas es
diferente al nº de columnas.

Ing. Diana Rebaza Fernández


 Coeficiente D- Somer:
Es una medida de asociación que nos proporciona
la direccionalidad. Se tiene hasta 3 opciones,
cuando no tenemos variable dependientes e
independientes (denomina prueba simétrica),
cuando la variable a es dependiente y cuando la
variable b es dependiente. Su valor varía entre 0 y 1
positivo o negativo.

Ing. Diana Rebaza Fernández


 Coeficiente Gamma:
Es una medida de asociación de direccionalidad. El
valor de Gamma varía entre -1 y 1. Si es cera 0 una
variable se relaciona o tiene que ver con la otra, si
es  a mayor nivel “a” mejor b, si es 1 de igual
manera. Si se invierte las categorías e valor de
Gamma tamben se invierte.

Ing. Diana Rebaza Fernández

También podría gustarte