Está en la página 1de 44

REGRESION LINEAL MULTIPLE

1. Modelo de Regresin Lineal Mltiple.


Pl i C i Planteamiento. Caractersticas.
2. Matrices de Datos. Matriz Suma de Cuadrados-
Productos Cruzados Productos Cruzados.
3. Matrices de Covarianza y Correlacin.
4 Estimacin de Parmetros Pruebas de Hiptesis 4. Estimacin de Parmetros. Pruebas de Hiptesis
5. Anlisis de Residuos. Datos Influenciales
6 P bl l M d l d R i 6. Problemas en el Modelo de Regresin:
Multicolinealidad, Heterocedasticidad,
Autocorrelacin, Omisin Variables.
1
Giampaolo Orlandoni Merli. 2012
Modelo de Regresin Lineal Mltiple (RLM)
Se dispone de p variables explicativas (X1,X2,...,Xp), una variable
respuesta Y, todas medidas sobre n individuos.
Modelo de Regresin Lineal Mltiple con p variables: g p p
Estimacin por Mnimos Cuadrados Ordinarios de
los Parmetros del Modelo de RLM
Los parmetros poblacionales se estiman siguiendo el criterio de mnimos
cuadrados, aplicados a una muestra de n observaciones:
los Parmetros del Modelo de RLM
Min SS (i) = Min (Y
i
- )
2
= Min (Y
i
o - 1X
i1
- - p X
ip
)
2
(i=1,2,,n)

| = (XX)
-1
XY
Para invertir XX, las matrices deben ser no
i l

|
= o
2
(XX)
-1
| (X X) X Y
singulares
Las variables independientes no deben
presentar caractersticas de colinealidad
Los estimadores se distribuyen normal multivariante, con vector de medias
igual a los parmetros j, y matriz de varianzas-covarianzas =o
2
I:
b ~ NID(j; )
EL MODELO RLM: FORMA MATRICIAL
25 206 8294
(X'X) = 206 2396 77177
8294 77177 3531848
725.42
(X'Y) = 8001.67
274580 7 8294 77177 3531848
0 21465 0 00749 0 00034
274580.7
2 309
0.21465 -0.00749 -0.00034
(X'X)
-1
=
-0.00749 0.00167 -0.00002
-0.00034 -0.00002 0.00000
2.309
B = 2.740
0.012
1.12250 -0.03917 -0.00178
S = -0.03917 0.00874 -0.00010
0 00178 0 00010 0 00001
1.00 -0.40 -0.60
R = 1.00 -0.38
1 00 -0.00178 -0.00010 0.00001 1.00
SIGNIFICACION ESTADISTICA de las ESTIMACIONES
de los PARAMETROS del MODELO
La significacin estadstica de cada variable se determina
calculando el cociente entre el coeficiente estimado y su y
error estndar, y comparndolo con el cuantil
correspondiente de una distribucin t-Student con (n-p-1)
grados de libertad.
La bondad de ajuste del modelo se puede valorar
mediante la varianza residual, y el estadstico R
2
( fi i t d d t i i ) (coeficiente de determinacin).
Tambin puede utilizarse el contraste F global de la
regresin calculado a partir de las sumas de cuadrados regresin, calculado a partir de las sumas de cuadrados
explicada del modelo y la suma de cuadrados no
explicada, o SC del error.
PRUEBA DE HIPOTESIS: SIGNIFICACION ESTADISTICA
de las ESTIMACIONES de los PARAMETROS del MODELO
La significacin estadstica de cada variable se determina calculando el
cociente entre el coeficiente estimado y su error estndar: Luego se compara
con el cuantil correspondiente de la distribucin t con (n-p-1) grados de
lib d libertad.
H
0
: |
i
= 0 (LA VARIABLE X
i
NO TIENE EFECTO SIGNIFICATIVO SOBRE Y)
H
1
: |
i
= 0

tc=
)

i
DS

~t
n_k
La bondad de ajuste del modelo se puede valorar mediante la varianza
residual, y el estadstico R
2
(coeficiente de determinacin).
) (
i
DS
Tambin puede utilizarse el contraste F global de la regresin, calculado a
partir de las sumas de cuadrados explicada del modelo y la suma de
cuadrados no explicada, o SC del error. p ,
H
0
: |
2
= |
3
= = |
k
= 0
H
1
: AL MENOS UN |
i
= 0

Fc =
k) SCE/(n
1) SCReg/(k

=
1 - k
k - n

) R (1
R
2
2

~ F
k-1,n-K
SIGNIFICACION ESTADISTICA de las ESTIMACIONES
de los PARAMETROS del MODELO
ANOVA SCT = SCR + SCE
PRUEBA DE BONDAD DE AJUSTE: Se usa la F calculada en el
Cuadro ANOVA. Equivale a usar el R
2
FUENTE GL SC CM F p
Modelo 2 5968.97 2984.49 570.71 0.0000
Error 22 115.05 5.23
Total (C) 24 6084.02
R2 98.1%
La significacin estadstica de cada variable se determina
haciendo las correspondientes pruebas t para cada variable en el p p p
modelo. Ello equivale a analizar el incremento de la SC aportado
por cada variable
lf 0 05 alfa = 0.05
Param Estimador SE t p LI LS
b0 2.309 1.059 2.18 0.0403 0.11 4.51
b1 2.740 0.093 29.32 0.0000 2.55 2.93
b2 0.012 0.003 4.45 0.0002 0.01 0.02
PROPIEDADES DE LOS ESTIMADORES MCO
Los estimadores MCO son los mejores estimadores lineales insesgados
(MELI), si se verifican los supuestos establecidos inicialmente.
Propiedades: INSESGADEZ, CONSISTENCIA, EFICIENCIA
bl d Los problemas de HETEROCEDASTICIDAD, MULTICOLINEALIDAD,
AUTOCORRELACION, ERROR DE ESPECIFICACION afectan estas
propiedades estadsticas.
HETERO
CEDASTICIDAD
AUTO
CORRELACION COLINEALIDAD
ERROR DE
ESPECIFICACION
Insesgado
No Eficiencia
Insesgado
No Eficiencia
MELI
R
2
grande; t pequeo
Sesgado
Inconsistentes
R
2
sobre-estimado
g ; p q
Varianzas grandes
Estimadores muy
sensibles a pequeos
Ineficientes
dependiendo de la
fuente de error
8
p q
cambios en los datos
Violacin de Supuestos: MULTICOLINEALIDAD
Fenmeno de Colinealidad: Alguna variable independiente es combinacin Fenmeno de Colinealidad: Alguna variable independiente es combinacin
lineal de otras: el modelo es irresoluble, debido a que la matriz X'X es
singular y no se puede invertir.
C bi i li l d i bl X X i ifi b Combinacin lineal de una variable X
1
con otra X
2
, significa que ambas
estn relacionadas por la expresin X
1
=b
1
+b
2
X
2
, (b
1
,b
2
constantes). El
coeficiente de correlacin entre ambas variables es 1. Esto se hace extensible
a mas de dos variables: en este caso el coeficiente de correlacin mltiple
R
X1|X2,...Xi
=1.
En la prctica, la colinealidad exacta raras veces ocurre. Surge con En la prctica, la colinealidad exacta raras veces ocurre. Surge con
frecuencia la casi-colinealidad: alguna variable es casi-combinacin lineal
de otras (algunos coeficientes de correlacin simple o mltiple entre
variables independientes estn cercanos a 1) variables independientes estn cercanos a 1).
En este caso la matriz X'X es casi-singular, y surgen problemas de precisin
en la estimacin de los coeficientes. Como la matriz de varianzas de los
estimadores es proporcional a X'X, los errores estndar de los coeficientes
son tambin grandes.
DETECCION DE COLINEALIDAD
Coeficientes de Determinacin (R
i
2
)
d d i bl i d di t
Relacionados con (R
i
2
), se definen el Factor de
I fl i d l V i (FIV) l T l i (T) de cada variable independiente con
todas las dems:
R
i
2
= R
2
xi/x1,x2,,xi-1,xi+1,,xk ;
(i=1,2,,k)
FIV= 1/(1 R
2
)
Inflacin de la Varianza (FIV), y la Tolerancia (T)
Regla emprica: existen colinealidad si algn
FIV>10 (corresponde a R
i
2
=0.9 y T
i
<0.1)
Puede haber cierta colinealidad que no involucre a FIV
i
= 1/(1-R
i
)
T
i
= 1/FIV
i
= (1-R
i
2
)
Puede haber cierta colinealidad que no involucre a
todas las variables independientes y que no es bien
detectada por el FIV.
La deteccin de la Colinealidad se
basa en los Autovalores de la matriz
estandarizada no centrada de
Indices de Condicin: para cada autovalor, el IC se
definen como la raz cuadrada del cociente entre el
mayor autovalor y los dems autovalores.
productos cruzados de variables
independientes XX
Autovalores prximos a cero son una
seal de Colinealidad entre variables
ICj = (
max
/j)
1/2
, j=1,2,,p
Rango de valores del IC:
IC < 15: Colinealidad Dbil
seal de Colinealidad entre variables
independientes (esas variables estn
muy relacionadas entre s)
IC < 15: Colinealidad Dbil
IC entre 15 y 30: Colinealidad Moderada
IC > 30: Colinealidad Fuerte.
N d C di i l d l di d Nmero de Condicin: el mayor de los ndices de
condicin: IC(XX) = max(ICj)
COLINEALIDAD: DETECCION
Indices de Condicin. Los autovalores de la matriz de varianzas-covarianzas de
las variables originales permiten determinar la existencia de colinealidad, y
tambin el nmero de colinealidades:
El nmero de autovalores nulos indica el nmero de variables que son combinacin
lineal de otras (nmero de colinealidades exactas)
Autovalores prximos a cero indican presencia de fuerte colinealidad.
Para determinar las variables implicadas en la colinealidad se calcula la Para determinar las variables implicadas en la colinealidad se calcula la
proporcin de la varianza de las variables sobre cada componente.
Si dos o ms variables tienen una proporcin de varianza alta en un componente,
esas variables estn involucradas en la colinealidad y la estimacin de sus esas variables estn involucradas en la colinealidad, y la estimacin de sus
coeficientes est degradada por la misma.
Uso de los Indices Condicin y Proporcin de descomposicin de varianza para
l di ti d C li lid d ( b l d i lt 0 5) el diagnstico de Colinealidad (umbral de proporcin alta: 0.5):
Los IC > 30 indican el nmero de colinealidades, y su magnitud mide la importancia
relativa.
Si un componente tiene un IC > 30, y dos o ms variables tienen una proporcin de
varianza alta en el mismo, esas variables son colineales.
COLINEALIDAD: CAUSAS
Las variables producto introducidas para estudiar interacciones pueden generar problemas
de colinealidad.
Una variable que tiene varianza cero (toma el mismo valor para todas las observaciones)
li lid d t l t i i d di t Si i bl ti i genera colinealidad exacta con el trmino independiente. Si una variable tiene varianza
casi cero (toma valores muy prximos para todas las observaciones) entonces se produce
casi-colinealidad.
Una varianza pequea puede deberse a una escala inapropiada para la variable. Por
ejemplo, si la edad de individuos se mide en dcadas, se obtiene una varianza 100 veces
menor que si se mide en aos. En este caso un cambio de escala puede evitar el problema
de la colinealidad.
Tambin se puede perder precisin en el clculo de Inv(X'X) por la existencia de
variables con varianzas excesivamente grandes. En este caso el cambio de escala
aconsejable es el contrario al anterior Por ejemplo puede generar problemas de precisin
14
aconsejable es el contrario al anterior. Por ejemplo, puede generar problemas de precisin
medir la edad en das.
COLINEALIDAD: SOLUCIONES
1. Cambios de escala en las variables, incluyendo el
centrado de las mismas (restar a cada variable su media) centrado de las mismas (restar a cada variable su media)
2. Eliminar alguna de las variables independientes
colineales.
3. No incluir muchos trminos de interaccin en un modelo
de regresin.
15
COLINEALIDAD: EJEMPLO
EJEMPLO COLESTEROL. Analizar el efecto del consumo de grasas
sobre el nivel de colesterol, con una muestra de 20 pacientes
sobre los que se han medido las siguientes variables:
Nivel de colesterol en plasma sanguneo (mg/100 ml)
Edad (aos)
Consumo de grasas saturadas (gr/semana)
Nivel de ejercicio (0: no, 1: moderado 2: intenso) j ( , )
16
DIAGNOSTICO COLINEARIDAD: DATOS COLESTEROL
M d l S
MODELO: COL=f(EDADGRASA EJER)
Model Summary
.690
a
.477 .378 58.153
Model
1
R R Square
Adjusted
R Square
Std. Error of
the Estimate
MODELO: COL=f(EDAD,GRASA,EJER)
690 3 8 58 53
Predi ctors: (Constant), Ejercicio, Grasa, Edad
a.
Coefficients
a
Unstandardized Standardized
99.937 61.275 1.631 .122
2.346 1.056 .464 2.223 .041 .749 1.335
2 306 720 606 3 201 006 913 1 095
(Constant)
Edad
Grasa
Model
1
B Std. Error
Coefficients
Beta
Coefficients
t Sig. Tolerance VIF
Collinearity Statistics
2.306 .720 .606 3.201 .006 .913 1.095
-6.248 19.831 -.064 -.315 .757 .796 1.256
Grasa
Ejercicio
Dependent Variable: Colesterol
a.
Collinearity Diagnostics
a
3.181 1.000 .00 .01 .01 .02
.597 2.309 .00 .02 .01 .64
Dimension
1
2
Model
1
Eigenvalue
Condition
Index (Constant) Edad Grasa Ejercicio
Variance Proportions
17
.193 4.064 .00 .18 .54 .03
.030 10.252 .99 .78 .43 .30
3
4
Dependent Variable: Colesterol
a.
Model Summary
DIAGNOSTICO COLINEARIDAD: DATOS COLESTEROL
COL=f(EDAD,GRASA,EJER,GR2,GRED,GREJ)
INTERACCIONES EN EL MODELO
.769
a
.591 .402 57.058
Model
1
R R Square
Adjusted
R Square
Std. Error of
the Estimate
Predictors: (Constant), GREJ, GRED, GR2, Ejercicio,
Edad, Grasa
a.
INTERACCIONES EN EL MODELO
Coefficients
a
258 484 130 837 1 976 070 (Constant)
Model
1
B Std. Error
Unstandardized
Coefficients
Beta
Standardized
Coefficients
t Sig. Tolerance VIF
Collinearity Statistics
258.484 130.837 1.976 .070
.443 2.867 .088 .155 .879 .098 10.225
-5.714 4.776 -1.501 -1.196 .253 .020 49.978
-3.115 45.953 -.032 -.068 .947 .143 7.005
.067 .036 1.691 1.851 .087 .038 26.530
.072 .075 .670 .966 .351 .066 15.242
(Constant)
Edad
Grasa
Ejercicio
GR2
GRED
1
-.075 1.150 -.032 -.065 .949 .130 7.683 GREJ
Dependent Variable: Colesterol
a.
Collinearity Diagnostics
a
Condition
Variance Proportions
5.276 1.000 .00 .00 .00 .00 .00 .00 .00
1.055 2.236 .00 .00 .00 .03 .00 .00 .03
.519 3.190 .00 .01 .00 .02 .02 .00 .00
.100 7.250 .03 .01 .00 .06 .01 .04 .20
Dimension
1
2
3
4
Model
1
Eigenvalue
Condition
Index (Constant) Edad Grasa Ejercicio GR2 GRED GREJ
Variance Proportions
00 50 03 0 00 06 0 0 0
.035 12.200 .06 .00 .00 .78 .03 .04 .64
.012 20.908 .02 .41 .05 .02 .31 .23 .05
.002 50.781 .89 .58 .95 .09 .64 .69 .07
5
6
7
Dependent Variable: Colesterol
a.
ELIMINACION DE COLINEALIDAD: CENTRADO DE VARIABLES
Coefficients
a
257.278 21.532 11.949 .000 (Constant)
Model
1
B Std. Error
Unstandardized
Coefficients
Beta
Standardized
Coefficients
t Sig. Tolerance VIF
Collinearity Statistics
-6.077 19.959 -.062 -.304 .766 .757 1.321
2.225 1.272 .585 1.750 .104 .282 3.543
3.311 1.156 .655 2.865 .013 .602 1.662
.072 .075 .254 .966 .351 .456 2.191
.067 .036 .467 1.851 .087 .495 2.021
Ejercicio
GRC
EDC
GRCEDC
GRC2 .067 .036 .467 1.851 .087 .495 2.021
-.075 1.150 -.018 -.065 .949 .405 2.470
GRC2
GRCEJ
Dependent Variable: Colesterol
a.
Collinearity Diagnostics
a
2.777 1.000 .01 .01 .02 .01 .03 .03 .02
1 935 1 198 04 07 02 01 01 01 05
Dimension
1
2
Model
1
Eigenvalue
Condition
Index (Constant) Ejercicio GRC EDC GRCEDC GRC2 GRCEJ
Variance Proportions
1.935 1.198 .04 .07 .02 .01 .01 .01 .05
1.055 1.622 .05 .00 .00 .42 .03 .00 .00
.547 2.253 .04 .15 .01 .01 .17 .10 .26
.328 2.910 .15 .47 .03 .03 .30 .18 .08
.205 3.678 .10 .04 .44 .39 .46 .24 .19
2
3
4
5
6
19
.153 4.262 .61 .26 .47 .13 .00 .44 .41 7
Dependent Variable: Colesterol
a.
INTERACCIN y CONFUSIN
Ejemplo. Estudio sobre la relacin entre el Nivel de Actividad Fsica (NAF) y la Presin
Sistlica (PS), controlando la variable Edad (E). Quiere determinarse si la relacin entre
NAF PS
( ), ( ) Q
NAF y PS es independiente de la variable extraa E.
1 CONFUSION
La inclusin de la variable Edad modifica la estimacin de la
1-CONFUSION
Si se incluye una
variable extraa (E)
en el anlisis cambia
La inclusin de la variable Edad modifica la estimacin de la
asociacin entre NAF y PS
El efecto de una variable difiere significativamente segn se considere
o no en el modelo alguna otra variable. sta se asocia tanto con la
en el anlisis, cambia
la interpretacin de la
relacin en estudio.
variable inicial, como con la respuesta, y en casos extremos puede
invertir el primer efecto observado.
Las estimaciones adecuadas son las que proporciona el modelo
completo (estn controladas o ajustadas por variables de confusin) completo (estn controladas o ajustadas por variables de confusin)
2-INTERACCION
L l i t di
La estimacin de la asociacin entre NAF y PS es diferente, para
diferentes valores de la variable Edad.
Cuando se incorpora ms de una variable en el modelo de regresin es
La relacin en estudio
es diferente para
diferentes niveles o
valores de la variable
t (E)
Cuando se incorpora ms de una variable en el modelo de regresin es
necesario constatar la independencia de los efectos de todas ellas. Se
supone que la asociacin de cada variable con la respuesta no depende
del valor que tomen el resto de las variables en la ecuacin de regresin.
extraa (E).
Se debe verificar si la inclusin de trminos de interaccin (producto de
pares de variables) mejora la prediccin del modelo
Ejemplo: Y = X1 X2 X3 X1*X2 X2*X3
Interaccin y Confusin son dos conceptos metodolgicos relacionados con la evaluacin
de relaciones entre variables dependientes e independientes (Ryx)
Existe Interaccin cuando (Ryx) es diferente para diversos niveles de alguna VI Extraa.
Hay Confusin cuando (Ryx) difiere dependiendo de si la VIE se incluye o no en la relacin
en estudio.
Es necesario evaluar primero la Interaccin entre variables. El uso de estimaciones que
controlan el problema de Confusin se debe hacer slo si no hay interaccin significativa
entre las variables del modelo. La Interaccin se evala mediante pruebas estadsticas
aplicadas a los trminos producto de VI del modelo.
La evaluacin de Confusin requiere comparar la estimacin de un modelo sin la variable
extraa, con un modelo que incorpora a la variable extraa. Si hay diferencias significativas
entre las dos estimaciones, entonces hay confusin entre las variables, y la VI extraa debe
incluirse en el anlisis.
PS= a
0
+ a
1
NAF + e
1
PS= b
0
+ b
1
NAF + b
2
E + e
2
Si a
1
b
1
entonces hay confusin en el modelo.
Cuando hay fuerte interaccin incluyendo alguna VI Extraa, la evaluacin de la confusin
se hace irrelevante y no es recomendable, pues priva la interaccin fuerte y significativa de
las VI en la estimacin del modelo.
1 INTERACCION Si l i i t l d d l i l d l t l
EJEMPLO DE INTERACCION Y CONFUSION.
1. INTERACCION: Si la asociacin entre la edad y el nivel de colesterol
es diferente para los individuos que realizan ejercicio comparado con los que no lo
realizan, entonces para el nivel de colesterol, existe interaccin entre la edad y el
ejercicio realizado ejercicio realizado.
En este caso no existe una nica estimacin del coeficiente de la variable de inters
Hay una estimacin para cada nivel de la otra variable, es decir, una estimacin de la
relacin entre el nivel de colesterol y la edad para los individuos que realizan ejercicio relacin entre el nivel de colesterol y la edad para los individuos que realizan ejercicio
y otra distinta para los que no lo realizan.
2. CONFUSION: La asociacin entre dos variables vara segn los diferentes niveles de g
otra variable (variable extraa).
En el ejemplo, la edad no tiene correlacin significativa con el nivel de colesterol, si no
se considera el consumo de grasas. Mientras que si se toma en cuenta dicho consumo,
la correlacin se hace significativa.
El consumo de grasas es una variable de confusin para la asociacin entre colesterol y
edad.
L j ti i d l fi i t l bti d l d l fi l La mejor estimacin del coeficiente es la que se obtiene del modelo en que figura la
variable de confusin (modelo con edad y consumo de grasas).
Variable Dependiente: COLESTEROL
MOD R
2
Ra
2
GRC EDC EJ GR2 GRED GREJ
M1 .59 .40 2.22 3.31 -6.1 .067 .07 -.75
M2 .59 .44 2.17 3.31 -5.81 .067 .07 *
M3 .59 .48 2.19 3.45 * .068 .07 M3 .59 .48 2.19 3.45 .068 .07
M4 .56 .48 1.71 3.11 1.053
M5 47 41 2 34 2 50 M5 .47 .41 2.34 2.50
M6 .24 .20 1.88 **
*EJERC no es variable de confusin, pues las estimaciones no varan al ser
eliminada
**EDC y GRC son variables de confusin Al eliminar una de ellas vara mucho **EDC y GRC son variables de confusin. Al eliminar una de ellas vara mucho
la estimacin del parmetro de la variable incluida. Ademas la correlacin con
COL baja.
EJEMPLO: InCr = f(Tcm, Hgb, Hcr) + e
Coefficients
a
5.688 .501 11.361 .000 4.695 6.680
-.069 .012 -.496 -5.851 .000 -.093 -.046 .751 1.332
(Constant)
Tiempo Circulacion
Media (seg)
Model
1
B Std. Error
Unstandardized
Coefficients
Beta
Standardized
Coefficients
t Sig. Lower Bound Upper Bound
95% Confidence Interval for B
Tolerance VIF
Collinearity Statistics
-.177 .176 -.305 -1.003 .318 -.526 .173 .058 17.143
.014 .057 .074 .244 .808 -.100 .128 .058 17.218
( g)
Hemoglobina (gr/100 ml)
Hematocrito (%)
Dependent Variable: Indice Cardiaco (lt/min m2)
a.
Collinearity Diagnostics
a
Condition
Tiempo
Circulacion Hemoglobina Hematocrito
Variance Proportions
3.863 1.000 .00 .01 .00 .00
.106 6.037 .07 .91 .00 .00
.029 11.465 .93 .08 .02 .02
.001 52.669 .00 .00 .98 .98
Dimension
1
2
3
4
Model
1
Eigenvalue Index (Constant) Media (seg)
g
(gr/100 ml) (%)
Dependent Variable: Indice Cardiaco (lt/min m2)
a.
Corr(Hematocrito, Hemoglobina)= 0.97 Colinealidad. El IC
4
=52.7
Eliminar Hemoglobina del modelo: IC = f(tcm Hcr) + e
24
Eliminar Hemoglobina del modelo: IC = f(tcm, Hcr) + e
EJEMPLO: InCr = f(Tcm, Hcr) + e
Coefficients
a
Unstandardized Standardized
5.612 .495 11.338 .000 4.632 6.593
-.070 .012 -.500 -5.914 .000 -.093 -.046 .753 1.328
-.041 .016 -.219 -2.590 .011 -.073 -.010 .753 1.328
(Constant)
Tiempo Circulacion
Media (seg)
Hematocrito (%)
Model
1
B Std. Error
Unstandardized
Coefficients
Beta
Standardized
Coefficients
t Sig. Lower Bound Upper Bound
95% Confidence Interval for B
Tolerance VIF
Collinearity Statistics
( )
Dependent Variable: Indice Cardiaco (lt/min m2)
a.
Desaparece la Colinealidad. Al eliminar Hgb, la variable Hematocrito se hace
significativa.
25
EJEMPLO. Presin = f(Tab, Caf, TabCaf) + c
Paci ent e Pr esi on Tabaco Caf TabCaf Paci ent e Pr esi on Tabaco Caf TabCaf
1 15. 0 0 1
0
2 11. 0 1 1
1
3 26. 3 1 0
0
4 13. 0 1 1
1
Relacin entre la Presin Arterial
Sistlica con el consumo de Caf y
1
5 18. 0 0 1
0
6 19. 8 1 1
1
7 23. 2 1 0
0
8 14. 4 0 0
0
9 13 3 1 1
1
Tabaco (codificadas 0:no, 1:si)
Interaccin:
9 13. 3 1 1
1
10 12. 0 1 1
1
11 22. 5 1 0
0
12 23. 5 1 0
0
13 12. 7 0 1
0
14 14 0 0 1
TabCaf = Tabaco
X
Caf
14 14. 0 0 1
0
15 11. 8 0 0
0
16 21. 2 1 0
0
17 14. 0 0 0
0
18 15. 5 1 1
1
Coefficient Correlations
a
19 12. 3 1 1
1
20 15. 0 0 0
0
21 22. 6 1 0
0
22 16. 4 0 1
0
23 23. 5 1 0
0
1.000 -.740 -.792
-.740 1.000 .595
-.792 .595 1.000
3.251 -1.779 -2.038
-1.779 1.779 1.132
TabCaf
Tabaco
Cafe
TabCaf
Tabaco
Correlations
Covariances
Model
1
TabCaf Tabaco Cafe
0
24 13. 7 1 1
1
-2.038 1.132 2.038 Cafe
Dependent Variable: Presion
a.
Model Summary
Model R R Square
Adjusted
R Square
Std. Error of
the Estimate
R Square
Change F Change df1 df2 Sig F Change
Change Statistics
.905
a
.819 .792 2.128 .819 30.254 3 20 .000
Model
1
R R Square R Square the Estimate Change F Change df1 df2 Sig. F Change
Predictors: (Constant), TabCaf, Tabaco, Cafe
a.
Coefficients
a
Unstandardized
Coefficients
Standardized
Coefficients Collinearity Statistics
13.800 1.064 12.969 .000
9.457 1.334 1.001 7.090 .000 .453 2.210
1.420 1.428 .155 .995 .332 .373 2.681
-10.852 1.803 -1.119 -6.019 .000 .261 3.829
(Constant)
Tabaco
Cafe
TabCaf
Model
1
B Std. Error Beta t Sig. Tolerance VIF
y
Dependent Variable: Presion
a.
Dependent Variable: Presion
ANOVA
b
411.056 3 137.019 30.254 .000
a
90.580 20 4.529
Regression
Residual
T l
Model
1
Sum of
Squares df Mean Square F Sig.
501.636 23 Total
Predictors: (Constant), TabCaf, Tabaco, Cafe
a.
Dependent Variable: Presion
b.
El modelo completo es significativo (p=0 00) El coeficiente de correlacin mltiple es muy alto ya que la El modelo completo es significativo (p=0.00). El coeficiente de correlacin mltiple es muy alto, ya que la
proporcin de suma de cuadrados explicada por la regresin (R2) es de 82%.
El coeficiente del trmino de interaccin es significativo (p=0.00), y aunque el coeficiente del trmino
CAFE no lo es (p=0.33), se mantiene en el modelo por el principio jerrquico.
Hay interaccin CAF x TABACO significa que no hay efecto puro del tabaco, sino que:
Hay un efecto tabaco para los consumidores de caf, y otro distinto para los no consumidores de caf.
Hay un efecto caf para los consumidores de tabaco, y otro para los no consumidores de tabaco.
Estimacin Efecto del Tabaco:
La presin arterial media en la muestra es 16.86 y la estimacin de la presin arterial de los
no fumadores y no consumidores de caf es o
0
= 13 8 no fumadores y no consumidores de caf es o
0
13.8.
La estimacin del efecto del tabaco (cambio en la presin arterial media por ser fumador) es
para los no consumidores de caf o1, y para los consumidores de caf (o1+o3).
El tabaco, para: , p
Los no consumidores de caf, aumenta la presin arterial media en 9.46 unidades, y es
significativamente distinto de cero.
Los consumidores de caf, disminuye la presin en 1.40 unidades, aunque no es
significativamente distinta de cero (su intervalo de confianza incluye el cero).
Estimacin Efecto Tabaco
No Consume Caf (o1) Consume Caf (o1+o3)
Var( ) Var(o1) = 1.78 Var(o1+o3) = 1.47
EE1 = raiz(1.78) = 1.33 EE13 = raiz(1.47) = 1.21
IC 95% 9.46 2.09 (1.33) = (6.68;12.24) (9.46 10.85) 2.09 (1.21) =
= - 1.40 2.09 (1.21) = (-3.92;1.14)
Var(o1+o3) = var(o1) + var(o3) + 2cov(o1,o3) = 1.78 + 3.25 + 2(-1.78) = 1.47
t
0.025(20)
= 2.09
o0=13.80; o1= 9.46; o2= 1.42; o3= 10.85
REGRESION POR PASOS (STEPWISE)
Las variables definitivas por el mtodo de regresin por pasos son
l d bl l d b d l las dos variables previamente seleccionadas, corroborando la
existencia de confusin entre ambas variables (GRC, EDC)
Model Summary
.494
a
.244 .202 65.889
.688
b
.473 .411 56.592
Model
1
2
R R Square
Adjusted
R Square
Std. Error of
the Estimate
Predictors: (Constant), GRC
a.
Predictors: (Constant), GRC, EDC
b.
Coefficients
a
272.800 14.733 18.516 .000
1 881 780 494 2 411 027
(Constant)
GRC
Model
1
B Std. Error
Unstandardized
Coefficients
Beta
Standardized
Coefficients
t Sig.
1.881 .780 .494 2.411 .027
272.800 12.654 21.558 .000
2.344 .691 .616 3.391 .003
2.496 .918 .494 2.720 .015
GRC
(Constant)
GRC
EDC
2
Dependent Variable: Colesterol
a
29
Dependent Variable: Colesterol
a.
Violacin de Supuestos. AUTOCORRELACION
La prueba DW sirve para verificar la independencia de las
observaciones:
El valor observado en una variable para un individuo no debe estar p
influenciado por los valores de esa variable observados en otros
individuos.
Los residuos no deben presentar ningn patron sistemtico respecto p g p p
a la secuencia de observaciones.
El estadstico DW mide el grado de autocorrelacin entre los
residuos de una observacin y la siguiente y g
Test Durbin-Watson: d (0<d<4)
Valores muy diferentes de 2 son una seal de autocorrelacin
Autocorrelacin Positiva: d0 Autocorrelacin Positiva: d0
Autocorrelacin Negativa: d4
30
EJEMPLO: EMPLEO = a + b PIB
Coefficients
a
8.303 .332 24.986 .000
119 037 351 3 227 002
(Constant)
LnPIB
Model
1
B Std. Error
Unstandardized
Coefficients
Beta
Standardized
Coefficients
t Sig.
Model Summary
b
351
a
123 112 04547 030
Model
1
R R Square
Adjusted
R Square
Std. Error of
the Estimate
Durbin-
Watson
.119 .037 .351 3.227 .002 LnPIB
Dependent Variable: LnEM
a.
.351
a
.123 .112 .04547 .030 1
Predictors: (Constant), LnPIB
a.
Dependent Variable: LnEM
b.
Autocorrelacion POSITIVA: d=0.03
USO DEL AUTORREGRESSION DE TIME SERIES
Regression Coefficients
1 067 144 1 272 7 391 000 LnPIB
B Std. Error
Unstandardized
Coefficients
Beta
Standardized
Coefficients
t Sig
32
1.067 .144 1.272 7.391 .000
-.005 .001 -.797 -4.632 .000
-.071 1.261 -.056 .955
LnPIB
T
(Constant)
The Cochrane-Orcutt estimation method is used.
PRUEBA DE DURBIN-WATSON EN DATOS TRANSVERSALES.
EJEMPLO: DATOS ULCERA
VARIABLE DEFINICION
REAPARICION TIEMPO REAPARICION SINTOMATOLOGIA ULCEROSA (MESES)
RESPUESTA
TIEMPO RESPUESTA TRATAMIENTO SINTOMATOLOGIA ULCEROSA
RESPUESTA
TIEMPO RESPUESTA TRATAMIENTO SINTOMATOLOGIA ULCEROSA
(SEMANAS)
TABACO PACIENTE HA DEJADO DE FUMAR DURANTE EL TRATAMIENTO (S1=1,NO=0)
ALCOHOL CONSUMO ALCOHOL (GRAMOS/DIA)
CAFE CONSUMO CAF (0 1 9) CAFE CONSUMO CAF (0,1,,9)
ANTIACIDO TOMA ANTIACIDOS (0,1,2,,9)
ANALSIS DE RESIDUOS:
*NORMALIDAD: GRAFICO DE PROBABILIDAD NORMAL
*HOMOCEDASTICIDAD: PRUEBA DE LEVENE Y
TRANSFORMACIONES DE LA VARIABLE DEPENDIENTE
*INDEPENDENCIA: PRUEBA DE DURBIN-WATSON
33
*EN DATOS TRANSVERSALES, QUE NO DEPENDEN DEL TIEMPO, LA PRUEBA D-W
PERMITE VERIFICAR LA INDEPENDENCIA DE LOS RESIDUOS.
*EN EL EJEMPLO, LOS PACIENTES OBSERVADOS SON INDEPENDIENTES ENTRE SI.
Model Summary
b
Adjusted Std Error of Durbin-
LOS RESIDUOS SON INDEPENDIENTES (DW=2.147)
.942
a
.887 .887 .13579 2.147
Model
1
R R Square
Adjusted
R Square
Std. Error of
the Estimate
Durbin
Watson
Predictors: (Constant), Consumo de Alcohol, Tiempo de respuesta
a.
Dependent Variable: LnREAP
b.
Coefficients
a
Dependent Variable: LnREAP
3.225 .028 113.838 .000 (Constant)
Model
1
B Std. Error
Unstandardized
Coefficients
Beta
Standardized
Coefficients
t Sig.
-.166 .004 -.773 -40.487 .000
-.012 .000 -.534 -27.979 .000
Tiempo de respuesta
Consumo de Alcohol
Dependent Variable: LnREAP
a.
Collinearity Diagnostics
a
Collinearity Diagnostics
2 784 1 000 01 02 01
Dimension
1
Model
1
Eigenvalue
Condition
Index (Constant)
Tiempo de
respuesta
Consumo
de Alcohol
Variance Proportions
2.784 1.000 .01 .02 .01
.171 4.039 .03 .82 .17
.045 7.828 .97 .15 .82
1
2
3
1
Dependent Variable: LnREAP
a.
USO DE STEPWISE COMBINADO CON METODO ENTER
(INCLUYE VARIABLES YA SELECCIONADAS)
EJEMPLO: DATOS ULCERA EJEMPLO: DATOS ULCERA.
Model Summary
M d l R R S
Adjusted
R S
Std. Error of
th E ti t
.942
a
.887 .887 .13579
.963
b
.927 .926 .10984
Model
1
2
R R Square R Square the Estimate
Predictors: (Constant), Consumo de Alcohol, Tiempo
de respuesta
a.
p
Predictors: (Constant), Consumo de Alcohol, Tiempo
de respuesta, Paciente ha dejado de fumar
b.
Coefficients
a
Unstandardized Standardized
3.225 .028 113.838 .000
-.166 .004 -.773 -40.487 .000
- 012 000 - 534 -27 979 000
(Constant)
Tiempo de respuesta
Consumo de Alcohol
Model
1
B Std. Error
Unstandardized
Coefficients
Beta
Standardized
Coefficients
t Sig.
.012 .000 .534 27.979 .000
3.118 .024 127.694 .000
-.157 .003 -.734 -46.584 .000
-.012 .000 -.536 -34.700 .000
.163 .013 .202 12.817 .000
Consumo de Alcohol
(Constant)
Tiempo de respuesta
Consumo de Alcohol
Paciente ha dejado
de fumar
2
35
Dependent Variable: LnREAP
a.
*Ecuacin de Regresin Estimada:
LnReap = 3 12 0 157 Resp 0 012 ALCOH +0 163 FUMA LnReap = 3.12 -0.157 Resp -0.012 ALCOH +0.163 FUMA
*Estimacin del Tiempo de Reaparicin de los sntomas:
REAP = exp(3 12 0 157 Resp 0 012 ALCOH +0 163 FUMA) REAP = exp(3.12 -0.157 Resp -0.012 ALCOH +0.163 FUMA)
**Fuma: REAP
T=0
= exp(3.12 -0.157 Resp -0.012 ALCOH)
**NoFuma: REAP = exp(3 12 0 157 Resp 0 012 ALCOH +0 163) **NoFuma: REAP
T=1
= exp(3.12 -0.157 Resp -0.012 ALCOH +0.163)
=exp(0.163) REAP
T=0
El Tiempo Esperado de Reaparicin de los Sntomas aumenta en un factor de El Tiempo Esperado de Reaparicin de los Sntomas aumenta en un factor de
Exp(0.163)=1.177, si el paciente deja de fumar (T=1)
-0.157 -0.012 0.163 3.12
RESP ALC FUMA REAP
4 40 0 7.5
4 40 1 8.8 17.7%
4 20 1 11 2 27 1%
36
4 20 1 11.2 27.1%
VIOLACION DE SUPUESTOS: HETEROSCEDASTICIDAD
i d l b i f i d l d l i bl La varianza de las perturbaciones c
i
es funcin de alguna de las variables
explicativas incluidas en el modelo, o
i
2
.
En presencia de heterocedasticidad, los estimadores MCO sern lineales,
insesgados y consistentes pero no eficientes Dejan de ser MELI. insesgados y consistentes, pero no eficientes. Dejan de ser MELI.
La varianza no es mnima, por lo que los resultados de las pruebas T y f no
son confiables
CAUSAS: C US S:
Ensayo y error: la experiencia reduce los errores de comportamiento en el tiempo,
o en comparacin con los menos experimentados
Mejoras en los sistemas de recoleccin de datos
O tli f t t i Outliers o factores atpicos
Mala especificacin del modelo de regresin: forma funcional incorrecta, omisin
de variables relevantes.
Asimetra en la distribucin de variables explicativas incluidas en el modelo p
(ingreso, riqueza, educacin, etc.)
Manipulacin de los datos: incorrecta transformacin de los datos (diferencias o
razones).
Nota: la heterocedasticidad es mas frecuentes en datos de corte transversal Nota: la heterocedasticidad es mas frecuentes en datos de corte transversal
(individuos, empresas, pases de diferente tamao, condicin).
37
HETEROCEDASTICIDAD: DETECCION Y SOLUCION
1. TEST BREUSCH-PAGAN-GODFREY
Sea Y
i
= |
1
+ |
2
X
2i
+ ... + |
k
X
ki
+c
i
Asuma o
i
2
= o
1
+ o
2
X
2i
+ + o
m
X
mi
O= SCReg/2 ~ _
2
m-1
H
0
: o
2
= = o
m
= 0 RESIDUOS HOMOCEDASTICOS
H
1
: AL MENOS UN o = 0 RESIDUOS HETEROCEDASTICOS
2. TEST GENERAL DE WHITE:
Sea Y
i
= |
1
+ |
2
X
2i
+ |
3
X
3i
+c
i
Asuma e
i
2
=o
1
+ o
2
X
2i
+ o
3
X
3i
+ o
4
X
2i
2
+ o
5
X
3i
2
+ o
6
X
2i
X
3i
+ V
i
nR
2
~_
2
k-1
H 0 RESIDUOS HOMOCEDASTICOS H
0
: o
2
= = o
m
= 0 RESIDUOS HOMOCEDASTICOS
H
1
: AL MENOS UN o = 0 RESIDUOS HETEROCEDASTICOS
MEDIDAS REMEDIALES: MEDIDAS REMEDIALES:
Mnimos Cuadrados Generalizados: aplicar MCO a variables transformadas de modo tal que
satisfagan los supuestos. B
MCG
=(XO
-1
X)
-1
XO
-1
y
Reducir la desigual variabilidad de la variable dependiente: logaritmos, razones, deflactacin
Transformacin de White para errores estndar robustos (regresin robusta):
38
VAR(

j
) =

=
=
n
i
ji
i
n
i
ji
w
u w
1
2 2
2
1
2
)

(

ERROR DE ESPECIFICACION
CAUSAS:
Omisin de una variable relevante (especificacin insuficiente)
Inclusin de variables irrelevantes
I t f f i l Incorrecta forma funcional
Errores de medicion
Incorrecta especificacin del trmino de error
DETECCION :
Evaluacin general del modelo
Forma iterativa (STEPWISE): incorporar progresivamente variables al Forma iterativa (STEPWISE): incorporar progresivamente variables al
modelo
Prueba RESET de RAMSEY:
Estimar regresin original. Obtener y R2 restringido g g y g
Reestimar la ecuacin incluyendo como variable explicativa.
Obtener R2 ampliado
39
F=
) /( ) 1 (
) /( ) (
2
2 2
k n R
m R R
AMPLIADO
O RESTRINGID AMPLIADO


~ F
m, n-k

ERROR DE ESPECIFICACION: CONSECUENCIAS
OMISION DE VARIABLE RELEVANTE:
Si ij 0 los parmetros estimados son sesgados e inconsistentes; pero si ij = 0
slo el intercepto es sesgado
La varianza de los residuos y la varianza de los parmetros no esta correctamente
estimada: pruebas de hiptesis y pronsticos poco confiables.
ERRORES DE MEDICION:
si el error se presenta en la variable dependiente, los parmetros sern
insesgados y consistentes pero sus varianzas sern mas grandes insesgados y consistentes pero sus varianzas sern mas grandes.
si el error de medicin se presenta en alguna variable explicativa, los
estimadores MCO son sesgados e inconsistentes
INCORRECTA ESPECIFICACIN DEL TERMINO DE ERROR:
Los parmetros sern sesgados
VIOLACION SUPUESTOS: RESUMEN
PROBLEMA CONSECUENCIAS DETECCIN SOLUCIN
Multicolinealidad Perfecta: No se
puede estimar
Situacin general Usar datos panel

(Siempre presente
en datos no
experimentales)

puede estimar
No perfecta:
Estimadores siguen
siendo MELI pero:
Pequeos cambios
en datos alteran
sustancialmente
parmetros
ti d
FIV = 1 / (1-R
2
23
)

ndice de condicin
(IC):
propio valor Mnimo
propio valor Mximo

Transformar o
eliminar
variables?

Variables
latentes
(componentes
i i l ) estimados.
Varianza de
coeficientes puede no
ser pequea (mnima
= pequea).
Coeficientes pueden
tener signos
incorrectos.
Matrices de correlacin

Regresiones auxiliares
principales)

Ridge regression
b
r
=[XX+rD]
-1
Xy

donde D es
matriz diagonal
Heteroscedasticidad
Var [c
i
, x
i
] = o
i
2

= o
2
=
i


E[cc,X] = o
2
O
Estimador lineal e
insesgado pero
ineficiente


Test de White

Test de Goldfeld-
Quandt

Test de Breusch-
Pagan/Godfrey
Transformacin
logartmica

Mnimos
Cuadrados
Generalizados
(MCG o GLS)
Wald test

Transformacin
de White
Autocorrelacin

Cov (u
t
u
t-1
) = 0
Estimador lineal e
insesgado pero
ineficiente

R
2
sobre-estimado
Test de Breusch-
Godfrey

Test de Box-Pierce

Test de Durbin Watson
Correcta
especificacin (si
es la causa)

Modelos en
diferencia o Test de Durbin-Watson diferencia o
cuasi-diferencia
(MCG)

Tendencia

Transformacin
de Newey - West
S d E ti d A li i l Ob i Sesgo de
especificacin
Estimadores
sesgados e
inconsistentes
Anlisis general

Ramsey RESET test

Test del mutiplicador
de Lagrange
Obvias

Variables
latentes

Anlisis Predictivo: el mejor modelo es el que produce predicciones ms fiables para una
ESTRATEGIAS MODELADO en REGRESION
nueva observacin
Anlisis Estimativo: el mejor modelo es el que produce estimaciones ms precisas para
el coeficiente de la variable de inters.
Pasos que deben realizarse siempre:
1.-Especificacin del Modelo Mximo.
2.-Especificacin de un criterio de comparacin de modelos y definicin de una
estrategia para realizarla estrategia para realizarla.
3.-Evaluacin de la fiabilidad del modelo.
El modelo mximo debe incluir todas las variables que van a ser estudiadas Tambin considerar los El modelo mximo debe incluir todas las variables que van a ser estudiadas. Tambin considerar los
trminos de interaccin y trminos no lineales.
Un modelo mximo grande minimiza la probabilidad de error tipo II (Infraajuste: no considerar una
variable que realmente tiene coeficiente de regresin distinto de cero). q g )
Un modelo mximo pequeo minimiza la probabilidad de error tipo I (Sobreajuste: incluir en el
modelo variables independientes cuyos coeficientes de regresin realmente son cero).
Un Sobreajuste, en general, no introduce sesgos en la estimacin de los coeficientes (los coeficientes
42
j , g , g (
de las otras variables no cambian), mientras que un Infraajuste puede producirlos, pero que un
modelo mximo grande aumenta la probabilidad de problemas de colinealidad.
COMPARACION DE MODELOS EN REGRESION
Uso de la F parcial para comparar modelos.
En un anlisis estimativo el criterio para incluir o excluir variables distintas a En un anlisis estimativo, el criterio para incluir o excluir variables distintas a
las de inters, est en los cambios en los coeficientes y no los cambios en la
significacin del modelo.
Los distintos modelos a comparar se pueden construir de dos formas: por os d s os ode os a co pa a se puede co s u de dos o as: po
eliminacin o hacia atrs (backward) y por inclusin o hacia adelante
(forward).
Aplicacin del principio jerrquico: cuando se contrasta un trmino de
interaccin, el modelo debe incluir todos los trminos de orden inferior. Si
dicho trmino permanece en el modelo, tambin ellos deben quedarse, aunque
los coeficientes correspondientes no sean distintos de cero.
Una vez encontrado el mejor modelo hay que evaluar su fiabilidad, es decir,
evaluar si se comporta igual en otras muestras extradas de la misma poblacin
EVALUACION de la FIABILIDAD del MODELO
evaluar si se comporta igual en otras muestras extradas de la misma poblacin.
El modo ms completo de evaluarlo es repetir el estudio con otra muestra y
comprobar que se obtienen los mismos resultados, o similares.
Otra alternati a consiste en di idir aleatoriamente la m estra en dos gr pos Otra alternativa consiste en dividir aleatoriamente la muestra en dos grupos y
ajustar el modelo con cada uno de ellos. El modelo es fiable si no hay grandes
diferencias entre los dos ajustes.
EJEMPLO 3: Datos OXIGENO (Atletas Masculinos)
VARIABLES Significado
EDAD (aos)
PESO (Kg)
OX (ml/Kg/min)
TASA ENTRADA OXIGENO ( l/K / i )
( / g/ )
TASA ENTRADA OXIGENO (ml/Kg/min)
TC (min) TIEMPO CARRERA (Tiempo para correr 1.5 millas)
PD
Pulso en descanso
PC
Pulso en Carrera
PCM Max Pulso en Carrera
Modelo: OX= f(TC, EDAD, PESO, PC, PCM, PD)
51
Modelo: OX f(TC, EDAD, PESO, PC, PCM, PD)
Datos OXIGENO (Atletas Masculinos)
Correlations
OX (Entrada TC (TI EMPO PCM (Max
1 -. 234 -. 305 .189 -. 164 -. 338 -. 433*
.206 .096 .309 .378 .063 .015
31 31 31 31 31 31 31
Pearson Correlat ion
Sig. (2-tailed)
N
EDAD (Aos)
EDAD (Aos) PESO (KG)
(
Oxigeno:
ml/Kg/min)
(
CARRERA:
min/1.5 millas)
PD (Pulso
Descanso)
PC (Pulso
Carrera)
(
Pulso
Carrera)
-. 234 1 -. 163 .144 .044 .182 .249
.206 .382 .441 .814 .328 .176
31 31 31 31 31 31 31
-. 305 -. 163 1 -. 862** -. 399* -. 398* -. 237
Pearson Correlat ion
Sig. (2-tailed)
N
Pearson Correlat ion
Si (2 il d)
PESO (KG)
OX (Entrada Oxigeno:
ml/Kg/min)
.096 .382 .000 .026 .027 .200
31 31 31 31 31 31 31
.189 .144 -. 862** 1 .450* .314 .226
.309 .441 .000 .011 .086 .221
Sig. (2-tailed)
N
Pearson Correlat ion
Sig. (2-tailed)
ml/Kg/min)
TC (TI EMPO CARRERA:
min/1.5 millas)
31 31 31 31 31 31 31
-. 164 .044 -. 399* .450* 1 .352 .305
.378 .814 .026 .011 .052 .095
31 31 31 31 31 31 31
N
Pearson Correlat ion
Sig. (2-tailed)
N
P C l t i
PD (Pulso Descanso)
PC(P l C )
-. 338 .182 -. 398* .314 .352 1 .930**
.063 .328 .027 .086 .052 .000
31 31 31 31 31 31 31
-. 433* .249 -. 237 .226 .305 .930** 1
.015 .176 .200 .221 .095 .000
Pearson Correlat ion
Sig. (2-tailed)
N
Pearson Correlat ion
Sig. (2-tailed)
PC (Pulso Carrera)
PCM (Max Pulso Carrera)
.015 .176 .200 .221 .095 .000
31 31 31 31 31 31 31
g ( )
N
Correlation is signif icant at the 0.05 level (2-tailed).
*.
Correlation is signif icant at the 0.01 level (2-tailed).
**.
EJEMPLO 4: Datos NIOS
VARIABLES
PESO (libras)
EDAD (meses)
ALTURA (pulgadas)
SEXO (F,M)
53
MODELO: PESO = ALTURA EDAD SEXO
VARIABLE DEFINICION
EJEMPLO 5: DATOS ULCERA
REAPARICION TIEMPO REAPARICION SINTOMATOLOGIA ULCEROSA (MESES)
RESPUESTA TIEMPO RESPUESTA TRATAMIENTO SINTOMATOLOGIA ULCEROSA (SEMANAS)
TABACO PACIENTE HA DEJADO DE FUMAR DURANTE EL TRATAMIENTO (S1=1,NO=2)
ALCOHOL CONSUMO ALCOHOL (GRAMOS/DIA)
CAFE CONSUMO CAF (0,1,,9)
ANTIACIDO TOMA ANTIACIDOS (0,1,2,,9)
54

También podría gustarte