Documentos de Académico
Documentos de Profesional
Documentos de Cultura
28/3/05
18:00
Pgina 315
Sumario:
I. Introduccin.
II. Coeficiente de determinacin: definicin e interpretacin.
III. Estructura de la informacin muestral.
IV. Grados de libertad del modelo.
V. Maximizacin del valor de R2.
VI. Conclusiones.
11 ELENA MARTINEZ
28/3/05
18:00
Pgina 317
I. INTRODUCCIN
Una de las caractersticas de la realidad, sobre todo de la econmica, es la relacin que existe entre las distintas magnitudes que la
definen. El anlisis de la covariacin entre variables, una Y, variable
dependiente o endgena, y una o varias variables X, independientes
o exgenas, supone obtener, en el caso de la regresin lineal, una
ecuacin lineal (o conjunto de ecuaciones lineales) que exprese la
relacin entre la variable endgena Y y las variables exgenas X. Se
trata de encontrar la lnea media que resuma o sintetice la dependencia entre la variable Y y las X, con la doble finalidad prctica de
explicacin o descripcin causal de la variable dependiente y previsin de los valores futuros de Y para valores dados de X. Como lnea
media o medida de posicin, debe acompaarse siempre de alguna
medida de dispersin, que demuestre el grado en el que el promedio
puede sustituir a las observaciones individuales de las que se obtuvo,
esto es, que permita medir la bondad del ajuste realizado.
El desarrollo de la informtica, la accesibilidad a ordenadores de
gran potencia y a programas estadsticos y economtricos que facilitan los clculos complejos han propiciado la generalizacin de los
estudios de correlacin y de regresin, incluso fuera del propio
mbito de la economa. De hecho, podemos encontrar Tesis Doctorales en las que el doctorando propone modelos de regresin para avalar las conclusiones de sus investigaciones, trabajos en los que los
autores se valen de modelos de regresin para expresar la preferencia de los votantes o estudios clnicos en los que se intenta explicar la
variacin en la calidad de vida de los pacientes en funcin de las
dosis tomadas de ciertos medicamentos.
El inconveniente de este uso generalizado lo encontramos cuando
el investigador hace (generalmente por falta de un conocimiento ms
profundo) un mal uso de las medidas y tcnicas de regresin. En este
artculo pretendo poner de manifiesto de una manera sencilla, a travs
de ejemplos numricos, algunos de los errores graves en el anlisis de
regresin a los que conduce la sola consideracin del coeficiente de
11 ELENA MARTINEZ
28/3/05
18:00
Pgina 318
318
11 ELENA MARTINEZ
28/3/05
18:00
Pgina 319
319
11 ELENA MARTINEZ
28/3/05
320
18:00
Pgina 320
A partir de esta varianza podemos definir una medida de dispersin relativa para la ecuacin de regresin, comparando la misma
con la varianza total de Y. As lo que conocemos como coeficiente de
determinacin lineal se define por la expresin:
Cualquiera de estas dos expresiones permiten interpretar el coeficiente de determinacin como la proporcin o porcentaje de variacin total en Y respecto a su media, que es explicada por el modelo
de regresin. Es usual expresar esta medida en tanto por ciento, multiplicndola por cien.
11 ELENA MARTINEZ
28/3/05
18:00
Pgina 321
321
11 ELENA MARTINEZ
28/3/05
18:00
Pgina 322
322
Dato
Variable X
Variable Y
(valor prefijado) (muestra 1)
Variable Y
(muestra 2)
Variable Y
(muestra 3)
4,84
3,96
5,28
5,99
5,21
5,73
6,67
6,28
6,19
5,92
7,21
6,68
7,88
7,93
7,17
6,84
8,55
7,67
10
8,26
9,03
8,17
11
8,95
9,39
8,62
12
10,71
9,62
9,11
10
13
9,83
9,73
11,9
11
14
10,52
9,76
10,13
TABLA I
Realizando el ajuste lineal por el mtodo de los mnimos cuadrados, para cada una de las tres muestras obtenemos la misma ecuacin
y el mismo valor para el coeficiente de determinacin: