Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Universidad de Burgos
4.1 Introducción
El uso del término regresión procede de Sir Francis Galton (1822-1911) de Inglaterra,
quien analizó la relación entre la estatura de los padres y la de los hijos. Llegó a la
conclusión de que los padres altos tenían hijos altos y de que los padres bajos tenían
descendientes bajos y que, para entender la altura de los hijos, había que “regresar” a
la altura de los padres.
El análisis de regresión es una técnica estadística con la que se pretende predecir los
valores de una variable dependiente mediante una (regresión simple) o varias
(regresión múltiple) independientes. Al mismo tiempo se persigue explicar la
heterogeneidad interna de la variable dependiente; es decir, su varianza, a través, de
variables explicativas.
Antes de proceder al análisis de regresión se buscan posibles relaciones entre las
variables dependiente e independientes. Para ello se observa si existe correlación
entre variables. El proceso se explica en la figura 4.1
Figura 4.1: Correlación de variables
La tabla resultante proporciona los valores del coeficiente de Pearson, que indican el
nivel de asociación entre variables de intervalo. También se muestra en nivel de
significación. Una muestra se expone en la figura 4.2. Si en este primer análisis se
observara alguna relación significativa, se procede al análisis de regresión. El proceso
se explica en la figura 4.2.
Figura 4.2. Resultados de correlación entre variables
Correlaciones
edad ingreso
edad Correlación de Pearson 1 -,047
Sig. (bilateral) . ,101
N 1211 1211
ingreso Correlación de Pearson -,047 1
Sig. (bilateral) ,101 .
N 1211 1211
Métodos y Técnicas de la Ciencia Política Análisis de Regresión Lineal
Universidad de Burgos
Variable: RELIGION
Valores: 1 “Católico”
2 “Protestante”
3 “Musulmán”
Así, se crean tantas variables ficticias como valores tenga la variable nominal, en este
caso, tres. Las nuevas variables se llamarán como las etiquetas de la variable nominal.
Concretamente, se llamarán CATOLICO, PROTESTA y MUSULMAN. El comando
sintaxis para crear estas variables es como sigue:
NUMERIC catolico protesta musulman(F2).
COMPUTE #k=0.
DO REPEAT e= catolico protesta musulman.
COMPUTE #k=#k+1.
COMPUTE e=0.
IF (religion=#k)e=1.
END REPEAT.
EXECUTE.
Obsérvese que la variable nominal debe tener ordenados sus valores de forma
ascendente empezando por 1 y que la disposición en la primera y tercera líneas
(NUMERIC y DO REPEAT) debe seguir el orden en que estén ordenadas en la
variable nominal, en este caso: catolico primero, protesta segundo y musulman
tercero, ya que los valores de la variable originaria, religión, están ordenados en ese
orden. La nueva variable catolico tendrá valor 1 cuando la variable nominal religión sea
1 que indica religión católica y 0 cuando la variable nominal religion sea cualquier otro
valor. Así funcionaría el mecanismo para cualquier otra variable. En el análisis de
regresión se deben introducir todas las nuevas variables menos una. La razón es la
siguiente: las nuevas variables ficticias sólo tienes sentido su relación con las demás
variables ficticias creadas a partir de la variable nominal originaria. Es decir, el valor b
(no estandarizado1) hace referencia a relación de esa variable ficticia con la variable
ausente.
Al mismo tiempo, es posible que una variable, por ejemplo, ingreso, tenga una
relación positiva con la variable dependiente, por ejemplo confianza en el gobierno. Sin
embargo esa relación puede ser negativa para, por ejemplo, los católicos, y positiva
para el resto (musulmanes y protestantes). En este caso existe un efecto de
1
En las variables dummy sólo se interpreta el coeficiente b no estandarizado.
Métodos y Técnicas de la Ciencia Política Análisis de Regresión Lineal
Universidad de Burgos
interacción, que debe ser corregido. Esto se hace multiplicando la nueva variable
ficticia catolico, por ingreso, y creando una nueva variable con el resultado de esa
operación:
.001 Indica que la probabilidad de que el dato sea cierto es del 99,9 % (1-0,001)
.005 Indica que la probabilidad de que el dato sea cierto es del 99,5 % (1-0,005)
.05 Indica que la probabilidad de que el dato sea cierto es del 95 % (1-0,05)
4.5 Resultados
Los resultados que se obtienen se analizan a continuación. En primer lugar se observa
el porcentaje de varianza que queda explicada y como progresa ese porcentaje
modelo tras modelo.
Sin embargo, son los coeficientes de la tercera columna, los que nos permiten hacer
comparaciones más fácilmente, por estar estandarizados. De tal forma que ambos
Métodos y Técnicas de la Ciencia Política Análisis de Regresión Lineal
Universidad de Burgos
Coeficientesa
Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error típ. Beta t Sig.
1 (Constante) 26,741 3,270 8,179 ,000
educación 1,118 ,488 ,068 2,293 ,022
edad -,036 ,038 -,028 -,947 ,344
2 (Constante) 18,792 3,880 4,843 ,000
educación 1,115 ,492 ,068 2,266 ,024
edad -,032 ,038 -,025 -,838 ,402
Orgullo nacional 2,229 1,011 ,064 2,204 ,028
Uso de violencia 2,116 ,722 ,084 2,930 ,003
a. Variable dependiente: ingreso
Modelo 1a Modelo 2 a
b Beta b Beta
(Constante) 26,741*** 18,792***
Educación 1,118 ,068* 1,115 ,068*
Edad -,036 -,028 -,032 -,025
Orgullo nacional 2,229 ,064*
Uso de violencia 2,116 ,084
a
Variable dependiente: Ingreso
b es el coeficiente de regresión no estandarizado y Beta el coeficiente de regresión estandarizado
*** Significativo al nivel .001
** Significativo al nivel .005
* Significativo al nivel .05
Modelo 1 Modelo 2
R ,081 -,135
2
R ,007 ,018
Adj. R2 ,005 ,015
Métodos y Técnicas de la Ciencia Política Análisis de Regresión Lineal
Universidad de Burgos
Bibliografía
Chatterjee, S. and Price, B. (1991). Regression Analysis by Example. Second Edition.
Wiley, New York
Daniel, C. and Wood, F. S. (1980). Fitting Equations to Data: Analysis of Multifactor
Data. Second Edition. Wiley, New York
Draper, N. and Smith, H. (1981). Applied Regression Analysis. Second Edition, Wiley,
New York
Fernández Díaz, M.J., García Ramos, J.M. (1991). 225 problemas de estadística
aplicada a las Ciencias Sociales. Madrid: Síntesis
Fernández Díaz, M.J., García Ramos, J.M. (1991). Resolución de problemas de la
estadística aplicada a las Ciencias Sociales. Madrid: Síntesis
Johnston, J. (1975). Métodos de Econometría. Vicens-Vives, Barcelona
Montgomery, D. C. and Peck, E. A. (1992). Introduction to Linear Regression Analysis.
Second Edition. Wiley, New York
Neter, J. Wasserman, W. and Kutner, M. H. (1990). Applied Linear Statistical Models.
Third Edition. Irwin, Boston
Seber, G. A. F. (1977). Linear Regression Analysis. Wiley, New York.
Weisberg, S. (1985). Applied Linear Regression. Second Edition. Wiley, New York.
Métodos y Técnicas de la Ciencia Política Análisis de Regresión Lineal
Universidad de Burgos