Está en la página 1de 20

CAPTULO XIX: TCNICAS DE INVESTIGACIN EMPLEADAS .

577

En este captulo se describen las tcnicas de anlisis cuantitativo empleadas
para el anlisis de los datos, con la finalidad de contrastar las hiptesis de
trabajo. Fundamentalmente se emplearn dos tcnicas de anlisis estadstico
multivariante: el anlisis factorial y la regresin mltiple. Aunque se darn las
oportunas referencias para el lector, no se entrar en la descripcin del aparato
matemtico asociado a estas dos tcnicas. Ms bien, se darn indicaciones
relevantes para la investigacin concreta, en lo relativo a las siguientes
cuestiones:

Funcionalidad y prestaciones de la tcnica estadstica, y su aplicacin al
contexto de la investigacin, as como elecciones relativas a la seleccin de
diferentes tcnicas y variables a utilizar.

Formato de la informacin suministrada por el programa informtico
MINITAB, empleado para el anlisis de los datos empricos.

Lmites de los parmetros de validez de los anlisis, para que los resultados
obtenidos sean estadsticamente significativos.

Los resultados de la explotacin de los datos empricos se detallan en la parte V
de la tesis, y la discusin relativa a la interpretacin de los resultados y al grado
de contrastacin de las hiptesis se detallar en la parte VI.

CAPTULO XIX: TCNICAS DE INVESTIGACIN EMPLEADAS.
578

XIX.1. EL PROCESO DE ANLISIS CUANTITATIVO DE LA INVESTIGACIN

La figura XIX.1.a describe el proceso de anlisis cuantitativo realizado en la
investigacin. Dicho anlisis incluye los siguientes pasos:

A partir de los indicadores de eficacia recogidos para la muestra, se han
obtenido los criterios de eficacia para la contrastacin de las hiptesis. La
naturaleza de los criterios se determinar mediante la utilizacin de tcnicas de
anlisis factorial, mediante las que se realizar la reduccin dimensional del
conjunto de indicadores. Los resultados del anlisis factorial, as como su
interpretacin, se detallan en el captulo XX.

Seguidamente, tras el anlisis previo de los datos recabados acerca de la
planificacin estratgica, se utilizan ambos conjuntos de datos (los criterios de
eficacia organizativa y los de planificacin estratgica) para probar las hiptesis.
Dado que se trata de establecer la existencia de relaciones entre ambos
conjuntos de variables, se emplearn tcnicas de regresin mltiple. Los
resultados derivados de la utilizacin de esta tcnica se detallan en el captulo
XXI.

Finalmente, cabe interpretar los resultados del anlisis de regresin a la luz de
la naturaleza de las variables, con lo que se determinar si las hiptesis se han
contrastado o refutado. La interpretacin forma parte de la discusin de los
resultados, y se detalla en el captulo XXII.

Por lo tanto, las tcnicas de anlisis estadstico empleadas ms frecuentemente
en la investigacin son el anlisis factorial y la regresin mltiple. En los
siguientes apartados del captulo se indican las caractersticas a retener de
estas tcnicas para la interpretacin de los resultados de la investigacin.
CAPTULO XIX: TCNICAS DE INVESTIGACIN EMPLEADAS .
581

XIX.2. EL ANLISIS FACTORIAL.

En este apartado se indican criterios para las decisiones que debe tomar en
investigador al realizar un anlisis factorial, consistentes en la estimacin de los
factores (especialmente en la determinacin del nmero de factores a retener),
y la posterior interpretacin de los factores retenidos, fundamentada ms en la
naturaleza del modelo que en consideraciones estadsticas. Para el caso de la
investigacin, tambin es necesario obtener variables representativas del
contenido de cada factor.


XIX.2.1. OBJETIVOS DEL ANLISIS FACTORIAL.

El anlisis factorial es una tcnica de anlisis estadstico multivariante cuyo
objetivo es el de reducir la complejidad de un conjunto de datos multivariante, al
precio de perder un cierto porcentaje de explicacin de la varianza de la
muestra. Suele reservarse la denominacin de anlisis factorial al anlisis
factorial tipo R, cuyo objetivo es encontrar, a partir de la matriz de covarianzas o
correlaciones de las variables, un conjunto reducido de variables latentes que
expliquen un porcentaje apreciable de la varianza de la muestra. Dichas
variables latentes reciben el nombre de factores. Tambin puede utilizarse el
anlisis factorial tipo Q, cuyo objetivo consiste en encontrar conjuntos de
individuos con valores semejantes de las variables, con la finalidad de
determinar un nmero reducido de agrupamientos, de los que se espera que los
individuos contenidos en cada uno de ellos tengan algn tipo de propiedad
comn.

En la investigacin, el objetivo perseguido es doble:

Determinar con cuntas variables latentes es posible representar un
CAPTULO XIX: TCNICAS DE INVESTIGACIN EMPLEADAS.
582
porcentaje apreciable de la variabilidad observada en las observaciones
acerca de los criterios de eficacia organizativa.
Una vez determinada esa cantidad, identificar las variables que sustituirn al
conjunto de indicadores de partida, para su anlisis posterior.

Para obtener una reduccin significativa de las variables con las que puede
representarse la eficacia organizativa, es necesario que exista un nmero
apreciable de correlaciones significativas (aproximadamente por encima de 06,
para el tamao muestral de la investigacin) dentro de la matriz. En caso
contrario, la simplificacin que podr obtenerse ser bastante pobre, debido a
que las variables apenas estn relacionadas entre s. Por otra parte, si existen
correlaciones muy elevadas entre dos variables, puede eliminarse del anlisis
alguna de ellas sin perjuicio de la interpretacin de los resultados obtenidos, y
en beneficio de la interpretacin de stos.

Como se ha indicado, el anlisis factorial parte del estudio de la varianza del
conjunto de datos. Dicha varianza conjunta es susceptible de descomponerse
en tres componentes:

Varianza comn: varianza de una variable compartida con el resto de
variables del anlisis.
Varianza especfica: asociada solamente a una variable determinada.
Error: varianza atribuible a la fiabilidad imperfecta de las medidas.

Existen dos procedimientos para realizar el anlisis factorial: el anlisis factorial
comn
1
(AFC) y el anlisis en componentes principales
2
(ACP). El primero usa
slo de la varianza especfica para obtener los factores, mientras que el
segundo usa slo de la varianza comn. Sin embargo, los primeros factores

1
En ingles, se denomina maximum likelihood factor analysis. En francs, analyse en facteurs
communs et spcifiques.
2
En ingls, principal components factor analysis. En francs, analyse en composantes
principales.
CAPTULO XIX: TCNICAS DE INVESTIGACIN EMPLEADAS .
583
obtenidos mediante ACP (los que explican una mayor proporcin de la
varianza) contienen una cantidad relativamente menor de varianza especfica,
por lo que es de esperar que no sean muy distintos de los obtenidos por AFC.
De hecho, algunos autores proponen como prueba de validez la comparacin
de factores anlogos obtenidos por los dos mtodos (Johnson y Wichern 1992:tt
tt). Por esta razn, suele realizarse el anlisis factorial por los dos mtodos
para contrastar la solidez de los resultados obtenidos.


XIX.2.2. ESTIMACIN DE LOS FACTORES.

Una vez obtenida la matriz de datos (individuos variables), el primer paso del
anlisis factorial consiste en la estimacin de los factores, que comprende dos
fases:

Valorar cul es el nmero de factores a retener para el anlisis: un nmero
excesivamente bajo sera poco representativo de la variabilidad observada,
y un nmero demasiado alto reducira la utilidad del anlisis factorial.

La solucin obtenida por cada uno de los mtodos no es nica. Sin
embargo, el resto de soluciones se puede obtener a partir de una rotacin
de la solucin original. Tambin debe escogerse el mtodo de rotacin ms
adecuado para los fines de la investigacin.

Pueden encontrarse en la literatura varios criterios para la determinacin del
nmero de factores a retener. Algunos de stos se detallan en el cuadro
XIX.2.3.a. Para la investigacin, se ha escogido utilizar los criterios de raz
latente y de contraste de cada, siempre que el porcentaje de varianza
explicado por el modelo est en torno al 60%, valor admitido en ciencias
sociales (Hair et al. 1998:93), y que los resultados obtenidos por ACP y AFC
puedan ser interpretados del mismo modo. La estimacin del nmero de
CAPTULO XIX: TCNICAS DE INVESTIGACIN EMPLEADAS.
584
factores exige la realizacin de un anlisis con un gran nmero de factores, y
comprobar que se siguen cumpliendo las condiciones establecida para el
conjunto de factores elegido.


CUADRO XIX.2.2.a. CRITERIOS DE SELECCIN DEL NMERO DE
FACTORES.
Criterio de raz latente.

Se parte de la base de que para retener un factor, ste debe justificar la
varianza de al menos una variable. Utilizando la matriz de correlaciones,
esto supone retener los factores con valor propio (en ACP) o de raz
latente (AFC) mayor que uno.

Criterio de porcentaje de la varianza.

El nmero de factores se obtiene a partir de la varianza total explicada
por el anlisis. En ciencias naturales, dicha varianza es del orden del
95%. Para ciencias sociales, se admiten valores del 60%.


Criterio a priori.

El investigador conoce antes de realizar el anlisis el nmero de factores
a obtener, por lo que realiza el anlisis con dicho nmero. Si el resultado
obtenido es aceptable bajo los otros criterios, puede servir para probar
alguna hiptesis acerca del nmero de variables latentes significativas.

Criterio de contraste de cada.

Se determina el nmero de factores a retener examinando la grfica de la
varianza comn de cada uno de los factores, ordenados de mayor a
menor varianza. Se descartan aquellos factores a partir de los cuales la
varianza explicada es constante y pequea (del orden de 02, si se usa la
matriz de correlaciones).

FUENTE: Hair et al. 1998:92 94.

Una vez fijado el nmero de factores, puede procederse a realizar el anlisis de
factores definitivo. El programa informtico utilizado aporta la siguiente
informacin:

CAPTULO XIX: TCNICAS DE INVESTIGACIN EMPLEADAS .
585
Los valores de las cargas factoriales de la solucin obtenida (unrotated
factor loadings and communalities), as como de la solucin asociada al
mtodo de rotacin elegido (rotated factor loadings and communalities). Las
cargas factoriales son la correlacin entre las variables y cada uno de los
factores. Una elevada carga factorial permite asociar un factor a una
determinada variable.

La varianza del conjunto explicada por cada factor (variance), en valor
absoluto y en porcentaje. La varianza total, usando la matriz de
correlaciones (esto es, la matriz de covarianzas con datos estandarizados)
ser igual al total de variables utilizado.

La ltima columna contiene las varianzas comunes (communalities) de cada
variable. Se trata de la varianza de cada variable explicada por el anlisis
factorial. Si se usa la matriz de correlaciones, las varianzas comunes
tendrn un valor entre 0 y 1. Si el valor es 1, el anlisis explica toda la
varianza de la variable considerada.

Para la investigacin, se han fijado los siguientes parmetros del modelo para
todo el desarrollo:

Se ha analizado la matriz de correlaciones, esto es, se han tratado los datos
estandarizados. Por este motivo, todas las variables tienen varianza igual a
uno, haciendo ms fcil la interpretacin de los datos.

Se ha escogido el mtodo de rotacin VARIMAX, que obtiene la rotacin
que maximiza la variabilidad de las cargas factoriales asociadas a cada
factor. Se trata del mtodo de rotacin de ms aceptacin (Hair et al.
1998:97 98).

Se han realizado los anlisis mediante los mtodos AFC y ACP,
CAPTULO XIX: TCNICAS DE INVESTIGACIN EMPLEADAS.
586
comparando los resultados obtenidos por uno y otro mtodo. Para ello, se
ha obtenido la matriz de correlaciones de los valores de los factores para los
individuos obtenidos por ambos mtodos a partir de las puntuaciones de los
factores. Idealmente, deben observarse correlaciones elevadas entre los
factores de la misma naturaleza hallados mediante el ACP y el AFC.

CAPTULO XIX: TCNICAS DE INVESTIGACIN EMPLEADAS .
587

XIX.2.3. INTERPRETACIN DE LOS FACTORES.

Una vez obtenido el anlisis factorial definitivo, el investigador, basndose en
los valores de las cargas factoriales de cada variable obtenidas por el mtodo
de rotacin elegido, debe interpretar la naturaleza de lo que se est midiendo
con cada uno de los factores.

Esta fase depende exclusivamente de la naturaleza de las variables. La relacin
entre factores y variables se obtiene a travs de las cargas factoriales.
Idealmente, cada variable debe tener cargas factoriales elevadas en un solo
factor, y cada factor debe tener asociadas cargas elevadas con variables
relacionadas conceptualmente entre s. De esta manera, es posible interpretar
el significado de cada uno de los factores. Si un factor tiene asociadas gran
nmero de variables heterogneas, puede ser recomendable aumentar el
nmero de factores en el anlisis, esperando que dichas variables se asocien a
diferentes factores.

Una vez interpretados los factores, puede ser necesario (como es el caso de la
investigacin) asignar a cada uno de los individuos de la muestra un valor para
cada uno de los factores retenidos, usando algn tipo de variable
representativa. Existen varios mtodos para determinar la variable significativa
de un factor (Hair et al. 1998:103 107): la variable suplente, el uso de escalas
aditivas o los propios factores, a partir de las puntuaciones factoriales.

El mtodo de la variable suplente supone representar el factor por una
variable con una elevada carga factorial. Si existen varias variables con
carga elevada, la eleccin puede fundamentarse en la naturaleza de las
variables, establecida en el marco terico. El uso de una nica variable para
representar el factor puede distorsionar el anlisis, dado que no se incluye
todo el contenido conceptual del factor en la variable representativa.
CAPTULO XIX: TCNICAS DE INVESTIGACIN EMPLEADAS.
588

La escala aditiva consiste en definir una variable representativa a partir de
una combinacin lineal de las variables con mayores cargas factoriales.
Usualmente se emplea la suma de las variables, o su valor medio. De esta
manera, nos aseguramos de que en la variable representativa del factor
estn presentes todos los componentes asociados a dicho factor.

Mediante el uso de la puntuacin factorial, el factor se representa como una
combinacin lineal de todas las variables incluidas en el anlisis, aunque los
mayores coeficientes (denominados puntuaciones factoriales o factor
scores) estarn asociados a las variables con cargas factoriales elevadas.
Las puntuaciones factoriales de las variables con cargas factoriales
reducidas pueden distorsionar seriamente, en ocasiones, el contenido de
este tipo de variables. Si las variables son homogneas, puede ser
interesante usar la matriz de covarianzas para que los factores tengan las
mismas dimensiones.

El uso de escalas aditivas, a travs de la media de las variables con carga
factorial ms elevada, parece ser el ms adecuado para las circunstancias de la
investigacin, dado que la variable as obtenida representa mejor todo el
contenido del factor.

CAPTULO XIX: TCNICAS DE INVESTIGACIN EMPLEADAS .
589

XIX.3. LA REGRESIN MLTIPLE.

En este apartado se indican, adems de los objetivos alcanzables mediante la
regresin mltiple, los criterios relativos al diseo estadstico de la regresin, a
la determinacin del modelo ms adecuado para el conjunto de variables
disponible, y a la validacin del modelo retenido.


XIX.3.1. OBJETIVOS DE LA REGRESIN MLTIPLE.

La regresin mltiple es la tcnica de dependencia ms usada en anlisis
multivariante. Consiste en establecer un modelo lineal, consistente en una
funcin lineal (ecuacin de regresin) de una serie de variables, llamadas
variables independientes o predictores, que intenta predecir los valores de una
variable dependiente o respuesta. Generalmente, la funcin se obtiene por el
criterio de los mnimos cuadrados, esto es, la minimizacin de los residuos
(diferencia entre los valores reales de la variable dependiente y la prediccin de
su valor establecida por la ecuacin de regresin).

La regresin mltiple es ampliamente utilizada para la contrastacin de
hiptesis que supongan una relacin de causalidad, con dos propsitos:
predictivo y explicativo.

Un modelo de regresin es predictivo, dado que la ecuacin de regresin
permite obtener una prediccin para la variable dependiente mejor que su
estimacin por la media.

Por otra parte, un modelo de regresin tambin puede ser explicativo: la
presencia de un coeficiente de regresin estadsticamente significativo
prueba la relacin entre una variable dependiente (significada como efecto
CAPTULO XIX: TCNICAS DE INVESTIGACIN EMPLEADAS.
590
en el modelo terico) y una variable independiente (significada como causa
en este mismo modelo). En este caso, no importa tanto el valor del
coeficiente como su signo, y que sea diferente de cero.

La determinacin de un modelo de regresin multivariante es notablemente ms
compleja que su correspondiente univariante. Esto es debido a la existencia de
correlaciones entre variables dependientes: la inclusin en el modelo de una
variable independiente altamente correlacionada con otras variables
independientes no aadir poder explicativo al modelo. En este sentido, uno de
los problemas asociados a la regresin mltiple es determinar qu variables
deben incluirse en el modelo para que ste tenga sentido segn el modelo
terico, y adems tenga una elevada significacin estadstica.

Las cuestiones clave en torno al establecimiento de modelos de regresin
mltiple para la investigacin giran en torno al diseo del modelo, la
metodologa empleada en su estimacin, y los criterios por los que se
considerar, teniendo en cuenta la dimensin muestral, que el modelo de
regresin obtenido tenga suficiente significacin.

CAPTULO XIX: TCNICAS DE INVESTIGACIN EMPLEADAS .
591

XIX.3.2. DISEO DEL MODELO DE REGRESIN.

Desde el punto de vista operativo, son destacables dos cuestiones relativas al
diseo de un modelo de regresin para la contrastacin de las hiptesis del
modelo: la naturaleza de las variables dependientes e independientes, y la
inclusin en el modelo del papel moderador de las variables de contingencia.


Variables dependientes e independientes.

Las variables independientes y la dependiente a considerar en una regresin
mltiple dependen de la naturaleza de la hiptesis. En el captulo XVI, se
establece para cada hiptesis a contrastar cules son las variables a tomar en
consideracin. Al construir el modelo terico, deben evitarse en la medida de
los posible los dos posibles errores al seleccionar las variables. La inclusin de
variables irrelevantes puede llevar a enmascarar el efecto de variables
conceptualmente ms tiles, lo cual puede dificultar la interpretacin del
modelo, aunque tenga una elevada significacin estadstica. La omisin de
variables relevantes tambin puede distorsionar seriamente el modelo,
especialmente cuando las variables omitidas estn fuertemente correlacionadas
con variables incluidas en el modelo.

Sin embargo, desde el punto de vista estadstico, hay que tener en cuenta la
correlacin entre las variables, independientes y dependiente, que forman parte
del modelo. Para el anlisis estadstico, la situacin ideal es la de un conjunto
de variables independientes correlacionadas significativamente con la variable
dependiente, y dbilmente correlacionadas entre s. La presencia de
correlaciones significativas, incluso siendo relativamente reducidas, entre las
variables independientes obliga al investigador a la cautela: los modelos de
regresin obtenidos el los procedimientos por etapas pueden enmascarar
CAPTULO XIX: TCNICAS DE INVESTIGACIN EMPLEADAS.
592
relaciones entre variables independientes y dependiente que no son relevantes
desde el punto de vista predictivo, pero que pueden dar lugar a resultados
sustantivos. El tratamiento de las relaciones entre variables puede ser de gran
complejidad, aunque pueden servir de ayuda los clculos de la varianza nica y
compartida (cfr. Hair et al. 1998:182 183) y la definicin conceptual de las
variables establecida en el modelo.


Transformaciones de las variables y variables moderadoras.

Para determinadas situaciones, puede ser de utilidad emplear transformaciones
de las variables originales para el anlisis de regresin.

Una primera transformacin puede ser la codificacin de indicadores, en los que
la pertenencia de un individuo a un determinado grupo o categora se indica por
una variable entera, con tantos valores como categoras. El ejemplo ms
sencillo es el de una variable binaria (0 1), que divide a la muestra en dos
categoras. Si el coeficiente de regresin de la variable binaria es
estadsticamente significativo, esto querr decir que las diferentes categoras
tendrn ecuaciones de regresin con la misma pendiente, diferenciadas
nicamente en el trmino constante. En este caso, la variable dependiente es
diferente para cada categora por especificidades propias de sta.

Otro hecho que puede detectarse mediante regresin es la interaccin: el hecho
de que un individuo presente determinados valores en una variable moderadora
(que puede ser una de las independientes, o bien una de codificacin) afecta a
la relacin entre una de las variables independientes y la dependiente. Dicha
interaccin se representar mediante una nueva variable, producto de la
variable independiente y la moderadora. As, si se desea estimar la relacin
entre una variable dependiente Y, una independiente X1 y una moderadora X2,
se partir de la siguiente ecuacin de regresin:
CAPTULO XIX: TCNICAS DE INVESTIGACIN EMPLEADAS .
593

Y = b
0
+ b
1
X
1
+ b
2
X
2
+ b
3
X
1
X
2
+ error residual [XIX.1]

El coeficiente b
2
es representativo de la influencia de la moderadora sobre la
variable dependiente, y el coeficiente b
3
de la interaccin entre la independiente
y la moderadora.

Un ltimo tipo de transformaciones son aquellas en las que se busca la relacin
entre la variable dependiente y una funcin de alguna independiente: las ms
frecuentes son la transformacin cuadrtica, la cbica y la de raz cuadrada.
Estas transformaciones pueden ser de utilidad cuando el anlisis residual
evidencia relaciones de dependencia no lineales, o el anlisis de los residuos
revela problemas de heterocedasticidad (valores de varianza significativamente
diferentes en funcin de los valores estimados de la variable dependiente) (cfr.
Hair et al. 1998:166 169,69 70)..


XIX.3.3. ESTIMACIN DEL MODELO DE REGRESIN.

Considerando lo indicado en los apartados anteriores, se ha establecido un
procedimiento, descrito sumariamente en la figura XIX.3.3.a, para obtener los
diferentes modelos de regresin que permitan contrastar las hiptesis de la
investigacin.

A partir del contenido de la hiptesis y de las variables disponibles en el
modelo, se procede a seleccionar la(s) variable(s) dependiente(s), as como las
independientes. La seleccin de ms de una variable dependiente dar lugar a
varias ecuaciones de regresin. Tambin es posible incluir en el modelo
variables moderadoras, generalmente en funcin de las variables contingentes.

Previamente a la definicin de la ecuacin de regresin, se obtiene la matriz de
CAPTULO XIX: TCNICAS DE INVESTIGACIN EMPLEADAS.
594
correlaciones entre las variables independientes, ms la variable dependiente.
Las correlaciones entre variables independientes son especialmente tiles para
la interpretacin de los resultados, dado que una variable no significativa en el
modelo de regresin, s que puede serlo en la interpretacin. La deteccin de
un nmero elevado de correlaciones puede hacer til un anlisis factorial de las
variables independientes, para conocer con ms detalle la estructura del
conjunto.

Seguidamente, se pasa a obtener la ecuacin de regresin para el modelo.
Generalmente, se proceder a obtener el modelo con mayor significacin
estadstica posible mediante la exploracin por etapas (cfr. Hair et al. 1998:171
173).

Junto con la ecuacin de regresin, se obtienen parmetros relativos al anlisis
de la validez de sta (ver ms adelante, en XIX3.4), as como el grfico de los
residuos en funcin de los valores previstos por la ecuacin. Con estos
elementos, es posible valorar la posibilidad de realizar algn tipo de
transformacin de las variables que permita obtener un modelo ms
significativo. Una vez realizadas las transformaciones, deber volver a
estimarse el modelo de regresin.

El resultado final es un modelo de regresin estadsticamente vlido, de
finalidad explicativa, que permita emitir conclusiones acerca de la contrastacin
o falsacin de la hiptesis de trabajo.

CAPTULO XIX: TCNICAS DE INVESTIGACIN EMPLEADAS .
597

XIX.3.4. ANLISIS DE LA VALIDEZ DE LA REGRESIN.

Los elementos que se cuentan para evaluar la validez del anlisis de regresin
realizado consisten en pruebas de hiptesis sobre los valores del coeficiente de
determinacin y los coeficientes de la ecuacin de regresin, el anlisis de los
residuos y la deteccin de observaciones influyentes o anmalas.

Coeficiente de determinacin.

Uno de los indicadores ms utilizados para la validez de la regresin es el
coeficiente de determinacin R
2
, indicador que admite dos interpretaciones. Es
el cociente entre la suma de cuadrados de lla regresin y la suma de cuadrados
de la muestra, y tambin el cuadrado de la correlacin entre los valores reales y
los valores previstos. Un elevado valor de R
2
muestra que los errores de
prediccin de la regresin son reducidos (nulos en el caso de que R
2
= 1), y que
por tanto la ecuacin de regresin es explicativo de un elevado porcentaje de la
variabilidad de la muestra.

La significacin estadstica del coeficiente de determinacin se valida a partir de
un ratio F, resultado de dividir la suma de errores al cuadrado explicada por la
regresin y la suma total de errores al cuadrado por sus respectivos grados de
libertad. Un elevado valor del estadstico F evidenciar una elevada
probabilidad de que R
2
sea diferente de cero. El programa da el p valor del
test: la probabilidad de equivocarse al rechazar la hiptesis de que R
2
es igual a
cero.

Algunos ejemplos de la significacin de R
2
se encuentran en la tabla XIX.3.4.a,
en la que se indica el mnimo R
2
significativo para un determinado nivel de
potencia estadstica , en funcin del nmero de variables independientes y un
determinado tamao muestral.
CAPTULO XIX: TCNICAS DE INVESTIGACIN EMPLEADAS.
598

CUADRO XIX.3.4.a. VALORES MNIMOS DE R2 ESTADSTICAMENTE
SIGNIFICATIVOS.
Variables independientes ( =
001)
Variables independientes ( =
005)
Tamao
muestral
2 5 10 20 2 5 10 20
20 45 56 71 - 39 48 64 -
50 23 29 36 49 19 23 29 42
100 13 16 20 26 10 12 15 21
250 5 7 8 11 4 5 6 8
500 3 3 4 6 3 4 5 9
1.000 1 2 2 3 1 1 2 2
FUENTE: Hair et al. 1998:159.


Significacin de los coeficientes de regresin.

Otro dato importante suministrado por el programa informtico es la
significacin estadstica de los coeficientes de regresin. Se trata de una prueba
de hiptesis de la hiptesis nula H
0
:
i
= 0 para cada uno de los coeficientes,
aceptando que su valor muestral b
i
sigue una distribucin de t de Student. El
estadstico es funcin del valor del coeficiente de regresin y de su desviacin
estndar (tambin indicado en los resultados). Un elevado valor absoluto de la t
de Student indica una reducida probabilidad (tambin indicada en la tabla) de
equivocarse al rechazar la hiptesis nula.

La prueba de significacin del coeficiente de regresin es de gran importancia
para la contrastacin de las hiptesis, puesto que es la prueba estadstica de la
existencia de relacin entre la variable independiente y la dependiente.

CAPTULO XIX: TCNICAS DE INVESTIGACIN EMPLEADAS .
599

Anlisis de los residuos.

Una de las hiptesis de base para la bondad del modelo de regresin es
suponer que los residuos (diferencia entre el valor real y el previsto por la
ecuacin de regresin) siguen una ley normal, de valor medio cero y varianza
constante. La verificacin de la suposicin se realiza a travs de la grfica de
los residuos en funcin de los valores previstos. Para que se cumpla la
hiptesis, la grfica debe presentar una nube de puntos centrada en el cero, y
de variabilidad uniforme a lo largo de los valores previstos (homocedasticidad).
La observacin de formas que se alejen de este patrn (cfr. Hair et al.
1998:167) puede aconsejar realizar transformaciones de algunas de las
variables, y volver a realizar el anlisis de regresin.


Observaciones influyentes y anmalas.

En el anlisis de los residuos, podemos encontrar que alguno de los individuos
de la muestra influyen de manera desproporcionada en los parmetros de la
distribucin de los residuos. El programa detecta dos tipos de observaciones
influyentes: los llamados atpicos y los puntos de apalancamiento (Hair et al.
1998:177 178).


Un punto atpico es una observacin con un elevado valor residual, que
influye significativamente en el valor de la varianza residual. Es probable
que, para su estimacin, deba contarse con un modelo de regresin
especfico.

Un punto de apalancamiento es una observacin que tiene un valor
significativamente diferente del valor observado de la variable
CAPTULO XIX: TCNICAS DE INVESTIGACIN EMPLEADAS.
600
independiente. Puede afectar de forma significativa al valor de alguno de los
coeficientes de estas variables independientes.

Las observaciones anmalas pueden afectar significativamente el valor de la
ecuacin de regresin (cfr. Hair et al. 1998:179, donde se indican algunos
ejemplos). Pueden ser representativas de comportamientos anmalos, que
pueden aportar informacin adicional acerca de las verificacin de las hiptesis
de la investigacin.

También podría gustarte