Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Semiparcial PDF
Semiparcial PDF
_____________________________________________________________________________
1.- Introducción
Las correlaciones semiparciales tienen interés igualmente dentro de lo que se puede llamar
control estadístico de variables, por cuanto permite conocer las distintas fuentes de variación que
determinan la variable dependiente investigada, y por tanto, permite, de acuerdo con el modelo
concebido, asignar causalidad a ciertas variables explicativas. En este sentido, este tema puede
considerarse como un preludio de los modelos causales que serán estudiados más adelante.
1
2.- Correlación semiparcial
Tengamos, en este sentido, las variables X1 , X2 e Y, cuyas correlaciones son las siguientes:
Una primera ojeada puede hacernos pensar que la variable X1 contribuye en la variabilidad de Y
en una proporción de 0.72=0.49 y que la variable X2 contribuye en una proporción de 0.62=0.36.
No obstante, se sabe por la correlación múltiple que la proporción de variación explicada es de
0.82=0.64. El total de ambas contribuciones no es igual a la suma, luego está claro que ambas
variables explicativas no son fuentes independientes de variabilidad, sino que comparten una
cierta cantidad de la misma. Existe, pues, redundancia entre ambas variables. El siguiente
diagrama de Venn ilustra lo que queremos decir:
Y
d
a c
b
X1 X2
El campo de variación de las distintas variables queda reflejada en los diferentes círculos (de
área total, la unidad), de tal manera que la contribución de X1 en Y es a+b, y la de X2, b+c . La
contribución total de X1 y X2 será a+b+c. Queda una parte -d- que es la variabilidad que no
logran explicar entre X1 y X2.
2
La proporción de variación explicada por la variable X1 será precisamente la intersección del
círculo correspondiente a X1 y del círculo indicado por Y. Así pues:
ry21 = a + b = 0.49
ry22 = b + c = 0.36
Como entre ambas variables explican una proporción de 0.64, es evidente que la contribución
adicional de X1 sobre la que explica X2 será:
Esto es, lo que añade X1 a X2 es una proporción de variación explicada de 0.28. La raíz cuadrada
de este valor se expresa como Ry(1.2) y se define como coeficiente de correlación semiparcial.
Así:
ry (1.2) = 0.28 = 0.529
Las correlaciones semiparciales tienen especial interés para conocer el reparto de las
contribuciones de las variables X sobre la variable Y. Frecuentemente las variables explicativas
están solapadas y hay que utilizar algún criterio que permita asignar las zonas compartidas a
variables específicas. A este respecto, ha de establecerse una jerarquía entre tales variables de
forma que las de mayor orden jerárquico tienen prioridad respecto a su variabilidad compartida,
a las que se les adjudica. Así, cuando el orden es 1º X1 y 2º X2 las contribuciones observadas por
las distintas variables serán:
3
Por el contrario, cuando el orden de entrada es 1º X2 y 2º X1 entonces:
Se observa la importancia del orden de entrada; de esta forma, cuando la variable X1 entra en
primer lugar explica una proporción de 0.49 y deja tan sólo un resto de 0.15 para X2. Cuando X2
es la variable de mayor rango en el modelo, explica una proporción de 0.36 y deja para X1 una
proporción explicada de 0.28. Es importante destacar que los mismos datos, según el acento que
se ponga en cada una de las variables llevará al investigador al conclusiones muy diferentes
respecto a su participación en el modelo.
Así pues, la contribución específica de las distintas variables depende de su orden de entrada.
Cuanto más intercorrelacionadas estén y más tarde se introduzcan menos explicarán. En cierto
sentido, la importancia relativa concedida a cada una de las variables, cuando existe
redundancia, es subjetiva y depende en gran parte del juicio del investigador y del dominio que
tenga de la materia. No existen reglas que especifiquen claramente el orden de entrada. No
obstante, se suele utilizar el criterio de maximizar progresivamente la variación explicada de la
variable dependiente, por lo que se introducen las variables en orden de mayor a menor
proporción de variación explicada.
Las correlaciones expuestas del tipo ry(1.2) o ry(2.1) se denominan correlaciones semiparciales de
primer orden porque es una variable cuya influencia se elimina. No obstante, puede interesar
eliminar la influencia de más variables, por ejemplo, ry(1.23) expresa que la variable Y es
relacionada con la variable X1 eliminando de ésta la influencia de X2 y X3 . Se trata de una
correlación semiparcial de orden dos. Una correlación de orden tres sería ry(1.234) donde se
relaciona Y con X1 eliminado la influencia de X2 , X3 , y X4. En general una correlación
semiparcial del tipo ry(i.23..(i).......K) es una correlación semiparcial de orden k-1 que indica la
correlación entre Y y Xi eliminado de ésta la influencia de las restantes variables explicativas.
4
El procedimiento para calcular las correlaciones semiparciales de orden superior es equivalente
al ya expuesto para correlaciones de primer orden. A este efecto, resulta de nuevo ilustrativo
recurrir a los diagramas de Venn. Supongamos, ahora, que disponemos de cuatro variables: Y,
X1, X2 , y X3, y deseamos calcular r2y(3.12):
X3
X1 X2
Si deseamos recomponer la aportación de cada una de las variables suponiendo que el orden
de entrada sea X1 , X2 , y X3:
Todas las correlaciones estudiadas anteriormente han sido siempre entre dos variables, la
variable dependiente Y y una variable explicativa Xi, eliminando la influencia, bien de una
variable (correlación semiparcial simple de primer orden) o de un conjunto de k variables
(correlación semiparcial simple de orden k).
5
semiparciales múltiples pueden ser a su vez, de primer orden o de orden superior. En términos
de proporción de variación, el cuadrado del coeficiente de correlación semiparcial múltiple
expresa la contribución que de la variación de la variable dependiente suponen una serie de
variables explicativas eliminado la influencia de otras. De esta forma, Ry(12.3) indica la
correlación semiparcial de Y con las variables X1 y X2 eliminando la influencia de X3. En
términos de proporción de variación se calculará de la siguiente manera:
El primer sumando R2y.1234 tiene k=4 grados de libertad, tantos como variables independientes
consideradas, mientras que el segundo sumando R2y.34, por la misma lógica, tiene k1=2 grados
de libertad. Así pues, la prueba F a realizar será (supongamos que operamos con 20 sujetos):
R y2(12.34) R y2(12.34)
k − k1 2
F= =
2
1 − R y .1234 1 − R y2.1234
N − k −1 15
6
Problema 1.- Tengamos los siguientes datos:
Determinar R2y.123.
SOL:
Tenemos que:
ry2(3.12) = ry23
Por tanto:
R y2.123 = R y2.12 + ry23 = 0.35 + 0.25 = 0.6
X3
X1 X2