Está en la página 1de 3

COEFICIENTE PHI

Coeficiente phi

En muchas situaciones es de interés estudiar la relación entre dos o más variables definidas en una
población, basados en los resultados encontrados en la muestra. Por ejemplo, podemos estar
interesados en estudiar la relación entre el sexo y el lugar de procedencia de los participantes, entre
el sexo y el rendimiento académico en el curso de álgebra, entre la edad y el tiempo de servicio de
los participantes en el programa de capacitación. En todos los casos nos basamos en valores que
encontramos en la muestra y nos preguntamos si dichos valores son estadísticamente significativos.
Para abordar el problema planteado, en cada tipo de situación, primero presentaremos la
metodología para calcular el coeficiente de correlación en la muestra y luego la metodología
correspondiente a pruebas de hipótesis para el parámetro poblacional.
Prueba de hipótesis para el coeficiente de correlación PHI
Cuando se desea estudiar la asociación entre dos variables de naturaleza cualitativas dicotómicas,
se recomienda obtener el coeficiente de correlación phi. Por ejemplo, se desea estudiar la
asociación entre las variables estado civil y deserción de los estudiantes de maestría.
Definición:
En estadística, el coeficiente phi φ o rφ, también llamado coeficiente de correlación de Mathews
es una medida de la asociación entre dos variables binarias. Esta medida es similar al coeficiente de
correlación de Pearson en su interpretación. De hecho, un coeficiente de correlación de Pearson
estimado para dos variables binarias nos dará el coeficiente phi
Este coeficiente se emplea cuando se busca la correlación entre dos variables que estén medidas,
ambas, en escala nominal dicotómica. Para su cálculo requiere que se construya, con los datos de
la muestra, una tabla simple de doble entrada. La tabla tendrá que tener dos filas (h=2) y de dos
columnas (k=2), es decir, será del tipo 2 x 2: a las frecuencias absolutas conjuntas le llamaremos,
respectivamente, a, b, c y d; tal y como se muestra a continuación:

Valores de la Valores de la variable x


Total
variable y 0 1
1 a b a+b
0 c d c+d
Total a+c b+d

Cuando los datos están tabulados en una tabla de contingencia (tabla que muestra la ocurrencia
conjunta de pares de puntuaciones en dos variables), puede calcularse Φ utilizando la siguiente
formula:
𝑎∗𝑑−𝑏∗𝑐
Φ=
√(𝑎 + 𝑏)(𝑎 + 𝑐)(𝑏 + 𝑑)(𝑐 + 𝑑)

Este coeficiente tomará el valor 1 solamente cuando (a+b) y (c+d) son iguales (consecuentemente
a=d) en una tabla de contingencia de dos por dos; es decir, cuando la proporción de "unos" es la
misma en X y en Y". entonces Y no puede predecirse perfectamente a partir de X, por lo que algunos
estadísticos consideran este hecho como una desventaja del coeficiente phi.
En resumen, para calcular el valor de phi, seguiremos los siguientes pasos:
1. Construir la tabla bivariado con dos filas y dos columnas y obtener las frecuencias
observadas conjuntas (a, b, c, d); así como, las marginales (a + b, c + d, a + c y b + d).
2. Calcular los productos "cruzados" a · d y b · c y hallar la diferencia entre los resultados de
estos productos. Si esta diferencia diera negativa, ignorar el signo menos.

COEFICIENTE PHI MG. JESUS HUGO MEDINA ORE


COEFICIENTE PHI

3. Calcular el producto de todas las frecuencias marginales y hallar la raíz cuadrada al


resultado.
4. Dividir el resultado del paso 2 por el del paso 3.
A continuación nos referimos a las propiedades de este coeficiente, que son útiles para la
interpretación práctica de él.
Propiedades de phi:
1. El menor valor que puede tomar phi es cero.
2. El mayor valor que puede tomar phi es uno.
Cuando phi es cero, indica que entre las variables no existe relación; en cambio, cuando es uno,
significa que entre esas variables existe una relación perfecta.
Estas observaciones también son válidas para los coeficientes que siguen
Ejemplo:
Se ha observado que los estudiantes que inician sus estudios de maestría presentan mucha
dificultad en el primer semestre por lo que algunos de ellos abandonan sus estudios. A
continuación, se presentan los resultados de un seguimiento realizado a 15 estudiantes de la
maestría en Política Social que se matricularon en el semestre 20204-II y que abandonaron el curso
de Herramientas de Análisis Cuantitativo
Se pide encontrar el coeficiente de Phi.
X: estado civil 1: no casado 0: casado
Y: permanencia 0: abandona el curso
1: permanece en el curso hasta el final
Estudiante Estado civil (xi) Permanencia (yi)
1 0 0
2 1 1
3 0 1
4 1 0
5 1 1
6 1 0
7 0 0
8 1 1
9 0 0
10 0 0
11 0 0
12 1 1
13 0 0
14 0 0
15 0 0

Solución

La información anterior se resume en el siguiente cuadro:

Valores de la variable X
Valores de la variable Y
0 (casado) 1 (no casado)
Total
1 (permanece) a2 b4 6
0 (abandona) c8 d1 9
Total 10 5 15

COEFICIENTE PHI MG. JESUS HUGO MEDINA ORE


COEFICIENTE PHI

𝑎∗𝑑−𝑏∗𝑐
Φ=
√(𝑎 + 𝑏)(𝑎 + 𝑐)(𝑏 + 𝑑)(𝑐 + 𝑑)

2∗1−4∗8
Φ=
√(2 + 4)(2 + 8)(4 + 1)(4 + 1)

Φ=-0.7745

Φ=-0.775

Por el signo se deduce una relación inversa, ente el estado civil y deserción. Entonces se comprueba
que a mayor nivel de casamientos mayor deserción.
Ejemplo 2: En una muestra aleatoria de cuarenta estudiantes se observó el interés por el estudio
(X) y el sexo (Y) de cada uno de ellos. Mida la correlación entre estas variables, a partir de los dados
en la siguiente tabla:
Valores de la variable Y
Valores de la variable X
M F
Total
SI a 10 b 10 20
NO c8 d 12 20
Total 18 22 40

X : Interés por el estudio


Y : Sexo
𝑎∗𝑑−𝑏∗𝑐
Φ=
√(𝑎 + 𝑏)(𝑎 + 𝑐)(𝑏 + 𝑑)(𝑐 + 𝑑)

10 ∗ 12 − 10 ∗ 8
Φ=
√(10 + 10)(10 + 8)(10 + 12)(8 + 12)

120 − 80
Φ=
√(20)(18)(22)(20)

40
Φ=
√158400

40
Φ=
397.994974842648

Φ=0.1005037815259

Φ=10.05

Existe una correlación muy baja entre las variables interés y sexo

COEFICIENTE PHI MG. JESUS HUGO MEDINA ORE

También podría gustarte