Está en la página 1de 9

COEFICIENTE DE CORRELACIN DE PEARSON PARA DATOS AGRUPADOS EN

INTERVALOS
Autor: Mario Orlando Surez Ibujes
mgsmariosuarez@gmail.com
mosuarez@utn.edu.ec
Telf: 06 2632 166
085619601

FRMULA
r=

n f dx dy( fx dx )( fy dy )

[n fx dx ( fx dx ) ][ n fy dy ( fy dy) ]
2

Donde
n = nmero de datos.
f = frecuencia de celda.
fx = frecuencia de la variable X.
fy = frecuencia de la variable Y.
dx = valores codificados o cambiados para los intervalos de la variable X, procurando que al intervalo
central le corresponda dx = 0, para que se hagan ms fciles los clculos.
dy = valores codificados o cambiados para los intervalos de la variable X, procurando que al intervalo
central le corresponda dy = 0, para que se hagan ms fciles los clculos.
EJEMPLOS ILUSTRATIVOS
N 1
Con los siguientes datos sobre los Coeficientes Intelectuales (X) y de las calificaciones en una prueba
de conocimiento (Y) de 50 estudiantes:
N de
estudiant
e
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

X
76
77
78
79
79
80
80
80
82
82
83
83
83
83
84
84
84
85
85

Y
28
24
18
41
43
45
34
18
40
35
30
21
22
23
25
11
15
31
35

N de
estudiante
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44

X
88
88
88
88
89
89
90
90
90
91
92
92
93
93
93
94
96
97
98

Y
40
31
35
26
30
24
18
11
15
38
34
31
33
35
24
40
35
36
40

20
21
22
23
24
25

86
86
86
86
87
88

26
30
24
16
20
36

45
46
47
48
49
50

99
100
101
101
102
102

33
51
54
55
41
45

1) Elaborar una tabla de dos variables


2) Calcular el coeficiente de correlacin
Solucin:
1) En la tabla de frecuencias de dos variables, cada recuadro de esta tabla se llama una celda y
corresponde a un par de intervalos, y el nmero indicado en cada celda se llama frecuencia de celda.
Todos los totales indicados en la ltima fila y en la ltima columna se llaman totales marginales o
frecuencias marginales, y corresponden, respectivamente, a las frecuencias de intervalo de las
distribuciones de frecuencia separadas de la variable X y Y.
Para elaborar la tabla se recomienda:
- Agrupar las variables X y Y en un igual nmero de intervalos.
- Los intervalos de la variable X se ubican en la parte superior de manera horizontal (fila) y en orden
ascendente.
- Los intervalos de la variable Y se ubican en la parte izquierda de manera vertical (columna) y en
orden descendente.
Para elaborar los intervalos se procede a realizar los clculos respectivos:
En la variable X:
Calculando el Rango se obtiene:
R=x mx x mn =10276=26
Calculando el nmero de intervalos se obtiene:
ni=1+3,32 log ( n )=1+3,32 log50=6
Calculando el ancho se obtiene:
R 26
i= = =4,33
6

En la variable Y:
Calculando el Rango se obtiene:
R= y mx y mn =5511=44

Calculando el nmero de intervalos se obtiene:


ni=1+3,32 log ( n )=1+3,32 log50=6
Calculando el ancho se obtiene:
R 44
i= = =7,33
6

Nota: Para la variable X se tomar un ancho de intervalo igual a 5 y para la variable Y un ancho de
intervalo igual a 8 para obtener un nmero de intervalos igual a 6 para cada variable.

Contando las frecuencias de celda para cada par de intervalos de las variables X y Y se obtiene la
siguiente tabla de frecuencias de dos variables:

51-58
43-50
35-42
27-34
19-26
11-18
fx

Coeficientes Intelectuales (X)


76-80 81-85 869196-100 101-105
90
95
1
2
2
1
1
3
3
3
3
1
2
2
3
3
1
1
4
5
1
2
2
4
8
11
15
7
5
4

fy
3
3
14
11
11
8
50

Interpretacin:
- El nmero 5 es la frecuencia de la celda correspondiente al par de intervalos 86-90 en Coeficiente
Intelectual y 19-26 en Calificacin obtenida en la prueba de conocimiento.
- El nmero 8 en la fila de fx es el total marginal o frecuencia marginal del intervalo 76-80 en
Coeficiente Intelectual.
- El nmero 14 en la columna de fy es el total marginal o frecuencia marginal del intervalo 35-42 en
Calificacin obtenida en la prueba de conocimiento.
- El nmero 50 es total de frecuencias marginales y representa al nmero total de estudiantes.
2) Realizando los clculos respectivos se obtiene la siguiente tabla:

76-80 81-85 86-90 91-95 96-100 101-105


dx
Y
-2
-1
0
1
2
dy
1
51-58
3
6
2
43-50
2
-8
35-42
1
1
3
3
3
3

fy

fydy

fydy2

fdxdy

27

24

12

-2

14

14

14

18
1
6
1

-2
27-34

19-26

-1

11-18

-2

fx
fxdx
fxdx2
fdxdy
Nota:

8
-16
32
0

-3

2
0

3
0

5
4

8
11
-11
11
5

11

11

-11

11

-16

32

12

1
-1

4
4

15
0
0
0

1
0

3
0

4
2

0
7
7
7
2

5
10
20
12

4
12
36
27

50
2
106
46

96

46

Los nmeros de las esquinas de cada celda en la anterior tabla representan el producto fdxdy, as por
ejemplo, para obtener el nmero el nmero -8 de los intervalos 76-80 en X y 43-50 en Y se obtiene
multiplicando 2(-2)(2) = -8. Para obtener el nmero 6 de los intervalos 96-100 en X y 51-58 en Y se
obtiene multiplicando 123 = 6.
Los nmeros de la ltima columna (24, -2, 7, 0, 5 y 12) se obtienen sumando los nmeros de las
esquinas en cada fila, as por ejemplo, para obtener el nmero 24 se suma 6 + 18 = 24.
Los nmeros de la ltima fila (0, 5, 0, 2, 12 y 27) se obtienen sumando los nmeros de las esquinas en
cada columna, as por ejemplo, para obtener el nmero 27 se suma 18 + 6 + 3 = 27.
Para obtener el nmero 2 de la antepenlmina columna se obtiene sumando los resultados de fydy, es
decir, representa la fydy
Para obtener el nmero 2 de la antepenlmina fila se obtiene sumando los resultados de fxdx, es decir,
representa la fydy
Para obtener el nmero 96 de la penltima columna se obtiene sumando los resultados de fydy2, es
decir, representa fydy2
Para obtener el nmero 106 de la penltima fila se obtiene sumando los resultados de fxdx2, es decir,
representa fxdx2
Para obtener ltimo nmero de la ltima columna se obtiene sumando los resultados de la ltima
columna (46=24-2+7+0+5+12), es decir, representa fdxdy.
Para obtener ltimo nmero de la ltima fila se obtiene sumando los resultados de la ltima fila
(46=0+5+0+2+12+27), y tiene que ser igual al ltimo nmero de la ltima columna como
comprobacin que los clculos de la tabla han sido correctos.
Observando los datos en la tabla anterior se reemplaza los valores en la ecuacin del Coeficiente de
Correlacin de Pearson para datos agrupados se obtiene:

r=

n f dx dy( fx dx )( fy dy )

[n fx dx ( fx dx ) ][ n fy dy ( fy dy) ]
2

r=

50 46( 2 ) (2 )

[ 50 106(2) ] [50 96(2) ]


2

r=

23004
2296
=
[ 53004 ][ 48004 ] [ 5296 ][ 4796 ]

2296
2296
=
=0,456
5039,803
25399616

Existe una correlacin positiva moderada

N 2
Dada la siguiente tabla de frecuencias de dos variables, con los datos sobre los pesos en kilogramos de
habitantes de dos barrios diferentes en una ciudad, determinar el tipo de correlacin que existe entre
ellas mediante el coeficiente de Pearson.
X
40-49

50-59

60-69

90-99

Solucin:

70-79

80-89

90-99

fy

10

80-89

16

70-79

10

24

60-69

50-59

10

40-49

fx

15

17

22

18
21
11

22

15

100

Correlacin positiva moderada de 0,688

N 3
Dada la siguiente tabla de frecuencias de dos variables, con los datos sobre las calificaciones obtenidos
en un curso de 100 estudiantes en la asignatura de Matemtica (X) y en la asignatura de Estadstica
(Y), determinar el tipo de correlacin que existe entre ellas mediante el coeficiente de Pearson para
datos agrupados.

N de
estudiant
e
1
2
3

X
40
41
42

Y
60
50
55

N de
N de
N de
estudiant
estudiant
estudiant
e
X Y
e
X Y
e
X Y
26

5
7

7
3

27

5
8

7
8

28

6
0

7
9

43

59

29

6
1

44

40

30

51

7
1

8
6

76

8
4 83

52

7
2

8
8

77

8
4 84

53

7
2

8
9

78

8
5 86

6
0

54

7
2

7
0

79

8
6 88

55

80

8 89

6
7
8
9
10
11
12
13
14

45
45
45
45
48
49
50
50
56

42
49
60
62
66
69
50
52
54

31

6
3

6
2

56

7
4

7
2

81

8
6 70

32

6
4

6
3

57

7
4

7
3

82

8
7 78

33

6
4

6
4

58

7
4

7
4

83

8
7 79

34

6
5

6
5

59

7
5

7
5

84

8
8 78

35

6
5

6
6

60

7
6

7
6

85

8
8 77

36

6
6

6
7

61

7
6

7
7

86

8
8 79

37

6
6

6
9

62

7
7

7
8

87

8
8 78

38

6
6

5
0

63

7
7

7
9

88

8
9 78

39

6
6

5
2

64

7
8

6
0

89

8
9 60

5
5

65

7
8

6
7

90

8
9 69

66

7
8

6
5

91

9
0 90

67

7
8

6
8

92

9
1 96

68

7
9

6
9

93

9
2 97

69

7
9

5
0

94

9
3 99

70

7
9

5
9

95

9
4 80

71

8
0

9
0

96

9
5 81

72

8
1

9
4

97

9
6 82

73

8
2

9
6

98

9
7 83

15

56

56

40

6
7

16

56

59

41

6
8

5
6

42

6
8

5
7

43

6
8

5
9

44

6
9

4
0

45

6
9

4
5

46

6
9

4
7

47

6
9

4
9

48

7
0

9
0

17
18
19
20
21
22
23

56
56
57
57
57
57
57

59
40
45
47
48
49
80

24
25

57
57

70
72

49

7
0

9
9

50

7
0

8
0

74

8
2

9
9

75

8
3

8
0

99

9
8 89

100

9
9 70

Solucin:

Correlacin positiva moderada de 0,62

REFERENCIAS BIBLIOGRFICAS

BENALCZAR, Marco, (2002),


SUREZ, Mario

Unidades para Producir Medios Instruccionales en Educacin,


Ed. Graficolor, Ibarra, Ecuador.

DAZA, Jorge, (2006), Estadstica Aplicada con Microsoft Excel, Grupo Editorial Megabyte, Lima,
Per.

GOVINDEN, Lincoyn, (1985),

Introduccin a la Estadstica, Ed. McGraw Hill. Interamericana


Editores. S.A., Bogot, Colombia.

JOHNSON, Robert, (2003), Estadstica Elemental, Ed. Math Learning, Ed. Tercera, Mxico DF.

KUBY, Patricia.

KAZMIER, J. Leonard, (1990).

Estadstica Aplicada a la Administracin y la Economa,


Ed. McGrawHill, Ed. Segunda, Bogot, Colombia.

LIND, Marchal, (2005),

Estadstica Aplicada a los Negocios y a la Economa, Ed. McGraw- Hill,

MASON

Ed. Dcima., Mexico DF.

MARTINEZ, Bencardino, (1981), Estadstica Comercial, Ed. Norma, Bogot, Colombia.

MORENO, Francis, (1993),

SNCHEZ, Jess, (2007),

SALTOS, Hctor, (1986),

SHAO, Stephen, (1980),

Estadstica Inferencial, Universidad Particular de Loja, Loja, Ecuador.

Introduccin a la Estadstica Empresarial, Madrid, Espaa.

Estadstica de Inferencia, Ed. Po XII, Ambato, Ecuador.

Estadstica para Economistas y Administradores de Empresas, Ed. Herrero


Hnos, Mxico DF.

SPIEGEL, Murray, (2000),

SUREZ, Mario, (2004),

Estadstica, Serie de Compendios Schaum, Ed. McGraw-Hill, Mxico.

Interaprendizaje Holstico de Matemtica, Ed. Grficas Planeta, Ibarra,


Ecuador.

STEVENSON, William, (1981),

Estadstica para Administracin y Economa, Ed. Harla S.A de C.V.


Mxico D.F.

WEBSTER, Allen, (2000),

Estadstica Aplicada a los Negocios y a la Economa, Ed. McGraw Hill.


Interamericana Editores S.A. Bogot, Colombia

También podría gustarte