Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Diseo de portada:
Edita:
ISBN:
Depsito Legal:
Imprime:
AUTORES:
Clemente Rodrguez Sabiote
Miguel ngel Gallardo Vigil
Teresa Pozo Lorente
Jos Gutirrez Prez
INDICE
Primera parte: Teora ...
1. Ideas previas sobre la organizacin de datos en la investigacin educativa .
1.1. Anlisis exploratorio de datos
1.2. Algunos ejemplos sobre la organizacin de datos en la investigacin educativa
2. Nociones Bsicas sobre anlisis descriptivo clsico ............................................
2.1. Distribucin de frecuencias .............................................
2.2. Representaciones grficas ..
2.2.1. Representaciones grficas ms frecuentes en el campo de la
investigacin educativa.
2.2.1.1. Diagrama de Barras
2.2.1.2. Pictograma ...
2.2.1.3. Polgono de frecuencias ......................
2.2.1.4. Histograma ..
2.2.1.5. Diagrama de sectores
2.2.1.6. Diagrama de tallo y hojas .
2.2.1.7. Diagrama de caja y pastillas .
2.2.2. Algunos errores en la construccin de grficos ..
2.2.2.1. La manipulacin del eje de ordenadas ..
2.2.2.2. La manipulacin del eje de abcisas .
2.3. Medidas de tendencia central .............................
2.3.1. Media aritmtica
2.3.2. Mediana .
2.3.3. Moda ..
2.3.4. Cuestionamiento de la media aritmtica como medida representativa del conjunto
en algunas ocasiones .............................................
2.4. Medidas de dispersin .
2.4.1. Amplitud, Rango o Recorrido ..
2.4.2. Desviacin Media ..
2.4.3. Desviacin Tpica ..
2.4.4. Varianza .
2.4.5. Coeficiente de Variacin .
2.4.6. Cmo interpretar los estadsticos de dispersin .
2.5. Medidas de posicin ..
2.6. La correlacin ..
2.6.1. El coeficiente de correlacin de Pearson .
2.6.2. El coeficiente de correlacin de Rho Sperman
2.6.3. Coeficientes de correlacin basados en el ...
2.6.4. La regresin estadstica...
Bibliografa ................................
Pg
5
7
12
14
16
16
17
17
17
18
18
19
19
20
20
21
21
23
23
24
24
25
26
26
27
27
27
28
28
29
29
32
33
36
40
41
44
PRIMERA PARTE:
TEORA
Puntuacin
45
44
32
49
44
50
49
44
50
50
45
32
32
49
Presentacin B
Puntuacin 32
Sujeto 3 / Sujeto 12 / Sujeto 13
Puntuacin 44
Sujeto 2 / Sujeto 5 / Sujeto 8
Puntuacin 45
Sujeto 1 / Sujeto 11
Puntuacin 49
Sujeto 4 / Sujeto 7 / Sujeto 14
Puntuacin 50
Sujeto 6 / Sujeto 9 / Sujeto 11
Clemente Rodrguez Sabiote, Miguel ngel Gallardo Vigil, Teresa Pozo Llorente y Jos Gutirrez Prez
a) Por orden creciente: 32, 32, 32, 44, 44, 44, 45, 45, 49, 49, 49, 50, 50, 50
b) Por orden decreciente: 50, 50, 50, 49, 49, 49, 45, 45, , 44, 44, 44, 32, 32, 32
c) Por agrupaciones segn repeticiones: tres 32, tres 44, dos 45, tres 49, tres 50
d) Por agrupaciones segn las veces que aparecen:
Dos veces: 45
Tres veces: 32, 44, 45, 49, 50
e) Mediante diagramas de Ven
32
44
45
49
50
2
3
tallo y hojas (anlisis exploratorio de datos); los datos transformados mediante procedimientos
matemticos sencillos (frecuencias, porcentajes, proporciones) o estadsticos de sntesis ms
elaborados (media, mediana, moda y medidas de variacin).
Para poder comprender mejor cada una de estas formas de presentar la informacin lo
haremos partiendo del siguiente ejemplo: La Biblioteca de la Facultad de Educacin est
realizando un estudio sobre el nmero de libros que prestan al alumnado durante el mes de
marzo. El total de alumnos del estudio ha sido 108 correspondientes a primer curso de la
Diplomatura de Maestro especialista en Educacin Infantil.
La informacin aparece en la siguiente tabla:
1
2
3
6
4
1
2
3
2
5
6
2
1
4
2
4
6
2
3
5
1
5
6
3
4
5
1
6
1
4
5
5
6
4
1
5
1
4
6
3
2
4
1
4
5
5
2
5
2
6
5
5
2
5
3
3
5
6
3
6
4
2
5
6
4
4
5
2
3
3
5
5
6
3
2
2
6
5
3
3
3
2
5
5
2
3
4
1
4
6
1
3
5
1
3
5
1
4
2
3
2
5
2
3
1
4
1
2
1
2
3
4
5
5
1
2
3
4
5
5
1
2
3
4
5
5
1
2
3
4
5
6
1
2
3
4
5
6
1
2
3
4
5
6
1
2
3
4
5
6
1
2
3
4
5
6
1
2
3
4
5
6
1
2
3
5
5
6
1
2
3
5
5
6
1
2
3
5
5
6
1
2
3
5
5
6
1
2
3
5
5
6
2
2
3
5
5
6
2
2
3
5
5
6
2
3
3
5
5
6
Clemente Rodrguez Sabiote, Miguel ngel Gallardo Vigil, Teresa Pozo Llorente y Jos Gutirrez Prez
Puntuacin
1
2
3
4
5
6
Frecuencia
15
20
19
10
30
14
108
Frecuencia
35
29
44
108
15
20
19
10
30
14
10
Stem &
15,00
20,00
19,00
10,00
30,00
14,00
1
2
3
4
5
6
Stem width:
Each leaf:
.
.
.
.
.
.
Leaf
000000000000000
00000000000000000000
0000000000000000000
0000000000
000000000000000000000000000000
00000000000000
1,00
1 case(s)
Vlidos
1,00
Frecuencia
15
Porcentaje
13,9
Porcentaje
vlido
13,9
Porcentaje
acumulado
13,9
2,00
20
18,5
18,5
32,4
0.18
3,00
19
17,6
17,6
50,0
0.17
4,00
10
9,3
9,3
59,3
0.09
5,00
30
27,8
27,8
87,0
0.27
6,00
14
13,0
13,0
100,0
0.12
Total
108
100,0
100,0
Proporciones
0.13
Estadsticos
VAR00001
N
Vlidos
Perdidos
Media
Mediana
Moda
Desv. tp.
Varianza
108
0
3,5741
3,5000
5,00
1,67557
2,808
11
Clemente Rodrguez Sabiote, Miguel ngel Gallardo Vigil, Teresa Pozo Llorente y Jos Gutirrez Prez
20
16
23
21
20
21
21
24
21
19
19
25
20
19
21
20
27
19
19
19
23
28
18
20
19
23
21
19
20
20
24
21
21
23
21
20
19
19
24
21
19
19
25
20
19
18
20
19
19
24
19
20
18
16
20
21
23
19
20
19
19
24
21
21
23
25
20
19
19
21
30
19
19
19
19
29
18
20
20
19
23
21
19
23
20
Si realizamos una primera exploracin de los datos podremos comprobar que alguna de
la informacin que hemos recogido no es vlida. As pues, si la utilizamos para nuestros anlisis
12
no obtendremos unos resultados vlidos y fiables. El siguiente grfico nos ofrece una visin
general de nuestros datos:
30
25
Frecuencia
20
15
10
0
12
16
18
19
20
21
23
24
25
27
28
29
30
Edad
Estadsticos descriptivos
N
Edad
N vlido (segn lista)
88
88
Media
20,81
Desv. tp.
2,848
Estadsticos descriptivos
N
Edad
N vlido (segn lista)
85
85
Media
21,02
Desv. tp.
2,623
13
Clemente Rodrguez Sabiote, Miguel ngel Gallardo Vigil, Teresa Pozo Llorente y Jos Gutirrez Prez
14
15
Clemente Rodrguez Sabiote, Miguel ngel Gallardo Vigil, Teresa Pozo Llorente y Jos Gutirrez Prez
CONCEPTOS CLAVES
; FRECUENCIA ABSOLUTA: Nmero de veces que se repite un valor (xi). Se simboliza (fi).
16
Ejemplo: Imaginad que el nmero de errores cometidos por un conjunto de nios (20) al leer
un prrafo en una prueba de lectura pasada por un/a Licenciado/a en Pedagoga o
Psicopedagoga ha sido el siguiente:
2, 1, 0, 3, 2, 2, 3, 1, 1, 0, 1, 2, 1, 2, 0, 2, 4, 2, 3 y 1. Con estos datos esta sera la tabla
de distribucin de frecuencias que correspondera al ejemplo citado:
xi
fi
fr
fia
fra
1
3
7
6
3
20
0,05
0,15
0,35
0,30
0,15
1
20
19
16
9
3
1
0,95
0,8
0,45
0,15
(nerrores)
4
3
2
1
0
17
Clemente Rodrguez Sabiote, Miguel ngel Gallardo Vigil, Teresa Pozo Llorente y Jos Gutirrez Prez
8
7
6
5
4
Frecuencia
3
2
1
0
,00
1,00
2,00
3,00
4,00
VAR00001
2.2.1.2. Pictograma
El pictograma es una representacin grfica que utilizada como recurso visual la presencia de
algn tipo de dibujo o representacin de un elemento. En este caso las diferentes categoras
contempladas son agrandadas o empequeecidas dependiendo de la frecuencia de cada una de
ellas. As por ejemplo las categoras 0 y 3 tendran el mismo tamao (frecuencia 3 en ambos
casos), mientras 4 sera la ms pequea (fi =1) y las categoras 2 (fi=6) y 3 (fi=7) seran las que
tendran un tamao mayor.
Frecuencia
3
2
1
0
,00
VAR00001
18
1,00
2,00
3,00
4,00
2.2.1.4. Histograma
El uso del histograma est indicado cuando la variable a representar se encuentra en una escala
de intervalos. En caso contrario se utilizara el diagrama de barras anteriormente comentado.
Histograma
8
Frecuencia
2
Desv. tp. = 1,09
Media = 1,7
N = 20,00
0,0
1,0
2,0
3,0
4,0
VAR00001
4,00
5,0%
,00
3,00
15,0%
15,0%
1,00
2,00
30,0%
35,0%
19
Clemente Rodrguez Sabiote, Miguel ngel Gallardo Vigil, Teresa Pozo Llorente y Jos Gutirrez Prez
0.
1.
2.
3.
4.
000
000000
0000000
000
0
20
17
-1
N=
20
VAR00001
21
Clemente Rodrguez Sabiote, Miguel ngel Gallardo Vigil, Teresa Pozo Llorente y Jos Gutirrez Prez
GRFICO A
GRFICO B
60
57
50
55
55%
50%
40
55%
53
Prueba de
medicin
30
20
49
10
47
Prueba de
medicin
51
50%
45
Experimental
Control
Experimental
Control
Salta a la vista que si nos quedamos con el grfico B podramos pensar, si obviamos la
manipulacin de la escala del eje de ordenadas, que el tratamiento es realmente eficaz cuando
es posible que no lo sea.
Propongamos otro ejemplo: Imaginemos la representacin de cinco tems de una escala tipo
Likert (1 a 5) sobre el desarrollo docente en un polgono de frecuencias.
GRFICO A
GRFICO B
10
9
8
7
6
5
4
3
2
1
0
5
4
3
2
1
1
Puede apreciarse como la manipulacin del eje Y (ordenadas) sin cambiar la amplitud del
intervalo ha generado la mayor o menor pendiente en el patrn de crestas y valles que se dibuja
en el grfico del polgono de frecuencias. Ahora imaginemos que el tem 3, el que obtiene una
puntuacin de 5 (muy de acuerdo), afirma literalmente: El profesor no explica adecuadamente
los contenidos del programa y adolece de una formacin evidente . Resulta obvio que, en este
caso si lo que se quiere es minimizar las diferencias debera de usarse el grfico B, ya que el A
refleja con ms precisin lo acontecido, pero sin duda visualiza una mayor diferencia con el resto
22
GRFICO B
1
1
En este caso, la inclusin de cuatro tems que en realidad no existen y, por tanto, no obtienen
puntuacin alguna, estrechara el polgono de frecuencias con el consiguiente aumento de la
pendiente del patrn representado.
23
Clemente Rodrguez Sabiote, Miguel ngel Gallardo Vigil, Teresa Pozo Llorente y Jos Gutirrez Prez
2.3.2. Mediana
Por su parte, la mediana se define como la puntuacin (xi) que deja detrs y delante el 50% de la
distribucin de puntuaciones. En este sentido, puede considerarse como el punto medio de una
distribucin de puntuaciones.
Siguiendo con el ejemplo anterior para su clculo deberamos tener en cuenta algunos aspectos:
a) Comprobar si el (N) o nmero de sujetos o elementos que constituyen la distribucin es par o
impar.
b) Ordenar la distribucin de menor a mayor o viceversa.
Si el nmero de elementos es par, nuestro caso, tomamos los 2 valores centrales, los sumamos
y los dividimos entre 2.
24
0, 0, 0, 1, 1, 1, 1, 1, 1,
2, 2,
2, 2, 2, 2, 2, 3, 3, 3, 4
50%
50%
Md = 2+2 / 2 = 2
Bien, imaginemos que nos hubisemos encontrado con una distribucin impar de este tipo:
2.3.3. Moda
Se dice que lo que est de moda es aquello que impera en un momento dado. Este invierno se
llevar para la mujer, mientras para el hombreTomando el sentido descrito, desde el
posicionamiento de la moda textil, podemos afirmar que en estadstica la moda es el/los valor/es
de la distribucin con mayor/es (fi), es decir, el/los que ms se repite/n.
Retomando, otra vez, el ejemplo anterior tendramos que la moda de la distribucin sera el valor
2.
Ahora bien, si la distribucin fuese esta:
25
Clemente Rodrguez Sabiote, Miguel ngel Gallardo Vigil, Teresa Pozo Llorente y Jos Gutirrez Prez
26
parecido sean los valores dados ms pequea ser la medida de dispersin y vicerversa. Los
estadsticos de dispersin fundamentales son:
2.4.1. Amplitud, Rango o Recorrido
La amplitud, rango o recorrido es la diferencia entre valor mximo y el mnimo de la distribucin.
Ej: Imaginad las calificaciones obtenidas por 10 nios en
un examen de vocabulario:
1,3,4,6,7,5,6,5,8,9
A = xima ximi
A=91=8
2.4.2. Desviacin media
Por su parte, la desviacin media es el cociente entre el sumatorio de cada una de las
desviaciones de cada puntuacin (xi) respecto de su media en valor absoluto y el valor de N. De
ahora en adelante entenderemos por desviaciones la diferencia entre cada valor de la
distribucin y su media. Si esta diferencia no est elevada al cuadrado, el presente caso, se dice
que es una desviacin de orden 1. Si est elevada al cuadrado, caso de la desviacin tpica, se
dice que es una desviacin de orden 2 y as sucesivamente.
I xi - x I
DM =
Sx =
( xi x)
N
27
Clemente Rodrguez Sabiote, Miguel ngel Gallardo Vigil, Teresa Pozo Llorente y Jos Gutirrez Prez
2.4.4. Varianza
La varianza es el cuadrado de la desviacin tpica. Como podis apreciar el nico cambio en
relacin a la desviacin tpica es que ha desaparecido la raz cuadrada que al pasar al primer
trmino de la ecuacin pasa como potencia, es decir, con lo contrario que actuaba en el segundo
trmino de la misma.
Sx =
( xi x)
N
Ejemplo: Supongamos que las calificaciones de 5 nios en una prueba de dislexia han sido las siguientes:
1,1,2,3,3
Amplitud = 3 1 = 2
DM = (1-2)+ (1-2)+ (2-2)+ (3-2)+ (3-2) = 0,8
Sx = (1-2)2+ (1-2) 2+ (2-2) 2+ (3-2) 2+ (3-2) 2 / 5 = 0,89
Sx = (1-2)2+ (1-2) 2+ (2-2) 2+ (3-2) 2+ (3-2) 2 / 5 = 0,8
CV = 0,89 /2 = 0,44 * 100 = 44%
28
Definicin
Centil
Decil
Cuartil
As por ejemplo, podemos afirmar que tras el Q3 se encuentran el 75% de las observaciones, o
que delante del mismo estn el 25%.
Evidentemente, se dan una serie de equivalencias entre los diferentes cuantiles que tambin
hemos contemplado en la siguiente tabla:
29
Clemente Rodrguez Sabiote, Miguel ngel Gallardo Vigil, Teresa Pozo Llorente y Jos Gutirrez Prez
Q1
Q2
Q3
D1
D2
D3
D4
D5
D6
D7
D8
D9
C10
C20
C25
C30
C40
C50
C60
C70
C75
C80
C90
Las frmulas habituales para el clculo de cuantiles que pueden encontrarse en cualquier
manual de estadstica aplicada a las ciencias sociales son para casos en que la distribucin est
organizada en intervalos. Como en nuestros procedimientos de clculo no contemplamos esa
posibilidad utilizaremos las siguientes expresiones para su clculo:
Pk = (n+1) * p
siendo:
n = nmero total de observaciones
p= proporcin del cuantil
En caso de que la posicin calculada no fuese exacta, es decir, se obtengan decimales deber
utilizarse esta expresin de interpolacin:
Pk = (1- ) * xi1 + () * xi2
siendo:
: cuanta decimal o parte de fraccin de la posicin determinada
xi1: valor de la primera observacin que contiene la posicin del percentil en cuestin o posicin
ms cercana por defecto
xi2: valor de la segunda observacin que contiene la posicin del percentil en cuestin o posicin
ms cercana por exceso
30
Fi
2
1
3
1
2
Fa
2
3
6
7
9
Xi
13
14
15
16
17
Fi
2
1
3
1
2
Fa
2
3
6
7
9
Posicin del
P25
31
Clemente Rodrguez Sabiote, Miguel ngel Gallardo Vigil, Teresa Pozo Llorente y Jos Gutirrez Prez
Podemos apreciar como la posicin 2,5 est contenida en las frecuencias acumuladas 2 y 3
cuyas observaciones de referencia son 13 y 14. Si aplicamos la frmula de interpolacin
tendremos que:
P25 = (1-0,5 ) * 13 + (0,5) * 14 = 13,5
2.6. La correlacin
La relacin entre dos variables nos conduce a un nuevo concepto: correlacin. sta puede ser
representada en diagramas de dispersin e informa acerca de la forma, direccin e intensidad de
la relacin entre dos variables, en ningn caso sobre los efectos de una sobre otra (ausencia de
causalidad, pero cierto grado de prediccin). Con Yela (1994:247) podemos afirmar que en
referencia a la forma sta puede ser una lnea recta si la relacin es lineal, es decir, si las
diferencias entre los valores de una variable son proporcionales directa (+) o inversamente (-) a
las diferencias entre los correspondientes a la otra; o una curva, cuando la relacin, no siendo
lineal, es, o bien monotnica (incrementos iguales en una variable corresponden a incrementos
crecientes, o decrecientes en la otra), o bien no monotnica, cuando hay cambios de direccin
en la curva. Con relacin a la direccin puede ser variable o constante, bien (positiva), cuando a
incrementos o decrementos de la variable A corresponden incrementos o decrementos de la
variable B, o negativa cuando a incrementos de la variable A corresponden decrementos en la
variable B y viceversa. Con respecto a la intensidad de la relacin se manifiesta en la
dispersin de los datos en torno a la lnea (recta de regresin) y suele expresarse mediante
valores de coeficientes de correlacin que oscilan entre 1 y 1 pasando por 0. Valores cercanos
a 0 denotan ausencia de correlacin y, por ende, independencia, valores cercanos a 1 1
indican una correlacin de gran intensidad y, por tanto, una fuerte relacin.
32
Negativa
10
12
10
8
6
6
4
VAR00005
VAR00001
0
0
10
0
0
12
10
VAR00006
VAR00002
12
12
10
10
8
8
6
VAR00003
VAR00001
0
0
10
12
2
4
VAR00002
10
12
14
16
VAR00004
Mayor intensidad
Menor intensidad
INTENSIDAD
33
Clemente Rodrguez Sabiote, Miguel ngel Gallardo Vigil, Teresa Pozo Llorente y Jos Gutirrez Prez
Por su parte, las dos frmulas que vamos contemplar son las siguientes:
La primera frmula es la denominada frmula larga, aparatosa a primera vista, pero sencilla
cuando se tabulan y organizan los datos desde unas determinadas coordenadas que a
continuacin explicitaremos. La segunda frmula se basa en la covarianza divida entre el
producto de las desviaciones tpicas de las variables x e y.
La caracterstica fundamental de este ndice es que mide la existencia de una relacin lineal
entre dos variables medidas en escala de intervalo. El valor de este coeficiente de correlacin
vara en el intervalo [-1, +1], de tal forma que un coeficiente de correlacin de Pearson igual o
cercano a 0 indica una independencia total o amplia entre las dos variables y as puede decirse
que cuando una de ellas vara esto no influye en absoluto, o acaso levemente, en el valor que
pueda tomar la segunda variable. Por su parte, un valor de correlacin igual o cercano a (1)
indica una dependencia total o fuerte entre las dos variables, denominada relacin inversa, de
manera que cuando una de ellas aumenta la otra disminuye y viceversa. Finalmente, un
coeficiente de correlacin igual o cercano a (+1) indica una dependencia tambin total o fuerte
entre las dos variables, denominada relacin directa, de manera que cuando una de ellas
aumenta la otra tambin aumenta y cuando disminuye tambin lo hace la otra.
34
Imaginemos que un licenciado en Psicopedagoga desea averiguar que relacin existe entre el nmero
de horas de estudio el fin de semana previo a un examen y las calificaciones obtenidas en el mismo.
Para ello examina el caso de diez alumnos que dicen haber estudiado las siguientes horas habiendo
obtenido tambin las siguientes calificaciones
Horas de estudio (X)
2
2
3
4
5
6
7
7
9
10
48
Calificaciones (Y)
3
3
3
4
5
7
7
7
8
9
56
La relacin que pueden guardar ambas variables puede determinarse mediante el coeficiente de
correlacin de Pearson. Para ello es condicin indispensable que ambas variables estn
medidas en escala de intervalo (se cumple dicho supuesto). Por tanto, slo queda aplicar la
dichosa y farragosa ecuacin antes propuesta. Para ahorrarte sufrimiento te proponemos que
organices los datos de la siguiente forma:
Horas de estudio (X)
2
2
3
4
5
6
7
7
9
10
48
Calificaciones (Y)
3
3
3
4
5
7
7
7
8
9
56
X
4
4
9
16
25
36
49
49
81
100
373
Y
9
9
9
16
25
49
49
49
64
81
360
X*Y
6
6
9
16
25
42
49
49
56
90
348
35
Clemente Rodrguez Sabiote, Miguel ngel Gallardo Vigil, Teresa Pozo Llorente y Jos Gutirrez Prez
Se transforman los valores originales por sus rangos. Esta transformacin se realiza independientemente
para cada variable.
36
Se obtiene, para cada sujeto, la diferencia, en valor absoluto, entre los rangos.
Estas diferencias permiten obtener el valor del coeficiente de correlacin de Spearman, por
medio de la siguiente expresin:
El valor +1 aparece cuando los rangos asignados a los dos valores de un mismo sujeto son
iguales, y el valor -1 aparece cuando los rangos asignados son opuestos.
1 3 4 2 6 5
1 3 4 2 6 5
rs= +1
x
1 3 4 2 6 5
6 4 3 5 1 2
rs= -1
La expresin anterior slo proporciona el resultado correcto cuando todas las observaciones
sean diferentes y, por tanto, le correspondan rangos diversos a cada una de ellas.
Cuando haya observaciones empatadas, el coeficiente de Spearman se debe obtener por medio
de la siguiente relacin:
37
Clemente Rodrguez Sabiote, Miguel ngel Gallardo Vigil, Teresa Pozo Llorente y Jos Gutirrez Prez
y
13
17
15
15
16
12
Sin embargo, para tratar de determinar si entre ambas variables existe relacin decide implementar el coeficiente Rho
de Spearman, para lo cual tendr que transformar las puntuaciones medidas en escala de intervalo en rangos de
orden.
Valores
10
10
12
12
14
16
12
13
15
15
16
17
Rango
Rango
asignado
1,5
3,5
3,5
A partir de los nmeros de orden se genera la variable D= x-y, cuyos valores, as como sus
cuadrados, aparecen en la tabla siguiente:
38
1.5
0.5
0.25
3.5
2.5
6.25
3.5
2.5
6.25
3.5
1.5
2.25
1.5
3.5
12.25
3.5
2.5
6.25
33.5
El resultado obtenido implica que la relacin existente entre las variables x e y es totalmente
nula. En ese sentido, podemos afirmar que son dos variables sin relacin alguna o totalmente
independientes.
39
donde
A, B, C y D son frecuencias observadas correspondientes a las celdillas pertenecientes a las
intersecciones de los diferentes niveles, o sea:
J
I
J1
J2
I1
I2
= /N
donde
= valor de la prueba de contraste de hiptesis con el mismo nombre
N = nmero de sujetos objeto de anlisis
el segundo (V de Cramer) se basa en el valor de phi divido entre los grados de libertad mnimos
de fila y columna. La frmula de clculo es la siguiente:
V = / mn (I-1),(J-1)
Y= + * xi +
o tambin:
Y= a + b* xi + e
donde:
41
Clemente Rodrguez Sabiote, Miguel ngel Gallardo Vigil, Teresa Pozo Llorente y Jos Gutirrez Prez
Y: valor criterio
a: intercepto o punto de corte de la recta de regresin con el eje de ordenadas y
b: pendiente o tangente de la recta de regresin
xi: variable predictora
e: desviacin o inexactitud del ajuste que a su vez se define.
Aprciese que el numerador de la expresin est formado por el sumatorio de los productos
cruzados de las variables x e y y como denominador contemplamos el momento de orden dos
de la variable x. En el primer caso, se trata de calcular las distancias desde cada puntuacin de
las variables x e y a sus respectivas medias, mientras en el segundo tambin determinar las
distancias desde cada punto de la distribucin de puntuaciones x a su media y elevarlo al
cuadrado.
En cuanto a la constante a o intercepto hace referencia al lugar por donde la ecuacin de
regresin corta con el eje de ordenadas y. En este sentido, podemos afirmar que el coeficiente
a indica el valor de y cuando la variable x toma el valor 0. Representa, por tanto, la influencia
42
de otras variables que no hemos tenido en cuenta al analizar la variable. Una vez calculado b
ser fcil el clculo de a a partir de la siguiente expresin:
43
Clemente Rodrguez Sabiote, Miguel ngel Gallardo Vigil, Teresa Pozo Llorente y Jos Gutirrez Prez
BIBLIOGRAFA:
Darrell, H. y Geis, I. (1954/1993). How to lie with statistics. New York. WW. Norton &
Company/Paperback.
Etxeberria Murgiondo, J. y Tejedor Tejedor, F. J. (2005) Anlisis descriptivo de datos en
educacin. Madrid: La Muralla.
Gil Flores, J. Rodrguez Gmez, G. y Garca Jimnez, E. (1995). Estadstica bsica aplicada a
las Ciencias de la Educacin. Sevilla: Kronos.
Gil Flores, J. Rodrguez Gmez, G. y Garca Jimnez, E. (1996). Problemas de estadstica
bsica aplicada a las Ciencias de la Educacin. Sevilla: Kronos.
Monmonier, M. (2001). Bushmanders and Bullwinkles: How Politicians Manipulate Electronic
Maps and Census Data to Win Elections. Chicago. University of Chicago Press.
Salvador Figueras, M y Gargallo, P. (2003): "Anlisis Exploratorio de Datos", [en lnea]
5campus.com, Estadstica <http://www.5campus.com/leccion/aed> [28 de junio de 2006]
Tufte, H. (2003) (2 edicin). The visual display of quantitative information. Cheshire. Graphics
Press.
Tukey, J.W. (1977). Exploratory data analysis. Reading. Addison Wesley.
Yela, M. (1994). Anlisis de datos, en Garca Hoz, V. (Dir.). Problemas y mtodos de
investigacin en educacin personalizada. Madrid. Rialp, pp. 223-254.
44