Está en la página 1de 40

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

REPRESENTACIONES GRFICAS EN LA INVESTIGACIN


EDUCATIVA.
ANLISIS DE DATOS DESDE UNA PERSPECTIVA EXPLORATORIA
Manuel Miguel Ramos lvarez
Junio de 2005

PRIMERA PARTE.

INTRODUCCIN A LOS CONCEPTOS PRINCIPALES.


1) Introduccin al anlisis con base exploratoria.
a) Objetivos y perspectiva.
b) El papel de las representaciones grficas.
2) Bases para la representacin
a) Tipos ms frecuentes.
b) Nuevos formatos de representacin.
c) Convenciones en torno al sistema de representacin.

SEGUNDA PARTE.
ANLISIS GRFICO DE INVESTIGACIONES EDUCATIVAS DESTACADAS.
3) Anlisis descriptivo bsico.
a) Propiedades elementales.
i) Tendencia central, posicin y variabilidad.
ii) Forma: Asimetra y apuntamiento.
b) La forma de la distribucin segn algunos modelos representativos.
i) El caso de la distribucin normal.
ii) La distribucin exponencial.
c) Deteccin de casos anmalos.
4) Anlisis de la relacin entre variables.
a) Introduccin.
b) El caso lineal.
c) Relacin no lineal.
5) Representaciones Multidimensionales.

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

Bibliografa
1.
2.
3.
4.
5.
6.
7.

Amn, J. (1980): Estadstica para Psiclogos 1. Madrid: Pirmide.


Botella, J., Len, O. y San Martn, R. (1993): Anlisis de Datos en Psicologa I.
Madrid: Pirmide.
Ferguson, G.A. (1986) Anlisis Estadstico en Educacin y Psicologa. Madrid: Anaya.
Freixa, M., Salafranca, L., Guardia, J., Ferrer, R. y Turbany, J. (1992): Anlisis
exploratorio de datos: Nuevas tcnicas estadsticas. Barcelona: PPU.
Guilford, J. P. y Frutcher, B. (1984): Estadstica Aplicada a la Psicologa y a la
Educacin. Bogot: McGraw-Hill.
Palmer. A. (1995). El Anlisis Exploratorio de Datos. Madrid: Pirmide.
Welkowitz, J., Ewen, R. B. y Cohen, J. (1981): Estadstica Aplicada a las Ciencias de
la Educacin. Madrid: Santillana.

Investigaciones
Supuesto 1: Implicaciones educativas de la estructura de interaccin entre los
alumnos.
Supuesto 2: Predicciones de xito escolar a partir de las expectativas del profesor.
Supuesto 3: Anlisis de la progresin evolutiva de las destrezas cognitivas.

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

PRIMERA PARTE.

INTRODUCCIN A LOS CONCEPTOS PRINCIPALES.

1. Introduccin al anlisis con base exploratoria.


a) Objetivos y perspectiva.
b) El papel de las representaciones grficas.

a) Objetivos y Perspectiva
1 parte: una descripcin bsica de caractersticas y tipos de representaciones que se apoyar
mediante transparencias y fotocopias. Incluye tambin unas definiciones bsicas de
puntos destacados, EDA como perspectiva moderna, convenciones, etc. Se realizar un
breve recorrido por la estadstica descriptiva, teniendo en cuenta el objetivo de
representaciones, que abarca desde la perspectiva clsica hasta la moderna.
2 parte de aplicaciones concretas. Centrado en ejemplos mejor que en tcnicas. Es decir
relatar ejemplos concretos de investigaciones educativas con una serie de objetivos a
cubrir y entonces situar su anlisis dentro de un esquema amplio de anlisis donde se vea
claramente la utilidad de las representaciones grficas. Adems ser importante que quede
patente el carcter interactivo de la perspectiva que se defiende en el curso. Es decir cmo
vamos forjando Hiptesis y explorando recurrentemente las representaciones, etc.
Utilizacin de abundante cantidad de ejemplos que ilustren bien la problemtica. A veces
un tipo de representacin camufla una realidad importante. Pues bien, un objetivo
importante es que el supuesto seleccionado permita clarificar esta cuestin.
Mltiples representaciones de los mismos datos para ver cosas diferentes en los mismos
cada vez.
De forma interactiva. Es decir presentarlo como una continua generacin y contraste
de Hiptesis.
Explicar los ejemplos dentro del seno de la Psicologa Educacin.
Contenidos de la Psicologa de la Educacin.
Definicin proceso bsico de aprendizaje.
Factores intrapersonales
Factores interpersonales y socio-ambientales.
Anlisis psicoeducativo del proceso.
Conocimiento psicolgico y prctica educativa.

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

Describir los programas de anlisis estadstico y sus posibilidades grficas. Uno de los ms
destacados es SYSTAT, motivo por el que hemos optado por l.

Men Graph del programa SYSTAT:

OPCIN
Spin
Plot
Cplot
Bar
Pie
Density
Box
Stemleaf
Pplot
Qplot
SPLOT
Icon
Map

DESCRIPCIN
Rotacin grficos 3-D
Diagrama dispersin
Categrico
de Barras o rectngulos
De tartas o circular
Histograma, Polgono y Funcin Probabilidad
Diagrama cajas y barbas
Diagrama tallos y hojas
Densidad ProbabilsticosCuantiles
Matricial
Simblico o Pictograma
Simblico de Mapas

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

El fichero repres1.syd es para el programa SYSTAT y servir para desarrollar los Supuestos 1
y 2.
El fichero incluye la siguiente informacin:

nio
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

rencoop rencompi exptprofe cultpadre tampandi


1
5
9,0
1
0
11
11
3,5
1
1
32
19
2,5
1
1
41
21
2,6
2
2
41
23
2,5
2
2
42
32
3,5
3
3
55
37
5,5
3
0
57
38
7,0
4
0
60
39
6,8
4
1
60
50
5,0
4
1
62
50
3,5
2
2
62
51
4,0
2
3
65
52
6,7
4
4
65
53
3,5
3
4
66
54
5,5
2
1
71
54
5,0
2
2
73
60
5,0
2
2
75
66
4,0
1
1
82
65
5,5
4
2
84
73
5,0
4
2
85
75
6,0
2
4
87
82
8,6
1
2
88
85
8,8
1
1
92
87
9,0
2
2
100
92
8,0
3
4

Aclaracin:
Las variables representan:
rencoop: rendimiento en
situacin cooperativa.
rencompi: rendimiento en
situacin competitiva.
Exptprofe: expectativas
del profesor.
cultpadre: nivel
sociocultural padres.
tampandi: tamao de las
pandillas.

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

Con los promedios:


rencoop rencompi exptprofe cultpadre tampandi
Promedio 62,28
50,96
5,44
2,40
1,88

Y sirven para describir las implicaciones educativas de la estructura de interaccin entre los
alumnos y ms en concreto para analizar las predicciones de xito escolar a partir de las
expectativas del profesor.

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

El fichero repres2.syd es para el programa SYSTAT y servir para desarrollar el Supuesto 3.


El fichero incluye la siguiente informacin:
edad
5.000
5.000
5.000
5.000
5.000
5.000
5.000
5.000
5.000
5.000
7.000
7.000
7.000
7.000
7.000
7.000
7.000
7.000
7.000
7.000
9.000
9.000
9.000
9.000
9.000
9.000
9.000
9.000
9.000
9.000
11.000
11.000
11.000
11.000
11.000
11.000
11.000
11.000
11.000
11.000
13.000
13.000
13.000
13.000
13.000
13.000
13.000
13.000
13.000
13.000

error
10.000
9.000
10.000
8.000
10.000
9.000
8.000
9.000
10.000
7.000
6.000
5.000
7.000
5.000
5.000
4.000
7.000
4.000
5.000
2.000
6.000
4.000
2.000
3.000
2.000
3.000
3.000
2.000
3.000
2.000
1.000
0.0
2.000
2.000
1.000
3.000
2.000
4.000
5.000
0.0
0.0
1.000
1.000
2.000
2.000
2.000
2.000
3.000
1.000
1.000

Aclaracin:
Las variables representan:
Edad: medida en aos
Error: Nmero de errores
cometidos en una batera de
aptitudes.

Y sirve para efectuar el anlisis de la progresin evolutiva de las destrezas cognitivas.

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

Por ltimo, el fichero normal.syd es para el programa SYSTAT y servir para desarrollar la
simulacin de la distribucin Normal Multivariada, como ilustracin de las posibilidades
grficas ms sofisticadas.
El fichero incluye la siguiente informacin:
Z1
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
1,79
1,79
1,79
1,79
1,79
1,79
1,79
1,79
1,79
1,79
1,79
1,79
1,79
1,79
1,79
1,79
1,79
1,79
1,79
1,79
1,79
1,58

Z2
2
1,79
1,58
1,37
1,16
0,95
0,74
0,53
0,32
0,11
-0,1
-0,31
-0,52
-0,73
-0,94
-1,15
-1,36
-1,57
-1,78
-1,99
-2,2
2
1,79
1,58
1,37
1,16
0,95
0,74
0,53
0,32
0,11
-0,1
-0,31
-0,52
-0,73
-0,94
-1,15
-1,36
-1,57
-1,78
-1,99
-2,2
2

Altura
0,00292
0,00434
0,00618
0,00843
0,01099
0,01372
0,01638
0,01872
0,02046
0,02141
0,02143
0,02053
0,01882
0,01650
0,01385
0,01112
0,00854
0,00628
0,00442
0,00297
0,00192
0,00434
0,00646
0,00920
0,01255
0,01636
0,02042
0,02439
0,02787
0,03047
0,03187
0,03191
0,03056
0,02801
0,02457
0,02062
0,01655
0,01272
0,00935
0,00658
0,00443
0,00285
0,00618

Aclaracin:
Las variables representan:
Z1: Tipificacin
Dimensin1
Z1: Tipificacin
Dimensin2
Altura: calculada a partir de
la funcin Normal.

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

b) El papel de las representaciones grficas.


Un nfasis en
La comprensin de los datos Qu hay aqu?
Tipologa de Representaciones grficas.
Aproximacin de construccin tentativa de modelos y generacin de Hiptesis en un
proceso interactivo. Especificacin modelo, anlisis residual, re-especificacin.
Uso de medidas robustas y re-anlisis sobre subconjuntos seleccionados de datos.
Flexibilidad y escepticismo respecto al mtodo concreto de anlisis a aplicar.
Descubrir patrones en los datos. Como un trabajo detectivesco, atender y observar los
datos hasta que emerja una historia coherente en los mismos. Es decir aprender a partir de los
datos. Abre una perspectiva que debe tomarse como complementaria ms que opuesta a la
perspectiva clsica. Se trata de una perspectiva exploratoria ms que confirmatoria. Ms que
una coleccin de tcnicas se trata de una genuina opcin terica. Es decir de una actitud
hacia los datos.
La tendencia reinante de anlisis de datos psicolgicos pretende muchas veces que
todo lo que nos interesa es el contraste de algn parmetro determinado (el mito del Test de
Hiptesis). Pero lo cierto es que hay multitud de preguntas no menos importantes, de
amplio alcance, y que requieren de una perspectiva ms flexible (menos tajante) en la que de
manera interactiva vamos planteando diferentes preguntas a los datos, es decir planteando
diferentes Hiptesis, a la vez que vamos tomando una serie de decisiones descartando algunas
de las mismas y concretando otras.
As pues se trata ms bien de estudiar las etapas iniciales del anlisis, con
perspectiva exploratoria ms que confirmatoria, realizando anlisis preliminares de los datos y
donde las tcnicas de representacin grfica son cruciales como gua del proceso. Tambin
veremos el uso de tcnicas de representacin como una ayuda ineludible para detectar
patrones complejos en los datos. Qu sucedera a un modelo por ejemplo lineal si uno de
los predictores lo reducimos a algunos de los valores que puede adoptar? Cul es el modelo
que mejor describe los datos? Es exponencial? Es logartmico?

Temas

incluidos bajo el epgrafe EDA:


Representacin de datos.
Transformacin de variables.
Lnea resistente.
Tcnicas de suavizado.
Ajuste de medianas.
Estimacin robusta.

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

10

2) Bases para la representacin


a) Tipos ms frecuentes.
b) Nuevos formatos de representacin.
c) Convenciones en torno al sistema de representacin.

a) Los tipos de representacin ms frecuentes

1. GRFICOS BSICOS.
A. GRUPO HISTOGRAMA.

1. Diagrama rectngulos (bar). Nivel sociocultural padres


(1: sin estudios, 2: primarios, 3: secundarios, 4: superiores).
10
9
8
7

Count

6
5
4
3
2
1
0
0

2
3
CULTPADRE

2. Diagrama barras (bar). Tamao de las pandillas (0,1,2,3,4 5 componentes).


10
9
8

Count

7
6
5
4
3
2
1
0
0

2
3
TAMPANDI

Histograma (histogram). Agrupacin rendimiento en situacin Cooperativa en intervalos de


10 puntos.
e histograma acumulativo (histogram_Histogram Options Cumulative:)

30

0.3

1.2

1.0

4
3
0.1
2

20

0.8

Count

Count

0.2

0.6
10

0.4
0.2

1
0
0

Cumulative Density

Proportion per Bar

20

40
60
80
RENCOOP

100

0.0
120

0
0

20

40
60
80
RENCOOP

100

0.0
120

10

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

11

B. GRUPO POLGONO FRECUENCIAS.

10

10

7
6
5

EXPTPROFE

10

EXPTPROFE

EXPTPROFE

4. Perfil ortogonal (Line, Profile o Pyramid). Expectativa profesor Rendimiento cada nio
del aula.

7
6
5

7
6
5

2
0

2
0

10

20

30

10

NIO

20

2
0

30

10

20

30

NIO

NIO

Polgono frecuencias (Histogram_Type of dsiplay: Frequency Poligon). Agrupacin


rendimiento en situacin Cooperativa en intervalos de 10 puntos.
y Polgono frecuencias acumulativo (histogram_ Type of dsiplay: Frequency Poligon_
Histogram Options Cumulative:).
30

8
7
6

20
Count

Count

5
4

10

3
2
1
0
0

0
0

20

40
60
80
RENCOOP

100

120

20

40
60
80
RENCOOP

100

120

11

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

12

C. GRUPO DIAGRAMAS SIMBLICOS.


6. Diagrama circular o Grfico tarta. (Pie chart). Nivel sociocultural padres.

1
2

4
3

Pictograma (Icon Plot). Rendimiento en cada nio.

12

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

13

2. GRFICOS PARA ESTUDIO DE LA RELACIN ENTRE VARIABLES.


Diagrama de dispersin o nube de puntos (scatterplot). Relacin rendimiento y expectativas
profesor.

120

RENCOOP

100
80
60
40
20
0
2

5
6
7
8
EXPTPROFE

10

13

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

14

b) Nuevos formatos de representacin

3.1. Diagrama de tallos y hojas (Descriptive Statistics_stem and leaf Plot). Rendimiento
en situacin cooperativa. Con letra Courier New.
Stem and Leaf Plot of variable:
Minimum:
1.000
Lower hinge:
55.000
Median:
65.000
Upper hinge:
82.000
Maximum:
100.000

RENCOOP, N = 25

0
1
1
1
* * * Outside Values * * *
3
2
4
112
5 H 57
6 M 0022556
7
135
8 H 24578
9
2
10
0
3.2. Diagrama de cajas y bigotes (Box Plot). Rendimiento en situacin cooperativa.

20

40
60
80
RENCOOP

100

120

14

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

15

El ejemplo de tallos-hojas a dos niveles diferentes de detalle: el sugerido por el programa


SYSTAT (unas 10 lneas) y otro en que se fuerza al doble de intervalos (20 lneas).
Stem and Leaf Plot of variable:
Minimum:
1.000
Lower hinge:
55.000
Median:
65.000
Upper hinge:
82.000
Maximum:
100.000

RENCOOP, N = 25

0
1
1
1
* * * Outside Values * * *
3
2
4
112
5 H 57
6 M 0022556
7
135
8 H 24578
9
2
10
0

Forzando 20 niveles
0
1
1
1
* * * Outside Values * * *
3
2
3
4
112
4
5
5 H 57
6
0022
6 M 556
7
13
7
5
8 H 24
8
578
9
2
9
10
0

15

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

16

Ventajas de los sistemas modernos de representacin


1) Permite retener mayor riqueza informativa (todas y cada una de las puntuaciones) pero
no facilita los clculos numricos de diferentes estadsticos.
2) Ofrece simultneamente un listado de las puntuaciones y un dibujo (si lo tumbamos es
como un histograma).
3) Flexible para alterar el nivel de detalle.
4) Facilita la comparabilidad entre grupos, estudios diferentes, y por ende la comprensin de
los datos.

16

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

17

c) Convenciones en torno al sistema de representacin.


1)
2)
3)
4)
5)

6)
7)
8)
9)

Valores variable en abcisas (X) y frecuencia en ordenada (Y).


Graduacin ordinal de derecha-izquierda y abajo-arriba desde menor a mayor.
Indicaciones de ruptura del eje cuando deseamos dar un salto.
Incluir toda la informacin posible para evitar ambigedades y facilitar su interpretacin
(ttulos descriptivos de los ejes y del propio grfico).
Cuando sea el caso, equiparacin de diferentes grupos o niveles de una variable:
a) Frecuencias relativas en lugar de absolutas para evitar distorsiones interpretativas por
el tamao.
b) Indicacin de dispersin en cada grupo.
c) Igualar la amplitud de los ejes que representan a cada uno de ellos-.
No utilizar ms de 8-9 unidades conceptuales diferentes, intervalos, columnas, barras,
grupos, secciones, etc.
Adaptar el tipo de representacin al tipo de pblico al que ir dirigida.
No alterar o manipular los ejes para inducir imgenes inadecuadas. Por ejemplo este
engao se puede lograr recortando la altura de los histogramas correspondientes.
Usar histogramas en lugar de pictogramas en la medida de lo posible. Por ejemplo, a pesar
de mantener la misma altura se puede inducir la impresin visual de una mayor diferencia
si por ejemplo alteramos el ancho de las figuras o smbolos utilizados.

17

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

18

SEGUNDA PARTE.

ANLISIS GRFICO DE INVESTIGACIONES EDUCATIVAS DESTACADAS.

3) Anlisis descriptivo bsico.


a) Propiedades elementales:
i) Tendencia central, posicin y variabilidad
ii) Forma: Asimetra y apuntamiento
b) La forma de la distribucin segn algunos modelos representativos.
i) El caso de la distribucin normal
ii) La distribucin exponencial.
c) Deteccin de casos anmalos.
Introduccin
Confeccionar representaciones que faciliten la comparacin de grupos
diferentes o donde se ha manipulado algn aspecto. En nuestro ejemplo
centraremos la comparacin de lo que sucede en situaciones competitivas y
cooperativas. As por ejemplo un diagrama tallos-hojas conjunto.

18

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

19

Veamos primero un ejemplo comparativo que ilustra las diferentes propiedades:

40
35
30
25
20
15
10
5
0

A
B
C
D

10

14

37

14

10

10

12

16

19

16

12

10

35

30

10

10

30

35

A y B similar tendencia central (en torno a 5 puntos) pero A es ms homognea su


varianza es menor- que B. Las dos son simtricas. A es ms apuntada que B. La primera
tiende a ser leptocrtica y la segunda a ser ms bien platicrtica.
C y D el mismo grado de variabilidad pero C es asimtrica positiva y D negativa.

El ejemplo que centraremos es el siguiente.


Supuesto 1: anlisis de las implicaciones educativas de la estructura de interaccin entre los
alumnos. Ms en concreto sobre las diferencias en rendimiento y en socializacin segn que
la estructura sea cooperativa o competitiva.

19

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

20

3. Anlisis descriptivo bsico


a) Propiedades elementales

i) Tendencia central
1. Mediante Diagrama de tallos y hojas (Descriptive Statistics_stem and leaf Plot).
Comparacin de rendimiento en las situaciones cooperativa y competitiva. Con letra Courier
New.
Sin forzar
Stem and Leaf Plot of variable:
Minimum:
21.000
Lower hinge:
50.000
Median:
54.000
Upper hinge:
82.000
Maximum:
100.000

RENCOOP, N = 25

2
12
3
27
4
00
5 M 0000024
6
015
7
35
8 H 24578
9
2
10
0
Stem and Leaf Plot of variable:
Minimum:
22.000
Lower hinge:
37.000
Median:
50.000
Upper hinge:
60.000
Maximum:
100.000

RENCOMPI, N = 25

2
23
2
9
3
3 H 5557
4
0034
4
5 M 00002
5
5
6 H 002
6
7
2
7
5
8
2
* * * Outside Values * * *
9
8
10
0

20

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

21

Forzando 10 lneas en los dos variables para compararlas.


Stem and Leaf Plot of variable:
Minimum:
21.000
Lower hinge:
50.000
Median:
54.000
Upper hinge:
82.000
Maximum:
100.000

RENCOOP, N = 25

2
12
3
27
4
00
5 M 0000024
6
015
7
35
8 H 24578
9
2
10
0
Stem and Leaf Plot of variable:
Minimum:
22.000
Lower hinge:
37.000
Median:
50.000
Upper hinge:
60.000
Maximum:
100.000

RENCOMPI, N = 25

2
239
3 H 5557
4
0034
5 M 000025
6 H 002
7
25
8
2
* * * Outside Values * * *
9
8
10
0

21

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

22

2. Clsica. Mediante histogramas

0.3

3
0.1
2

5
Count

Count

6
0.2

4
3
0.1

Proportion per Bar

0.2

Proportion per Bar

0
0.0
20 30 40 50 60 70 80 90 100 110
RENCOOP

0
0.0
20 30 40 50 60 70 80 90 100 110
RENCOMPI

22

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

23

i) Variabilidad
1. Mediante Diagrama de cajas y barbas (Box Plot). Comparacin de rendimiento en las
situaciones cooperativa y competitiva.

20 30 40 50 60 70 80 90 100 110
RENCOMPI

20 30 40 50 60 70 80 90 100 110
RENCOOP

2. Clsica. Mediante cuantiles


Displaying Error Bars on a Graph
From the Graph menu, select Bar, Dot, or Line.
In the dialog box choose:
Options
Error Bar

23

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

24

ii) Ilustracin comparativa de diferentes


asimetra y apuntamiento (curtosis).

formas

segn

(comparar con los ndices numricos)

12

8
0.3

Count

0
0

20

40
60
80
RENCOOP

100

0.1
2

0.0
120

12

0
2

2
3
CULTPADRE

0.0
5

5
6
7
EXPTPROFE

0.0
10

0.6

10

0.4

Count

Count

0
0.0
0 10 20 30 40 50 60 70 80 90 100
RENCOMPI

0.3
5

0.2

0.1

0.1
2

Proportion per Bar

0.2
4

0.5
Proportion per Bar

0.3

0.2

0.4

15

10

0
0

0.2

4
3

0.1

Proportion per Bar

0.2
4

Proportion per Bar

0.3

Proportion per Bar

0.3

Count

0.4

Count

10

0.1
0
0

2
3
TAMPANDI

0.0
5

24

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

25

b) Ilustracin de la forma de la distribucin segn algunos Modelos


representativos.

i) El caso de la Distribucin Normal Univariada


(Graph Line sobre fichero Normal.syd tomando Z1 e Y1).
0.4

Y1

0.3

0.2

0.1

0.0
-3

-2

-1

0
Z1

25

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

26

Estudio de la Forma-Modelo de la distribucin

5
Count

Count

A travs de representaciones especficas.


Density Function

4
3

2
1

1
0
30 40 50 60 70 80 90 100 110
RENCOOP

0
0 10 20 30 40 50 60 70 80 90 100
RENCOMPI

3
2
1
0
-1
-2
-3
30 40 50 60 70 80 90 100 110
RENCOOP

Expected Value for Normal Distribution

Expected Value for Normal Distribution

Que se aproximen o no a una lnea recta. Cuanto ms prximo a esta mejor ajusta el modelo hipotetizado.
Esta funcin s que incluye smooth para ajustar una lnea recta precisamente y poder aproximarnos
mejor.
Veamos la aproximacin a la normal.
3
2
1
0
-1
-2
-3
0 10 20 30 40 50 60 70 80 90 100
RENCOMPI

26

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

27

ii) La distribucin exponencial

0
30 40 50 60 70 80 90 100 110
RENCOOP

Expected Value for Exponential Distribution

Expected Value for Exponential Distribution

As pues, que los juicios sean comparativos (relativos) mas que absolutos. En este caso vamos a
comparar con otro tipo de modelo de distribucin, vg una exponencial.

0
0 10 20 30 40 50 60 70 80 90 100
RENCOMPI

Como se puede apreciar el ajuste normal es mejor que el de la exponencial por ejemplo.

27

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

28

Ilustracin de diferentes tipos de relacin

LINEAL
8

y = a + bx

6
4
2
0
1

11

21

31

41

51

EXPONENCIAL

POTENCIAL

100

0,1

80

0,08

60

0,06

y = ae bx

40

y = ax b

0,04

20

0,02

0
1

11

21

31

41

51

11

HIPERBLICA

21

31

0,1

y=

0,8

b
y =a+
x

0,15

51

LOGSTICA

0,25
0,2

41

0,6

1
1 + ae bx

0,4

0,05

0,2

11

21

31

41

11

21

31

41

51

28

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

29

c) Deteccin de casos anmalos.

29

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

30

30

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

31

4. Anlisis de relacin entre variables


a) Introduccin.
b) El caso lineal.
c) Relacin no lineal.

a) Introduccin
Es importante la exploracin grfica de la relacin, sobre todo para perfilar el tipo de
relacin. La ms importante ha sido en las disciplinas afines a la Psicologa sin lugar a dudas
la lineal. Pero no es este tipo de relacin ni mucho menos el nico tipo posible. De hecho
veremos un ejemplo extrado de la investigacin educativa que apunta ms bien un tipo
diferente de relacin. Una vez ms el anlisis exploratorio es crucial en este punto.
Por otro lado, tambin es importante observar/explorar con detenimiento el conjunto
de datos de nuestro estudio. Nuevamente la presencia de puntos anmalos puede se
distorsionante. En este punto podramos forjarnos una idea de relacin que es inadecuada. El
anlisis exploratorio tipo EDA vuelve a ser crucial. Veremos un mtodo robusto de
estimacin.
Todos los puntos trazados estn relacionados con la estadstica robusta.
El anlisis exploratorio puede ayudarnos, adems, a evitar algunos riesgos
inherentes a la interpretacin de relaciones.
Dependencia de la variabilidad.
Mediacin de terceras variables.
Rango de valores restringido y por tanto poco representativo de la poblacin de
referencia.
Mezcla de grupos heterogneos.
Centraremos dos ejemplos de manera comparativa. Veamos el primero de ellos.
Supuesto 2: Anlisis de las predicciones en el xito escolar a partir de las expectativas del
profesor.
Incluye un outlier, lo que permite apreciar la distorsin que provoca sobre la recta de
regresin.
Algo que se puede detectar mediante la representacin grfica correspondiente y que se puede
corregir mediante la recta de Tukey que es robusta (se basa en las medianas). Le ajustamos
algunos modelos diferentes para que se vea claramente la superioridad del lineal frente a otros
modelos como el exponencial o logartmico.
Realmente el estudio fue de regresin mltiple, cuya ecuacin sera de la forma:

z RF = 0.62 z EP + 0.16 z EA 0.18 z RAA ; R 2 = 0,801


RF: Rendimiento acadmico Final del curso,
EP: Expectativas profesor,
EA: Expectativas alumno y
RAA: Rendimiento Anterior del Alumno.
De Navas, Sampascual y Castejn (1991). Relacin entre rendimiento y variables
motivacionales cognitivas en nios de 5 EGB.

31

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

32

b) El caso Lineal

10
9

EXPTPROFE

8
7
6
5
4
3
2
1
0
20 30 40 50 60 70 80 90 100 110
RENCOOP

Tantear el ajuste hasta dar con la tecla del lineal:


Smoother (Scatterplot_options)
10
9

EXPTPROFE

8
7
6
5
4
3
2
1
0
20 30 40 50 60 70 80 90 100 110
RENCOOP

32

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

33

Estudio de la relacin entre variables a partir del Supuesto 2


El grfico nos permite comparar lo que sucede cuando est presente el outlier identificado frente a
cuando ste desaparece (como si se tratara de un valor perdido).

10
9
8
Value

7
6
5
4
3
NEWEXPT
EXPTPROFE

2
30 40 50 60 70 80 90 100 110
RENCOOP

Por ello sera til disponer de una estimacin robusta en casos como este. Veamos la lnea resistente de
Tukey, una de las tcnicas ms representativas en este punto.
X
Case n

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

ExpecProf RendCoo

9,0
3,5
2,5
2,6
2,5
3,5
5,5
7,0
6,8
5,0
3,5
4,0
6,7
3,5
5,5
5,0
5,0
4,0
5,5
5,0
6,0
8,6
8,8
9,0
8,0

Case n

1
11
32
41
41
42
55
57
60
60
62
62
65
65
66
71
73
75
82
84
85
87
88
92
100

3
5
4
2
6
11
14
12
18
10
16
17
20
7
15
19
21
13
9
8
25
22
23
1
24
Md
Md1
Md2

ExpecProf RendCoo

2,5
2,5
2,6
3,5
3,5
3,5
3,5
4,0
4,0
5,0
5,0
5,0
5,0
5,5
5,5
5,5
6,0
6,7
6,8
7,0
8,0
8,6
8,8
9,0
9,0
5,0
3,5
6,9

32
41
41
11
42
62
65
62
75
60
71
73
84
55
66
82
85
65
60
57
100
87
88
1
92
65
61
74

33

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

34

Representacin de la relacin a partir de un diagrama de dispersin:

120

RENDIMIENTO

100
80
60
40
20
0
0,0

2,0

4,0

6,0

8,0

10,0

EXPECTATIVA PROFE

Representacin de la relacin junto con la extrapolacin de la recta de regresin lineal:

120

RENDIMIENTO

100
y = 4,4472x + 38,087

80

y = 3,8235x + 47,618

60
40
20
0
0,0

2,0

4,0

6,0

8,0

10,0

EXPECTATIVA PROFE

34

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

35

C) De tipo no lineal. Por ejemplo una funcin exponencial.

Por otro lado, veamos otro estudio en que tambin interesa la relacin entre dos
variables.
Supuesto 3: Anlisis de la progresin evolutiva en las destrezas.
Se mide el nmero de errores cometidos en una batera que incluye una muestra
representativa de las habilidades cognitivas (aptitudes) ms destacadas a diferentes grupos de
edad. Entonces realizamos un seguimiento de las destrezas medido a travs del nmero de
errores. Como se podr apreciar se trata de una funcin exponencial. Le ajustamos tambin
algunos modelos diferentes para que se vea claramente la superioridad del lineal frente a otros
modelos como el exponencial o logartmico.
Interpretacin de la exponencial. Paulatinamente se comete menor nmero de errores, luego
mejoran las destrezas bsicas. Pero ese cambio no es constante en los diferentes momentos
sino que es proporcionalmente mayor al principio que en edades posteriores.
(Fichero repres2.syd)

12
10

ERR

8
6
4
2
0
0

10

15

EDAD

Ir tanteando los ajustes hasta dar con el mejor ajuste, proporcionado por el modelo
exponencial:
Smoother (Scatterplot_options)

35

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

36

Supuesto 3 para estimacin de relacin no lineal sobre Anlisis de la progresin evolutiva de


las destrezas cognitivas.
Matriz de datos. Dentro figura el nmero de errores cometido por cada nio en cada nivel de
edad.

NIOS

1
2
3
4
5
6
7
8
9
10
MEDIA

5
10
9
10
8
10
9
8
9
10
7
9,0

7
6
5
7
5
5
4
7
4
5
2
5,0

AOS
9
6
4
2
3
2
3
3
2
3
2
3,0

11
1
0
2
2
1
3
2
4
5
0
2,0

13
0
1
1
2
2
2
2
3
1
1
1,5

36

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

37

REPRESENTACIN DE LA RELACIN A PARTIR DE UN DIAGRAMA DE DISPERSIN:

12

ERRORES

10
8
6
4
2
0
0

EDAD

10

15

Representacin de la relacin junto con la extrapolacin de la funcin exponencial:

12

ERRORES

10
8
6
4
2
0
0

EDAD

10

15

37

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

38

5) Representaciones Multidimensionales
Se ilustrar la Normal Multidimensional, como ejemplo de grfico 3-D y sus posibilidades.

Para ello se simulan variaciones cclicas de una variable Z2 (tipificada) anidada a otra
variable Z1 y se estima a partir de la interaccin (el producto) de ambas la altura de
la funcin. Los datos de dicha simulacin se recogen en el fichero normal.syd y el
grfico tridimensional resultante en el fichero Normal3D.SYG

El resultado es la representacin:

38

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

39

Anexos.- Listados de diferentes anlisis con el


programa SYSTAT
El anlisis descriptivo detallado del Supuesto 1:
N of cases
Minimum
Maximum
Range
Sum
Median
Mean
95% CI Upper
95% CI Lower
Std. Error
Standard Dev
Variance
C.V.
Skewness(G1)
SE Skewness
Kurtosis(G2)
SE Kurtosis

RENCOOP
25
31.000
100.000
69.000
1607.000
65.000
64.280
72.501
56.059
3.983
19.915
396.627
0.310
-0.165
0.464
-0.815
0.902

RENCOMPI
25
5.000
92.000
87.000
1274.000
52.000
50.960
60.921
40.999
4.826
24.131
582.290
0.474
-0.125
0.464
-0.708
0.902

N of cases
Minimum
Maximum
Range
Sum
Median
Mean
95% CI Upper
95% CI Lower
Std. Error
Standard Dev
Variance
C.V.
Skewness(G1)
SE Skewness
Kurtosis(G2)
SE Kurtosis

RENCOOP
25
1.000
100.000
99.000
1557.000
65.000
62.280
72.266
52.294
4.839
24.193
585.293
0.388
-0.880
0.464
0.763
0.902

RENCOMPI
25
5.000
92.000
87.000
1274.000
52.000
50.960
60.921
40.999
4.826
24.131
582.290
0.474
-0.125
0.464
-0.708
0.902

EXPTPROFE
25
1.000
9.000
8.000
128.500
5.000
5.140
6.017
4.263
0.425
2.124
4.512
0.413
0.205
0.464
-0.521
0.902

EXPTPROFE
25
2.500
9.000
6.500
136.000
5.000
5.440
6.302
4.578
0.418
2.089
4.362
0.384
0.376
0.464
-0.931
0.902

CULTPADRE
25
1.000
4.000
3.000
60.000
2.000
2.400
2.862
1.938
0.224
1.118
1.250
0.466
0.272
0.464
-1.253
0.902

CULTPADRE
25
1.000
4.000
3.000
60.000
2.000
2.400
2.862
1.938
0.224
1.118
1.250
0.466
0.272
0.464
-1.253
0.902

TAMPANDI
25
0.0
4.000
4.000
47.000
2.000
1.880
2.390
1.370
0.247
1.236
1.527
0.657
0.390
0.464
-0.530
0.902

TAMPANDI
25
0.0
4.000
4.000
47.000
2.000
1.880
2.390
1.370
0.247
1.236
1.527
0.657
0.390
0.464
-0.530
0.902

39

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

40

Diferentes variaciones de representaciones modernas a partir de EDA:


Stem and Leaf Plot of variable:
RENCOOP, N = 25
Minimum:
31.000
Lower hinge:
55.000
Median:
65.000
Upper hinge:
82.000
Maximum:
100.000
3
112
4
112
5 H 57
6 M 0022556
7
135
8 H 24578
9
2
10
0
Stem and Leaf Plot of variable:
Minimum:
5.000
Lower hinge:
37.000
Median:
52.000
Upper hinge:
66.000
Maximum:
92.000

RENCOMPI, N = 25

0
5
1
19
2
13
3 H 2789
4
5 M 0012344
6 H 056
7
35
8
257
9
2
Stem and Leaf Plot of variable:
Minimum:
31.000
Lower hinge:
55.000
Median:
65.000
Upper hinge:
82.000
Maximum:
100.000

RENCOOP, N = 25

3
112
4
112
5 H 57
6 M 0022556
7
135
8 H 24578
9
2
10
0
Stem and Leaf Plot of variable:
Minimum:
5.000
Lower hinge:
37.000
Median:
52.000
Upper hinge:
66.000
Maximum:
92.000

RENCOMPI, N = 25

0
5
1
19
2
13
3 H 2789
4
5 M 0012344
6 H 056
7
35
8
257
9
2

40

También podría gustarte