Está en la página 1de 40

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

REPRESENTACIONES GRFICAS EN LA INVESTIGACIN EDUCATIVA. ANLISIS DE DATOS DESDE UNA PERSPECTIVA EXPLORATORIA
Manuel Miguel Ramos lvarez Junio de 2005

INTRODUCCIN A LOS CONCEPTOS PRINCIPALES.


1) Introduccin al anlisis con base exploratoria. a) Objetivos y perspectiva. b) El papel de las representaciones grficas. 2) Bases para la representacin a) Tipos ms frecuentes. b) Nuevos formatos de representacin. c) Convenciones en torno al sistema de representacin.

PRIMERA PARTE.

SEGUNDA PARTE. ANLISIS GRFICO DE INVESTIGACIONES EDUCATIVAS DESTACADAS.


3) Anlisis descriptivo bsico. a) Propiedades elementales. i) Tendencia central, posicin y variabilidad. ii) Forma: Asimetra y apuntamiento. b) La forma de la distribucin segn algunos modelos representativos. i) El caso de la distribucin normal. ii) La distribucin exponencial. c) Deteccin de casos anmalos. 4) Anlisis de la relacin entre variables. a) Introduccin. b) El caso lineal. c) Relacin no lineal. 5) Representaciones Multidimensionales.

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

Bibliografa
1. 2. 3. 4. 5. 6. 7.

Amn, J. (1980): Estadstica para Psiclogos 1. Madrid: Pirmide. Botella, J., Len, O. y San Martn, R. (1993): Anlisis de Datos en Psicologa I. Madrid: Pirmide. Ferguson, G.A. (1986) Anlisis Estadstico en Educacin y Psicologa. Madrid: Anaya. Freixa, M., Salafranca, L., Guardia, J., Ferrer, R. y Turbany, J. (1992): Anlisis exploratorio de datos: Nuevas tcnicas estadsticas. Barcelona: PPU. Guilford, J. P. y Frutcher, B. (1984): Estadstica Aplicada a la Psicologa y a la Educacin. Bogot: McGraw-Hill. Palmer. A. (1995). El Anlisis Exploratorio de Datos. Madrid: Pirmide. Welkowitz, J., Ewen, R. B. y Cohen, J. (1981): Estadstica Aplicada a las Ciencias de la Educacin. Madrid: Santillana.

Investigaciones
Supuesto 1: Implicaciones educativas de la estructura de interaccin entre los alumnos. Supuesto 2: Predicciones de xito escolar a partir de las expectativas del profesor. Supuesto 3: Anlisis de la progresin evolutiva de las destrezas cognitivas.

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

INTRODUCCIN A LOS CONCEPTOS PRINCIPALES.

PRIMERA PARTE.

1. Introduccin al anlisis con base exploratoria.


a) Objetivos y perspectiva. b) El papel de las representaciones grficas.

a) Objetivos y Perspectiva 1 parte: una descripcin bsica de caractersticas y tipos de representaciones que se apoyar mediante transparencias y fotocopias. Incluye tambin unas definiciones bsicas de puntos destacados, EDA como perspectiva moderna, convenciones, etc. Se realizar un breve recorrido por la estadstica descriptiva, teniendo en cuenta el objetivo de representaciones, que abarca desde la perspectiva clsica hasta la moderna. 2 parte de aplicaciones concretas. Centrado en ejemplos mejor que en tcnicas. Es decir relatar ejemplos concretos de investigaciones educativas con una serie de objetivos a cubrir y entonces situar su anlisis dentro de un esquema amplio de anlisis donde se vea claramente la utilidad de las representaciones grficas. Adems ser importante que quede patente el carcter interactivo de la perspectiva que se defiende en el curso. Es decir cmo vamos forjando Hiptesis y explorando recurrentemente las representaciones, etc. Utilizacin de abundante cantidad de ejemplos que ilustren bien la problemtica. A veces un tipo de representacin camufla una realidad importante. Pues bien, un objetivo importante es que el supuesto seleccionado permita clarificar esta cuestin. Mltiples representaciones de los mismos datos para ver cosas diferentes en los mismos cada vez. De forma interactiva. Es decir presentarlo como una continua generacin y contraste de Hiptesis. Explicar los ejemplos dentro del seno de la Psicologa Educacin. Contenidos de la Psicologa de la Educacin. Definicin proceso bsico de aprendizaje. Factores intrapersonales Factores interpersonales y socio-ambientales. Anlisis psicoeducativo del proceso. Conocimiento psicolgico y prctica educativa.

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

Describir los programas de anlisis estadstico y sus posibilidades grficas. Uno de los ms destacados es SYSTAT, motivo por el que hemos optado por l.

Men Graph del programa SYSTAT:

OPCIN
Spin Plot Cplot Bar Pie Density Box Stemleaf Pplot Qplot SPLOT Icon Map

DESCRIPCIN
Rotacin grficos 3-D Diagrama dispersin Categrico de Barras o rectngulos De tartas o circular Histograma, Polgono y Funcin Probabilidad Diagrama cajas y barbas Diagrama tallos y hojas Densidad ProbabilsticosCuantiles Matricial Simblico o Pictograma Simblico de Mapas

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

El fichero repres1.syd es para el programa SYSTAT y servir para desarrollar los Supuestos 1 y 2. El fichero incluye la siguiente informacin:

nio 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

rencoop rencompi exptprofe cultpadre tampandi 1 5 9,0 1 0 11 11 3,5 1 1 32 19 2,5 1 1 41 21 2,6 2 2 41 23 2,5 2 2 42 32 3,5 3 3 55 37 5,5 3 0 57 38 7,0 4 0 60 39 6,8 4 1 60 50 5,0 4 1 62 50 3,5 2 2 62 51 4,0 2 3 65 52 6,7 4 4 65 53 3,5 3 4 66 54 5,5 2 1 71 54 5,0 2 2 73 60 5,0 2 2 75 66 4,0 1 1 82 65 5,5 4 2 84 73 5,0 4 2 85 75 6,0 2 4 87 82 8,6 1 2 88 85 8,8 1 1 92 87 9,0 2 2 100 92 8,0 3 4

Aclaracin: Las variables representan: rencoop: rendimiento en situacin cooperativa. rencompi: rendimiento en situacin competitiva. Exptprofe: expectativas del profesor. cultpadre: nivel sociocultural padres. tampandi: tamao de las pandillas.

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

Con los promedios: rencoop rencompi exptprofe cultpadre tampandi Promedio 62,28 50,96 5,44 2,40 1,88

Y sirven para describir las implicaciones educativas de la estructura de interaccin entre los alumnos y ms en concreto para analizar las predicciones de xito escolar a partir de las expectativas del profesor.

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

El fichero repres2.syd es para el programa SYSTAT y servir para desarrollar el Supuesto 3. El fichero incluye la siguiente informacin: edad 5.000 5.000 5.000 5.000 5.000 5.000 5.000 5.000 5.000 5.000 7.000 7.000 7.000 7.000 7.000 7.000 7.000 7.000 7.000 7.000 9.000 9.000 9.000 9.000 9.000 9.000 9.000 9.000 9.000 9.000 11.000 11.000 11.000 11.000 11.000 11.000 11.000 11.000 11.000 11.000 13.000 13.000 13.000 13.000 13.000 13.000 13.000 13.000 13.000 13.000 error 10.000 9.000 10.000 8.000 10.000 9.000 8.000 9.000 10.000 7.000 6.000 5.000 7.000 5.000 5.000 4.000 7.000 4.000 5.000 2.000 6.000 4.000 2.000 3.000 2.000 3.000 3.000 2.000 3.000 2.000 1.000 0.0 2.000 2.000 1.000 3.000 2.000 4.000 5.000 0.0 0.0 1.000 1.000 2.000 2.000 2.000 2.000 3.000 1.000 1.000

Aclaracin: Las variables representan: Edad: medida en aos Error: Nmero de errores cometidos en una batera de aptitudes.

Y sirve para efectuar el anlisis de la progresin evolutiva de las destrezas cognitivas.

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

Por ltimo, el fichero normal.syd es para el programa SYSTAT y servir para desarrollar la simulacin de la distribucin Normal Multivariada, como ilustracin de las posibilidades grficas ms sofisticadas. El fichero incluye la siguiente informacin: Z1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1,79 1,79 1,79 1,79 1,79 1,79 1,79 1,79 1,79 1,79 1,79 1,79 1,79 1,79 1,79 1,79 1,79 1,79 1,79 1,79 1,79 1,58 Z2 2 1,79 1,58 1,37 1,16 0,95 0,74 0,53 0,32 0,11 -0,1 -0,31 -0,52 -0,73 -0,94 -1,15 -1,36 -1,57 -1,78 -1,99 -2,2 2 1,79 1,58 1,37 1,16 0,95 0,74 0,53 0,32 0,11 -0,1 -0,31 -0,52 -0,73 -0,94 -1,15 -1,36 -1,57 -1,78 -1,99 -2,2 2 Altura 0,00292 0,00434 0,00618 0,00843 0,01099 0,01372 0,01638 0,01872 0,02046 0,02141 0,02143 0,02053 0,01882 0,01650 0,01385 0,01112 0,00854 0,00628 0,00442 0,00297 0,00192 0,00434 0,00646 0,00920 0,01255 0,01636 0,02042 0,02439 0,02787 0,03047 0,03187 0,03191 0,03056 0,02801 0,02457 0,02062 0,01655 0,01272 0,00935 0,00658 0,00443 0,00285 0,00618

Aclaracin: Las variables representan: Z1: Tipificacin Dimensin1 Z1: Tipificacin Dimensin2 Altura: calculada a partir de la funcin Normal.

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

b) El papel de las representaciones grficas. Un nfasis en La comprensin de los datos Qu hay aqu? Tipologa de Representaciones grficas. Aproximacin de construccin tentativa de modelos y generacin de Hiptesis en un proceso interactivo. Especificacin modelo, anlisis residual, re-especificacin. Uso de medidas robustas y re-anlisis sobre subconjuntos seleccionados de datos. Flexibilidad y escepticismo respecto al mtodo concreto de anlisis a aplicar. Descubrir patrones en los datos. Como un trabajo detectivesco, atender y observar los datos hasta que emerja una historia coherente en los mismos. Es decir aprender a partir de los datos. Abre una perspectiva que debe tomarse como complementaria ms que opuesta a la perspectiva clsica. Se trata de una perspectiva exploratoria ms que confirmatoria. Ms que una coleccin de tcnicas se trata de una genuina opcin terica. Es decir de una actitud hacia los datos. La tendencia reinante de anlisis de datos psicolgicos pretende muchas veces que todo lo que nos interesa es el contraste de algn parmetro determinado (el mito del Test de Hiptesis). Pero lo cierto es que hay multitud de preguntas no menos importantes, de amplio alcance, y que requieren de una perspectiva ms flexible (menos tajante) en la que de manera interactiva vamos planteando diferentes preguntas a los datos, es decir planteando diferentes Hiptesis, a la vez que vamos tomando una serie de decisiones descartando algunas de las mismas y concretando otras. As pues se trata ms bien de estudiar las etapas iniciales del anlisis, con perspectiva exploratoria ms que confirmatoria, realizando anlisis preliminares de los datos y donde las tcnicas de representacin grfica son cruciales como gua del proceso. Tambin veremos el uso de tcnicas de representacin como una ayuda ineludible para detectar patrones complejos en los datos. Qu sucedera a un modelo por ejemplo lineal si uno de los predictores lo reducimos a algunos de los valores que puede adoptar? Cul es el modelo que mejor describe los datos? Es exponencial? Es logartmico?

Temas

incluidos bajo el epgrafe EDA: Representacin de datos. Transformacin de variables. Lnea resistente. Tcnicas de suavizado. Ajuste de medianas. Estimacin robusta.

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

10

2) Bases para la representacin


a) Tipos ms frecuentes. b) Nuevos formatos de representacin. c) Convenciones en torno al sistema de representacin.

a) Los tipos de representacin ms frecuentes

1. GRFICOS BSICOS. A. GRUPO HISTOGRAMA.


1. Diagrama rectngulos (bar). Nivel sociocultural padres (1: sin estudios, 2: primarios, 3: secundarios, 4: superiores).
10 9 8 7

Count

6 5 4 3 2 1 0 0

2 3 CULTPADRE

2. Diagrama barras (bar). Tamao de las pandillas (0,1,2,3,4 5 componentes).


10 9 8 7

Count

6 5 4 3 2 1 0 0

2 3 TAMPANDI

Histograma (histogram). Agrupacin rendimiento en situacin Cooperativa en intervalos de 10 puntos. e histograma acumulativo (histogram_Histogram Options Cumulative:)

8 0.3 7 6 5
Count Proportion per Bar

30

1.2 1.0
Cumulative Density

0.2

20
Count

0.8 0.6

4 3 0.1 2 1 0 0 20 40 60 80 RENCOOP 100 0.0 120

10

0.4 0.2

0 0

20

40 60 80 RENCOOP

100

0.0 120

10

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

11

B. GRUPO POLGONO FRECUENCIAS.


4. Perfil ortogonal (Line, Profile o Pyramid). Expectativa profesor Rendimiento cada nio del aula.
10 9 8
EXPTPROFE EXPTPROFE

10 9 8
EXPTPROFE

10 9 8 7 6 5 4 3

7 6 5 4 3 2 0 10 NIO 20 30

7 6 5 4 3 2 0 10 NIO 20 30

2 0

10 NIO

20

30

Polgono frecuencias (Histogram_Type of dsiplay: Frequency Poligon). Agrupacin rendimiento en situacin Cooperativa en intervalos de 10 puntos. y Polgono frecuencias acumulativo (histogram_ Type of dsiplay: Frequency Poligon_ Histogram Options Cumulative:).
8 7 6
Count
Count

30

20

5 4 3 2 1 0 0

10

0 0

20

20

40 60 80 RENCOOP

100

120

40 60 80 RENCOOP

100

120

11

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

12

C. GRUPO DIAGRAMAS SIMBLICOS.


6. Diagrama circular o Grfico tarta. (Pie chart). Nivel sociocultural padres.

1 2

4 3

Pictograma (Icon Plot). Rendimiento en cada nio.

12

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

13

2. GRFICOS PARA ESTUDIO DE LA RELACIN ENTRE VARIABLES.


Diagrama de dispersin o nube de puntos (scatterplot). Relacin rendimiento y expectativas profesor.

120 100
RENCOOP

80 60 40 20 0 2

5 6 7 8 EXPTPROFE

10

13

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

14

b) Nuevos formatos de representacin

3.1. Diagrama de tallos y hojas (Descriptive Statistics_stem and leaf Plot). Rendimiento en situacin cooperativa. Con letra Courier New. Stem and Leaf Plot of variable: Minimum: 1.000 Lower hinge: 55.000 Median: 65.000 Upper hinge: 82.000 Maximum: 100.000 0 1 1 1 * * * Outside Values * * * 3 2 4 112 5 H 57 6 M 0022556 7 135 8 H 24578 9 2 10 0 3.2. Diagrama de cajas y bigotes (Box Plot). Rendimiento en situacin cooperativa. RENCOOP, N = 25

20

40 60 80 RENCOOP

100

120

14

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

15

El ejemplo de tallos-hojas a dos niveles diferentes de detalle: el sugerido por el programa SYSTAT (unas 10 lneas) y otro en que se fuerza al doble de intervalos (20 lneas).
Stem and Leaf Plot of variable: Minimum: 1.000 Lower hinge: 55.000 Median: 65.000 Upper hinge: 82.000 Maximum: 100.000 0 1 1 1 * * * Outside Values * * * 3 2 4 112 5 H 57 6 M 0022556 7 135 8 H 24578 9 2 10 0 RENCOOP, N = 25

Forzando 20 niveles
0 1 1 1 * * * Outside Values * * * 3 2 3 4 112 4 5 5 H 57 6 0022 6 M 556 7 13 7 5 8 H 24 8 578 9 2 9 10 0

15

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

16

Ventajas de los sistemas modernos de representacin 1) Permite retener mayor riqueza informativa (todas y cada una de las puntuaciones) pero no facilita los clculos numricos de diferentes estadsticos. 2) Ofrece simultneamente un listado de las puntuaciones y un dibujo (si lo tumbamos es como un histograma). 3) Flexible para alterar el nivel de detalle. 4) Facilita la comparabilidad entre grupos, estudios diferentes, y por ende la comprensin de los datos.

16

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

17

c) Convenciones en torno al sistema de representacin. 1) 2) 3) 4) 5) Valores variable en abcisas (X) y frecuencia en ordenada (Y). Graduacin ordinal de derecha-izquierda y abajo-arriba desde menor a mayor. Indicaciones de ruptura del eje cuando deseamos dar un salto. Incluir toda la informacin posible para evitar ambigedades y facilitar su interpretacin (ttulos descriptivos de los ejes y del propio grfico). Cuando sea el caso, equiparacin de diferentes grupos o niveles de una variable: a) Frecuencias relativas en lugar de absolutas para evitar distorsiones interpretativas por el tamao. b) Indicacin de dispersin en cada grupo. c) Igualar la amplitud de los ejes que representan a cada uno de ellos-. No utilizar ms de 8-9 unidades conceptuales diferentes, intervalos, columnas, barras, grupos, secciones, etc. Adaptar el tipo de representacin al tipo de pblico al que ir dirigida. No alterar o manipular los ejes para inducir imgenes inadecuadas. Por ejemplo este engao se puede lograr recortando la altura de los histogramas correspondientes. Usar histogramas en lugar de pictogramas en la medida de lo posible. Por ejemplo, a pesar de mantener la misma altura se puede inducir la impresin visual de una mayor diferencia si por ejemplo alteramos el ancho de las figuras o smbolos utilizados.

6) 7) 8) 9)

17

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

18

ANLISIS GRFICO DE INVESTIGACIONES EDUCATIVAS DESTACADAS.

SEGUNDA PARTE.

3) Anlisis descriptivo bsico.


a) Propiedades elementales: i) Tendencia central, posicin y variabilidad ii) Forma: Asimetra y apuntamiento b) La forma de la distribucin segn algunos modelos representativos. i) El caso de la distribucin normal ii) La distribucin exponencial. c) Deteccin de casos anmalos. Introduccin Confeccionar representaciones que faciliten la comparacin de grupos diferentes o donde se ha manipulado algn aspecto. En nuestro ejemplo centraremos la comparacin de lo que sucede en situaciones competitivas y cooperativas. As por ejemplo un diagrama tallos-hojas conjunto.

18

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

19

Veamos primero un ejemplo comparativo que ilustra las diferentes propiedades:

40 35 30 25 20 15 10 5 0
A B C D

A B C D

1 1 2 8 1

2 6 10 35 1

3 10 12 30 3

4 14 16 10 5

5 37 19 7 7

6 14 16 5 10

7 10 12 3 30

8 6 10 1 35

9 2 3 1 8

A y B similar tendencia central (en torno a 5 puntos) pero A es ms homognea su varianza es menor- que B. Las dos son simtricas. A es ms apuntada que B. La primera tiende a ser leptocrtica y la segunda a ser ms bien platicrtica. C y D el mismo grado de variabilidad pero C es asimtrica positiva y D negativa.

El ejemplo que centraremos es el siguiente. Supuesto 1: anlisis de las implicaciones educativas de la estructura de interaccin entre los alumnos. Ms en concreto sobre las diferencias en rendimiento y en socializacin segn que la estructura sea cooperativa o competitiva.

19

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

20

3. Anlisis descriptivo bsico


a) Propiedades elementales

i) Tendencia central
1. Mediante Diagrama de tallos y hojas (Descriptive Statistics_stem and leaf Plot). Comparacin de rendimiento en las situaciones cooperativa y competitiva. Con letra Courier New. Sin forzar Stem and Leaf Plot of variable: Minimum: 21.000 Lower hinge: 50.000 Median: 54.000 Upper hinge: 82.000 Maximum: 100.000 2 12 3 27 4 00 5 M 0000024 6 015 7 35 8 H 24578 9 2 10 0 Stem and Leaf Plot of variable: Minimum: 22.000 Lower hinge: 37.000 Median: 50.000 Upper hinge: 60.000 Maximum: 100.000 2 23 2 9 3 3 H 5557 4 0034 4 5 M 00002 5 5 6 H 002 6 7 2 7 5 8 2 * * * Outside Values * * * 9 8 10 0 RENCOMPI, N = 25

RENCOOP, N = 25

20

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

21

Forzando 10 lneas en los dos variables para compararlas. Stem and Leaf Plot of variable: Minimum: 21.000 Lower hinge: 50.000 Median: 54.000 Upper hinge: 82.000 Maximum: 100.000 2 12 3 27 4 00 5 M 0000024 6 015 7 35 8 H 24578 9 2 10 0 Stem and Leaf Plot of variable: Minimum: 22.000 Lower hinge: 37.000 Median: 50.000 Upper hinge: 60.000 Maximum: 100.000 2 239 3 H 5557 4 0034 5 M 000025 6 H 002 7 25 8 2 * * * Outside Values * * * 9 8 10 0 RENCOMPI, N = 25 RENCOOP, N = 25

21

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

22

2. Clsica. Mediante histogramas

7 6
Proportion per Bar

8 0.3 7 0.2 6 5
Count Proportion per Bar

5
Count

4 3 0.1 2 1 0 0.0 20 30 40 50 60 70 80 90 100 110 RENCOOP

0.2

4 3 0.1 2 1 0 0.0 20 30 40 50 60 70 80 90 100 110 RENCOMPI

22

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

23

i) Variabilidad
1. Mediante Diagrama de cajas y barbas (Box Plot). Comparacin de rendimiento en las situaciones cooperativa y competitiva.

20 30 40 50 60 70 80 90 100 110 RENCOMPI

20 30 40 50 60 70 80 90 100 110 RENCOOP

2. Clsica. Mediante cuantiles Displaying Error Bars on a Graph From the Graph menu, select Bar, Dot, or Line. In the dialog box choose: Options Error Bar

23

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

24

ii) Ilustracin comparativa de diferentes asimetra y apuntamiento (curtosis).


(comparar con los ndices numricos)

formas

segn

12 10 8
Count

8 0.3 0.4
Proportion per Bar

8 0.3 7 6 5
Count Proportion per Bar Proportion per Bar

7 6 5
Count

0.3

0.2

0.2

6 0.2 4 2 0 0 0.1

4 3 0.1 2 1

4 3 0.1 2 1 0 2 3 4 5 6 7 EXPTPROFE 8 9 0.0 10

20

40 60 80 RENCOOP

100

0.0 120

0 0.0 0 10 20 30 40 50 60 70 80 90 100 RENCOMPI

12 10 8
Count

15 0.4
Proportion per Bar

0.6 0.5
Proportion per Bar

0.3

10
Count

0.4 0.3

6 0.2 4 2 0 0 0.1

0.2 0.1

2 3 CULTPADRE

0.0 5

0 0

2 3 TAMPANDI

0.0 5

24

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

25

b) Ilustracin de la forma de la distribucin segn algunos Modelos representativos.

i) El caso de la Distribucin Normal Univariada


(Graph Line sobre fichero Normal.syd tomando Z1 e Y1).
0.4

0.3

Y1

0.2

0.1

0.0 -3

-2

-1

0 Z1

25

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

26

Estudio de la Forma-Modelo de la distribucin


A travs de representaciones especficas. Density Function

7 6 5
Count

8 7 6 5
Count

4 3 2 1

4 3 2 1

0 30 40 50 60 70 80 90 100 110 RENCOOP

0 0 10 20 30 40 50 60 70 80 90 100 RENCOMPI

Que se aproximen o no a una lnea recta. Cuanto ms prximo a esta mejor ajusta el modelo hipotetizado. Esta funcin s que incluye smooth para ajustar una lnea recta precisamente y poder aproximarnos mejor. Veamos la aproximacin a la normal.
Expected Value for Normal Distribution

2 1 0 -1 -2 -3 30 40 50 60 70 80 90 100 110 RENCOOP

Expected Value for Normal Distribution

3 2 1 0 -1 -2 -3 0 10 20 30 40 50 60 70 80 90 100 RENCOMPI

26

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

27

ii) La distribucin exponencial


As pues, que los juicios sean comparativos (relativos) mas que absolutos. En este caso vamos a comparar con otro tipo de modelo de distribucin, vg una exponencial.
Expected Value for Exponential Distribution

Expected Value for Exponential Distribution

0 30 40 50 60 70 80 90 100 110 RENCOOP

0 0 10 20 30 40 50 60 70 80 90 100 RENCOMPI

Como se puede apreciar el ajuste normal es mejor que el de la exponencial por ejemplo.

27

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

28

Ilustracin de diferentes tipos de relacin

LINEAL 8 6 4 2 0 1 11 21 31 41 51

y = a + bx

EXPONENCIAL 100 80 60 40 20 0 1 11 21 31 41 51

POTENCIAL 0,1 0,08

y = ae bx

0,06 0,04 0,02 0 1 11

y = ax b

21

31

41

51

HIPERBLICA 0,25 0,2 0,15 0,1 0,05 0 1 11 21 31 41


1

LOGSTICA

b y =a+ x

0,8 0,6 0,4 0,2 0 1 11 21

y=

1 1 + ae bx

31

41

51

28

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

29

c) Deteccin de casos anmalos.

29

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

30

30

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

31

4. Anlisis de relacin entre variables


a) Introduccin. b) El caso lineal. c) Relacin no lineal.

a) Introduccin Es importante la exploracin grfica de la relacin, sobre todo para perfilar el tipo de relacin. La ms importante ha sido en las disciplinas afines a la Psicologa sin lugar a dudas la lineal. Pero no es este tipo de relacin ni mucho menos el nico tipo posible. De hecho veremos un ejemplo extrado de la investigacin educativa que apunta ms bien un tipo diferente de relacin. Una vez ms el anlisis exploratorio es crucial en este punto. Por otro lado, tambin es importante observar/explorar con detenimiento el conjunto de datos de nuestro estudio. Nuevamente la presencia de puntos anmalos puede se distorsionante. En este punto podramos forjarnos una idea de relacin que es inadecuada. El anlisis exploratorio tipo EDA vuelve a ser crucial. Veremos un mtodo robusto de estimacin. Todos los puntos trazados estn relacionados con la estadstica robusta. El anlisis exploratorio puede ayudarnos, adems, a evitar algunos riesgos inherentes a la interpretacin de relaciones. Dependencia de la variabilidad. Mediacin de terceras variables. Rango de valores restringido y por tanto poco representativo de la poblacin de referencia. Mezcla de grupos heterogneos. Centraremos dos ejemplos de manera comparativa. Veamos el primero de ellos. Supuesto 2: Anlisis de las predicciones en el xito escolar a partir de las expectativas del profesor. Incluye un outlier, lo que permite apreciar la distorsin que provoca sobre la recta de regresin. Algo que se puede detectar mediante la representacin grfica correspondiente y que se puede corregir mediante la recta de Tukey que es robusta (se basa en las medianas). Le ajustamos algunos modelos diferentes para que se vea claramente la superioridad del lineal frente a otros modelos como el exponencial o logartmico. Realmente el estudio fue de regresin mltiple, cuya ecuacin sera de la forma:

z R 2 = 0,801 RF = 0.62 z EP + 0.16 z EA 0.18 z RAA ;


RF: Rendimiento acadmico Final del curso, EP: Expectativas profesor, EA: Expectativas alumno y RAA: Rendimiento Anterior del Alumno. De Navas, Sampascual y Castejn (1991). Relacin entre rendimiento y variables motivacionales cognitivas en nios de 5 EGB.

31

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

32

b) El caso Lineal

10 9 8

EXPTPROFE

7 6 5 4 3 2 1 0 20 30 40 50 60 70 80 90 100 110 RENCOOP

Tantear el ajuste hasta dar con la tecla del lineal: Smoother (Scatterplot_options)
10 9 8

EXPTPROFE

7 6 5 4 3 2 1 0 20 30 40 50 60 70 80 90 100 110 RENCOOP

32

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

33

Estudio de la relacin entre variables a partir del Supuesto 2 El grfico nos permite comparar lo que sucede cuando est presente el outlier identificado frente a cuando ste desaparece (como si se tratara de un valor perdido).

10 9 8 7
Value

6 5 4 3 2 30 40 50 60 70 80 90 100 110 RENCOOP NEWEXPT EXPTPROFE

Por ello sera til disponer de una estimacin robusta en casos como este. Veamos la lnea resistente de Tukey, una de las tcnicas ms representativas en este punto. X
Case n ExpecProf RendCoo Case n

Y 32 41 41 11 42 62 65 62 75 60 71 73 84 55 66 82 85 65 60 57 100 87 88 1 92 65 61 74

ExpecProf RendCoo

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

9,0 3,5 2,5 2,6 2,5 3,5 5,5 7,0 6,8 5,0 3,5 4,0 6,7 3,5 5,5 5,0 5,0 4,0 5,5 5,0 6,0 8,6 8,8 9,0 8,0

1 11 32 41 41 42 55 57 60 60 62 62 65 65 66 71 73 75 82 84 85 87 88 92 100 Md Md1 Md2

3 5 4 2 6 11 14 12 18 10 16 17 20 7 15 19 21 13 9 8 25 22 23 1 24

2,5 2,5 2,6 3,5 3,5 3,5 3,5 4,0 4,0 5,0 5,0 5,0 5,0 5,5 5,5 5,5 6,0 6,7 6,8 7,0 8,0 8,6 8,8 9,0 9,0 5,0 3,5 6,9

33

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

34

Representacin de la relacin a partir de un diagrama de dispersin:

120 100 RENDIMIENTO 80 60 40 20 0 0,0 2,0 4,0 6,0 8,0 10,0 EXPECTATIVA PROFE

Representacin de la relacin junto con la extrapolacin de la recta de regresin lineal:

120 100 RENDIMIENTO 80 60 40 20 0 0,0 2,0 4,0 6,0 8,0 10,0 EXPECTATIVA PROFE y = 4,4472x + 38,087 y = 3,8235x + 47,618

34

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

35

C) De tipo no lineal. Por ejemplo una funcin exponencial.

Por otro lado, veamos otro estudio en que tambin interesa la relacin entre dos variables. Supuesto 3: Anlisis de la progresin evolutiva en las destrezas. Se mide el nmero de errores cometidos en una batera que incluye una muestra representativa de las habilidades cognitivas (aptitudes) ms destacadas a diferentes grupos de edad. Entonces realizamos un seguimiento de las destrezas medido a travs del nmero de errores. Como se podr apreciar se trata de una funcin exponencial. Le ajustamos tambin algunos modelos diferentes para que se vea claramente la superioridad del lineal frente a otros modelos como el exponencial o logartmico. Interpretacin de la exponencial. Paulatinamente se comete menor nmero de errores, luego mejoran las destrezas bsicas. Pero ese cambio no es constante en los diferentes momentos sino que es proporcionalmente mayor al principio que en edades posteriores. (Fichero repres2.syd)

12 10 8
ERR

6 4 2 0 0

5 EDAD

10

15

Ir tanteando los ajustes hasta dar con el mejor ajuste, proporcionado por el modelo exponencial: Smoother (Scatterplot_options)

35

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

36

Supuesto 3 para estimacin de relacin no lineal sobre Anlisis de la progresin evolutiva de las destrezas cognitivas. Matriz de datos. Dentro figura el nmero de errores cometido por cada nio en cada nivel de edad.

NIOS

1 2 3 4 5 6 7 8 9 10 MEDIA

5 10 9 10 8 10 9 8 9 10 7 9,0

7 6 5 7 5 5 4 7 4 5 2 5,0

AOS 9 6 4 2 3 2 3 3 2 3 2 3,0

11 1 0 2 2 1 3 2 4 5 0 2,0

13 0 1 1 2 2 2 2 3 1 1 1,5

36

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

37

REPRESENTACIN DE LA RELACIN A PARTIR DE UN DIAGRAMA DE DISPERSIN:

12 10
ERRORES

8 6 4 2 0 0 5
EDAD

10

15

Representacin de la relacin junto con la extrapolacin de la funcin exponencial:

12 10
ERRORES

8 6 4 2 0 0 5
EDAD

10

15

37

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

38

5) Representaciones Multidimensionales Se ilustrar la Normal Multidimensional, como ejemplo de grfico 3-D y sus posibilidades. Para ello se simulan variaciones cclicas de una variable Z2 (tipificada) anidada a otra variable Z1 y se estima a partir de la interaccin (el producto) de ambas la altura de la funcin. Los datos de dicha simulacin se recogen en el fichero normal.syd y el grfico tridimensional resultante en el fichero Normal3D.SYG

El resultado es la representacin:

38

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

39

Anexos.- Listados de diferentes anlisis con el programa SYSTAT


El anlisis descriptivo detallado del Supuesto 1:
N of cases Minimum Maximum Range Sum Median Mean 95% CI Upper 95% CI Lower Std. Error Standard Dev Variance C.V. Skewness(G1) SE Skewness Kurtosis(G2) SE Kurtosis RENCOOP 25 31.000 100.000 69.000 1607.000 65.000 64.280 72.501 56.059 3.983 19.915 396.627 0.310 -0.165 0.464 -0.815 0.902 RENCOMPI 25 5.000 92.000 87.000 1274.000 52.000 50.960 60.921 40.999 4.826 24.131 582.290 0.474 -0.125 0.464 -0.708 0.902 EXPTPROFE 25 1.000 9.000 8.000 128.500 5.000 5.140 6.017 4.263 0.425 2.124 4.512 0.413 0.205 0.464 -0.521 0.902 CULTPADRE 25 1.000 4.000 3.000 60.000 2.000 2.400 2.862 1.938 0.224 1.118 1.250 0.466 0.272 0.464 -1.253 0.902 TAMPANDI 25 0.0 4.000 4.000 47.000 2.000 1.880 2.390 1.370 0.247 1.236 1.527 0.657 0.390 0.464 -0.530 0.902

N of cases Minimum Maximum Range Sum Median Mean 95% CI Upper 95% CI Lower Std. Error Standard Dev Variance C.V. Skewness(G1) SE Skewness Kurtosis(G2) SE Kurtosis

RENCOOP 25 1.000 100.000 99.000 1557.000 65.000 62.280 72.266 52.294 4.839 24.193 585.293 0.388 -0.880 0.464 0.763 0.902

RENCOMPI 25 5.000 92.000 87.000 1274.000 52.000 50.960 60.921 40.999 4.826 24.131 582.290 0.474 -0.125 0.464 -0.708 0.902

EXPTPROFE 25 2.500 9.000 6.500 136.000 5.000 5.440 6.302 4.578 0.418 2.089 4.362 0.384 0.376 0.464 -0.931 0.902

CULTPADRE 25 1.000 4.000 3.000 60.000 2.000 2.400 2.862 1.938 0.224 1.118 1.250 0.466 0.272 0.464 -1.253 0.902

TAMPANDI 25 0.0 4.000 4.000 47.000 2.000 1.880 2.390 1.370 0.247 1.236 1.527 0.657 0.390 0.464 -0.530 0.902

39

Manuel Miguel Ramos lvarez

Curso Representaciones grficas de datos en Psicologa Educacin

40

Diferentes variaciones de representaciones modernas a partir de EDA: Stem and Leaf Plot of variable: RENCOOP, N = 25 Minimum: 31.000 Lower hinge: 55.000 Median: 65.000 Upper hinge: 82.000 Maximum: 100.000 3 112 4 112 5 H 57 6 M 0022556 7 135 8 H 24578 9 2 10 0 Stem and Leaf Plot of variable: Minimum: 5.000 Lower hinge: 37.000 Median: 52.000 Upper hinge: 66.000 Maximum: 92.000 0 5 1 19 2 13 3 H 2789 4 5 M 0012344 6 H 056 7 35 8 257 9 2 Stem and Leaf Plot of variable: Minimum: 31.000 Lower hinge: 55.000 Median: 65.000 Upper hinge: 82.000 Maximum: 100.000 3 112 4 112 5 H 57 6 M 0022556 7 135 8 H 24578 9 2 10 0 Stem and Leaf Plot of variable: Minimum: 5.000 Lower hinge: 37.000 Median: 52.000 Upper hinge: 66.000 Maximum: 92.000 0 5 1 19 2 13 3 H 2789 4 5 M 0012344 6 H 056 7 35 8 257 9 2 RENCOMPI, N = 25 RENCOOP, N = 25 RENCOMPI, N = 25

40