Está en la página 1de 24

Tema 3.

1b: Análisis de una variable

Máster Universitario en Psicología Jurídica y Forense

Asignatura
Metodología aplicada a la Psicología Jurídica y Forense

Documento de trabajo con programa SPSS

Dra. Ana Benavente Reche


Dr. Rafael Rabadán Anta
Metodología aplicada a la Psicología Jurídica y Forense

Análisis de una variable

Índice

1. Introducción
2. Distribuciones de frecuencias
2.1 Variables cualitativas
2.2 Variables cuantitativas
3. Análisis exploratorio de datos
4. Actividades prácticas de consolidación

1. Introducción

Cuando comenzamos a analizar los datos de cualquier archivo, un primer paso es el de


analizar cada una de las variables por separado. El simple cálculo de la distribución de
frecuencias de cada variable, tal y como hicimos al final de la unidad anterior con el
objetivo de depurar los archivos de datos, nos va a ofrecer una información muy
relevante, sobre todo en el caso de las variables cualitativas y con pocos valores. Sin
embargo, cuando las variables son cuantitativas, las distribuciones de frecuencias
pueden presentar un número excesivo de valores, lo que dificulta su interpretación si no
se aplican técnicas adicionales: por ejemplo la agrupación por intervalos o la obtención
de índices como los valores máximo y mínimo, determinados percentiles, la media y la
desviación típica.

2. Distribuciones de frecuencias

2.1 Variables cualitativas

Como ya vimos en la unidad anterior, el cálculo de una distribución de frecuencias en


SPSS se hace a través de la ruta:

Analizar Estadísticos Descriptivos Frecuencias…


Práctica 1. Abra el archivo Psicología 2009.sav y obtenga la distribución de
frecuencias de la variable Identificación religiosa (religión) acompañada de un gráfico
de barras. Para obtener el gráfico pulse el botón Gráficos en el cuadro de diálogo
Frecuencias (ver Figura 1) y escoja la opción Gráficos de barras con porcentajes.
Observe el resultado e interprételo.

2
Metodología aplicada a la Psicología Jurídica y Forense

Figura 1. Cuadro de diálogo Frecuencias

Identificación religiosa

Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válidos Católico practicante 12 6,6 6,7 6,7
Católico no practicante 73 40,3 40,6 47,2
Otra religión 1 ,6 ,6 47,8
Agnóstico 41 22,7 22,8 70,6
Ateo 53 29,3 29,4 100,0
Total 180 99,4 100,0
Perdidos Sistema 1 ,6
Total 181 100,0

Identificación religiosa

50

40
Porcentaje

30

20

10

0
Católico practicante Católico no Otra religión Agnóstico Ateo
practicante

Identificación religiosa

Aclaración previa: Los valores de la columna “Porcentaje” se obtienen sobre el total


de cuestionarios, 181, mientras que el “Porcentaje válido” se calcula sobre el total de
sujetos que respondieron a la pregunta, 180, excluyéndose al único sujeto que no la
respondió (un dato perdido). Puesto que se trata de un solo sujeto, en la interpretación ni
siquiera lo mencionaremos, limitándonos a comentar los porcentajes válidos.

3
Metodología aplicada a la Psicología Jurídica y Forense

Interpretación: Predominan los católicos no practicantes, que representan el 40,6%


de los alumnos, seguidos de un 29,4% ateos, un 22,8% de agnósticos, y a más distancia
tenemos un 6,7% de católicos practicantes y un 0,6% (tan solo un alumno) de otra
religión.

Práctica 2. Obtenga ahora la distribución de frecuencias de la variable Comportamiento


electoral (elección) acompañada de un gráfico de sectores. Este es el resultado:

Comportamiento electoral

Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válidos No votar 25 13,8 13,8 13,8
Votar en blanco 22 12,2 12,2 26,0
Votar PP 39 21,5 21,5 47,5
Votar PSOE 36 19,9 19,9 67,4
Votar IU 17 9,4 9,4 76,8
Votar otro partido 19 10,5 10,5 87,3
No sabe/no contesta 23 12,7 12,7 100,0
Total 181 100,0 100,0

Comportamiento electoral

No votar
Votar en blanco
Votar PP
Votar PSOE
Votar IU
Votar otro partido
No sabe/no contesta

Aclaración previa: Los valores de las columnas “Porcentaje” y “Porcentaje válido”


coinciden porque en esta variable no hubieron casos perdidos: los alumnos que no
respondieron a la cuestión relativa al comportamiento electoral se incluyeron en la
categoría “No sabe/no contesta”.

Interpretación: La mayor parte de los alumnos, el 38,7%, o no votan, votan en blanco


o no saben/no contestan, lo que refleja cierta insatisfacción o indiferencia frente a la
política. A continuación el 21,5% votan al PP, el 19,9% al PSOE, el 10,5% a otro
partido distinto de los mencionados y el 9,4% a IU.

Práctica 3. En lugar de continuar trabajando con todos los sujetos del archivo
Psicología 2009.sav, vamos a seleccionar a los varones a partir de la secuencia:

4
Metodología aplicada a la Psicología Jurídica y Forense

Datos Seleccionar casos…


y marcando la opción si satisface la condición, que nos conduce al cuadro de diálogo
de la Figura 2, donde especificamos el criterio de selección: sexo = 1 (se seleccionan los
casos con el valor 1 en la variable sexo, es decir, todos los varones). Obtenga ahora la
distribución de frecuencias de la variable Identificación religiosa (religión), referida
exclusivamente a los varones, y observe el resultado.

Figura 2. Subcuadro de diálogo Seleccionar casos: Si

Identificación religiosa

Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válidos Católico practicante 1 2,4 2,4 2,4
Católico no practicante 9 21,4 22,0 24,4
Otra religión 1 2,4 2,4 26,8
Agnóstico 17 40,5 41,5 68,3
Ateo 13 31,0 31,7 100,0
Total 41 97,6 100,0
Perdidos Sistema 1 2,4
Total 42 100,0

Interpretación: Si analizamos la distribución de la identificación religiosa entre los


varones, nos encontramos con que predominan los agnósticos, con un porcentaje del
41,5%. A continuación hay un 31,7% de ateos, un 22% de católicos no practicantes, un
2,4% de católicos practicantes y también un 2,4% de otra religión.

Práctica 4. A partir de las variables sexo y Modalidad de pareja preferida (pareja),


seleccione a las mujeres que se casarían por la Iglesia, y vuelva a obtener la distribución
de frecuencias de la variable Identificación religiosa (religión). Observe el resultado:

5
Metodología aplicada a la Psicología Jurídica y Forense

Identificación religiosa

Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válidos Católico practicante 9 15,0 15,0 15,0
Católico no practicante 44 73,3 73,3 88,3
Agnóstico 6 10,0 10,0 98,3
Ateo 1 1,7 1,7 100,0
Total 60 100,0 100,0

Interpretación: Si analizamos la distribución de la identificación religiosa entre las


mujeres que se casarían por la Iglesia, nos encontramos con que la gran mayoría, el
73,3%, se consideran católicas no practicantes, seguidas de tan solo un 15% de
católicas practicantes, un 10% de agnósticas y un 1,7% de ateas.

ATENCIÓN: Para volver a trabajar con todos los sujetos debería desactivar la
selección definida, pulsando sucesivamente los botones Restablecer y Aceptar en el
cuadro de diálogo Seleccionar casos (ver Figura 3).

Figura 3. Cuadro de diálogo Seleccionar casos

2.2 Variables cuantitativas

Un primer análisis de las características de una variable cuantitativa puede abordarse


desde la misma secuencia que para las variables cualitativas:

Analizar Estadísticos Descriptivos Frecuencias…


Práctica 5. Abra el archivo Depres.sav y obtenga la distribución de frecuencias de la
variable edad acompañada de un histograma. Para obtener el histograma pulse el botón
Gráficos en el cuadro de diálogo Frecuencias (ver Figura 1) y escoja la opción
Histogramas incluyendo, si se desea, la superposición en el gráfico de la curva normal.
Observe lo extenso del resultado, que hemos suprimido en parte para ahorrar espacio:

6
Metodología aplicada a la Psicología Jurídica y ForenseI

Edad (Años cumplidos)

Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válidos 18 5 1,7 1,7 1,7
19 5 1,7 1,7 3,4
20 6 2,0 2,0 5,4
21 6 2,0 2,0 7,5
… … … … …
… … … … …
… … … … …
82 1 ,3 ,3 98,0
83 5 1,7 1,7 99,7
89 1 ,3 ,3 100,0
Total 294 100,0 100,0

Aclaración: Al tratarse de una variable cuantitativa con numerosos valores, su


correspondiente distribución de frecuencias es muy extensa (ocuparía más de un folio),
de ahí que habitualmente se aconseje simplificar este resultado, por ejemplo a través de
la agrupación por intervalos de edad o el cálculo de los estadísticos descriptivos básicos
(valores mínimo, máximo, media y desviación típica), tal y como haremos en las
siguientes actividades. En la última columna de la Tabla se muestran los porcentajes
acumulados, que representan los percentiles para cada edad. A modo de ejemplo, el
porcentaje acumulado 5,4 nos indicaría que el 5,4% de los sujetos tienen una edad igual
o inferior a 20 años, o que la edad 20 años se sitúa en el percentil 5,4.

Histograma

40

30
Frecuencia

20

10

Media =44,41
Desviación típica =18,
116
0 N =294
0 20 40 60 80 100

Edad (Años cumplidos)

Interpretación: La distribución de la edad no se ajusta exactamente a un modelo


normal, sino que muestra cierta asimetría positiva o un ligero predominio de las edades
bajas.

Práctica 6. Continuando con el análisis de la variable edad vamos a efectuar cálculos


adicionales pulsando el botón Estadísticos del cuadro de diálogo Frecuencias (ver

7
Metodología aplicada a la Psicología Jurídica y Forense

Figura 1), al que ya accedió en la práctica anterior. En concreto, señale todas las
opciones marcadas en la Figura 4, lo que le permitirá obtener varios índices de
tendencia central (media, mediana, moda, suma), varios índices de posición (cuartiles,
puntos de corte para un determinado número de grupos y otros percentiles), varios
índices de variabilidad (desviación típica, varianza, amplitud total o rango, valores
mínimo y máximo, error típico de la media) y dos índices de forma (asimetría y
curtosis). Observe e interprete el resultado:

Figura 4. Subcuadro de diálogo Frecuencias: Estadísticos

Estadísticos

Edad (Años cumplidos)


N Válidos 294
Perdidos 0
Media 44,41
Error típ. de la media 1,057
Mediana 43,00
Moda 23
Desv. típ. 18,116
Varianza 328,195
Asimetría ,356
Error típ. de asimetría ,142
Curtosis -,954
Error típ. de curtosis ,283
Rango 71
Mínimo 18
Máximo 89
Suma 13057
Percentiles 10 22,00
20 26,00
25 28,00
30 31,00
40 35,00
50 43,00
60 50,00
70 57,00
75 59,00
80 61,00
90 70,00

8
Metodología aplicada a la Psicología Jurídica y Forense

Interpretación: Las edades oscilan entre los 18 y 89 años, siendo la media 44,41 y la
desviación típica 18,12. La distribución es asimétrica positiva (índice de asimetría de
Fisher de +0,356), lo que se refleja en cierto predominio de las edades bajas y en el
hecho de que el valor de la media, 44,41 años, sea ligeramente superior a la mediana,
de 43 años (si la distribución hubiese sido simétrica habrían coincidido los valores de
la media, mediana y moda). Finalmente se apuntan los 9 deciles (percentiles 10, 20, …
y 90), que se corresponden con las edades de 22, 26,… y 70 años, respectivamente, y
los 3 cuartiles (percentiles 25, 50 y 75), que se corresponden con las edades de 28, 43 y
59 años, respectivamente.

Práctica 7. Analice la variable peso del archivo Psicología 2009.sav, calculando los
valores mínimo y máximo, la media, la mediana, la desviación típica, el índice de
asimetría y los percentiles 10, 80 y 90. Observe e interprete el resultado:

Estadísticos

Peso
N Válidos 179
Perdidos 2
Media 62,8827
Mediana 60,0000
Desv. típ. 11,15043
Asimetría ,911
Error típ. de asimetría ,182
Mínimo 43,00
Máximo 103,00
Percentiles 10 50,0000
80 72,0000
90 77,0000

Interpretación: El peso de los alumnos oscila entre los 43 y 103 kg, siendo la media
62,88 kg, la mediana 60 kg y la desviación típica 11,15 kg. La forma de la distribución
es asimétrica positiva (índice de asimetría de Fisher de +0,91) o con un predominio de
los pesos bajos, lo que también se manifiesta en el hecho de que la media (62,88 kg) sea
superior a la mediana (60 kg). Finalmente los percentiles 10, 80 y 90 corresponden a
los valores de 50, 72 y 77 kg, respectivamente.

Práctica 8. A partir de los datos del archivo Global Psicología 1999-2009.sav,


seleccione a las mujeres de 18 años con una estatura entre 160 y 170 cm y obtenga la
correspondiente tabla de percentiles (puntos de corte para 100 grupos iguales) del peso.
Recuerde que para seleccionar casos debe seguir la ruta:

Datos Seleccionar casos…


Observe el resultado, donde por ahorrar espacio tan sólo presentamos los 16 primeros percentiles.

9
Metodología de la Investigacion Psicoeducativa II

Peso
N Válidos 476
Perdidos 18
Percentiles 1 45,0000
2 46,0000
3 47,0000
4 48,0000
5 49,0000
6 49,0000
7 49,0000
8 49,0000
9 49,9720
10 50,0000
11 50,0000
12 50,0000
13 50,0000
14 50,0000
15 50,0000
16 50,6600
17 51 0000

Buena parte de los análisis que estamos viendo para las variables cuantitativas
también pueden obtenerse siguiendo la secuencia:

Analizar Estadísticos Descriptivos Descriptivos…


La diferencia con la secuencia anterior es que no incluye gráficos ni distribuciones de
frecuencias, ni índices de posición (cuartiles, percentiles); pero tiene la ventaja de que
incorpora la posibilidad de archivar los valores tipificados de las variables, para lo cual
crea en el archivo original una nueva variable con el mismo nombre y precedida por la
letra ‘z’.

Práctica 9. Calcule los valores mínimo y máximo, la media y la desviación típica de la


variable Suma de c1 a c20 (ctotal) en el archivo Depres.sav, y guarde los valores
tipificados de dicha variable. Pulsando el botón Opciones del cuadro de diálogo
Descriptivos (ver Figura 5), observará que todos los estadísticos que se piden ya están
seleccionados por defecto. Marcando la opción Guardar valores tipificados como
variables en el mismo cuadro de diálogo, se creará la variable zctotal, con los valores
tipificados. Recuerde que la variable Suma de c1 a c20 (ctotal) muestra las puntuaciones
en una escala de depresión con valores entre 0 y 60 puntos, donde las puntuaciones altas
indican una elevada sintomatología depresiva.

Figura 5. Cuadro de diálogo Descriptivos

10
Metodología aplicada a la Psicología Jurídica y Forense

Estadísticos descriptivos

N Mínimo Máximo Media Desv. típ.


Suma de c1 a c20
294 0 47 8,91 8,870
(mín 0, máx 60)
N válido (según lista) 294

Interpretación: Los sujetos de la muestra obtuvieron puntuaciones en la escala de


depresión comprendidas entre 0 y 47 puntos, siendo la media 8,91 y la desviación típica
8,87.

Práctica 10. Vamos a obtener las medias y desviaciones típicas de los 4 primeros ítems
de la escala de depresión: c.1 (“He sentido que nunca podré salir de la tristeza ni incluso
con ayuda”), c.2 (“Me he sentido deprimido”), c.3 (“Me he sentido solo”) y c.4 (“Tuve
ataques de llanto”). Lo haremos seleccionando las cuatro variables a la vez en el cuadro
de diálogo Descriptivos (ver Figura 5), lo que facilitará la comparación entre los
resultados (medias y desviaciones típicas) de los ítems. Pulse el botón Opciones para
acceder al subcuadro de diálogo de la Figura 6, compruebe que ya están marcadas por
defecto la media y la desviación típica, y seleccione la opción Medias descendentes
referente al orden de visualización. Observe el resultado:

Figura 6. Subcuadro de diálogo Descriptivos: Opciones

Estadísticos descriptivos

N Mínimo Máximo Media Desv. típ.


"Me he sentido
294 0 3 ,57 ,810
deprimido"
"Me he sentido sólo" 294 0 3 ,55 ,902
"He sentdio que nunca
podré salir de la tristeza 294 0 3 ,36 ,744
ni incluso con ayuda"
"He gritado al hablar" ("I
294 0 3 ,18 ,567
had crying spells")
N válido (según lista) 294

11
Metodología aplicada a la Psicología Jurídica y Forense

Interpretación: El ítem que mostró el mayor promedio fue “Me he sentido deprimido”
(media 0,57, desviación típica 0,81), seguido muy de cerca por el ítem “Me he sentido
solo (media 0,55, desviación típica 0,90), y a mayor distancia por los ítems “He sentido
que nunca podré salir de la tristeza ni incluso con ayuda” (media 0,36, desviación
típica 0,74) y “Tuve ataques de llanto” (media 0,18, desviación típica 0,57).

3. Análisis exploratorio de datos

Continuando con el análisis descriptivo de variables cuantitativas SPSS ofrece, además


de lo visto en el epígrafe anterior, la posibilidad de aplicar las técnicas del Análisis
Exploratorio de Datos (Exploratory Data Analysis) preconizado por Tukey (1977) y que
supone una nueva forma de entender el análisis de datos. Desde esta perspectiva se trata
de captar ‘lo que nos dicen los datos’ utilizando para ello técnicas descriptivas más
adecuadas que los procedimientos clásicos (medias, varianzas e índices de forma).

Estas técnicas son especialmente apropiadas cuando nos enfrentamos ante datos
con distribuciones asimétricas y valores atípicos (outliers). Consisten en nuevos
estadísticos robustos o resistentes a la presencia de puntuaciones atípicas y en nuevos
gráficos más informativos acerca del detalle y la estructura de los datos.

En SPSS podemos realizar estos análisis seleccionando sucesivamente:

Analizar Estadísticos Descriptivos Explorar…


Introducimos primero en la ventana ‘Dependientes’ la(s) variable(s)
cuantitativa(s) que queremos analizar y, a continuación, pulsamos el botón Estadísticos
para seleccionar los análisis que deseamos ejecutar, y el botón Gráficos para indicar los
gráficos que se quieren obtener, que por defecto serán el diagrama en “tallo y hojas”
(stem and leaf display) y el gráfico de “caja y bigotes” (box plot) (ver Figura 7).

Figura 7. Cuadro de diálogo Explorar

Práctica 11. Analice la variable edad del archivo Depres.sav desde el enfoque del
Análisis Exploratorio de Datos, incorporando todas las opciones de análisis estadístico
(tras pulsar el botón Estadísticos de la Figura 7), y los gráficos de “tallo y hojas” y

12
Metodología aplicada a la Psicología Jurídica y Forense

“caja” (compruebe que son los seleccionados por defecto tras pulsar el botón Gráficos
de la Figura 7). Observe e interprete el resultado.

Descriptivos

Estadístico Error típ.


Edad (Años cumplidos) Media 44,41 1,057
Intervalo de confianza Límite inferior 42,33
para la media al 95% Límite superior
46,49

Media recortada al 5% 43,77


Mediana 43,00
Varianza 328,195
Desv. típ. 18,116
Mínimo 18
Máximo 89
Rango 71
Amplitud intercuartil 31
Asimetría ,356 ,142
Curtosis -,954 ,283

Estimadores-M

Estimador-M Biponderado Estimador-M Onda de


a b c d
de Huber de Tukey de Hampel Andrews
Edad (Años cumplidos) 43,15 43,47 43,80 43,48
a. La constante de ponderación es 1,339.
b. La constante de ponderación es 4,685.
c. Las constantes de ponderación son 1,700, 3,400 y 8,500.
d. La constante de ponderación es 1,340*pi.

Percentiles

Percentiles
5 10 25 50 75 90 95
Promedio Edad (Años cumplidos)
20,00 22,00 28,00 43,00 59,00 70,00 77,25
ponderado(definición 1)
Bisagras de Tukey Edad (Años cumplidos) 28,00 43,00 59,00

Valores extremos

Número
del caso Valor
Edad (Años cumplidos) Mayores 1 234 89
2 114 83
3 148 83
4 198 83
5 257 83a
Menores 1 229 18
2 206 18
3 201 18
4 141 18
5 25 18
a. En la tabla de valores extremos mayores sólo se muestra una
lista parcial de los casos con el valor 83.

Aclaración. Con el fin de facilitar la interpretación de los gráficos exploratorios que


figuran a continuación (diagramas de “tallo y hojas” y de “caja y bigotes”), nos
referiremos brevemente a algunos de los resultados de las Tablas:

1. En lo relativo a la tendencia central de la distribución, mientras que la media es de


44,41 años, la mediana y otros promedios robustos muestran un valor ligeramente
inferior (la mediana es de 43 años, la media recortada al 5% es de 43,77 y los
estimadores M arrojan valores comprendidos entre 43,15 y 43,80). Así, la media se

13
Metodología aplicada a la Psicología Jurídica y Forense

deja afectar en mayor medida por las edades más altas de una distribución con una
ligera asimetría positiva (índice de asimetría de Fisher de +0,356).
2. En lo relativo a la variabilidad de la distribución, el índice robusto alternativo a la
varianza y la desviación típica es la amplitud intercuartil, que se calcula a partir de
los cuartiles 3 y 1 (percentiles 75 y 25), según la expresión Q = Q3 –Q1 = 59-28 =
31. El valor de esta amplitud es equivalente a la longitud de la caja en el diagrama
de “caja y bigotes”.
3. La última Tabla muestra los cinco valores más altos (un sujeto de 89 años y cuatro
de 83 años) y los cinco valores más bajos (todos ellos de 18 años) de la distribución.

Edad (Años cumplidos) Stem-and-Leaf Plot

Frequency Stem & Leaf

10,00 1 . 8888899999
41,00 2 . 00000011111122222222233333333333444444444
29,00 2 . 55555556666666667777888889999
35,00 3 . 00000011111222222222233333444444444
17,00 3 . 55566666677777889
23,00 4 . 00000122222222333333344
21,00 4 . 555566677777788889999
21,00 5 . 000001111111222233444
29,00 5 . 55556667777778888888999999999
21,00 6 . 000000011111222233444
15,00 6 . 555556667788889
15,00 7 . 000001112233444
7,00 7 . 5778899
9,00 8 . 011233333
1,00 8 . 9

Stem width: 10
Each leaf: 1 case(s)

Interpretación: Diez sujetos presentan edades comprendidas entre los 18 y 19 años (5


de 18 años y otros 5 de 19 años), 41 sujetos tienen edades comprendidas entre los 20 y
24 años (6 con 20 años, 6 con 21 años, 9 con 22 años, 11 con 23 años y 9 con 24 años),
29 sujetos muestran edades comprendidas entre los 25 y 29 años…, y así
sucesivamente. La forma de la distribución es asimétrica positiva o con un ligero
predominio de las edades bajas, pero no hay valores atípicos o outliers en la
distribución.

14
Metodología aplicada a la Psicología Jurídica y Forense

100

80

60

40

20

Edad (Años cumplidos)

Interpretación: El gráfico nos informa de que la mediana es 43 años, los cuartiles 1 y


3 son 28 y 59 años, respectivamente, y los valores mínimo y máximo son 18 y 89 años,
respectivamente. Así, a través de la mediana conocemos la tendencia central o el
promedio de la distribución y a través de la amplitud intercuartil, que equivale a la
altura de la caja (Q = Q3 − Q1 = 59 − 28 = 31 años), conocemos la variabilidad de la
distribución. El gráfico también puede informarnos de la asimetría de la distribución, a
través de las distancias entre los cuartiles y la presencia o no de valores atípicos. En
este caso se detecta una ligera asimetría positiva (Q3 – Q2 > Q2 – Q1), pero no hay
valores atípicos en la distribución.

Práctica 12. Obtenga los gráficos de “tallo y hojas” y de “caja y bigotes” de la variable
edad, en este caso del archivo Psicología 2009.sav. Con el propósito de facilitar la
interpretación de ambos gráficos, obtenga también los estadísticos descriptivos básicos,
estimadores robustos y resistentes, valores atípicos y percentiles. Observe e interprete el
resultado.

Descriptivos

Estadístico Error típ.


Edad Media 19,94 ,314
Intervalo de confianza Límite inferior 19,32
para la media al 95% Límite superior
20,56

Media recortada al 5% 19,26


Mediana 19,00
Varianza 17,875
Desv. típ. 4,228
Mínimo 18
Máximo 56
Rango 38
Amplitud intercuartil 2
Asimetría 5,264 ,181
Curtosis 35,972 ,359

15
Metodología aplicada a la Psicología Jurídica y Forense

Estimadores-M

Estimador-M Biponderado Estimador-M Onda de


a b c d
de Huber de Tukey de Hampel Andrews
Edad 18,92 18,72 18,86 18,71
a. La constante de ponderación es 1,339.
b. La constante de ponderación es 4,685.
c. Las constantes de ponderación son 1,700, 3,400 y 8,500.
d. La constante de ponderación es 1,340*pi.

Percentiles

Percentiles
5 10 25 50 75 90 95
Promedio Edad
18,00 18,00 18,00 19,00 20,00 23,00 26,90
ponderado(definición 1)
Bisagras de Tukey Edad 18,00 19,00 20,00

Valores extremos

Número
del caso Valor
Edad Mayores 1 135 56
2 81 44
3 24 38
4 100 30
5 110 30
Menores 1 179 18
2 174 18
3 173 18
4 172 18
5 171 18a
a. En la tabla de valores extremos menores sólo se
muestra una lista parcial de los casos con el valor 18.

Explique brevemente algunos de los resultados más relevantes en las Tablas:

1. En lo relativo a la tendencia central de la distribución,... mientras que la media es


19,94 años, la mediana y otros promedios robustos muestran un valor inferior (la
mediana es 19 años, la media recortada al 5% es 19,26 años y los estimadores M
arrojan valores comprendidos entre 18,71 y 18,92). Así, la media es más sensible a
la influencia de las edades más altas de una distribución con una clara asimetría
positiva (índice de asimetría de Fisher de +5,264).
2. En lo relativo a la variabilidad de la distribución,... el índice robusto alternativo a la
varianza y la desviación típica es la amplitud intercuartil, que se calcula a partir de
los cuartiles 3 y 1 (percentiles 75 y 25), según la expresión Q = Q3 – Q1 = 20 – 18 =
2. El valor de esta amplitud es equivalente a la longitud de la caja en el diagrama de
“caja y bigotes”.
3. La última Tabla muestra los cinco valores más altos (...56, 44, 38, 30 y 30 años)
y los cinco valores más bajos (... años) en la distribución.

16
Metodología de la Investigacion Psicoeducativa II

Edad Stem-and-Leaf Plot

Frequency Stem & Leaf

80,00 18 . 0000000000000000000000000000000000000000
,00 18 .
47,00 19 . 00000000000000000000000
,00 19 .
14,00 20 . 0000000
,00 20 .
17,00 21 . 00000000
,00 21 .
2,00 22 . 0
,00 22 .
5,00 23 . 00
16,00 Extremes (>=24)

Stem width: 1
Each leaf: 2 case(s)

Interpretación del gráfico: Ochenta alumnos tienen 18 años, 47 tienen 19 años, 14 tienen 20
años…, y así sucesivamente. Las edades iguales o superiores a 24 años, que
corresponden a 16 alumnos de la muestra, se consideran valores atípicos o outliers. La
forma de la distribución e
s de una asimetría positiva pronunciada, con un claro
predominio de las edades más bajas.

60
135

50

81

40 24

110 100
30 12
69 76
43 28 101
73
75 39
99 102

20

10

Edad

Interpretación del gráfico: El gráfico nos informa de que la mediana es 19 años, el valor mínimo
y el cuartil 1 coinciden en la edad de 18 años, el cuartil 3 es 20 años y el valor máximo,
excluidos los valores atípicos, es de 23 años. Las edades iguales o superiores a 24
años, correspondientes a 16 alumnos, se consideran valores atípicos: los círculos
representan los valores atípicos y los asteriscos los valores atípicos extremos. Así, se
observa una distribución de asimetría positiva muy pronunciada, donde las edades
oscilan entre los 18 y 56 años, aunque la gran mayoría de los alumnos (el 91,16%)
tienen entre 18 y 23 años.

Aclaración: Se consideran valores atípicos los que se alejan del cuartil 1 (por debajo) o
del cuartil 3 (por encima) en una distancia superior a 1,5 veces la longitud de la caja
(1,5 veces la amplitud intercuartil). Si esta desviación supera 3 veces la longitud de la
17
Metodología aplicada a la Psicología Jurídica y Forense

caja hablaríamos de valores atípicos extremos. En el ejemplo de la edad de los alumnos


de Primero de Psicología, donde la longitud de la caja es de Q3 – Q1 = 20 – 18 = 2 años,
son valores atípicos las edades superiores a 20 + 1,5 (2) = 23 años y valores atípicos
extremos las edades superiores a 20 + 3(2) = 26 años.

Práctica 13. Obtenga los gráficos de “tallo y hojas” y de “caja y bigotes” de la variable
peso en el archivo Global Psicología 1999-2009.sav, acompañados de los estadísticos
descriptivos básicos, estimadores robustos y resistentes, valores atípicos y percentiles.
Etiquete los casos mediante la variable sexo, incorporando esta variable en la ventana
‘Etiquetar los casos mediante’ del cuadro de diálogo Explorar (ver Figura 7). Observe e
interprete el resultado.

Descriptivos

Estadístico Error típ.


Peso Media 60,6834 ,25856
Intervalo de confianza Límite inferior 60,1763
para la media al 95% Límite superior
61,1905

Media recortada al 5% 59,9806


Mediana 58,0000
Varianza 108,299
Desv. típ. 10,40668
Mínimo 40,00
Máximo 119,0
Rango 79,00
Amplitud intercuartil 13,00
Asimetría 1,152 ,061
Curtosis 1,867 ,122

Estimadores-M

Estimador-M Biponderado Estimador-M Onda de


a b c d
de Huber de Tukey de Hampel Andrews
Peso 58,9414 58,2205 59,0832 58,2108
a. La constante de ponderación es 1,339.
b. La constante de ponderación es 4,685.
c. Las constantes de ponderación son 1,700, 3,400 y 8,500.
d. La constante de ponderación es 1,340*pi.

Percentiles

Percentiles
5 10 25 50 75 90 95
Promedio Peso
48,0000 50,0000 53,0000 58,0000 66,0000 75,0000 80,0000
ponderado(definición 1)
Bisagras de Tukey Peso 53,0000 58,0000 66,0000

Valores extremos

Número
del caso Sexo Valor
Peso Mayores 1 1230 Varón 119,0
2 1299 Varón 110,0
3 75 Varón 107,0
4 1515 Varón 103,0
5 441 Varón 100,0a
Menores 1 1294 Mujer 40,00
2 1276 Mujer 40,00
3 763 Mujer 42,00
4 1598 Mujer 43,00
5 1394 Mujer 43,00b
a. En la tabla de valores extremos mayores sólo se muestra
una lista parcial de los casos con el valor 100,0.
b. En la tabla de valores extremos menores sólo se muestra
una lista parcial de los casos con el valor 43,00.

18
Metodología aplicada a la Psicología Jurídica y Forense

cExpliqueomenzamos por explicar algunos de los


resultados más relevantes en las Tablas:

1. En lo relativo a la tendencia central de la distribución, mientras que la media es


60,68 kg, la mediana y otros promedios robustos muestran un valor inferior (la
mediana es 58 kg, la media recortada al 5% es 59,98 kg y los estimadores M arrojan
valores comprendidos entre 58,21 y 59,08 kg). Así, la media se deja afectar en
mayor medida por los pesos más elevados de una distribución asimétrica positiva
(índice de asimetría de Fisher de +1,152).
2. En lo relativo a la variabilidad de la distribución, el índice robusto alternativo a la
varianza y la desviación típica es la amplitud intercuartil, que se calcula a partir de
los cuartiles 3 y 1 (percentiles 75 y 25), según la expresión Q = Q3 – Q1 = 66 – 53 =
13 kg. El valor de esta amplitud es equivalente a la longitud de la caja en el
diagrama de “caja y bigotes”.
3. La última Tabla muestra que los cinco alumnos de menor peso son mujeres, con
valores comprendidos entre los 40 y 43 kg, mientras que los cinco alumnos con
mayor peso son varones, con valores comprendidos entre los 100 y 119 kg.

Peso Stem-and-Leaf Plot

Frequency Stem & Leaf

2,00 4 . &
9,00 4 . 33&
12,00 4 . 455
37,00 4 . 666667777
77,00 4 . 8888888899999999999
157,00 5 . 000000000000000000000000011111111111111
143,00 5 . 22222222222222222222333333333333333
152,00 5 . 44444444444444444444555555555555555555
134,00 5 . 666666666666666666777777777777777
143,00 5 . 88888888888888888888888999999999999
150,00 6 . 0000000000000000000000000000001111111
68,00 6 . 2222222333333333
105,00 6 . 44444444555555555555555555
70,00 6 . 66666666667777777
54,00 6 . 8888888899999
68,00 7 . 00000000000000011
47,00 7 . 22222233333
47,00 7 . 44455555555
22,00 7 . 66677
23,00 7 . 88899
36,00 8 . 00000001
6,00 8 . 3&
25,00 8 . 445555
33,00 Extremes (>=86)

Stem width: 10,00


Each leaf: 4 case(s)

& denotes fractional leaves.

Interpretación: Dos alumnos (en este caso mujeres) pesan 40 kg, 9 pesan entre 42 y
43 kg, 12 pesan entre 44 y 45 kg, 37 entre 46 y 47 kg, y así sucesivamente. Se
consideran valores atípicos todos los pesos iguales o superiores a 86 kg, que
corresponden a 33 alumnos (el 2% de la muestra). La forma de la distribución es
asimétrica positiva o con un predominio de los pesos bajos.
Metodología aplicada a la Psicología Jurídica y Forense

Varón
120,00

Varón

Varón
Varón Varón
100,00
Mujer Mujer
Varón Mujer
Varón
Varón
Varón
Varón Varón
Varón

80,00

60,00

40,00

Peso

Interpretación: El gráfico nos informa de que la mediana es 58 kg, el cuartil 1 es 53


kg, el cuartil 3 es 66 kg, el valor mínimo es 40 kg y el valor máximo, excluidos los
valores atípicos, es de 85 kg. La amplitud intercuartil o longitud de la caja, Q3 − Q1 =
66 − 53 = 13 kg, es un indicador de la variabilidad de la distribución. Asimismo, el
hecho de que la distancia entre los cuartiles 2 y 3 (8 kg) sea superior a la distancia
entre los cuartiles 1 y 2 (5 kg), nos indica que hay una asimetría positiva o predominio
de los pesos bajos. Aunque el peso de los alumnos oscila entre los 40 y 119 kg, se
consideran valores atípicos (representados con círculos) los pesos iguales o superiores
86 kg, y valores atípicos extremos (asteriscos) los pesos iguales o superiores a 106 kg.
La mayor parte de los pesos atípicos corresponden a varones y los pesos atípicos
extremos, de 107, 110 y 119 kg, corresponden a tres varones.

Aclaración: Puesto que la longitud de la caja es de 13 kg, son valores atípicos los pesos
superiores a 66 + 1,5 (13) = 85,5 kg y valores atípicos extremos los superiores a 66 +
3(13) = 105 kg.

Práctica 14. Compruebe el supuesto de normalidad en la variable edad del archivo


Psicología 2009.sav, a través de la prueba de Kolmogorov-Smirnov. Para ello debe
pulsar el botón Gráficos del cuadro de diálogo Explorar (ver Figura 7) y seleccionar la
opción Gráficos con pruebas de normalidad (ver Figura 8). Observe e interprete el
resultado.

Figura 8. Subcuadro de diálogo Explorar: Gráficos

20
Metodología aplicada a la Psicología Jurídica y Forense

Pruebas de normalidad
a
Kolmogorov-Smirnov Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Edad ,323 181 ,000 ,463 181 ,000
a. Corrección de la significación de Lilliefors

Gráfico Q-Q normal de Edad

2
Normal esperado

-1

10 20 30 40 50 60

Valor observado

Gráfico Q-Q normal sin tendencias de Edad

4
Desv. de normal

10 20 30 40 50 60

Valor observado

Interpretación: Rechazamos la hipótesis nula de que la edad se distribuya


normalmente, ya que el nivel crítico de probabilidad de la prueba de Kolmogorov-
Smirnov, p = 0,000, es inferior al nivel de significación α = 0,05. Así, la distribución de
la edad se desvía significativamente del supuesto de normalidad, mostrando una
asimetría positiva muy pronunciada.

21
4. Actividades prácticas de consolidación

Práctica 15. Con los datos del archivo Psicología 2009.sav, elabore un histograma de la
variable edad y pídale al programa que superponga una curva normal (ver la práctica
5).

Práctica 16. Realice un análisis descriptivo de la variable Estado civil (ec) en el archivo
Depres.sav (similar a las prácticas 1 y 2).

Práctica 17. A partir del archivo Depres.sav, obtenga la distribución de frecuencias de


la variable edad, agrupada en las categorías “joven” cuando el sujeto tiene una edad
igual o inferior a 25 años, “adulto” cuanto tiene entre 26 y 65 años y “anciano” cuando
es mayor de 65 años (ver la práctica 13 del documento correspondiente a la unidad 1 y
las prácticas 1 y 2 del presente documento).

Práctica 18. Continuando con el archivo Depres.sav, localice al sujeto con la mayor
puntuación en la escala de depresión [variable Suma de c1 a c20 (ctotal)] y describa
algunas de sus características (por ejemplo sexo, edad, estado civil, nivel educativo,
empleo, etc.).

Práctica 19. Analice la variable ingresos del archivo Depres.sav, calculando sus
estadísticos descriptivos básicos (puntuaciones máxima y mínima, media y desviación
típica) y acompañando estos resultados de un histograma (ver las prácticas 5, 6 y 9).

Práctica 20. Obtenga la media y la mediana de la variable Suma de c1 a c20 (ctotal) en


el archivo Depres.sav y justifique las razones por las que difieren ambos valores,
ayudándose de un gráfico de la distribución de dicha variable.

Práctica 21. En el archivo Psicología 2009.sav, agrupe los valores de la variable


¿Practicas algún deporte? (deporte) en dos categorías: (1) nunca u ocasionalmente y
(2) una o más veces por semana. Elabore un gráfico con los datos agrupados y otro con
los valores originales de la variable (ver la práctica 12 del documento correspondiente a
la unidad 1 y las prácticas 1 y 2 del presente documento).

Práctica 22. Analice los datos de las variables ¿Eres fumador? (fumar) y Número de
cigarros en un día (fumar1) en el archivo Psicología 2009.sav, con el propósito de
describir el hábito de fumar de los alumnos de Primero de Psicología. Una vez
analizadas ambas variables por separado, seleccione a los sujetos fumadores, y analice
para este grupo la distribución del número de cigarrillos fumados en un día. Cuando
termine con el ejercicio, no se olvide de desactivar la selección establecida (ver la
práctica 3).

Práctica 23. Elabore un diagrama de “caja y bigotes” para la variable Suma de c1 a c20
(ctotal) en el archivo Depres.sav, donde los casos queden etiquetados en función del
sexo (similar a las prácticas 11 y 13).

Práctica 24. A partir del archivo Psicología 2009.sav, analice la variable ¿Legalizarías
la venta de drogas? (drogas) para toda la muestra de alumnos y para los que votarían a
Izquierda Unida en unas Elecciones Generales [sujetos con Comportamiento electoral

22
Metodología aplicada a la Psicología Jurídica y Forense

(elección) = 5]. Compare los resultados entre ambas distribuciones y cuando finalice el
ejercicio no se olvide de desactivar la selección definida.

Práctica 25. En el archivo Psicología 2009.sav calcule los estadísticos descriptivos


básicos (media, desviación típica, mínimo y máximo) de las siete variables referentes a
las preferencias de los alumnos en relación a su futuro: Trabajo muy bien remunerado
(fut1), Pareja estable (fut2), …, Vivir en plena naturaleza (fut7). Presente las variables
por orden descendente de su media, lo que facilitará la comparación de resultados
(similar a la práctica 10).

Práctica 26. Obtenga los percentiles 10, 20 y 90 de la variable estatura en el archivo


Psicología 2009.sav (similar a la práctica 7).

Práctica 27. Obtenga el diagrama de “tallo y hojas” de la variable ingresos en el


archivo Depres.sav, identifique las puntuaciones atípicas o outliers y compruebe el
supuesto de normalidad de la distribución a través de la prueba de Kolmogorov-
Smirnov (similar a la práctica 14).

Práctica 28. Analice la variable Nivel de estrés (estrés) del archivo Estrés.sav a través
de los estadísticos descriptivos básicos (media, desviación típica, mínimo y máximo) y
guarde en el archivo original las puntuaciones tipificadas (similar a la práctica 9).

Práctica 29. Elabore un gráfico donde se muestre la distribución de la variable ¿Fuiste


un niño con buena salud? (salud) en el archivo Psicología 2009.sav.

Práctica 30. Elabore un diagrama de “caja y bigotes” de la variable Ansiedad Pretest


(ans1) en el archivo Drogas.sav e interprételo con la ayuda de los estadísticos
descriptivos básicos (incluido el índice de asimetría), estimadores robustos, valores
atípicos y percentiles.

Práctica 31. En el archivo Psicología 2009.sav calcule los estadísticos descriptivos


básicos (media, desviación típica, mínimo y máximo) de las catorce variables referentes
a las preferencias de los alumnos en relación a su tiempo libre: Leer (tlb1), Ir de
compras (tlb2), …, Ir a la montaña (tlb14). Presente las variables por orden descendente
de su media, lo que facilitará la comparación de resultados (similar a la práctica 10).

Práctica 32. Analice la variable Número de hermanos (hermanos) del archivo


Psicología 2009.sav mostrando su distribución de frecuencias, los estadísticos
descriptivos básicos (media, mediana, desviación típica, índice de asimetría, valores
máximo y mínimo) y el correspondiente diagrama de “caja y bigotes”.

Práctica 33. Analice la variable Modalidad de pareja preferida (pareja) del archivo
Psicología 2009.sav de la forma que considere más oportuna. Recuerde que al tratarse
de una variable cualitativa, carece de sentido obtener una media, mediana o desviación
típica.

Práctica 34. Continuando con el archivo Psicología 2009.sav, analice los resultados de
la variable Nota de selectividad (nota) de la forma que estime más conveniente.
Recuerde que al tratarse de una variable cuantitativa de numerosos valores, lo habitual
es obtener los estadísticos descriptivos básicos (media, desviación típica, máximo y

23
Metodología aplicada a la Psicología Jurídica y Forense

mínimo), pero también es conveniente informar, en su caso, de la posible asimetría y


presencia de valores atípicos, mostrando algún estadístico resistente como la mediana.

Práctica 35. A partir del archivo Depres.sav, analice la variable He sentido que nunca
podré salir de la tristeza ni incluso con ayuda (c.1). Tratándose de una variable con
pocos valores (tan sólo 5), lo habitual es presentar la distribución de frecuencias.
Siendo, además, una variable cuasicuantitativa, los índices de tendencia central más
adecuados son la mediana y la moda, aunque en la práctica también se suele informar de
la media.

Práctica 36. Con los datos del archivo Psicología 2009.sav, analice la distribución de la
variable Opinión sobre la ley antitabaco (antitab) entre los fumadores.

Práctica 37. Analice la distribución de la estatura de todos los sujetos en el archivo


Psicología 2009.sav y a continuación analice la misma variable para las mujeres.

Práctica 38. Analice la variable Número de libros en un año (libro1) del archivo
Psicología 2009.sav.

Práctica 39. Obtenga la distribución de frecuencias de las siguientes variables en el


archivo Psicología 2009.sav: sexo, Estado civil (ecivil), ¿Eres fumador? (fumar),
Identificación religiosa (religión), Define tu personalidad (extrov) y Modalidad de
pareja preferida (pareja). En esta práctica no es necesario que interprete los resultados,
tan sólo observe lo sencillo que resulta describir el perfil del alumno de Primero de
Psicología: una mujer soltera (76,8% de mujeres, 98,3% de solteros/as), no fumadora
(64,6% de no fumadores), católica no practicante (40,6% de católicos no practicantes
frente al 29,4% de ateos, 22,8% de agnósticos y 6,7% de católicos practicantes), que se
considera extrovertida (65,4% de extrovertidos) y prefiere casarse por la Iglesia (el
39,2% de los alumnos optan por el matrimonio religioso, aunque seguidos de cerca por
un 35,4% que escogen la convivencia sin casarse).

Práctica 40. Continuando con el archivo Psicología 2009.sav, obtenga los estadísticos
descriptivos básicos (media, desviación típica, valores máximo y mínimo) de las
variables edad, estatura, peso, Número de hermanos (hermanos) y Número de cigarros
en un día (fumar1). No es necesario que interprete los resultados, tan sólo observe cuál
sería el perfil del estudiante de Primero de Psicología respecto a todas estas variables
cuantitativas: un alumno entre los 18 y 56 años de edad, aunque la gran mayoría no
superan los 20 años (edad media 19,94, desviación típica 4,23), de estatura entre 150 y
190 cm (media 166,81 cm, desviación típica 7,80), peso entre 43 y 103 kg (peso medio
62,88 kg, desviación típica 11,15), procedente de una familia de entre 1 y 9 hijos (media
2,38; desviación típica 1,12), y que puede fumar entre 0 y 35 cigarros al día (media
2,68; desviación típica 5,46), aunque la gran mayoría no fuman ningún cigarro.

Práctica 41. Elabore el perfil de la muestra de sujetos en el archivo Depres.sav,


analizando una a una las variables que considere más relevantes.

Práctica 42. Describa el perfil de los pacientes drogodependientes en el archivo


Drogas.sav, analizando una a una las variables que considere más relevantes.

24