Documentos de Académico
Documentos de Profesional
Documentos de Cultura
datos
Ana María López
Departamento de Psicología Experimental
Introducción
vamos a entender por errores de codificación a todos aquellos valores que están
fuera del rango de las variables cuantitativas y a códigos numéricos o no
numéricos no definidos para representar a categorías de las variables cualitativas.
Ejemplo: Estamos interesados en estudiar si la opinión acerca de la ley de
matrimonios entre parejas del mismo sexo depende de la edad y del sexo. Para
ello seleccionamos una muestra de sujetos mayores de edad y les pedimos que
nos den su opinión acerca de la ley eligiendo una de las opciones de una escala
que va desde 1 (muy desfavorable) hasta 7 (muy favorable). Los datos los hemos
escrito en una archivo de spss y hemos realizado un análisis descriptivo básico
utilizando el procedimiento frecuencias para las todas las variables incluidas en el
archivo y el procedimiento descriptivos para las cuantitativas
Para realizar el análisis descriptivo hemos seleccionado las opciones que aparecen en los
cuadros siguientes y hemos obtenido las siguientes tablas. A partir de la información que
nos proporcionan las tablas
¿podemos identificar errores de codificación en las variables medidas?
2. Caracterizar las distribuciones de las variables en cuanto a su
tendencia central, dispersión y forma (normalidad).
– Media aritmética.
– Mediana: una vez ordenados los datos, es el valor que deja el mismo número de
observaciones a su derecha que a su izquierda.
• Estadísticos de dispersión:
– Rango
– Varianza
– Desviación tipo
– Amplitud intercuartílica (AI)
• Estadísticos de forma:
– Asimetría.
– Curtosis
14
12
10
0 N = 49.00
0.0 2.5 5.0 7.5 10.0 12.5 15.0
DIG
2. Caracterizar las distribuciones de las variables en cuanto a su
tendencia central, dispersión y forma (normalidad).
Figura 1. Tipologías de histogramas
( X máx 1) X i
Xi
1 1
Xi X máx 1 X i
2. Caracterizar las distribuciones de las variables en cuanto a su tendencia central,
dispersión y forma (normalidad).
Con las opciones seleccionadas hemos obtenido información que nos permite
responder a las siguientes cuestiones de las variables analizadas:
1. Identificar las medidas de tendencia central y de dispersión
2. Comparar la media con la mediana y con los estimadores robustos
3. Evaluar mediante inspección visual la normalidad de las variables
4. Evaluar utilizando la prueba de significación la normalidad de las variables
3. Detectar datos atípicos:
xi med x
4,5
MEDA( x)
• Los criterios para detectar atípicos a nivel univariante no tienen porque identificar
atípicos multivariantes. Para ello se puede utilizar, aunque no exenta de problemas,
la distancia de Mahalanobis.
La distancia de Mahalanobis es la distancia al centro de gravedad ponderada por la
matriz de varianzas covarianzas. Una observación multivariante resultará
sospechosa si su distancia supera el valor de chi-cuadrado para k (número de
variables) y un nivel de significación de 0,001.
Algunos de los gráficos disponibles en SPSS implementan los criterios anteriores
para detectar datos atípicos. Los siguientes cuadros de diálogo corresponden a los
gráficos recomendados para detectar atípicos:
3. Detectar datos atípicos:
Caras de Chernoff
3. Detectar datos atípicos:
Gráficos de estrella
sujeto 1 sujeto 2
zcan
4
zcan zcan 2
1 4 0
0 2 zsatisfa -2 zdespe
zsatisfa -1 zdespe zsatisfa 0 zdespe -4
fr
-2 sujeto 1 -2
0
zcan zdespe zrea zdepre zsatisfa
Gráficos de linea
-1
-2
-3
-4
-5
4. Linealidad
300
250
200
150
100
50
0
0 5 10 15 20
4. Linealidad
4. Linealidad
Gráfico
80,00
60,00
hrv_b
40,00
20,00
hrv_a
hrv_b
hrv_c
hrv_d
hrv_fa
imp_a
imp_b
imp_c
imp_d
grup
ctrl
phob
80,00
60,00
hrv_b
40,00
20,00