Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Aed PDF
Aed PDF
datos
Ana María López
Departamento de Psicología Experimental
Introducción
MULTIDIMENSIONAL
UNIDIMENSIONAL BIDIMENSIONAL
Errores de codificación son valores que están fuera del rango de las variables
cuantitativas y códigos numéricos o no numéricos no definidos para representar
las categorías de las variables cualitativas.
Ejemplo: Estamos interesados en estudiar si la opinión acerca de la ley de
matrimonios entre parejas del mismo sexo depende de la edad y del sexo. Para
ello seleccionamos una muestra de sujetos mayores de edad y les pedimos que
nos den su opinión acerca de la ley eligiendo una de las opciones de una escala
que va desde 1 (muy desfavorable) hasta 7 (muy favorable). Los datos los hemos
escrito en una archivo de spss y hemos realizado un análisis descriptivo básico
utilizando el procedimiento frecuencias para las todas las variables incluidas en el
archivo y el procedimiento descriptivos para las cuantitativas
Para realizar el análisis descriptivo, seleccionamos Estadísticos descriptivos> Frecuencias
del menú Analizar. Con esta selección accedemos al cuadro de diálogo Frecuencias y en
dicho cuadro trasladamos, pulsando en el botón flecha, las variables al cuadro Variables y
pulsamos en Aceptar.
Para analizar las variables cuantitativas opinión y edad seleccionamos Descriptivos y
pulsamos Aceptar. El visor de resultados nos ofrece la información contenida en las
siguiente tablas.
– Media aritmética.
– Mediana: una vez ordenados los datos, es el valor que deja el mismo número de
observaciones a su derecha que a su izquierda.
• Estadísticos de dispersión:
– Rango
– Varianza
– Desviación tipo
– Amplitud intercuartílica (AI)
• Estadísticos de forma:
– Asimetría.
– Curtosis
14
12
10
DIG
AED: Caracterización de las distribuciones de las variables en
cuanto a su tendencia central, dispersión y forma (normalidad).
Figura 1. Tipologías de histogramas
(Xmáx +1) − Xi
Xi
1 1
Xi (( Xmáx +1) − Xi )
AED: Caracterización de las distribuciones de las variables en cuanto a su
tendencia central, dispersión y forma (normalidad) con SPSS.
Con las opciones seleccionadas hemos obtenido información que nos permite
responder a las siguientes cuestiones de las variables analizadas:
1. Identificar las medidas de tendencia central y de dispersión
2. Comparar la media con la mediana y con los estimadores robustos
3. Evaluar mediante inspección visual la normalidad de las variables
4. Evaluar utilizando la prueba de significación la normalidad de las variables
AED: Detección de datos atípicos:
xi − med ( x )
> 4,5
MEDA( x)
• Los criterios para detectar atípicos a nivel univariante no tienen porque identificar
atípicos multivariantes (ejemplo). Para ello se puede utilizar, aunque no exenta de
problemas, la distancia de Mahalanobis.
La distancia de Mahalanobis es la distancia al centro de gravedad ponderada por la
matriz de varianzas-covarianzas. Una observación multivariante resultará
sospechosa si su distancia supera el valor de chi-cuadrado para k (número de
variables) y un nivel de significación de 0,001.
Algunos de los gráficos disponibles en SPSS implementan los criterios anteriores
para detectar datos atípicos. Los siguientes cuadros de diálogo corresponden a los
gráficos recomendados para detectar atípicos:
AED: Detección de datos atípicos
Caras de Chernoff
AED: Detección de datos atípicos:
Gráficos de estrella
sujeto 1 sujeto 2
zcan
4
zcan zcan 2
1 4 0
0 2 zsatisfa -2 zdespe
zsatisfa -1 zdespe zsatisfa 0 zdespe -4
fr
-2 sujeto 1 -2
2
1
0
zcan zdespe zrea zdepre zsatisfa
Gráficos de linea
-1
-2
-3
-4
-5
AED: Supuesto de Linealidad
300
250
200
150
100
50
0
0 5 10 15 20
AED: Supuesto de Linealidad
AED: Supuesto de Linealidad
80,00
60,00
hrv_b
40,00
20,00
Gráfico
hrv_a
hrv_b
hrv_c
hrv_d
hrv_fa
imp_a
imp_b
imp_c
imp_d
grup
ctrl
phob
80,00
60,00
hrv_b
40,00
20,00
• Seleccionamos:
Analizar > Estadísticos descriptivos > Tablas de contingencia
AED: Dos variables cualitativas
Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
f ( f ) × f ( c) f i . × f . j
VAL * retraso
42 61.8% 26 38.2% 68 100.0%
en el desarrollo
f esp = =
Tabla de contingencia VAL * retraso en el desarrollo
N f ..
retraso en el
desarrollo
Si No Total
VAL 0 Recuento 1 0 1
Frecuencia esperada .7 .3 1.0
% de VAL 100.0% .0% 100.0%
% de retraso en el
3.3% .0% 2.4%
desarrollo
% del total 2.4% .0% 2.4%
Si Recuento 17 3 20
Frecuencia esperada 14.3 5.7 20.0
% de VAL 85.0% 15.0% 100.0%
% de retraso en el
56.7% 25.0% 47.6%
desarrollo
% del total 40.5% 7.1% 47.6%
No Recuento 12 9 21
Frecuencia esperada 15.0 6.0 21.0
% de VAL 57.1% 42.9% 100.0%
% de retraso en el
40.0% 75.0% 50.0%
desarrollo
% del total 28.6% 21.4% 50.0%
Total Recuento 30 12 42
Frecuencia esperada 30.0 12.0 42.0
% de VAL 71.4% 28.6% 100.0%
% de retraso en el
100.0% 100.0% 100.0%
desarrollo
% del total 71.4% 28.6% 100.0%
AED: Dos variables cualitativas
(f − f es ) ij
2
∑∑
ob
χ2 =
i j (f ) es ij
Pruebas de chi-cuadrado
Sig. asintótica
Valor gl (bilateral)
Chi-cuadrado de Pearson 4.305a 2 .116
Razón de verosimilitud 4.664 2 .097
Asociación lineal por
4.139 1 .042
lineal
N de casos válidos 42
a. 2 casillas (33.3%) tienen una frecuencia esperada inferior a 5.
La frecuencia mínima esperada es .29.
En este caso dado que p > 0.05 aceptamos la hipótesis de independencia y concluimos
que las variables no están relacionadas.
Nota a. El número de casillas con frecuencias esperadas menores que 5 no debe superar el 20% para
que la aproximación a la distribución Chi-cuadrado sea adecuada
AED: Dos variables cualitativas
Además de los estadísticos anteriores el cuadro de diálogo Tablas de contingencia
nos proporciona los diagramas de barras para las variables analizadas
20
100
100 15 43
90
80 85
70
10
60
57
50
40
30
retraso en el desarr retraso en el desarr
Recuento
Recuento
20
Si No
10
0 No 0 Si
0 Si No 0 Si No
VAL VAL
Casos
Válidos Perdidos Total
ansiedad N Porcentaje N Porcentaje N Porcentaje
CIM . (perdidos 10 90.9% 1 9.1% 11 100.0%
Si 24 100.0% 0 .0% 24 100.0%
No 33 100.0% 0 .0% 33 100.0%
Descriptivos
1.5
1.0
1
.5
0.0
0
Normal esperado
Normal esperado
-.5
-1.0
-1
-1.5
-2.0
-2 30 40 50 60 70 80 90 100 110
20 40 60 80 100 120 140
Gráfico Q-Q normal de CIM
Valor observado
Valor observado
Para ANS= Omitido
1.5
1.0
.5
0.0
Normal esperado
-.5
-1.0
-1.5
40 50 60 70 80 90
Valor observado
Prueba de homogeneidad de la varianza
Estadístico
de Levene gl1 gl2 Sig.
CIM Basándose en la media 2.016 2 64 .142
Basándose en la
1.665 2 64 .197
mediana.
Basándose en la
mediana y con gl 1.665 2 61.164 .198
corregido
Basándose en la media
2.097 2 64 .131
recortada
140
120
100
80
60
40
CIM
20
N= 10 24 33
Omitido Si No
ansiedad
Bibliografía