Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística Descriptiva
Univariada (una sola variable)
a. Como primer paso para analizar los datos, se debe primero conocer la distribución de cada
una de las variables con que se trabajará y además examinar los valores atípicos o no
esperados.
b. Es habitual listar en tablas de frecuencias los valores obtenidos en cada una de las variables
y el número de veces que se repiten, especialmente si las variables son categóricas.
c. Para algunas variables, también podemos resumir la distribución de los datos examinando
estadísticos de resumen simples como por ejemplo el mínimo y el Máximo o el rango de
datos.
d. Además, se utilizan frecuentemente medidas de resumen que describen la tendencia central
de la distribución, como la media aritmética.
e. También podemos utilizar estadísticos que nos informen de la dispersión de nuestros datos
en la distribución y que de alguna forma evalúen el grado de concentración de los datos
(normalmente alrededor de un valor central como la media).
NIVEL DE MEDIDA
Las variables categóricas pueden ser nominales u ordinales. Y dentro de las variables
cuantitativas podemos encontrar variables de intervalo o de razón.
Variables categóricas
Tienen un número limitado de categóricas (por ejemplo: sexo y estado civil). Las variables
categóricas pueden ser de cadena (características alfanuméricas) o numéricas, cuando sus
códigos son numéricos ( por ejemplo: 0= femenino, 1= masculino).
1
CURSO DE SPSS BÁSICO
Nominal. Valores categóricos donde no hay un orden inherente para las categorías.
Por ejemplo: una categoría de trabajo de "ventas” no es mayor o menor que una
categoría de trabajo de “marketing” o “investigación”. Otros ejemplos: estado civil,
región de residencia, sexo, etc. La única relación existente entre los valores de la
variable nominal es de igualdad o desigualdad.
Ordinal: valores categóricos donde hay un orden significativo de categorías, pero
no hay una distancia medible entre ellas. Por ejemplo, hay un orden para los valores
alto, medio y bajo, pero la “distancia” entre los valores no puede ser calculada. Otros
ejemplos: variables actitudinales con categorías. Totalmente de acuerdo (valor 4),
de acuerdo (valor 3), en desacuerdo (valor 2) y totalmente en desacuerdo (valor 1),
o variables como la edad o los ingresos, siempre y cuando estén recodificadas en
rangos de valores ( de 18 a 25 años o de 500 a 1,000 nuevos soles, etc).
Variables cuyos valores están medidos en intervalos o escalas de razón. Los valores de los
datos mantienen una relación de orden entre los valores ( de menor a mayor), pero además
de distancia entre ellos. Por ejemplo, un salario de S/. 72,195 es mayor que un salario de
S7. 52,398, y la distancia entre ambos valores es de S/. 19,797.
2
CURSO DE SPSS BÁSICO
Frecuencia,
Procesamiento en
Frecuencia Frecuencia Descriptivos,
SPSS
Explorar
3
CURSO DE SPSS BÁSICO
ARCHIVO: GSS2004Intro_es.sav
Estadísticos
Estado civil ¿Cómo se
conecta a
Internet en su
hogar?
Válidos 2812 1583
N
Perdidos 0 1229
4
CURSO DE SPSS BÁSICO
Estado civil
Frecuencia Porcentaje Porcentaje Porcentaje
válido acumulado
Casado 1479 52,6 52,6 52,6
Viudo 204 7,3 7,3 59,9
Divorciado 415 14,8 14,8 74,6
Válidos
Separado 95 3,4 3,4 78,0
Soltero 619 22,0 22,0 100,0
Total 2812 100,0 100,0
5
CURSO DE SPSS BÁSICO
Continuar y Aceptar…
6
CURSO DE SPSS BÁSICO
Tabla de frecuencias y gráfico de barras para la variable Identificación subjetiva de clase social
(Clase baja (código 1), clase trabajadora (2), clase media (3) y clae alta (4)):
7
CURSO DE SPSS BÁSICO
Continuar..
8
CURSO DE SPSS BÁSICO
Aceptar----
Estadísticos
Identificación subjetiva de la
clase social
Válidos 2799
N
Perdidos 13
Mediana 2,00
9
CURSO DE SPSS BÁSICO
10
CURSO DE SPSS BÁSICO
11
CURSO DE SPSS BÁSICO
Estadísticos
Edad del encuestado
Válidos 2803
N
Perdidos 9
Media 45,96
Mediana 44,00
Desv. típ. 16,804
Mínimo 18
Máximo 89
Se puede ver que el valor mínimo de edad es de 18 años y que el máximo es de 89 años. En este
estudio todos los encuestados deben ser mayores de edad ( tener 18 años o más) y a todos aquellos
con 89 años o más se les asignó el código 89. Observe que la diferencia entre la media (45,96) y la
mediana (44) es menor a 2 años, indicando que la variable tiene una distribución aproximadamente
simétrica dentro del rango definido.
12
CURSO DE SPSS BÁSICO
Podemos ver que el rango de valores más bajo está truncado en 18 y que el número de personas es
mayor en los valores medios de edad. Además, como es de esperar, el número de casos decae en
las edades más altas. Así , la edad de los encuestados para esta muestra de adultos se distribuye
aproximadamente normal (esto último se deduce porque la curva normal teórica y la distribución
observada se solapan bastante bien).
13
CURSO DE SPSS BÁSICO
Desplazar todas las variables desde Estado Civil (ecivil) hasta Ingresos familiares totales (Salario)
14
CURSO DE SPSS BÁSICO
Aceptar---
Estadísticos descriptivos
N Mínimo Máximo Media Desv. típ.
Estado civil 2812 1 5 2,35 1,634
Edad del encuestado 2803 18 89 45,96 16,804
AÑO DE ESTUDIO 2810 0 20 13,70 2,889
AÑO DE EDUCACIÓN
2090 0 20 11,76 4,012
ALCANZADO, PADRE
AÑO DE EDUCACIÓN
2429 0 20 11,80 3,492
ALCANZADO, MADRE
AÑO DE EDUCACIÓN
ALCANZADO, 1458 0 20 13,79 2,858
ESPOSA/O
ESTUDIOS 2811 0 4 1,61 1,207
¿Qué edad tenía cuando
2026 12 51 24,03 5,473
nació su primer hijo?
Clasificación étnica 2812 1 3 1,28 ,586
Ingresos familiares
2692 1 13 11,05 2,381
totales
N válido (según lista) 923
15
CURSO DE SPSS BÁSICO
La columna N muestra el número de observaciones válidas para cada variable de la tabla. Se puede
ver que varía el número de observaciones válidas: la mayoría de las variables tienen más de 2000
observaciones válidas, sin embargo, la variable Años de educación alcanzado de la esposa/o tiene
sólo 1458 valores válidos, ya que como es lógico esta variable únicamente se aplicará a los que
tengan estado civil casados. El número de casos válidos puede ser útil para examinar qué variables
son apropiadas para otros análisis más específicos.
El último valor en la columna N (etiquetado como N válido (según lista)) indica cuántos casos
contienen valores válidos para todas las variables que aparecen en la tabla. Aquí hay 924 casos que
tienen valores válidos para todo el conjunto de variables. Aunque este número no parece
aparentemente útil para este análisis, puede servir para utilizarlo para posteriores análisis más
complejos en los que cuando alguna de las variables introducidas en el análisis tiene un valor
perdido supone un valor perdido para el resto de variables (análisis de fiabilidad, de regresión o
análisis factorial, por ejemplo). Es decir, ese valor nos informa de que si utilizásemos este conjunto
de variables en un procedimiento estadístico, el número de casos con valores válidos en todas las
variables es de 924.
16
CURSO DE SPSS BÁSICO
PRACTICA
Archivo de datos: empleados.sav
1. Ejecute el procedimiento Frecuencias para las variables catlab (Categoría laboral), minoría
(Clasificación étnica) y sexo, requiriendo además la moda y un gráfico de barras. Examine el
gráfico de barras para comprender la distribución de estas variables. ¿Qué categoría laboral
tiene la mayor cantidad de empleados y qué categoría la menor?.
4. Complete la siguiente tabla para las variables definidas en el archivo de empleados del
banco.
Medidas de Medidas de
Nombre de variable Nivel de medida tendencia central dispersión
aceptadas aceptadas
catlab(Categoría
laboral)
edad (Edad del
empleado)
niveduc (Nivel de
educación)
17