Está en la página 1de 17

CURSO DE SPSS BÁSICO

Estadística Descriptiva
Univariada (una sola variable)

OBJETIVOS DE LA ESTADÍSTICA DESCRIPTIVA

a. Como primer paso para analizar los datos, se debe primero conocer la distribución de cada
una de las variables con que se trabajará y además examinar los valores atípicos o no
esperados.
b. Es habitual listar en tablas de frecuencias los valores obtenidos en cada una de las variables
y el número de veces que se repiten, especialmente si las variables son categóricas.
c. Para algunas variables, también podemos resumir la distribución de los datos examinando
estadísticos de resumen simples como por ejemplo el mínimo y el Máximo o el rango de
datos.
d. Además, se utilizan frecuentemente medidas de resumen que describen la tendencia central
de la distribución, como la media aritmética.
e. También podemos utilizar estadísticos que nos informen de la dispersión de nuestros datos
en la distribución y que de alguna forma evalúen el grado de concentración de los datos
(normalmente alrededor de un valor central como la media).

NIVEL DE MEDIDA

Hay dos niveles generales de medida de las variables: categóricas y cuantitativas


(escalares).

Las variables categóricas pueden ser nominales u ordinales. Y dentro de las variables
cuantitativas podemos encontrar variables de intervalo o de razón.

Variables categóricas

Tienen un número limitado de categóricas (por ejemplo: sexo y estado civil). Las variables
categóricas pueden ser de cadena (características alfanuméricas) o numéricas, cuando sus
códigos son numéricos ( por ejemplo: 0= femenino, 1= masculino).

Dentro de las variables categóricas hay dos tipos de medidas diferentes:

1
CURSO DE SPSS BÁSICO

 Nominal. Valores categóricos donde no hay un orden inherente para las categorías.
Por ejemplo: una categoría de trabajo de "ventas” no es mayor o menor que una
categoría de trabajo de “marketing” o “investigación”. Otros ejemplos: estado civil,
región de residencia, sexo, etc. La única relación existente entre los valores de la
variable nominal es de igualdad o desigualdad.
 Ordinal: valores categóricos donde hay un orden significativo de categorías, pero
no hay una distancia medible entre ellas. Por ejemplo, hay un orden para los valores
alto, medio y bajo, pero la “distancia” entre los valores no puede ser calculada. Otros
ejemplos: variables actitudinales con categorías. Totalmente de acuerdo (valor 4),
de acuerdo (valor 3), en desacuerdo (valor 2) y totalmente en desacuerdo (valor 1),
o variables como la edad o los ingresos, siempre y cuando estén recodificadas en
rangos de valores ( de 18 a 25 años o de 500 a 1,000 nuevos soles, etc).

Variables cuantitativas (escalares)

Variables cuyos valores están medidos en intervalos o escalas de razón. Los valores de los
datos mantienen una relación de orden entre los valores ( de menor a mayor), pero además
de distancia entre ellos. Por ejemplo, un salario de S/. 72,195 es mayor que un salario de
S7. 52,398, y la distancia entre ambos valores es de S/. 19,797.

Dentro de las variables escalares hay dos tipos de medidas diferentes:


 De intervalo: La distancia entre los valores de la variable es la misma a través de
todo el rango de la variable. Por ejemplo. Para la variable Temperatura, podemos
establecer que la diferencia que existe entre 3º y 4º es la misma que la que hay
entre 25º y 26º,
 De razón. Tiene todas las propiedades de las variables de intervalo, pero además el
cero (0) representa ausencia de la propiedad que se desea medir. Por ejemplo, la
temperatura medida en grados centígrados es una variable de intervalo ya que el 0
no representa ausencia de temperatura. Sin embargo, la variable número de hijos sí
es una variable de razón, porque 0 significa ausencia de hijos. En estas variables
tiene también sentido hablar de razones ( de ahí su nombre), 2 hijos es el doble de 1
hijo, mientras que 10º no es el doble de temperatura que 5º.

También las variables cuantitativas se pueden clasificar en discretas o continuas en función


del tipo de valores que puede tomar la variable. En cualquier caso el SPSS aglutina a ambas
bajo la denominación ESCALA., son variables de escala y el tratamiento estadístico que
reciben es el mismo.

2
CURSO DE SPSS BÁSICO

Resúmenes estadísticos y gráficos apropiados

Iconos que representan diferentes escalas de medida de las variables

Estadísticos descriptivos y gráficos

NOMINAL ORDINAL ESCALAR

Definición Categorías sin orden Categorías en orden Valores numéricos

Ejemplos Color de ojos, sexo, Nivel de educación, Ingreso, edad, peso,


estado civil rango de edad altura
Moda
Medidas de Moda Mediana
Moda
tendencia central Mediana Media
Mínimo, máximo,
Medidas de Mínimo, máximo,
No corresponde rango, desvío
dispersión rango
estándar, etc.

Gráficos Sectores o barras Sectores o barras Histograma

Frecuencia,
Procesamiento en
Frecuencia Frecuencia Descriptivos,
SPSS
Explorar

3
CURSO DE SPSS BÁSICO

RESUMENES PARA VARIABLES NOMINALES


Procedimiento: FRECUENCIAS

ARCHIVO: GSS2004Intro_es.sav

Tabla de estadísticos para todas las variables

Estadísticos
Estado civil ¿Cómo se
conecta a
Internet en su
hogar?
Válidos 2812 1583
N
Perdidos 0 1229

4
CURSO DE SPSS BÁSICO

Tabla de frecuencia para estado civil y tipo de conexión a Internet

Estado civil
Frecuencia Porcentaje Porcentaje Porcentaje
válido acumulado
Casado 1479 52,6 52,6 52,6
Viudo 204 7,3 7,3 59,9
Divorciado 415 14,8 14,8 74,6
Válidos
Separado 95 3,4 3,4 78,0
Soltero 619 22,0 22,0 100,0
Total 2812 100,0 100,0

¿Cómo se conecta a Internet en su hogar?


Frecuencia Porcentaje Porcentaje Porcentaje
válido acumulado
Telefónica 785 27,9 49,6 49,6
ADSL 385 13,7 24,3 73,9
Por cable 400 14,2 25,3 99,2
Satélite 5 ,2 ,3 99,5
Válidos
Wireless 2 ,1 ,1 99,6
Telefono celular 2 ,1 ,1 99,7
Otros 4 ,1 ,3 100,0
Total 1583 56,3 100,0
No sabe 213 7,6
No contesta 24 ,9
Perdidos
Sistema 992 35,3
Total 1229 43,7
Total 2812 100,0

5
CURSO DE SPSS BÁSICO

Gráfico para variables nominales

Seleccionamos: gráficos de sectores

Continuar y Aceptar…

6
CURSO DE SPSS BÁSICO

RESÚMENES PARA VARIABLES ORDINALES

Tabla de frecuencias y gráfico de barras para la variable Identificación subjetiva de clase social
(Clase baja (código 1), clase trabajadora (2), clase media (3) y clae alta (4)):

7
CURSO DE SPSS BÁSICO

Clic en Gráficos y Porcentajes

Continuar..

Como la mediana es más útil para variables ordinales: Pulsar Estadísticos---Medina---continuar---

8
CURSO DE SPSS BÁSICO

Aceptar----

Estadísticos y Tabla de frecuencia para la variable Clase:

Estadísticos
Identificación subjetiva de la
clase social
Válidos 2799
N
Perdidos 13
Mediana 2,00

Identificación subjetiva de la clase social


Frecuencia Porcentaje Porcentaje Porcentaje
válido acumulado
Clase baja 191 6,8 6,8 6,8
Clase trabajadora 1213 43,1 43,3 50,2
Válidos Clase media 1311 46,6 46,8 97,0
Clase alta 84 3,0 3,0 100,0
Total 2799 99,5 100,0
No sabe 10 ,4
Perdidos NC 3 ,1
Total 13 ,5
Total 2812 100,0

9
CURSO DE SPSS BÁSICO

Gráfcio de barras para la variable Clase:

10
CURSO DE SPSS BÁSICO

RESÚMENES PARA VARIABLES ESCALARES:

Medidas de tendencia central-Medidas de dispersión:

Pulsar Estadísticos y seleccionar: Media, mediana, Desv. Típica, mínimo y Máximo:

11
CURSO DE SPSS BÁSICO

Continuar---Gráfcios—Histograma con curva normal—continuar—

Estadísticos
Edad del encuestado
Válidos 2803
N
Perdidos 9
Media 45,96
Mediana 44,00
Desv. típ. 16,804
Mínimo 18
Máximo 89
Se puede ver que el valor mínimo de edad es de 18 años y que el máximo es de 89 años. En este
estudio todos los encuestados deben ser mayores de edad ( tener 18 años o más) y a todos aquellos
con 89 años o más se les asignó el código 89. Observe que la diferencia entre la media (45,96) y la
mediana (44) es menor a 2 años, indicando que la variable tiene una distribución aproximadamente
simétrica dentro del rango definido.

12
CURSO DE SPSS BÁSICO

Podemos ver que el rango de valores más bajo está truncado en 18 y que el número de personas es
mayor en los valores medios de edad. Además, como es de esperar, el número de casos decae en
las edades más altas. Así , la edad de los encuestados para esta muestra de adultos se distribuye
aproximadamente normal (esto último se deduce porque la curva normal teórica y la distribución
observada se solapan bastante bien).

13
CURSO DE SPSS BÁSICO

EVALUACIÓN DE VALORES PERDIDOS CON EL PROCEDIMIENTO DESCRIPTIVOS:

El procedimiento Descriptivos proporciona una tabla de estadísticos (Media, Desviación Típica,


Varianza, Mínimo, Máximo, etc) para variables cuantitativas (este procedimiento no es aplicable a
variables categóricas-nominales u ordinales). Sin embargo, este procedimiento también muestra la
cantidad de caos con valores válidos para cada variable incluida en la tabla. Estos resúmenes son
uy útiles para evaluar la cantidad de valores perdidos y poder identificar las variables con una gran
proporción de valores perdidos en los datos.

Pulsar: analizar---estadísticos descriptivos---Descriptivos

Desplazar todas las variables desde Estado Civil (ecivil) hasta Ingresos familiares totales (Salario)

14
CURSO DE SPSS BÁSICO

Aceptar---

Estadísticos descriptivos
N Mínimo Máximo Media Desv. típ.
Estado civil 2812 1 5 2,35 1,634
Edad del encuestado 2803 18 89 45,96 16,804
AÑO DE ESTUDIO 2810 0 20 13,70 2,889
AÑO DE EDUCACIÓN
2090 0 20 11,76 4,012
ALCANZADO, PADRE
AÑO DE EDUCACIÓN
2429 0 20 11,80 3,492
ALCANZADO, MADRE
AÑO DE EDUCACIÓN
ALCANZADO, 1458 0 20 13,79 2,858
ESPOSA/O
ESTUDIOS 2811 0 4 1,61 1,207
¿Qué edad tenía cuando
2026 12 51 24,03 5,473
nació su primer hijo?
Clasificación étnica 2812 1 3 1,28 ,586
Ingresos familiares
2692 1 13 11,05 2,381
totales
N válido (según lista) 923

15
CURSO DE SPSS BÁSICO

La columna N muestra el número de observaciones válidas para cada variable de la tabla. Se puede
ver que varía el número de observaciones válidas: la mayoría de las variables tienen más de 2000
observaciones válidas, sin embargo, la variable Años de educación alcanzado de la esposa/o tiene
sólo 1458 valores válidos, ya que como es lógico esta variable únicamente se aplicará a los que
tengan estado civil casados. El número de casos válidos puede ser útil para examinar qué variables
son apropiadas para otros análisis más específicos.

El último valor en la columna N (etiquetado como N válido (según lista)) indica cuántos casos
contienen valores válidos para todas las variables que aparecen en la tabla. Aquí hay 924 casos que
tienen valores válidos para todo el conjunto de variables. Aunque este número no parece
aparentemente útil para este análisis, puede servir para utilizarlo para posteriores análisis más
complejos en los que cuando alguna de las variables introducidas en el análisis tiene un valor
perdido supone un valor perdido para el resto de variables (análisis de fiabilidad, de regresión o
análisis factorial, por ejemplo). Es decir, ese valor nos informa de que si utilizásemos este conjunto
de variables en un procedimiento estadístico, el número de casos con valores válidos en todas las
variables es de 924.

MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN APROPIADAS EN FUNCIÓN DEL


NIVEL DE MEDIDA

Medidas de tendencia central apropiadas en función del nivel de medida

Medidas de tendencia central apropiadas


Nivel de medida
Moda Mediana Media
Nominal SI NO NO
Ordinal SI SI NO
Escalar SI SI SI

Algunas medidas de dispersión apropiadas en función del nivel de medida

Medidas de dispersión adecuadas


Nivel de medida
Mínimo/Máximo Varianza Desviación Típica
Nominal NO NO NO
Ordinal SI NO NO
Escalar SI SI SI

16
CURSO DE SPSS BÁSICO

PRACTICA
Archivo de datos: empleados.sav

1. Ejecute el procedimiento Frecuencias para las variables catlab (Categoría laboral), minoría
(Clasificación étnica) y sexo, requiriendo además la moda y un gráfico de barras. Examine el
gráfico de barras para comprender la distribución de estas variables. ¿Qué categoría laboral
tiene la mayor cantidad de empleados y qué categoría la menor?.

2. Ejecute el procedimiento frecuencias para las variables salini(Salario inicial) y salario


(Salario actual), solicitando resúmenes estadísticos y un histograma para cada variable
superponiendo la curva normal. Desactive la opción Mostrar tablas de frecuencias. ¿Piensa
que los salarios se distribuyen normalmente?. Si su respuesta es No, ¿por qué?.

3. Ejecute el procedimiento Frecuencias para la variable educ (nivel educativo) mostrando la


tabla en orden de frecuencias (Ayuda: use el botón Formato).

4. Complete la siguiente tabla para las variables definidas en el archivo de empleados del
banco.

Medidas de Medidas de
Nombre de variable Nivel de medida tendencia central dispersión
aceptadas aceptadas
catlab(Categoría
laboral)
edad (Edad del
empleado)
niveduc (Nivel de
educación)

17

También podría gustarte