Unidad 1 Manejo Del SPSS y Estadisticos

UNIDAD 1
MANEJO DEL SPSS Y ESTADÍSTICOS DESCRIPTIVOS
Objetivo.-
Al finalizar esta unidad del curso de SPSS, usted estará en capacidad de manejar
el editor de datos, ingresar, transformar y filtrar variables, así como fundir e
importar archivos de datos, generar reportes descriptivos, representaciones
graficas de variables, construir tablas de contingencia y realizar un análisis
exploratorio
Contenidos:
1. Aspectos técnicos
2. Entrar al programa
3. Definición de datos
4. Introducción y edición de datos
5. Transformación de una variable
6. Recodificación de una variable
7. Filtrado de datos
8. Fundir archivos
9. Importar datos
10. Tablas de frecuencias
11. Estadísticos
12. Representación gráfica de variables.
13. Generación de tablas de contingencia.
14. Generación de tablas personalizadas.
15. Generación de reportes estadísticos en base a intervalos de confianza
16. Determinación de valores atípicos
17. Generación de diagramas de caja
Jorge Antonio Pérez

Docente UPS
1. Aspectos técnicos
El programa SPSS para Windows es una versión para ordenadores personales

del paquete estadístico SPSS (Statistical Package for Social Sciences).
El programa trabaja con 3 tipos de archivos:
•
•
archivos de datos propios de SPSS. .sav
•
archivos de gráficos y resultados de SPSS. .spv
archivos de sintaxis de SPSS. .sps
Además, permite importar archivos creados con otras aplicaciones: Excel, Lotus,
Dbase, entre otras y exportar archivos de datos y gráficos.
2. Entrar al programa
Seleccionamos la opción de SPSS desde el icono del programa de su

computador.
Así se abre la siguiente ventana con diferentes opciones.

Docente UPS
Seleccionamos la opción de nuevo conjunto de datos y damos clic en Aceptar,
desplegándose la siguiente ventana.
La parte inferior de la pantalla indica la barra de estado en la que hay

información sobre el procesador de SPSS (IBM SPSS Statistic Processor está
listo); así como dos pestañas que permiten seleccionar "vista de datos" o "vista
de variables".
En la parte superior aparece la barra de menú. Al situar el puntero del ratón

sobre cualquiera de sus elementos, aparece información sobre las operaciones
que podemos realizar:
Archivo: Crear, abrir o grabar los diferentes archivos de SPSS, mostrar

información de datos, imprimir, acceso directo a los últimos archivos abiertos,
salir del SPSS.
Edición: Deshacer, borrar, copiar, cortar, pegar, insertar variable, buscar,

opciones.

Docente UPS
Ver: Barra de estado, Barras de herramientas, Fuentes, Lineas de cuadrícula,
Etiquetas de valor, Personalizar vista de variables.
Datos: Definir propiedades de variables, Definir fechas, Definir conjunto de

respuestas múltiples y efectuar modificaciones en el archivo de datos como:
seleccionar, añadir, ponderar, ordenar, ir al caso, etc.
Transformar: Modificación, edición y generación de nuevas variables.
Las funciones de Datos y Transformar son temporales y sólo están vigentes

durante la sesión sin que afecten al archivo original de datos. Si queremos que
sean permanentes debemos guardar los cambios.
Analizar: Permite realizar análisis estadísticos mediante los comandos

instalados.
Marketing Directo: comprender los contactos, mejorar mis campañas de

marketing
Gráficos: Edición y generación de diversos tipos de gráficas de alta resolución.
Utilidades: Cambiar fuentes, información sobre archivos.
Ventana: Funciones habituales para controlar las ventanas. Se visualiza las

siguientes ventanas:
•
•
Edición de datos de SPSS (Ventana principal con los menús)
Visor de SPSS (entrega de resultados)
Ayuda: Formato de Windows que permite obtener alguna ayuda del programa.
3. Definición de los datos
Antes de empezar el análisis de los datos es conveniente, siempre, prepararlos

para su mejor manejo e interpretación.
Los archivos de datos, habitualmente, toman la forma de una matriz en la que

cada fila representa los valores que un individuo determinado o caso tiene para
las diferentes variables.
En el programa SPSS cada fila representa un caso. En las columnas de dicha

matriz aparecen los diferentes valores que una variable determinada toma para
cada uno de los individuos de ese grupo o casos.

Docente UPS
3.1 Apertura de datos
Para abrir un archivo de datos seguimos el siguiente procedimiento:
Archivo/Abrir/Datos y se busque el archivo que se requiera, para esta práctica

abrimos el archivo MUNDO previamente entregado, con lo cual aparecerá la
siguiente ventana:
Observe como se modifica la variable REGIÓN de un valor numérico a uno

nominal cuando se da clic en la opción de etiquetas de valor que se encuentra
debajo del menú principal.
Obteniendo lo siguiente:

Docente UPS
3.2 Definición de Variables
Antes de trabajar con un archivo de datos es de primordial importancia definir

las variables. Para esto debemos hacer clic en la barra inferior en la opción de
vista de variables.
Para revisar esta opción se analizará cómo están definidas las variables del
archivo MUNDO, seleccionando la opción de vista de variables se obtiene:
Observe que hay una fila para cada variable y que existen columnas: Nombre,
Tipo, Anchura, Decimales, Etiqueta, Valores, Perdidos, Columnas, Alineación,
Medida, Rol.
La definición de una variable se basa en las opciones siguientes:
• Asignar un Nombre: a cada variable, cumpliendo las siguientes reglas:

- Nombres que inicien con una letra o @ al inicio.
- No utilizar símbolos como &, /, $, etc.
- No utilizar nunca espacios en blanco.
- No utilizar expresiones como: ALL, AND, BY, EQ, GE, GT, LE, NE,
NOT, OR, TO, o WITH.

Docente UPS
• Asignar un Tipo: a cada variable, indicando el máximo número de dígitos
que deseamos para anotar las observaciones de la variable y el tipo de la
variable con la que vamos a trabajar, alfanumérica, fecha, moneda o
numérica, indicando en este caso el número de cifras decimales con que
queremos que aparezca en el editor.
- Numéricas: formato numérico estándar
- Coma: comas de separación cada tres posiciones. Un punto para la
parte decimal.
- Punto: al contrario que el anterior.
- Notación Científica: uso de la E para exponente. Ejemplo 2,34E2
- Cadena: variable alfanumérica. (de más de 8 caracteres se considera
larga).
- Además están los formatos de fecha, dólar y moneda personalizada.
Si no escogemos ninguna de las opciones anteriores, el sistema las asigna

automáticamente, siendo el formato por defecto: Numérica 8.2 que significa:
Anchura: 8 y Decimales: 2, es decir, una amplitud de columna de 8 espacios,
siendo los 2 últimos para decimales.
Haga clic sobre el recuadro derecho en la celda correspondiente al Tipo en la

variable densidad y observe estas posibilidades. Adicional analice los formatos
permitidos para Fecha, Dólar, Moneda personalizada y Cadena.
• Asignar una Etiqueta: a cada variable de no más de 120 caracteres

(entre 30 y 40 es el valor recomendado) que nos permita tener más
información sobre esa variable.

Docente UPS
• Asignar Valores: se trata de asignar etiquetas a los valores de cada
variable. No es obligatorio, pero sí muy útil en algunos casos.
Ubíquese en el campo correspondiente a Valores de la variable clima y

haga clic en el recuadro derecho y analice los valores.
• Definir Perdidos: permite definir los valores de los datos especificados

como perdidos por el usuario. A menudo es útil para saber por qué se
pierde información. Por ejemplo, puede distinguir el dato perdido
correspondiente a un entrevistado que se niega a responder, del dato
perdido debido a que la pregunta no afectaba a dicho entrevistado. Los
valores de datos especificados como perdidos por el usuario aparecen
marcados para un tratamiento especial y se excluyen de la mayoría de los
cálculos.
Colóquese en el campo correspondiente a Perdidos de cualquier variable y de

clic sobre el recuadro derecho y aparece:

Docente UPS
Los códigos asignados a los valores ausentes deben de ser coherentes con el
tipo de variables declarado: Numéricos para las numéricas y alfanuméricos para
las alfanuméricas (máximo 9 caracteres). Se pueden introducir hasta 3 valores
perdidos (individuales) de tipo discreto, un rango de valores perdidos o un rango
más un valor de tipo discreto. Sólo pueden especificarse rangos para las
variables numéricas.
Estos valores ausentes son denominados por SPSS "valores ausentes definidos
por el usuario" (userdefined missing values), a diferencia de los definidos por el
sistema (system-missing values o sysmis). Estos últimos corresponden a los que
establece el sistema para los espacios en blanco y caracteres ilegales que pueda
haber en el archivo de datos. Aparecen en los listados representados por comas.
• Definir Columnas: consiste en especificar la amplitud de la columna.

Podemos hacerlo también desde el propio archivo de datos.
• Definir Alineación: seleccionar la justificación de las entradas de la

columna: Izquierda, Derecha y Centrado.
• Especificar medida. Se puede seleccionar uno de los tres niveles de

medida:
- Escala: los valores de datos son numéricos en una escala de intervalo.
Las variables de escala deben ser numéricas.
- Ordinal: los valores de datos representan categorías con un cierto
orden intrínseco en escala de likert (bajo, medio, alto ó totalmente de
acuerdo, de acuerdo, en desacuerdo, etc). Las variables ordinales
pueden ser de cadena o valores numéricos. Notar que, para variables
de cadena ordinales, se asume que el orden alfabético de los valores
de cadena indica el orden correcto de las categorías; en el caso de
bajo, medio y alto el orden sería alto, bajo y medio (orden que no es
correcto), por lo que es más fiable utilizar códigos numéricos para
representar datos ordinales que usar etiquetas de estos códigos.
- Nominal: los valores de datos representan categorías sin un cierto
orden intrínseco. Las variables nominales pueden ser de cadena o
valores numéricos que representan categorías diferentes, por ejemplo
1 = Hombre y 2 = Mujer.
Observe cómo han sido definidas todas las variables del archivo MUNDO.

Docente UPS
4. Introducción y edición de los datos
Para abrir un archivo nuevo de datos de SPSS debe seleccionar el menú de
• Si ya está en el editor de datos vacío, no hace falta.

Archivo/Nuevo/Datos:
• Si, previamente, tenía abierto otro archivo de datos, por ejemplo

MUNDO.sav, y ha realizado alguna modificación de este archivo, antes
de cerrar éste y abrir uno nuevo, le preguntará si quiere guardar los
cambios realizados.
Una vez tenga la ventana del Editor de datos del SPSS abierta y vacía, lea
atentamente las siguientes instrucciones antes de introducir datos:
• Debe definir las variables adecuadamente (Vista de variables) de forma

que después podamos empezar a introducir los datos en cualquier orden
•
(Vista de datos).
Para introducir los datos, nos situamos en una casilla, tecleamos su valor
y pulsamos Intro o el Tabulador o nos situamos con el ratón en otra
•
casilla. Podemos introducir los datos por filas o columnas indistintamente.
Conviene ir actualizando el archivo con la opción Guardar Datos o con el
botón de grabar habitual en otras aplicaciones Windows. Para ello:
- Si ya lo había guardado con anterioridad, para guardar las últimas
modificaciones, seleccione la opción de Guardar dentro de
Archivo.
- Si es la primera vez que lo guarda, como todavía no le ha asignado
un nombre al archivo, seleccione la opción Guardar como ...
dentro de Archivo. Le pedirá el nombre que quiere darle al archivo,
su extensión (por defecto utilizará la extensión .sav para datos del
SPSS) y la carpeta en que quiera guardarlo.
Ejercicio1
Genere un archivo de datos en SPSS con la información que aparece a continuación.
Este archivo de datos debe recoge la información obtenida en un proyecto de
investigación mediante encuestas.
Las variables que necesita son las siguientes:
nombre: nombre del entrevistado
n_ident: número de identificación del entrevistado
genero: identifica el género del entrevistado
edad: edad en años del entrevistado
l_nacim: colocar la ciudad de nacimiento del entrevistado
telef: colocar el número de teléfono del entrevistado
Direc: colocar la dirección del entrevistado
f_encues: colocar la fecha de la entrevista
1.Defina las variables con el nombre indicado, el tipo y formato convenientes.

2.Introduzca los valores recolectados de seis personas.
3.Grabe el archivo de datos con nombre eje1uni1.sav

Docente UPS
Una vez introducidos los datos usted puede modificarlos, ya sea para introducir
o ampliar con nuevos valores o para rectificar alguno ya introducido.
La edición de datos en SPSS contiene comandos para: cortar, copiar, pegar,

eliminar y buscar (similar a otras aplicaciones Windows), insertar variables o
casos, ir al caso, ordenar casos, y se encuentran en el menú Editar y Datos.
Ejercicio 2.
1.Insertar, entre las personas 4º y 5º, los datos correspondientes la siguiente persona:
CORREA DELGADO RAFAEL VICENTE
0908813512
Masculino
54
Guayaquil
02 382 7000
Belgica
19 de febrero del 2018
2. Insertar, entre las personas 2º y 3º, sus datos personales como un entrevistado
más:
Para los dos ítems anteriores, nos situamos en el individuo 5° y 3°

respectivamente y seleccionamos el menú Editar/Insertar caso.
3.Modificar el valor de la variable telef del 4º entrevistado, por su número de celular

si anteriormente estaba el convencional o viceversa.
4.Modificar las especificaciones (nombre, tipo y formato columna) de las variables
para que tengan la presentación que usted desee.
5.Asignar las siguientes etiquetas de variables:
n_ident número de cédula del entrevistado
l_nacim cantón de nacimiento del entrevistado
6.Asignar etiquetas de valor a las variables l_nacim y genero:
l_nacim: 0 = Cuenca, 1 = Guayaquil, 2=Quito, etc.
genero: 1 = masculino, 2 = femenino.
7.Verifique con el ícono de etiqueta de valor de la barra de herramientas, si se dan
los cambios realizados anteriormente.
8. Guardar las modificaciones en el archivo eje2uni1.sav

Docente UPS
5. Transformación de una variable
Una vez elaborado el archivo de datos, y previo al análisis estadístico es posible

modificar los datos originales presentes en el archivo. Estos cambios pueden
referirse a las variables, a los casos, o al archivo en su conjunto. El programa
permite tanto la recodificación de los valores, así como la generación de nuevas
variables mediante transformaciones de las ya existentes. El programa SPSS
permite generar nuevas variables mediante transformaciones numéricas
efectuadas sobre las antiguas.
Abra el archivo de datos Ambiente entregado previamente; este archivo recoge

información obtenida en un proyecto de investigación ambiental en el que se
estudió los niveles de contaminación atmosférica en la Comunidad Valenciana.
Para ello se analizó observaciones aleatorias en cada provincia, midiendo en el
aire la concentración de sulfato, el pH y la presencia de un nivel elevado de
ozono. En estos datos se ha detectado un error en la medición del pH debido a
que el aparato utilizado incrementa en 0,3 unidades todas las mediciones que
realiza. Conviene generar una nueva variable que incorporara esta corrección.
Para esto elija Transformar/ Calcular variable, y realice los siguientes pasos:
- Asignar un nombre y un tipo (por defecto será numérica) a la nueva
variable en el cuadro de texto de la Variable de destino, en este caso
nuevp_ph
- Definir la Expresión numérica que va a permitir calcular los valores de la
misma. Para ello utilice los nombres de las variables del archivo (puede
escribirlos o seleccionarlos del listado que aparece), constantes,
operadores y funciones.
- Pulse Aceptar.

Docente UPS
Para construir estas expresiones puede usarse operadores aritméticos como
+, -, *, /, ** y funciones como SQRT, EXP, LG10, LN, ARTAN, COS, SIN, ABS,
MOD10, TRUNC, RND, entre otras.
Dando click sobre el nombre de la función, aparece su descripción. El

argumento de las funciones debe ir entre paréntesis.
Es importante tener cuidado con el orden de utilización de los operadores y no

olvidar que los valores antiguos pierden su vigencia al recodificar una variable
sobre el mismo nombre.
El botón Si la opción permite realizar modificaciones similares, pero sujetas a

que se verifique una condición lógica. Se incluirán aquellos casos que verifiquen
la condición. Los que no la cumplan pasarán a ser valores ausentes definidos
por el sistema.

Docente UPS
Por ejemplo, si queremos modificar sólo las observaciones realizadas en
Alicante, en una nueva variable nuevo_ph2, deberemos:
- Pulsar en el recuadro Si la opción

- Seleccionar Incluir si el caso satisface la condición
- Escribir la condición: provin = “1” (VA ENTRE COMILLAS PORQUE LA
VARIABLE ES TIPO CADENA)

Docente UPS
Pulsar Continuar y en la siguiente pantalla pulsar Aceptar.
Una expresión lógica es una expresión que puede ser evaluada como verdadera
o falsa en función de los valores de las variables en ella relacionadas. El nexo
de las variables son los operadores de relación: =, >=, <=, <, > , ~= .
Es posible formar expresiones complejas, utilizando los operadores lógicos:

AND (&), OR ( | ), NOT (~).
6. Recodificación de una variable
A partir de una variable se puede crear otra cuyos valores sean una
recodificación de los de la primera. Esta recodificación podemos hacerla tanto
en la misma variable como en variables diferentes. Para ello, seleccionaremos
Transformar/Recodificar/En distintas variables... Se abre una ventana en la
que deberemos asignar un nombre (y una etiqueta si queremos) a la nueva
variable.
¡Cuidado!, si selecciona En las mismas variables ... borrará la variable original.
Docente UPS
Recodifique la variable sulfato en una nueva variable llamada:
niv_sulf, clasificándolo en: bajo (0,3), medio [3,6), alto [6,9).
- Seleccione la variable sulfato, escriba el nuevo nombre de la Variable de

resultado “niv_sulfato”, y pulse Cambiar:

Docente UPS
- Pulse en Valores antiguos y nuevos, Aquí especifique los valores
antiguos y sus nuevos valores. Es muy útil cuando queremos recodificar
variables cuantitativas mediante el establecimiento de intervalos. Para ello
utilizamos las posibilidades descritas en Rango:
Para especificar 0 ≤ sulfato < 3 niv_sulf = 1, escriba en rango (valores antiguos)

0 y 3, y en valor nuevo, 1, pulse añadir y realice los mismos pasos con el resto
de intervalos.
A continuación, pulsar Continuar y en la siguiente pantalla Aceptar. Observa el

contenido de la nueva variable.

Docente UPS
Ejercicio 3.
1. Añadir, a la variable niv_sulf las etiquetas de valores para leer bajo, medio, alto
2. Recodificar la variable provin en una nueva variable cod_prov que contenga los
prefijos telefónicos de la provincia: Alicante 965, Castellón 964 y Valencia 963, como
en la siguiente ventana y luego en la vista de variables colocar el respectivo CÓDIGO,
mirar las dos siguientes ventanas.
3. Guardar en archivo como eje3un1.sav
7. Filtrado de datos
El programa SPSS permite seleccionar determinados casos para un próximo

proceso, bien temporalmente o de forma permanente, sobre la base de un criterio
lógico o de una decisión aleatoria. Para ello seleccionaremos el menú
Datos/Seleccionar casos...

Docente UPS
Docente UPS
La selección de casos puede ser temporal (filtrados) o permanente
(eliminados):
En la selección permanente se elimina del archivo activo los casos no deseados,

mientras que en la temporal, la selección es recuperable (los casos son
filtrados). En esta última situación, los casos del archivo que no satisfacen la
condición aparecerán marcados como excluidos mediante una línea que cruza
en diagonal su número de fila. Aparece también una variable llamada FILTER_$
que el sistema crea para controlar el filtrado de datos.
Seleccionar, sin eliminar, las filas correspondientes a las mediciones con bajo
nivel de sulfato:
• Seleccione Si se satisface la condición, de clic en el cuadro Si la
•
opción. Especificamos la condición niv_sulfato = 1
Pulse Continuar y, después, Aceptar.
Observe el resultado y después seleccione Todos los casos o Restablecer

para volver a considerar todos los casos del archivo de datos.

Docente UPS
Los resultados son:

Docente UPS
Especificaciones para el resto de opciones de SELECCIONAR CASOS:
• Todos los casos: indica que quiere procesar todos los casos del archivo
de datos de trabajo.
• Si se satisface la condición: indica que quiere procesar sólo los casos

que satisfagan una condición lógica. Para especificar o cambiar la
condición, pulse en Si. Esta alternativa crea la variable filter_$, que el
sistema crea para controlar el filtrado de datos.
• Muestra aleatoria de casos: indica que queremos seleccionar los casos

de forma aleatoria para su procesamiento. Si ha tecleado las
especificaciones de muestreo, éstas aparecerán junto al botón de
comando Muestra. Si no, o si quiere cambiarlas, pulse en Muestra (véase
más adelante). Esta alternativa también crea la variable filter_$.
• Basándose en el rango del tiempo o de los casos: permite seleccionar

los casos deseados siempre que sean consecutivos, por ejemplo del 3º al
18º.
• Usar variable de filtro: indica que quiere utilizar los valores de una
variable numérica existente para controlar el filtrado de casos. Seleccione
la variable de la lista de la izquierda. Los casos cuyo valor sea 0, o
ausentes, en la variable de filtro se excluyen del análisis.
Ejercicio 4
CREAR UN NUEVO ARCHIVO A PARTIR DEL ARCHIVO AMBIENTE Y
LLAMARLO PH, Y EN ESE ARCHIVO
-Seleccionar los valores de pH por debajo de 6,0
-CREAR UN NUEVO ARCHIVO A PARTIR DEL ARCHIVO AMBIENTE Y
LLAMARLO PRIMEROS, Y EN ESE ARCHIVO
-Seleccionar los 8 primeros datos de todas las variables.
-Guardar el archivo como eje4un1
8. Fundir archivos
SPSS permite añadir casos desde un archivo.sav a otro y también variables de

un archivo a otro:
8.1 Añadir casos:

En primer lugar, crea y guarda los dos archivos siguientes:
• Realizar el siguiente procedimiento de fundir archivos, y adjuntar en

Ejercicio 5
• Guarde el archivo como eje5un1.

la tarea los archivo fundir1a y fundir 1c

Docente UPS
Archivo: fundir1a.sav
Archivo: fundir1b.sav
Va a copiar los casos del archivo fundir1b.sav a continuación de los casos

del archivo fundir1a.sav. Para ello siga los pasos siguientes:
• Sobre el archivo fundir1a.sav,

•
•
Seleccione del menú: Datos/ Fusionar Archivos/Añadir casos
Selecciona el archivo fundir1b.sav. y damos clic en abrir y luego
continuar

Docente UPS
Docente UPS
• SPSS mostrará las variables coincidentes que aparecerán en el nuevo
•
archivo.
Después de Aceptar, la fusión se realiza.
• El resultado es el siguiente el cual lo puede guardar con el nombre que

usted desee. En caso de que existan variables que no coincidiesen en
nombre en ambos archivos, SPSS permite emparejarlas.

Docente UPS
8.2 Añadir variables:
Al archivo resultante de la fusión anterior va a añadirle variables nuevas que se

encuentran en otro archivo. Para ello es necesario que ambos archivos
compartan una variable que identifique los casos, en nuestro caso usaremos la
variable clave.
• En primer lugar cree y guarde el siguiente archivo: fundir1c.sav
Note que aparecen los mismos casos etiquetados por la variable clave, en
distinto orden. Los pasos a seguir son los siguientes:
• Ordene ascendentemente el archivo fundir1c.sav mediante

Datos/Ordenar casos y seleccionar la variable clave y guarde.

Docente UPS
El resultado es:
• Ordenar ascendentemente el archivo fundir1a.sav por la variable

clave y guarde.

Docente UPS
El resultado es:
• Seleccione el menú Datos/Fusionar Archivos/Añadir variables,

desde el archivo fundir1c. Obtiene el siguiente cuadro de diálogo:

Docente UPS
• Seleccione el archivo fundir1a.sav de clic en abrir y luego en
continuar.
• Active la opción de Asignar casos en variables clave y pase la

variable clave a la casilla de variables clave:

Docente UPS
• Luego de clic en Aceptar, y obtiene el archivo fusionado que podrá
guardarlo con el nombre que usted desee.
Advertencia: Se producirá un error si no ordena los datos en forma

ascendente de la variable.
9. Importar datos
Vamos a importar un archivo de texto y convertirlo al formato SPSS.
• Realizar el siguiente procedimiento de importar datos y adjuntar en

Ejercicio 6
• Guarde el archivo como eje6un1.

la tarea el archivo importado

Docente UPS
• Con el bloc de notas de Windows cree y guarde el archivo siguiente:
para ello debes crear un archivo en el programa, y guardarlo con el
nombre bloc de notas.
Observe lo siguiente:
- Cada registro tiene 4 campos de tipos diferentes, separados por un

espacio en blanco,
- Los campos no están en columna, esto se lo denomina formato libre
• Para importar este archivo en un nuevo archivo seleccione el menú

Archivo/Importar datos/ Leer datos de texto, introducir el
nombre del archivo.

Docente UPS
• De clic en abrir y luego aparece el cuadro de dialogo en el cual le pide
que indique si su archivo tiene algún formato definido, en esta caso
•
damos clic en no.
De clic en siguiente y activamos la opción NO para indicar que no
está incluido el nombre de la variable en la primera fila o parte
superior del archivo y damos clic en siguiente

Docente UPS
• En el cuadro de dialogo siguiente coloque la información referente a
cada uno de los casos según sea el archivo con el que esté trabajando
•
y de clic en siguiente.
Luego indique como están delimitada cada una de las variables en el
archivo de texto y de clic en siguiente.

Docente UPS
• En el paso 5 de 6 puede dar nombres y formato a las variables dando
clic en la parte inferior sobre cada una de las variables: para este caso
la V1 se ha colocado el nombre codigo, para la v2 es nombre, para
la v3 es valor y para la V4 es fecha.

Docente UPS
Docente UPS
• Luego de clic en FINALIZAR:

Docente UPS
• Y obtiene el archivo final el cual lo puede guardarlo con el nombre que
usted desee.
10. Tablas de frecuencias
Una de las formas más simples de resumir la información de un conjunto de

datos es por medio de una tabla de frecuencias, que consiste en calcular para
cada valor de una variable el número (frecuencia) de casos en que aparece.
Una tabla de frecuencias debe indicar el nombre de la variable en su

encabezado, los valores que toma la variable, la frecuencia de cada uno de ellos
y la suma de todas las frecuencias, que coincidirá con el número total de casos
válidos. También es aconsejable calcular las frecuencias relativas, o
proporciones, que resultan al dividir cada frecuencia por su suma total.
SPSS genera tablas de frecuencias de forma automática. En primer lugar, se
necesita abrir una base de datos con los que pretende trabajar, por ejemplo, el
archivo ambiente.sav (proporcionado previamente), y con el menú
Analizar/Estadísticos descriptivos/Frecuencias se puede obtener la tabla de
frecuencias asociada a cualquier variable.
La tabla para la variable ozono obtenida por SPSS es la siguiente:

Docente UPS
•
•
Pase la variable gas ozono por zona a la ventana variables.
Active la opción: Mostrar tablas de frecuencias y luego de clic en
Aceptar, y los resultados.

Docente UPS
• El resultado que usted obtiene es el siguiente:
Estadísticos
Gas ozono por zonas
N Válido 15
Perdidos 0
Gas ozono por zonas
Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válido normal 7 46,7 46,7 46,7
alto 8 53,3 53,3 100,0
Total 15 100,0 100,0
La tabla indica que hay 15 casos válidos y ninguno perdido, que la variable ozono
tiene dos valores posibles Normal y Alto (son las etiquetas asociadas a los
valores 0 y 1, respectivamente). Hay 7 casos (46,7%) en los que ozono toma el
valor Normal y 8 (53,3%) el valor Alto.
SPSS también cuenta con el menú alternativo Analizar/Tablas personalizadas

que posibilita alterar el formato del resultado.
Ejercicio 7
1.Ordene los datos por la variable ozono con la opción: Datos/Ordenar casos o
haciendo clic con el botón derecho del ratón sobre el nombre de la variable y
comprueba que las frecuencias anteriores son correctas, volviendo a generar la
opción frecuencias.
2.Obtener la tabla de frecuencias de la variable provin.
3.Obtener la tabla de frecuencias de la variable sulfato.
4. Guarde los archivos de resultados y datos en una carpeta comprimida con el
nombre eje7un1.

Docente UPS
11. Estadísticos
Los estadísticos son valores calculados con los datos de una variable
cuantitativa y que miden alguna de las características de la distribución muestral.
Las principales características son: tendencia central, posición, dispersión,
asimetría y apuntamiento.
11.1 Medidas de posición
11.1.1 Medidas de posición central:
- Media.- es la suma de todas las observaciones dividida por el

tamaño de la muestra.
- Mediana.- es el valor que divide a la muestra ordenada en dos

mitades con el mismo número de datos.
- Media recortada.- es una media calculada después de eliminar

algunos datos extremos. Es más robusta que la media pues no
tiene en cuenta los valores atípicos.
- Moda.- es el dato que posee la mayor frecuencia. En algunos casos

pueden darse varias modas.
11.1.2 Otras medidas de posición.

Los cuartiles Q1,Q2 y Q3, son tres valores que dividen a la distribución en cuatro
partes iguales. El primer cuartil tiene un 25% de casos menores o iguales que
dicho valor; el segundo cuartil coincide con la mediana y el tercer cuartil deja un
25% de valores superiores o iguales a este.
Los deciles (10 en total) y percentiles (100 en total) dividen a la distribución en
diez y cien partes iguales, respectivamente. Su forma de cálculo es similar a la
de los cuartiles.
11.2 Medidas de dispersión
Las más utilizadas son:
- Rango o amplitud que es la diferencia entre el mayor y el menor valor de

la muestra.
- Rango intercuartílico Q3-Q1, el intervalo [Q1,Q3] contiene al 50%

central de los valores muestrales.
- Varianza (s2) que mide el alejamiento medio de las diferencias al

cuadrado de cada observación a la media.
Docente UPS
- Desviación típica o estándar (s) está medida en las mismas unidades
que la variable y es la raíz cuadrada positiva de la varianza.
- Coeficiente de variación de Pearson es una medida de dispersión

relativa. Es el cociente o división entre la desviación típica o estándar y el
valor absoluto de la media. Carece de unidades y se usa para comparar
la dispersión entre variables que tengan distintas unidades de medida.
El coeficiente de variación toma valores entre 0 y 1. Si el coeficiente es
próximo al 0, significa que existe poca variabilidad en los datos y es una
muestra muy compacta. En cambio, si tienden a 1 es una muestra muy
dispersa; para interpretar fácilmente el coeficiente de variación, puede
multiplicarlo por cien para tenerlo en porcentaje.
11.3 Medidas de asimetría y apuntamiento
Su objetivo es expresar mediante un valor la forma simétrica o asimétrica de la

distribución.
Para distribuciones unimodales que además son simétricas es decir la parte
izquierda de la distribución es igual a la derecha, los estadísticos: media,
mediana y moda suelen tener valores idénticos o muy parecidos. En base a esto,
aparece el Coeficiente de Asimetría de Pearson.
Este coeficiente de asimetría oscila entre valores de -3 hasta 3 si el valor es
negativo los datos están sesgados hacia la izquierda de la media; si el valor es
positivo los datos están sesgados hacia la derecha.

Docente UPS
11.4 Medidas de apuntamiento
Indican el nivel de concentración de los datos respecto de su media. Las curvas

se pueden clasificar en tres grupos según el signo de su curtosis, es decir, según
la forma de la distribución:
• Leptocúrtica: la Curtosis>0. Los datos están muy concentrados en la

media, siendo una curva muy apuntada.
• Mesocúrtica: la Curtosis=0. Distribución normal.
• Platicúrtica: la Curtosis<0. Muy poca concentración de datos en la

media, presentando una forma muy achatada.
Para obtener los estadísticos con SPSS se usa el menú Analizar/Estadísticos

descriptivos/Descriptivo luego selecciona la variable o variables de interés y
después en Opciones puede escoger los estadísticos que sean de su interés.
Otra opción con la cual se puede obtener todos los estadísticos e incluir en forma
adicional los percentiles debe ingresar al menú Analizar/Estadísticos
descriptivos/Frecuencias y entrar en la opción Estadísticos en donde se
seleccionan los estadísticos más los percentiles deseados.
Como ejemplo se va a trabajar con el archivo ambiente.sav (entregado

previamente) y se realizará el análisis para la variable sulfato.
• Ingrese en el menú Analizar/Estadísticos descriptivos/Frecuencias y
•
desactive la opción mostrar tabla de frecuencias
Pase la variable sulfato en la tierra a la casilla de variables y de clic en
la opción estadísticos y señale los estadísticos de su interés.

Docente UPS
Docente UPS
• De clic en continuar y luego debe escoger la opción de Gráficos, y pulsar
sobre Histogramas y en el casillero Mostrar curva normal en el
histograma, de clic en continuar y luego en aceptar

Docente UPS
Los resultados obtenidos son:
Estadísticos
Sulfato en la tierra
N Válido 15
Perdidos 0
Media 3.125580
Mediana 2.925800
Moda .4614a
Desviación estándar 2.1521373
Varianza 4,632
Asimetría ,918
Error estándar de asimetría ,580
Curtosis ,495
Error estándar de curtosis 1,121
Rango 7.1515
Mínimo .4614
Máximo 7.6129
Suma 46.8837
Percentiles 25 1.178700
50 2.925800
75 3.824500
a. Existen múltiples modos. Se muestra el valor

más pequeño.

Docente UPS
Ejercicio 8
1.De la base de datos entregada de SPSS del INEC

(INEC_BDD_MODULO_AMBIENTAL_2015)
2. Realice dos análisis de los estadísticos; la primera de frecuencias con la variable:

A04A (PRINCIPALMENTE, en su hogar durante los ÚLTIMOS 12 MESES, cómo
eliminó los Residuos Orgánicos). Y la segunda salida para una variable numérica
A07A (Cuantos focos tiene en total en su hogar).
3. Interprete los resultados y guárdelos en una carpeta comprimida con el nombre

eje8un1.
12. Representación gráfica de variables
El uso de gráficos es muy necesario en Estadística, estos pretenden resumir la

información en forma gráfica con fines clarificadores o para enfatizar y descubrir
determinadas características que de otra forma sería muy difícil de apreciar. Un
gráfico es más fácil de entender que un conjunto de estadísticos.
Los gráficos para representar variables discretas o categóricas son diferentes de

los que se utilizan para representar variables continuas por lo que separaremos
su estudio.
12.1 Gráficos de variables discretas y categóricas
Los gráficos más utilizados en estadística para representar variables discretas o

categóricas son los gráficos de sectores y los diagramas de barras.
12.1.1 Gráficos de pastel o sectores.
Un gráfico de sectores consiste en un círculo dividido en sectores de tamaño

proporcional a la frecuencia de cada valor de la variable. Se utilizan cuando hay
pocos valores que representar (máximo de 7).
Para obtener un gráfico de sectores con SPSS usaremos el menú

Gráficos/Cuadro de diálogo antiguos/Gráficos circulares y seleccionaremos
una o varias variables apareciendo el cuadro de diálogo siguiente:

Docente UPS
• Resúmenes para distintas variables
Permite que los sectores representen variables en lugar de grupos de casos.

Cada sector representa una función de una determinada variable (por
ejemplo, la suma de los valores de sus casos).
Por ejemplo, las puntuaciones de 10 alumnos en tres exámenes han sido las
siguientes:

Docente UPS
Se puede representar gráficamente con un diagrama de sectores la suma de
las puntuaciones en estos tres exámenes para ver si difieren mucho y para
ver qué examen tuvo la mayor puntuación relativa. Para ello, después de
introducir los datos en SPSS y elegir la opción resumen para distintas
variables, se puede obtener un gráfico de sectores, se observa, por ejemplo,
que la suma de las puntuaciones en el Ex1 es de 69,20 y que representan un
35,2% de la suma de todas las puntuaciones (es decir su puntuación relativa).
• Ingrese en el menú la opción Gráficos/Cuadros de diálogo
•
antiguos/Circular.
•
Selecciones la opción Resúmenes para distintas variables
Pase las tres variables a la casilla Las porciones representan.

Docente UPS
El resultado es:
• Para observar la suma de las variables, damos un doble clic sobre el

gráfico y se visualiza la ventana del editor de gráficos, luego damos
clic derecho y pulsamos sobre el botón Mostrar etiquetas de datos.

Docente UPS
•
•
Aparece la siguiente ventana
Ubíquese sobre la palabra Porcentaje, y pulsamos sobre la flecha
•
verde que permite pasar a la ventana Mostrado.
Y de clic en aplicar.

Docente UPS
El resultado es:
• Resúmenes para grupos de casos
Genera un gráfico en el que cada sector corresponde a un valor de la variable

seleccionada. El tamaño del sector se determina por la opción Los sectores
representan, esta opción aparece en el cuadro de diálogo que surge después
de dar clic en definir del cuadro de dialogo de resumen para cuadros de diálogos
de gráficos de sectores.
Por ejemplo, supongamos que queremos representar del archivo de

ambiente.sav los valores de la variable provin en un diagrama de sectores
donde los sectores representan el número de casos de cada provincia. El gráfico
de sectores podría ser así:

Docente UPS
• De clic en aceptar y puede colocar etiqueta de datos siguiendo el mismo
•
procedimiento anterior.
El resultado es:
• Valores individuales de los casos
Se resume una única variable.

Docente UPS
Genere un gráfico lineal para la variable sulfato del archivo ambiente.sav:

Docente UPS
•
•
Pase la variable a graficar al cuadro de diálogo la línea representa.
y de clic en aceptar
El resultado es:

Docente UPS
12.2 Gráficos de variables continuas
Básicamente se utilizan dos tipos de gráficos para las representaciones de una

única variable continua: Histogramas y Diagramas de caja.
12.2.1 Histogramas
Parecidos en forma a los diagramas de barras, pero atención: su uso se restringe

únicamente a las variables continuas. Los histogramas representan frecuencias
agrupadas de una variable continua sobre intervalos. A diferencia de los
diagramas de barras, los histogramas dibujan rectángulos unidos entre sí, lo que
significa que existe una continuidad en la variable cuyos valores se representan
en el eje horizontal. El eje horizontal se halla dividido en intervalos de igual
amplitud (SPSS no permite alterar esta propiedad), sobre los que se elevan
rectángulos de altura proporcional a su frecuencia. Por lo tanto, las áreas de los
rectángulos son proporcionales a las frecuencias que representan. Los
histogramas se pueden editar, lo que permite alterar el número de clases, su
amplitud, etc. La gráfica de un histograma puede ser muy distinta para los
mismos datos, simplemente variando el número de clases, por lo que la elección
del número de clases debe hacerse con cuidado, también se puede superponer
una curva normal con media y desviación estándar coincidentes con las de la
muestra para ver su parecido.
Para obtener un histograma con SPSS se utilizan los menús Gráficos/Cuadro

de diálogo antiguos/Histograma. Con éste último menú podemos obtener el
histograma de frecuencias.
Genere un gráfico lineal para la variable sulfato del archivo ambiente.sav:

Docente UPS
• Pase la variable sulfato en la tierra al cuadro de diálogo variable y de clic
•
en aceptar.
Active la casilla Mostrar curva normal
El resultado es el siguiente:

Docente UPS
• Dando clic derecho en el gráfico puede modificar el gráfico dando clic en
•
editar contenido
Puede cambiare el número de intervalos según sea su interés por ejemplo
colocamos la opción de 5 intervalos dando clic en la opción de ocultar
etiqueta de datos y luego clic en agrupaciones/personalizado/número
de intervalos y damos clic en aplicar

Docente UPS
• El resultado es:

Docente UPS
12.2.2 Diagramas de caja
A diferencia de los otros gráficos ya vistos, los diagramas de caja hacen énfasis
en las medidas de posición. Es muy útil para hacer comparaciones entre
muestras de distintas poblaciones.
Un diagrama de caja consiste en un rectángulo cuya longitud es el rango

intercuartílico, dividido por un segmento a la altura de la mediana y
complementado por dos líneas (llamadas bigotes) que parten de los extremos
del rectángulo, cuya longitud no supera 1,5 veces el rango intercuartílico y que
intentan alcanzar los valores mínimo y máximo observados. Para obtener un
diagrama de caja con SPSS se selecciona el menú Gráficos/Cuadro de diálogo
antiguos/Diagrama de cajas.
Pulse la opción en simples y resúmenes para grupos de casos y en definir,

en el argumento variable colocamos la variable numérica para nuestro ejemplo
del archivo ambiente.sav pasamos la variable ph en la zona y en el Eje de
categorías debemos colocar la variable por la cual se va a segmentar en este
caso provincia y de clic en aceptar
Docente UPS
El resultado es:

Docente UPS
En el gráfico, cada provincia está representada por una caja que muestra los
niveles de ph. Se puede observar diferencias en cuanto la situación de la
mediana y a la dispersión. Por ejemplo, se observa que en Valencia los niveles
de ph., son superiores a los de Castellón y que presentan una ligera mayor
dispersión. Los casos extremos si los hay se representan por símbolos
especiales a cuyo lado aparece el número de caso.
También nos da idea de la simetría de los datos, por ejemplo, una mediana
descentrada dentro del rectángulo nos indicaría una asimetría. En este ejemplo
podemos decir que las distribuciones no son lo suficientemente simétricas. El
diagrama de cajas puede ser editado para su modificación, haciendo doble clic
sobre sus elementos. Se puede alterar título, pie, anotaciones, leyenda y los
valores y etiquetas de los ejes; las líneas como los ejes, las líneas de referencia
y los bordes, la escala, el relleno y trama de la caja y los casos atípicos y
extremos.
Ejercicio 9
CON EL ARCHIVO p1coches.sav entregado previamente, realice lo siguiente:
1.Calcule la moda, mediana, asimetría y curtuosis del consumo de todos los coches.
2.Calcule el consumo medio y la mediana de los coches de 4 cilindros.
3.Construya un diagrama de cajas que sirva para comparar los consumos de cada
tipo de coche dependiendo de su número de cilindros.
4.Construya un histograma del peso de los coches. Superponga una curva normal.
5.Construya un diagrama de cajas para comparar las cilindradas de los coches

según el origen del coche.
6.Construya un diagrama de barras de la potencia media (en CV) de los coches

según su origen.
7. Construya un gráfico de sectores para ver las proporciones de coches en la

muestra según su origen.
8.Guarde en una carpeta con el nombre eje9un1.

Docente UPS
13. Generación de tablas de contingencia
La tabla de contingencia es utilizada para realizar el cruce entre dos variables

categóricas y determinar el número de casos existentes en cada cruce, para
ello se utilizará el archivo Dato de empleados entregado previamente.
• Para generar la tabla debe ingresar en el menú Analizar/Estadísticos
•
descriptivos/Tablas cruzadas.
Se debe trasladar tanto a la fila como a la columna variables
categóricas, para el ejemplo las variables sexo a la fila y categoría
•
laboral catlab a la columna.
Activar la casilla Mostrar los gráficos de barras agrupadas. Y de clic en
Aceptar.

Docente UPS
El resultado es:
Resumen de procesamiento de casos
Casos
Válido Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
Sexo * Categoría laboral 474 100,0% 0 0,0% 474 100,0%
Sexo*Categoría laboral tabulación cruzada

Recuento
Categoría laboral
Administrativo Seguridad Directivo Total
Sexo Hombre 157 27 74 258
Mujer 206 0 10 216

Total 363 27 84 474

Docente UPS
• Para ver los resultados de forma porcentual, pulsamos sobre el botón
Casillas.
• Y en la siguiente ventana activar la opción Total.
• De clic en continuar y luego aceptar

Docente UPS
Sexo*Categoría laboral tabulación cruzada
Categoría laboral
Administrativo Seguridad Directivo Total
Sexo Hombre Recuento 157 27 74 258
% del total 33,1% 5,7% 15,6% 54,4%

Mujer Recuento 206 0 10 216
% del total 43,5% 0,0% 2,1% 45,6%

Total Recuento 363 27 84 474
% del total 76,6% 5,7% 17,7% 100,0%
Lo que nos indica por ejemplo que en este archivo del 100% de personas
encuestadas el 54,4% son hombres y el 45,6% mujeres.
Otra forma de presentar las tablas segmentadas es utilizar la opción: CAPA

1de 1 para ello pasar la variable Clasificación de minorías a la tercera ventana.

Docente UPS
El resultado es:
Sexo*Categoría laboral*Clasificación de minorías tabulación cruzada
Categoría laboral
Clasificación de minorías Administrativo Seguridad Directivo Total
No Sexo Hombre Recuento 110 14 70 194
% del total 29,7% 3,8% 18,9% 52,4%
% del total 44,9% 0,0% 2,7% 47,6%
% del total 74,6% 3,8% 21,6% 100,0%

Sí Sexo Hombre Recuento 47 13 4 64
% del total 45,2% 12,5% 3,8% 61,5%
% del total 38,5% 0,0% 0,0% 38,5%
% del total 83,7% 12,5% 3,8% 100,0%
Total Sexo Hombre Recuento 157 27 74 258
% del total 33,1% 5,7% 15,6% 54,4%
% del total 43,5% 0,0% 2,1% 45,6%
% del total 76,6% 5,7% 17,7% 100,0%

Docente UPS
Docente UPS
Ahora que ha logrado generar la tabla de contingencia puede surgir la siguiente
inquietud, generar el mismo reporte pero sólo las personas que tienen sueldos
anuales mayores a 20.000 USD, por lo que ahora veremos cómo se seleccionan
los casos:
• Vamos al menú DATOS y escogemos SELECCIONAR CASOS.
• Y escoja la segunda opción:

Docente UPS
• Pase la variable salario actual al cuadro y luego ingresar el símbolo
mayor que > y por el teclado el número 20000, de clic en continuar y
luego aceptar.
• Luego vuelva a generar la tabla de contingencia.

Docente UPS
El resultado es:
AHORA SE TRABAJARÁ CON 441 DATOS FILTRADOS.

Resumen de procesamiento de casos
Casos
Válido Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
Sexo * Categoría laboral *

441 100,0% 0 0,0% 441 100,0%
Clasificación de minorías
Sexo*Categoría laboral*Clasificación de minorías tabulación cruzada
Categoría laboral
Clasificación de minorías Administrativo Seguridad Directivo Total
No Sexo Hombre Recuento 110 14 70 194
% del total 31,6% 4,0% 20,1% 55,7%
% del total 41,4% 0,0% 2,9% 44,3%
% del total 73,0% 4,0% 23,0% 100,0%

Sí Sexo Hombre Recuento 46 13 4 63
% del total 49,5% 14,0% 4,3% 67,7%
% del total 32,3% 0,0% 0,0% 32,3%
% del total 81,7% 14,0% 4,3% 100,0%
Total Sexo Hombre Recuento 156 27 74 257
% del total 35,4% 6,1% 16,8% 58,3%
% del total 39,5% 0,0% 2,3% 41,7%
% del total 74,8% 6,1% 19,0% 100,0%

Docente UPS
14. Generación de tablas personalizadas
La tabla personalizada es otra forma de generar un cruce de variables pero se

puede aumentar una o más variables numéricas, así por ejemplo, en el archivo
Dato de empleados, ubicarse en la opción Analizar / Tablas / Tablas
personalizadas:
Saldrá el siguiente mensaje:

Docente UPS
Debe dar clic en aceptar siempre y cuando estén correctas las medidas de cada
variable, esto es por ejemplo las variables numéricas deben ser su medida
escalar y las variables que clasifican por ejemplo nominal, esta información las
pueden ver en la ficha vista de variables.

Docente UPS
Arrastre hacia la fila o la columna las variables categóricas por ejemplo sexo a
la fila y lo soltamos.
Si la visualización es sólo el campo sexo, es porque esta pulsado el botón

compacta y puedes pulsar el botón Normal estas dos opciones son formas de
visualizar los datos en general la regla dice:
Compacta : sólo se ve el nombre de la variable.

Normal : se ve el contenido de la variable.

Docente UPS
• Arrastre una variable numérica salario actual junto a la variable sexo.
• Ahora puede aumentar la variable categoría laboral (catlab) al
segmento columnas:
Y el resultado es:
Categoría laboral
Administrativo Seguridad Directivo
Media Media Media
Sexo Hombre Salario actual $31,558 $30,939 $66,243
Mujer Salario actual $25,004 . $47,214
Si deseamos obtener otros estadísticos, debemos ubicarnos sobre el campo

salario actual y debemos pulsar sobre estadísticos de resumen.
• Pasar a la ventana Visualización los estadísticos que se desea calcular,

por ejemplo, el máximo o el mínimo.
• De clic en aplicar a la selección y luego aceptar
Docente UPS
El resultado es:

Docente UPS
Ejercicio 10
1.Del archivo mundo.sav arme una tabla de contingencias con la variable relig
(religión) y región expresar los resultados en valores absolutos y en otra salida en
formato porcentual.
2.Genere una tabla personalizada colocando en la fila la relig(religión) y en la
columna la región y como variable numérica utilizar poblac con los estadígrafos
media, mediana, máximo y mínimo.
3.Genere otro archivo y realizar el mismo trabajo anterior pero seleccionar
previamente en el archivo en base a la variable tasa_nat los casos que sean mayores
a 25.
4.Guarde los archivos de resultados en una carpeta con el nombre eje10un1
Introducción al diseño de una muestra aleatoria.
En este apartado consideraremos la generación de una muestra de una

población con distribución conocida, pero de la que no disponemos de datos. Por
ejemplo, de una población con distribución Normal de media 20 y desviación
típica 5 vamos a generar 40 datos.
En primer lugar, necesitamos crear un nuevo banco de datos

Archivo/Nuevo/Datos.

Docente UPS
SPSS genera los datos de una determinada distribución y los sitúa en una
columna con la longitud que tenga el banco de datos; es decir, el número de filas
con datos que aparezcan en el Editor de datos. Dado que acaba de crear el
fichero, no contendrá ningún dato, por lo que la primera operación a realizar será
el rellenar la primera columna con datos.
Para ello basta con que nos situemos en la casilla correspondiente a la columna
1, fila 40 e insertemos el número 40.
Seleccionamos en el menú Transformar/Calcular y nos aparece la ventana de

calcular variables.

Docente UPS
En el campo Variable de destino, escriba m1 como nombre de la variable que
va a crear. De la ventana Grupo de funciones elija la opción de Números
aleatorios y de la ventana Funciones y variables especiales seleccione una
de las funciones que nos ofrece el SPSS, para este caso seleccione
RV.NORMAL (media,desv_típ) y pase la función a la ventana de Expresión
numérica.
Entonces en lugar de media y desv_típ aparecen unos interrogantes, que

sustituiremos por los valores de la media y la desviación estándar o típica de la
distribución normal de la que pretendemos simular una muestra, en este caso,
media=20, s(desviación)=5.
Se activa, entonces, el botón Aceptar, y al pulsarlo, el SPSS genera una muestra

que añade en la primera columna libre del editor de datos.

Docente UPS
La siguiente tabla muestra algunas de las funciones que proporcionan un valor
aleatorio de una distribución determinada. Los argumentos son los parámetros
de la distribución. Pueden consultar la ayuda del SPSS para obtener una lista
exhaustiva de todas las funciones disponibles.
Expresión Descripción
RV.UNIFORM(mín,máx) Devuelve un valor aleatorio de la
distribución uniforme, con el mínimo y el
máximo especificados.
RV.NORMAL(media,desv_típ) Devuelve un valor aleatorio de la
distribución normal, con la media y la
desviación típica especificadas.
RV.GAMMA(forma,escala) Devuelve un valor aleatorio de la
distribución Gamma, con los parámetros
de forma y escala especificados.
RV.CHISQ(gl) Devuelve un valor aleatorio de la
distribución de chi cuadrado, con los
grados de libertad gl especificados.
RV.EXP(forma) Devuelve un valor aleatorio de una
distribución exponencial, con el
parámetro de forma especificado.
RV.WEIBULL(a,b) Devuelve un valor aleatorio de la
distribución de Weibull, con los
parámetros especificados.
RV.BETA(forma1,forma2) Devuelve un valor aleatorio de una
distribución Beta, con los parámetros de
forma especificados.
RV.T(gl) Devuelve un valor aleatorio de la
distribución t de Student, con los grados
de libertad gl especificados.
Ejercicio 11:
1.Generar muestras de tamaño 40 para las distribuciones continuas siguientes:

Uniforme (3,5) y Normal (3, 1.5)
2.Guarde el archivo con el nombre eje11un1
Docente UPS
15. Generación de los reportes estadísticos en base a intervalos de
confianza.
En base a los datos de ventas de un mes de marzo presentado ver tabla adjunta),
se desea generar 20 datos aleatorios para pronosticar un mes a futuro.
(RECUERDE QUE ESTAMOS EN MARZO Y EL OBJETIVO ES POR MEDIO
DE LA FUNCIÓN RV.NORMAL GENERAR LAS POSIBLES VENTAS DE
JUNIO).
Datos del mes de marzo:
Primero debemos ingresar los datos al SPSS.

Docente UPS
• Ahora debe obtener el promedio y la desviación de la variable ventas, en
el menú principal vaya a Analizar/Estadísticos
•
descriptivos/Frecuencias.
Pase la variable ventas al cuadro de dialogo Variables y de clic en
•
estadísticos.
Señale desviación típica y media, de clic en continuar.

Docente UPS
El resultado es:
Estadísticos
ventas
N Válido 20
Perdidos 0
Media 82,1000
Desviación estándar 12,42620
Con estos resultados genere los 20 números aleatorios con la función rv.normal:
•
•
En el menú principal vaya a Transformar/Calcular variable.
Coloque el nombre de la variable: aleatorio y luego en el cuadro
grupo de funciones seleccione la opción Números aleatorios y
escoja la opción Rv.Normal, pase a la ventana de Expresión
numérica e ingrese los valores correspondiente media= 82.10 y
desviación estándar=12.4262, al darle clic en aceptar se genera los
20 números aleatorios, si en caso no pasa dicha ventana es porque el
separador de los valores ingresados no es el punto sino la coma.

Docente UPS
Docente UPS
Los valores aleatorios que se obtiene en la anterior pantalla NO lo van a tener
usted ya que son aleatorios, Con estos datos pronosticados podemos generar
el reporte exploratorio.
16. Determinación de valores atípicos
•
•
Debe ingresar en el menú Analizar/Estadísticos descriptivos/Explorar.
En Lista de dependientes, pasamos una variable numérica para nuestro
caso VENTAS, y en la Lista de factores una variable que segmenta para
•
nuestro caso SEMANA.
Luego pulsamos en el botón Estadísticos y activamos las opciones
Descriptivos y Valores atípicos.

Docente UPS
El resultado es:
Descriptivos
semana Estadístico Error estándar
ventas semana 1 Media 81,0000 4,69042
95% de intervalo de Límite inferior 67,9773

confianza para la media Límite superior 94,0227
Media recortada al 5% 80,9444
Mediana 80,0000
Varianza 110,000
Mínimo 67,00

Docente UPS
Máximo 96,00
Rango 29,00
Rango intercuartil 17,50
Asimetría ,228 ,913
Curtosis 1,215 2,000
semana 2 Media 70,0000 4,83735

Mediana 70,0000
Varianza 117,000
Mínimo 57,00
Máximo 85,00
Rango 28,00
Curtosis -,493 2,000
semana 3 Media 81,2000 3,76032

Mediana 80,0000
Varianza 70,700
Mínimo 69,00
Máximo 92,00
Rango 23,00
Asimetría -,354 ,913
Curtosis ,995 2,000
semana 4 Media 96,2000 ,58310

Mediana 96,0000
Varianza 1,700

Docente UPS
Mínimo 95,00
Máximo 98,00
Rango 3,00
Curtosis -1,488 2,000
La tabla de valores atípicos es:
Valores extremosa
Número del
semana caso Valor
ventas semana 1 Mayor 1 4 96,00
2 5 84,00
Menor 1 1 67,00
2 2 78,00
semana 2 Mayor 1 10 85,00
2 9 75,00
Menor 1 6 57,00
2 7 63,00
2 12 85,00
Menor 1 11 69,00
2 14 80,00b
2 19 97,00
Menor 1 20 95,00
2 16 95,00
a. El número solicitado de valores extremos excede el número de puntos

de datos. Se visualiza un número menor de extremos.
b. Sólo se muestra una lista parcial de casos con el valor 80,00 en la tabla
de extremos inferiores.

Docente UPS
17. Generación de diagramas de caja
• En el menú vaya a Analizar/Estadísticos descriptivos/Explorar.

• Pulse sobre la opción Gráficos y verificamos que este escogido la
opción Niveles de los factores juntos.
• De clic en continuar y luego en aceptar.

Docente UPS
El resultado es:

Docente UPS
La lectura se da en función de la caja que se encuentra más arriba de las demás
nos dice cuál es la semana de mayor venta, para este ejemplo la semana cuatro,
mientras que la caja más alta nos indica la de mayor dispersión para este ejemplo
la semana dos, y los círculos representan los valores atípicos y el valor es el
número de caso al que pertenece en cada semana por ejemplo en la semana
tres un valor atípico es el caso 11 o en la semana uno el caso 1 y 4, nos indica
que es un valor muy pequeño o muy grande con respecto al resto.
Ejercicio 12:
1.Enviar el archivo de datos como el de resultado de esta práctica con el nombre

eje12un1

Docente UPS

Unidad 1 Manejo Del SPSS y Estadisticos

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Unidad 1 Manejo Del SPSS y Estadisticos

Cargado por

Copyright:

Formatos disponibles

UNIDAD 1

MANEJO DEL SPSS Y ESTADÍSTICOS DESCRIPTIVOS

Jorge Antonio Pérez

El programa SPSS para Windows es una versión para ordenadores personales

El programa trabaja con 3 tipos de archivos:

Seleccionamos la opción de SPSS desde el icono del programa de su

Así se abre la siguiente ventana con diferentes opciones.

Jorge Antonio Pérez

La parte inferior de la pantalla indica la barra de estado en la que hay

En la parte superior aparece la barra de menú. Al situar el puntero del ratón

Archivo: Crear, abrir o grabar los diferentes archivos de SPSS, mostrar

Edición: Deshacer, borrar, copiar, cortar, pegar, insertar variable, buscar,

Jorge Antonio Pérez

Datos: Definir propiedades de variables, Definir fechas, Definir conjunto de

Transformar: Modificación, edición y generación de nuevas variables.

Las funciones de Datos y Transformar son temporales y sólo están vigentes

Analizar: Permite realizar análisis estadísticos mediante los comandos

Marketing Directo: comprender los contactos, mejorar mis campañas de

Gráficos: Edición y generación de diversos tipos de gráficas de alta resolución.

Utilidades: Cambiar fuentes, información sobre archivos.

Ventana: Funciones habituales para controlar las ventanas. Se visualiza las

3. Definición de los datos

Antes de empezar el análisis de los datos es conveniente, siempre, prepararlos

Los archivos de datos, habitualmente, toman la forma de una matriz en la que

En el programa SPSS cada fila representa un caso. En las columnas de dicha

Jorge Antonio Pérez

Para abrir un archivo de datos seguimos el siguiente procedimiento:

Archivo/Abrir/Datos y se busque el archivo que se requiera, para esta práctica

Observe como se modifica la variable REGIÓN de un valor numérico a uno

Jorge Antonio Pérez

Antes de trabajar con un archivo de datos es de primordial importancia definir

La definición de una variable se basa en las opciones siguientes:

• Asignar un Nombre: a cada variable, cumpliendo las siguientes reglas:

Jorge Antonio Pérez

Si no escogemos ninguna de las opciones anteriores, el sistema las asigna

Haga clic sobre el recuadro derecho en la celda correspondiente al Tipo en la

• Asignar una Etiqueta: a cada variable de no más de 120 caracteres

Jorge Antonio Pérez

Ubíquese en el campo correspondiente a Valores de la variable clima y

• Definir Perdidos: permite definir los valores de los datos especificados

Colóquese en el campo correspondiente a Perdidos de cualquier variable y de

Jorge Antonio Pérez

• Definir Columnas: consiste en especificar la amplitud de la columna.

• Definir Alineación: seleccionar la justificación de las entradas de la

• Especificar medida. Se puede seleccionar uno de los tres niveles de

Jorge Antonio Pérez

Para abrir un archivo nuevo de datos de SPSS debe seleccionar el menú de

• Si ya está en el editor de datos vacío, no hace falta.

• Si, previamente, tenía abierto otro archivo de datos, por ejemplo

• Debe definir las variables adecuadamente (Vista de variables) de forma

1.Defina las variables con el nombre indicado, el tipo y formato convenientes.

Jorge Antonio Pérez

La edición de datos en SPSS contiene comandos para: cortar, copiar, pegar,

Para los dos ítems anteriores, nos situamos en el individuo 5° y 3°

3.Modificar el valor de la variable telef del 4º entrevistado, por su número de celular

Jorge Antonio Pérez

Una vez elaborado el archivo de datos, y previo al análisis estadístico es posible

Abra el archivo de datos Ambiente entregado previamente; este archivo recoge

Jorge Antonio Pérez

Dando click sobre el nombre de la función, aparece su descripción. El

Es importante tener cuidado con el orden de utilización de los operadores y no

El botón Si la opción permite realizar modificaciones similares, pero sujetas a

Jorge Antonio Pérez