Está en la página 1de 90

UNIDAD 1

MANEJO DEL SPSS Y ESTADÍSTICOS DESCRIPTIVOS

Objetivo.-

Al finalizar esta unidad del curso de SPSS, usted estará en capacidad de manejar
el editor de datos, ingresar, transformar y filtrar variables, así como fundir e
importar archivos de datos, generar reportes descriptivos, representaciones
graficas de variables, construir tablas de contingencia y realizar un análisis
exploratorio

Contenidos:

1. Aspectos técnicos
2. Entrar al programa
3. Definición de datos
4. Introducción y edición de datos
5. Transformación de una variable
6. Recodificación de una variable
7. Filtrado de datos
8. Fundir archivos
9. Importar datos
10. Tablas de frecuencias
11. Estadísticos
12. Representación gráfica de variables.
13. Generación de tablas de contingencia.
14. Generación de tablas personalizadas.
15. Generación de reportes estadísticos en base a intervalos de confianza
16. Determinación de valores atípicos
17. Generación de diagramas de caja

Jorge Antonio Pérez


Docente UPS
1. Aspectos técnicos

El programa SPSS para Windows es una versión para ordenadores personales


del paquete estadístico SPSS (Statistical Package for Social Sciences).

El programa trabaja con 3 tipos de archivos:



archivos de datos propios de SPSS. .sav


archivos de gráficos y resultados de SPSS. .spv
archivos de sintaxis de SPSS. .sps

Además, permite importar archivos creados con otras aplicaciones: Excel, Lotus,
Dbase, entre otras y exportar archivos de datos y gráficos.

2. Entrar al programa

Seleccionamos la opción de SPSS desde el icono del programa de su


computador.

Así se abre la siguiente ventana con diferentes opciones.

Jorge Antonio Pérez


Docente UPS
Seleccionamos la opción de nuevo conjunto de datos y damos clic en Aceptar,
desplegándose la siguiente ventana.

La parte inferior de la pantalla indica la barra de estado en la que hay


información sobre el procesador de SPSS (IBM SPSS Statistic Processor está
listo); así como dos pestañas que permiten seleccionar "vista de datos" o "vista
de variables".

En la parte superior aparece la barra de menú. Al situar el puntero del ratón


sobre cualquiera de sus elementos, aparece información sobre las operaciones
que podemos realizar:

Archivo: Crear, abrir o grabar los diferentes archivos de SPSS, mostrar


información de datos, imprimir, acceso directo a los últimos archivos abiertos,
salir del SPSS.

Edición: Deshacer, borrar, copiar, cortar, pegar, insertar variable, buscar,


opciones.

Jorge Antonio Pérez


Docente UPS
Ver: Barra de estado, Barras de herramientas, Fuentes, Lineas de cuadrícula,
Etiquetas de valor, Personalizar vista de variables.

Datos: Definir propiedades de variables, Definir fechas, Definir conjunto de


respuestas múltiples y efectuar modificaciones en el archivo de datos como:
seleccionar, añadir, ponderar, ordenar, ir al caso, etc.

Transformar: Modificación, edición y generación de nuevas variables.

Las funciones de Datos y Transformar son temporales y sólo están vigentes


durante la sesión sin que afecten al archivo original de datos. Si queremos que
sean permanentes debemos guardar los cambios.

Analizar: Permite realizar análisis estadísticos mediante los comandos


instalados.

Marketing Directo: comprender los contactos, mejorar mis campañas de


marketing

Gráficos: Edición y generación de diversos tipos de gráficas de alta resolución.

Utilidades: Cambiar fuentes, información sobre archivos.

Ventana: Funciones habituales para controlar las ventanas. Se visualiza las


siguientes ventanas:



Edición de datos de SPSS (Ventana principal con los menús)
Visor de SPSS (entrega de resultados)

Ayuda: Formato de Windows que permite obtener alguna ayuda del programa.

3. Definición de los datos

Antes de empezar el análisis de los datos es conveniente, siempre, prepararlos


para su mejor manejo e interpretación.

Los archivos de datos, habitualmente, toman la forma de una matriz en la que


cada fila representa los valores que un individuo determinado o caso tiene para
las diferentes variables.

En el programa SPSS cada fila representa un caso. En las columnas de dicha


matriz aparecen los diferentes valores que una variable determinada toma para
cada uno de los individuos de ese grupo o casos.

Jorge Antonio Pérez


Docente UPS
3.1 Apertura de datos

Para abrir un archivo de datos seguimos el siguiente procedimiento:

Archivo/Abrir/Datos y se busque el archivo que se requiera, para esta práctica


abrimos el archivo MUNDO previamente entregado, con lo cual aparecerá la
siguiente ventana:

Observe como se modifica la variable REGIÓN de un valor numérico a uno


nominal cuando se da clic en la opción de etiquetas de valor que se encuentra
debajo del menú principal.

Obteniendo lo siguiente:

Jorge Antonio Pérez


Docente UPS
3.2 Definición de Variables

Antes de trabajar con un archivo de datos es de primordial importancia definir


las variables. Para esto debemos hacer clic en la barra inferior en la opción de
vista de variables.

Para revisar esta opción se analizará cómo están definidas las variables del
archivo MUNDO, seleccionando la opción de vista de variables se obtiene:

Observe que hay una fila para cada variable y que existen columnas: Nombre,
Tipo, Anchura, Decimales, Etiqueta, Valores, Perdidos, Columnas, Alineación,
Medida, Rol.

La definición de una variable se basa en las opciones siguientes:

• Asignar un Nombre: a cada variable, cumpliendo las siguientes reglas:


- Nombres que inicien con una letra o @ al inicio.
- No utilizar símbolos como &, /, $, etc.
- No utilizar nunca espacios en blanco.
- No utilizar expresiones como: ALL, AND, BY, EQ, GE, GT, LE, NE,
NOT, OR, TO, o WITH.

Jorge Antonio Pérez


Docente UPS
• Asignar un Tipo: a cada variable, indicando el máximo número de dígitos
que deseamos para anotar las observaciones de la variable y el tipo de la
variable con la que vamos a trabajar, alfanumérica, fecha, moneda o
numérica, indicando en este caso el número de cifras decimales con que
queremos que aparezca en el editor.
- Numéricas: formato numérico estándar
- Coma: comas de separación cada tres posiciones. Un punto para la
parte decimal.
- Punto: al contrario que el anterior.
- Notación Científica: uso de la E para exponente. Ejemplo 2,34E2
- Cadena: variable alfanumérica. (de más de 8 caracteres se considera
larga).
- Además están los formatos de fecha, dólar y moneda personalizada.

Si no escogemos ninguna de las opciones anteriores, el sistema las asigna


automáticamente, siendo el formato por defecto: Numérica 8.2 que significa:
Anchura: 8 y Decimales: 2, es decir, una amplitud de columna de 8 espacios,
siendo los 2 últimos para decimales.

Haga clic sobre el recuadro derecho en la celda correspondiente al Tipo en la


variable densidad y observe estas posibilidades. Adicional analice los formatos
permitidos para Fecha, Dólar, Moneda personalizada y Cadena.

• Asignar una Etiqueta: a cada variable de no más de 120 caracteres


(entre 30 y 40 es el valor recomendado) que nos permita tener más
información sobre esa variable.

Jorge Antonio Pérez


Docente UPS
• Asignar Valores: se trata de asignar etiquetas a los valores de cada
variable. No es obligatorio, pero sí muy útil en algunos casos.

Ubíquese en el campo correspondiente a Valores de la variable clima y


haga clic en el recuadro derecho y analice los valores.

• Definir Perdidos: permite definir los valores de los datos especificados


como perdidos por el usuario. A menudo es útil para saber por qué se
pierde información. Por ejemplo, puede distinguir el dato perdido
correspondiente a un entrevistado que se niega a responder, del dato
perdido debido a que la pregunta no afectaba a dicho entrevistado. Los
valores de datos especificados como perdidos por el usuario aparecen
marcados para un tratamiento especial y se excluyen de la mayoría de los
cálculos.

Colóquese en el campo correspondiente a Perdidos de cualquier variable y de


clic sobre el recuadro derecho y aparece:

Jorge Antonio Pérez


Docente UPS
Los códigos asignados a los valores ausentes deben de ser coherentes con el
tipo de variables declarado: Numéricos para las numéricas y alfanuméricos para
las alfanuméricas (máximo 9 caracteres). Se pueden introducir hasta 3 valores
perdidos (individuales) de tipo discreto, un rango de valores perdidos o un rango
más un valor de tipo discreto. Sólo pueden especificarse rangos para las
variables numéricas.

Estos valores ausentes son denominados por SPSS "valores ausentes definidos
por el usuario" (userdefined missing values), a diferencia de los definidos por el
sistema (system-missing values o sysmis). Estos últimos corresponden a los que
establece el sistema para los espacios en blanco y caracteres ilegales que pueda
haber en el archivo de datos. Aparecen en los listados representados por comas.

• Definir Columnas: consiste en especificar la amplitud de la columna.


Podemos hacerlo también desde el propio archivo de datos.

• Definir Alineación: seleccionar la justificación de las entradas de la


columna: Izquierda, Derecha y Centrado.

• Especificar medida. Se puede seleccionar uno de los tres niveles de


medida:
- Escala: los valores de datos son numéricos en una escala de intervalo.
Las variables de escala deben ser numéricas.
- Ordinal: los valores de datos representan categorías con un cierto
orden intrínseco en escala de likert (bajo, medio, alto ó totalmente de
acuerdo, de acuerdo, en desacuerdo, etc). Las variables ordinales
pueden ser de cadena o valores numéricos. Notar que, para variables
de cadena ordinales, se asume que el orden alfabético de los valores
de cadena indica el orden correcto de las categorías; en el caso de
bajo, medio y alto el orden sería alto, bajo y medio (orden que no es
correcto), por lo que es más fiable utilizar códigos numéricos para
representar datos ordinales que usar etiquetas de estos códigos.
- Nominal: los valores de datos representan categorías sin un cierto
orden intrínseco. Las variables nominales pueden ser de cadena o
valores numéricos que representan categorías diferentes, por ejemplo
1 = Hombre y 2 = Mujer.

Observe cómo han sido definidas todas las variables del archivo MUNDO.

Jorge Antonio Pérez


Docente UPS
4. Introducción y edición de los datos

Para abrir un archivo nuevo de datos de SPSS debe seleccionar el menú de

• Si ya está en el editor de datos vacío, no hace falta.


Archivo/Nuevo/Datos:

• Si, previamente, tenía abierto otro archivo de datos, por ejemplo


MUNDO.sav, y ha realizado alguna modificación de este archivo, antes
de cerrar éste y abrir uno nuevo, le preguntará si quiere guardar los
cambios realizados.

Una vez tenga la ventana del Editor de datos del SPSS abierta y vacía, lea
atentamente las siguientes instrucciones antes de introducir datos:

• Debe definir las variables adecuadamente (Vista de variables) de forma


que después podamos empezar a introducir los datos en cualquier orden


(Vista de datos).
Para introducir los datos, nos situamos en una casilla, tecleamos su valor
y pulsamos Intro o el Tabulador o nos situamos con el ratón en otra


casilla. Podemos introducir los datos por filas o columnas indistintamente.
Conviene ir actualizando el archivo con la opción Guardar Datos o con el
botón de grabar habitual en otras aplicaciones Windows. Para ello:
- Si ya lo había guardado con anterioridad, para guardar las últimas
modificaciones, seleccione la opción de Guardar dentro de
Archivo.
- Si es la primera vez que lo guarda, como todavía no le ha asignado
un nombre al archivo, seleccione la opción Guardar como ...
dentro de Archivo. Le pedirá el nombre que quiere darle al archivo,
su extensión (por defecto utilizará la extensión .sav para datos del
SPSS) y la carpeta en que quiera guardarlo.

Ejercicio1
Genere un archivo de datos en SPSS con la información que aparece a continuación.
Este archivo de datos debe recoge la información obtenida en un proyecto de
investigación mediante encuestas.
Las variables que necesita son las siguientes:
nombre: nombre del entrevistado
n_ident: número de identificación del entrevistado
genero: identifica el género del entrevistado
edad: edad en años del entrevistado
l_nacim: colocar la ciudad de nacimiento del entrevistado
telef: colocar el número de teléfono del entrevistado
Direc: colocar la dirección del entrevistado
f_encues: colocar la fecha de la entrevista

1.Defina las variables con el nombre indicado, el tipo y formato convenientes.


2.Introduzca los valores recolectados de seis personas.
3.Grabe el archivo de datos con nombre eje1uni1.sav

Jorge Antonio Pérez


Docente UPS
Una vez introducidos los datos usted puede modificarlos, ya sea para introducir
o ampliar con nuevos valores o para rectificar alguno ya introducido.

La edición de datos en SPSS contiene comandos para: cortar, copiar, pegar,


eliminar y buscar (similar a otras aplicaciones Windows), insertar variables o
casos, ir al caso, ordenar casos, y se encuentran en el menú Editar y Datos.

Ejercicio 2.

1.Insertar, entre las personas 4º y 5º, los datos correspondientes la siguiente persona:
CORREA DELGADO RAFAEL VICENTE
0908813512
Masculino
54
Guayaquil
02 382 7000
Belgica
19 de febrero del 2018

2. Insertar, entre las personas 2º y 3º, sus datos personales como un entrevistado
más:

Para los dos ítems anteriores, nos situamos en el individuo 5° y 3°


respectivamente y seleccionamos el menú Editar/Insertar caso.

3.Modificar el valor de la variable telef del 4º entrevistado, por su número de celular


si anteriormente estaba el convencional o viceversa.
4.Modificar las especificaciones (nombre, tipo y formato columna) de las variables
para que tengan la presentación que usted desee.
5.Asignar las siguientes etiquetas de variables:
n_ident número de cédula del entrevistado
l_nacim cantón de nacimiento del entrevistado
6.Asignar etiquetas de valor a las variables l_nacim y genero:
l_nacim: 0 = Cuenca, 1 = Guayaquil, 2=Quito, etc.
genero: 1 = masculino, 2 = femenino.
7.Verifique con el ícono de etiqueta de valor de la barra de herramientas, si se dan
los cambios realizados anteriormente.
8. Guardar las modificaciones en el archivo eje2uni1.sav

Jorge Antonio Pérez


Docente UPS
5. Transformación de una variable

Una vez elaborado el archivo de datos, y previo al análisis estadístico es posible


modificar los datos originales presentes en el archivo. Estos cambios pueden
referirse a las variables, a los casos, o al archivo en su conjunto. El programa
permite tanto la recodificación de los valores, así como la generación de nuevas
variables mediante transformaciones de las ya existentes. El programa SPSS
permite generar nuevas variables mediante transformaciones numéricas
efectuadas sobre las antiguas.

Abra el archivo de datos Ambiente entregado previamente; este archivo recoge


información obtenida en un proyecto de investigación ambiental en el que se
estudió los niveles de contaminación atmosférica en la Comunidad Valenciana.
Para ello se analizó observaciones aleatorias en cada provincia, midiendo en el
aire la concentración de sulfato, el pH y la presencia de un nivel elevado de
ozono. En estos datos se ha detectado un error en la medición del pH debido a
que el aparato utilizado incrementa en 0,3 unidades todas las mediciones que
realiza. Conviene generar una nueva variable que incorporara esta corrección.

Para esto elija Transformar/ Calcular variable, y realice los siguientes pasos:
- Asignar un nombre y un tipo (por defecto será numérica) a la nueva
variable en el cuadro de texto de la Variable de destino, en este caso
nuevp_ph
- Definir la Expresión numérica que va a permitir calcular los valores de la
misma. Para ello utilice los nombres de las variables del archivo (puede
escribirlos o seleccionarlos del listado que aparece), constantes,
operadores y funciones.

- Pulse Aceptar.

Jorge Antonio Pérez


Docente UPS
Para construir estas expresiones puede usarse operadores aritméticos como
+, -, *, /, ** y funciones como SQRT, EXP, LG10, LN, ARTAN, COS, SIN, ABS,
MOD10, TRUNC, RND, entre otras.

Dando click sobre el nombre de la función, aparece su descripción. El


argumento de las funciones debe ir entre paréntesis.

Es importante tener cuidado con el orden de utilización de los operadores y no


olvidar que los valores antiguos pierden su vigencia al recodificar una variable
sobre el mismo nombre.

El botón Si la opción permite realizar modificaciones similares, pero sujetas a


que se verifique una condición lógica. Se incluirán aquellos casos que verifiquen
la condición. Los que no la cumplan pasarán a ser valores ausentes definidos
por el sistema.

Jorge Antonio Pérez


Docente UPS
Por ejemplo, si queremos modificar sólo las observaciones realizadas en
Alicante, en una nueva variable nuevo_ph2, deberemos:

- Pulsar en el recuadro Si la opción


- Seleccionar Incluir si el caso satisface la condición
- Escribir la condición: provin = “1” (VA ENTRE COMILLAS PORQUE LA
VARIABLE ES TIPO CADENA)

Jorge Antonio Pérez


Docente UPS
Pulsar Continuar y en la siguiente pantalla pulsar Aceptar.

Una expresión lógica es una expresión que puede ser evaluada como verdadera
o falsa en función de los valores de las variables en ella relacionadas. El nexo
de las variables son los operadores de relación: =, >=, <=, <, > , ~= .

Es posible formar expresiones complejas, utilizando los operadores lógicos:


AND (&), OR ( | ), NOT (~).

6. Recodificación de una variable

A partir de una variable se puede crear otra cuyos valores sean una
recodificación de los de la primera. Esta recodificación podemos hacerla tanto
en la misma variable como en variables diferentes. Para ello, seleccionaremos
Transformar/Recodificar/En distintas variables... Se abre una ventana en la
que deberemos asignar un nombre (y una etiqueta si queremos) a la nueva
variable.
¡Cuidado!, si selecciona En las mismas variables ... borrará la variable original.
Jorge Antonio Pérez
Docente UPS
Recodifique la variable sulfato en una nueva variable llamada:
niv_sulf, clasificándolo en: bajo (0,3), medio [3,6), alto [6,9).

- Seleccione la variable sulfato, escriba el nuevo nombre de la Variable de


resultado “niv_sulfato”, y pulse Cambiar:

Jorge Antonio Pérez


Docente UPS
- Pulse en Valores antiguos y nuevos, Aquí especifique los valores
antiguos y sus nuevos valores. Es muy útil cuando queremos recodificar
variables cuantitativas mediante el establecimiento de intervalos. Para ello
utilizamos las posibilidades descritas en Rango:

Para especificar 0 ≤ sulfato < 3 niv_sulf = 1, escriba en rango (valores antiguos)


0 y 3, y en valor nuevo, 1, pulse añadir y realice los mismos pasos con el resto
de intervalos.

A continuación, pulsar Continuar y en la siguiente pantalla Aceptar. Observa el


contenido de la nueva variable.

Jorge Antonio Pérez


Docente UPS
Ejercicio 3.

1. Añadir, a la variable niv_sulf las etiquetas de valores para leer bajo, medio, alto
2. Recodificar la variable provin en una nueva variable cod_prov que contenga los
prefijos telefónicos de la provincia: Alicante 965, Castellón 964 y Valencia 963, como
en la siguiente ventana y luego en la vista de variables colocar el respectivo CÓDIGO,
mirar las dos siguientes ventanas.
3. Guardar en archivo como eje3un1.sav

7. Filtrado de datos

El programa SPSS permite seleccionar determinados casos para un próximo


proceso, bien temporalmente o de forma permanente, sobre la base de un criterio
lógico o de una decisión aleatoria. Para ello seleccionaremos el menú
Datos/Seleccionar casos...

Jorge Antonio Pérez


Docente UPS
Jorge Antonio Pérez
Docente UPS
La selección de casos puede ser temporal (filtrados) o permanente
(eliminados):

En la selección permanente se elimina del archivo activo los casos no deseados,


mientras que en la temporal, la selección es recuperable (los casos son
filtrados). En esta última situación, los casos del archivo que no satisfacen la
condición aparecerán marcados como excluidos mediante una línea que cruza
en diagonal su número de fila. Aparece también una variable llamada FILTER_$
que el sistema crea para controlar el filtrado de datos.

Seleccionar, sin eliminar, las filas correspondientes a las mediciones con bajo
nivel de sulfato:

• Seleccione Si se satisface la condición, de clic en el cuadro Si la


opción. Especificamos la condición niv_sulfato = 1
Pulse Continuar y, después, Aceptar.

Observe el resultado y después seleccione Todos los casos o Restablecer


para volver a considerar todos los casos del archivo de datos.

Jorge Antonio Pérez


Docente UPS
Los resultados son:

Jorge Antonio Pérez


Docente UPS
Especificaciones para el resto de opciones de SELECCIONAR CASOS:

• Todos los casos: indica que quiere procesar todos los casos del archivo
de datos de trabajo.

• Si se satisface la condición: indica que quiere procesar sólo los casos


que satisfagan una condición lógica. Para especificar o cambiar la
condición, pulse en Si. Esta alternativa crea la variable filter_$, que el
sistema crea para controlar el filtrado de datos.

• Muestra aleatoria de casos: indica que queremos seleccionar los casos


de forma aleatoria para su procesamiento. Si ha tecleado las
especificaciones de muestreo, éstas aparecerán junto al botón de
comando Muestra. Si no, o si quiere cambiarlas, pulse en Muestra (véase
más adelante). Esta alternativa también crea la variable filter_$.

• Basándose en el rango del tiempo o de los casos: permite seleccionar


los casos deseados siempre que sean consecutivos, por ejemplo del 3º al
18º.

• Usar variable de filtro: indica que quiere utilizar los valores de una
variable numérica existente para controlar el filtrado de casos. Seleccione
la variable de la lista de la izquierda. Los casos cuyo valor sea 0, o
ausentes, en la variable de filtro se excluyen del análisis.

Ejercicio 4
CREAR UN NUEVO ARCHIVO A PARTIR DEL ARCHIVO AMBIENTE Y
LLAMARLO PH, Y EN ESE ARCHIVO
-Seleccionar los valores de pH por debajo de 6,0
-CREAR UN NUEVO ARCHIVO A PARTIR DEL ARCHIVO AMBIENTE Y
LLAMARLO PRIMEROS, Y EN ESE ARCHIVO
-Seleccionar los 8 primeros datos de todas las variables.
-Guardar el archivo como eje4un1

8. Fundir archivos

SPSS permite añadir casos desde un archivo.sav a otro y también variables de


un archivo a otro:

8.1 Añadir casos:


En primer lugar, crea y guarda los dos archivos siguientes:

• Realizar el siguiente procedimiento de fundir archivos, y adjuntar en


Ejercicio 5

• Guarde el archivo como eje5un1.


la tarea los archivo fundir1a y fundir 1c

Jorge Antonio Pérez


Docente UPS
Archivo: fundir1a.sav

Archivo: fundir1b.sav

Va a copiar los casos del archivo fundir1b.sav a continuación de los casos


del archivo fundir1a.sav. Para ello siga los pasos siguientes:

• Sobre el archivo fundir1a.sav,




Seleccione del menú: Datos/ Fusionar Archivos/Añadir casos
Selecciona el archivo fundir1b.sav. y damos clic en abrir y luego
continuar

Jorge Antonio Pérez


Docente UPS
Jorge Antonio Pérez
Docente UPS
• SPSS mostrará las variables coincidentes que aparecerán en el nuevo


archivo.
Después de Aceptar, la fusión se realiza.

• El resultado es el siguiente el cual lo puede guardar con el nombre que


usted desee. En caso de que existan variables que no coincidiesen en
nombre en ambos archivos, SPSS permite emparejarlas.

Jorge Antonio Pérez


Docente UPS
8.2 Añadir variables:

Al archivo resultante de la fusión anterior va a añadirle variables nuevas que se


encuentran en otro archivo. Para ello es necesario que ambos archivos
compartan una variable que identifique los casos, en nuestro caso usaremos la
variable clave.

• En primer lugar cree y guarde el siguiente archivo: fundir1c.sav

Note que aparecen los mismos casos etiquetados por la variable clave, en
distinto orden. Los pasos a seguir son los siguientes:

• Ordene ascendentemente el archivo fundir1c.sav mediante


Datos/Ordenar casos y seleccionar la variable clave y guarde.

Jorge Antonio Pérez


Docente UPS
El resultado es:

• Ordenar ascendentemente el archivo fundir1a.sav por la variable


clave y guarde.

Jorge Antonio Pérez


Docente UPS
El resultado es:

• Seleccione el menú Datos/Fusionar Archivos/Añadir variables,


desde el archivo fundir1c. Obtiene el siguiente cuadro de diálogo:

Jorge Antonio Pérez


Docente UPS
• Seleccione el archivo fundir1a.sav de clic en abrir y luego en
continuar.

• Active la opción de Asignar casos en variables clave y pase la


variable clave a la casilla de variables clave:

Jorge Antonio Pérez


Docente UPS
• Luego de clic en Aceptar, y obtiene el archivo fusionado que podrá
guardarlo con el nombre que usted desee.

Advertencia: Se producirá un error si no ordena los datos en forma


ascendente de la variable.

9. Importar datos

Vamos a importar un archivo de texto y convertirlo al formato SPSS.

• Realizar el siguiente procedimiento de importar datos y adjuntar en


Ejercicio 6

• Guarde el archivo como eje6un1.


la tarea el archivo importado

Jorge Antonio Pérez


Docente UPS
• Con el bloc de notas de Windows cree y guarde el archivo siguiente:
para ello debes crear un archivo en el programa, y guardarlo con el
nombre bloc de notas.

Observe lo siguiente:

- Cada registro tiene 4 campos de tipos diferentes, separados por un


espacio en blanco,
- Los campos no están en columna, esto se lo denomina formato libre

• Para importar este archivo en un nuevo archivo seleccione el menú


Archivo/Importar datos/ Leer datos de texto, introducir el
nombre del archivo.

Jorge Antonio Pérez


Docente UPS
• De clic en abrir y luego aparece el cuadro de dialogo en el cual le pide
que indique si su archivo tiene algún formato definido, en esta caso


damos clic en no.
De clic en siguiente y activamos la opción NO para indicar que no
está incluido el nombre de la variable en la primera fila o parte
superior del archivo y damos clic en siguiente

Jorge Antonio Pérez


Docente UPS
• En el cuadro de dialogo siguiente coloque la información referente a
cada uno de los casos según sea el archivo con el que esté trabajando


y de clic en siguiente.
Luego indique como están delimitada cada una de las variables en el
archivo de texto y de clic en siguiente.

Jorge Antonio Pérez


Docente UPS
• En el paso 5 de 6 puede dar nombres y formato a las variables dando
clic en la parte inferior sobre cada una de las variables: para este caso
la V1 se ha colocado el nombre codigo, para la v2 es nombre, para
la v3 es valor y para la V4 es fecha.

Jorge Antonio Pérez


Docente UPS
Jorge Antonio Pérez
Docente UPS
• Luego de clic en FINALIZAR:

Jorge Antonio Pérez


Docente UPS
• Y obtiene el archivo final el cual lo puede guardarlo con el nombre que
usted desee.

10. Tablas de frecuencias

Una de las formas más simples de resumir la información de un conjunto de


datos es por medio de una tabla de frecuencias, que consiste en calcular para
cada valor de una variable el número (frecuencia) de casos en que aparece.

Una tabla de frecuencias debe indicar el nombre de la variable en su


encabezado, los valores que toma la variable, la frecuencia de cada uno de ellos
y la suma de todas las frecuencias, que coincidirá con el número total de casos
válidos. También es aconsejable calcular las frecuencias relativas, o
proporciones, que resultan al dividir cada frecuencia por su suma total.
SPSS genera tablas de frecuencias de forma automática. En primer lugar, se
necesita abrir una base de datos con los que pretende trabajar, por ejemplo, el
archivo ambiente.sav (proporcionado previamente), y con el menú
Analizar/Estadísticos descriptivos/Frecuencias se puede obtener la tabla de
frecuencias asociada a cualquier variable.
La tabla para la variable ozono obtenida por SPSS es la siguiente:

Jorge Antonio Pérez


Docente UPS


Pase la variable gas ozono por zona a la ventana variables.
Active la opción: Mostrar tablas de frecuencias y luego de clic en
Aceptar, y los resultados.

Jorge Antonio Pérez


Docente UPS
• El resultado que usted obtiene es el siguiente:

Estadísticos
Gas ozono por zonas

N Válido 15

Perdidos 0

Gas ozono por zonas

Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado

Válido normal 7 46,7 46,7 46,7

alto 8 53,3 53,3 100,0

Total 15 100,0 100,0

La tabla indica que hay 15 casos válidos y ninguno perdido, que la variable ozono
tiene dos valores posibles Normal y Alto (son las etiquetas asociadas a los
valores 0 y 1, respectivamente). Hay 7 casos (46,7%) en los que ozono toma el
valor Normal y 8 (53,3%) el valor Alto.

SPSS también cuenta con el menú alternativo Analizar/Tablas personalizadas


que posibilita alterar el formato del resultado.

Ejercicio 7
1.Ordene los datos por la variable ozono con la opción: Datos/Ordenar casos o
haciendo clic con el botón derecho del ratón sobre el nombre de la variable y
comprueba que las frecuencias anteriores son correctas, volviendo a generar la
opción frecuencias.
2.Obtener la tabla de frecuencias de la variable provin.
3.Obtener la tabla de frecuencias de la variable sulfato.
4. Guarde los archivos de resultados y datos en una carpeta comprimida con el
nombre eje7un1.

Jorge Antonio Pérez


Docente UPS
11. Estadísticos

Los estadísticos son valores calculados con los datos de una variable
cuantitativa y que miden alguna de las características de la distribución muestral.
Las principales características son: tendencia central, posición, dispersión,
asimetría y apuntamiento.

11.1 Medidas de posición

11.1.1 Medidas de posición central:

- Media.- es la suma de todas las observaciones dividida por el


tamaño de la muestra.

- Mediana.- es el valor que divide a la muestra ordenada en dos


mitades con el mismo número de datos.

- Media recortada.- es una media calculada después de eliminar


algunos datos extremos. Es más robusta que la media pues no
tiene en cuenta los valores atípicos.

- Moda.- es el dato que posee la mayor frecuencia. En algunos casos


pueden darse varias modas.

11.1.2 Otras medidas de posición.


Los cuartiles Q1,Q2 y Q3, son tres valores que dividen a la distribución en cuatro
partes iguales. El primer cuartil tiene un 25% de casos menores o iguales que
dicho valor; el segundo cuartil coincide con la mediana y el tercer cuartil deja un
25% de valores superiores o iguales a este.
Los deciles (10 en total) y percentiles (100 en total) dividen a la distribución en
diez y cien partes iguales, respectivamente. Su forma de cálculo es similar a la
de los cuartiles.

11.2 Medidas de dispersión

Las más utilizadas son:

- Rango o amplitud que es la diferencia entre el mayor y el menor valor de


la muestra.

- Rango intercuartílico Q3-Q1, el intervalo [Q1,Q3] contiene al 50%


central de los valores muestrales.

- Varianza (s2) que mide el alejamiento medio de las diferencias al


cuadrado de cada observación a la media.
Jorge Antonio Pérez
Docente UPS
- Desviación típica o estándar (s) está medida en las mismas unidades
que la variable y es la raíz cuadrada positiva de la varianza.

- Coeficiente de variación de Pearson es una medida de dispersión


relativa. Es el cociente o división entre la desviación típica o estándar y el
valor absoluto de la media. Carece de unidades y se usa para comparar
la dispersión entre variables que tengan distintas unidades de medida.
El coeficiente de variación toma valores entre 0 y 1. Si el coeficiente es
próximo al 0, significa que existe poca variabilidad en los datos y es una
muestra muy compacta. En cambio, si tienden a 1 es una muestra muy
dispersa; para interpretar fácilmente el coeficiente de variación, puede
multiplicarlo por cien para tenerlo en porcentaje.

11.3 Medidas de asimetría y apuntamiento

Su objetivo es expresar mediante un valor la forma simétrica o asimétrica de la


distribución.
Para distribuciones unimodales que además son simétricas es decir la parte
izquierda de la distribución es igual a la derecha, los estadísticos: media,
mediana y moda suelen tener valores idénticos o muy parecidos. En base a esto,
aparece el Coeficiente de Asimetría de Pearson.
Este coeficiente de asimetría oscila entre valores de -3 hasta 3 si el valor es
negativo los datos están sesgados hacia la izquierda de la media; si el valor es
positivo los datos están sesgados hacia la derecha.

Jorge Antonio Pérez


Docente UPS
11.4 Medidas de apuntamiento

Indican el nivel de concentración de los datos respecto de su media. Las curvas


se pueden clasificar en tres grupos según el signo de su curtosis, es decir, según
la forma de la distribución:

• Leptocúrtica: la Curtosis>0. Los datos están muy concentrados en la


media, siendo una curva muy apuntada.

• Mesocúrtica: la Curtosis=0. Distribución normal.

• Platicúrtica: la Curtosis<0. Muy poca concentración de datos en la


media, presentando una forma muy achatada.

Para obtener los estadísticos con SPSS se usa el menú Analizar/Estadísticos


descriptivos/Descriptivo luego selecciona la variable o variables de interés y
después en Opciones puede escoger los estadísticos que sean de su interés.

Otra opción con la cual se puede obtener todos los estadísticos e incluir en forma
adicional los percentiles debe ingresar al menú Analizar/Estadísticos
descriptivos/Frecuencias y entrar en la opción Estadísticos en donde se
seleccionan los estadísticos más los percentiles deseados.

Como ejemplo se va a trabajar con el archivo ambiente.sav (entregado


previamente) y se realizará el análisis para la variable sulfato.

• Ingrese en el menú Analizar/Estadísticos descriptivos/Frecuencias y


desactive la opción mostrar tabla de frecuencias
Pase la variable sulfato en la tierra a la casilla de variables y de clic en
la opción estadísticos y señale los estadísticos de su interés.

Jorge Antonio Pérez


Docente UPS
Jorge Antonio Pérez
Docente UPS
• De clic en continuar y luego debe escoger la opción de Gráficos, y pulsar
sobre Histogramas y en el casillero Mostrar curva normal en el
histograma, de clic en continuar y luego en aceptar

Jorge Antonio Pérez


Docente UPS
Los resultados obtenidos son:

Estadísticos
Sulfato en la tierra

N Válido 15

Perdidos 0
Media 3.125580
Mediana 2.925800
Moda .4614a
Desviación estándar 2.1521373
Varianza 4,632
Asimetría ,918
Error estándar de asimetría ,580
Curtosis ,495
Error estándar de curtosis 1,121
Rango 7.1515
Mínimo .4614
Máximo 7.6129
Suma 46.8837
Percentiles 25 1.178700

50 2.925800

75 3.824500

a. Existen múltiples modos. Se muestra el valor


más pequeño.

Jorge Antonio Pérez


Docente UPS
Ejercicio 8

1.De la base de datos entregada de SPSS del INEC


(INEC_BDD_MODULO_AMBIENTAL_2015)

2. Realice dos análisis de los estadísticos; la primera de frecuencias con la variable:


A04A (PRINCIPALMENTE, en su hogar durante los ÚLTIMOS 12 MESES, cómo
eliminó los Residuos Orgánicos). Y la segunda salida para una variable numérica
A07A (Cuantos focos tiene en total en su hogar).

3. Interprete los resultados y guárdelos en una carpeta comprimida con el nombre


eje8un1.

12. Representación gráfica de variables

El uso de gráficos es muy necesario en Estadística, estos pretenden resumir la


información en forma gráfica con fines clarificadores o para enfatizar y descubrir
determinadas características que de otra forma sería muy difícil de apreciar. Un
gráfico es más fácil de entender que un conjunto de estadísticos.

Los gráficos para representar variables discretas o categóricas son diferentes de


los que se utilizan para representar variables continuas por lo que separaremos
su estudio.

12.1 Gráficos de variables discretas y categóricas

Los gráficos más utilizados en estadística para representar variables discretas o


categóricas son los gráficos de sectores y los diagramas de barras.

12.1.1 Gráficos de pastel o sectores.

Un gráfico de sectores consiste en un círculo dividido en sectores de tamaño


proporcional a la frecuencia de cada valor de la variable. Se utilizan cuando hay
pocos valores que representar (máximo de 7).

Para obtener un gráfico de sectores con SPSS usaremos el menú


Gráficos/Cuadro de diálogo antiguos/Gráficos circulares y seleccionaremos
una o varias variables apareciendo el cuadro de diálogo siguiente:

Jorge Antonio Pérez


Docente UPS
• Resúmenes para distintas variables

Permite que los sectores representen variables en lugar de grupos de casos.


Cada sector representa una función de una determinada variable (por
ejemplo, la suma de los valores de sus casos).

Por ejemplo, las puntuaciones de 10 alumnos en tres exámenes han sido las
siguientes:

Jorge Antonio Pérez


Docente UPS
Se puede representar gráficamente con un diagrama de sectores la suma de
las puntuaciones en estos tres exámenes para ver si difieren mucho y para
ver qué examen tuvo la mayor puntuación relativa. Para ello, después de
introducir los datos en SPSS y elegir la opción resumen para distintas
variables, se puede obtener un gráfico de sectores, se observa, por ejemplo,
que la suma de las puntuaciones en el Ex1 es de 69,20 y que representan un
35,2% de la suma de todas las puntuaciones (es decir su puntuación relativa).

• Ingrese en el menú la opción Gráficos/Cuadros de diálogo


antiguos/Circular.


Selecciones la opción Resúmenes para distintas variables
Pase las tres variables a la casilla Las porciones representan.

Jorge Antonio Pérez


Docente UPS
El resultado es:

• Para observar la suma de las variables, damos un doble clic sobre el


gráfico y se visualiza la ventana del editor de gráficos, luego damos
clic derecho y pulsamos sobre el botón Mostrar etiquetas de datos.

Jorge Antonio Pérez


Docente UPS


Aparece la siguiente ventana
Ubíquese sobre la palabra Porcentaje, y pulsamos sobre la flecha


verde que permite pasar a la ventana Mostrado.
Y de clic en aplicar.

Jorge Antonio Pérez


Docente UPS
El resultado es:

• Resúmenes para grupos de casos

Genera un gráfico en el que cada sector corresponde a un valor de la variable


seleccionada. El tamaño del sector se determina por la opción Los sectores
representan, esta opción aparece en el cuadro de diálogo que surge después
de dar clic en definir del cuadro de dialogo de resumen para cuadros de diálogos
de gráficos de sectores.

Por ejemplo, supongamos que queremos representar del archivo de


ambiente.sav los valores de la variable provin en un diagrama de sectores
donde los sectores representan el número de casos de cada provincia. El gráfico
de sectores podría ser así:

Jorge Antonio Pérez


Docente UPS
• De clic en aceptar y puede colocar etiqueta de datos siguiendo el mismo


procedimiento anterior.
El resultado es:

• Valores individuales de los casos

Se resume una única variable.

Jorge Antonio Pérez


Docente UPS
Genere un gráfico lineal para la variable sulfato del archivo ambiente.sav:

Jorge Antonio Pérez


Docente UPS


Pase la variable a graficar al cuadro de diálogo la línea representa.
y de clic en aceptar

El resultado es:

Jorge Antonio Pérez


Docente UPS
12.2 Gráficos de variables continuas

Básicamente se utilizan dos tipos de gráficos para las representaciones de una


única variable continua: Histogramas y Diagramas de caja.

12.2.1 Histogramas

Parecidos en forma a los diagramas de barras, pero atención: su uso se restringe


únicamente a las variables continuas. Los histogramas representan frecuencias
agrupadas de una variable continua sobre intervalos. A diferencia de los
diagramas de barras, los histogramas dibujan rectángulos unidos entre sí, lo que
significa que existe una continuidad en la variable cuyos valores se representan
en el eje horizontal. El eje horizontal se halla dividido en intervalos de igual
amplitud (SPSS no permite alterar esta propiedad), sobre los que se elevan
rectángulos de altura proporcional a su frecuencia. Por lo tanto, las áreas de los
rectángulos son proporcionales a las frecuencias que representan. Los
histogramas se pueden editar, lo que permite alterar el número de clases, su
amplitud, etc. La gráfica de un histograma puede ser muy distinta para los
mismos datos, simplemente variando el número de clases, por lo que la elección
del número de clases debe hacerse con cuidado, también se puede superponer
una curva normal con media y desviación estándar coincidentes con las de la
muestra para ver su parecido.

Para obtener un histograma con SPSS se utilizan los menús Gráficos/Cuadro


de diálogo antiguos/Histograma. Con éste último menú podemos obtener el
histograma de frecuencias.

Genere un gráfico lineal para la variable sulfato del archivo ambiente.sav:

Jorge Antonio Pérez


Docente UPS
• Pase la variable sulfato en la tierra al cuadro de diálogo variable y de clic


en aceptar.
Active la casilla Mostrar curva normal

El resultado es el siguiente:

Jorge Antonio Pérez


Docente UPS
• Dando clic derecho en el gráfico puede modificar el gráfico dando clic en


editar contenido
Puede cambiare el número de intervalos según sea su interés por ejemplo
colocamos la opción de 5 intervalos dando clic en la opción de ocultar
etiqueta de datos y luego clic en agrupaciones/personalizado/número
de intervalos y damos clic en aplicar

Jorge Antonio Pérez


Docente UPS
• El resultado es:

Jorge Antonio Pérez


Docente UPS
12.2.2 Diagramas de caja

A diferencia de los otros gráficos ya vistos, los diagramas de caja hacen énfasis
en las medidas de posición. Es muy útil para hacer comparaciones entre
muestras de distintas poblaciones.

Un diagrama de caja consiste en un rectángulo cuya longitud es el rango


intercuartílico, dividido por un segmento a la altura de la mediana y
complementado por dos líneas (llamadas bigotes) que parten de los extremos
del rectángulo, cuya longitud no supera 1,5 veces el rango intercuartílico y que
intentan alcanzar los valores mínimo y máximo observados. Para obtener un
diagrama de caja con SPSS se selecciona el menú Gráficos/Cuadro de diálogo
antiguos/Diagrama de cajas.

Pulse la opción en simples y resúmenes para grupos de casos y en definir,


en el argumento variable colocamos la variable numérica para nuestro ejemplo
del archivo ambiente.sav pasamos la variable ph en la zona y en el Eje de
categorías debemos colocar la variable por la cual se va a segmentar en este
caso provincia y de clic en aceptar
Jorge Antonio Pérez
Docente UPS
El resultado es:

Jorge Antonio Pérez


Docente UPS
En el gráfico, cada provincia está representada por una caja que muestra los
niveles de ph. Se puede observar diferencias en cuanto la situación de la
mediana y a la dispersión. Por ejemplo, se observa que en Valencia los niveles
de ph., son superiores a los de Castellón y que presentan una ligera mayor
dispersión. Los casos extremos si los hay se representan por símbolos
especiales a cuyo lado aparece el número de caso.

También nos da idea de la simetría de los datos, por ejemplo, una mediana
descentrada dentro del rectángulo nos indicaría una asimetría. En este ejemplo
podemos decir que las distribuciones no son lo suficientemente simétricas. El
diagrama de cajas puede ser editado para su modificación, haciendo doble clic
sobre sus elementos. Se puede alterar título, pie, anotaciones, leyenda y los
valores y etiquetas de los ejes; las líneas como los ejes, las líneas de referencia
y los bordes, la escala, el relleno y trama de la caja y los casos atípicos y
extremos.

Ejercicio 9

CON EL ARCHIVO p1coches.sav entregado previamente, realice lo siguiente:

1.Calcule la moda, mediana, asimetría y curtuosis del consumo de todos los coches.

2.Calcule el consumo medio y la mediana de los coches de 4 cilindros.

3.Construya un diagrama de cajas que sirva para comparar los consumos de cada
tipo de coche dependiendo de su número de cilindros.

4.Construya un histograma del peso de los coches. Superponga una curva normal.

5.Construya un diagrama de cajas para comparar las cilindradas de los coches


según el origen del coche.

6.Construya un diagrama de barras de la potencia media (en CV) de los coches


según su origen.

7. Construya un gráfico de sectores para ver las proporciones de coches en la


muestra según su origen.

8.Guarde en una carpeta con el nombre eje9un1.

Jorge Antonio Pérez


Docente UPS
13. Generación de tablas de contingencia

La tabla de contingencia es utilizada para realizar el cruce entre dos variables


categóricas y determinar el número de casos existentes en cada cruce, para
ello se utilizará el archivo Dato de empleados entregado previamente.

• Para generar la tabla debe ingresar en el menú Analizar/Estadísticos


descriptivos/Tablas cruzadas.
Se debe trasladar tanto a la fila como a la columna variables
categóricas, para el ejemplo las variables sexo a la fila y categoría


laboral catlab a la columna.
Activar la casilla Mostrar los gráficos de barras agrupadas. Y de clic en
Aceptar.

Jorge Antonio Pérez


Docente UPS
El resultado es:
Resumen de procesamiento de casos

Casos

Válido Perdidos Total

N Porcentaje N Porcentaje N Porcentaje

Sexo * Categoría laboral 474 100,0% 0 0,0% 474 100,0%

Sexo*Categoría laboral tabulación cruzada


Recuento

Categoría laboral

Administrativo Seguridad Directivo Total

Sexo Hombre 157 27 74 258

Mujer 206 0 10 216


Total 363 27 84 474

Jorge Antonio Pérez


Docente UPS
• Para ver los resultados de forma porcentual, pulsamos sobre el botón
Casillas.
• Y en la siguiente ventana activar la opción Total.
• De clic en continuar y luego aceptar

Jorge Antonio Pérez


Docente UPS
Sexo*Categoría laboral tabulación cruzada

Categoría laboral

Administrativo Seguridad Directivo Total

Sexo Hombre Recuento 157 27 74 258

% del total 33,1% 5,7% 15,6% 54,4%


Mujer Recuento 206 0 10 216

% del total 43,5% 0,0% 2,1% 45,6%


Total Recuento 363 27 84 474

% del total 76,6% 5,7% 17,7% 100,0%

Lo que nos indica por ejemplo que en este archivo del 100% de personas
encuestadas el 54,4% son hombres y el 45,6% mujeres.

Otra forma de presentar las tablas segmentadas es utilizar la opción: CAPA


1de 1 para ello pasar la variable Clasificación de minorías a la tercera ventana.

Jorge Antonio Pérez


Docente UPS
El resultado es:
Sexo*Categoría laboral*Clasificación de minorías tabulación cruzada

Categoría laboral

Clasificación de minorías Administrativo Seguridad Directivo Total

No Sexo Hombre Recuento 110 14 70 194

% del total 29,7% 3,8% 18,9% 52,4%

Mujer Recuento 166 0 10 176

% del total 44,9% 0,0% 2,7% 47,6%

Total Recuento 276 14 80 370

% del total 74,6% 3,8% 21,6% 100,0%


Sí Sexo Hombre Recuento 47 13 4 64
% del total 45,2% 12,5% 3,8% 61,5%
Mujer Recuento 40 0 0 40
% del total 38,5% 0,0% 0,0% 38,5%
Total Recuento 87 13 4 104
% del total 83,7% 12,5% 3,8% 100,0%
Total Sexo Hombre Recuento 157 27 74 258

% del total 33,1% 5,7% 15,6% 54,4%

Mujer Recuento 206 0 10 216

% del total 43,5% 0,0% 2,1% 45,6%

Total Recuento 363 27 84 474

% del total 76,6% 5,7% 17,7% 100,0%

Jorge Antonio Pérez


Docente UPS
Jorge Antonio Pérez
Docente UPS
Ahora que ha logrado generar la tabla de contingencia puede surgir la siguiente
inquietud, generar el mismo reporte pero sólo las personas que tienen sueldos
anuales mayores a 20.000 USD, por lo que ahora veremos cómo se seleccionan
los casos:
• Vamos al menú DATOS y escogemos SELECCIONAR CASOS.
• Y escoja la segunda opción:

Jorge Antonio Pérez


Docente UPS
• Pase la variable salario actual al cuadro y luego ingresar el símbolo
mayor que > y por el teclado el número 20000, de clic en continuar y
luego aceptar.
• Luego vuelva a generar la tabla de contingencia.

Jorge Antonio Pérez


Docente UPS
El resultado es:

AHORA SE TRABAJARÁ CON 441 DATOS FILTRADOS.


Resumen de procesamiento de casos

Casos

Válido Perdidos Total

N Porcentaje N Porcentaje N Porcentaje

Sexo * Categoría laboral *


441 100,0% 0 0,0% 441 100,0%
Clasificación de minorías

Sexo*Categoría laboral*Clasificación de minorías tabulación cruzada

Categoría laboral

Clasificación de minorías Administrativo Seguridad Directivo Total

No Sexo Hombre Recuento 110 14 70 194

% del total 31,6% 4,0% 20,1% 55,7%

Mujer Recuento 144 0 10 154

% del total 41,4% 0,0% 2,9% 44,3%

Total Recuento 254 14 80 348

% del total 73,0% 4,0% 23,0% 100,0%


Sí Sexo Hombre Recuento 46 13 4 63
% del total 49,5% 14,0% 4,3% 67,7%
Mujer Recuento 30 0 0 30
% del total 32,3% 0,0% 0,0% 32,3%
Total Recuento 76 13 4 93
% del total 81,7% 14,0% 4,3% 100,0%
Total Sexo Hombre Recuento 156 27 74 257

% del total 35,4% 6,1% 16,8% 58,3%

Mujer Recuento 174 0 10 184

% del total 39,5% 0,0% 2,3% 41,7%

Total Recuento 330 27 84 441

% del total 74,8% 6,1% 19,0% 100,0%

Jorge Antonio Pérez


Docente UPS
14. Generación de tablas personalizadas

La tabla personalizada es otra forma de generar un cruce de variables pero se


puede aumentar una o más variables numéricas, así por ejemplo, en el archivo
Dato de empleados, ubicarse en la opción Analizar / Tablas / Tablas
personalizadas:

Saldrá el siguiente mensaje:

Jorge Antonio Pérez


Docente UPS
Debe dar clic en aceptar siempre y cuando estén correctas las medidas de cada
variable, esto es por ejemplo las variables numéricas deben ser su medida
escalar y las variables que clasifican por ejemplo nominal, esta información las
pueden ver en la ficha vista de variables.

Jorge Antonio Pérez


Docente UPS
Arrastre hacia la fila o la columna las variables categóricas por ejemplo sexo a
la fila y lo soltamos.

Si la visualización es sólo el campo sexo, es porque esta pulsado el botón


compacta y puedes pulsar el botón Normal estas dos opciones son formas de
visualizar los datos en general la regla dice:

Compacta : sólo se ve el nombre de la variable.


Normal : se ve el contenido de la variable.

Jorge Antonio Pérez


Docente UPS
• Arrastre una variable numérica salario actual junto a la variable sexo.
• Ahora puede aumentar la variable categoría laboral (catlab) al
segmento columnas:

Y el resultado es:

Categoría laboral
Administrativo Seguridad Directivo

Media Media Media

Sexo Hombre Salario actual $31,558 $30,939 $66,243

Mujer Salario actual $25,004 . $47,214

Si deseamos obtener otros estadísticos, debemos ubicarnos sobre el campo


salario actual y debemos pulsar sobre estadísticos de resumen.

• Pasar a la ventana Visualización los estadísticos que se desea calcular,


por ejemplo, el máximo o el mínimo.
• De clic en aplicar a la selección y luego aceptar
Jorge Antonio Pérez
Docente UPS
El resultado es:

Jorge Antonio Pérez


Docente UPS
Ejercicio 10

1.Del archivo mundo.sav arme una tabla de contingencias con la variable relig
(religión) y región expresar los resultados en valores absolutos y en otra salida en
formato porcentual.
2.Genere una tabla personalizada colocando en la fila la relig(religión) y en la
columna la región y como variable numérica utilizar poblac con los estadígrafos
media, mediana, máximo y mínimo.
3.Genere otro archivo y realizar el mismo trabajo anterior pero seleccionar
previamente en el archivo en base a la variable tasa_nat los casos que sean mayores
a 25.
4.Guarde los archivos de resultados en una carpeta con el nombre eje10un1

Introducción al diseño de una muestra aleatoria.

En este apartado consideraremos la generación de una muestra de una


población con distribución conocida, pero de la que no disponemos de datos. Por
ejemplo, de una población con distribución Normal de media 20 y desviación
típica 5 vamos a generar 40 datos.

En primer lugar, necesitamos crear un nuevo banco de datos


Archivo/Nuevo/Datos.

Jorge Antonio Pérez


Docente UPS
SPSS genera los datos de una determinada distribución y los sitúa en una
columna con la longitud que tenga el banco de datos; es decir, el número de filas
con datos que aparezcan en el Editor de datos. Dado que acaba de crear el
fichero, no contendrá ningún dato, por lo que la primera operación a realizar será
el rellenar la primera columna con datos.

Para ello basta con que nos situemos en la casilla correspondiente a la columna
1, fila 40 e insertemos el número 40.

Seleccionamos en el menú Transformar/Calcular y nos aparece la ventana de


calcular variables.

Jorge Antonio Pérez


Docente UPS
En el campo Variable de destino, escriba m1 como nombre de la variable que
va a crear. De la ventana Grupo de funciones elija la opción de Números
aleatorios y de la ventana Funciones y variables especiales seleccione una
de las funciones que nos ofrece el SPSS, para este caso seleccione
RV.NORMAL (media,desv_típ) y pase la función a la ventana de Expresión
numérica.

Entonces en lugar de media y desv_típ aparecen unos interrogantes, que


sustituiremos por los valores de la media y la desviación estándar o típica de la
distribución normal de la que pretendemos simular una muestra, en este caso,
media=20, s(desviación)=5.

Se activa, entonces, el botón Aceptar, y al pulsarlo, el SPSS genera una muestra


que añade en la primera columna libre del editor de datos.

Jorge Antonio Pérez


Docente UPS
La siguiente tabla muestra algunas de las funciones que proporcionan un valor
aleatorio de una distribución determinada. Los argumentos son los parámetros
de la distribución. Pueden consultar la ayuda del SPSS para obtener una lista
exhaustiva de todas las funciones disponibles.

Expresión Descripción
RV.UNIFORM(mín,máx) Devuelve un valor aleatorio de la
distribución uniforme, con el mínimo y el
máximo especificados.
RV.NORMAL(media,desv_típ) Devuelve un valor aleatorio de la
distribución normal, con la media y la
desviación típica especificadas.
RV.GAMMA(forma,escala) Devuelve un valor aleatorio de la
distribución Gamma, con los parámetros
de forma y escala especificados.
RV.CHISQ(gl) Devuelve un valor aleatorio de la
distribución de chi cuadrado, con los
grados de libertad gl especificados.
RV.EXP(forma) Devuelve un valor aleatorio de una
distribución exponencial, con el
parámetro de forma especificado.
RV.WEIBULL(a,b) Devuelve un valor aleatorio de la
distribución de Weibull, con los
parámetros especificados.
RV.BETA(forma1,forma2) Devuelve un valor aleatorio de una
distribución Beta, con los parámetros de
forma especificados.
RV.T(gl) Devuelve un valor aleatorio de la
distribución t de Student, con los grados
de libertad gl especificados.

Ejercicio 11:

1.Generar muestras de tamaño 40 para las distribuciones continuas siguientes:


Uniforme (3,5) y Normal (3, 1.5)
2.Guarde el archivo con el nombre eje11un1
Jorge Antonio Pérez
Docente UPS
15. Generación de los reportes estadísticos en base a intervalos de
confianza.

En base a los datos de ventas de un mes de marzo presentado ver tabla adjunta),
se desea generar 20 datos aleatorios para pronosticar un mes a futuro.
(RECUERDE QUE ESTAMOS EN MARZO Y EL OBJETIVO ES POR MEDIO
DE LA FUNCIÓN RV.NORMAL GENERAR LAS POSIBLES VENTAS DE
JUNIO).

Datos del mes de marzo:

Primero debemos ingresar los datos al SPSS.

Jorge Antonio Pérez


Docente UPS
• Ahora debe obtener el promedio y la desviación de la variable ventas, en
el menú principal vaya a Analizar/Estadísticos


descriptivos/Frecuencias.
Pase la variable ventas al cuadro de dialogo Variables y de clic en


estadísticos.
Señale desviación típica y media, de clic en continuar.

Jorge Antonio Pérez


Docente UPS
El resultado es:

Estadísticos
ventas

N Válido 20

Perdidos 0
Media 82,1000
Desviación estándar 12,42620

Con estos resultados genere los 20 números aleatorios con la función rv.normal:



En el menú principal vaya a Transformar/Calcular variable.
Coloque el nombre de la variable: aleatorio y luego en el cuadro
grupo de funciones seleccione la opción Números aleatorios y
escoja la opción Rv.Normal, pase a la ventana de Expresión
numérica e ingrese los valores correspondiente media= 82.10 y
desviación estándar=12.4262, al darle clic en aceptar se genera los
20 números aleatorios, si en caso no pasa dicha ventana es porque el
separador de los valores ingresados no es el punto sino la coma.

Jorge Antonio Pérez


Docente UPS
Jorge Antonio Pérez
Docente UPS
Los valores aleatorios que se obtiene en la anterior pantalla NO lo van a tener
usted ya que son aleatorios, Con estos datos pronosticados podemos generar
el reporte exploratorio.

16. Determinación de valores atípicos



Debe ingresar en el menú Analizar/Estadísticos descriptivos/Explorar.
En Lista de dependientes, pasamos una variable numérica para nuestro
caso VENTAS, y en la Lista de factores una variable que segmenta para


nuestro caso SEMANA.
Luego pulsamos en el botón Estadísticos y activamos las opciones
Descriptivos y Valores atípicos.

Jorge Antonio Pérez


Docente UPS
El resultado es:

Descriptivos

semana Estadístico Error estándar

ventas semana 1 Media 81,0000 4,69042

95% de intervalo de Límite inferior 67,9773


confianza para la media Límite superior 94,0227

Media recortada al 5% 80,9444

Mediana 80,0000

Varianza 110,000

Desviación estándar 10,48809

Mínimo 67,00

Jorge Antonio Pérez


Docente UPS
Máximo 96,00

Rango 29,00

Rango intercuartil 17,50

Asimetría ,228 ,913

Curtosis 1,215 2,000

semana 2 Media 70,0000 4,83735

95% de intervalo de Límite inferior 56,5694


confianza para la media Límite superior 83,4306

Media recortada al 5% 69,8889

Mediana 70,0000

Varianza 117,000

Desviación estándar 10,81665

Mínimo 57,00
Máximo 85,00

Rango 28,00

Rango intercuartil 20,00

Asimetría ,316 ,913

Curtosis -,493 2,000

semana 3 Media 81,2000 3,76032

95% de intervalo de Límite inferior 70,7597


confianza para la media Límite superior 91,6403

Media recortada al 5% 81,2778

Mediana 80,0000

Varianza 70,700

Desviación estándar 8,40833

Mínimo 69,00

Máximo 92,00

Rango 23,00

Rango intercuartil 14,00

Asimetría -,354 ,913

Curtosis ,995 2,000

semana 4 Media 96,2000 ,58310

95% de intervalo de Límite inferior 94,5811


confianza para la media Límite superior 97,8189

Media recortada al 5% 96,1667

Mediana 96,0000

Varianza 1,700

Jorge Antonio Pérez


Docente UPS
Desviación estándar 1,30384

Mínimo 95,00

Máximo 98,00

Rango 3,00

Rango intercuartil 2,50

Asimetría ,541 ,913

Curtosis -1,488 2,000

La tabla de valores atípicos es:

Valores extremosa

Número del
semana caso Valor

ventas semana 1 Mayor 1 4 96,00

2 5 84,00

Menor 1 1 67,00

2 2 78,00

semana 2 Mayor 1 10 85,00

2 9 75,00

Menor 1 6 57,00

2 7 63,00

semana 3 Mayor 1 15 92,00

2 12 85,00

Menor 1 11 69,00

2 14 80,00b

semana 4 Mayor 1 18 98,00

2 19 97,00

Menor 1 20 95,00

2 16 95,00

a. El número solicitado de valores extremos excede el número de puntos


de datos. Se visualiza un número menor de extremos.
b. Sólo se muestra una lista parcial de casos con el valor 80,00 en la tabla
de extremos inferiores.

Jorge Antonio Pérez


Docente UPS
17. Generación de diagramas de caja

• En el menú vaya a Analizar/Estadísticos descriptivos/Explorar.


• Pulse sobre la opción Gráficos y verificamos que este escogido la
opción Niveles de los factores juntos.
• De clic en continuar y luego en aceptar.

Jorge Antonio Pérez


Docente UPS
El resultado es:

Jorge Antonio Pérez


Docente UPS
La lectura se da en función de la caja que se encuentra más arriba de las demás
nos dice cuál es la semana de mayor venta, para este ejemplo la semana cuatro,
mientras que la caja más alta nos indica la de mayor dispersión para este ejemplo
la semana dos, y los círculos representan los valores atípicos y el valor es el
número de caso al que pertenece en cada semana por ejemplo en la semana
tres un valor atípico es el caso 11 o en la semana uno el caso 1 y 4, nos indica
que es un valor muy pequeño o muy grande con respecto al resto.

Ejercicio 12:

1.Enviar el archivo de datos como el de resultado de esta práctica con el nombre


eje12un1

Jorge Antonio Pérez


Docente UPS

También podría gustarte