Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Objetivo.-
Al finalizar esta unidad del curso de SPSS, usted estará en capacidad de manejar
el editor de datos, ingresar, transformar y filtrar variables, así como fundir e
importar archivos de datos, generar reportes descriptivos, representaciones
graficas de variables, construir tablas de contingencia y realizar un análisis
exploratorio
Contenidos:
1. Aspectos técnicos
2. Entrar al programa
3. Definición de datos
4. Introducción y edición de datos
5. Transformación de una variable
6. Recodificación de una variable
7. Filtrado de datos
8. Fundir archivos
9. Importar datos
10. Tablas de frecuencias
11. Estadísticos
12. Representación gráfica de variables.
13. Generación de tablas de contingencia.
14. Generación de tablas personalizadas.
15. Generación de reportes estadísticos en base a intervalos de confianza
16. Determinación de valores atípicos
17. Generación de diagramas de caja
•
•
archivos de datos propios de SPSS. .sav
•
archivos de gráficos y resultados de SPSS. .spv
archivos de sintaxis de SPSS. .sps
Además, permite importar archivos creados con otras aplicaciones: Excel, Lotus,
Dbase, entre otras y exportar archivos de datos y gráficos.
2. Entrar al programa
•
•
Edición de datos de SPSS (Ventana principal con los menús)
Visor de SPSS (entrega de resultados)
Ayuda: Formato de Windows que permite obtener alguna ayuda del programa.
Obteniendo lo siguiente:
Para revisar esta opción se analizará cómo están definidas las variables del
archivo MUNDO, seleccionando la opción de vista de variables se obtiene:
Observe que hay una fila para cada variable y que existen columnas: Nombre,
Tipo, Anchura, Decimales, Etiqueta, Valores, Perdidos, Columnas, Alineación,
Medida, Rol.
Estos valores ausentes son denominados por SPSS "valores ausentes definidos
por el usuario" (userdefined missing values), a diferencia de los definidos por el
sistema (system-missing values o sysmis). Estos últimos corresponden a los que
establece el sistema para los espacios en blanco y caracteres ilegales que pueda
haber en el archivo de datos. Aparecen en los listados representados por comas.
Observe cómo han sido definidas todas las variables del archivo MUNDO.
Una vez tenga la ventana del Editor de datos del SPSS abierta y vacía, lea
atentamente las siguientes instrucciones antes de introducir datos:
•
(Vista de datos).
Para introducir los datos, nos situamos en una casilla, tecleamos su valor
y pulsamos Intro o el Tabulador o nos situamos con el ratón en otra
•
casilla. Podemos introducir los datos por filas o columnas indistintamente.
Conviene ir actualizando el archivo con la opción Guardar Datos o con el
botón de grabar habitual en otras aplicaciones Windows. Para ello:
- Si ya lo había guardado con anterioridad, para guardar las últimas
modificaciones, seleccione la opción de Guardar dentro de
Archivo.
- Si es la primera vez que lo guarda, como todavía no le ha asignado
un nombre al archivo, seleccione la opción Guardar como ...
dentro de Archivo. Le pedirá el nombre que quiere darle al archivo,
su extensión (por defecto utilizará la extensión .sav para datos del
SPSS) y la carpeta en que quiera guardarlo.
Ejercicio1
Genere un archivo de datos en SPSS con la información que aparece a continuación.
Este archivo de datos debe recoge la información obtenida en un proyecto de
investigación mediante encuestas.
Las variables que necesita son las siguientes:
nombre: nombre del entrevistado
n_ident: número de identificación del entrevistado
genero: identifica el género del entrevistado
edad: edad en años del entrevistado
l_nacim: colocar la ciudad de nacimiento del entrevistado
telef: colocar el número de teléfono del entrevistado
Direc: colocar la dirección del entrevistado
f_encues: colocar la fecha de la entrevista
Ejercicio 2.
1.Insertar, entre las personas 4º y 5º, los datos correspondientes la siguiente persona:
CORREA DELGADO RAFAEL VICENTE
0908813512
Masculino
54
Guayaquil
02 382 7000
Belgica
19 de febrero del 2018
2. Insertar, entre las personas 2º y 3º, sus datos personales como un entrevistado
más:
Para esto elija Transformar/ Calcular variable, y realice los siguientes pasos:
- Asignar un nombre y un tipo (por defecto será numérica) a la nueva
variable en el cuadro de texto de la Variable de destino, en este caso
nuevp_ph
- Definir la Expresión numérica que va a permitir calcular los valores de la
misma. Para ello utilice los nombres de las variables del archivo (puede
escribirlos o seleccionarlos del listado que aparece), constantes,
operadores y funciones.
- Pulse Aceptar.
Una expresión lógica es una expresión que puede ser evaluada como verdadera
o falsa en función de los valores de las variables en ella relacionadas. El nexo
de las variables son los operadores de relación: =, >=, <=, <, > , ~= .
A partir de una variable se puede crear otra cuyos valores sean una
recodificación de los de la primera. Esta recodificación podemos hacerla tanto
en la misma variable como en variables diferentes. Para ello, seleccionaremos
Transformar/Recodificar/En distintas variables... Se abre una ventana en la
que deberemos asignar un nombre (y una etiqueta si queremos) a la nueva
variable.
¡Cuidado!, si selecciona En las mismas variables ... borrará la variable original.
Jorge Antonio Pérez
Docente UPS
Recodifique la variable sulfato en una nueva variable llamada:
niv_sulf, clasificándolo en: bajo (0,3), medio [3,6), alto [6,9).
1. Añadir, a la variable niv_sulf las etiquetas de valores para leer bajo, medio, alto
2. Recodificar la variable provin en una nueva variable cod_prov que contenga los
prefijos telefónicos de la provincia: Alicante 965, Castellón 964 y Valencia 963, como
en la siguiente ventana y luego en la vista de variables colocar el respectivo CÓDIGO,
mirar las dos siguientes ventanas.
3. Guardar en archivo como eje3un1.sav
7. Filtrado de datos
Seleccionar, sin eliminar, las filas correspondientes a las mediciones con bajo
nivel de sulfato:
•
opción. Especificamos la condición niv_sulfato = 1
Pulse Continuar y, después, Aceptar.
• Todos los casos: indica que quiere procesar todos los casos del archivo
de datos de trabajo.
• Usar variable de filtro: indica que quiere utilizar los valores de una
variable numérica existente para controlar el filtrado de casos. Seleccione
la variable de la lista de la izquierda. Los casos cuyo valor sea 0, o
ausentes, en la variable de filtro se excluyen del análisis.
Ejercicio 4
CREAR UN NUEVO ARCHIVO A PARTIR DEL ARCHIVO AMBIENTE Y
LLAMARLO PH, Y EN ESE ARCHIVO
-Seleccionar los valores de pH por debajo de 6,0
-CREAR UN NUEVO ARCHIVO A PARTIR DEL ARCHIVO AMBIENTE Y
LLAMARLO PRIMEROS, Y EN ESE ARCHIVO
-Seleccionar los 8 primeros datos de todas las variables.
-Guardar el archivo como eje4un1
8. Fundir archivos
Archivo: fundir1b.sav
•
archivo.
Después de Aceptar, la fusión se realiza.
Note que aparecen los mismos casos etiquetados por la variable clave, en
distinto orden. Los pasos a seguir son los siguientes:
9. Importar datos
Observe lo siguiente:
•
damos clic en no.
De clic en siguiente y activamos la opción NO para indicar que no
está incluido el nombre de la variable en la primera fila o parte
superior del archivo y damos clic en siguiente
•
y de clic en siguiente.
Luego indique como están delimitada cada una de las variables en el
archivo de texto y de clic en siguiente.
Estadísticos
Gas ozono por zonas
N Válido 15
Perdidos 0
Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
La tabla indica que hay 15 casos válidos y ninguno perdido, que la variable ozono
tiene dos valores posibles Normal y Alto (son las etiquetas asociadas a los
valores 0 y 1, respectivamente). Hay 7 casos (46,7%) en los que ozono toma el
valor Normal y 8 (53,3%) el valor Alto.
Ejercicio 7
1.Ordene los datos por la variable ozono con la opción: Datos/Ordenar casos o
haciendo clic con el botón derecho del ratón sobre el nombre de la variable y
comprueba que las frecuencias anteriores son correctas, volviendo a generar la
opción frecuencias.
2.Obtener la tabla de frecuencias de la variable provin.
3.Obtener la tabla de frecuencias de la variable sulfato.
4. Guarde los archivos de resultados y datos en una carpeta comprimida con el
nombre eje7un1.
Los estadísticos son valores calculados con los datos de una variable
cuantitativa y que miden alguna de las características de la distribución muestral.
Las principales características son: tendencia central, posición, dispersión,
asimetría y apuntamiento.
Otra opción con la cual se puede obtener todos los estadísticos e incluir en forma
adicional los percentiles debe ingresar al menú Analizar/Estadísticos
descriptivos/Frecuencias y entrar en la opción Estadísticos en donde se
seleccionan los estadísticos más los percentiles deseados.
•
desactive la opción mostrar tabla de frecuencias
Pase la variable sulfato en la tierra a la casilla de variables y de clic en
la opción estadísticos y señale los estadísticos de su interés.
Estadísticos
Sulfato en la tierra
N Válido 15
Perdidos 0
Media 3.125580
Mediana 2.925800
Moda .4614a
Desviación estándar 2.1521373
Varianza 4,632
Asimetría ,918
Error estándar de asimetría ,580
Curtosis ,495
Error estándar de curtosis 1,121
Rango 7.1515
Mínimo .4614
Máximo 7.6129
Suma 46.8837
Percentiles 25 1.178700
50 2.925800
75 3.824500
Por ejemplo, las puntuaciones de 10 alumnos en tres exámenes han sido las
siguientes:
•
antiguos/Circular.
•
Selecciones la opción Resúmenes para distintas variables
Pase las tres variables a la casilla Las porciones representan.
•
verde que permite pasar a la ventana Mostrado.
Y de clic en aplicar.
•
procedimiento anterior.
El resultado es:
El resultado es:
12.2.1 Histogramas
•
en aceptar.
Active la casilla Mostrar curva normal
El resultado es el siguiente:
•
editar contenido
Puede cambiare el número de intervalos según sea su interés por ejemplo
colocamos la opción de 5 intervalos dando clic en la opción de ocultar
etiqueta de datos y luego clic en agrupaciones/personalizado/número
de intervalos y damos clic en aplicar
A diferencia de los otros gráficos ya vistos, los diagramas de caja hacen énfasis
en las medidas de posición. Es muy útil para hacer comparaciones entre
muestras de distintas poblaciones.
También nos da idea de la simetría de los datos, por ejemplo, una mediana
descentrada dentro del rectángulo nos indicaría una asimetría. En este ejemplo
podemos decir que las distribuciones no son lo suficientemente simétricas. El
diagrama de cajas puede ser editado para su modificación, haciendo doble clic
sobre sus elementos. Se puede alterar título, pie, anotaciones, leyenda y los
valores y etiquetas de los ejes; las líneas como los ejes, las líneas de referencia
y los bordes, la escala, el relleno y trama de la caja y los casos atípicos y
extremos.
Ejercicio 9
1.Calcule la moda, mediana, asimetría y curtuosis del consumo de todos los coches.
3.Construya un diagrama de cajas que sirva para comparar los consumos de cada
tipo de coche dependiendo de su número de cilindros.
4.Construya un histograma del peso de los coches. Superponga una curva normal.
•
descriptivos/Tablas cruzadas.
Se debe trasladar tanto a la fila como a la columna variables
categóricas, para el ejemplo las variables sexo a la fila y categoría
•
laboral catlab a la columna.
Activar la casilla Mostrar los gráficos de barras agrupadas. Y de clic en
Aceptar.
Casos
Categoría laboral
Categoría laboral
Lo que nos indica por ejemplo que en este archivo del 100% de personas
encuestadas el 54,4% son hombres y el 45,6% mujeres.
Categoría laboral
Casos
Categoría laboral
Y el resultado es:
Categoría laboral
Administrativo Seguridad Directivo
1.Del archivo mundo.sav arme una tabla de contingencias con la variable relig
(religión) y región expresar los resultados en valores absolutos y en otra salida en
formato porcentual.
2.Genere una tabla personalizada colocando en la fila la relig(religión) y en la
columna la región y como variable numérica utilizar poblac con los estadígrafos
media, mediana, máximo y mínimo.
3.Genere otro archivo y realizar el mismo trabajo anterior pero seleccionar
previamente en el archivo en base a la variable tasa_nat los casos que sean mayores
a 25.
4.Guarde los archivos de resultados en una carpeta con el nombre eje10un1
Para ello basta con que nos situemos en la casilla correspondiente a la columna
1, fila 40 e insertemos el número 40.
Expresión Descripción
RV.UNIFORM(mín,máx) Devuelve un valor aleatorio de la
distribución uniforme, con el mínimo y el
máximo especificados.
RV.NORMAL(media,desv_típ) Devuelve un valor aleatorio de la
distribución normal, con la media y la
desviación típica especificadas.
RV.GAMMA(forma,escala) Devuelve un valor aleatorio de la
distribución Gamma, con los parámetros
de forma y escala especificados.
RV.CHISQ(gl) Devuelve un valor aleatorio de la
distribución de chi cuadrado, con los
grados de libertad gl especificados.
RV.EXP(forma) Devuelve un valor aleatorio de una
distribución exponencial, con el
parámetro de forma especificado.
RV.WEIBULL(a,b) Devuelve un valor aleatorio de la
distribución de Weibull, con los
parámetros especificados.
RV.BETA(forma1,forma2) Devuelve un valor aleatorio de una
distribución Beta, con los parámetros de
forma especificados.
RV.T(gl) Devuelve un valor aleatorio de la
distribución t de Student, con los grados
de libertad gl especificados.
Ejercicio 11:
En base a los datos de ventas de un mes de marzo presentado ver tabla adjunta),
se desea generar 20 datos aleatorios para pronosticar un mes a futuro.
(RECUERDE QUE ESTAMOS EN MARZO Y EL OBJETIVO ES POR MEDIO
DE LA FUNCIÓN RV.NORMAL GENERAR LAS POSIBLES VENTAS DE
JUNIO).
•
descriptivos/Frecuencias.
Pase la variable ventas al cuadro de dialogo Variables y de clic en
•
estadísticos.
Señale desviación típica y media, de clic en continuar.
Estadísticos
ventas
N Válido 20
Perdidos 0
Media 82,1000
Desviación estándar 12,42620
Con estos resultados genere los 20 números aleatorios con la función rv.normal:
•
•
En el menú principal vaya a Transformar/Calcular variable.
Coloque el nombre de la variable: aleatorio y luego en el cuadro
grupo de funciones seleccione la opción Números aleatorios y
escoja la opción Rv.Normal, pase a la ventana de Expresión
numérica e ingrese los valores correspondiente media= 82.10 y
desviación estándar=12.4262, al darle clic en aceptar se genera los
20 números aleatorios, si en caso no pasa dicha ventana es porque el
separador de los valores ingresados no es el punto sino la coma.
•
•
Debe ingresar en el menú Analizar/Estadísticos descriptivos/Explorar.
En Lista de dependientes, pasamos una variable numérica para nuestro
caso VENTAS, y en la Lista de factores una variable que segmenta para
•
nuestro caso SEMANA.
Luego pulsamos en el botón Estadísticos y activamos las opciones
Descriptivos y Valores atípicos.
Descriptivos
Mediana 80,0000
Varianza 110,000
Mínimo 67,00
Rango 29,00
Mediana 70,0000
Varianza 117,000
Mínimo 57,00
Máximo 85,00
Rango 28,00
Mediana 80,0000
Varianza 70,700
Mínimo 69,00
Máximo 92,00
Rango 23,00
Mediana 96,0000
Varianza 1,700
Mínimo 95,00
Máximo 98,00
Rango 3,00
Valores extremosa
Número del
semana caso Valor
2 5 84,00
Menor 1 1 67,00
2 2 78,00
2 9 75,00
Menor 1 6 57,00
2 7 63,00
2 12 85,00
Menor 1 11 69,00
2 14 80,00b
2 19 97,00
Menor 1 20 95,00
2 16 95,00
Ejercicio 12: