Está en la página 1de 9

PRÁCTICA 2: Introducción y depuración de datos con SPSS.

Al abrir el SPSS aparece una ventaja con celdas similar a una Hoja de Cálculo, sin embargo, el
funcionamiento es diferente. En el paquete estadístico, la organización de las filas y las columnas es
fundamental para que los datos se puedan analizar de la manera correcta. En la parte inferior
izquierda de la ventana aparecen dos pestañas, correspondientes al visor de datos y al visor de
variables. En el visor de variables definiremos todas las características principales de las variables
medidas en la investigación. El visor de datos es, evidentemente, donde se introducirán los datos de
las variables.

EJEMPLO: En una empresa tienen vacante un puesto de trabajo, para cubrirlo hacen una selección
de personal en la que mediante preguntas directas y tests obtienen información de las siguientes
variables: género, edad, nivel de estudios, motivación, capacidad de liderazgo, y adecuación al
puesto de trabajo. Se presentan para ese puesto de trabajo 10 candidatos, que obtienen los siguientes
resultados:

Genero H H M M M H H M M M
Edad 35 34 27 23 45 99 25 36 34 28
Niv.Est U S S S P P U U S S
Moti 7 6 9 15 15 10 11 12 12 8
Cap.Lid 18 20 20 14 10 10 21 18 14 22
Ade.Tra 8 9 10 7 5 5 12 10 9 10

1. Introducción de los datos.


1.1. Definición de las variables:
Nombre: Genere Nombre: Edad
Tipo: Numérico Tipo: Numérico
Valores: 1 → Hombre 2 → Mujer Medida: Escala
Medida: Nominal
Nombre: Estudios Nombre: Motivación
Tipo: Numérico Tipo: Numérico
Valores: 1 → Primarios 2 → Secund 3→ Univer Medida: Escala
Medida: Ordinal
Nombre: Liderazgo Nombre: Adecuación
Tipo: Numérico Tipo: Numérico
Medida: Escala Medida: Escala

1.2. Creación del fichero de datos: Si algún dato no está, no tienes que poner nada en esa celdilla.
Es fundamental que siempre las filas y las columnas representan:

Fila → Sujeto
Columna → Variable o niveles de una variable

1.3. Almacenamiento del fichero:

1
MENU → Archivo → Guardar como
Guarda el fichero de datos en el escritorio del ordenador con el nombre DATOS.

2. Depuración de datos: Se trata de comprobar que todas las variables presentan valores
posibles y probables, es decir, que entre los datos que hemos introducido no hay errores. Hay
que asegurarse de que los valores posibles pero improbables realmente no son un error sino
resultado de una medición correcta. Hay varios procedimientos para detectar posibles errores
(iremos viéndolo a lo largo del curso) pero el más sencillo es el de visualizar las
distribuciones de frecuencias para detectar la posible existencia de valores que la variable no
puede tener o es poco probable que tenga. Da igual seleccionar todas las variables que
hacerlo de una en una.

MENU → Analizar → Estadísticos descriptivos → Frecuencias


En esas distribuciones de frecuencias podemos apreciar algunos errores que tendremos
que tratar de solucionar.

Sexo

Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válidos hombre 4 40,0 40,0 40,0
mujer 6 60,0 60,0 100,0
Total 10 100,0 100,0

edad

Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válidos 23 1 10,0 10,0 10,0
25 1 10,0 10,0 20,0
27 1 10,0 10,0 30,0
28 1 10,0 10,0 40,0
34 2 20,0 20,0 60,0
35 1 10,0 10,0 70,0
36 1 10,0 10,0 80,0
45 1 10,0 10,0 90,0
99 1 10,0 10,0 100,0
Total 10 100,0 100,0

2
niv.est

Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válidos primarios 2 20,0 20,0 20,0
secundarios 5 50,0 50,0 70,0
universitarios 3 30,0 30,0 100,0
Total 10 100,0 100,0

moti

Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válidos 6 1 10,0 10,0 10,0
7 1 10,0 10,0 20,0
8 1 10,0 10,0 30,0
9 1 10,0 10,0 40,0
10 1 10,0 10,0 50,0
11 1 10,0 10,0 60,0
12 2 20,0 20,0 80,0
15 2 20,0 20,0 100,0
Total 10 100,0 100,0

cap.lid

Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válidos 10 2 20,0 20,0 20,0
14 2 20,0 20,0 40,0
18 2 20,0 20,0 60,0
20 2 20,0 20,0 80,0
21 1 10,0 10,0 90,0
22 1 10,0 10,0 100,0
Total 10 100,0 100,0

ade.tra

Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válidos 5 2 20,0 20,0 20,0
7 1 10,0 10,0 30,0
8 1 10,0 10,0 40,0
9 2 20,0 20,0 60,0
10 3 30,0 30,0 90,0
12 1 10,0 10,0 100,0
Total 10 100,0 100,0

En la variable Edad hay un dato que probablemente no es correcto, ya que es imposible que
un candidato al puesto de trabajo tenga 99 años. Habría que repasar la entrevista y los cuestionarios
de esa persona y tratar de averiguar su edad verdadera. Después de hacerlo descubrimos que la edad
real era de 19 años y procedemos a corregirlo, con lo que la nueva distribución queda así.

3
edad

Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válidos 19 1 10,0 10,0 10,0
23 1 10,0 10,0 20,0
25 1 10,0 10,0 30,0
27 1 10,0 10,0 40,0
28 1 10,0 10,0 50,0
34 2 20,0 20,0 70,0
35 1 10,0 10,0 80,0
36 1 10,0 10,0 90,0
45 1 10,0 10,0 100,0
Total 10 100,0 100,0

EJERCICIO 1
En una investigación unos psicólogos querían saber si el “momento de estudio”, es decir, si los
estudiantes estudian por la tarde/noche o por la mañana influye en el rendimiento académico.
Seleccionan entre los estudiantes de 2º de la Facultad de Psicología a 10 que estudian siempre o casi
siempre por la mañana, y a otros 10 que estudian por la tarde/noche, y les preguntan su nota en
Estadística el curso anterior (valores posibles de 0 a 10). Los resultados que obtienen son los que
aparecen en la tabla.

Mañana 3.0 5.8 7.4 4.0 3.5 2.7 8.2 5.8 4.0 4.0
Tarde 5.8 9.6 3.5 5.0 4.5 4.5 7.4 11.2 9.3 8.0

1) Indica las variables independientes y dependientes, y señala el tipo de variable y


escala de medida.
2) Indica el número de filas y columnas que tendrá el fichero de datos en SPSS.
3) Define las variables e introduce los datos. Copia y pega el visor de variables y el visor
de datos.
4) Depura los datos. Copia la tabla de frecuencias obtenida. ¿Detectas algún error?

4
EJERCICIO 2
En un estudio sobre el efecto del “momento de estudio” (mañana/noche) y el “material de apoyo”
(esquemas, resúmenes, sin material complementario) sobre el rendimiento en una asignatura
participaron voluntariamente 6 grupos de estudiantes. Cada grupo estudió durante un curso en unas
condiciones determinadas (mañana-esquemas; mañana-resúmenes; mañana-sin material; noche-
esquemas; noche-resúmenes; noche-sin material) y a final de curso se midió su rendimiento
académico a través de un examen.

Mañana-esquemas 8 7 7 7 9 6 7 7 6 8
Mañana-resúmenes 7 9 9 8 7 8 6 9 8 8
Mañana-sin material 5 6 4 5 7 4 5 6 4 6
Noche-esquemas 3 6 5 5 5 5 5 5 5 5
Noche-resúmenes 3 5 4 2 3 6 3 5 4 4
Noche-sin material 3 3 2 1 4 3 3 2 1 4

1) Indica las variables independientes y dependientes, de qué tipo son y su escala de


medida.
2) ¿Cuántas filas y columnas tendrá el fichero de datos que vas a crear?
3) Define las variables, introduce y depura los datos, y detecta los posibles errores.

EJERCICIO 3
A unos psicólogos que trabajan para la Conselleria d’Educació i Cultura les hacen el encargo
de estudiar la influencia de la asistencia de los niños a las escuelas infantiles a la hora de desarrollar
el lenguaje. Para investigarlo diseñan un estudio en el que participa una muestra de 10 niños de 1º
de Primaria de diversos colegios de la Comunidad Valenciana que contestan un test en el que se
mide su nivel de Vocabulario en una escala de 20 puntos (más puntuación indica mayor cantidad de
vocabulario), así como la cantidad de años que han asistido a la escuela infantil (desde 1 a 5 años) y
el tipo de centro (privado o público). Obtienen los siguientes datos:

Vocabulario 8 12 15 19 10 5 7 13 9 10
Años infantil 2 3 7 2 1 3 5 4 3 4
Centro Pub Pub Pr Pr Pub Pub Pr Pr Pub Pr

1) Indica las variables independientes y dependientes, de qué tipo son y su escala de


medida.
2) ¿Cuántas filas y columnas tendrá el fichero de datos que vas a crear?
3) Define las variables, introduce y depura los datos, y detecta los posibles errores.

5
Solución a la PRÁCTICA 2

EJERCICIO 1

1) Variable Independiente: Momento de estudio (1. Mañana 2. Tarde)


Variable cualitativa, en escala nominal.

Variable Dependiente: Nota (como medida de rendimiento académico).

Variable cuantitativa en escala de intervalo.

2) Matriz con 20 filas y 2 columnas.

3) Visor de variables:

Visor de datos:

6
4) Tablas de frecuencias:

7
En la variable Nota_Estadistica, se ha de corregir el 11,2 ya que la nota más alta seria el 10.

EJERCICIO 2
1) Variable Independiente 1: Momento de estudio (1. Mañana, 2. Noche)
Variable cualitativa, en escala nominal.
Variable Independiente 2: Material de apoyo. (1. esquemas, 2. resúmenes, 3. sin material
complementario).
Variable cualitativa, en escala nominal.
Variable Dependiente: Nota.
Variable cuantitativa en escala de intervalo

2) Matriz con 60 filas y 3 columnas.


3) No hay que modificar ningún dato.

8
EJERCICIO 3

1) Variable Independiente 1: Años de preescolar.


Variable cuantitativa en escala de razón.
Variable Independiente 2: Tipo de centro. (1. Privado, 2. Público)
Variable cualitativa, en escala nominal.
Variable Dependiente: Nivel de vocabulario.
Variable cuantitativa en escala de intervalo

2) Matriz con 10 filas y 3 columnas.


3) Los 7 años de preescolar del tercer niño son imposibles.

También podría gustarte