Está en la página 1de 34

Tema 6

Metodología de la Investigación II

Preparación de los datos


antes del análisis
estadístico
Índice
Esquema 3

Ideas clave 4
6.1. Introducción y objetivos 4
6.2. Los programas estadísticos 5
6.3. Preparación de los datos para el análisis 8
6.4. ¿Cómo incluir los datos en la base de datos? 11
© Universidad Internacional de La Rioja (UNIR)

6.5. Depuración de los datos 22


6.6. Referencias bibliográficas 25

A fondo 26

Actividades 28

Test 33
Esquema
© Universidad Internacional de La Rioja (UNIR)

Metodología de la Investigación II
3
Tema 6. Esquema
Ideas clave

6.1. Introducción y objetivos

Uno de los pasos previos antes de realizar los análisis estadísticos es preparar los
datos. El primer paso es elegir un programa informático apropiado a nuestras
necesidades. Después, incorporar los datos a este programa y, finalmente, revisar
que los datos estén correctos y que no haya ningún error (preprocesamiento).

Este tema se va a dedicar a explicar estos pasos, que son esenciales para asegurar
que después podamos realizar correctamente los análisis descriptivos e inferenciales.
Esta fase de preparación de los datos antes de los análisis es fundamental, ya que
garantiza que los resultados que se obtengan posteriormente sean válidos (Martínez,
Chacón y Castellanos y López, 2014).

Los objetivos de este tema son los siguientes:

 Objetivo 1: aprender a seleccionar el programa estadístico adecuado.


 Objetivo 2: conocer la forma de incorporar correctamente los datos en una base
de datos.
 Objetivo 3: aprender a explorar los datos antes de realizar los análisis estadísticos.
 Objetivo 4: conocer la forma de importar datos a otro programa estadístico

El preprocesamiento de los datos es «el conjunto de procedimientos que


convierten la información obtenida en la recogida de las respuestas de los
participantes en datos que pueden ser procesados por un programa de
© Universidad Internacional de La Rioja (UNIR)

análisis estadístico» (Martínez et al., 2014, p. 44).

Metodología de la Investigación II
4
Tema 6. Ideas clave
6.2. Los programas estadísticos

El primer paso es conocer las distintas opciones que existen hoy en día para realizar
los análisis estadísticos: los programas estadísticos. En el mercado existen diversos
programas que sirven para este fin. En esta asignatura vamos a destacar tres de ellos:
JASP, PSPP y SPSS.

Un programa estadístico muy recomendable es JASP (https://jasp-


stats.org/download/). Es un programa gratuito pero muy completo, ya que se pueden
realizar la mayoría de los análisis tanto paramétricos como no paramétricos y
funciona con todos los sistemas operativos (Windows, MAC y Linux) (ver figura 1).
Aunque tiene dos inconvenientes: solo está disponible en inglés (pero es muy
intuitivo de manejar) y no permite la entrada de datos directamente, por lo que hay
que importarlos desde otro programa como Excel (hoja de cálculo) de Office
(Microsoft).
© Universidad Internacional de La Rioja (UNIR)

Figura 1. Programa JASP (v0.10.2).

Metodología de la Investigación II
5
Tema 6. Ideas clave
Encontrarás el enlace para descargar el programa estadístico JASP en la sección A
Fondo, así como un tutorial de cómo descargar y manejar este programa.

Vídeo. Instalación y manejo del programa JASP.

Accede al vídeo a través del aula virtual

Una alternativa muy interesante es el programa estadístico GNU PSPP


(https://www.gnu.org/software/pspp/). También es gratuito, funciona con diversos
sistemas operativos (incluido Windows y Mac) y está disponible en español. El
inconveniente principal de este programa es que no incluye algunos de los
estadísticos no paramétricos, como la correlación de Spearman o el estadístico de
comparación U de Mann-Whitney (ver figura 2), análisis utilizados muy
habitualmente. Este programa es muy similar al programa IBM SPSS Statistics en su
manejabilidad, pero no es tan completo.
© Universidad Internacional de La Rioja (UNIR)

Metodología de la Investigación II
6
Tema 6. Ideas clave
Figura 2. Programa GNU PSPP (v3).

Encontrarás el enlace para descargar el programa PSPP en la sección A Fondo, así


como un tutorial de cómo descargar e instalar este programa.
© Universidad Internacional de La Rioja (UNIR)

Vídeo. Descarga e instalación del programa PSPP.

Accede al vídeo a través del aula virtual

Metodología de la Investigación II
7
Tema 6. Ideas clave
Existen otras posibilidades, como IBM SPSS Statistics, que es el programa más
utilizado dentro de las ciencias sociales, ya que es el más completo, pero es de pago.

Encontrarás el enlace a la página web del programa SPSS en la sección A Fondo.

6.3. Preparación de los datos para el análisis

En la fase de preparación de los datos antes de los análisis estadísticos se pueden


distinguir tres etapas fundamentales: codificación de los datos, creación del archivo
y depuración de los datos (ver figura 3).

Figura 3. Etapas de la preparación de los datos.

El primer paso es codificar los datos, que se explicará en este punto del temario. La
creación del archivo dependerá del tipo de programa informático que se elija (se
explicará en el siguiente punto del tema). La última etapa es la depuración de los
© Universidad Internacional de La Rioja (UNIR)

datos (y se expondrá en el último apartado del tema).

La codificación de los datos consiste en elaborar un libro de codificación, también


llamado codebook, que consiste en realizar un listado de todas las variables que se
han medido en la investigación indicando su nombre, su etiqueta (forma abreviada)

Metodología de la Investigación II
8
Tema 6. Ideas clave
y los valores numéricos asociados a las distintas respuestas (en su caso). Además, se
deben crear los identificadores para cada uno de los participantes, ya que hay que
mantener el anonimato (se le asignará un código) (ver tabla 1).

Según el código ético, no se puede incluir el nombre completo (nombre y apellidos)


de los participantes, por lo que se recomienda utilizar códigos (por ejemplo,
«DCA001» o «sujeto 1»). Hay procedimientos más complejos donde se recolecta
determinada información del participante y, en función de esta, se elabora el código.
Por ejemplo, un código formado por la inicial del nombre del abuelo materno (D), la
inicial del nombre de la abuela materna (J), el día del cumpleaños de la madre (22) y
el día del cumpleaños del padre (13) (código final: DJ2213).

Variable Etiqueta Instrucciones de codificación

1. Inicial del nombre del abuelo materno.


2. Inicial del nombre de la abuela materna.
Identificación ID
3. Día del cumpleaños de la madre.
4. Día del cumpleaños del padre
0 = niño
Sexo Sexo
1 = niña

Edad Edad En años

Funciones ejecutivas FFEE Percentil

0 = bajo
Inteligencia emocional IE 1 = medio
2 = alto

Tabla 1. Ejemplo de libro de codificación.

«Dentro de cada variable, cada respuesta debe tener un código numérico que es el
que se introduce en el editor de datos o base de dato» (Martínez et al., 2014, p. 46).
© Universidad Internacional de La Rioja (UNIR)

En la investigación cuantitativa se manejan variables cualitativas (nominales), cuasi-


cuantitativas (ordinales) y cuantitativas. Para incluir los datos en cualquiera de los
programas informáticos se necesita codificar las variables cualitativas y cuasi-
cuantitativas ya que no están representadas mediante números. La codificación no

Metodología de la Investigación II
9
Tema 6. Ideas clave
implica que las variables se conviertan en cuantitativas, siguen siendo cualitativas o
cuasi-cuantitativas, pero se les asigna un código numérico para poder incorporarlas
en una base de datos y poder analizarlas estadísticamente. Por ello, los análisis que
se pueden realizar con ellas son diferentes; estos análisis se denominan no
paramétricos (recuerda que ese término no denomina a las variables sino a los
análisis que se hacen con ellas).

Vamos a ver un ejemplo de codificación de una variable cualitativa (llamada también


categórica o nominal). La variable género se recoge mediante las opciones masculino
o femenino. A masculino le podemos asignar el valor de 0 y a femenino el valor de 1.
Estos códigos serán los que se utilicen para incorporar los datos en la base de datos
(ver figura 4).

Figura 4. Codificación de una variable cualitativa (nominal o categórica).

Un ejemplo de codificación de una variable cuasi-cuantitativa (también llamada


ordinal) es el nivel socioeconómico, que puede registrarse como bajo, medio-bajo,
medio, medio-alto y alto. Le tenemos que asignar un valor numérico a cada valor de
la variable. Al nivel bajo se le puede asignar el 0, a medio-bajo el 1, a medio el 2, a
medio-alto el 3 y a alto el 4 (ver figura 5).
© Universidad Internacional de La Rioja (UNIR)

Figura 5. Codificación de una variable cuasi-cuantitativa (ordinal).

Metodología de la Investigación II
10
Tema 6. Ideas clave
Hay que tener un especial cuidado en incorporar las variables que forman los grupos
o condiciones de nuestro estudio (es decir, las variables independientes, como, por
ejemplo, grupo control/grupo experimental o grupo con alta creatividad/baja
creatividad, etc.). En este caso hay que crear una variable de agrupación. Se puede
denominar simplemente «grupos» o cualquier palabra que nos haga entender a qué
variable se refiere (por ejemplo, tipo de intervención, tipo de colegio, etc.).

La naturaleza de esta variable es cualitativa (nominal), y, como tal, tendremos que


asignar un número a cada grupo (grupo experimental=1, grupo control=2, o grupo
alta creatividad=1, grupo baja creatividad=2). De esta forma, todos los sujetos de la
investigación (independientemente del grupo) tienen que aparecer en la misma tabla
u hoja de datos. No es posible realizar comparaciones de grupo cuando los datos
están separados en tablas diferentes (diferentes archivos o, en el caso de Excel, en
diferentes hojas).

6.4. ¿Cómo incluir los datos en la base de datos?

Teniendo claro cómo se van a codificar los datos, hay que pasar a la etapa de la
creación del archivo. Según el programa estadístico que hayamos elegido, este
proceso se va a realizar de forma diferente. A continuación, se encuentra la
explicación de cómo incluir los datos con el programa Excel, con PSPP/SPSS y con
JASP.

Una base de datos se puede definir como un conjunto de datos organizados


que permiten la gestión de la información que contiene.
© Universidad Internacional de La Rioja (UNIR)

¿Cómo incluir datos en Excel?

Excel es un programa incluido en el paquete Office de Microsoft muy útil para el


tratamiento de datos. Es una hoja de cálculo formada por columnas y filas.

Metodología de la Investigación II
11
Tema 6. Ideas clave
El primer paso es crear las distintas variables en forma de columnas, para
posteriormente incorporar los datos de cada uno de los sujetos participantes en filas
(ver figura 6). Por tanto, y como suele decirse, cada columna es una variable y cada
fila un sujeto.

Figura 6. Ejemplo de datos en Excel.

Siempre, en la primera columna, se incorpora la información de identificación del


sujeto (ID). De esta forma las distintas variables del estudio se irán ordenando por
columnas y los distintos participantes por filas (ver figura 7).

Figura 7. Ejemplo de datos en filas y columnas en Excel.


© Universidad Internacional de La Rioja (UNIR)

Metodología de la Investigación II
12
Tema 6. Ideas clave
Para organizar la matriz de datos en Excel hay que tener en cuenta una serie de
recomendaciones:

 Solo en la primera fila y en la primera columna pueden aparecer letras. Es decir, la


primera fila está destinada a poner los nombres de las distintas variables (ver
figura 7) y la primera columna está destinada a la identificación de los sujetos. En
el resto de las casillas solo puede haber números, por ese motivo hay que codificar
las variables cualitativas y cuasi-cuantitativas como se ha explicado
anteriormente.

 Todos los datos deben estar en una sola hoja. Excel tiene la posibilidad de crear
distintas hojas (ver figura 8). Las distintas hojas o pestañas se pueden seleccionar
desde la parte de abajo (hoja 1, hoja 2…). Por defecto vienen creadas tres, pero se
pueden eliminar y crear las que se quieran, incluso cambiarlas de sitio. El nombre
de estas hojas se puede modificar, por lo que a la hoja donde tenemos todos los
datos la podemos denominar «DATOS». Es muy útil crear una hoja diferente para
los códigos utilizados (libro de códigos); es decir, las transformaciones que hemos
utilizado para los datos cualitativas y cuasi-cuantitativas (por ejemplo, niño=1,
niña=2). Así, se puede consultar el significado de estos valores fácilmente (ver
figura 9). Un error muy común es utilizar una hoja para cada variable o una hoja
para cada grupo de sujetos. Todos los datos deben estar en la misma hoja.
© Universidad Internacional de La Rioja (UNIR)

Figura 8. Hojas/pestañas del Excel.

Metodología de la Investigación II
13
Tema 6. Ideas clave
Figura 9. Hoja de valores en Excel.

Encontrarás un tutorial de cómo incluir los datos en el programa Excel en la sección


A fondo.

Vídeo. Cómo incluir datos en Excel.

Accede al vídeo a través del aula virtual


© Universidad Internacional de La Rioja (UNIR)

Una vez creadas todas las variables e incluidos los identificadores de los participantes,
se procede a completar todos los datos de la matriz, teniendo mucho cuidado de no
equivocarnos de variable ni de sujeto.

Metodología de la Investigación II
14
Tema 6. Ideas clave
Los datos creados en Excel se pueden exportar a otros programas como JASP y
PSPP/SPSS.

¿Cómo incluir datos en SPSS/PSPP?

Como se ha comentado anteriormente, el manejo del programa SPSS y PSPP es muy


similar. A continuación, se explicarán los distintos conceptos partiendo de SPSS,
aunque todo es extrapolable a PSPP. Existen dos formas de pasar datos a SPSS/PSPP:

 Importados de otro programa como, por ejemplo, Excel. SPSS tiene una opción
para importar un archivo .xls (o cualquier otro). En el menú «Archivo», se
selecciona la opción «Abrir» y, a continuación, seleccionar «Datos» (ver figura 10).
Se despliega una ventana donde buscaremos la carpeta donde se encuentra el
archivo Excel que queremos importar a SPSS. Para que aparezca el archivo,
tendremos que seleccionar el tipo de archivo: seleccionar Excel (.xls). Una vez
seleccionado, pulsaremos «Abrir» y se importarán todos los datos. Es importante
revisar cada una de las variables creadas y, además, las variables nominales y
ordinales hay que codificarlas para asignarle el código correspondiente (por
ejemplo, 1=niño, 2=niña).
© Universidad Internacional de La Rioja (UNIR)

Figura 10. Importar datos del Excel al SPSS.

Metodología de la Investigación II
15
Tema 6. Ideas clave
 Crear la matriz de datos directamente. A la hora de abrir el programa PSPP o SPSS
se abrirá una tabla vacía. En la parte de abajo tendremos la opción de seleccionar
dos hojas: una «Vista de datos» y una «Vista de variables» (ver figura 11). Primero
se tienen que crear las variables en la «Vista de variables», para posteriormente
completar la matriz en la «Vista de datos». Estas pestañas no son configurables y
están predeterminadas de antemano. En la parte superior se encuentran los
menús desplegables.

Figura 11. Aspecto visual del SPSS.

En la pestaña «Vista de datos» se incluyen los datos de la investigación (cada una de


las variables medidas en los sujetos). Igual que en el Excel, la primera columna estará
destinada a identificar a los participantes del estudio y en las siguientes columnas
cada una de las variables medidas. En las diferentes líneas se incluyen los datos de
distintos participantes (ver figura 12).
© Universidad Internacional de La Rioja (UNIR)

Metodología de la Investigación II
16
Tema 6. Ideas clave
Figura 12. Vista de datos.

En la «Vista de variables» se configuran las distintas variables que aparecen en la


«Vista de datos» (figura 13).
© Universidad Internacional de La Rioja (UNIR)

Figura 13. Vista de variables.

Metodología de la Investigación II
17
Tema 6. Ideas clave
En esta hoja aparecen en cada línea las distintas variables que luego aparecen en la
«Vista de datos» por columnas. En la línea 1 se debe incluir la identificación del sujeto
(ID) para que aparezca en primer lugar en la «Vista de datos». Debajo aparecen de
forma consecutiva todas las variables del estudio. Se pueden configurar una serie de
parámetros para que la variable sea lo más ajustada posible:

 Nombre de la variable: este nombre suele ser corto y no puede contener espacios
ni caracteres especiales (por ejemplo: memoria, edad, etc.). Este nombre es el que
aparecerá en las distintas columnas de la «Vista de datos».

 Tipo de variable: se puede elegir el formato de la variable (numérica, coma, punto,


notación científica, fecha, moneda, cadena, etc.). Según como sea la variable,
elegiremos un formato u otro. Normalmente, para poner los datos de
identificación del alumno hay que seleccionar «Cadena» para poder incluir letras
en la casilla. En el resto de las variables se puede utilizar la opción «Numérica».

 N.º de decimales: sería el n.º de decimales que queremos tener visibles en la


«Vista de datos». En el caso de números enteros y variables nominales/ordinales,
es mejor no incluir ningún decimal.

 Etiquetas: se exponen todas las etiquetas que se hayan asociado a los valores
asignados (Género. 1=masculino/2=femenino). También se puede utilizar para
incorporar el nombre de la variable de forma más amplia, sin restricciones, a
diferencia de la primera columna «Nombre» donde solo se puede incluir el
nombre de la variable de forma corta sin espacios y sin caracteres especiales (por
ejemplo, «identificación sujeto»). Otro ejemplo sería si en la primera columna se
ha incorporado el nombre de la variable siguiente «mm_visual_cp», en la casilla
© Universidad Internacional de La Rioja (UNIR)

«Etiqueta» podemos poner el nombre más extendido: «memoria visual a corto


plazo».

 Valores: esta configuración es importante para las variables nominales y ordinales,


ya que nos permite asociar un número a una palabra, es decir, codificar las

Metodología de la Investigación II
18
Tema 6. Ideas clave
variables (1=hombres). Si pulsamos en los puntos sucesivos de esta casilla, se
despliega una ventana (figura 14). En esta ventana se puede asociar el número que
el investigador haya vinculado a cada una de las respuestas de la variable. En este
caso hemos elegido el ejemplo del género (1=masculino y 2=femenino). En la
casilla «Valor» incluimos el número elegido y en «Etiqueta» la palabra que
queremos asociar al número. A continuación, se pulsa la casilla «Añadir». Una vez
terminados de configurar todos los valores, se pulsa «Aceptar».

Figura 14. Configuración de los valores.

Evidentemente, el primer paso a la hora de incluir datos en el SPSS es crear y


configurar las variables en la «Vista de variables». Una vez configuradas todas las
variables, se vuelve a pasar a la «Vista de datos» y se procede a incluir todos los datos
de las variables creadas por cada uno de los sujetos evaluados. En el caso de las
variables nominales y ordinales es posible mostrar los datos numéricos o los datos
con las etiquetas asociadas. Para cambiar esta configuración simplemente
© Universidad Internacional de La Rioja (UNIR)

pulsaremos el icono de etiqueta en la parte superior de la ventana (figura 15).

Metodología de la Investigación II
19
Tema 6. Ideas clave
Figura 15. Icono de etiquetas de valor.

Para realizar los distintos análisis estadísticos hay que pulsar el menú de «Analizar» y
se desplegarán todas las opciones disponibles.

Otra cuestión importante que debemos mencionar es que en SPSS los datos (tanto la
«Vista de datos» como la «Vista de variables») se guardarán en un archivo diferente
que los resultados que se obtengan tras los análisis estadísticos. Es decir, por un lado,
© Universidad Internacional de La Rioja (UNIR)

se guardarán los datos de la hoja («Vista de datos» y la «Vista de variables») y, por


otro lado, los resultados que se vayan obteniendo mediante los análisis estadísticos.
Por ese motivo, hay que guardar los datos en un archivo (con extensión .sav) y los
resultados por otro lado (extensión .spo). Solamente con el programa SPSS se pueden
abrir estos dos archivos.

Metodología de la Investigación II
20
Tema 6. Ideas clave
Encontrarás un tutorial de cómo crear una base de datos en PSPP en la sección A
fondo.

Vídeo. Crear una base de datos en PSPP.

Accede al vídeo a través del aula virtual

El programa JASP

El programa JASP no permite introducir los datos directamente en el programa por lo


que es necesario importarlo desde otro programa como, por ejemplo, Excel. También
se puede realizar desde PSPP o SPSS.

Encontrarás un tutorial de cómo importar datos desde Excel a JASP en la sección A


fondo.
© Universidad Internacional de La Rioja (UNIR)

Vídeo. Cómo importar datos desde Excel a JASP.

Accede al vídeo a través del aula virtual

Metodología de la Investigación II
21
Tema 6. Ideas clave
Una vez importados los datos, es necesario asignar la escala de medida de los datos
(seleccionar si es nominal, ordinal o escala para las variables cuantitativas). Para ello
hay que pulsar sobre el símbolo del nombre de la variable y se desplegará el menú
donde se puede asignar la escala de medida (ver figura 16).

Figura 16. Programa JASP.

6.5. Depuración de los datos

Una vez introducidos todos los datos en el programa estadístico es necesario dedicar
un tiempo a revisar que no se hayan producido errores que pueden influir en los
resultados. Es muy frecuente que se cometan errores como, por ejemplo, introducir
un número de más (11 en vez de 1) o equivocarse de columna. Hacer una revisión
© Universidad Internacional de La Rioja (UNIR)

profunda de los datos garantiza su calidad (Martínez et al., 2014).

El primer paso es detectar valores fuera de rango de la variable (valores anómalos):


es decir, datos que no son coherentes con la medida realizada. Estos errores se
pueden deber a un error de recogida de la información o al pasar los datos al

Metodología de la Investigación II
22
Tema 6. Ideas clave
programa informático. Por ejemplo, si estamos registrando el rendimiento
académico de 0 a 10 y tenemos un valor de 15. Estos errores se pueden detectar
fácilmente mediante los siguientes procedimientos:

 Para las variables cualitativas (nominales) y cuasi-cuantitativas (ordinales) es


necesario obtener los descriptivos de frecuencias. En la tabla que se obtiene se
pueden observar todos los valores obtenidos en esa variable (frecuencia y
porcentaje) y detectar si hay algún valor extraño.

 Para las variables cuantitativas es necesario obtener los estadísticos descriptivos


de media, desviación típica, mínimo y máximo. Al observar los datos de mínimo y
máximo podemos detectar si hay algún valor por encima o por debajo que no
debería estar (fuera de rango).

Si detectamos anormalidades mediante estos procedimientos indicados, debemos


localizar estos datos y rectificarlos. Un truco para poder localizarlos rápidamente en
el caso de que se tengan muchos sujetos en la base de datos es ordenar los casos de
mayor a menor (función incluida en todos los programas estadísticos).

El segundo paso es analizar los casos perdidos. A veces a la hora de evaluar en un


mismo sujeto varias medidas, es posible que algún dato no se pueda obtener o no
sea válido utilizar esa puntuación. Por ejemplo, el niño no entendió las instrucciones
de esa prueba o no le fue aplicada por falta de tiempo. Si el número de casos es bajo,
no tendrá repercusión sobre los resultados, pero, si es alto, deberemos valorar en
profundidad tomar medidas o incluso eliminar una variable determinada. Para ello
debemos analizar, por un lado, la pérdida de datos por cada sujeto, y, por otro, los
datos perdidos por cada variable. Si la pérdida de datos es inferior al 10 % se puede
© Universidad Internacional de La Rioja (UNIR)

ignorar, pero si es superior al 10 % tendremos que valorar si eliminar o no el caso o


la variable.

Metodología de la Investigación II
23
Tema 6. Ideas clave
Existen procedimientos para tratar los casos perdidos con baja incidencia (Martínez
et al., 2014):

 Utilizar solamente los casos con datos completos: existe una opción en los
programas estadísticos donde indicamos que solamente se utilicen los datos
completos para realizar los análisis estadísticos.

 Sustitución por otros valores: las más frecuentes son las que sustituyen el valor
por la media de todos los casos o por el caso más parecido. También se pueden
utilizar técnicas más sofisticadas y complejas, como las técnicas de imputación
(como regresión o imputación propiamente dichas), donde se utiliza información
de otras variables.

Algunas recomendaciones para tratar con casos perdidos los puedes encontrar en la
figura 17.

Figura 17. Recomendaciones para tratar los casos perdidos. Fuente: Martínez et al. (2014).

Como paso final dentro de la depuración de los datos, nos podemos encontrar con la
© Universidad Internacional de La Rioja (UNIR)

necesidad de crear nuevas variables generadas por la combinación de otras


variables. Por ejemplo, queremos realizar una media de todas las asignaturas
incluidas de forma que tengamos que combinar tres asignaturas (Lengua,
Matemáticas e Inglés) para crear una nueva variable denominada como «Media
Rendimiento Académico». Otra posibilidad es incluir la suma de diez puntuaciones

Metodología de la Investigación II
24
Tema 6. Ideas clave
en una puntuación total. Para realizar este procedimiento seleccionaremos la opción
de «Transformar y Calcular variable» en el programa informático PSPP/SPSS e
incluiremos la fórmula matemática que queremos aplicar para la nueva variable,
indicando las variables ya creadas que queremos utilizar. Por ejemplo, «lengua +
matemáticas + ingles/3».

6.6. Referencias bibliográficas

GNU PSPP [Software]. (n. d.): Free Software Foundation. Recuperado de


https://www.gnu.org/software/pspp/

IBM SPSS Statistics for Windows (Versión 25.0) [Software]. Armonk, NY: IBM Corp.

JASP (Versión 0.10.2) [Software]. Ámsterdam: The JASP Team. Recuperado de


https://jasp-stats.org/

Martínez, R., Chacón, J. C. y Castellanos, M. A. (2014). Análisis de datos en Psicología


y Ciencias de la Salud (Vol. I). Madrid: Editorial EOS.
© Universidad Internacional de La Rioja (UNIR)

Metodología de la Investigación II
25
Tema 6. Ideas clave
A fondo
Programa estadístico JASP

JASP. Página web oficial. https://jasp-stats.org/

En el siguiente enlace puedes acceder a la página web del programa estadístico JASP,
donde encontrarás información sobre el programa, cómo descargarlo y manuales
explicativos para su uso.

Programa estadístico PSPP

GNU PSPP. Página web oficial. https://www.gnu.org/software/pspp/

En el siguiente enlace puedes acceder a la página web del programa estadístico PSPP,
donde encontrarás información sobre el programa, cómo descargarlo y manuales
explicativos para su uso.
© Universidad Internacional de La Rioja (UNIR)

Metodología de la Investigación II
26
Tema 6. A fondo
Programa estadístico SPSS

IBM: SPSS. Página web oficial. https://www.ibm.com/es-es/products/spss-statistics

En el siguiente enlace puedes acceder a la página web del programa estadístico SPSS,
donde encontrarás información sobre el programa y cómo comprarlo. Hay disponible
una demo gratuita de quince días de duración.
© Universidad Internacional de La Rioja (UNIR)

Metodología de la Investigación II
27
Tema 6. A fondo
Actividades

Trabajo. Elaboración de una base de datos en Excel

Objetivos

El objetivo de esta actividad es que los alumnos practiquen la preparación de una


base de datos siguiendo todos los pasos explicados en el tema.

Descripción de la actividad y pautas de elaboración

El alumno tendrá que elaborar una base de datos en el programa Excel con los datos
que se le proporcionará de una investigación siguiendo las indicaciones del temario.
Para realizar esta tarea el alumno tendrá que seguir el siguiente esquema:

 Consultar los datos proporcionados para elaborar el trabajo (a continuación).

 Abrir el programa Excel.

 Crear las distintas variables por columnas según lo explicado en el tema.

 Crear una hoja en Excel para incluir el libro de codificación y codificar las variables
que sean necesarias según lo explicado en el tema.
© Universidad Internacional de La Rioja (UNIR)

 Crear un identificador (ID) por cada sujeto compuesto por la inicial del padre, la
inicial de la madre y el año de nacimiento del abuelo materno.

 Incluir los datos por cada sujeto (en cada fila, un sujeto).

Metodología de la Investigación II
28
Tema 6. Actividades
Datos de la actividad

Los datos para incluir en la base de datos son los siguientes:

Sujeto 1. Nombre: Daniel; nombre de la madre: Silvia; nombre del padre: Antonio;
fecha nacimiento del abuelo: 1950; edad: 10; género: masculino; memoria de
trabajo: 45; calificación lengua: aprobado; nivel socioeconómico: alto; creatividad:
110.

Sujeto 2. Nombre: Antonia; nombre de la madre: Alejandra; nombre del padre: Javier;
fecha nacimiento del abuelo: 1945; edad: 11; género: femenino; memoria de trabajo:
62; calificación lengua: notable; nivel socioeconómico: alto; creatividad: 100.

Sujeto 3. Nombre: David; nombre de la madre: Verónica; nombre del padre: Evo;
fecha nacimiento del abuelo: 1965; edad: 10; género: masculino; memoria de
trabajo: 53; calificación lengua: suspenso; nivel socioeconómico: medio; creatividad:
95.

Sujeto 4. Nombre: Martín; nombre de la madre: Carmen; nombre del padre: Aitor;
fecha nacimiento del abuelo: 1968; edad: 10; género: masculino; memoria de
trabajo: 70; calificación lengua: sobresaliente; nivel socioeconómico: alto;
creatividad: 120.

Sujeto 5. Nombre: Alberto; nombre de la madre: Andrea; nombre del padre:


Francisco; fecha nacimiento del abuelo: 1951; edad: 11; género: masculino; memoria
de trabajo: 42; calificación lengua: suspenso; nivel socioeconómico: bajo; creatividad:
103.
© Universidad Internacional de La Rioja (UNIR)

Sujeto 6. Nombre: Alejandro; nombre de la madre: Dolores; nombre del padre:


Salvador; fecha nacimiento del abuelo: 1948; edad: 9; género: masculino; memoria
de trabajo: 48; calificación lengua: notable; nivel socioeconómico: medio;
creatividad: 99.

Metodología de la Investigación II
29
Tema 6. Actividades
Sujeto 7. Nombre: Manuela; nombre de la madre: Manuela; nombre del padre: José;
fecha nacimiento del abuelo: 1958; edad: 10; género: femenino; memoria de trabajo:
50; calificación lengua: notable; nivel socioeconómico: medio; creatividad: 110.

Sujeto 8. Nombre: Teresa; nombre de la madre: Silvia; nombre del padre: Alberto;
fecha nacimiento del abuelo: 1960; edad: 9; género: femenino; memoria de trabajo:
46; calificación lengua: aprobado; nivel socioeconómico: medio; creatividad: 120.

Sujeto 9. Nombre: Maite; nombre de la madre: Sofía; nombre del padre: Juan; fecha
nacimiento del abuelo: 1930; edad: 11; género: femenino; memoria de trabajo: 60;
calificación lengua: sobresaliente; nivel socioeconómico: alto; creatividad: 115.

Sujeto 10. Nombre: Carlos; nombre de la madre: Manuela; nombre del padre:
Bernardo; fecha nacimiento del abuelo: 1949; edad: 10; género: masculino; memoria
de trabajo: 54; calificación lengua: suspenso; nivel socioeconómico: bajo; creatividad:
95.

Sujeto 11. Nombre: Justo; nombre de la madre: Carmen; nombre del padre: Joaquín;
fecha nacimiento del abuelo: 1940; edad: 9; género: masculino; memoria de trabajo:
53; calificación lengua: notable; nivel socioeconómico: medio; creatividad: 118.

Sujeto 12. Nombre: Daniela; nombre de la madre: Eva; nombre del padre: Antonio;
fecha nacimiento del abuelo: 1954; edad: 10; género: femenino; memoria de trabajo:
45; calificación lengua: notable; nivel socioeconómico: alto; creatividad: 100.

Sujeto 13. Nombre: Berta; nombre de la madre: Natalia; nombre del padre: Miguel;
fecha nacimiento del abuelo: 1946; edad: 11; género: femenino; memoria de trabajo:
© Universidad Internacional de La Rioja (UNIR)

58; calificación lengua: aprobado; nivel socioeconómico: bajo; creatividad: 95.

Sujeto 14. Nombre: Raúl; nombre de la madre: Rocío; nombre del padre: Rubén;
fecha nacimiento del abuelo: 1954; edad: 9; género: masculino; memoria de trabajo:
38; calificación lengua: suspenso; nivel socioeconómico: alto; creatividad: 105.

Metodología de la Investigación II
30
Tema 6. Actividades
Sujeto 15. Nombre: Agustín; nombre de la madre: Ángela; nombre del padre:
Baltasar; fecha nacimiento del abuelo: 1949; edad: 10; género: masculino; memoria
de trabajo: 57; calificación lengua: sobresaliente; nivel socioeconómico: medio;
creatividad: 106.

Sujeto 16. Nombre: Fabio; nombre de la madre: Gabriela; nombre del padre:
Fernando; fecha nacimiento del abuelo: 1960; edad: 9; género: masculino; memoria
de trabajo: 49; calificación lengua: notable; nivel socioeconómico: medio;
creatividad: 109.

Sujeto 17. Nombre: Juana; nombre de la madre: María; nombre del padre: Luis; fecha
nacimiento del abuelo: 1947; edad: 10; género: femenino; memoria de trabajo: 50;
calificación lengua: sobresaliente; nivel socioeconómico: bajo; creatividad: 114.

Sujeto 18. Nombre: Noel; nombre de la madre: Rafaela; nombre del padre: Eduardo;
fecha nacimiento del abuelo: 1936; edad: 11; género: masculino; memoria de
trabajo: 53; calificación lengua: aprobado; nivel socioeconómico: alto; creatividad:
115.

Sujeto 19. Nombre: Roberta; nombre de la madre: Belén; nombre del padre: Roberto;
fecha nacimiento del abuelo: 1950; edad: 11; género: femenino; memoria de trabajo:
60; calificación lengua: sobresaliente; nivel socioeconómico: alto; creatividad: 120.

Sujeto 20. Nombre: Salvador; nombre de la madre: Silvia; nombre del padre: Samuel;
fecha nacimiento del abuelo: 1962; edad: 9; género: masculino; memoria de trabajo:
42; calificación lengua: aprobado; nivel socioeconómico: bajo; creatividad: 100.
© Universidad Internacional de La Rioja (UNIR)

Metodología de la Investigación II
31
Tema 6. Actividades
Rúbrica de corrección de la actividad

0 1 2 3
Incluye los
Incluye los
nombres de las
nombres de las Incluye los
No incluye todas variables por
variables por nombres de las
las variables o no columnas y
columnas, pero variables por
de forma codifica
utiliza más de una columnas y
Creación de las correcta (no correctamente
línea en Excel. codifica
variables utiliza columnas todas las variables
Codifica las correctamente
correctamente y no codifica las ordinales y
variables las variables. El
variables nominales, pero el
nominales y nombre de la
nominales ni nombre
ordinales, pero no variable es
ordinales). seleccionado no
correctamente apropiado.
es apropiado
(utiliza palabras).
(demasiado largo).
Utiliza el código
ID
correctamente
Creación del Incluye el
Utiliza «sujeto x» Utiliza el código ID (formado por la
identificador nombre del
como indicado, pero primera inicial
del sujeto sujeto. No utiliza
identificador. comete errores. del padre y de la
correctamente el anonimato.
madre y el año
de nacimiento
del abuelo).
No incluye los Incluye todos los Incluye todos los
Inclusión de datos de cada datos, pero datos, pero Incluye todos los
todos los datos sujeto y comete comete muchos comete algunos datos sin errores.
muchos errores. errores errores.
Inclusión del 1
libro de Inclusión del libro de codificación en una hoja diferente en el Excel donde se
© Universidad Internacional de La Rioja (UNIR)

codificación indiquen la codificación de las variables ordinales y nominales.

Tabla 1. Rúbrica de evaluación.

Extensión máxima: se enviará el archivo en formato Excel (.xls).

Metodología de la Investigación II
32
Tema 6. Actividades
Test
1. ¿Qué programa informático para realizar análisis estadísticos es gratuito y es muy
completo?
A. JASP.
B. PSPP.
C. SPSS.

2. ¿Cuál es el programa estadístico más utilizado en el ámbito de las ciencias sociales,


pero es de pago?
A. JASP.
B. PSPP.
C. SPSS.

3. ¿Cuál es el último paso para preparar los datos antes de los análisis de datos?
A. Codificar los datos.
B. Crear la base de datos.
C. Depurar los datos.

4. ¿Para qué sirve el libro de codificación?


A. Para saber cuántos sujetos han participado en el estudio.
B. Para saber cuántos datos se han perdido en el estudio.
C. Para saber los valores numéricos asociados a las distintas respuestas.

5. ¿Qué programa no permite introducir los datos directamente?


A. JASP.
© Universidad Internacional de La Rioja (UNIR)

B. PSPP.
C. SPSS.

Metodología de la Investigación II
33
Tema 6. Test
6. ¿Por qué motivos se pueden dar valores fuera de rango?
A. Por errores en la recogida de la información.
B. Por errores a la hora de pasar los datos al programa informático.
C. Ambas son correctas.

7. ¿Qué procedimiento se puede utilizar para detectar valores fuera de rango en


variables ordinales?
A. Analizar las frecuencias y porcentajes.
B. Analizar el mínimo y el máximo.
C. Analizar las medias aritméticas.

8. ¿Qué porcentaje de pérdida de datos es considerado como bajo?


A. Menos del 20 %.
B. Menos del 10 %.
C. Más del 10 %.

9. ¿Qué procedimiento existe para tratar los casos perdidos?


A. Técnicas de imputación.
B. Sustituir por la desviación típica.
C. Sustituir por la máxima.

10. ¿Qué procedimiento es el más conveniente si tenemos un sujeto al que le falten


muchos datos?
A. Aplicar técnicas de imputación.
B. Eliminarlo.
C. Sustituir los valores por la media del grupo.
© Universidad Internacional de La Rioja (UNIR)

Metodología de la Investigación II
34
Tema 6. Test

También podría gustarte