Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Metodología de la Investigación II
Ideas clave 4
6.1. Introducción y objetivos 4
6.2. Los programas estadísticos 5
6.3. Preparación de los datos para el análisis 8
6.4. ¿Cómo incluir los datos en la base de datos? 11
© Universidad Internacional de La Rioja (UNIR)
A fondo 26
Actividades 28
Test 33
Esquema
© Universidad Internacional de La Rioja (UNIR)
Metodología de la Investigación II
3
Tema 6. Esquema
Ideas clave
Uno de los pasos previos antes de realizar los análisis estadísticos es preparar los
datos. El primer paso es elegir un programa informático apropiado a nuestras
necesidades. Después, incorporar los datos a este programa y, finalmente, revisar
que los datos estén correctos y que no haya ningún error (preprocesamiento).
Este tema se va a dedicar a explicar estos pasos, que son esenciales para asegurar
que después podamos realizar correctamente los análisis descriptivos e inferenciales.
Esta fase de preparación de los datos antes de los análisis es fundamental, ya que
garantiza que los resultados que se obtengan posteriormente sean válidos (Martínez,
Chacón y Castellanos y López, 2014).
Metodología de la Investigación II
4
Tema 6. Ideas clave
6.2. Los programas estadísticos
El primer paso es conocer las distintas opciones que existen hoy en día para realizar
los análisis estadísticos: los programas estadísticos. En el mercado existen diversos
programas que sirven para este fin. En esta asignatura vamos a destacar tres de ellos:
JASP, PSPP y SPSS.
Metodología de la Investigación II
5
Tema 6. Ideas clave
Encontrarás el enlace para descargar el programa estadístico JASP en la sección A
Fondo, así como un tutorial de cómo descargar y manejar este programa.
Metodología de la Investigación II
6
Tema 6. Ideas clave
Figura 2. Programa GNU PSPP (v3).
Metodología de la Investigación II
7
Tema 6. Ideas clave
Existen otras posibilidades, como IBM SPSS Statistics, que es el programa más
utilizado dentro de las ciencias sociales, ya que es el más completo, pero es de pago.
El primer paso es codificar los datos, que se explicará en este punto del temario. La
creación del archivo dependerá del tipo de programa informático que se elija (se
explicará en el siguiente punto del tema). La última etapa es la depuración de los
© Universidad Internacional de La Rioja (UNIR)
Metodología de la Investigación II
8
Tema 6. Ideas clave
y los valores numéricos asociados a las distintas respuestas (en su caso). Además, se
deben crear los identificadores para cada uno de los participantes, ya que hay que
mantener el anonimato (se le asignará un código) (ver tabla 1).
0 = bajo
Inteligencia emocional IE 1 = medio
2 = alto
«Dentro de cada variable, cada respuesta debe tener un código numérico que es el
que se introduce en el editor de datos o base de dato» (Martínez et al., 2014, p. 46).
© Universidad Internacional de La Rioja (UNIR)
Metodología de la Investigación II
9
Tema 6. Ideas clave
implica que las variables se conviertan en cuantitativas, siguen siendo cualitativas o
cuasi-cuantitativas, pero se les asigna un código numérico para poder incorporarlas
en una base de datos y poder analizarlas estadísticamente. Por ello, los análisis que
se pueden realizar con ellas son diferentes; estos análisis se denominan no
paramétricos (recuerda que ese término no denomina a las variables sino a los
análisis que se hacen con ellas).
Metodología de la Investigación II
10
Tema 6. Ideas clave
Hay que tener un especial cuidado en incorporar las variables que forman los grupos
o condiciones de nuestro estudio (es decir, las variables independientes, como, por
ejemplo, grupo control/grupo experimental o grupo con alta creatividad/baja
creatividad, etc.). En este caso hay que crear una variable de agrupación. Se puede
denominar simplemente «grupos» o cualquier palabra que nos haga entender a qué
variable se refiere (por ejemplo, tipo de intervención, tipo de colegio, etc.).
Teniendo claro cómo se van a codificar los datos, hay que pasar a la etapa de la
creación del archivo. Según el programa estadístico que hayamos elegido, este
proceso se va a realizar de forma diferente. A continuación, se encuentra la
explicación de cómo incluir los datos con el programa Excel, con PSPP/SPSS y con
JASP.
Metodología de la Investigación II
11
Tema 6. Ideas clave
El primer paso es crear las distintas variables en forma de columnas, para
posteriormente incorporar los datos de cada uno de los sujetos participantes en filas
(ver figura 6). Por tanto, y como suele decirse, cada columna es una variable y cada
fila un sujeto.
Metodología de la Investigación II
12
Tema 6. Ideas clave
Para organizar la matriz de datos en Excel hay que tener en cuenta una serie de
recomendaciones:
Todos los datos deben estar en una sola hoja. Excel tiene la posibilidad de crear
distintas hojas (ver figura 8). Las distintas hojas o pestañas se pueden seleccionar
desde la parte de abajo (hoja 1, hoja 2…). Por defecto vienen creadas tres, pero se
pueden eliminar y crear las que se quieran, incluso cambiarlas de sitio. El nombre
de estas hojas se puede modificar, por lo que a la hoja donde tenemos todos los
datos la podemos denominar «DATOS». Es muy útil crear una hoja diferente para
los códigos utilizados (libro de códigos); es decir, las transformaciones que hemos
utilizado para los datos cualitativas y cuasi-cuantitativas (por ejemplo, niño=1,
niña=2). Así, se puede consultar el significado de estos valores fácilmente (ver
figura 9). Un error muy común es utilizar una hoja para cada variable o una hoja
para cada grupo de sujetos. Todos los datos deben estar en la misma hoja.
© Universidad Internacional de La Rioja (UNIR)
Metodología de la Investigación II
13
Tema 6. Ideas clave
Figura 9. Hoja de valores en Excel.
Una vez creadas todas las variables e incluidos los identificadores de los participantes,
se procede a completar todos los datos de la matriz, teniendo mucho cuidado de no
equivocarnos de variable ni de sujeto.
Metodología de la Investigación II
14
Tema 6. Ideas clave
Los datos creados en Excel se pueden exportar a otros programas como JASP y
PSPP/SPSS.
Importados de otro programa como, por ejemplo, Excel. SPSS tiene una opción
para importar un archivo .xls (o cualquier otro). En el menú «Archivo», se
selecciona la opción «Abrir» y, a continuación, seleccionar «Datos» (ver figura 10).
Se despliega una ventana donde buscaremos la carpeta donde se encuentra el
archivo Excel que queremos importar a SPSS. Para que aparezca el archivo,
tendremos que seleccionar el tipo de archivo: seleccionar Excel (.xls). Una vez
seleccionado, pulsaremos «Abrir» y se importarán todos los datos. Es importante
revisar cada una de las variables creadas y, además, las variables nominales y
ordinales hay que codificarlas para asignarle el código correspondiente (por
ejemplo, 1=niño, 2=niña).
© Universidad Internacional de La Rioja (UNIR)
Metodología de la Investigación II
15
Tema 6. Ideas clave
Crear la matriz de datos directamente. A la hora de abrir el programa PSPP o SPSS
se abrirá una tabla vacía. En la parte de abajo tendremos la opción de seleccionar
dos hojas: una «Vista de datos» y una «Vista de variables» (ver figura 11). Primero
se tienen que crear las variables en la «Vista de variables», para posteriormente
completar la matriz en la «Vista de datos». Estas pestañas no son configurables y
están predeterminadas de antemano. En la parte superior se encuentran los
menús desplegables.
Metodología de la Investigación II
16
Tema 6. Ideas clave
Figura 12. Vista de datos.
Metodología de la Investigación II
17
Tema 6. Ideas clave
En esta hoja aparecen en cada línea las distintas variables que luego aparecen en la
«Vista de datos» por columnas. En la línea 1 se debe incluir la identificación del sujeto
(ID) para que aparezca en primer lugar en la «Vista de datos». Debajo aparecen de
forma consecutiva todas las variables del estudio. Se pueden configurar una serie de
parámetros para que la variable sea lo más ajustada posible:
Nombre de la variable: este nombre suele ser corto y no puede contener espacios
ni caracteres especiales (por ejemplo: memoria, edad, etc.). Este nombre es el que
aparecerá en las distintas columnas de la «Vista de datos».
Etiquetas: se exponen todas las etiquetas que se hayan asociado a los valores
asignados (Género. 1=masculino/2=femenino). También se puede utilizar para
incorporar el nombre de la variable de forma más amplia, sin restricciones, a
diferencia de la primera columna «Nombre» donde solo se puede incluir el
nombre de la variable de forma corta sin espacios y sin caracteres especiales (por
ejemplo, «identificación sujeto»). Otro ejemplo sería si en la primera columna se
ha incorporado el nombre de la variable siguiente «mm_visual_cp», en la casilla
© Universidad Internacional de La Rioja (UNIR)
Metodología de la Investigación II
18
Tema 6. Ideas clave
variables (1=hombres). Si pulsamos en los puntos sucesivos de esta casilla, se
despliega una ventana (figura 14). En esta ventana se puede asociar el número que
el investigador haya vinculado a cada una de las respuestas de la variable. En este
caso hemos elegido el ejemplo del género (1=masculino y 2=femenino). En la
casilla «Valor» incluimos el número elegido y en «Etiqueta» la palabra que
queremos asociar al número. A continuación, se pulsa la casilla «Añadir». Una vez
terminados de configurar todos los valores, se pulsa «Aceptar».
Metodología de la Investigación II
19
Tema 6. Ideas clave
Figura 15. Icono de etiquetas de valor.
Para realizar los distintos análisis estadísticos hay que pulsar el menú de «Analizar» y
se desplegarán todas las opciones disponibles.
Otra cuestión importante que debemos mencionar es que en SPSS los datos (tanto la
«Vista de datos» como la «Vista de variables») se guardarán en un archivo diferente
que los resultados que se obtengan tras los análisis estadísticos. Es decir, por un lado,
© Universidad Internacional de La Rioja (UNIR)
Metodología de la Investigación II
20
Tema 6. Ideas clave
Encontrarás un tutorial de cómo crear una base de datos en PSPP en la sección A
fondo.
El programa JASP
Metodología de la Investigación II
21
Tema 6. Ideas clave
Una vez importados los datos, es necesario asignar la escala de medida de los datos
(seleccionar si es nominal, ordinal o escala para las variables cuantitativas). Para ello
hay que pulsar sobre el símbolo del nombre de la variable y se desplegará el menú
donde se puede asignar la escala de medida (ver figura 16).
Una vez introducidos todos los datos en el programa estadístico es necesario dedicar
un tiempo a revisar que no se hayan producido errores que pueden influir en los
resultados. Es muy frecuente que se cometan errores como, por ejemplo, introducir
un número de más (11 en vez de 1) o equivocarse de columna. Hacer una revisión
© Universidad Internacional de La Rioja (UNIR)
Metodología de la Investigación II
22
Tema 6. Ideas clave
programa informático. Por ejemplo, si estamos registrando el rendimiento
académico de 0 a 10 y tenemos un valor de 15. Estos errores se pueden detectar
fácilmente mediante los siguientes procedimientos:
Metodología de la Investigación II
23
Tema 6. Ideas clave
Existen procedimientos para tratar los casos perdidos con baja incidencia (Martínez
et al., 2014):
Utilizar solamente los casos con datos completos: existe una opción en los
programas estadísticos donde indicamos que solamente se utilicen los datos
completos para realizar los análisis estadísticos.
Sustitución por otros valores: las más frecuentes son las que sustituyen el valor
por la media de todos los casos o por el caso más parecido. También se pueden
utilizar técnicas más sofisticadas y complejas, como las técnicas de imputación
(como regresión o imputación propiamente dichas), donde se utiliza información
de otras variables.
Algunas recomendaciones para tratar con casos perdidos los puedes encontrar en la
figura 17.
Figura 17. Recomendaciones para tratar los casos perdidos. Fuente: Martínez et al. (2014).
Como paso final dentro de la depuración de los datos, nos podemos encontrar con la
© Universidad Internacional de La Rioja (UNIR)
Metodología de la Investigación II
24
Tema 6. Ideas clave
en una puntuación total. Para realizar este procedimiento seleccionaremos la opción
de «Transformar y Calcular variable» en el programa informático PSPP/SPSS e
incluiremos la fórmula matemática que queremos aplicar para la nueva variable,
indicando las variables ya creadas que queremos utilizar. Por ejemplo, «lengua +
matemáticas + ingles/3».
IBM SPSS Statistics for Windows (Versión 25.0) [Software]. Armonk, NY: IBM Corp.
Metodología de la Investigación II
25
Tema 6. Ideas clave
A fondo
Programa estadístico JASP
En el siguiente enlace puedes acceder a la página web del programa estadístico JASP,
donde encontrarás información sobre el programa, cómo descargarlo y manuales
explicativos para su uso.
En el siguiente enlace puedes acceder a la página web del programa estadístico PSPP,
donde encontrarás información sobre el programa, cómo descargarlo y manuales
explicativos para su uso.
© Universidad Internacional de La Rioja (UNIR)
Metodología de la Investigación II
26
Tema 6. A fondo
Programa estadístico SPSS
En el siguiente enlace puedes acceder a la página web del programa estadístico SPSS,
donde encontrarás información sobre el programa y cómo comprarlo. Hay disponible
una demo gratuita de quince días de duración.
© Universidad Internacional de La Rioja (UNIR)
Metodología de la Investigación II
27
Tema 6. A fondo
Actividades
Objetivos
El alumno tendrá que elaborar una base de datos en el programa Excel con los datos
que se le proporcionará de una investigación siguiendo las indicaciones del temario.
Para realizar esta tarea el alumno tendrá que seguir el siguiente esquema:
Crear una hoja en Excel para incluir el libro de codificación y codificar las variables
que sean necesarias según lo explicado en el tema.
© Universidad Internacional de La Rioja (UNIR)
Crear un identificador (ID) por cada sujeto compuesto por la inicial del padre, la
inicial de la madre y el año de nacimiento del abuelo materno.
Incluir los datos por cada sujeto (en cada fila, un sujeto).
Metodología de la Investigación II
28
Tema 6. Actividades
Datos de la actividad
Sujeto 1. Nombre: Daniel; nombre de la madre: Silvia; nombre del padre: Antonio;
fecha nacimiento del abuelo: 1950; edad: 10; género: masculino; memoria de
trabajo: 45; calificación lengua: aprobado; nivel socioeconómico: alto; creatividad:
110.
Sujeto 2. Nombre: Antonia; nombre de la madre: Alejandra; nombre del padre: Javier;
fecha nacimiento del abuelo: 1945; edad: 11; género: femenino; memoria de trabajo:
62; calificación lengua: notable; nivel socioeconómico: alto; creatividad: 100.
Sujeto 3. Nombre: David; nombre de la madre: Verónica; nombre del padre: Evo;
fecha nacimiento del abuelo: 1965; edad: 10; género: masculino; memoria de
trabajo: 53; calificación lengua: suspenso; nivel socioeconómico: medio; creatividad:
95.
Sujeto 4. Nombre: Martín; nombre de la madre: Carmen; nombre del padre: Aitor;
fecha nacimiento del abuelo: 1968; edad: 10; género: masculino; memoria de
trabajo: 70; calificación lengua: sobresaliente; nivel socioeconómico: alto;
creatividad: 120.
Metodología de la Investigación II
29
Tema 6. Actividades
Sujeto 7. Nombre: Manuela; nombre de la madre: Manuela; nombre del padre: José;
fecha nacimiento del abuelo: 1958; edad: 10; género: femenino; memoria de trabajo:
50; calificación lengua: notable; nivel socioeconómico: medio; creatividad: 110.
Sujeto 8. Nombre: Teresa; nombre de la madre: Silvia; nombre del padre: Alberto;
fecha nacimiento del abuelo: 1960; edad: 9; género: femenino; memoria de trabajo:
46; calificación lengua: aprobado; nivel socioeconómico: medio; creatividad: 120.
Sujeto 9. Nombre: Maite; nombre de la madre: Sofía; nombre del padre: Juan; fecha
nacimiento del abuelo: 1930; edad: 11; género: femenino; memoria de trabajo: 60;
calificación lengua: sobresaliente; nivel socioeconómico: alto; creatividad: 115.
Sujeto 10. Nombre: Carlos; nombre de la madre: Manuela; nombre del padre:
Bernardo; fecha nacimiento del abuelo: 1949; edad: 10; género: masculino; memoria
de trabajo: 54; calificación lengua: suspenso; nivel socioeconómico: bajo; creatividad:
95.
Sujeto 11. Nombre: Justo; nombre de la madre: Carmen; nombre del padre: Joaquín;
fecha nacimiento del abuelo: 1940; edad: 9; género: masculino; memoria de trabajo:
53; calificación lengua: notable; nivel socioeconómico: medio; creatividad: 118.
Sujeto 12. Nombre: Daniela; nombre de la madre: Eva; nombre del padre: Antonio;
fecha nacimiento del abuelo: 1954; edad: 10; género: femenino; memoria de trabajo:
45; calificación lengua: notable; nivel socioeconómico: alto; creatividad: 100.
Sujeto 13. Nombre: Berta; nombre de la madre: Natalia; nombre del padre: Miguel;
fecha nacimiento del abuelo: 1946; edad: 11; género: femenino; memoria de trabajo:
© Universidad Internacional de La Rioja (UNIR)
Sujeto 14. Nombre: Raúl; nombre de la madre: Rocío; nombre del padre: Rubén;
fecha nacimiento del abuelo: 1954; edad: 9; género: masculino; memoria de trabajo:
38; calificación lengua: suspenso; nivel socioeconómico: alto; creatividad: 105.
Metodología de la Investigación II
30
Tema 6. Actividades
Sujeto 15. Nombre: Agustín; nombre de la madre: Ángela; nombre del padre:
Baltasar; fecha nacimiento del abuelo: 1949; edad: 10; género: masculino; memoria
de trabajo: 57; calificación lengua: sobresaliente; nivel socioeconómico: medio;
creatividad: 106.
Sujeto 16. Nombre: Fabio; nombre de la madre: Gabriela; nombre del padre:
Fernando; fecha nacimiento del abuelo: 1960; edad: 9; género: masculino; memoria
de trabajo: 49; calificación lengua: notable; nivel socioeconómico: medio;
creatividad: 109.
Sujeto 17. Nombre: Juana; nombre de la madre: María; nombre del padre: Luis; fecha
nacimiento del abuelo: 1947; edad: 10; género: femenino; memoria de trabajo: 50;
calificación lengua: sobresaliente; nivel socioeconómico: bajo; creatividad: 114.
Sujeto 18. Nombre: Noel; nombre de la madre: Rafaela; nombre del padre: Eduardo;
fecha nacimiento del abuelo: 1936; edad: 11; género: masculino; memoria de
trabajo: 53; calificación lengua: aprobado; nivel socioeconómico: alto; creatividad:
115.
Sujeto 19. Nombre: Roberta; nombre de la madre: Belén; nombre del padre: Roberto;
fecha nacimiento del abuelo: 1950; edad: 11; género: femenino; memoria de trabajo:
60; calificación lengua: sobresaliente; nivel socioeconómico: alto; creatividad: 120.
Sujeto 20. Nombre: Salvador; nombre de la madre: Silvia; nombre del padre: Samuel;
fecha nacimiento del abuelo: 1962; edad: 9; género: masculino; memoria de trabajo:
42; calificación lengua: aprobado; nivel socioeconómico: bajo; creatividad: 100.
© Universidad Internacional de La Rioja (UNIR)
Metodología de la Investigación II
31
Tema 6. Actividades
Rúbrica de corrección de la actividad
0 1 2 3
Incluye los
Incluye los
nombres de las
nombres de las Incluye los
No incluye todas variables por
variables por nombres de las
las variables o no columnas y
columnas, pero variables por
de forma codifica
utiliza más de una columnas y
Creación de las correcta (no correctamente
línea en Excel. codifica
variables utiliza columnas todas las variables
Codifica las correctamente
correctamente y no codifica las ordinales y
variables las variables. El
variables nominales, pero el
nominales y nombre de la
nominales ni nombre
ordinales, pero no variable es
ordinales). seleccionado no
correctamente apropiado.
es apropiado
(utiliza palabras).
(demasiado largo).
Utiliza el código
ID
correctamente
Creación del Incluye el
Utiliza «sujeto x» Utiliza el código ID (formado por la
identificador nombre del
como indicado, pero primera inicial
del sujeto sujeto. No utiliza
identificador. comete errores. del padre y de la
correctamente el anonimato.
madre y el año
de nacimiento
del abuelo).
No incluye los Incluye todos los Incluye todos los
Inclusión de datos de cada datos, pero datos, pero Incluye todos los
todos los datos sujeto y comete comete muchos comete algunos datos sin errores.
muchos errores. errores errores.
Inclusión del 1
libro de Inclusión del libro de codificación en una hoja diferente en el Excel donde se
© Universidad Internacional de La Rioja (UNIR)
Metodología de la Investigación II
32
Tema 6. Actividades
Test
1. ¿Qué programa informático para realizar análisis estadísticos es gratuito y es muy
completo?
A. JASP.
B. PSPP.
C. SPSS.
3. ¿Cuál es el último paso para preparar los datos antes de los análisis de datos?
A. Codificar los datos.
B. Crear la base de datos.
C. Depurar los datos.
B. PSPP.
C. SPSS.
Metodología de la Investigación II
33
Tema 6. Test
6. ¿Por qué motivos se pueden dar valores fuera de rango?
A. Por errores en la recogida de la información.
B. Por errores a la hora de pasar los datos al programa informático.
C. Ambas son correctas.
Metodología de la Investigación II
34
Tema 6. Test