Está en la página 1de 3

Ejercitación semana 1: Codificación de variables y creación de variables

compuestas en SPSS.

En la presente sesión se repasarán los métodos utilizados para la codificación de variables


en el software SPSS. La codificación de variables es fundamental al momento de procesar
datos, ya que este proceso ayudará a identificar los datos obtenidos en las diversas técnicas
de muestreo, independiente si utilizamos escala Likert para recoger opiniones o si estamos
midiendo la presión arterial de un grupo de estudio. La asignación de características a los
datos nos ayudará a diferenciar nuestra muestra, pudiendo diferenciar entre el lugar de la
toma de dato, o quien entrega el dato, su género, edad, hemisferio, etc.
Posterior a esto, con los datos ya codificados, se puede, previo al análisis si se desea, se
puede efectuar la creación de variables compuestas, es decir, crear una nueva variable
utilizando variables originales.
1. Codificación de variables.
Para este caso se utilizarán los datos obtenido en una encuesta, el cual recogió la
percepción de las personas respecto de un tema en particular, siendo codificada como una
escala Likert de 1 a 5.
Este proceso puede parecer tedioso y engorroso, pero es de vital importancia, ya que, un
error en la codificación puede generar un error en la interpretación de los resultados, en
caso de que el error no sea detectado a tiempo.
Para ejercitar, se utilizará el archivo “Ejemplo 1.dat” el cual contiene una serie de números,
en la pestaña de “vista de datos” que, a primera vista, no arrojan mucha información (figura
1)
En la pestaña “Vista de variable” nos encontraremos con un escenario completamente
distinto, ya que, las primeras 5 columnas tienen asignados valores y/o palabras (ya que
responden a una encuesta realizada previamente, posteriormente se enseñará a rellenar
cada una de las columnas), las cuales, en breves palabras, describen el contenido de cada
una de las filas de este plano (figura 2), que hacen referencia a las distintas columnas de la
pestaña “Vista de datos”.
En esta sesión aprenderemos a rellenar la columna de Valores, Perdidos y Medida.
- Valores: La columna valores es la con más trabajo, ya que cada una de estas
contiene información distinta que debe ser asignada. La asignación de valores se
realiza de la siguiente manera: Para el caso de la fila Universidad, usted debe pasar
el cursor por sobre la casilla valores respectiva a fila Universidad y aparecerán
puntos suspensivos (…) los selecciona y aparecerá una pestaña llamada “Etiqueta
de valor”. Esta pestaña la primera casilla a rellenar dice Valor y posterior dice
Etiqueta. En este punto debe colocar en Valor=1 y Etiqueta= USACH, y posterior
seleccionar la opción que diga Añadir. Seguido de esto, en Valor coloca el Valor=2
y Etiqueta=UNAB, y así sucesivamente hasta logar algo iguala lo mostrado en la
figura 3. Los valores para asignar se encuentran en el anexo A del presente
documento. Este procedimiento debe repetirlo hasta agotar los números que salen
en el anexo A y con todas las columnas que aparecen (20, ya que número no tiene
valor asignado). Luego de esto, asegure de guardar el trabajo, para que no pierda
los avances. Este proceso se realiza para poder darle un sentido a los valores de
esta encuesta. Ahora, como se puede notar, existe, dentro de los datos, números -
99, los cuales no fueron codificados, esto debido a que son datos perdidos.
- Perdidos: En esta columna se asignarán los datos perdidos. La pregunta que puede
saltar en este punto es, qué es un dato perdido y por qué antes no lo codificamos?
Simple, un dato perdido es un dato que no pudo ser obtenido por el instrumento de
medición, ya que el sujeto en estudio no pudo entregar la información debido a
diversas causas, y no se codifica ya que, en este caso, no participará en el proceso
de análisis. Puede ser codificado? Si, pero no tiene relevancia en éste caso. Existen
diversas formas para obtener el dato perdido como un dato real, mediante diversas
técnicas estadísticas, pero para este caso, no se verán. Un dato perdido puede ser
cualquier valor real entre el -∞ y +∞. De manera práctica se recomienda utilizar -99,
ya que es un valor no recurrente a obtener en la toma de datos, pero se puede
utilizar cualquiera. No se recomienda, bajo ningún punto no asignar un valor al
dato no obtenido, ya que el software de todos modos reconoce el espacio faltante y
realiza cálculos sobre él y esto arroja errores al momento final, pudiendo perder
validez el análisis. En la pestaña de perdidos, al igual que anteriormente señalado,
se posicionará sobre el punto suspensivo, hará click y se abrirá una pestaña de
“valores perdidos” en donde debe seleccionar, en este caso, la opción “Valores
perdidos discretos” y luego de eso, en la primera casilla asignar el valor -99.
Recuerde, el -99 es un valor ya asignado, cuando usted realice su propia base de
datos, puede utilizar el valor que estime conveniente y que no interfiera con su
investigación.
- Finalmente, en la columna de medida, debe procurar, que desde la fila C1 a C9 diga
“Nominal”, si no aparece esa categoría, realice el mismo procedimiento, ir al punto
suspensivo, hacer click y elegir la opción señalada.

Este proceso debe realizarlo para todas las filas que aparecen en la ventana de “vista de
variables”.
Para corroborar que hubo cambio, primero guarde sus avances y en la pestaña de Vista de
Datos, presione el botón “etiquetas de valor” (figura 4) y debiesen cambiar las opciones, de
números a letras en las pestañas que se asignó un valor.

2. Creación de variables compuestas.

Este procedimiento consta, en pocas palabras, en la creación de grupo con diferentes


datos, lo cual es distinto a recodificar, codificar o verificar agrupaciones de datos. En este
punto solo realizaremos una operación matemática para generar una nueva columna en la
pestaña de Vista de Datos.
Para realizar esto, de manera fácil, iremos a la pestaña superior, a la opción Transformar y
luego seleccionaremos Calcular variable (figura 5). Luego asignaremos el nombre de la
nueva variable, en este caso, en la casilla “Variable de destino” escribiremos el nombre de
la nueva variable, que será “Confianza”. Luego, en la casilla que dice “Expresión numérica”
escribiremos lo que deseamos hacer. En esta caso en particular obtendremos el promedio
resultante entre las variables C1 a la C9. Para esto se puede realizar de diversas maneras.
La primera es escribir la ecuación de promedio, es decir la sumatoria de los valores
involucrados dividido en la cantidad de valores involucrados; y la segunda opción es…