Está en la página 1de 41

Universidad de Chile

Facultad de Ciencias Sociales (FACSO)


Departamento de Sociología

Guía introductoria al uso de fuentes de datos


primarias y secundarias con SPSS

Ayudantía Estadística I 2016


Equipo de ayudantes:
Álvaro Arancibia
Juan Carrasco
Gabriel Cortés
Ivana Medina
Daniela Miranda
Brian Montenegro
Esteban Navarro
Daniela Olivares
Gabriel Sotomayor
Sofía Villalobos

Docentes:
Giorgio Boccardo y Víctor Orellana
Agosto de 2016
Contenido
Fuentes primarias ..........................................................................................................................................................3
Cómo se crea la base de datos ..................................................................................................................................3
Un caso particular: las variables de respuesta múltiple. ...........................................................................................6
Importar de Excel a SPSS .........................................................................................................................................10
Ordenar la base de datos en SPSS ...........................................................................................................................14
Aplicación de comandos básicos: tablas de frecuencia e histogramas ...................................................................21
¿Cómo exportar todos mis resultados a una hoja de Word? ..................................................................................27
Fuentes secundarias ....................................................................................................................................................29
Fuentes de información secundarias ......................................................................................................................30
Elementos descargables diferentes: utilidades diferentes .....................................................................................31
Anexos .........................................................................................................................................................................37
Anexo 1: Cuestionario aplicado a los estudiantes para crear la base de datos ......................................................37
Anexo 2: Sintaxis del ejercicio para tablas de frecuencias e histograma ................................................................41

2
Fuentes primarias

Los métodos de investigación cuantitativa buscan medir la realidad social a través de la producción propia
de datos o mediante el apoyo en mediciones ya existentes. Tal como vieron en el curso, las fuentes
primarias, desde el punto de vista del investigador, corresponden a los datos que se elaboran en el
proceso de investigación mismo1.

A continuación, presentaremos a modo de ejemplo la creación de una base de datos a partir de una
encuesta, técnica que constituye uno de los métodos privilegiados para la producción de la información
necesaria para nuestra investigación.

Cómo se crea la base de datos

Por facilidades para la digitación de datos y la mayor disponibilidad del programa, uno de los programas
más utilizados para la creación de bases de datos es el programa Excel, (el que será presentado con mayor
detalle en la próxima ayudantía), perteneciente al paquete Office de Microsoft.

Excel, al igual que en SPSS, funciona como una planilla que posee filas y columnas, lo que da origen a
celdas que son independientes unas de otras. En las columnas se ubican las variables y en las filas los
casos. A modo de ejemplo, ingresaremos algunas de las variables extraídas de la encuesta realizada a los
estudiantes del curso el año 2015 (Ver Anexo 1), tal como aparece en la siguiente imagen:

Folio, Edad, Sexo, Zona, NEM, p7.a, p8.1, p8.2, p8.3, p11, p12, p14, p15, p16, p17, p20, p21.2

Siempre comenzamos por la variable Folio, ya que ésta corresponde a la variable que enumera los casos
a partir del número correspondiente a cada encuesta. Dado que la variable folio es una secuencia
numérica, podemos ingresar sólo los dos primeros números, los seleccionamos, nos posicionamos en la

1
Para más información sobre fuentes de información, véase la clase 3: “Las fuentes de información: tratamiento,
producción y análisis de datos primarios y secundarios”.
2
En ayudantía, se repasará el nivel de medición de las variables seleccionadas y se evaluará la pertinencia de algunas
de las preguntas.
3
esquina inferior derecha y arrastramos hacia abajo considerando en número de casos que tengamos (en
este caso, 70 encuestados).

Dado que vamos a ingresar los datos en su forma numérica, tenemos que ponerle etiquetas a los valores
de las variables (código). Como en Excel los códigos no pueden ir a primera vista, tenemos que darle click
al botón derecho sobre la variable y seleccionar “insertar comentario” y escribir los códigos que nos
permitan reconocer a qué corresponde cada uno de los valores de respuesta.

Una vez escrito los valores con sus etiquetas, nos posicionamos en cualquier celda y quedará guardado el
comentario. Cada vez que te pares sobre la celda de la variable, se mostrará el comentario. Para borrar o
modificar debes apretar nuevamente el botón derecho sobre la celda.

Así, por motivos de orden y mayor claridad para poder trabajar, es recomendable ir ingresando para cada
una de las variables el código asociado, que en caso de nombres de variables que no sean auto-explicativos
(como p7.a), idealmente debe clarificar el enunciado de la pregunta como las alternativas de respuesta.

4
Es importante tener en cuenta también que siempre debe existir algún valor que represente a los casos
perdidos (No sabe o No contesta). Por convención, suelen utilizarse el 8 y el 9. En caso de que estos valores
representen otra alternativa de respuesta, se pueden utilizar como 88, 99 y etc.

Una vez ingresadas todas las variables y sus códigos, se puede comenzar a digitar la información de las
encuestas. Es importante para ello mantener el orden e ir corroborando que no se comentan errores
típicos como la doble digitación, el desorden de los casos y etc. (Para Borrar algún contenido por si te
equivocas al ingresar los datos debes seleccionar lo que quieres borrar, hacer click en el botón derecho y
clickear y en “borrar contenido”. Si seleccionas eliminar te dará la opción de borrar filas o columnas
completas lo que te podría desconfigurar todo).

Una opción ofrecida por Excel que puede ser de utilidad es inmovilizar paneles, la que permite dejar fijas
una fila y/o columna. Esto permite que al movernos por la hoja, una fila y/o columna en particular
permanecerán siempre visibles. Esto es muy útil cuando trabajamos con planillas con mucha información
y necesitamos que permanezcan siempre visibles los nombres de las variables, de los casos, u otros
contenidos de referencia.

Para seleccionar las filas y/o columnas que queremos inmovilizar, tenemos que seleccionar la pestaña
“Vista” y desplegar el menú de inmovilizar, seleccionando si queremos inmovilizar la fila superior
(variables), la columna izquierda (casos), o ambos (para lo cual debemos seleccionar la casilla B2 y luego
seleccionar la opción movilizar paneles)

5
Un caso particular: las variables de respuesta múltiple.

Pese a la sencillez que puede evidenciarse en este procedimiento, no todas las variables suponen
simplemente ingresar una variable con sus correspondientes alternativas de respuesta, ya que algunas
permiten seleccionar más de una alternativas de respuesta. Ellas se conocen como alternativas de
respuesta múltiple.

Para ello utilizaremos el ejemplo de la p8 de nuestro cuestionario:

8. Del siguiente listado, ¿cuáles son las tres palabras que representan mejor tu manera de ver a
Chile?
(Marcar como máximo sólo tres alternativas)

Democrático…………………………….. (1)
Consumista……………………………… (2)
Tolerante………………………………… (3)
Moderno…………………………………. (4)
Sin Igualdad de Oportunidades………. (5)
Inseguro…………………………………. (6)
Individualista……………………………. (7)
Clasista………………………………….. (8)
Justo……………………………………... (9)
Discriminador…………………………… (10)
Represivo……………………………….. (11)
Libre……………………………………… (12)
Seguro…………………………………… (13)
Injusto……………………………………. (14)
Con igualdad de oportunidades………. (15)
Solidario…………………………………. (16)

Existen dos formas de digitar variables de respuesta múltiple que suponen distintas definiciones: como
variable categórica o como variables dummy.
6
1. Si la variable múltiple ha sido definida como categórica significa que para registrar la presencia de un
atributo se ha digitado el valor que representa a la categoría de respuesta. En este caso en la base de
datos tendremos tantas columnas como posibilidades de respuesta se hayan delimitado para la pregunta.

2. Las variables múltiples que han sido definidas como dummy corresponden a aquellas donde el 1
significa presencia del atributo y el 0 (u otro valor) significan ausencia del atributo. Si la variable ha sido
definida de esta manera, en la base de datos tendremos tantas columnas como categorías de respuesta
posibles.3

En el ejemplo, si la definimos como categórica debemos ingresar la variable en tres columnas (ya que
posee un máximo de 3 alternativas de respuesta seleccionables) donde en cada una de ellas se ingrese
una de las respuestas seleccionadas por el caso, del siguiente modo:

3
Apuntes del Taller de Análisis Estadístico Aplicado Semestre Otoño 2015.
7
Si la definimos como variables dummy, se vería del siguiente modo (habría tantas sub-preguntas como
alternativas de respuesta):

8
Dado que existen 16 alternativas de respuesta, debiera haber 16 columnas donde cada una represente
una alternativa, ingresando un 1 toda vez que esta fue seleccionada por alguno de los casos.

Esta segunda forma de digitar respuestas múltiples es de utilidad cuando no hay un número máximo
estimulado de respuestas seleccionadas, ya que en ese caso digitarla como categórica o como dummy
requeriría la consideración de 16 columnas. Sin embargo, ya que en este caso sólo se pueden seleccionar
tres, la primera alternativa parece la alternativa más adecuada.

Para su análisis en SPSS como una sola variable que toma distintos valores dentro de un mismo caso, esas
variables deberán ser definidas como un conjunto de variables de respuesta múltiple para su tratamiento,
cuestión que se verá en otros cursos.

9
Importar de Excel a SPSS

Una vez finalizado este proceso, y dado que para el análisis y tratamiento de la información SPSS es más
amigable, puedes importar esta base de datos creada en Excel a SPSS.

Para ello, lo primero que tenemos que hacer es guardar y cerrar el archivo de Excel ya que no se puede
trasladar si este se encuentra abierto. Luego abrimos SPSS y seleccionamos Archivo, Abrir, Datos y vamos
a la carpeta donde guardamos el archivo.

Inicialmente no podremos verlo porque donde dice tipo de archivo está marcado por defecto sólo ver los
archivos con extensión (sav.), que es el que corresponde a archivos propios de SPSS. Cambiamos la
extensión de archivo para poder ver archivos de excel (xlsx.), y ahí podremos seleccionar nuestra base de
datos creada en Excel.

10
Al darle Abrir, desplegará el siguiente cuadro de diálogo:

La opción que viene seleccionada por defecto permitirá que los nombres de las variables escritos en la
primera fila del Excel sean leídos como tales. Además nos permite seleccionar la hoja de trabajo del Excel
donde se encuentra nuestra base de datos (lo que es muy importante en caso de estar trabajando en

11
varias hojas), además de un máximo de caracteres para las variables cadena (es decir, aquellas que poseen
letras). Mantenemos las opciones marcadas por defecto y le damos aceptar.

A continuación, se desplegarán varias ventanas que pasaremos a definir:

Vista de variables: Contiene las preguntas de la encuesta [variables] y las características de los datos;
podemos señalar rápidamente como importantes las columnas: nombre, tipo, decimales, etiqueta,
valores, perdidos y medida.

Vista de datos: Es similar a una hoja de cálculo en Excel. Es una cuadrícula de caso [fila] x variable
[columna]. De esta forma, podemos identificar rápidamente a un caso particular dentro de nuestro
conjunto de casos; por ejemplo, podemos querer analizar el comportamiento del caso 12 en la variable
NEM. No tenemos más que buscar tal caso por su numeración en las filas y revisar los valores que presenta
en cada una de las variables (columnas).

12
Ventana de Resultados: Esta ventana, que ahora nos aparecerá en blanco, será aquella donde el
programa irá mostrando los resultados de los diferentes análisis que ejecutemos. La visualización de
tablas, estadísticos y gráficos se da en esta ventana.

Ventana de sintaxis: Para visualizar la ventana de sintaxis, una vez abierta una base de datos, hacemos la
siguiente operación:

13
Se presenta en blanco cuando la abrimos por primera vez. En esta pestaña podemos escribir e intervenir
de manera directa los comandos con los que trabaja el software.

SPSS presenta dos interfaces de uso, una gráfica en la que nos desplegamos a través de ventanas y
botones y el editor de sintaxis.

La primera modalidad es similar al uso que damos a la mayoría de los programas: desde un menú con
botones desplegables se seleccionan las acciones que se quieren realizar y se señalan distintas
instrucciones o especificaciones al programa según lo que se necesite.

La segunda forma corresponde al editor de sintaxis, el cual consiste en escribir instrucciones para el
programa en forma de comandos computacionales, en el visor de sintaxis. Este modo permite realizar las
mismas funciones que el uso mediante botones, pero tiene mayores beneficios ya que la sintaxis puede
ser guardada como texto, copiada, enviada, etc., ahorrando el trabajo de señalar las instrucciones desde
el menú repetidas veces (esta ventaja seguramente será difícil de apreciar en un ramo introductorio a la
estadística, pero es preciso desde ya familiarizarse con tal uso); es sobre todo cuando requiramos realizar
operaciones estadísticas simultáneamente, con la posibilidad de replicar los análisis rápidamente para
ejecutarlos en distintas bases de datos, que esta modalidad adquiere mayor utilidad. En este sentido, la
utilidad principal de manejar el modo sintaxis es que es posible modificar el texto de la sintaxis y usarla
para distintas bases de datos en las que quiera hacerse análisis similares o también para cambiar las
especificaciones del análisis que se está realizando sin entregar las instrucciones desde cero (como sí
requiere el uso del menú). Manejar el análisis estadístico a nivel de sintaxis nos permitirá agregar, eliminar
o modificar rápidamente, ciertas partes del comando a ejecutar, sin perder el grueso del trabajo ya
hecho.

Ordenar la base de datos en SPSS


Para ordenar la base de datos exportada, volveremos a la ventana vista de variables. Como podemos
observar, las variables ya vienen con diversas definiciones que SPSS nos arroja por defecto.

14
La primera columna es la columna Nombre que, valga la redundancia, hace alusión al nombre que le
otorgamos a la variable. Dada lo opción que marcamos al exportar el Excel, ya fueron asignados como
nombres de las variables los que habíamos puesta en la primera fila del Excel. En lo posible, debemos
tratar de asegurarnos que el nombre otorgado a cada variable tenga pocos caracteres. Por convención,
cuando son preguntas numeradas en el cuestionario, están tienden a recibir el nombre de P1, P2, P2.2,
etc. y cuando ocupamos más de dos palabras, están van unidas por un guion bajo ya que no acepta
espacios en blancos (por ejemplo zona_censal, clasificación_nse, etc.)

La segunda columna corresponde a la columna Tipo. Para cambiar el tipo asignado por defecto debes
pararte sobre la casilla y presionar los puntos seguidos. Aparecerá un cuadro que te muestra distintas
opciones, seleccionas la que creas que es pertinente y le das al botón aceptar.

15
Cuando los valores de la variable estén representados en números, el tipo de variable será Numérica
(como se dará en la mayoría de los casos). Sin embargo, cuando no existan los valores de la variable
representados en números o la respuesta no esté codificada con un valor sino que se ingrese directamente
las palabras dichas por el encuestado, ocupamos el tipo Cadena (esto ocurre generalmente en las
preguntas abiertas, como la p21 ¿Por qué te siente así de satisfecho con tu carrera? Estas deben existir lo
menos posible dado su dificultad de tratamiento). En el caso de la variable folio, dado que a cada encuesta
se le asigna un número, es esta una variable numérica.

Luego tenemos la columna Anchura. Esta corresponde a la máxima longitud o número máximo de
caracteres de los valores que tome la variable. Esta funciona sólo como información que se le provee al
investigador acerca de la longitud de los valores que puede encontrar, pero no restringe la posibilidad de
que la longitud sea mayor. SSPS propone por defecto una anchura de 11 como un valor razonable para las
variables numéricas, por lo que mantendremos esa anchura.

En caso de variables cualitativas sin valores numéricos, se trabaja con una anchura muchísimo mayor
porque muy posiblemente una respuesta abierta posee más de 11 caracteres. Mantenemos los 80
caracteres sugeridos por SPSS para las variables cadena.

La siguiente columna corresponde a la columna Decimales. Aquí ingresamos el número de decimales que
queremos que tengan los valores de la variable. Dado que el número de folio es un número entero,
podemos darle un valor 0. En el caso de la variable NEM, los decimales solicitados son 2, pues muchas de
las notas tienen decimales.

16
Luego vienen la etiquetas. Estas cumplen un rol fundamental porque nos permiten ingresar información
adicional para aclarar el contenido de las variables. Cuando realicemos alguna operación y SPSS nos arroje
los resultados, la variable viene presentada con su etiqueta, lo que es de gran ayuda al momento de
interpretar las conclusiones de las tablas o gráficos. Para el caso de la variable folio, la etiquetaremos
como “número de encuesta” ya que resulta más esclarecedor. Para ello simplemente debes pararte sobre
la casilla y escribir la etiqueta que desees.

En el caso de que la variable que estés ingresando corresponde a una pregunta nombrada como p7.a, por
ejemplo, en la etiqueta debe escribirse la pregunta completa.

17
Después de definir la etiqueta, continuamos con las demás propiedades. La columna de valores tiene una
importancia central porque explicita que es lo que representarán los números. Por ejemplo, si estás
ingresando la variable sexo, haces click sobre los puntos suspensivos de la casilla de valores y donde dice
valor pones un “1” y donde dice etiqueta pones “mujer”. Luego aprietas añadir y haces lo mismo con la
etiqueta para “hombre”, asignándole un valor “2” (es decir, ingresas lo mismo que habíamos ingresado a
modo de comentario en el Excel). Una vez que ya hayas ingresado todos los valores que quieres que
contenga la variable, le das click al botón aceptar.

18
(Hay que recordar que depende del nivel de medición la importancia o no del número asignado. Para
variables nominales éstas son sólo un símbolo por lo que podría ser cualquier número, mientras que para
variable intervalares es fundamental la distancia que existe entre una y otra categoría de respuesta de la
variable por lo que el número cobra especial importancia)

Dado que para la variable folio no existen categorías predefinidas, la propiedad Valores no debe ser
modificadas. La columna de perdidos guarda relación con excluir algún valor de los asignados a la variable
para un análisis posterior. En principio, está columna se deja tal como está, pero en pos de algún tipo de

19
tratamiento, esta columna podrá ser modificada, por ejemplo, para excluir los casos que tienen un valor
de “no sabe” o “no responde”.

La propiedad columna indica el ancho que tendrá la columna en la vista de datos. Si aumentamos o
disminuimos el ancho, al ir a la vista de datos notaremos la diferencia en el ancho de la columna en la que
se posiciona la variable.

Luego, la alineación indica a qué lado de la columna se posicionarán los datos de la variable en la vista de
datos. Para modificarla, seguimos el mismo procedimiento que los anteriores.

Debido a que las propiedades Columna y Alineación son netamente de formato y sus resultados sólo son
apreciables en la vista de datos del Editor, dejamos estos valores a voluntad del lector, de acuerdo a como
desee observarlas.

Por último encontramos la propiedad correspondiente a Medida. Esta facultad es una de las propiedades
más importantes de las variables, ya que de ella depende en gran medida el tipo de análisis que se puede
realizar con la variable y por lo tanto los procedimientos del paquete en los que puede ser utilizada. Para
definir cuál opción debe ser seleccionada, debemos tener claridad de los niveles de medida de las
variables. La opción Escala se utiliza para todas las variables cuantitativas y de intervalo y para variables
ordinales que quieren ser tratadas como una escala.

Si nos fijamos en los valores que puede tomar la variable folio, notaremos que estos son números enteros
que representan una cantidad por lo que podemos concluir que la variable corresponde a la medida de
Escala.

Para activar el tipo de medida, nuevamente, debemos hacer clic sobre la casilla de la respectiva columna,
de manera que aparezca al costado derecho de ella un botón flecha hacia arriba y hacia abajo, lo que nos
indica que cuenta con un listado. Al hacer clic sobre él, surgen los tres diferentes tipos de medida con que
cuenta SPSS. Para escoger uno de ellos basta con hacer clic sobre el tipo que deseemos, de manera que
desaparece el listado y queda en la casilla el tipo de medida elegido.

A continuación, repetimos el mismo proceso considerando estos criterios para el resto de las variables.

20
Aplicación de comandos básicos: tablas de frecuencia e histogramas
Tenemos al fin nuestra base de datos terminada en SPSS, pero antes de realizar cualquier tipo de cálculo
con las variables que disponemos, es necesario conocer el comportamiento de dichas variables,
observando su distribución. Para esa tarea, podemos utilizar las tablas de frecuencia y los histogramas.

Para ejemplificar el uso de las distintas modalidades de SPSS, elaboraremos una tabla de frecuencias y un
histograma con los dos usos que nos ofrece SPSS, es decir, el modo utilizando botones o utilizando sintaxis.
Un ejercicio sociológicamente relevante, podría ser conocer los niveles de escolaridad de quien aporta
mayores ingresos en el hogar, pues en literatura sociológica esa variable es un indicador de posición social
y movilidad social. Para esto, ocuparemos en el ejercicio la variable p16: ¿Cuál es el nivel del educación de
la persona que aporta el principal y mayor ingreso de tu hogar?, que cuenta con las siguientes categorías
de respuesta:
1 = Sin estudios
2 = Básica incompleta
3 = Básica completa
4 = Media incompleta
5 = Media completa
6 = Técnica post-media incompleta
7 = Técnica post-media completa
8 = Universitaria incompleta
9 = Universitaria completa
99 = No sabe/ No contesta

Primero lo realizaremos desde la interfaz de botones:

Desde la opción analizar, a través de la opción estadísticos descriptivos, le damos al botón que dice
frecuencias:

21
Luego, en el cuadro de diálogo Frecuencias buscamos la variable que queremos analizar y la llevamos
hacia el espacio en blanco titulado Variables, donde deben incluirse la(s) variable(s) a analizar. Luego,
seleccionamos la opción Gráficos y le solicitamos a SPSS que además de la tabla de frecuencias, agregue
el histograma. Una vez hecho tal procedimiento presionamos el botón Aceptar:

En la ventana Resultados podremos observar los resultados de la operación efectuada, obteniendo una
tabla de frecuencias y el histograma que nos indica la cantidad de casos por cada categoría de la variable
analizada:
22
23
Ahora realizaremos el mismo ejercicio, pero empleando el editor de sintaxis. Para ello, escribimos el
siguiente comando en la ventana de sintaxis:

FREQUENCIES VARIABLES=p16
/HISTOGRAM
/ORDER=ANALYSIS.

Seleccionamos el texto recién escrito y presionamos el botón con la flecha (play) verde ‘Ejecutar selección’.

Como podrán ver, la ventana de resultados que se obtiene es la misma que la obtenida mediante el
procedimiento anterior.

Para conocer algunos de los beneficios de la sintaxis, realizaremos una pequeña modificación en el
comando ya escrito, para obtener tanto la tabla de frecuencia como el histograma de la variable p.17:
“¿Con qué religión te identificas?”

FREQUENCIES VARIABLES=p17
FREQUENCIES VARIABLES=p16
/HISTOGRAM
/HISTOGRAM
/ORDER=ANALYSIS.
/ORDER=ANALYSIS.

Y ejecutamos el comando recién modificado directamente desde el editor de sintaxis (no olvidar
seleccionar el comando a ejecutar):

24
De esta forma, podemos ejecutar análisis directamente desde el editor de sintaxis de forma más rápida,
sin realizar la operación paso a paso como es requerido en la interfaz de botones. En la ventana de
resultados se mostrarán los resultados del segundo análisis ejecutado, a continuación de los resultados
del primero.

25
Ahora bien, mientras hacemos uso de los botones, también estamos haciendo uso de la sintaxis sólo que
sin verla de manera directa, pero si nos fijamos en el visor de resultados, podremos ver el listado de
comandos que fueron ejecutados mediante los botones:

Una opción para ir dejando registro de nuestra configuración mediante botones en una sintaxis que sea
susceptible de posterior modificaciones, es acostumbrarnos a usar el botón pegar, antes de echar a correr
cualquier análisis desde el visor de botones:

26
Al emplear este botón no echaremos a correr inmediatamente el análisis, sino que activaremos un paso
intermedio: nuestra configuración mediante botones quedará registrada – una vez apretado el botón
Pegar – en el editor de sintaxis. Al apretar tal botón desaparecerá el cuadro de diálogo sin dar inicio al
análisis. Para que el SPSS entregue los resultados, debemos ir al editor de sintaxis, seleccionar el comando
recién creado y ejecutarlo de la manera recién vista.

Esta posibilidad que da SPSS puede llegar a ser bastante útil para mezclar el uso de botones (que no
requiere memorizar códigos dado su uso intuitivo) a la vez que se cumple el objetivo de contar con un
registro modificable de los análisis solicitados al programa.
¿Cómo exportar todos mis resultados a una hoja de Word?
La mayoría de las veces, los informes o trabajos que entregamos van en formato Word, por lo que
aprender a exportar los resultados de SPSS a Word es muy importante. Cabe señalar que mediante la
opción exportar de SPSS, podemos guardar este archivo en diferentes formatos, haciendo más fácil su
edición y manejo para la presentación de resultados en reuniones, informes etc.

SPSS arrojará un archivo (que usualmente lleva el nombre “OUTPUT”) en formato Word con los resultados
que hasta ahora se presentaban en la ventana de resultados. Generalmente, el trabajo no está finiquitado
hasta que ajustemos los detalles de presentación, pues las tablas de SPSS son poco amigables.

27
Para mejorar la presentación, seleccionamos toda la tabla con el cuadro superior que aparece a la
izquierda y podemos editar el formato de sus celdas:

28
Teniendo la tabla en el formato deseado, podemos mejorar su diseño completamente, a fin de realizar
una buena presentación. Para eso, podemos editar las fuentes de las letras, los grosores de las celdas y
aplicar nuevos diseños de tabla. Acá dejamos un ejemplo:

¿Cuál es el nivel de educación de la persona que aporta el principal y mayor


ingreso de tu hogar?
Frecuencia Porcentaje Porcentaje Porcentaje
válido acumulado

Válido Básica Incompleta 1 1,4 1,4 1,4

Media Incompleta 7 9,9 10,0 11,4

Media Completa 16 22,5 22,9 34,3

Técnica post-media 3 4,2 4,3 38,6


incompleta

Técnica post-media 13 18,3 18,6 57,1


completa

Universitaria 4 5,6 5,7 62,9


Incompleta

Universitaria 26 36,6 37,1 100,0


Completa

Total 70 98,6 100,0

Perdidos Sistema 1 1,4

Total 71 100,0

Fuentes secundarias
Como se señaló, SPSS nos permite trabajar con bases de datos y también hacer uso de fuentes de datos
ya existentes. Nuevamente, cuando los datos que estamos utilizando fueron recogidos en el marco de
nuestra propia investigación, estas fuentes se conocen como primarias, pues contienen información
nueva y original. En el caso de que nos encontremos trabajando con información que ya fue organizada y
elaborada previamente, esta se conoce como fuente de tipo secundaria.

29
Fuentes de información secundarias
Uno de los principales conocimientos que se requieren para llevar a cabo análisis estadísticos es conocer
desde donde podemos obtener fuentes de datos secundarios; si bien parece algo trivial, no siempre lo es,
pues hay que tener claro en primer lugar qué es lo que necesitamos, para saber dónde buscar.

Existe una variada gama de encuestas y estudios, que son realizados de manera periódica en nuestro país,
dentro de ellas podemos destacar, dentro de las más empleadas:

Institución Encuesta Enlace

Centro de Estudios Encuesta Nacional http://www.cepchile.cl/dms/lang_1/encuestasCEP.htm


Públicos de Opinión Pública

Universidad Diego Encuesta Nacional http://www.encuesta.udp.cl/


Portales (ICSO) UDP

Programa de las Desarrollo http://www.desarrollohumano.cl/base-datos/base-


Naciones Unidas Humano en Chile datos.htm
para el Desarrollo
(PNUD)

Ministerio de Salud Encuesta Nacional http://epi.minsal.cl/vigilancia-epidemiologica/sistema-


de Salud de-vigilancia-de-enfermedades-no-transmisibles-
vent/solicita-base/

(Se debe solicitar creando un usuario)

Sin embargo, es preciso tener en cuenta que cada uno de estos estudios presenta sus objetivos
particulares, por lo que la información que queramos obtener desde ellos estará delimitada por tales
orientaciones. En tal sentido, una recomendación importante es la importancia de contar con una relativa
orientación al comenzar cualquier trabajo de investigación (objetivos, hipótesis, áreas temáticas de
interés, etc.), pues sólo tal condición nos ahorrará tiempo valioso al momento de buscar posibles fuentes
de información (sin estar recorriendo cuestionarios incansablemente, hasta que por arte de magia se nos
ocurra sobre qué hacer nuestro informe.

El siguiente cuadro resume las principales orientaciones de los estudios ya mencionados.

30
Institución Características

Centro de Estudios “La Encuesta Nacional de Opinión Pública CEP representa un estudio
Públicos académico y objetivo de las actitudes y predisposiciones políticas,
económicas y sociales de todos los habitantes del país. A través de este tipo
de estudios se desea conocer las preocupaciones, preferencias y
necesidades de la población.” (CEP, 2013)

Universidad Diego “Conocer la opinión pública a nivel nacional y regional de los siguientes
Portales (ICSO) temas: Políticas públicas y sociales, opiniones sobre la coyuntura política y
económica, confianza en instituciones, democracia y representación,
familia e intimidad, percepción sobre los empresarios, participación
ciudadana y medio ambiente, y discriminación.” (UDP, 2013)

Programa de las Las características dependen del área de estudio específica definida para el
Naciones Unidas año en cuestión.
para el Desarrollo
(PNUD) “Lo que aquí se pretende mostrar es que, para resignificar el horizonte del
desarrollo poniendo al centro los proyectos de vida de las personas, es
necesario ampliar la mirada y asumir en toda su complejidad una dimensión
hasta ahora menos atendida del desarrollo, y de la cual el fenómeno de la
felicidad forma parte: la subjetividad. Se entiende por subjetividad el espacio
y el proceso en que los individuos construyen una imagen de sí, de los otros
y del mundo en el contexto de sus experiencias sociales. Este ámbito está
formado por sus emociones, imágenes, percepciones, deseos, motivaciones
y evaluaciones, entre otros elementos.” (PNUD, 2012)

Ministerio de Salud -----------

Elementos descargables diferentes: utilidades diferentes


Cuando accedamos a alguno de los links que ya hemos anotado, nos encontraremos con la posibilidad de
descargar diferentes elementos, que es preciso diferenciar para saber cómo ocupar.

En primer lugar, muchas veces es bastante visible la presentación, informe o sinopsis (o algún nombre
afín). Este archivo por lo general no nos será tan útil, ya que se trata de la presentación que hace la
institución de los principales resultados que arrojó el estudio. A veces se trata de una presentación
powerpoint que incluye frecuencias, porcentajes y gráficos. Evidentemente, un documento así no sirve
para nuestras intenciones: a nosotros nos interesa analizar datos, no que nos informen sobre el análisis
que hizo otro; sin embargo, en algunos casos (como los informes del PNUD, en este documento se suelen

31
incluir aspectos teóricos relevantes que pueden sernos de utilidad a la hora encargarnos del análisis de
datos). No suelen incluir precisiones metodológicas.

En segundo lugar podemos mencionar la base de datos. Usualmente es posible encontrar bases de datos
en formato .xls (planilla Excel) o .sav (formato SPSS) susceptibles de abrir con los programas. Cualquiera
sea el formato, una base de datos es – en formato virtual – un pliego de papel blanco cuadriculado donde
podemos ir poniendo números. Evidentemente éste archivo nos interesa, ya que si lo tenemos en nuestro
poder podemos iniciar nuestros propios análisis sobre la información producida por otras instituciones.
Es el archivo que abriremos con nuestro software de análisis estadístico.

En tercer lugar, tenemos el cuestionario. En algunos casos (Encuesta CEP, por ejemplo), este viene
incluido en el manual de usuario que describiremos en el siguiente párrafo. Más allá de que la base de
datos sea el archivo clave, por incluir la información producida, gracias al cuestionario será posible
entender el estudio y decidir sobre qué variables (preguntas) emplearemos en nuestro análisis. Muchas
veces al abrir una base de datos se hará dificultosa la búsqueda de variables de interés, procedimiento
que se realiza de manera expedita al inspeccionar el cuestionario.

En último lugar, es preciso mencionar el manual de usuario. En este documento encontraremos la


información técnica necesaria para hacernos una idea de las principales características y alcances del
estudio. Datos como tamaño de la muestra, población representada, nivel de confianza, margen de error,
error de cobertura, tasas de reemplazo y factores de ponderación de los datos, estarán indicados con
detalle en este documento.

Para introducirnos en el uso de datos secudnarios procederemos a descargar la Base de Datos Encuesta
UDP 2014, que luego abriremos. Para ello, accederemos al sitio http://www.encuesta.udp.cl/ , y luego
nos dirigimos al Banco de Datos:

32
Una vez abierta, podemos hacer uso de ella tal como mostramos con la base creada por nosotros mismos.
Solo a modo de ejemplo, repetiremos el proceso que explicamos con la base propia, pero esta vez con la
base de la UDP. Así se ve la interfaz de SPSS cuando abrimos la base:

Esta vez, solicitaremos conocer las frecuencias e histogramas de la siguiente pregunta:

 P41C: Acuerdo con: Las diferencias políticas entre la elite y el pueblo son más grandes que las
diferencias que existen en el pueblo, siendo 1 “muy de acuerdo” y 5 “muy en desacuerdo"

Para combinar ambas formas de utilizar SPSS, esta vez iremos a Analizar, Estadísticos Descriptivos,
Frecuencias. Llegando a este punto, vamos a Gráficos, pedimos el histograma, y luego seleccionamos
Pegar. Ahora se abrirá nuestra ventana de sintaxis:

33
Para finalizar, seleccionamos el comando y le damos play, para luego ver nuestra ventana de resultados:
Haciendo una descripción somera de los datos obtenidos, vemos que la mayoría de los encuestados esta
de acuerdo con que las diferencias políticas entre la elite y el pueblo son más grandes que las diferencias
que existen en el pueblo, ya que la mayoría de los resultados se concentran en las opciones 1 y 2.

34
Casos perdidos
Al observar el histograma, podemos observar que el histograma se distribuye del valor 1 al 9, a pesar de
que las alternativas de respuesta van del 1 al 5. Esto se debe a que no dimos por perdidos los valores 8
“no sabe” y 9 “no contesta”, un error que puede distorsionar nuestros resultados, especialmente cuando
estemos haciendo análisis más complejos y podamos no darnos cuenta.
Para solucionar esto debemos volver a la vista de variables, y seleccionar la casilla “Perdidos” para nuestra
variable P41C, y establecer valores perdidos discretos, en este caso 8 y 9.

Una vez realizado esto ejecutamos nuevamente la sintaxis de nuestro análisis para observar como
modifica esto los resultados, tanto en la distribución en el histograma como en las frecuencias relativas
de la tabla de frecuencias.

35
Por último, es importante considerar, que el eliminar los casos perdidos es una decisión que hay que
tomar considerando si los casos perdidos no entregan o no información. Un ejemplo claro, son las escalas
de posición política, en las cuales se pregunta a los encuestados si se consideran de izquierda, centro o
derecha, que, al ser aplicadas en nuestro país, siempre tienen como alternativa con mayor frecuencia
“ninguna”, o “no sabe/no contesta” (dependiendo de la construcción de las alternativas), generando que
lo que se podría considerar casos perdidos constituyen la información sociológicamente más relevante, y
nos da cuenta de las dificultades de aplicar este ítem para medir posición política.

36
Anexos
Anexo 1: Cuestionario aplicado a los estudiantes para crear la base de datos

Uso Interno
ENCUESTA CURSO ESTADÍSTICA I

PRESENTACIÓN E INSTRUCCIONES

La presente encuesta ha sido elaborada exclusivamente con propósitos educativos. El objetivo de la encuesta es conocer el comportamiento y opiniones de
los alumnos del curso y contar con material didáctico y pedagógico para realizar actividades de ayudantía.

Se realizarán preguntas generales sobre tu familia, vida universitaria y otros temas generales. Esta encuesta es completamente privada y anónima. Ninguna
persona conocerá tus respuestas, tu nombre no será escrito en ninguna parte, por lo que puedes tener confianza en que la información que entregues será
secreta.

En la encuesta no hay respuestas buenas ni malas, sólo nos interesa conocer tu opinión. Recuerda que la participación en la encuesta es completamente
voluntaria.

En cada pregunta debes marcar siempre una sola alternativa, excepto cuando se especifique otra cosa. Si tienes alguna duda respecto al cuestionario,
puedes hacérsela al ayudante. Desde ya muchas gracias por tu disposición y colaboración.

1. ¿Cuál es tu edad? 4. ¿En qué Comuna vives?

2. Tu sexo es…

Masculino………………… (1) 5. 5. En la siguiente tabla anota tus puntajes en la PSU para


cada prueba:
Femenino……………….... (2)

Prueba Puntaje

3. Eres de… Lenguaje y Comunicación

Matemáticas
Santiago…………………. (1)
Historia y Ciencias Sociales
Región…………………… (2)
El extranjero…………….. (3)
6. ¿Cuál fue tu promedio de notas de enseñanza media?

37
Promedio

Percepción sobre el país

8. Del siguiente listado, ¿cuáles son las tres palabras que


representan mejor tu manera de ver a Chile?
7. Pasando a otro tema, ¿cómo crees que…
(Marcar como máximo sólo tres alternativas)

Mejor que Igual que Peor que

ahora ahora ahora Democrático…………………………….. (1)

a) Va a estar Chile en 5 años más? (1) (2) (3) Consumista……………………………… (2)


Tolerante………………………………… (3)
b) Vas a estar tú en 5 años más? (1) (2) (3)
Moderno…………………………………. (4)
Sin Igualdad de Oportunidades………. (5)
Inseguro…………………………………. (6)
Individualista……………………………. (7)
Clasista………………………………….. (8)
Justo……………………………………... (9)
Discriminador…………………………… (10)
Represivo……………………………….. (11)
Libre……………………………………… (12)
Seguro…………………………………… (13)
Injusto……………………………………. (14)
Con igualdad de oportunidades………. (15)
Solidario…………………………………. (16)

38
Uso de Tecnologías

9. ¿Con qué frecuencia utilizas el computador? 11. ¿Tienes computador (PC o notebook) en tu casa?

Todos los días……………………………. (1) Sí...…………..…..……… (1)


Algunas veces a la semana……………. (2) No….………….....……… (2) (Pasar a pregunta 12)
Algunas veces al mes…………………... (3)
Nunca o casi nunca……………………... (4) 12. ¿Tienes conexión a Internet en tu casa?

10. ¿Con qué frecuencia utilizas Internet? Sí...…………..…..……… (1)


No….………….....……… (2)
Todos los días……………………………. (1)
Algunas veces a la semana……………. (2)
Algunas veces al mes…………………... (3)
Nunca o casi nunca……………………... (4)

Confianza

13. En general ¿Cuánta confianza tienes en las siguientes personas para 14. Dirías que en general:
conversar sobre las cosas que te importan?

Se puede confiar en las personas………………. (1)


Mucha Poca No tiene No tiene con
quien No se puede confiar en las personas…….……. (2)
Confianza Confianza Confianza conversar

a) Madre (1) (2) (3) (4)


15. Con respecto al tema de la amistad, usted diría que:
b) Padre (1) (2) (3) (4)

c) Amigos (1) (2) (3) (4) Tiene muchos amigos………………………. (1)


Tiene pocos amigos…………….…….……. (2)
d) Pareja (1) (2) (3) (4)
No tiene amigos, sólo conocidos…………. (3)
e) Hermano(a) (1) (2) (3) (4)

f) Otro Adulto (1) (2) (3) (4)

39
Para Terminar

16. ¿Cuál es el nivel de educación de la persona que aporta el 20. En la actualidad, ¿qué tan satisfecho te sientes con la carrera que
principal y mayor ingreso de tu hogar? elegiste estudiar?

Sin Estudios…………………………….. (1) Muy satisfecho………………………….. (1)


Básica Incompleta……………………… (2) Bastante satisfecho….………………… (2)
Básica Completa.….…………………… (3) Algo satisfecho....….…………………… (3)
Media Incompleta………………………. (4) Poco satisfecho...………………………. (4)
Media Completa………………..………. (5) Nada satisfecho………………..………. (5)
Técnica post-media incompleta...……. (6)
Técnica post-media completa..……….. (7) 21. ¿Por qué te sientes así de satisfecho con tu carrera?
Universitaria Incompleta…...………….. (8)
Universitaria Completa………………... (9)

17. ¿Con qué religión te identificas?

Católica………………………………….. (1)
Protestante o Evangélica……………… (2)
Judía…………….….…………………… (3)
Ateo o Agnóstico….……………………. (4)
Ninguna Religión..……………..………. (5) 22. En la actualidad, ¿qué tan satisfecho te sientes con la Universidad?
Otra (indique cuál)…………….....……. (6)
__________________________________ Muy satisfecho………………………….. (1)
Bastante satisfecho….………………… (2)
18. ¿Con qué frecuencia vas a misa o a oficios religiosos de tu Algo satisfecho....….…………………… (3)
iglesia (sin contar bautizos, matrimonios o funerales)?
Poco satisfecho...………………………. (4)
Nada satisfecho………………..………. (5)
Más de una vez a la semana...……….. (1)
Una vez a la semana…...……………… (2)
23. ¿Por qué te sientes así de satisfecho con la Universidad?
Algunas veces al mes.………………… (3)
Algunas veces al año…………………. (4)
Nunca o caso nunca…………..………. (5)

19. ¿Estás inscrito en los registros electorales?

Sí…………....…………..…..……… (1)
No….………………….….....……… (2)
No aplica, soy menor de 18 años.. (3)

40
Anexo 2: Sintaxis del ejercicio para tablas de frecuencias e histograma
*Ejemplo de tabla de frecuencias e histograma para la pregunta 16.

FREQUENCIES VARIABLES=p16

/HISTOGRAM

/ORDER=ANALYSIS.

*Ejemplo de tabla de frecuencias e histograma para la pregunta 17.

FREQUENCIES VARIABLES=p17

/HISTOGRAM

/ORDER=ANALYSIS.

*Eejemplo de tabla de frecuencias e histograma para la pregunta P41C de la base de datos UDP 2015:

FREQUENCIES VARIABLES=P41C

/HISTOGRAM

/ORDER=ANALYSIS.

41

También podría gustarte