Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ÍNDICE
Hemos visto hasta el momento los pasos que se siguen en una investigación. Partimos de una idea, un
problema y continuamos con la formulación de la investigación, su alcance, la definición de sus hipótesis,
su diseño hasta llegar a la muestra. Ahora continuaremos con el análisis, que corresponde al eje principal
de este MÓDULO. Llegado a este punto el estudiante debe tener en cuenta que el paso a seguir requiere
lo siguiente:
2
Base de datos
Aunque evidente, es importante recordar que los programas de análisis cuantitativo funcionan con
valores numéricos y no con texto. Es así que las bases que se elaboren para tal fin deben responder a
esta característica.
Es común ver en el estudiante que inicia su proceso, cometer el error de digitar en su base palabras
como hombre, mujer, Alto, Bajo, etc., Por ello, el primer paso en este proceso tiene que ver con la
categorización de las variables y la atribución numérica a las categorías de las variables. Así, el estudiante
debe atender a cuál es la variable medida y qué características tiene. Miremos el ejemplo de encabezado
de una prueba que aparece abajo. Allí aparecen los datos personales del paciente. Como se ve, la prueba
indaga por la variable sexo. La misma tiene a su vez dos categorías: hombre y mujer.
A estas categorías se le asigna un valor numérico que, si bien, en principio puede ser cualquiera, ya que
estos valores sólo funcionan como etiquetas, generalmente son del tipo 1 y 2. 1: hombre, 2: mujer. En
este punto se recomienda al estudiante evitar el uso del 0 como categoría. El 0 es útil sólo en los casos
en los que la categoría, por sí misma, designe una falta o carencia, por ejemplo, cuando tomamos cierto
tipo de respuestas dicótomas o de dos opciones, como sí y no, En estos caso el sí puede categorizarse
con un 1 y el no con un 0. En el resto de las situaciones se puede evitar estos usos.
NIVELES DE MEDIDA
Existen distintas formas de entender los valores numéricos en una base. En esta unidad utilizaremos la
división establecida por Coolican (2005) entre variables categóricas y variables medida.
Los datos que designan categorías (datos etiqueta) no tienen un valor real en cuanto magnitud, Así, en el
ejemplo anterior, puedo tener una variable que se llame tipo de investigador y atribuir, al primer tipo
(Clínico) el valor de 1, y al segundo (Investigador) el valor de 2.Es claro que con este tipo de dato
numérico no es posible ubicar puntos intermedios.
En las variables medida, por el contrario, los valores numéricos sí tienen un poder o magnitud como
número, ya que son el resultado, generalmente, de la aplicación de una escala (en el caso anterior la
variable Edad es un tipo de variable medida).
Existe un común acuerdo en los tipos de niveles de medida. Estos son: nominal, ordinal, de razón y de
intervalo (Hernández, Fernández y Baptista, 2010, p.214).
En el nivel de medida nominal hay una categorización de la variable y se asignan valores numéricos a
cada categoría. Así, por ejemplo, frente a la variable altura, pueden aparecer categorías como altos y
bajos, a las cuales les atribuyo un valor numérico cualquiera. El estudiante debe tener presente que las
categorías nominales denominan grupos separados.
Estos dos tipos de medida hacen parte de lo que se denomina variables discretas. Los valores numéricos
se asocian a la designación de grupos o conjunto de personas o cosas, por lo cual no hay un continuo
entre un valor numérico y otro (no es posible pensar, en una variable dicótoma, como género, un valor
intermedio como 1,5).
Los otros dos tipos de medida, de intervalo y de razón, hacen referencia a unidades o valores numéricos
medibles a través de escalas (de allí su denominación como escalares).
Las variables de intervalo, designan datos agrupados cuyo valor numérico tiene un peso o magnitud
como número. Es común en este tipo de variables que no exista un 0 absoluto.
Las variables de razón son escalas de tipo intervalo que tienen un cero absoluto y, en estas, los valores y
razones de los valores tienen sentido. Este tipo de variables es común en las mediciones de cantidades
físicas.
Todas estas aclaraciones son importantes antes de continuar con nuestra base. Como veremos, una
parte importante del trabajo inicial con SPSS consistirá en hacer una atribución adecuada del nivel de
medida de la variable, ya que de éste dependerá el tipo de análisis concreto que se haga. Continuamos
entonces con el reconocimiento del entorno de SPSS.
EL ENTORNO DE SPSS
SPSS (Statistical Package for the Social Science)funciona con un entorno parecido a otro programa muy
conocido, Excel. Una rejilla o matriz de filas y columnas donde se pueden disponer los datos o valores de
una investigación.
Se pueden descargar versiones de prueba gratuitas por catorce días desde la página del proveedor.
https://www.ibm.com/analytics/es/es/technology/spss/spss-trials.html Consultada el 11 de abril de
2013.
4
Pantallazo tomado de SPSS
En su entorno, SPSS tiene una gran ventaja ya que permite ingresar los datos (vista de datos) y, a su vez,
especificar las características de las variables (vista de variables). En la vista de datos se digitaran los
datos resultado del estudio, y en la de variables las distintas variables que hacen parte de la
investigación. Recomiendo al estudiante que no esté familiarizado con este tipo de programas una
primera visita a algunos tutoriales que están disponibles en la web para que su familiarización con la
plataforma.
http://www.youtube.com/watch?v=q-KLq-USjII
http://www.youtube.com/watch?v=Nht2bkxbD2w
http://www.youtube.com/watch?v=O0FC7Nh2A_4
Es importante, ya sea en el ingreso de los datos como en el importe de ellos desde Excel, la atribución
correcta de las características de los mismos. Es igualmente relevante definir los decimales, las etiquetas,
los valores de etiqueta y, de manera muy especial, como se había mencionado anteriormente, el nivel de
medida de cada variable.
A continuación he de explicar algunos requisitos básicos para el trabajo con la base a partir de un
ejemplo. Como se podrá dar cuenta el estudiante, las columnas designan los variables y las filas los
casos. Se recomienda dejar una columna como variable de identificación. Muy útil para identificar
cuestionarios si llegase a existir errores que hay que revisar en los formularios.
En éste ejemplo tengo 4 variables (Género, Var1, Var2, Var3) y un dato de ordenamiento (Identificación
– ID).
Para importar los datos el estudiante deberá seguir una pequeña secuencia en SPSS:
Comando: Archivo/Abrir/Datos
SPSS tratará de buscar los datos, por defecto, en la carpeta [Documentos] e identificará archivos con la
extensión *.sav. Los archivos de Excel tiene la extensión *.xls *.xlsx o *.xlsm. El estudiante deberá
cambiar la búsqueda en “Archivos de tipo”, de archivo de SPSS(*.sav) a Excel. Este paso tiene una ventaja
adicional y es que permite que SPSS importe los datos con los respectivos nombres de las variables.
La otra opción es copiar directamente la base y pegarla en la primera casilla. Sólo se copiaran los datos
numéricos. El estudiante deberá ajustar las variables en la vista de variables.
Este es el primer paso para el trabajo con SPSS.
SELECCIONAR CASOS
Uno de los primeros ejercicios que se puede hacer con una base es la selección de casos específicos para
el análisis sólo de los casos de interés. Para ello, es estudiante debe digitar el siguiente comando:
6
Pantallazo tomado de SPSS
SPSS tiene varias opciones para la selección de casos. Para este ejercicio sólo nos centraremos en la
selección de una categoría de una variable, por ejemplo, en la categoría hombre de la variable Género.
Para ello, en la ventana emergente debe seleccionar la opción [Si se satisface la condición] y oprimir la
pestaña [Si la op…] allí aparecerá el siguiente cuadro de dialogo lógico:
Se selecciona la variable de la cual se escogerá el caso o categoría y se utiliza el operador lógico para la
selección. Se debe tener presente cuál es el valor numérico que es tiqueta? al caso o categoría antes de
continuar. Para el caso de los hombres estos tienen el valor numérico de 1, por ello, si quisiera sólo
seleccionar a este grupo los comandos que puedo utilizar son:
[Género] < 2
[Género] <=1
[Género] = 1
[Género] ~= 2
Cualquiera de estas opciones lógicas debe permitirnos sólo la selección de la categoría 1 (hombre) de la
variable [Género]. Continuamos y aceptamos
Sabemos que hemos seleccionado casos específicos porque los casos no seleccionados aparecerán
tachados en las filas de la izquierda. Como se ve en el ejemplo:
8
Pantallazo tomado de SPSS
Estos son los comandos básicos para funcionar con SPSS. En la próxima semana se trabajará
propiamente el análisis descriptivo de las variables.