Está en la página 1de 7

Taller SPSS

El 90% de un exitoso análisis en SPSS es preparar bien la información y las variables, y por ello
en ocasiones es necesario recodificar las variables

90%: Análisis descriptivos (Pese a que son infravalorados)

Sintaxis: Superar el nivel de usuario de SPSS, garantiza trabajo.

La estadística es una herramienta (ciencia auxiliar), no es verdad en sí misma. El error que


cometemos es pensar que por numerizar algo es real, dos niveles de este error: Para usar
estadística necesito observar la realidad de cierta manera, como unidades de medición
equivalentes (En ciencias sociales se basa en contar a los individuos; La estadística no puede
observar relaciones sociales, solo individuos).

Individualismo metodológico como recurso, pese a que se debe tener en cuenta que la
sociedad está en las relaciones sociales. Solo aspiramos a una aproximación a las relaciones
sociales.

Al tratarse de unidades de medición equivalentes solo pueden inferirse resultados para las
unidades como grupo, y no como individuos.

La estadística no tiene NADA que ver con los números, se expresa en los números. Son un
conjunto de reglas que unos tipos se dieron cuenta de que existía cuando habían muchas cosas
dando vuelta.

Vista de datos

Filas: Casos, cosas (que puedo contar)

Columnas: Variables, características de los sujetos

Vista de variables

Fila: Variable

Columna: Condiciones o características de la variable

- La clave de la estadística es definir bien la variable de análisis, qué es lo que se va a


medir de cada persona

Variables que se pueden cuantificar y variables que no: Por ejemplo el nombre de las personas
(no se puede cuantificar), las escalares u ordinales son las que se pueden numerizar.

No obstante, en SPSS siempre a la variable le pongo un número (sea escalar o nominal).

- Etiquetas de valor: Para transformar los datos en números

Las variables tienen diversas características que se deben definir:


1) Es cuantificable o no (nominal u ordinal/escalar): La frontera entre lo que se puede
medir o no es teórica. Se debe ser consecuente con esta determinación, porque una
variable nominal se mide distinto de una ordinal/escalar.
2) Tipo: Casi siempre se pone “numérico”, porque es más fácil de medir
3) Etiqueta: Nombre completo
4) Valores: Los números asignados a las categorías. Las variables “escala” no tienen
valores, porque el número en sí es el valor (categoría)
5) Decimales: Si quiero usar decimales en las categorías
6) Casos perdidos: Por defecto SPSS no da casos perdidos, deben definirse.
7) Medida: Escalar, nominal (unidades cualitativamente distintas) u ordinal.

Archivo  Nuevo  Sintaxis

Sintaxis: Conjunto de instrucciones al programa. Permite guardar, replicar y personalizar un


análisis, permitiendo ahorrar tiempo en los análisis.

Programar un conjunto de instrucciones al computador para que haga análisis estadísticos

- Un comando es una instrucción al SPSS. Siempre un comando termina en un punto.


- Control + R o “play”: Para activar

Trampas:

- Lo clave en una investigación es que se haga una muy buena preparación de los datos:
No solo significa ser ordenado en SPSS, también está la imaginación del analista.
- La teoría es lo que permite medir algo bien, no los números

Como trabajar en SPSS:

- Primero trabajas todas las tablas descriptivas y cruzas todas las variables
- Luego ese descriptivo se lee, y en virtud de eso se hacen otras pruebas.
- Al final en el informe va una tabla o dos tablas, nada más.

No se construyen interpretaciones a partir de una sola prueba.

No solo hay que producir análisis, también hay que producir variables.

Tarea: Revisar la CASEN

- Variables de identificación: Permiten identificar a los casos. Folio es la identificación


del hogar. Hay que sacar la mayor cantidad de variables de identificación que se
puedan.
- Variables de expansión: Toda encuesta probabilística es siempre un ejercicio lleno de
errores (producir aleatoriedad no es fácil), para resolver esto y hacer equiparable a la
población se hacen variables de expansión, que son números por los que multiplico la
muestra para que dé la población total. Se inventa un número para multiplicar cada
caso de la muestra.
Ponderar es solo ajustar datos, Expansor es para expandir (aunque es al mismo tiempo
ponderador).

- Variables del hogar: Tipo de vivienda, número de vivienda, etc. Identificación de la


vivienda
- Variables sociodemográficas: Sexo, edad, estado civil, pareja, etc.
- Variables de CASEN

CASEN se organiza en Módulos, parte con preguntas de educación (e), ocupación (o), ingresos
(y), salud (s), trayectoria y movilidad (r), vivienda (v).

- Variables que a partir de las anteriores genera CASEN, como por ejemplo pobreza,
nivel educacional, variable corte (pobreza, por la que todos se pelean), indicadores
varios, etc.

Preparar una base de datos.-

- Hay que foliar siempre las encuestas (número único con la información de a quién se le
aplicó y quién lo hizo).
- Los datos se pueden ingresar directamente o importarlos (copiando de Excel)
- Variables nombre son de tipo cadena (variables con letra, además es nominal)
- En sintaxis se puede atribuir el tipo de una variable, el nivel, etc. En estudios con
cientos de variables es complejo ir haciendo eso con el mouse, por lo que se usa
sintaxis
- Primera línea antecedida de asterisco hace que no valga para el spss, son solo líneas
comentadas, así puedes explicarte a ti mismo lo que estás haciendo

VARIABLE LEVEL: nivel de medición de las variables (nominal, ordinal

Variable labels: etiquetado de variables, se usa la apóstrofe para la etiqueta (‘’)

Value labels: Etiquetas de valor de las variables

- Definir códigos para los valores perdidos: en general se usa 99. No siempre la ausencia
de datos es por perdidos, a veces es porque corresponde (por ejemplo saltos, donde
se usa el “66”)

Formats: Anchura de decimales; no sirve.

Ahora con CASEN:

Comandos:

- RECODE: Recodificar

*Uno nunca usa las variables tal y como las tiene

EDAD
- DESCRIPTIVOS DE LA VARIABLE EDAD

DESCRIPTIVES EDAD. (Si quiero sacar descriptivos de más variables solo debo poner
espacio y el nombre de la variable, todo seguido).

*RECODIFICAR LA VARIABLE EDAD EN TRAMOS (nunca recodificar en la misma variable)

WEIGHT OFF.  Apagar el ponderador (porque cuando estas recodificando quieres saber los
datos reales que tienes, luego se vuelve a prender para el análisis)

RECODE –> Recodificación

INTO: RECODIFICAR EN OTRA

Cada vez que a SPSS le doy una orden que modifica la base de datos (no análisis, ni etiquetas,
etc.) debo dar la orden de EJECTUTAR (EXECUTE)

- DO IF: Es un condicionante, funciona como un operador lógico. SPSS solo operara en


los casos que solo cumplen esa condición
- END IF: Termina LA CONDICIÓN

ELSE= Todos los demás

SYSMIS= Datos perdidos (SI USO LA CONDICIÓN NO ES NECESARIO)

WEIGHT BY EXPR_R2 (ESE ES EL NOMBRE DEL PONDERADOR EN LA CASEN)

Establecer un principio jerárquico

El comando DO IF no es lo mismo que el filtro, ya que ese último espera el análisis de las
variables

Las medidas de tendencia central son la base para analizar cualquier cosa. Luego, las técnicas
descriptivas (tablas de contingencia) y univariadas son el 90% de lo que hacemos

Tablas personalizadas: Se toma una variable independiente, que es nuestra variable de


estratificación. La variable se pone en las filas o las columnas (se pone el tipo de variable,
nominal en este caso).

Reemplazar total por “promedio general”

En las columnas ponemos una gran cantidad de indicadores (se ponen como escalares).

Esta tabla no se incluye en informes.


Sexo Edad (años cumplidos) Años de escolaridad Indicador de Hacinamiento

Medi Median Mod Desviació Medi Median Mod Desviació Medi Median Mod Desviació Medi Median Mod Desviació
a a a n típica a a a n típica a a a n típica a a a n típica

= 'Clase 1,54 2,00 2,00 ,50 30,68 26,00 17,0 21,91 8,86 9,00 12,0 4,00 1,30 1,00 1,00 ,53
baja' 0 0

= 'Clase 1,52 2,00 2,00 ,50 35,37 33,00 21,0 22,46 9,68 11,00 12,0 4,04 1,15 1,00 1,00 ,39
Estratificació media' 0 0
n social 3 = 'Clase 1,49 1,00 1,00 ,50 37,50 37,00 50,0 20,59 13,02 13,00 12,0 3,79 1,03 1,00 1,00 ,18
categorías alta' 0 0

Promedi 1,52 2,00 2,00 ,50 34,64 32,00 18,0 22,18 10,06 11,00 12,0 4,21 1,17 1,00 1,00 ,41
o 0 0
general
Análisis bivariado.-

La distribución normal permite comprobar que se trata de un fenómeno aleatorio.


En la estadística hay variables nominales y escalares; por lo tanto las posibles
combinaciones son
1) Nominal-nominal= Chi cuadrado
2) Nominal-escalar= R de pearson
3) Escalar-Escalar=

Analizar  estadísticos descriptivos  tabla de contingencia

Chi cuadrado – casillas, tipificados, corregidos

Con los residuos se puede ver el sentido de la asociación

Chi cuadrado trabaja con las tablas de contingencia y la diferencia entre lo observado y lo
esperado.

Por otra parte, R de Pearson (Regresión lineal) trabaja con la nube de puntos, entre mayor es
la pendiente, mayor asociación.

Elaboración de índices y escalas.-

UN índice es una variable escalar u ordinal que se construye desde distintas variables. La idea
es que tenemos un concepto que da lugar a “X” dimensiones, que dan lugar a “x” variables. El
concepto debe descomponerse en dimensiones, y estas en variables, reconstruyéndolas en
una fórmula matemática.

Para el índice se necesita que al menos la dimensiones que dan lugar a “x” sub-índices estén en
la misma unidad de medida, por lo cual muchas veces hay que recodificar las variables.

Índice de incorporación al sistema financiero: A partir de esto se hacen diversas dimensiones


(Débito, crédito bancario, crédito casa comercial, chequera, línea de crédito) – En este caso
haremos coincidir dimensiones con variables (aunque podríamos hacer una diferencia entre
instrumentos de pago y de crédito)

Índice Sub índices Variables


incorporación al sistema Instrumentos de pago - Y28a
financiero: - Y28d
Instrumentos de crédito - Y28b
bancario - Y28e
Instrumentos de crédito casa - Y28c
comercial
Primero hay que elaborar subíndices que tienen que estar en la misma unidad de medida.

Algunos estadísticos dicen que las variables tienen que estar asociadas para poder hacer un
índice, aunque eso no siempre es así, la asociación entre las variables es teórica, no estadística
(debe argumentarse).

- Hay que recodificar las variables para que funcionen.


- Nosotros podemos decidir el peso de cada subíndice o variable

COMPUTE: Permite calcular una variable a partir de operaciones lógicas (matemáticas) entre
otras.

- Con los casos perdidos pueden descartarse al principio o al final, en este caso lo
haremos al final. Otra opción es imputar datos.
- Los decimales se ponen con punto en la sintaxis
- Luego, para explicar los índices se hacen tramos.

También podría gustarte