Está en la página 1de 24

INTRODUCCIÓN

A LA ESTADÍSTICA CON EL SPSS

Profesor:
Dr. José Ovidio Flores
Email: floresjoseovidio@gmail.com
Cel: 959543990

Septiembre de 2021
Lima, Perú
2

Abuso y mal uso de la estadística (Rustom, 2012, p. 9)


A pesar de la notoria y creciente utilidad de la estadística, su uso se presta para mal uso e, incluso,
para abusos, lo que ha estimulado la aparición de detractores. A continuación, algunas de estas
opiniones:
1) Benjamín Disraeli hizo la siguiente aseveración "Existen tres tipos de mentiras, las mentiras
ordinarias, las grandes mentiras y las mentiras estadísticas".
2) Darrel Huff en su libro Cómo mentir con la Estadística, anotó al respecto "los bribones ya
conocen tales trucos; los hombres honrados deben aprenderlos para defenderse" (tomado del
texto Estadística para administradores de Levin & Rubin)
3) Hace años, una escritora humorística chilena, Eliana Simon, publicó en una revista nacional un
aforismo que decía: "Todo se puede probar con pruebas y lo que no se prueba con pruebas, se
prueba con estadísticas". Sin embargo, la misma escritora escribió también "Por lo general, el
que no cree en las estadísticas, creería en ellas si las entendiera" (tomado del libro Estadística
Elemental de Horacio D'Ottone).

SEMANA 1: INTRODUCCIÓN A LA ESTADÍSTICA CON EL SPSS


Concepto de estadística.
Se define como la ciencia que proporciona un conjunto de métodos, técnicas o procedimientos
para:
- recopilar,
- organizar (clasificar, agrupar),
- presentar, y
- analizar,
datos con el fin de describirlos o de realizar generalizaciones válidas.
Estadística descriptiva
Conjunto de métodos estadísticos que se relacionan con el resumen y descripción de los datos
como tablas y gráficas, así como el análisis mediante algunos cálculos. Es la primera etapa a
desarrollar en un análisis de información.
Estadística inferencial
Conjunto de métodos que sirven para formular generalizaciones o realizar inferencias sobre una
población a partir de una muestra. Estas inferencias pueden incluir conclusiones cuya certeza
absoluta no puede ser garantizada, por lo que es indispensable que éstas sean emitidas con una
medida de confiabilidad denominada probabilidad.
Uso de la estadística en la investigación científica y en la empresa
El origen del uso de la estadística se asocia con los inicios de la administración de los gobiernos y
los Estados (por ello la palabra estadística se relaciona con el Estado), quienes debían censar las
extensiones de tierra de los agricultores, con fines de cobrar los tributos.
Uno de los fines más importantes de la estadística es la de proporcionar alternativas cuantitativas
al juicio personal, de manera que se obtengan conclusiones objetivas. Los test de significación son
considerados como una de las herramientas más transcendentales en este tipo de toma de
decisiones, pues prácticamente no dependen de la subjetividad de la persona que las realiza.
Por otra parte, es creciente el uso de la estadística en el ámbito empresarial, particularmente en
épocas en que se manejan ingentes cantidades de datos relacionados con los procesos, los clientes,
3

los grupos de interés, el entorno, entre otros tipos de datos, que de otro modo abrumaría los
procesos de toma de decisiones gerenciales.
Visión general del SPSS
El programa SPSS, creado en 1968 por Norman H. Nie, C. Hadlai Hull y Dale H. Bent, debe su
nombre al acrónimo de Statistical Package for Social Sciences (Paquete Estadístico para las
Ciencias Sociales). Luego se denomina IBM SPSS, después de ser adquirido por la IBM en 2009.
En la actualidad este software estadístico es ampliamente utilizado en muchas disciplinas
científicas en el ámbito académico, así como en mundo empresarial.

Ventanas (vistas o pantallas) de datos, variables y resultados.


El programa cuenta con tres “ventanas”: de datos, de variables y de resultados, que estarán activas
al trabajar con el software, aunque la primera y la segunda solo se pueden ver una a la vez, mientras
que la tercera puede verse simultáneamente con cualquiera de las otras dos vistas, siempre que no
esté maximizada.
Para alternar entre las ventanas de datos y de variables solo hay que dar clic en las pestañas
correspondientes, indicadas en la figura debajo:

Tipos de datos y escalas de medida de las variables


Los datos son los valores que asume una variable cuando es medida, y pueden ser clasificados en
cualitativos y cuantitativos.
Los cualitativos corresponden a dos categorías (dicotómicos), por ej: Vivo/Muerto; Si/No; o a más
de dos categorías, llamados politómicos (Ej: Soltero/Casado/Divorciado/Viudo), donde los sujetos
son clasificados sin un orden determinado.
Los cuantitativos pueden ser continuos o discretos.
Continuos: pueden asumir un número infinito de valores entre dos puntos cualesquiera de su
intervalo de medidas (altura, tiempo, peso).
Discretos: corresponden a conteos (pj: número de hijos, número de accidentes laborales).
Las escalas de medición de las variables se definen por las operaciones matemáticas que pueden
ser utilizadas en su manipulación. Se tienen escalas: nominales, categóricas, de intervalo y de
razón.
4

1. La escala nominal. Se emplea en variables numéricas cuyos valores representan una


categoría o identifican un grupo de pertenencia. Las variables dicotómicas solamente
pueden asumir dos valores posibles (ej. Vivo/Muerto). Se considera el nivel de medición
más débil. En SPSS los números se asignan en forma aleatoria (ej: vivo puede asumir el
valor de 1 ó 2).
2. Escala ordinal o de rangos. Se suele utilizar en variables numéricas cuyos valores
representan una categoría o identifican un grupo de pertenencia contando con un orden
lógico. Este tipo de variables permite establecer relaciones de igualdad/desigualdad y a su
vez, podemos identificar si una categoría es mayor o menor que otra. (Ej: escala tipo Likert,
Grado de instrucción).
1. Escala de intervalo. Se emplea en variables numéricas, que pueden presentarse en grados
o magnitudes. Además de clasificar y ordenar las categorías, estas variables indican los
grados de distancia que existe entre ellas. Ej: Temperatura, coeficiente intelectual.
2. Escala de razón. Corresponden a variables numéricas (discretas o continuas) cuyos valores
no representan categorías, sino magnitudes o cantidades susceptible de cualquier tipo de
operación aritmética. Ej: Peso, Edad, Altura.
El SPSS excluye expresamente la escala de intervalo, la considera como escala de razón.
En el caso de variables de cadena consideradas como ordinales, el SPSS procesa las categorías en
orden alfabético. Ej: si tamaño se categoriza como bajo, mediano y alto, el software las ordenará
como alto, bajo y mediano. Por ello es conveniente codificar utilizando números.
Datos univariantes y multivariantes
Los datos univariantes contienen información sobre una característica en particular (edad) y datos
multivariantes de varias características (ej: estatura, peso y notas)

Técnicas e instrumentos de investigación


Técnica de investigación: procedimiento o forma particular de obtener datos o información.
Instrumento de investigación: recurso, dispositivo o formato (en papel o digital), empleado para
obtener, registrar o almacenar información.
Técnica Instrumento
Libreta de campo, Ficha de registro,
Observación Grabaciones, Entrevista a profundidad con
informantes claves, Video, Fotografías
Entrevista Puede ser grabada en medios electrónicos
Encuesta Test, cuestionarios, escalas
Los grupos focales (focus group) Guion de grupo focal
El análisis de documentos Matrices de análisis

Creación de un archivo de trabajo en SPSS


a) Crear el archivo directamente en SPSS
5

b) Importar el archivo de Excel u otros softwares o formatos

Crear el archivo directamente en SPSS (Uso del editor de datos). Dele click al icono del SPSS.
En la ventana de edición de datos de SPSS se puede abrir un archivo de datos creado con
anterioridad o crear un nuevo archivo. En el caso de crear un archivo de datos nuevo, el primer
paso es el de definir las variables que formarán el archivo. Para definir una variable se pueden
seguir dos procedimientos:
1. Haciendo doble clic con el botón izquierdo del ratón cuando el puntero de este se encuentra
situado en la palabra var del extremo superior de la columna (en vista de datos)
2. Pulsando la pestaña de vista de variables.
Para la asignación del nombre de las variables es menester considerar:
•El nombre debe comenzar por una letra. Los demás caracteres pueden ser letras, dígitos,
puntos o los símbolos @, #, _ o $.
• Los nombres de variable no pueden terminar en punto.
• Se debe evitar finalizar los nombres de variable con subrayado (para evitar conflictos con
las variables creadas automáticamente por algunos procedimientos).
• La longitud del nombre no debe exceder los 64 bytes. Normalmente, 64 bytes suelen
equivaler a 64 caracteres en idiomas de un solo byte (por ejemplo, inglés, francés, alemán,
español, italiano, hebreo, ruso, griego, árabe, tailandés) y a 32 caracteres en los idiomas de
dos bytes (por ejemplo, japonés, chino, coreano).
• No se pueden utilizar espacios en blanco ni caracteres especiales (p. ej.: !, ?, ’ y *).
• Cada nombre de variable debe ser único; no se permiten duplicados.
• Las palabras reservadas no se pueden utilizar como nombres de variable: ALL, AND, BY,
EQ, GE, GT, LE, LT, NE, NOT, OR, TO, WITH.
• Los nombres de variable se pueden definir combinando de cualquier manera caracteres en
mayúsculas y en minúsculas, esta distinción entre mayúsculas y minúsculas se conserva en
lo que se refiere a la presentación.
• Cuando es necesario dividir los nombres largos de variable en varias líneas en los
resultados, SPSS intenta dividir las líneas aprovechando los subrayados, los puntos y los
cambios de minúsculas a mayúsculas.
Libro de códigos
Cuadro 1. Ejemplo de libro de códigos
Nombre de la variable Etiqueta Valores
1: Masculino
Sexo Sexo
2: Femenino
1: 18 a 25
Edad Edad 2: 26-30
3: >30 años
Ingreso Ingresos mensuales En dólares/USD

Uso del Editor de datos


En el Editor de datos se muestra el contenido del archivo de datos activo. La información incluida
en el Editor de datos consta de variables y casos.
6

• En la Vista de datos, las columnas representan las variables y las filas representan los casos
(observaciones).
• En la Vista de variables, cada fila es una variable y cada columna es un atributo asociado
a dicha variable.
Las variables se utilizan para representar los diferentes tipos de datos que haya recopilado. Una
analogía común es la de una encuesta. La respuesta a cada pregunta de una encuesta equivale a
una variable. Las variables son de distintos tipos, incluyendo números, cadenas, moneda y fechas.
Introducción de datos numéricos
Los datos se pueden introducir en el Editor de datos, lo que puede resultar útil para archivos de
datos pequeños o para realizar tareas de edición menores en archivos de datos más grandes.
1. Pulse en la pestaña Vista de variables, que se encuentra en la parte inferior de la ventana Editor
de datos.
Debe definir las variables que van a utilizar. En este caso, sólo se necesitan tres variables:
edad, estado civil e ingresos.
2. Escriba edad en la primera fila de la primera columna.
3. En la segunda fila, escriba ecivil.
4. En la tercera fila, escriba ingresos.
Se asignará automáticamente el tipo de datos Numérico a las nuevas variables.
Si no introduce nombres de variable, se crearán nombres exclusivos automáticamente. No
obstante, estos nombres no son descriptivos ni recomendables para archivos de datos más grandes.
No olvide asignar el nivel de medida de la variable

Figura 1. Nombres de variables en la Vista de variables

5. Pulse en la pestaña Vista de datos para seguir introduciendo los datos.


Los nombres introducidos en la pestaña Vista de variables serán, a partir, a partir de ahora, los
encabezados de las tres primeras columnas de Vista de datos.
Empiece a introducir datos en la primera fila de la primera columna.
6. En la columna edad, escriba 55.
7. En la columna ecivil, escriba 1.
8. En la columna ingresos, escriba 72000.
9. Mueva el cursor hasta la segunda fila de la primera columna para añadir los datos del siguiente
sujeto.
10. En la columna edad, escriba 53.
11. En la columna ecivil, escriba 0.
12. En la columna ingresos, escriba 153000.
Ahora en las columnas de la edad y el estado civil aparecen número decimales, aunque sus
valores sean números enteros. Para ocultar los decimales en estas variables:
7

13. Pulse en la pestaña Vista de variables, que se encuentra en la parte inferior de la ventana
Editor de datos.
14. En la columna Decimales de la fila edad, escriba 0 para ocultar el decimal.
15. En la columna Decimales de la fila ecivil, escriba 0 para ocultar el decimal.

Figura 2. Valores introducidos en Vista de datos

Introducción de datos de cadena


También se pueden introducir datos no numéricos como, por ejemplo, cadenas de texto, en el
Editor de
datos.
1. Pulse en la pestaña Vista de variables, que se encuentra en la parte inferior de la ventana Editor
de datos.
2. Escriba sexo como nombre de variable en la primera casilla de la primera fila vacía.
3. Pulse en la casilla Tipo que hay junto a su entrada.
4. Pulse en el botón que hay a la derecha de la casilla Tipo para abrir el cuadro de diálogo Tipo
de variable.
5. Seleccione Cadena para especificar el tipo de variable.
6. Pulse en Aceptar para guardar la selección y volver al Editor de datos.

Figura 3. Cuadro de diálogo Tipo de variable


8

Definición de datos
Además de definir los tipos de datos, también puede definir etiquetas descriptivas de variable y
etiquetas de valor para los nombres de variables y los valores de datos. Estas etiquetas descriptivas
se emplean en los gráficos e informes estadísticos.
Adición de etiquetas de variable
Las etiquetas están destinadas a proporcionar descripciones de las variables. Estas descripciones
suelen ser versiones extendidas de los nombres de variable. Las etiquetas pueden ocupar hasta 255
bytes. Estas etiquetas se utilizan en los resultados para identificar a las diferentes variables.
1. Pulse en la pestaña Vista de variables, que se encuentra en la parte inferior de la ventana
Editor de datos.
2. En la columna Etiqueta de la fila edad, escriba Edad del encuestado.
3. En la columna Etiqueta de la fila ecivil, escriba Estado civil.
4. En la columna Etiqueta de la fila ingresos, escriba Ingresos familiares $.
5. En la columna Etiqueta de la fila sexo, escriba Sexo.
Nota: es muy importante indicar las unidades (moneda, peso, volumen) en que fue medida la
variable

Figura 4. Etiquetas de variable introducidas en Vista de variables

Cambio de tipo de variable y formato


En la columna Tipo aparecen los tipos de datos actuales de cada variable. Los tipos de datos más
comunes son los numéricos y las cadenas, pero se admiten otros muchos formatos. En el archivo
de datos actual, la variable de ingresos se define como un tipo numérico.
1. Pulse en la casilla Tipo para la fila ingresos y, a continuación, pulse el botón que hay a la
derecha de la casilla para abrir el cuadro de diálogo Tipo de variable.
2. Seleccione Dólar.
9

Figura 5. Cuadro de diálogo Tipo de variable

Aparecerán las opciones de formato del tipo de datos seleccionado en ese momento.
3. Para el formato de la moneda de este ejemplo, seleccione $###,###,###.
4. Pulse en Aceptar para guardar los cambios.
Si se selecciona el formato Variables con coma (es numérico) se añade al numérico la coma como
separador de los miles y el punto como separador de la parte entera y de la decimal. El formato
con punto establece como el punto como separador de los miles y la coma como separador de la
parte decimal. Estos formatos se pueden modificar después de creadas las variables.
Añadir etiquetas de valores
Las etiquetas de valor proporcionan un método para correlacionar los valores de variable con una
etiqueta de texto. En este ejemplo, hay dos valores aceptables para la variable ecivil. Un valor 0
significa que el sujeto está soltero/a, y un valor 1, que está casado/a.
1. Pulse en la casilla Valores de la fila ecivil y, a continuación, pulse el botón que hay a la derecha
de la casilla para abrir el cuadro de diálogo Etiquetas de valor.
El valor corresponde al valor numérico real.
La etiqueta de valor es la etiqueta de cadena que se aplica al valor numérico especificado.
2. Escriba 0 en el campo Valor.
3. Escriba Soltero en el campo Etiqueta.
4. Pulse en Añadir para que se añada esta etiqueta a la lista.
5. Escriba 1 en el campo Valor y, a continuación, escriba Casado en el campo Etiqueta.
6. Pulse en Añadir y a continuación, pulse en Aceptar para guardar los cambios y volver al Editor
de datos.
Estas etiquetas se pueden visualizar también en la Vista de datos, lo que puede facilitar la lectura
de los datos.
7. Pulse en la pestaña Vista de datos, que se encuentra en la parte inferior de la ventana Editor de
datos.
8. Elija en los menús:
10

Ver > Etiquetas de valores


Las etiquetas aparecerán ahora en una lista cuando introduzca valores en el Editor de datos. Esta
configuración tiene la ventaja de sugerir una respuesta válida y proporcionar una contestación más
descriptiva.
Si el elemento de menú Etiquetas de valor ya está activo (aparece una marca de verificación junto
al mismo), al volver a elegir Etiquetas de valor se desactivará la presentación de las etiquetas de
valor.

Figura 6. Cuadro de diálogo Etiquetas de valor

Tratamiento de los datos perdidos


Los datos perdidos o no válidos son generalmente tan comunes que no se deben ignorar. Puede
que las personas que han respondido a una encuesta se nieguen a contestar ciertas preguntas, no
sepan la respuesta o contesten de forma inesperada. Si no filtra ni identifica estos datos, puede que
el análisis no proporcione resultados exactos.
Los datos numéricos, campos de datos vacíos o campos con entradas no válidas se convierten a
valores perdidos del sistema, que se pueden identificar mediante un punto individual.
El motivo por el que se pierde un valor puede ser importante para el análisis. Por ejemplo, puede
resultar útil realizar una distinción entre los encuestados que se negaron a contestar una pregunta
y los encuestados que no contestaron porque la pregunta no era aplicable.
Valores perdidos de una variable numérica
1. Pulse en la pestaña Vista de variables, que se encuentra en la parte inferior de la ventana Editor
de datos.
2. Pulse en la casilla Perdido de la fila edad y, a continuación, pulse el botón que hay a la derecha
de la casilla para abrir el cuadro de diálogo Valores perdidos.
Es este cuadro de diálogo puede especificar hasta tres valores perdidos diferentes, o puede
especificar un rango de valores más un valor de tipo discreto adicional.
3. Seleccione Valores perdidos discretos.
11

4. Escriba 999 en el primer cuadro de texto u deje los otros dos cuadros de texto en blanco.
5. Pulse en Aceptar para guardar los cambios y volver a Editor de datos.
Ahora que se ha añadido el valor de datos perdidos se puede aplicar una etiqueta a ese valor.
6. Pulse en la casilla Valores de la fila edad y, a continuación, pulse el botón que hay a la derecha
de la casilla para abrir el cuadro de diálogo Etiquetas de valor.
7. Escriba 999 en el campo Valor.
8. Escriba Sin respuesta en el campo Etiqueta de valor.
9. Pulse en Añadir para que se añada esta etiqueta al archivo de datos.
10. Pulse en Aceptar para guardar los cambios y volver a Editor de datos.

Figura 7. Cuadro de diálogo valores perdidos

Valores perdidos de una variable de cadena


Los valores perdidos en variables de cadena se tratan de forma parecida a los valores perdidos en
variables numéricas. Sin embargo, a diferencia de las variables numéricas, los campos vacíos de
las variables de cadena no se consideran perdidos del sistema. En lugar de eso, se interpretan como
una cadena vacía.
1. Pulse en la pestaña Vista de variables, que se encuentra en la parte inferior de la ventana Editor
de datos.
2. Pulse en la casilla Perdido de la fila sexo y, a continuación, pulse el botón que hay a la derecha
de la casilla para abrir el cuadro de diálogo Valores perdidos.
3. Seleccione Valores perdidos discretos.
4. Escriba SR en el primer cuadro de texto.
Guardar archivo
Archivo >Guardar como/
Se selecciona el directorio (buscar en:) y el nombre del archivo, que tendrá una extensión .sav. Se
puede exportar a otros formatos (guardar como tipo): Excel (.xls, xlsx), delimitado por tabuladores
(.dat), delimitado por comas (.csv) y otros formatos.
12

Figura 8. Cuadro de guardar archivo


Lectura de datos
Los datos se pueden introducir directamente o importarse desde diferentes orígenes. En este
capítulo se tratarán los procesos para leer datos almacenados en archivos de datos IBM SPSS
Statistics, aplicaciones de hojas de cálculo como Microsoft Excel, aplicaciones de bases de datos
como Microsoft Access y archivos de texto.
Lectura de archivos de datos de IBM SPSS Statistics
Los archivos de datos IBM SPSS Statistics, que tienen una extensión de archivo.sav, contiene los
datos guardados.
1. Elija en los menús:
Archivo > Abrir > Datos...
2. Acceda a demo.sav y ábralo.

En este archivo de datos, los casos representan a los encuestados individuales que responden a una
encuesta (filas). Las variables representan respuestas a cada una de las preguntas realizadas en la
encuesta (columnas).
13

Figura 10. Archivo de datos abierto


Lectura de datos de Excel
En lugar de escribir todos los datos directamente en el Editor de datos, puede leer datos desde
aplicaciones como Microsoft Excel. También puede leer los encabezados de las columnas como
nombres de variables.
1. Elija en los menús:
Archivo > Importar datos > Excel
2. Vaya a la carpeta donde estén los archivos de práctica y seleccione demo.xlsx.
El cuadro de diálogo Leer archivo Excel ofrece una vista previa del archivo de datos. Se muestra
el contenido de la primera hoja del archivo. Si el archivo tiene varias hojas, puede seleccionar la
hoja de la lista.
3. Asegúrese de que está seleccionada la opción Leer nombre de variables de la primera fila de
datos.
Si los encabezados de las columnas no se ajustan a las reglas de nombre de variable, se convierten
a nombres de variable válidos. Los encabezados de columna originales se guardan como etiquetas
de variable.
4. Seleccione Eliminar espacios iniciales de valores de cadena.
5. Deseleccione Porcentaje de valores que determinan tipo de datos.
En caso de valores de cadena "sin respuesta" se mostrarían en las celdas que no estaban en el
sistema. Si no hay parámetro de porcentaje de valores y la columna contiene una combinación de
tipos de datos, la variable se lee como un tipo de datos de cadena. Los valores se mantienen, pero
los valores numéricos se tratan como valores de cadena.
14

Figura 11. Cuadro de diálogo Leer archivo Excel


6. Pulse en Aceptar para leer el archivo de Excel.
Los datos aparecerán en el Editor de datos, con los encabezados de las columnas utilizados como
nombres de variables. Al no poder contener espacios los nombres de variables, se eliminan los
espacios de los encabezados de las columnas originales. Por ejemplo, un encabezado de columna
"Estado civil" se convertiría en la variable Estadocivil. El encabezado de la columna original se
conservará como etiqueta de la variable.
Se deben ajustar los atributos de las variables que no estén conformes, p. ej: número de decimales,
anchura, medida, entre otros.
Ordenación y selección de datos
Los archivos de datos no siempre están organizados de la forma ideal para las necesidades
específicas del usuario. Para preparar los datos para analizarlos posteriormente, puede transformar
de muchas maneras diferentes el archivo, entre las que se incluyen:
• Ordenar datos. Puede ordenar los casos en función del valor de una o más variables.
• Seleccionar subconjuntos de casos. Puede restringir el análisis a un subconjunto de casos
o efectuar análisis simultáneos de subconjuntos diferentes.
Ordenación de datos
Muchas veces resulta útil, y en ocasiones es incluso necesario, ordenar los casos (ordenar las filas
del archivo de datos) para realizar determinados tipos de análisis.
Para cambiar el orden de la secuencia de casos en el archivo de datos de acuerdo con el valor de
una o varias variables de ordenación:
15

1. Elija en los menús:


Datos > Ordenar casos...
Aparecerá el cuadro de diálogo Ordenar casos.
2. Añada las variables Edad en años [edad] e Ingresos del hogar en miles [ingres] a la lista Ordenar
por.
Si selecciona varias variables de ordenación, los casos se ordenarán de acuerdo con el orden en
que estas variables aparezcan en la lista Ordenar por. En este ejemplo, basado en las entradas de
la lista Ordenar por, los casos se ordenarán por el valor de Ingresos del hogar en miles [ingres]
dentro de las categorías de Edad en años [edad]. Para las variables de cadena, las letras mayúsculas
preceden a las minúsculas correspondientes en orden (por ejemplo, el valor de cadena Sí es anterior
sí en el orden de clasificación).

Figura 13. Cuadro de diálogo Ordenar casos


Procesamiento de archivos segmentados
Para dividir el archivo de datos en diferentes grupos:
1. Elija en los menús:
Datos > segmentar archivo...
Aparecerá el cuadro de diálogo Segmentar archivo.
2. Seleccione Comparar los grupos en primera instancia y luego se hará con Organizar los
resultados por grupos. (Los ejemplos que siguen a estos pasos muestran las diferencias entre estas
dos opciones.)
3. Seleccione Género [Genero] para dividir el archivo en grupos independientes para estas
variables.
16

Figura 13. Cuadro de diálogo Segmentar archivo

Si el archivo de datos todavía no está ordenado según los valores de las variables de agrupación,
seleccione Ordenar archivo según variables de agrupación.
Puede utilizar variables numéricas, de cadena corta y de cadena larga como variables de
agrupación. Se realizará un análisis distinto para cada uno de los subgrupos definidos por las
variables de agrupación. Si selecciona varias variables de agrupación, los casos se agruparán de
acuerdo con el orden en que estas variables aparezcan en la lista Grupos basados en.
Si selecciona Comparar los grupos, los resultados de todos los grupos de archivos segmentados se
incluirán en las mismas tablas, como se muestra en la siguiente tabla de estadísticos de resumen
generada por el procedimiento: “analizar/descriptivos” para la variable edad.

Figura 14. Salida del archivo segmentado con una sola tabla dinámica
Si selecciona Organizar los resultados por grupos y ejecuta el procedimiento “descriptivos” para
la variable edad, se crean dos tablas dinámicas: una tabla para mujeres y una tabla para hombres:
17

Figura 15. Salida del archivo segmentado con tabla dinámica para mujeres y hombres por separado

Ordenación de casos para el procesamiento de archivos segmentados


El procedimiento Segmentar archivo crea un nuevo subgrupo cada vez que encuentra un valor
diferente para una de las variables de agrupación. Por tanto, es importante ordenar los casos de
acuerdo con los valores de las variables de agrupación antes de invocar el procesamiento de
archivos segmentados.
De forma predeterminada, el procedimiento Segmentar archivo ordena automáticamente el archivo
de datos de acuerdo con los valores de las variables de agrupación. Si el archivo ya está ordenado
con el orden correcto, puede ahorrar tiempo de procesamiento si selecciona “El archivo ya está
ordenado”.
Activación y desactivación del procesamiento de archivos segmentados
Tras invocar el procesamiento de archivos segmentados, éste permanecerá en vigor durante el resto
de la sesión, a menos que lo desactive.
• Analizar todos los casos. Esta opción desactiva el procesamiento de archivos segmentados.
• Comparar grupos y Organizar los resultados por grupos. Esta opción activa el
procesamiento de archivos segmentados.
Mientras permanezca activado el procesamiento de archivos segmentados, aparecerá el mensaje
Segmentar archivo activado en la barra de estado situada en la parte inferior de la ventana de la
aplicación.
18

Selección de subconjuntos de casos


Puede limitar el análisis a un determinado subconjunto de acuerdo con criterios que pueden incluir
variables y expresiones complejas. También se puede seleccionar una muestra aleatoria de casos.
Los criterios usados para definir un subgrupo pueden incluir:
• Valores y rangos de las variables
• Rangos de fechas y horas
• Números de caso (filas)
• Expresiones aritméticas
• Expresiones lógicas
• Funciones
Para seleccionar un subconjunto de casos para su análisis:
1. Seleccione en los menús:
Datos > Seleccionar casos...
Se abrirá el cuadro de diálogo Seleccionar casos.

Figura 16. Cuadro de diálogo Seleccionar casos

Para seleccionar subconjuntos de casos basados en una expresión


Condicional Para seleccionar los casos basados en una expresión condicional:
1. Seleccione Si se satisface la condición y pulse en Si en el cuadro de diálogo Seleccionar casos.
Se abrirá el cuadro de diálogo Seleccionar casos: Si.
19

Figura 17. Cuadro de diálogo Seleccionar casos: Si

En la expresión condicional se pueden utilizar nombres de variables existentes, constantes,


operadores aritméticos, operadores lógicos, operadores de relación y funciones. Puede escribir y
editar la expresión en el cuadro de texto de la misma manera que cualquier otro texto de una
ventana de resultados. También puede utilizar el teclado de calculadora, la lista de variables y la
lista de funciones para pegar elementos en la expresión. Para especificar una expresión
condicional:
2. Introduzca la expresión condicional.
La mayoría de las expresiones condicionales contienen al menos un operador de relación, p. ej:
edad>=21
o
ingresos*3<100
En el primer ejemplo, sólo aquellos casos que tengan un valor de 21 o mayor para la Edad [edad]
seleccionada. En el segundo ejemplo, Ingresos del hogar en miles [ingres] multiplicado por 3
deberá ser inferior a 100 para que se pueda seleccionar un caso.

Figura 18. Resultado de la expresión condicional edad>=21


20

También se puede enlazar dos o más expresiones condicionales mediante operadores lógicos,
como en:
edad>=21 | educ>=4 (equivale a la selección de A o B)
o
ingresos*3<100 & educ=5 (equivale a la selección de A y B)
En el primer ejemplo, se seleccionarán los casos que cumplan la condición de Edad [edad] o Nivel
educativo [educ]. En el segundo ejemplo, las condiciones Ingresos del hogar en miles [ingres] y
Nivel educativo [educ] deberán cumplirse ambas para que se pueda seleccionar un caso.
También se pueden seleccionar casos para una categoría específica de una variable, p. ej: edad ≥25
& edad ≤30, que selecciona los individuos entre 25 y 30 años de edad.

Actividad: El estudiante guardara la selección: a) copiándola a un nuevo archivo y b) eliminando


los datos descartados

Importación de datos y exportación


Se pueden importar datos de Excel, Stata, .csv, .txt, .dat, SAS, Stata y Dbase, entre otros. (visto en
clases anteriores).
Se pueden exportar datos a: Excel, Stata, .csv, .txt, SAS, Stata y Dbase, entre otros.
Exportar resultados a: *.docx, *.htm, *.pdf, .pptx, *.xlsx, *.jpeg, *.cgm, *.tiff entre otros. Para ello
active la ventana de resultados>archivo>exportar>se selecciona objeto a exportar (todo, todos los
visibles, selección)/Tipo de archivo (Excel, texto…) y directorio receptor). Otra opción de
exportar es copiar los gráficos o tablas y pegarlos en Word, Excel u otro programa. Para ello, en
la ventana de resultados se posiciona en una tabla, se da clic (botón derecho)>copiar como>hoja
de trabajo de Excel (BIFF)> pegar en hoja de Excel (hay otras opciones de copiar como imagen,
texto). Esta opción puede solucionar (en caso de que haya) problemas de diferencia de formato
(separador de miles y decimales) de los números entre los dos softwares. Por ello, se recomienda
compatibilizar previamente los programas informáticos en este aspecto, o cambiar el formato de
las casillas en SPSS.
Otra opción de copiado es hacer clic sobre la tabla (o gráfico)> seleccionar tabla>copiar>pegar en
Excel. También se pueden copiar como imágenes en Word u otros softwares.

Figura 19. Cuadro de opciones de exportación de datos


21

Figura 20. Cuadro de opciones de copiado de resultados

Población y muestra

Población: conjunto de sujetos de los que se desea extraer información


Muestra: subconjunto de la población a la que tenemos acceso. Representativa de la población
Para obtener una muestra aleatoria:
1. Seleccione Muestra aleatoria de casos en el cuadro de diálogo Seleccionar casos.
2. Haga clic en Muestra.
Se abrirá el cuadro de diálogo Seleccionar casos: Muestra aleatoria.

Figura 21. Cuadro de diálogo Seleccionar casos: Muestra aleatoria

Puede elegir una de las siguientes alternativas para el tamaño de la muestra:


• Aproximadamente. Un porcentaje especificado por el usuario. Esta opción generará una
muestra aleatoria que contendrá aproximadamente el porcentaje especificado de los casos.
22

• Exactamente. Un número de casos especificado por el usuario. También se debe especificar


el número de casos a partir de los cuales se generará la muestra. Este segundo número debe
ser menor o igual que el número total de casos presentes en el archivo de datos. Si lo
excede, la muestra contendrá un número menor de casos proporcional al número solicitado.

Las muestras pueden ser probabilísticas y no probabilísticas. Deben ser representativas de la


población. Para estimar una muestra se pueden seguir varios procedimientos.
• Estimación del tamaño de la muestra (n) mediante procedimiento matemático, aplicado a una
variable (estadística univariante)
• Opción de selección de muestra complejas del SPSS
• En estadística multivariante se pueden seleccionar mínimo 10 individuos por cada variable o
5 por cada parámetro a estimar.

Referencias bibliográficas

Aguilar, J. (2021). Estadística descriptiva, regresión y probabilidad con aplicaciones. 1a. ed.
Bogotá: Ediciones de la U.

Anderson, D., Sweeney, D., & Williams, T. A. (2004). Estadística para Administración y
Economía. Octava edición. Editorial Internacional Thomson Editores S. A. USA.

Bernal, C. (2010). Metodología de la investigación. Colombia: Pearson Educación.


de la Fuente, S. (2011). Análisis de variables categóricas. Tablas contingencia. Facultad de
Ciencias Económicas y Empresariales. Universidad Autónoma de Madrid. En:
http://www.estadistica.net/ECONOMETRIA/CUALITATIVAS/CONTINGENCIA/tablas-
contingencia.pdf
Florido, B. (2015). Análisis de los efectos del marketing móvil en la satisfacción del usuario de
las infraestructuras aeroportuarias (Tesis Doctoral). Universidad De Málaga, España.
Guisande, C., Vaamonde, A., y Barreiro, A. (2013). Tratamiento de datos con R, Statistica y SPSS.
Madrid, España: Diaz de Santos
Hair, J., Black, W., Babin B. y Anderson, R. (2010). Multivariate Data Analysis. (7ma ed). Madrid:
Pearson Prentice Hall.
Hair, J., Hult, T., Ringle, C. & Sarstedt, M. (2014). A primer on partial least squares structural
equation modeling (PLS-SEM). Thousand Oaks: Sage.
Hernández, R., & Mendoza, C (2018). Metodología de la investigación: las rutas cuantitativa,
cualitativa y mixta. Mcgraw-Hill Interamericana Editores, S.A. De C. V.
23

Hernández, R.. Fernández, C. y Baptista P. (2014). Metodología de la investigación, Cuarta


edición, México: Mc Graw Hill.
Huh, J., Delorme, D.E. y Reid, L.N. (2006). Perceived Third-Person Effects and Consumer
Attitudes on Prevetting and Banning DTC Advertising. The Journal of Consumer Affairs,
40(1), 90-116.
Kleinbaum, D., Kupper, L., Nizam, A. & Rosenberg, E. (2013). Applied Regression Analysis
and Other Multivariables Methods. Boston, MA: Cengage Learning.
Lloret-Segura, S., Ferreres-Traver, A., Hernández-Baeza, A. & Tomás-Marco, I. (2014). El
análisis factorial exploratorio de los ítems: una guía práctica, revisada y actualizada. Anales
de Psicología, 30(3), 1151-1169
Lorenzo-Seva, U., Timmerman, M. E. & Kiers, H. A. L. (2011). The Hull method for selecting the
number of common factors. Multivariate Behavioral Research, 46(2), 340-364.
Manterola, C. y Pineda, V. (2008). El valor de “p” y la “significación estadística”. Aspectos
generales y su valor en la práctica clínica. Rev. Chilena de Cirugía, 60(1), 86-89
Martínez, C. (2019). Estadística básica aplicada. 5a. ed. Bogotá: Ecoe Ediciones.

Millones, R., Barreno, E., Vásquez, & F., Castillo, C. (2016). Estadística aplicada a la ingeniería
y Ios negocios. Primera edición digital. Universidad de Lima.

Rustom, A. (2012). Estadística descriptiva, probabilidad e inferencia. una visión conceptual y


aplicada. Universidad de Chile: La Pintana, Santiago, Chile.
Schmidt, W. (2019). IBM SPSS: Guía completa para principiantes aprende estadísticas utilizando
IBM SPSS De la A-Z. Amazon Digital Services LLC

Bases de datos
BVL. https://www.bvl.com.pe/regulacion
INEI. Manufactura. https://www.inei.gob.pe/estadisticas/indice-tematico/manufacture/
INEI. Principales indicadores macroeconómicos (Incluye sector industrial).
https://www.inei.gob.pe/estadisticas/indice-tematico/economia/
Ministerio de la Producción. Portal de Datos Abiertos.
https://www.produce.gob.pe/index.php/datosabiertos/52-portal-de-datos-abiertos

Foráneas
https://www.ine.es/jaxiT3/Tabla.htm?t=26061
https://datos.gob.es/es/catalogo?theme_id=industria
24

https://datos.gob.es/es/catalogo?administration_level=E&res_format_label=XLS
https://www.cepal.org/es/datos-y-estadisticas
https://www.ilo.org/global/statistics-and-databases/lang--es/index.htm

Resumen CV del docente

Dr. José Ovidio Flores. Abogado, Ingeniero, Especialista en Derecho Agrario y


ambiental, MBA, MSc en Desarrollo Rural, Doctor en ingeniería (Universidad de
Valladolid, España) con la calificación Sobresaliente Cum Laude. Publicaciones en
Scopus, Scielo, Latindex y otros índices. Ponente en congresos nacionales e
internacionales. Acreditado en el Registro Nacional de Investigadores del Perú
(RENACYT), grupo María Rostworowski (N° 14767). Profesor principal full time jubilado.
Profesor de posgrado en la USMP y UNMSM. Ha dictado clases y asesorías de tesis en
pregrado, maestría y doctorado. Experto en estadística univariante y multivariante.
Asesor de empresas
• Página web: https://www.researchgate.net/profile/Jose_Flores22/publications
• Página Orcid ID: https://orcid.org/0000-0001-5019-2635
• Página google académico:
https://scholar.google.co.ve/citations?user=vDbkQ3wAAAAJ&hl=es

También podría gustarte