Está en la página 1de 70

Universidad de Talca

Centro de Insercin Laboral


Programa Jvenes Profesionales

Manual Bsico SPSS


Manual de introduccin a SPSS

Elaborado por:

Juan Antonio Gonzlez Gonzlez | Ingeniero Comercial | Universidad de Talca | 2009 | juagonzalez@utalca.cl
AGRADECIMIENTOS LICENCIA

Quisiera agradecer a todas las personas que de alguna manera han ayudado en la De manera de facilitar la difusin de este contenido, he decidido licenciar el texto con
elaboracin de este documento. A todas las personas que trabajan en el Centro de una licencia Creative Commons del tipo: Atribucin - No Comercial - Licenciar Igual
Insercin Laboral: Don Julio, la Anita, La Margarita, Andrs, los Psiclogos, la Sra. Berta 2.0 Chile, bajo las siguientes condiciones:
y al personal de aseo, por la buena disposicin y todo el apoyo prestado durante el
periodo en que me desempe como joven profesional del CIL.
Eres libre de:
Quisiera tambin agradecer a mis compaeros de labores all en el centro, que siempre
han sido una fuente de apoyo bastante grande, aunque quizs, muchos no se daban
cuenta... muchas gracias chiquillos(as)!.
Copiar, distribuir, comunicar y ejecutar pblicamente la obra.
Finalmente, agradecer a mi nia, Mara Paz, por el apoyo que siempre me ha prestado
en cada uno de los proyectos en los que me embarco, nunca limitando ni mi
imaginacin ni mis ideas... As mismo quisiera agradecer a los profesores Marcelo Hacer obras derivadas.
Rodrguez Gallardo y Jorge Zamora por todo el apoyo que me prestaron para la
elaboracin de este texto, por las bases de datos, libros e ideas para hacer esto lo ms
simple posible.
Bajo las siguientes condiciones:
Muchas Gracias.

Atribucin. Debes reconocer y citar la obra de la forma especificada


por el autor o el licitante.

No Comercial. No puedes utilizar esta obra para fines comerciales.

Licenciar Igual. Si alteras o transformas esta obra, o generas una


obra derivada, solo puedes distribuir la obra derivada bajo una licencia
idntica a sta.
INDICE
Contenido de captulos

Captulo 1 - Introduccin a SPSS! ! ! ! ! ! ! ! ! ! ! 4


Captulo 2 - Trabajo con Bases de Datos! ! ! ! ! ! ! ! ! ! 7
Captulo 3 - Anlisis de Estadsticos Descriptivos! ! ! ! ! ! ! ! ! 17
Captulo 4 - Anlisis de Variables Categricas! ! ! ! ! ! ! ! ! 26
Captulo 5 - Pruebas de Hiptesis! ! ! ! ! ! ! ! ! ! ! 29
Captulo 6 - Anlisis de Varianza (ANOVA)! ! ! ! ! ! ! ! ! ! 35
Captulo 7 - Grficos! ! ! ! ! ! ! ! ! ! ! ! ! 38
Captulo 8 - Anlisis de Correlacin! ! ! ! ! ! ! ! ! ! ! 46
Captulo 9 - Anlisis de Regresin Lineal! ! ! ! ! ! ! ! ! ! 49
Captulo 10 - Anlisis de Regresin Logstica! ! ! ! ! ! ! ! ! 53
Captulo 11 - Anlisis Discriminante! ! ! ! ! ! ! ! ! ! ! 58
Captulo 12 - Anlisis Factorial! ! ! ! ! ! ! ! ! ! ! ! 63

Pgina 3
CAPTULO 1
Introduccin a SPSS

Pgina 4
Mdulo Bsico SPSS - Programa Jvenes Profesionales

Introduccin a SPSS

Una vez abierto el software, se observa una


Hoy en da resulta obligatorio para los nuevos profesionales poseer herramientas que le ventana de Bienvenida, en la que se ofrecen
permitan desarrollar su trabajo de forma ms ptima y eficiente. Independiente del rea distintas opciones, donde la ms importante
en que se desempeen, tener la capacidad de interpretar datos para transformarlos en es la de abrir archivos utilizados
conocimiento, resulta vital para cualquier profesional y para la posterior toma de recientemente.
decisiones.
Pese a lo anterior, se recomienda no utilizar
SPSS es uno de los Software ms conocidos y utilizados para la realizacin de esta ventana, debido a que generalmente no
investigaciones de mercado e investigaciones relacionadas al rea de la sociologa y se puede observar bien la base de datos con
psicologa. Una de las caractersticas fundamentales de SPSS es su facilidad de uso, la que se est trabajando, pudiendo generar
junto a la potencia e integridad del software, convirtindolo en una de las herramientas errores al momento de abrir una base de
ms potentes para ste tipo de trabajos. datos particular.

La imagen que se puede ver al lado izquierdo corresponde al


icono de la aplicacin, el que por defecto se instala bajo el
nombre de SPSS para Windows.

Al iniciar el Software, lo primero que se


despliega es una ventana de informacin
(que se observa a la izquierda) la que indica
la versin del software, que en este caso
corresponde a la versin 15 para Windows y
adems muestra la informacin referente al
propietario de la licencia.

Pgina 5
Mdulo Bsico SPSS - Programa Jvenes Profesionales

Editor de Datos: Visor de Resultados:

SPSS se compone de dos ventanas de trabajo. La primera recibe el nombre de La segunda ventana correspondiente al rea de trabajo de SPSS se conoce como
Editor de Datos (arriba) y es la ventana donde se ingresan los datos con los que se Visor de Resultados y, tal como su nombre lo indica, corresponde a una ventana
trabajar. Para los familiarizados con Micosoft Excel , esta ventana les resultar donde el software despliega los resultados que se obtienen de los distintos anlisis
familiar y su forma de trabajo ser bastante similar. En las columnas (hacia la realizados. En la seccin izquierda, el software mostrar los ttulos de los distintos
izquierda) se introducirn las distintas variables que compongan la base de datos. En anlisis y los desplegara como una diagrama de rbol.
trminos prcticos, cada pregunta de un cuestionario realizado corresponde a una
variable. Por otra parte en la seccin derecha se muestran los resultados obtenidos, los cuales
pueden ser copiados y pegados a software como Microsoft Word o Excel para
En las filas (hacia abajo) son introducidos los datos, o las respuestas entregadas por realizar informes u otras acciones que el investigador considere necesarias.
los encuestados, o donde sea que se hayan extrado los datos para la realizacin de
la base de datos. As, si se entrevist a 100 personas, hacia abajo deber haber 100
registros.

Este Editor posee dos tipos de vista: Vista de datos y Vista de variables. En la
primera, el investigador observar los datos ingresados, mientras que en la segunda
se puede acceder a los atributos de las distintas variables para poder editarlos. Lo
anterior ser ejemplificado en el captulo siguiente.

Pgina 6
CAPTULO 2
Trabajo con Bases de Datos

Pgina 7
Mdulo Bsico SPSS - Programa Jvenes Profesionales

Trabajo con Bases de Datos

En este apartado se explicar la forma de crear y editar las distintas bases de datos, de Nombre: En esta seccin se debe asignar un nombre para la variable. Dicho nombre
manera que se encuentren listas para realizar los distintos anlisis requeridos por el debe poseer un mximo de 8 letras y se debe evitar el uso de tildes, smbolos y
investigador. caracteres como la letra .

Lo primero que se debe hacer antes de ingresar datos a una base de datos, es Tipo: Se ofrece la posibilidad de asignar una caracterstica a la variable, de manera que
prepararla para ello, lo cual debe ser efectuado en el Editor de datos, utilizando la sta sea ms fcil de trabajar y de forma que el software la interprete de manera
Vista de variables, lo que mostrar una ventana como la que se observa a correcta. A continuacin se muestra la ventana de Tipos de variable:
continuacin.

Etiqueta: Para que en el visor de resultados muestre correctamente los nombres de las
variables (y sin el lmite de las 8 letras) se puede establecer una etiqueta para ellas, de
manera de en este sector se podr escribir lo que el investigador considere necesario.

Valores: Para cierto tipo de variables, la etiqueta debe ser definida para ms de un valor,
como por ejemplo cuando estamos hablando del sexo de una persona (que puede ser
masculino o femenino), por lo cual hay que decir a SPSS como debe identificar eso.
Para ello se utiliza esta seccin, la cual despliega una ventana como la siguiente:

Como se puede observar, en la parte superior se muestra una serie de caractersticas


de las variables. Sin embargo, no todas se deben utilizar siempre, por lo que solamente
se explicar el funcionamiento de las caractersticas que resulten ms relevantes para el
uso comn de SPSS.

Pgina 8
Mdulo Bsico SPSS - Programa Jvenes Profesionales
Medida: Para que SPSS realice correctamente los anlisis solicitados, es necesario Libro de Cdigos:
establecer correctamente las unidades de medida de cada una de las variables. Para
ello ofrece tres opciones: Escala, Ordinal y Nominal. A continuacin se explicar Una de las caractersticas fundamentales de todo tipo de software de anlisis de
brevemente cada una de estas unidades de medidas utilizadas por el software. datos es que estos trabajan con nmeros, por lo que cada una de las preguntas
(variables) debe ser definida por un valor o un conjunto de valores numricos para as
ingresarlos al software.
Medida Descripcin
Una recomendacin es la utilizacin de un libro de cdigos, el cual no es ms que
una ficha en que se incluyen todos los valores numricos asignados a cada una de
Corresponde a variables numricas sin una caracterstica
las variables, de manera que al momento de ingresar los datos a SPSS, el
Escala especial. Por ejemplo, Notas del colegio, Edad, Estatura,
investigador, as como los digitadores sepan que rango de valores debe usar cada
Salario, etc.
una de las variables.
Corresponde a variables que representan categoras y
adems dichas categoras poseen un ranking implcito. A continuacin se mostrar un ejemplo prctico para la creacin de un libro de
Ordinal Ejemplo de este tipo de variable es aquella donde hay que cdigos, la edicin de las caractersticas de las variables y el ingreso de datos a
seleccionar que tan de acuerdo o en desacuerdo se est con SPSS.
algo.

Corresponde a variables que representan categoras pero que Ejemplo Prctico:


Nominal no poseen ningn tipo de ranking. Por ejemplo: Tramo de
edad, sexo, etc. La Empresa JPP requiere obtener informacin acerca de la percepcin de sus
clientes sobre un nuevo servicio ofrecido desde hace unos meses. Para ello se
aplicar un cuestionario a 30 de sus mejores clientes para conocer la opinin de
Las caractersticas anteriormente definidas son las comnmente utilizadas por los stos. Su misin como investigador ser preparar el libro de cdigos y la base de
usuarios, no obstante el investigador puede utilizar el resto de caractersticas de datos para que la realizacin de los anlisis sea efectuada de manera correcta y sin
manera de personalizar an ms su base de datos. Una vez que estas caractersticas errores. En la pgina siguiente se presenta el cuestionario aplicado por la empresa a
se encuentren correctamente definidas, el investigador se encuentra con la sus clientes.
capacidad de comenzar a ingresar los datos a la base de datos.

Pgina 9
Mdulo Bsico SPSS - Programa Jvenes Profesionales
Libro de Cdigos:
Marque con una X la alternativa que corresponda:
El libro de cdigos es una ficha donde se especifican los valores numricos con que
1. Sexo:!! Masculino! ! Femenino
se codificar cada una de las variables del estudio (en este caso del cuestionario), de
manera que el ingreso de los valores a la base de datos se realice uniformemente,
2. Edad: " 18 a 29" " 30 a 49" 50 o ms
evitando as errores derivados de la digitacin de los cuestionarios.

Si bien no existe una forma nica de hacer un libro de cdigos, a continuacin se


Escriba su respuesta en la zona designada para ello:
ofrecer una vista parcial de un libro de cdigos estndar.
3. Cul es su renta lquida?

Nombre de la
N Etiqueta de la Variable Valores
4. Cuntos aos de estudio posee? Variable

1 : Masculino
1 Sexo Sexo
5. Marque con una X la alternativa que ms se acerque a su percepcin del 2 : Femenino
servicio:
1 : 18 a 29
2 Edad Edad 2 : 30 a 49
Muy de De En Muy en
Indiferente 3 : 50 o ms aos
Acuerdo Acuerdo Desacuerdo Desacuerdo
3 Ren_Liq Renta Lquida
El Servicio ofrece una
nueva experiencia en 4 Niv_Est Aos de Estudio
la compra.
1 : Muy de Acuerdo
El precio del servicio 2 : De acuerdo
es acorde a la El Servicio ofrece una nueva
5.1 Exp_Serv 3 : Indiferente
calidad de este experiencia en la compra
4 : En Desacuerdo
5 : Muy en Desacuerdo

Muchas Gracias por participar 1 : Muy de Acuerdo


2 : De acuerdo
El precio del servicio es
5.2 Pre_Serv 3 : Indiferente
acorde a la calidad de este
4 : En Desacuerdo
5 : Muy en Desacuerdo

Pgina 10
Mdulo Bsico SPSS - Programa Jvenes Profesionales
Edicin de las Variables: Posteriormente en Tipo hay que escoger Numrica, pues se trata de una variable
numrica, sin caractersticas especiales, tal como se muestra a continuacin:
Una vez listo el libro de cdigos, toca el turno de preparar la base de datos para el
ingreso de la informacin. Lo primero que hay que hacer es definir las caractersticas
de cada una de las variables, resultando el libro de cdigos una herramienta
indispensable para esta parte del proceso.

A modo prctico solo se har la edicin de las variables 1, 3 y 5.1 del libro de
cdigos. En el archivo BaseDatosC1.sav se encuentra la base de datos lista para el
ingreso de informacin, con todas las variables especificadas.

Variable 1 (Sexo):
En Etiqueta se debe establecer el Nombre completo que recibir la variable, en este
Lo primero que se debe insertar es el nombre de la variable. En este caso Sexo, caso se llamar Sexo.
bajo la columna Nombre, tal como muestra la imagen siguiente (Recuadro rojo).
Siguiendo, bajo valores se debe ingresar los valores asignados a cada una de las
posibles respuestas a la pregunta. En este caso Masculino o Femenino. En este
caso los valores ingresados sern 1 para Masculino y 2 para Femenino, de acuerdo al
libro de cdigos.

Al hacer clic ah, se abrir una nueva ventana, donde se debe ingresar el Valor y el
Nombre para cada una de las posibles respuestas. La imagen siguiente muestra los
valores que se deben ingresar para la respuesta Masculino. Una vez listo se debe
presionar el botn Aadir (En recuadro) y el valor de la etiqueta pasar a la zona
inferior. Posteriormente se debe ingresar los valores para Femenino, tal como lo
muestran las imgenes siguientes:

Pgina 11
Mdulo Bsico SPSS - Programa Jvenes Profesionales
Variable 3 (Renta Lquida):

Lo primero que se debe insertar es el nombre de la variable. En este caso Ren_Liq,


bajo la columna Nombre.

Al definir el Tipo de variable, se debe tener en cuenta que esta es una unidad de
medida monetaria, por lo que debe ser definida como tal. En el cuadro de dilogo se
ofrece una opcin denominada Dlar que es para definir variables monetarias.

Una vez ingresadas ambos valores se debe hacer clic en el botn Aceptar.

Finalmente se debe establecer la unidad de medida. Debido a que la variable sexo es


una variable que representa una categora (Masculino o Femenino) y que a su vez no
se puede establecer un ranking, en la medida que ser Masculino no es superior a ser
Femenino o viceversa, se est hablando de una variable con una escala de medida
Nominal. Finalmente, cuando est toda la variable definida, el software mostrar lo
siguiente:
Bajo la columna etiqueta se debe escribir el valor de la etiqueta de acuerdo a lo
especificado por el libro de cdigos. En este caso Renta Lquida y debido a que
esta variable no tiene respuestas adicionales, el cuadro Valores debe ser dejado sin
llenar.

En cuanto a la unidad de medida, ya que se trata de una variable donde el


encuestado ingresa un valor numrico (su salario), se est haciendo referencia a una
variable de con unidad de medida de Escala, por lo que esa debe ser la unidad de
medida asignada. La imagen de la pgina siguiente muestra como debe verse la
base de datos con la variable 1, 2 y 3 completas:

Pgina 12
Mdulo Bsico SPSS - Programa Jvenes Profesionales
Bajo la columna etiqueta se debe escribir el valor de la etiqueta de acuerdo a lo
especificado por el libro de cdigos. En este caso El Servicio ofrece una nueva
experiencia en la compra y posteriormente se debe llenar el cuadro de Valores
para esta etiqueta, al igual como se hizo con la variable Sexo, pero esta vez
utilizando las 5 posibles respuestas, tal como lo muestra la imagen siguiente:

Finalmente se debe definir una unidad de medida para la variable. Como se puede
Variable 5.1 (El servicio ofrece una nueva experiencia en la compra): observar, esta variable tambin sirve para categorizar la informacin, sin embargo
posee la caracterstica que est definiendo un ranking de con la informacin, de
Lo primero que se debe insertar es el nombre de la variable. En este caso acuerdo a las posibilidades de respuesta, por lo que se trata de una variable con
Exp_Serv, bajo la columna Nombre. medida Ordinal

Al definir el Tipo de variable, se debe tener en cuenta que esta es una unidad de En la pgina siguiente se observa la base de datos editada para cada una de las 5
medida numrica, por lo que debe ser definida como tal: variables del cuestionario, la cual se encuentra disponible en el archivo
BaseDatos1.sav de manera que pueda ser verificado por ud.

Pgina 13
Mdulo Bsico SPSS - Programa Jvenes Profesionales
La base de datos, una vez completa debiese lucir como la imagen siguiente:

Al volver a la Vista de datos se obtendr una pantalla como la siguiente. En ese


momento SPSS se encuentra listo para que se comience a ingresar los datos en el,
de acuerdo a lo especificado por el libro de cdigos. El archivo BaseDatosC1a
contiene una base de datos con la informacin de los 30 encuestados, de manera Guardar una Base de Datos:
que se pueda revisar y comprender la forma en que se ingresa la informacin en el
software. SPSS tiene una particularidad, por cuanto el archivo de bases de datos, as como el
archivo de resultados se guardan como archivos independientes y con extensiones
distintas.

tem Extensin

Guardar Base de Datos Nombre.sav

Guardar Archivo de Resultados Nombre.spo

Pgina 14
Mdulo Bsico SPSS - Programa Jvenes Profesionales
Para Guardar una base de datos, se debe ir al men Archivo \ Guardar y asignar un
nombre al archivo. Posteriormente hacer clic en el botn Guardar. Tal como se
observa en las imgenes siguientes:

Abrir una Base de Datos:

Para abrir una base de datos se debe hacer clic en el men Archivo \ Abrir \ Datos,
y buscar el archivo que deseemos abrir, tal como muestran las imgenes siguientes:

Pgina 15
Mdulo Bsico SPSS - Programa Jvenes Profesionales
Importar Datos de Microsoft Excel Se recomienda dejar este dilogo tal
cual aparece en el programa, pues
Una forma comn de encontrar bases de datos es en formatos distintos a SPSS, generalmente cambiar esto puede
como por ejemplo Microsoft Excel (.xls), Para poder trabajar con bases de datos de generar problemas al investigador
otro software primero se debe importar de manera de transformarla en datos cuando no comprende a cabalidad los
comprensibles para SPSS. software que se estn haciendo
funcionar (SPSS y Excel).
La forma de hacer esto es la siguiente:
Hacer clic en el botn Aceptar para
Primero se debe ir al men Archivo \ Leer datos de texto. En la ventana que abre continuar e importar los datos.
debemos seleccionar Excel [.xls] donde dice Tipo y posteriormente buscar y
seleccionar el archivo Excel que se desee importar.

Una vez importados los datos desde la planilla excel, se abrir una ventana del
Editor de datos que lucir como la siguiente. Si se va a la Vista de variables, el
investigador se dar cuenta que las caractersticas de las variables no estn
ingresadas, por lo que deber ingresarlas tal cual se explic anteriormente:

Una vez seleccionado el archivo se debe hacer clic en el botn Abrir y se abrir un
nuevo cuadro de dilogo.

Pgina 16
CAPTULO 3
Anlisis de Estadsticos Descriptivos

Pgina 17
Mdulo Bsico SPSS - Programa Jvenes Profesionales
2. Posteriormente se abrir un
Anlisis Estadsticos Descriptivos cuadro de dilogo como el de la
izquierda. Ah se debe seleccionar la
En el presente apartado se explicar la forma de realizar algunos de los anlisis variable a la que se quiere calcular
descriptivos ms comunes en las investigaciones de mercado, como son las medidas la media (promedio), en este caso la
de tendencia central (Media, mediana), medidas de dispersin (Varianza, desviacin Renta Lquida y se debe hacer clic
estndar) y anlisis de respuestas de seleccin Mltiple. en el botn con el tringulo
(recuadro rojo).

Medidas de Tendencia Central: La Media.

La media es comnmente conocida como promedio y corresponde a un valor de


tendencia central para una variable con medida de Escala. En las variables nominales u 3. Una vez seleccionada la variable
ordinales no tiene sentido utilizar este estadstico por su naturaleza. esta pasar a ubicarse en la zona
de la derecha, tal cual se ilustra en
Para el caso prctico se utilizar la misma base de datos creada en el captulo anterior, la imagen. Posteriormente se
debido a que ya se encuentra familiarizado con esta (BaseDatosC1a.sav). recomienda hacer clic en el botn
Opciones.. para seleccionar los
estadsticos que se quiere calcular.
1. Lo primero que se debe hacer
es ir al men Analizar (que es
donde se encuentran todas las
opciones de anlisis de SPSS) y
luego ir al submen Estadsticos 4. El cuadro abierto ofrece distintos
descriptivos y dentro del dicho anlisis a realizar. Por ser este el
men, escoger Descriptivos..., primer ejemplo se recomienda que
Tal cual se observa en la imagen solamente se deje seleccionado el
que acompaa este texto. anlisis Media y el resto se deje
sin seleccionar.

Es posible realizar ms de un
anlisis al mismo tiempo. Solo basta
seleccionar ms anlisis de los que
se ofrecen ah y SPSS se encargar
de mostrar todos los anlisis
requeridos por el investigador.

Pgina 18
Mdulo Bsico SPSS - Programa Jvenes Profesionales
Una vez hecho clic en Continuar y posteriormente en Aceptar, SPSS abrir una Medidas de Tendencia Central: La Mediana.
ventana del visor de resultados con la informacin requerida (en este caso la media). A
continuacin una captura del visor de resultados: La mediana es similar al promedio, pero es utilizada en variables de tipo Ordinal o
Nominal para determinar cual es la tendencia central escogida por parte del
encuestado.

Nuevamente se utilizar la base de datos del captulo anterior y se buscar la Mediana


para la variable El servicio ofrece una nueva experiencia en la compra

1. Para la determinacin de la
Mediana se debe ir al men:
Analizar \ Estadsticos
Descriptivos \ Frecuencias.

Una vez abierto el software abrir


un cuadro de dilogo similar al
que se mostraba para calcular la
media, pero esta vez tendr
algunas variaciones.

Interpretacin:

El salario promedio de los 30 Clientes Encuestados es de $287.766.

Pgina 19
Mdulo Bsico SPSS - Programa Jvenes Profesionales
2. Una vez abierto el cuadro de Interpretacin:
dilogo se debe seleccionar la
variable que a la que se desea Debido a que el valor de la mediana es
calcular la mediana y luego de 2.5, esto quiere decir que los
presionar el botn con el tringulo. encuestados tienden a estar entre
En este caso es la variable El indiferentes y de acuerdo con que el
servicio ofrece una.... servicio ofrece una nueva experiencia en
la compra

3. Posteriormente se recomienda
seleccionar los anlisis que se
desea realizar. Para ello se debe
hacer clic en el botn Estadsticos,
el que abrir una nueva ventana con
distintos anlisis disponibles para el
investigador.

Interpretacin:
4 . E n e l c u a d ro d e d i a l o g o
Estadsticos se debe seleccionar El visor de resultados tambin muestra una tabla que indica las frecuencias (cantidad
los anlisis que el investigador de veces) que se escogi cada una de las alternativas por parte de los usuarios, as
desee realizar. A modo prctico como el porcentaje al que equivale esa cantidad de respuestas sobre el total de
solamente se seleccionar el encuestados. Si se observa con atencin, la tabla muestra claramente que las
anlisis de Mediana, que es la respuestas tienden a estar agrupadas entre Indiferente y De acuerdo, tal cual lo
medida de tendencia central que se determin el clculo e interpretacin de la mediana.
est explicando en el presente
captulo.

Una vez seleccionados los anlisis


se debe hacer clic en el botn
Continuar.

Pgina 20
Mdulo Bsico SPSS - Programa Jvenes Profesionales
Medidas de Dispersin: La Varianza y Desviacin Estndar. Posteriormente se debe seleccionar
la variable que se desee analizar y
Muchas veces el investigador necesita saber que tan dispersos estn los datos unos presionar el botn con el tringulo,
con otros respecto al promedio o en trminos generales. Por ejemplo, si tenemos un de la misma forma como se ha
grupo de dos personas que ganan $300.000 cada una, no es lo mismo que tener un hecho anteriormente. En este caso
segundo grupo de dos personas donde una gana $100.000 y la otra $500.000, an la variable a estudiar ser Renta
cuando en promedio ambos grupos ganan $300.000. Lquida. Posteriormente se debe
hacer clic en el botn Opciones
Evidentemente el segundo grupo posee una dispersin ms grande que el primero, y para escoger los estadsticos que
es justamente para evitar estos problemas o para advertirlos a tiempo que las llamadas se realizarn.
medidas de dispersin de datos son necesarias.

Las medidas comnmente utilizadas en investigacin de mercados son la Varianza y la


Desviacin Estndar, siendo esta ltima la ms utilizada porque es una medida que Una vez dentro del cuadro de
indica cuan dispersos estn los datos respecto del promedio. Obviamente un mayor dilogo Opciones se muestra una
valor implica una mayor dispersin de los datos. serie de anlisis posibles. En este
c a s o s e s e l e c c i o n a r D e s v.
A modo prctico se seguir utilizando la misma base de datos BaseDatosC1a.sav y tpica (Desviacin Estndar) y
determinaremos la varianza y desviacin estndar para la variable Sueldo Lquido. Varianza, tal como muestra la
figura lateral.

Posteriormente se hace clic en el


1. Para calcular la varianza y
botn Continuar y finalmente en el
desviacin estndar se debe hacer
botn Aceptar para acceder a la
clic en el men Analizar y
ventana de resultados.
posteriormente situar el mouse
sobre Estadsticos Descriptivos
y una vez all seleccionar
Descriptivos, tal como lo ilustra la
imagen de la izquierda.

Pgina 21
Mdulo Bsico SPSS - Programa Jvenes Profesionales
Ingreso de datos a la Base de Datos:

A diferencia de los anlisis comunes, cuando se trabaja con respuestas de seleccin


mltiple hay que adaptar la base de datos.

Lo primero que se debe saber, es que cada alternativa debe ser ingresada como una
variable independiente en SPSS, es decir, cada alternativa debe ser tratada como si se
Interpretecin: tratara de una pregunta diferente. En el archivo BaseDatosMult.sav se encuentra la
base de datos ingresada.
Los salarios poseen una desviacin estndar de $44.276.
Se debe notar que cuando un encuestado selecciona una alternativa particular, esta
debe ser llenada con un valor 1, mientras que una alternativa que no haya sido
Anlisis de Respuestas de Seleccin Mltiple: seleccionada por el encuestado debe llevar un nmero 0. En la base de datos de
ejemplo se observa como se debe realizar el procedimiento.
Es comn que las investigaciones de mercado o estudios donde se apliquen
cuestionarios, posean respuestas de seleccin mltiple, o en otras palabras, aquellas
respuestas donde el encuestado puede responder con ms de una opcin. Para estos
casos SPSS requiere ser trabajado de manera especial, tanto en el ingreso de este tipo
de preguntas al Software, como para su posterior anlisis.

Para ejemplificar la forma de trabajar este tipo de preguntas se supondr que una
empresa X desea ofrecer nuevos servicios a sus clientes. Para ello realizan un
pequeo cuestionario a 30 personas, donde se les pide que seleccionen las alternativas
por las que estaran dispuestos a pagar. A continuacin se muestra las alternativas:

Seleccione las alternativas por las que estara dispuesto a pagar (Puede
seleccionar ms de una):

Servicio de seguridad personalizada.

Servicio de limpieza de vehculos.

Servicio de atencin personalizada.

Servicio de estacionamiento.

Pgina 22
Mdulo Bsico SPSS - Programa Jvenes Profesionales
1. Lo primero que se debe realizar
para definir el conjunto de datos es
ir al men Analizar, luego
posicionarse sobre Respuesta
mltiple y finalmente escoger la
opcin Definir conjuntos de
variables... (tal como muestra la
figura).

2. Una vez abierto el cuadro de


dilogo, se debe escoger las
variables que se desee utilizar como
alternativas (cada una de las
Definir el conjunto de datos: alternativas de la pregunta de
seleccin mltiple y posteriormente
La primera labor que se debe hacer para realizar un anlisis de respuestas mltiples es hacer clic en el botn con el
definir el conjunto de datos, lo que consiste bsicamente en indicar al software cuales tringulo negro para que as las
variables corresponden a las alternativas de la pregunta de seleccin mltiple. El variables se ubiquen en la seccin
objetivo de esto es que el programa sepa los parmetros sobre los que debe encontrar de Variables del Conjunto, ta
las respuestas dadas por los encuestados y as evitar malinterpretar los resultados. como se observa en las figuras de
la izquierda.

Pgina 23
Mdulo Bsico SPSS - Programa Jvenes Profesionales
4. Posteriormente se debe definir el 1. Primero se debe ir al men
valor que SPSS identificar como Analizar \ Respuesta Mltiple \
vlido para la seleccin. En este Frecuencias.... En caso que se
caso ser el valor 1, pues con ese d e s e e re a l i z a r u n a t a b l a d e
se indic en la base de datos que el contingencia, solamente se deber
encuestado haba seleccionado escoger la segunda opcin.
dicha alternativa. Para ello se debe
escribir el nmero 1 donde dice Del uso de tablas de contingencia
las variables estn codificadas se hablar en un captulo posterior.
como y posteriormente se debe
agregar un nombre y etiqueta al
conjunto de respuesta mltiple.

Finalmente se debe hacer clic en el


botn Aadir y as el conjunto de
respuestas estar creado y se
podr realizar los anlisis de
respuestas mltiples con SPSS
2. Una vez abierto el cuadro de
dilogo se debe escoger el conjunto
de respuestas multiples que se
d e fi n i a n t e r i o r m e n t e y
posteriormente se debe hacer clic
en el botn con el tringulo negro.
Una vez listo, se debe presionar el
botn Aceptar y abrir una
ventana del editor de resultados,
Anlisis de conjuntos de Respuestas Mltiples: con los resultados de los anlisis
realizados.
Una vez definido el conjunto de datos, es posible realizar los anlisis. Resulta necesario
mencionar que los anlisis que se pueden realizar con este tipo de preguntas son
bastante pocos, y se limitan a tablas de contingencia y anlisis de frecuencia.

El procedimiento para realizar dichos anlisis se describir a continuacin:

Pgina 24
Mdulo Bsico SPSS - Programa Jvenes Profesionales

El primer cuadro que se muestra es un cuadro resumen que no posee mayor


informacin, salvo indicar que se estn analizando 30 datos y que estos equivalen al
100% de la muestra.

Interpretacin:

Se puede deducir de los resultados que el 34% de los encuestados prefieren un


servicio de atencin personalizada, mientras que un 26,4% pagaran por un servicio de
seguridad personalizada, un 20,8% estaran dispuestos a pagar por un servicio de
estacionamiento y un 18,9% pagara por un servicio de limpieza de vehculos.

En la columna Porcentaje de casos se indica el porcentaje Bruto de cada una de las


alternativas, de ah que sume ms del 100%.
Pgina 25
CAPTULO 4
Anlisis de Variables Categricas

Pgina 26
Mdulo Bsico SPSS - Programa Jvenes Profesionales
1. Al igual que la mayora de los
Anlisis de Variables Categricas anlisis, se debe ir al men
Analizar y posteriormente a
Estadsticos descriptivos, donde
En las investigaciones de mercados y otros trabajos de investigacin, en ocasiones, es se debe escoger la opcin Tablas
importante entregar resultados categorizados, es decir, agrupados por alguna categora de contingencia...
o variable que sirva para separar los resultados y dar visiones separadas de estos,
como por ejemplo cuando se entregan resultados separados para mujeres y hombres.

Para realizar estas labores SPSS posee una herramienta de anlisis que se llama
Tablas de contingencia, que consiste en una tabla que muestra informacin
categorizada de acuerdo a los parmetros que se haya definido previamente.

Para que este tipo de anlisis tenga sentido, se necesita al menos de dos variables: una
variable que sirva para categorizar y una variable que se desee categorizar. Estas
variables deben poseer unidades de medida Ordinal o Nominal, por lo que utilizar
variables con medida de Escala no tiene mayor sentido y no ofrecera resultados de los
que se pueda extraer mucha informacin.

Ejemplo Prctico: 2. Posteriormente se debe escoger


las variables que se desee utilizar. En
Se utilizar la base de datos BaseDatosC1a.sav para categorizar la edad de los este caso se utilizarn las variables:
encuestados de acuerdo al sexo de estos. Es decir, se buscar definir cuantas Sexo y Edad.
personas de cada grupo de edad corresponden a sexo masculino y cuantas al sexo
femenino. Se debe ubicar una de las variables
en la casilla Filas y la otra en la
casilla Columnas. Esta ubicacin
depender de la forma en que al
investigador resulte ms cmodo
que se desplieguen los anlisis en la
tabla de contingencia, por lo que los
resultados no variarn si se ubica en
otra direccin.

Para mejorar los resultados se


recomienda hacer clic en el botn:
Casillas

Pgina 27
Mdulo Bsico SPSS - Programa Jvenes Profesionales
3. Dentro de las opciones para
mostrar en las casillas, se
recomienda al investigador utilizar
porcentajes, ya que la tabla de
contingencia por si sola, muestra
nicamente las frecuencias de los
datos, lo que en ocasiones puede
resultar insuficiente.

Para mostrar los porcentajes de las


frecuencias en la tabla solamente se
debe marcar las casillas respectivas.
En este caso se seleccion la opcin
Columna pues se desea que los
porcentajes sean mostrados para Interpretacin:
cada una de las columnas.
Como se puede observar en la tabla, dentro de los 16 encuestados del rango de 18 a
Finalmente se debe hacer clic en 29 aos, el 75% corresponde a mujeres, mientras que el 25% corresponde a hombres.
Continuar y posteriormente en En el rango de 30 a 49 aos sucede lo contrario: El 72,7% de los encuestados son
Aceptar para visualizar los varones y el 27,3% son mujeres, mientras que de los encuestados mayores de 50
resultados. aos, el 66,7% corresponde a personas del sexo femenino, mientras que el 33,3%
corresponde a hombres.

Al igual que con cualquier resultado, SPSS muestra un resumen del procesamiento, en
el que se indica que se utilizaron 30 casos para el anlisis y que estos corresponden al
100% de los datos incluidos.

Pgina 28
CAPTULO 5
Pruebas de Hiptesis

Pgina 29
Mdulo Bsico SPSS - Programa Jvenes Profesionales
Valor p:
Pruebas de Hiptesis
Una vez establecidas las hiptesis, es necesario conocer el mtodo por el cual el
investigador escoger entre una hiptesis y la otra. Para ello, de manera general, se
Resulta comn en el da a da, escuchar afirmaciones que dicen cosas como Las utiliza un estadstico llamado valor p.
mujeres ganan menos que los hombres, A mayor nivel de educacin, mayor nivel de
ingresos y asuntos por el estilo. Este estadstico indica la probabilidad que existe de rechazar la hiptesis del
investigador, cuando esta es verdadera. Por convencin, se asume que si esta
Si bien es cierto que la lgica o el sentido comn podan indicar que efectivamente lo probabilidad es ms de un 5% (0,05) debemos rechazar la hiptesis del investigador
que sucede es as, cuando se desea comprobar de manera emprica estas afirmaciones (H1) en favor de la hiptesis nula (H0). Entonces:
es necesario utilizar tcnicas estadsticas que apoyen o refuten las teoras del
investigador, de manera de tener certeza (desde el punto de vista estadstico), sobre las
afirmaciones realizadas.
Criterio Opcin
Para poder realizar este tipo de anlisis, SPSS presenta algunas herramientas, sin
embargo, se considera prudente interiorizar al lector en el concepto de pruebas de Si, Valor p < 0,05 Se debe aceptar H1 (Hiptesis del investigador)
hiptesis, de manera superficial, con la finalidad de comprender su finalidad.
Si, Valor p > 0,05 Se debe aceptar H0 (Hiptesis nula)

Pruebas de Hiptesis:

En trminos generales, las pruebas de hiptesis se utilizan cuando se quiere determinar, Ejemplo Prctico:
a travs de una muestra, que la totalidad de la poblacin posee una caracterstica
determinada, adems de aquellas ocasiones en que esto no es as. La empresa Doble Equis est enfrentando una seria disputa entre su personal. Por
una parte los profesionales pelean porque de acuerdo a su percepcin, el salario
La prueba de hiptesis consta de dos afirmaciones: Una hiptesis del investigador (que recibido por las mujeres es menor que el salario recibido por los hombres.
se identifica como H1) y una hiptesis nula (identificada como H0). Cada una de estas
afirmaciones puede escribir en trminos normales, pero tambin se debe identificar Adems todos reclaman que el salario promedio de la empresa es inferior al salario de
como notacin matemtica. Por ejemplo, si deseamos determinar que el promedio de mercado, que ronda los $ 520.000 para empresas similares.
las edad de las mujeres es menor que el de los hombres, se deber expersar de la
siguiente manera: Finalmente, todos concuerdan que en los ltimos aos el salario no ha aumentado, en
promedio, de manera considerable, por lo que piden que se reajuste a todos los
H0: El promedio de edad de las mujeres es igual al de los hombres. trabajadores su nivel de renta.
H1: El promedio de edad de las mujeres es menor al de los hombres.
La empresa decide tomar cartas en el asunto y genera una base de datos
O en notacin matemtica: (BaseDatosC5.sav) en la que incluye informacin como: Sexo, Salario inicial, Salario
actual y aos de escolaridad para cada uno de sus 35 trabajadores.
H 0 : xedad mujeres = xedad hom bres
Se le pide analizar la base de datos y determinar la veracidad de cada una de las
H 1 : xedad mujeres < xedad hom bres situaciones anteriormente descritas.
Pgina 30
Mdulo Bsico SPSS - Programa Jvenes Profesionales
Prueba de medias para muestras independientes: 2. Una vez en el cuadro de dilogo,
se debe escoger la variable que se
La primera situacin a la que se enfrenta el investigador es a determinar si desea medir, en este caso Salario
efectivamente existe discriminacin en el salario entre las mujeres y los hombres. Para actual y debe ser llevada hasta
ello se debe realizar una prueba de medias para muestras independientes. A donde dice Contrastar variables,
continuacin se explica como realizarlo con SPSS, pero primero se debe establecer la mientras que la variable por la que
prueba de hiptesis: se desee agrupar el estadstico (en
este caso, el sexo del trabajador)
H0: En promedio, el salario de las mujeres es igual al salario de los hombres. debe ir donde dice Variable de
H1: En promedio, el salario de las mujeres es menor al salario de los hombres. agrupacin.

De lo anterior, ser responsabilidad del investigador, determinar la veracidad de la Posteriormente se deben definir los
hiptesis H1. grupos. Para ello hay que hacer clic
en el botn Definir grupos

1. Lo primero que se debe hacer es ir 3. Al hacer clic en el botn Definir


al men Analizar, posteriormente ir Grupos, se abrir una pequea
al apartado Comparar medias y ventana como la que se ve a la
finalmente escoger Prueba T para izquierda. En ella se debe ingresar
muestras independientes.... los valores correspondientes a las
etiquetas de sexo. De acuerdo a la
Esto abrir una ventana de dilogo informacin de la base de datos:
donde se debern definir los 1=Masculino y 2=Femenino. A
parmetros para la realizacin de la continuacin hay que escribir los
prueba de contraste de medias. nmeros en las casillas que se
denominan Grupo 1 y Grupo 2,
tal cual se observa en la figura.
Finalmente se debe hacer clic en el
botn Continuar y para finalizar, en
el botn Aceptar.

Pgina 31
Mdulo Bsico SPSS - Programa Jvenes Profesionales
Prueba de medias para una muestra:

La segunda situacin que debe resolver el investigador es si efectivamente la empresa


ofrece un salario promedio inferior al del mercado, que ronda los $520.000. Lo primero
que se debe realizar es establecer la prueba de hiptesis correspondiente:

H0: El salario promedio pagado por la empresa es igual al salario de mercado


Interpretacin: ($520.000).
H1: El salario promedio pagado por la empresa es menor que el salario de
Los resultados indican que el salario promedio de los hombres es de $488.888, mercado ($520.000).
mientras que el salario de las mujeres es de $480.000. Como primera aproximacin se
observa una diferencia de salario a favor de los hombres de $8.000 en promedio. Sin Para determinar cual hiptesis es la correcta, el procedimiento a seguir es el siguiente:
embargo esto necesita ser contrastado por pruebas ms especficas.

1. Para realizar este anlisis se debe


ir al men Analizar posteriormente
seleccionar donde dice Comparar
medias y finalmente escoger
Prueba T para una muestra.

Interpretacin:

SPSS utiliza el criterio del valor p para determinar la validez de los resultados de la
prueba de hiptesis. Sin embargo, en este software, el valor p, viene escrito como Sig
(bilateral). Por ende, para medir el valor p, solamente se debe ver donde dice Sig
(bilateral).
2. Una vez abierta la ventana, se
Utilizando el criterio del valor p, se puede afirmar que, estadsticamente, no hay debe escoger la variable que se
diferencias entre el salario de las mujeres en relacin al de los hombres (valor p = 0,612), desea contrastar (en este caso
por lo que esa acusacin resulta falsa (Se debe aceptar H0). Salario actual y se debe llevar
hacia el cuadro. Donde dice Valor
de prueba se debe ingresar el valor
contra el que se quiere contrastar
(en este caso el salario de mercado
de $ 520.000.
Pgina 32
Mdulo Bsico SPSS - Programa Jvenes Profesionales
Prueba de medias para muestras relacionadas:

La ltima situacin presentada por los trabajadores de la empresa indica que en


promedio sus sueldos no han subido significativamente conforme ha pasado el tiempo.
Para resolver lo anterior, el investigador debe realizar una prueba que se denomina:
Prueba T para muestras relacionadas.

Interpretacin: Las hiptesis detrs de esta prueba son las siguienes:

La primera parte de los resultados indican que el salario promedio pagado por la H0: El salario promedio actual de la empresa es igual al salario inicial.
empresa es de $ 484.571, lo que est indicando que en trminos brutos, el salario H1: El salario promedio actual de la empresa es mayor al salario inicial.
efectivamente es ms bajo que el de mercado.
Para determinar cual hiptesis es la correcta, el procedimiento a seguir es el siguiente:

1. Primero hay que ir al men


Analizar, posteriormente ir al
submen Comparar medias y ah
escoger Prueba T para muestras
relacionadas... tal como muestra
la figura de la izquierda.

Interpretacin:

Utilizando el criterio del valor p, y dado que el valor entegado por el software es de
0,000 se puede asumir que el investigador tiene razn al afirmar que la empresa paga
un salario ms bajo que el promedio de mercado.

Recordemos que cuando el valor p es menor que 0,05 se puede aceptar como
verdadera la hiptesis del investigador (H1).

Pgina 33
Mdulo Bsico SPSS - Programa Jvenes Profesionales
2. En la ventana que se abre, se
debe escoger las variables que se
desea contrastar y agregarlas al
sector de Variables seleccionadas.
Para el desarrollo de este ejemplo,
las variables son Salario inicial y
Salario actual.

Una vez seleccionadas y ubicadas Interpretacin:


en la seccin variables
Seleccionadas, se debe hacer clic De acuerdo al anlisis del valor p, se puede determinar que en promedio, el salario
en el botn Aceptar. actual de la empresa si es estadsticamente mayor que el salario que se pagaba
inicialmente, debido a que como el valor p < 0,05, se debe aceptar la hiptesis del
investigador (H1), que dice que el salario actual es mayor que el salario inicial.

Interpretacin:

Los estadsticos descriptivos indican que inicialmente el salario inicial promedio de los
trabajadores era de $473.715, mientras que el salario promedio actual de los
trabajadores es de $484.571.

Pgina 34
CAPTULO 6
Anlisis de Varianza

Pgina 35
Mdulo Bsico SPSS - Programa Jvenes Profesionales
Ejemplo Prctico:
Anlisis de Varianza
La empresa OMG fabrica mesas y sillas, las cuales son iguales para cada lugar al que
distribuyen. De acuerdo a los reportes de la fuerza de ventas, existe descontento por
En el apartado anterior, se introdujo el concepto de pruebas de hiptesis y pruebas de parte de los clientes de algunas de las cuatro localidades a las que se distribuye los
diferencia de tres tipos: para muestras independientes, para una muestra y para productos.
muestras relacionadas. Sin embargo, estas pruebas de diferencias de media solo era
posible realizarlas entre dos grupos de datos. Qu sucede entonces, cuando se desea Para verificar esta informacin, la empresa decide preguntar a sus clientes de las cuatro
contrastar el promedio entre ms de dos grupos de datos?. Obviamente, el uso de las localidades sobre el grado de satisfaccin del producto. Para ello se les pide que
tcnicas anteriores no logra cumplir ese cometido, por lo que resulta necesario utilizar evalen el producto con una nota del 1 al 10, permitiendo usar cifras decimales, donde
una tcnica diferente, que se denomina Anlisis de Varianza (ANOVA, por sus siglas en 1 sera muy insatisfactorio y 10 sera completamente satisfecho.
ingls).
Una vez con la base de datos en su poder (BaseDatosC6.sav), la empresa le pide a
La ANOVA se basa en el anlisis de las varianzas de los grupos de datos presentados y usted que determine si efectivamente existen diferencias en la satisfaccin de los
se utiliza comnmente para demostrar que el promedio de un grupo de datos es clientes de la Localidad 1 con respecto a los de las otras localidades.
diferente al de los dems. Por ende la prueba de hiptesis asociada a esta prueba es
las siguiente:

1. Debido a que el anlisis de


H 0 : 1 = 2 = 3 ... = n = 0 varianza (ANOVA) es utilizado para
H 1 : al menos uno es ! 0 contrastar medias, se debe ir al
men Analizar, luego al apartado
Comparar medias y finalmente se
debe escoger la opcin ANOVA de
La prueba anterior indica bajo la hiptesis nula, que el promedio para cada uno de los un factor....
conjuntos de datos es igual entre ellos y a su vez es igual a cero, mientras que la
hiptesis del investigador indica que al menos un promedio es distinto de cero.

Pgina 36
Mdulo Bsico SPSS - Programa Jvenes Profesionales
2. Una vez abierto el cuadro de Interpretacin:
dilogo, se debe escoger las
variables dependientes y el factor. De acuerdo a los resultados obtenidos por el anlisis ANOVA, no existe evidencia
Para esclarecer este punto, el estadstica (de acuerdo al criterio del valor p - Sig) para rechazar la hiptesis nula, por
Factor es la variable que se ende se puede asegurar que NO existe diferencias en la satisfaccin percibida por los
tomar como referencia para clientes de ninguna localidad.
comparar: en este caso, la localidad
1 (de acuerdo a las instrucciones Como se puede observar, los distintos valores p (Sig) que entrega SPSS son todos
del ejercicio), mientras que las mayores que el valor de referencia que es de 0,05, por lo que el investigador debe
variables dependientes sern: aceptar la hiptesis nula que indica que no hay diferencias entre la satisfaccin
Localidad 2, Localidad 3 y percibida por el cliente en ninguna de las localidades.
Localidad 4.
Todo lo anterior derriba la hiptesis de la fuerza de venta que deca que existan
La segunda figura muestra como diferencias en la percepcin de la satisfaccin producida por los productos
deben ser ubicadas las distintas comercializados.
variables para la realizacin del
anlisis.

Una vez listo, se debe hacer clic en


el botn Aceptar.

Pgina 37
CAPTULO 7
Grficos

Pgina 38
Mdulo Bsico SPSS - Programa Jvenes Profesionales
1 . P a r a g e n e r a r u n g r fi c o
Grficos cualquiera, se debe ir al Men
Grficos (Al lado del men
Analizar) y se debe escoger alguna
de las opciones. Se recomienda que
En numerosas ocasiones, el investigador se enfrenta con lectores que difcilmente
se escoja la opcin Cuadros de
podrn comprender gran parte de los resultados obtenidos en el marco de una
dilogo antiguos (por asuntos de
investigacin. Sin embargo, esto puede mejorar en la medida que el investigador busca
comodidad). Posteriormente se
nuevas formas de presentar la informacin. Una de estas formas es la utilizacin de
debe escoger el tipo de grfico que
grficos, los que resultan un complemento visual importante para el desarrollo de una
se desea, en este caso, un grfico
correcta investigacin y ofrecen herramientas que permiten al lector hacerse una mejor
de Sectores... (que es
idea de lo que visualizaran si solamente mirasen los resultados numricos.
comnmente llamado Grfico de
Torta.
Si bien es cierto que hay numerosos estilos de grficos que se pueden utilizar, en este
apartado solamente se utilizarn los ms comunes: Grficos de torta, Grficos de Barra,
Grficos de dispersin (diagramas de dispersin).

2. Posteriormente ofrece la opcin


de como se desea obtener los
datos desde la base de datos.
Grficos de Torta: Como este es un manual de orden
bsico, se recomienda dejar tal cual
Este tipo de grficos es muy comn para visualizar informacin de carcter cualitativo y lo ofrece el software, es decir, se
categrico, ya que ofrece una forma muy grfica para visualizar el peso (o cuanta) de debe seleccionar la opcin
algn aspecto de una variable en relacin a otros. Resmenes para grupos de
casos.
A modo prctico se utilizar la base de datos del captulo 5 (BaseDatosC5.sav).
Con lo anterior, el investigador se
En este caso, se realizar un grfico de torta para representar la segmentacin de los asegura que se utilizar todos los
encuestados segn su sexo (algo muy comn en cualquier estudio). datos de la base de datos de
acuerdo a los grupos en los que se
Es importante mencionar que para que este tipo de grficos tenga sentido, la unidad de encuentren definidos.
medida de los datos debe ser Nominal u Ordinal. Con variables medidas en Escala
no tiene mucho sentido realizar este tipo de grficos, pues entregarn un dibujo muy
complejo de leer y sin lgica aparente.

Pgina 39
Mdulo Bsico SPSS - Programa Jvenes Profesionales
3. Una vez abierto el cuadro de
dilogo, se debe definir los sectores
del grfico. Para ello, se debe
seleccionar la variable que se desee
graficar (en este caso Sexo) y se
debe ubicar en el sector que dice:
Definir sectores por:
1
Con esto, el investigador le est
diciendo al software que defina los
sectores del grfico de acuerdo a
las etiquetas de la variable
seleccionada.
2 Posteriormente se recomienda
agregar ttulos al grfico. Para ello
se debe hacer clic en el botn
Ttulos....

4. En el cuadro de dilogo de ttulos,


se debe agregar el ttulo principal
(Lnea 1 y Lnea 2), el Subttulo y las
notas al pie (Lnea 1 y Lnea 2 de la
zona inferior). Sin embargo es Una vez hecho clic en el botn aceptar, el software abrir una ventana de resultados
posible que el investigador decida con un grfico similar al de la imagen superior, en el cual se puede observar el ttulo y la
solo colocar un ttulo y dejar el resto nota al pie ingresada, y la representacin grfica de la distribucin por sexo de los
en blanco, o simplemente colocar encuestados.
nada.
No obstante lo anterior, el grfico an se puede encontrar muy incompleto o falto de
No es obligacin llenar cada uno de identificadores. Para ello SPSS ofrece herramientas para editar grficos. Solo basta con
los espacios disponibles en esta hacer doble clic sobre el grfico en el visor de resultados y abrir una nueva ventana
ventana. con el editor de grficos, donde el investigador podr editar el grfico a gusto.

Finalmente se debe hacer clic en el Como no es el objetivo de este manual, queda a criterio del investigador aprender a
botn Continuar y posteriormente utilizar dicho editor de la forma que estime conveniente. Ms adelante se ofrece una
en el botn Aceptar. vista a la ventana del editor de grficos.

Pgina 40
Mdulo Bsico SPSS - Programa Jvenes Profesionales
La imagen de la izquierda muestra la Ejemplo Grfico de Barra Simple:
composicin del editor de grficos
provisto por SPSS. En el, el Este es el tipo ms comn de grfico de barra, en que solamente se grafica una
investigador podr cambiar los variable. En este caso se graficar la variable Rango de edad, de manera de observar
colores, formas, textos, etc, del la forma en que este tipo de grfico despliega la informacin:
grfico, de manera de acomodarlo a
las necesidades de su investigacin.
1. Al igual que con el grfico de
sectores, para realizar este, es
necesario ir al men Grficos,
posteriormente se recomienda elegir
la opcin Cuadros de dilogo
a n t i g u o s y d e n t ro d e e l l a ,
seleccionar donde dice Barras
para poder dibujar un grfico de
barras con la informacin
disponible.

Grficos de Barra:
2. Nuevamente se abre un cuadro
Los grficos de barra son, junto con los de torta, los ms utilizados al momento de de dilogo para definir que tipo de
desplegar informacin grficamente en un estudio. Al igual que los grficos de torta, grfico se quiere realizar. En este
generalmente tienen sentido solamente con variables medidas en unidades nominales u caso ser un grfico simple pues
ordinales. solamente considera una variable.
Ms adelante se realizar este
Para ejemplificar la utilizacin de este tipo de grficos, se tiene una base de datos que procedimiento para un grfico
contiene la siguiente informacin: Sexo del encuestado, Rango de edad, Nivel agrupado.
educacional y salario. La base de datos est disponible en el archivo
BaseDatosC7.sav. Una vez definido el grfico Simple
hay que hacer clic en el botn
Definir.

Pgina 41
Mdulo Bsico SPSS - Programa Jvenes Profesionales
3. En la ventana que abre, se debe
especificar a SPSS la variable que
se desea graficar. Para ello se debe
situar la variable que se desee
donde dice Eje de categoras (que
corresponde al piso del grfico de
barras. En este caso se selecciona
1 la variable Rango de Edad.

Posteriormente se recomienda
hacer clic en el botn Ttulos y
establecer los ttulos necesarios
para el grfico

4. En el cuadro de dilogo de los


Ttulos, se debe (al igual que en el
caso anterior) especificar los ttulos
ms idneos para definir la variable. El resultado del grfico de barras desplegado es similar al que se muestra en la parte
Esta decisin de ttulos corresponde superior. En dicho grfico se observan columnas que representan a los 3 grupos de
plenamente al investigador. edad definidos en la base de datos y hacia arriba se puede observar el porcentaje de
participacin de cada una de ellas.
Cuando est listo, se debe hacer
clic en el botn Continuar y para De lo anterior se puede desprender que cerca del 40% de los encuestados posee entre
finalizar hay que hacer clic en el 18 y 29 aos, una cifra cercana al 35% de los encuestados estn en el rango de 30 a
botn Aceptar 49 aos. mientras que los encuestados con 50 o ms aos estn en el rango del 25%.

Si el investigador desea editar el grfico, los colores u otros aspectos, solamente debe
hacer doble clic sobre el grfico y SPSS abrir una ventana con el editor de grficos,
donde podr hacer algunas correcciones a este.

Pgina 42
Mdulo Bsico SPSS - Programa Jvenes Profesionales
Ejemplo Grfico de Barra Agrupado: 2. En la ventana que se abre a
continuacin se debe escoger la
Este es un tipo de grfico de barras en que la variable ubicada en el eje de categoras segunda opcin (Agrupado) de
(en el ejemplo la variable Rango de edad) es categorizada por otra variable, de manera manera de generar un grfico con
de entregar resultados segmentados por otra variable que sirva como segmentadora. datos agrupados. Donde dice Los
Todo esto dentro del mismo grfico. d a t o s d e l g r fi c o s o n e l
investigador debe cerciorarse que la
Utilizando la base de datos BaseDatosC7.sav se pretender elaborar un grfico de opcin Resmenes para grupos de
barras agrupado, en que se categorizar la variable Rango de edad de acuerdo al casos est seleccionada.
nivel de escolaridad alcanzado. esto proporcionar al lector una idea sobre el nivel de
escolaridad existente para cada uno de los rangos de edad que se utilizaron en el Luego que se haga clic en el botn
estudio. definir, se abrir una ventana para
establecer los parmetros del
grfico.

1. Al tratarse de un grfico de
barras, hay que ir al men
Graficos y ah escoger la opcin
Cuadro de dilogo antiguos y
finalmente la opcin de Barras...
tal cual se hizo la vez anterior (ver 3. La variable que se desea
imagen de la izquierda). categorizar (en este caso el rango
de edad) se debe colocar donde
dice Eje de Categoras, mientras
que la variable por la que se
definirn los grupos (Nivel de
educacin), deber ser agregada
donde dice Definir grupos por, tal
como se observa en la figura de la
izquierda.

Adems se deben agregar los ttulos


y una vez listo eso, se debe hacer
clic en el botn Aceptar para que
posteriormente el software nos
muestre el grfico requerido.

Pgina 43
Mdulo Bsico SPSS - Programa Jvenes Profesionales
Grfico de dispersin (Tendencia):

En ocasiones el investigador necesita determinar la tendencia seguida por cierta


variable con el paso del tiempo o bajo otras situaciones. Para ello es posible
ejemplificar de manera grfica lo que est ocurriendo, de manera que el lector pueda
visualizar de mejor manera la tendencia que existe (o no existe) con determinada
variable). Un punto que se debe tener en cuenta con este tipo de grficos es que se
debe trabajar con, al menos, una variable de tipo Escala.

Para ejemplificar este tipo de grfico, se utilizar la base de datos BaseDatosC7a.sav,


la que consiste bsicamente en una base de datos con meses y las respectivas
cantidades vendidas por la empresa durante cada uno de los meses, para su producto
XYZ.

Del grfico se pretender determinar la tendencia de las ventas del producto XYZ.

1. Lo primero que se debe hacer es


ir al Men Grficos y una vez ah
situarse donde dice Cuadros de
Interpretacin: dilogo antiguos y posteriormente
seleccionar la opcin Dispersin/
En el rango de edad de 18 a 29 aos, se observa que ms del 40% de los encuestados Puntos, que es el tipo de grfico
posee educacin universitaria completa, no as en el rango de 30 a 49 aos, en que es que se utiliza para visualizar
aproximadamente de un 20%. En cuanto a los encuestados mayores de 50 aos, es tendencias de variables.
posible establecer que cerca del 30% posee educacin Universitaria completa.

Pgina 44
Mdulo Bsico SPSS - Programa Jvenes Profesionales
2. Una vez que se muestran las
opciones de grficos, se debe
seleccionar la opcin Dispersin
Simple, tal como se observa en la
figura y posteriormente se debe
hacer clic en el botn Definir.

3. Una vez abierto el cuadro de


dilogo se debe ingresar las
variables. En el eje X se debe
seleccionar la variable que se desee
que se encuentre en la parte inferior
del grfico, mientras que en el Eje
Y, se debe seleccionar la variable
que estar hacia arriba en el grfico
(abajo se observa una figura con la
disposicin del eje X e Y).

Adems se puede agregar ttulos al


grfico, tal cual se hace con
cualquier tipo de grficos de SPSS. Interpretacin:

Una vez listo lo anterior, se debe Como se puede observar en el grfico, las ventas comienzan a ascender desde el mes
hacer clic en el botn Aceptar 1 y alcanzan su mximo en el mes de Junio (mes 6), para luego comenzar a decaer
para acceder al grfico. nuevamente, hasta llegar a un nuevo mnimo en el mes de Diciembre (12).
Eje Y

Eje X
Pgina 45
CAPTULO 8
Anlisis de Correlacin

Pgina 46
Mdulo Bsico SPSS - Programa Jvenes Profesionales

Correlacin
Rango Correlacin Significado

0,2 < r < 0,4 Correlacin Baja


Con frecuencia el investigador necesita determinar si existe relacin entre un conjunto
0 < r < 0,2 Correlacin Muy Baja
de variables, como por ejemplo, la existencia de una relacin entre el salario y los aos
de estudio de una persona, u otra. r=0 Correlacin Nula.
La correlacin lineal mide el grado de relacin lineal entre dos variables o conjuntos de
variables. Los resultados entregan al investigador nociones sobre la direccin de esta
relacin (positiva, negativa), la fuerza (correlacin fuerte, correlacin dbil, sin Ejemplo Prctico:
correlacin).
Comnmente se cree que existe una fuerte relacin entre los aos de estudio de una
La medida de correlacin ms utilizada en investigaciones de mercado es la persona con el salario que recibe en su trabajo. Por lo mismo se le pide a usted que
denominada Correlacin lineal de Pearson, que indica el grado de relacin lineal de las determine si es efectiva esta afirmacin y si realmente ms aos de estudio implican un
variables que se desea medir. mejor salario.

El valor de la correlacin flucta entre -1 y 1, donde valores cercanos a -1 indican una Para ello se utilizar una base de datos que contiene informacin sobre salario actual,
fuerte correlacin negativa, mientras que valores cercanos a 1 indican una fuerte salario inicial, aos de educacin y aos de experiencia previa de 30 trabajadores de
relacin positiva. Si el valor de la correlacin es cercano a cero, se puede decir que el distintas empresas. La base de datos se encuentra en el archivo BaseDatosC8.sav
grado de relacin lineal entre las variables es cero o muy dbil.

Si bien es criterio del investigador el determinar que tan fuerte es la correlacin de las
variables, a continuacin se dejan rangos de valores que a menudo se utilizan para 1. En el men Analizar, se debe
determinar la fuerza de la relacin entre las variables. ubicar el mouse sobre el men
Correlaciones y posteriormente se
debe escoger el tipo Bivariadas,
que corresponde a correlaciones para
Rango Correlacin Significado dos variables. Una nota importante es
que para que este tipo de anlisis
r=1 Correlacin Perfecta tenga sentido se debe tratar de
utilizar variables con unidad de
0,8 < r < 1 Correlacin muy Alta medida de Escala u Ordinales
(aunque este ltimo tipo podra
0,6 < r < 0,8 Correlacin Alta generar problemas).

0,4 < r < 0,6 Correlacin Moderada

Pgina 47
Mdulo Bsico SPSS - Programa Jvenes Profesionales
2. Una vez abierto el cuadro de
dilogo, se debe escoger las
variables entre las que se desea
determinar la correlacin: en este
caso se trata de las variables: Aos
de educacin y Salario actual.
Una vez seleccionadas las variables,
se deben posicionar donde dice
Variables (como muestra la figura)
y s e d e b e c e rc i o r a r q u e s e
encuentra marcada la casilla
Pearson dentro de Coeficientes
de correlacin.

Finalmente se debe hacer clic en el


botn Aceptar.

Interpretacin:

Una vez hecho clic en el botn Aceptar, se abrir una ventana del visor de resultados
donde se indicar el valor de la correlacin de Pearson. En este caso la correlacin es
de 0,932, lo que significa que existe una relacin lineal muy alta entre los aos de
escolaridad con el salario actual. Es decir, en la medida que se posee una mayor
educacin (expresada en aos), mayor es el salario que se recibir por parte del
trabajador.

Pgina 48
CAPTULO 9
Anlisis de Regresin Lineal

Pgina 49
Mdulo Bsico SPSS - Programa Jvenes Profesionales
Pruebas de Hiptesis:
Regresin Lineal
Para verificar la validez de este tipo de modelos, existen dos pruebas de hiptesis que
generalmente se utilizan. La primera busca determinar si el modelo completo tiene
sentido o si no funciona para lo que se quiere determinar. Para ello existe una prueba
Generalmente en investigaciones relacionadas con economa y otras, el investigador de hiptesis que se basa en el uso del estadstico F de Fisher (el que se obtiene de un
necesita determinar si existe alguna relacin entre distintas variables, de que tipo es anlisis de varianza) y que busca determinar si los parmetros en conjunto son iguales
esta relacin y si es posible predecir de valor de una de ellas en funcin de las otras. o distintos de cero. La prueba en cuestin es la siguiente:

Para realizar esto, es que el investigador puede utilizar la herramienta conocida como
Regresin Lineal. El sentido de esta tcnica estadstica, es el de predecir una medida
basndose en el conocimiento de otras.
H 0 : !1 = ! 2 = ! n = 0
H 1 : ! j " 0 para a lg n j = 1, 2,..., n
La regresin lineal consta de dos tipos de variables:

Variable Dependiente: Es la variable por predecir (o modelar) y se denota con la letra Y.


Variable Independiente: Son las variables que se utilizan para predecir (o modelar) y se La segunda prueba de hiptesis que se utiliza con este tipo de modelos, busca
denotan con los smbolos x1, x2, x3.... xn. determinar si alguno de los parmetros de manera individual es estadsticamente
Error Aleatorio: Corresponde a las desviaciones de los valores verdaderos de Y con distinto de cero. Para ello se utiliza la siguiente prueba de hiptesis.
respecto a los valores esperados de Y.

El modelo se plantea de la siguiente manera: H0 : ! j = 0


H 1 : ! j " 0 para j = 1, 2,...., n
Y = ! 0 + !1 X1 + ! 2 X2 + ... + ! n Xn + "
R Cuadrado:

El R cuadrado, o conocido comnmente como Coeficiente de determinacin permite


Donde los valores 0, 1, 2...n son llamados parmetros del modelo y corresponde
determinar el grado de ajuste del modelo, o dicho de otra forma, que tanto de la
al trmino de error aleatorio.
variable dependiente es explicada por las variables independientes (o por el modelo).
El software SPSS se encarga de entregar los valores para cada uno de los parmetros
A continuacin se presenta un ejemplo prctico acerca de la utilizacin del modelo.
junto con sus respectivas pruebas de hiptesis, de manera que el investigador puede
generar un modelo de regresin lineal y a su vez, verificar la validez de este.

A continuacin se explicar brevemente las pruebas de hiptesis de este tipo de


modelo estadstico, sin embargo, se recomienda recurrir a algn libro que entregar una
idea ms completa respecto a este tema.

Pgina 50
Mdulo Bsico SPSS - Programa Jvenes Profesionales
Ejemplo Prctico: 2. En la ventana que se abre, se
debe seleccionar la variable
El investigador cree que el salario actual que recibe una persona depende de diversos dependiente as como las
factores, entre ellos: el salario que reciba en un comienzo, los aos de estudio y la independientes. En este caso, la
experiencia previa del trabajador. variable dependiente corresponde
al salario actual, mientras que las
Para ello se genera una base de datos con informacin de 30 trabajadores para variables independientes
determinar la existencia de esta relacin. corresponde a las variables:
Salario inicial, Aos de educacin
y Experiencia previa. Una vez
seleccionadas y ubicadas como
muestra la figura de la izquierda,
1. Para poder generar un modelo de se debe hacer clic en el botn
regresin, el investigador debe ir al aceptar, para abrir una nueva
men Analizar y posteriormente ventana con los resultados
ubicarse sobre el men Regresin
y ah seleccionar donde dice
Lineal....

Una vez hecho clic sobre el men, se


abrir una nueva ventana donde se
introducirn las variables.

El visor de resultados proporciona al investigador una serie de tablas y cuadros que


indican toda la informacin que se necesita. El primero de ellos (en la parte superior)
indica cuales de las variables ingresadas, finalmente han sido introducidas al modelo.
En este caso particular, todas las variables fueron ingresadas y adems indica que la
variable dependiente corresponde al Salario Actual:

Pgina 51
Mdulo Bsico SPSS - Programa Jvenes Profesionales

Un segundo cuadro, ofrece al investigador informacin bsica del modelo. En este caso
el valor que ms resulta til es el R cuadrado, que indica bsicamente que el modelo
explica un 99,1% (0,991) del salario actual. En otras palabras, el salario actual se explica
en un 99,1% por el salario inicial, los aos de estudio y la experiencia previa. Finalmente, la tabla que indica los parmetros y las pruebas de hiptesis para ellos. En
cuanto a los parmetros, el modelo se puede escribir de la siguiente manera:

Y = !89, 956 + 0, 863X1 + 13732X2 + 1341X 3 + "

En otras palabras:

Salario Actual = -89,95 + 0,863*Salario Inicial + 13732*Aos Experiencia +


1341*Experiencia Previa.

Ahora, revisando las pruebas de hiptesis y mediante el criterio del valor p (Sig.), se
puede decir que tanto el salario inicial como los aos de educacin son
Posteriormente, SPSS ofrece una tabla ANOVA, la que se utiliza para determinar la estadsticamente distintos de cero (Sig < 0,05), por lo que pueden permanecer en el
validez del modelo completo (la prueba F que se mencion anteriormente). Para ello el modelo, mientras que la experiencia previa no es distinta de cero (Sig. > 0,05), por lo
investigador debe fijarse en el valor p (Sig.) y como este es menor que 0,05 se puede que no resulta relevante para explicar el salario actual.
aceptar la hiptesis del investigador, lo que significa que al menos uno de los
parmetros es estadsticamente distinto de cero, por ende el modelo es vlido en su Por lo anterior, el modelo finalmente quedar de la siguiente manera:
conjunto.

Salario Actual = -89,95 + 0,863*Salario Inicial + 13732*Aos Experiencia +

Pgina 52
CAPTULO 10
Anlisis de Regresin Logstica

Pgina 53
Mdulo Bsico SPSS - Programa Jvenes Profesionales
Ejemplo Prctico:
Regresin Logstica (Logit)
Para comprender de mejor manera la utilidad de los modelos de regresin logstica, se
aplicar el siguiente ejemplo prctico. Si bien es bastante trivial, se pretende dar al
lector una visin sobre las posibilidades de este mtodo.
La regresin logstica resulta til para los casos en los que se desea predecir la
presencia o ausencia de una caracterstica o resultado segn los valores de un conjunto
Una entidad financiera prepara el lanzamiento de un nuevo producto. Con el fin de
de predictores. Es similar a un modelo de regresin lineal pero est adaptado para
disear una adecuada poltica de promocin, el departamento de marketing estara
modelos en los que la variable dependiente es dicotmica (esto quiere decir que toma
interesado en conocer hasta qu punto la aceptacin del producto est relacionada
los valores 0 1). Los coeficientes de regresin logstica pueden utilizarse para estimar
con el nivel ingresos de sus clientes. Con esta intencin se realiza una encuesta, en la
la razn de las ventajas de cada variable independiente del modelo.
cual la variable dependiente seria: adquirira usted el producto A?, la que ha sido
codificada con el valor 1 en caso de respuesta afirmativa y con valor 0 en caso
En su forma funcional, el modelo de regresin logstica se presenta de la siguiente
contrario (pregunta dicotmica). Por otra parte, la variable independiente representa el
manera:
nivel de ingresos de cada encuestado.

Para efectos prcticos se encuest a 42 personas y la base de datos se guardo en el


e!0 + !1 x archivo BaseDatosC10.sav.
p =
1 + e!0 + !1 x
1. Como el modelo de regresin
logstica es similar al modelo de
La ecuacin anteriormente presentada, representa la probabilidad (estimada) que un regresin lineal (visto en el captulo
sujeto elija la opcin 1 (el valor de la variable dicotmica), dado un determinado valor de anterior), para acceder a el se
x. debe ir al men Analizar y
posteriormente ir donde dice
En este tipo de ecuaciones, tambin se puede definir la ventaja de elegir la opcin 1, Regresin y escoger la opcin
por sobre la opcin 0, mediante el siguiente clculo: Logstica binaria... tal cual se
ilustra en la imagen de la derecha.

= pi
! = e#0 + #1 xi
1 " pi
i

Pgina 54
Mdulo Bsico SPSS - Programa Jvenes Profesionales
2. Se debe seleccionar las
variables que se incluirn en el
modelo. En este caso, la variable
dependiente (dicotmica) es
adquirira usted el ...?, mientras
que las covariables sera el nivel de
ingresos, Se deben ubicar en las
respectivas casillas, tal cual se
muestra en la imagen.

Finalmente se debe hacer clic en el


botn Aceptar. Si no est
familiarizado con este modelo, se
sugiere no cambiar nada en la
ventana.

Interpretacin:

Posteriormente, SPSS realiza un modelo en que no se tiene en cuenta la covariable


asignada (Nivel de ingresos). En este punto, solamente se est tomando en cuenta la
existencia de una variable constante, que es propia de este tipo de modelos.

En la medida que se vayan agregando variables (covariables) a un modelo de regrsin


Interpretacin: logstica es que el software ir agregando un paso adicional por cada una de las
variables que se agreguen.
Cuando se realiza un modelo de regresin logstica, SPSS provee un cuadro de
resumen en que se indica la cantidad de casos incluidos en el clculo. En este caso, En este caso, los valores entregados para la constante son absolutamente intiles, por
corresponde a 42, que es el nmero de personas que contestaron el cuestionario y que lo que habra que dejarlos de lado.
adems estas 42 personas corresponden al 100% de la muestra. Adems muestra un
cuadro donde se indica los valores asignados a la variable dependiente (0 y 1).
Pgina 55
Mdulo Bsico SPSS - Programa Jvenes Profesionales

Interpretacin:

Seguido al anlisis con la constante, SPSS comienza a incluir (de una en una) las
variables asignadas al modelo. En este caso solamente la variable ingresos.
Interpretacin:
La tabla que se muestra arriba indica (de acuerdo al criterio del valor p) que la variable
incluida es vlida (Paso), y que adems el modelo es vlido. En el siguiente apartado se ofrece al investigador informacin acerca de la forma en
que los encuestados contestaron a la pregunta.

Adems la tabla indica que el modelo es capaz de predecir el 88,1% de las veces,
acerca de las intenciones de compra del usuario.

Interpretacin: Interpretacin:

Luego de realizar los anlisis para determinar que el modelo es vlido, entrega un Finalmente se entregan los valores de los para poder predecir el modelo. En este
cuadro de resumen, el que bsicamente indica algunos estimadores para verificar el caso el valor constante es -11,449 y el valor del es de 0,237. Por lo tanto el modelo
modelo, sin embargo, para el usuario principiante no debiese ser informacin de queda expresado de la siguiente manera:
cuidado, pues no se utiliza en el propsito general del modelo.

e!11, 449 + 0,237 x


p =
1 + e!11, 449 + 0,237 x
Pgina 56
Mdulo Bsico SPSS - Programa Jvenes Profesionales
El modelo se traduce, a modo prctico, en lo siguiente:

Si se quiere determinar, por ejemplo, la probabilidad de que un cliente con ingresos de


56,2 adquiera (compre) el producto A, esta sera de:

e!11, 449 + 0,23756,2


p = = 0, 867 Interpretacin:
1 + e!11, 449 + 0,23756,2
De la misma tabla final se puede utilizar el criterio del test de Wald para determinar que
las variables utilizadas en el modelo (constante y nivel de ingresos), son
Es decir, la probabilidad de que un cliente con ingresos de 56,2 adquiera el producto A estadsticamente distintas de cero. Para ello existen dos criterios. El primero es ver si el
es de un 86,7%. valor Wald es mayor que 4 y si es as, se puede asumir que las variables son
estadsticamente diferentes de cero. La segunda opcin es utilizando el criterio del valor
p, que en este caso (0,01) es menor que 0,05, por lo que tambin se puede asumir que
Adems se puede determinar la ventaja entre adquirir el producto y no adquirirlo para las variables son distintas de cero (o estadsticamente vlidas).
la misma persona (ingresos de 56,2), y eso vendra dado por:

= e"11, 449 + 0,23756,2 = 6, 527


!

Lo anterior significa que un cliente con ingresos de 56,2 tiene una preferencia por
comprar el producto 6,527 veces mayor que por no comprarlo.

Pgina 57
CAPTULO 11
Anlisis Discriminante

Pgina 58
Mdulo Bsico SPSS - Programa Jvenes Profesionales
Ejemplo Prctico:
Anlisis Discriminante
Los responsables de la empresa "A" s.a. estudian la planificacin de su estrategia
comunicacional para el ao 2009. El jefe de comunicacin sabe que hay una relacin
muy estrecha entre los resultados en trminos monetarios que consigue una empresa y
El anlisis discriminante es una tcnica que permite encontrar funciones capaces de el manejo de su estrategia de comunicacin. Este directivo desea saber ms
separar dos o ms grupos de individuos, tomando como base un conjunto de medidas informacin sobre los factores, derivados de su estrategia de comunicacin, que sirvan
sobre los mismos representadas por una serie de variables. Dichas funciones para discriminar entre las empresas segn sus resultados.
discriminan o identifican grupos, definidos por una variable dependiente.
Se dispone de un estudio en el que figura informacin relativa a 35 empresas
Bsicamente se trata de una tcnica de reduccin de datos que indica cuando un dato competidoras, 18 de las cuales tuvieron resultados que se pueden catalogar como
debe pertenecer a un grupo y cuando debe pertenecer a otro grupo. bajos y 17 tuvieron resultados que se puede considerar como medios. La base de
datos contiene informacin acerca de: Duracin en das de las actividades publicitarias
Como se indic antes, al anlisis discriminante permite encontrar una funcin que ayuda de la empresa, duracin en das de las actividades promocionales de la empresa,
a discriminar los datos, para ello se utiliza la siguiente funcin: incremento (%) en el presupuesto publicitario respecto al periodo anterior, incremento
(%) en el presupuesto promocional respecto al periodo anterior, inversin (millones de
euros) en actividades de patrocinio en el ao 2007 y resultados monetarios obtenidos.

D = a0 + a1 X1 + a2 X2 + ... + a p X p La base de datos se encuentra disponible en el archivo BaseDatosC11.sav

Donde:
1. Al tratarse de una tcnica de
X son los valores de las variables independientes y ap son los coeficientes estimados en clasificacin de datos, para
la base de datos. acceder al anlisis discriminante se
debe ir al men Analizar y
Si bien es cierto que lo anterior puede parecer un tanto engorroso, a continuacin se posteriormente seleccionar
explicar en trminos prcticos (mediante la resolucin de un ejemplo), la utilizacin de Clasificar y finalmente escoger
este tipo de anlisis. la opcin Discriminante.

La ventana de la izquierda muestra


NOTA: Este tipo de anlisis conlleva la utilizacin de cierto tipo de clculo (anexo a los grficamente la forma de acceder
resultados entregados por el Software), el cual ser explicado en la medida que vayan a dicho anlisis.
apareciendo los resultados. Esto principalmente para evitar confundir al lector con tanta
frmula en los encabezados.

Pgina 59
Mdulo Bsico SPSS - Programa Jvenes Profesionales
2. Una vez abierto el cuadro de 4. De manera de obtener mejores
dilogo del anlisis discriminante, resultados, se recomienda, en la
se debe ingresar las variables que ventana principal, hacer clic en el
se utilizarn. En este caso, la botn Estadsticos, lo que abrir
variable dependiente (RESULTAD) una ventana como la que se
debe ir donde dice Variable de observa a la izquierda. Ah se debe
agrupacin, mientras que las seleccionar donde dice Medias y
variables independientes, van bajo ANOVAs univariados, de manera
la etiqueta Independiente, tal que aparezcan en los resultados.
como se observa en la figura.
Una vez listo, hacer clic en
Si se observa con detalle, la Continuar.
variable dependiente presenta
unos signos de interrogacin (??),
para ello debemos definir su rango
de accin. As que hay que 5. Una vez hecho clic en el botn
presionar donde dice Definir continuar, se volver a la ventana
rango.... inicial. Una vez ah, se sugiere
hacer clic en el botn Clasificar.
Cuando abra el cuadro de dilogo,
se debe seleccionar donde dice
3. Debido a que la variable Tabla de resumen que entregar
Resultado poda tomar los un cuadro que ser til para la
valores 1 y 2 (revisar en la base de correcta visualizacin de los
datos), esos valores deben ser resultados.
ingresados como Mnimo y
Mximo respectivamente. Una vez listo se debe hacer clic en
el botn Continuar y ya se
Ojo que los valores ingresados aqu encuentra listo para realizar el
dependen de los valores que anlisis
posea la variable dependiente en la
base de datos (en este caso son 1
y 2, que corresponden a resultados
Bajos y Resultados Medios).

Una vez que los valores estn


ingresados se debe hacer clic en el
botn Continuar.

Pgina 60
Mdulo Bsico SPSS - Programa Jvenes Profesionales
IMPORTANTE:

Antes de proceder a analizar los resultados, se debe saber que este tipo de anlisis
arroja una gran cantidad de tablas, las que a menudo no resultan tiles para extraer
informacin de ellas. Para efectos prcticos, solamente se analizarn aquellas tablas
que ofrezcan informacin relevante para la toma de decisiones, mientras que otro tipo
de tablas sern omitidas de anlisis.
Interpretacin:

El criterio del Lambda de Wilks permite al investigador determinar si el modelo es


vlido. Para ello utiliza el estadstico conocido como Lambda de Wilks. De acuerdo al
criterio del valor p, se puede asumir que el modelo es estadsticamente vlido, debido a
que Sig. = 0,000, lo que es menor que 0,05 (que es el valor generalmente usado para
contrastar y que corresponde a un 96% de confianza).

Interpretacin:

Los coeficientes mencionados en la tabla de la


izquierda corresponden a los coeficientes que
se deben utilizar en la ecuacin discriminante,
la que fue definida en forma terica al
comienzo de este captulo.

Utilizando esta informacin, la funcin


discriminante quedara de la siguiente manera:
Interpretacin:

La tabla que se muestra arriba, lo que hace es indicar al investigador el poder


discriminante de cada variable por separado. Para ello usa una prueba F y mediante el
criterio del valor p, se puede asumir que solamente una variable no tiene poder
discriminante por si sola. Esta variable es Inversin (En millones de euros) en
actividades de patrocinio en el ao 2007 (Sig. = 0,352 > 0,05). Por ende esta variable
no debiese ser utilizada en el modelo.

Pgina 61
Mdulo Bsico SPSS - Programa Jvenes Profesionales

D = 0, 675 X1 + 0, 586 X 2 + 0,197 X 3 ! 0, 225 X 4 Reemplazando se tiene que:

Donde:
[(18i(!1, 484)) + (17i1, 571)]
X1: Duracin de las actividades promocionales de la empresa. P0 = "0
X2: Duracin en das de las actividades publicitarias de la empresa. 18 + 17
X3: Incremento (%) en el presupuesto promocional con respecto al ejercicio anterior.
X4: Incremento (%) en el presupuesto publicitario con respecto al ejercicio anterior.

Se debe recordad que la variable Inversin (en millones de euros) en actividades de


patrocinio no debe ser incluida en el modelo por no poseer poder discriminante por si Interpretacin:
sola, de acuerdo a lo que se mencion anteriormente.
Como el valor de corte tiende a ser Cero, se puede decir entonces que se clasificar
a un individuo en el grupo 1 (resultados bajos), si su resultado discriminante (si el valor
D obtenido de procesar sus datos por la funcin discriminante) fuese menor que cero, y
se clasificara dentro del grupo 2 (resultados medios), si su resultado discriminante
fuese mayor que cero.

Interpretacin:

Para determinar el valor de corte (el que dir al investigador cuando clasificar en un
grupo y cuando hacerlo en el otro), se debe utilizar la siguiente ecuacin, la que a su vez
debe utilizar los valores de los centroides (indicados en la tabla superior):

naCa + nbCb
P0 = Interpretacin:
na + nb
Finalmente, el software entrega un recuento, el que solamente indica que la funcin
discriminante anteriormente elaborada es capaz de clasificar correctamente un 94,3%
Donde na y nb corresponde a la cantidad de datos que se encuentran actualmente en de los casos.
uno u otro grupo de clasificacin (en este caso con resultados medios o bajos. Para ello
se debe revisar el encabezado del problema, Mientras que Ca y Cb corresponde al valor
de los centroides.
Pgina 62
CAPTULO 12
Anlisis Factorial

Pgina 63
Mdulo Bsico SPSS - Programa Jvenes Profesionales
En el campo del Marketing el anlisis Factorial se puede aplicar en:
Anlisis Factorial
Investigaciones sobre productos y atributos determinantes.
Investigaciones sobre imagen corporativa de productos o marcas.
Identificacin de grupos de consumidores (Segmentacin).
Hay circunstancias en que el investigador posee una gran cantidad de variables que Estudios sobre precios.
debe analizar y agrupar, como por ejemplo el conjuntos de caractersticas comunes a
ciertos productos o lugares que sean propios de estos.
A continuacin se presentar un ejemplo prctico que indica la forma de aplicar, utilizar
Para poder hacer este tipo de ordenamiento o reduccin de variables, existen mtodos e interpretar este tipo de anlisis.
como el anlisis factorial, en el cual se parte de una gran nmero de variables y se trata
de averiguar si estas tienen algn pequeo nmero de factores en comn que expliquen
(bsicamente) lo mismo que las variables observables al inicio.

Dicho de otra manera, el anlisis factorial sirve como ayuda al investigador para Ejemplo Prctico (Adaptado del libro Tcnicas de Investigacin de Mercado de
comprender mejor la composicin de determinados fenmenos complejos, mediante la Teodoro Luque):
separacin de factores caractersticos para cada uno de estos fenmenos.

En anlisis factorial cuenta de 4 fases caractersticas: Para la toma de determinadas decisiones comerciales a nivel nacional puede interesar
sintetizar las principales caractersticas socioeconmicas del conjunto de capitales de
Clculo de una matriz capaz de expresar la variablilidad (varianza) conjunta de las provincia espaolas. Se trata de identificar las dimensiones relevantes que describen a
variables. las capitales de provincia espaolas. De esta forma conseguiremos un nmero ms
La extraccin de un nmero ptimo de factores. reducido y operativo de variables, y para ello parece oportuno plantear un anlisis
La rotacin de la solucin para facilitar su interpretacin. factorial.
La estimacin de las puntuaciones de los sujetos en las nuevas dimensiones.
Las variables se han seleccionado de la publicacin Anuario del Mercado Espaol del
Un aspecto importante de este tipo de tcnicas de reduccin de datos es que la ao 1992. Estn relacionadas con la poblacin, situacin econmica e indicadores
decisin de incluir ciertos factores dentro del anlisis depender nicamente de sus comerciales y econmicos. Las variables se detallan a continuacin:
criterios personales, por lo que este tipo de anlisis solo sirve para orientar al
investigador en la forma en que ordena la informacin.

En general, las grandes aplicaciones del anlisis factorial se resumen en:


Variable Descripcin

Reduccin de Informacin. ndice turstico calculado sobre una base nacional de


TURISMO
Identificacin de estructuras subyacentes. 100.000 unidades.
Como paso intermedio en la obtencin de nuevas variables intercorrelacionadas
para utilizar en posteriores anlisis. Cuota de mercado referida a una base nacional de
CUOTA
100.000 unidades

Pgina 64
Mdulo Bsico SPSS - Programa Jvenes Profesionales

Variable Descripcin

ICC1 Indice primario de capacidad de compra METALHAB Idem calificables dentro del grupo 6

ICC2 Indice segundo de capaidad de compra

ICC3 Indice tercero de capacidad de compra MAQUINHA Idem calificables dentro del grupo 7
Indice cultural calculado sobre una base nacional de
CULTURAL
100.000 unidades

Indice demogrfico, referido a una base de 100.000


DEMOGRAF
unidades
La base de datos de este ejemplo se encuentra en el archivo BaseDatosC12.sav.
ECONOMIC Indice econmico

RACTIVA Indice de riqueza activa

TLFHABIT Nmero de telfonos por cada 100.000 Hb.

Nmero de alumnos matriculados en EGB por cada


EGBHABIT
100.000 habitantes

Nmero de licencias fiscales calificables dentro del


TEXTILHA
grupo 2 de actividades comerciales

MADERHAB Idem calificables dentro del grupo 3

QUIMHAB Idem calificables dentro del grupo 4

CONSTHAB Idem calificables dentro del grupo 5

Pgina 65
Mdulo Bsico SPSS - Programa Jvenes Profesionales
1. El anlisis factorial es una tcnica 3. Primero se debe hacer clic donde
de reduccin de datos, por ende, dice Descriptivos... y seleccionar
para acceder a el, es necesario ir al las opciones Solucin Inicial,
men Analizar y posteriormente KMO y prueba de esfericidad de
Reduccin de datos. Finalmente Bartlett y Anti-imagen.
se debe hacer clic donde dice
Anlisis factorial.... Una vez seleccionadas todas las
opciones descritas (como muestra
la figura), se debe hacer clic en el
botn Continuar

2. Debido a que el anlisis factorial


no es una tcnica de dependencia 4. Posteriormente, se debe hacer
(es decir que no hay variables clic en el botn Rotacin... (en la
dependientes), solo se debe ventana principal) y se debe
agregar las variables que se desee seleccionar la opcin Varimax y se
introducir, las que en este caso debe pedir mostrar la solucin
corresponde a la totalidad de las rotada.
variables de la base de datos.
Lo anterior responde a que en
Una vez ingresadas las variables ocasiones SPSS no muestra
(como muestra la figura de la claramente la distribucin de las
izquierda), se debe agregar algunas caractersticas en los factores, por
opciones a los resultados de lo que se debe rotar el anlisis de
manera que sea ms fcil manera de obtener resultados ms
comprender los resultados. claros.

Las opciones estn disponibles en


los botones de la zona inferior del
cuadro de dilogo (recuadro rojo).

Pgina 66
Mdulo Bsico SPSS - Programa Jvenes Profesionales

NOTA IMPORTANTE:

Al igual que lo sucedido con el anlisis discriminante, la ventana de resultados despliega


mucha informacin que puede no resultar relevante para el estudio que se desee
realizar. A continuacin solamente se presentarn las tablas de respuesta que resultan
tiles para la realizacin de anlisis y para el correcto ordenamiento de los factores.

Interpretacin:

Interpretacin: La tabla que se presenta en la parte superior, se puede observar la descomposicin de


la varianza por parte de los distintos factores. Como se puede observar, en la parte
El anlisis del valor KMO (0,774) y el test de esfericidad de Bartlett (1.613), muestra una superior se muestra que hay 4 factores que explican el 89,021% de la varianza total,
cierta estructura de correlacin entre las variables, la que puede ser verificada con en mientras que el resto de los factores solamente aportan con el 11%, por lo que
anlisis de las matrices de correlaciones antiimagen, que es una tabla que no se debiesen ser desechados.
presentar en este documento, pero que el investigador puede observar.
En el cuadro rojo se observa cuales son los cuatro factores en los que se puede
simplificar el anlisis.

Pgina 67
Mdulo Bsico SPSS - Programa Jvenes Profesionales

Interpretacin:
Interpretacin:
Una vez con la matriz de
La matriz de componentes muestra componentes rotados, se puede
la forma en que se debe determinar con mayor facilidad la
descomponer cada una de las forma de incluir cada variable en
variables (en otras palabras, indica cada factor (componente). Para ello
que variable debe ser asignada a hay que ver para cada uno de los
cada factor). Sin embargo, se componentes, cuales son las
puede notar que el factor 1 variables que presentan valores ms
(Componente 1) posee un gran altos.
nmero de cargas elevadas (con un
valor alto), por lo que para obtener El factor 1, posee las siguientes
informacin ms clara se debe variables (ntese que todas las
utilizar una matriz de componentes seleccionadas poseen un valor alto):
rotada (rotacin varimax).
ndice turstico.
A priori, esta tabla no sirve de Cuota de mercado.
mucho al investigador, solamente ndice cultural.
debe ser analizada utilizando la ndice demogrfico.
matriz de componentes rotada. ndice econmico.
ndice de riqueza activa.

Pgina 68
Mdulo Bsico SPSS - Programa Jvenes Profesionales
Interpretacin: Interpretacin:

Nuevamente, en la matriz de Para seleccionar las variables


componentes rotados, se debe correspondientes al factor 3, se
observar el resto de los factores. En vuelve a utilizar el criterio del valor
este caso, se vern las variables ms alto. De acuerdo a esto, las
correspondientes al Factor 2 variables seleccionadas para el
(Componente 2). Utilizando el factor 3 (Componente 3) son:
mismo criterio que en el anterior
caso, se debe escoger las variables ndice primero de capacidad de
que posean los valores altos. De compra.
acuerdo a lo anterior, las variables ndice segundo de capacidad de
seleccionadas para el segundo compra.
factor son las siguientes: ndice tercero de capacidad de
compra.
Nmero de licencias para
industria textil (cada 100.000
hb.).
Nmero de licencias para
industria madera (cada 100.000
hb.).
Nmero de licencias para
industria qumica (cada 100.000
hb.).
Nmero de licencias para
industria construccin (cada
100.000 hb.).
Nmero de licencias para
industria metlica (cada 100.000
hb.).
Nmero de licencias para
maquinarias (cada 100.000
hb.).

Pgina 69
Mdulo Bsico SPSS - Programa Jvenes Profesionales
Interpretacin:

Finalmente, el cuatro factor esta


compuesto solamente por una
variable, esta es el nmero de
alumnos matriculaddos en EGB.

Analizando la composicin de los cuatro factores detectados, se puede asumir que el


factor 1 corresponde a aspectos socio-econmicos, el factor 2 corresponde a
aspectos relacionados con las licencias industriales, el factor 2 corresponde a
capacidad de compras y el factor 2 corresponde a aspectos educacionales.

Los nombres asignados a cada uno de los factores deben ser asignados por el propio
investigador de acuerdo a sus propios criterios personales y profesionales, en vista de
las variables que incluye cada uno de los factores determinados.

Pgina 70

También podría gustarte