Estadistica Aplicada Con SPSS

ESTADÍSTICA APLICADA
CON SPSS
Alfonso García Pérez

2 ESTADÍSTICA APLICADA CON SPPS
Copyright © 2005 Alfonso García Pérez
``No está permitida la reproducción total o parcial de este

libro, ni su tratamiento informático, ni la transmisión de
ninguna forma o por cualquier medio, ya sea electrónico,
mecánico, por fotocopia, por registro u otros medios, sin el
permiso previo y por escrito de los titulares del Copyright.
El contenido de este libro está registrado por el autor en el
Registro de la Propiedad Intelectual y protegido por la Ley,
que establece penas de prisión además de las correspondientes
indemnizaciones para quien lo plagiara"
Edita: Universidad Nacional de Educación a Distancia

ALFONSO GARCÍA PÉREZ 3
Contenido
Prólogo………………………………………………………. 5
Capítulo 1: Introducción al SPSS ……………………… 7
Capítulo 2: Análisis de Componentes Principales ….. 11
Capítulo 3: Análisis de Correspondencias …..……….. 15
Capítulo 4: Escalado Multidimensional ……..………... 21
Capítulo 5: Análisis de Conglomerados………..……… 27
Capítulo 6: Análisis de Discriminante …………............ 35
Capítulo 7: Análisis Factorial ……………………........... 41
Capítulo 8: Modelos Log-lineales …………………........ 43
Capítulo 9: Regresión Logística ……..……………........ 51
Capítulo 10: Regresión Poisson …....….…………......... 57
Capítulo 11: Regresión no Lineal..…..………….…........ 63
Capítulo 12: Análisis de la Varianza con Medidas
Repetidas ……….……..…..……….……… 67
Capítulo 13: Análisis de Series Temporales….…......... 73
Capítulo 14: Control Estadístico de la Calidad…......... 81
Prólogo
El presente libro es la segunda parte de la tercera Unidad Didáctica del curso

Métodos Avanzados de Estadística Aplicada, dedicada al estudio del
Tratamiento Informático.
Como se indicaba en la introducción de la primera parte, la gran implantación

de SPSS como software de trabajo por muchos usuarios, nos ha llevado a
dedicar un volumen entero a este paquete estadístico.
No obstante, ya adelantamos que no es exhaustivo en cuanto al análisis de

todos los Métodos a los que dicho paquete se puede aplicar, ya que la mejor
manera de aprenderlo es utilizarlo y, en la mayoría de las ocasiones, los
comentarios resultan redundantes ante la sencillez de manejo de este software.
Lo que advertimos es que, como ya pasaba con BMDP o SAS, sólo se van a
poder ejecutar, básicamente, Métodos Clásicos con este software, debiendo
utilizarse el software enviado por el curso para la ejecución de Métodos
Robustos y de Remuestreo.
Ya que los ejemplos que analizaremos en este texto son los del libro Métodos
Avanzados de Estadística Aplicada. Técnicas Avanzadas, no repetiremos aquí
los enunciado de dichos ejemplos, indicándolos con la abreviatura TA y el
número del ejemplo correspondiente.
Por último, le recordamos que puede ver más grandes la figuras utilizando el
zoom de su pdf.
Alfonso García Pérez

agar-per@ccia.uned.es
Capítulo 1
Introducción al SPSS
1.1. Introducción
Una de las características más destacadas de SPSS (en especial con
respecto a BMDP o SAS) es que no es necesario conocer un lenguaje de
programación para utilizarlo (aunque lo tiene). Su exitosa presentación de
“Métodos Estadísticos a ejecutar” en forma de persianas, permite comenzar a
utilizarlo casi sin conocimientos previos del paquete.
Por esta razón, este texto será simple y breve ya que, sin duda, la mejor
manera de aprende a manejar SPSS es utilizarlo.
1.2. El editor de datos
Lo primero que analizaremos es cómo introducir los datos de nuestro

problema, definiendo las variables a analizar con posterioridad.
Al abrir el paquete SPSS nos aparece un cuadro como el de la Figura 1.1,
en el que, si queremos ir tecleando los datos, elegiremos la opción Introducir
datos, apareciendo, a continuación el editor de datos en blanco en el que
debemos introducir los datos observados en el primer individuo de la primera
variable en la primera fila de la primera columna.
Para ir viendo cómo funciona el editor de datos, vamos a considerar un
ejemplo que analizaremos más adelante cuando estudiemos los modelos log-
lineales.
Ejemplo 8.1-TA ___________________________________________
En los modelos log-lineales, las variables deben ser categóricas; es decir,

deben definir categorías en las que clasificar los datos, pero ya veremos que
esto lo haremos antes de ejecutar el análisis en cuestión. Nosotros, de
momento, utilizaremos datos de tipo numérico. Para ello, lo más simple es ir
introduciendo los datos y más tarde, modificar, si es necesario, sus
propiedades.
Figura 1.1
Para el ejemplo en cuestión, incluiremos (por este orden) datos de las tres
variables: la variable Edad, con tres valores, 1 para los individuos menores de
20 años, 2 para los individuos entre 20 y 50 años y 3 para los individuos
mayores de 50 años.
Para la variable Sexo, dos valores, 0 para los hombres y 1 para las mujeres.
Y, finalmente, la variable Fumador, con dos valores, 0 para los individuos
que no fuman y 1 para los que sí fuman.
Así, los datos de los individuos de la tabla anterior serán los de la Figura 1.2.
Figura 1.2
Con objeto de introducir el nombre de las variables, pincharemos con el Ratón

la pestaña de abajo Vista de variables, apareciendo un panel como el de la
Figura 1.3. Pinchando el 1, podremos teclear el nombre de las tres variables

así como sus principales características. Volveremos al editor de datos
pinchando en la pestaña inferior, Vista de datos.
Figura 1.3
En la barra de arriba (en Archivo) deberemos salvar nuestro fichero de datos.
Si nuestros datos están ya en un archivo, debemos incluirlos en el Editor de

datos con la opción: Archivo → Abrir → Datos (Figura 1.4)
Figura 1.4
Capítulo 2
Análisis de Componentes Principales
2.1. Análisis de Componentes Principales
El Análisis de Componentes Principales se obtiene ejecutando la secuencia:

Analizar → Reducción de datos → Análisis Factorial (Figura 2.1).
Figura 2.1
Una vez incluidas todas las variables a utilizar en el Análisis, incluyéndolas

en el cuadro de la derecha con la flecha, es importante comprobar que en
Extracción se utilice la opción Componentes Principales y Gráfico de
sedimentación (Figura 2.2). Una vez seleccionadas éstas, SPSS se ejecuta
con el botón Aceptar que aparece en dicha Figura 2.2.
Ejemplo 2.1-TA ___________________________________________
Si ejecutamos la secuencia anterior con los datos del Ejemplo 2.1 del texto
Técnicas Avanzadas, se obtienen los siguientes resultados. En [1] y [2] puede
verse la variación explicada por cada componente principal.
A continuación aparece lo que SPSS denomina Gráfico de sedimentación y
que en TA denominamos Gráfico de desmoronamiento.
Por último, en [3] aparecen las Componentes Principales, con coeficientes
algo distintos de los que obteníamos en TA pero, por supuesto, con la misma
interpretación.
Figura 2.2
A. factorial
Comunalidades
Inicial Extracción
X1 1,000 ,973
X2 1,000 ,747
X3 1,000 ,817
X4 1,000 ,862
X5 1,000 ,945
X6 1,000 ,597
X7 1,000 ,781
X8 1,000 ,969
Método de extracción: Análisis de Componentes principales.
Varianza total explicada
Sumas de las saturaciones al cuadrado

Autovalores iniciales de la extracción
% de la % de la
Componente Total varianza % acumulado Total varianza % acumulado
1 2,686 33,577 33,577 2,686 33,577 33,577
2 1,862 23,275 56,852 1,862 23,275 56,852
3 1,112 13,905 70,757 1,112 13,905 70,757
4 1,030 12,881 83,637 1,030 12,881 83,637
5 ,619 7,740 91,377
6 ,367 4,591 95,968
7 ,277 3,467 99,436
8 ,045 ,564 100,000
Método de extracción: Análisis de Componentes principales.
[1] [2]
Gráfico de sedimentación
3,0
2,5
2,0
Autovalor
1,5
1,0
0,5
0,0
1 2 3 4 5 6 7 8
Número de componente
Matriz de componentes(a)
Componente
1 2 3 4
X1 ,753 ,450 ,445 -,070
X2 -,704 ,363 ,093 -,332
X3 -,113 ,872 -,176 ,118
X4 ,064 ,764 -,443 ,279
X5 ,803 ,273 ,470 -,078
X6 ,629 -,159 -,392 ,149
X7 -,719 ,255 ,445 ,026
X8 -,222 -,140 ,326 ,891
Método de extracción: Análisis de componentes principales.
a 4 componentes extraídos
[3]
Los resultados obtenidos al ejecutar SPSS son ficheros que pueden ser
salvados y reutilizados.
2.2. Sintaxis de SPSS
Aunque la forma habitual de utilizar SPPS (al menos en una primera

aproximación al paquete) es mediante las persianas de la barra de comandos
superior, SPSS puede ser utilizado a través de un lenguaje de programación
como lo era SAS o BMDP. Este lenguaje SPSS se llama Sintaxis SPSS.
Si observamos de nuevo la Figura 2.2, vemos un botón denominado Pegar.

Si lo hubiéramos seleccionado, obtendríamos el Programa
FACTOR
/VARIABLES X1 X2 X3 X4 X5 X6 X7 X8 /MISSING LISTWISE /ANALYSIS X1 X2 X3 X4 X5
X6 X7 X8
/PRINT INITIAL EXTRACTION
/PLOT EIGEN
/CRITERIA MINEIGEN(1) ITERATE(25)
/EXTRACTION PC
/ROTATION NOROTATE
/METHOD=CORRELATION .
Este Programa SPSS ejecuta lo mismo que el botón Aceptar de dicha

Figura 2.2 y puede ser salvado, modificado y reutilizado, de manera que una
forma de ejecutar SPSS reiteradamente sin tener que ir completando las
diversas ventanas de diálogo de las persianas SPSS, es utilizar directamente
Sintaxis SPSS. Además, esta Sintaxis puede modificarse adecuándola
precisamente a aquello en lo que estamos interesados, pudiendo unirse varios
Programas en una sola Sintaxis.
Capítulo 3
Análisis de Correspondencias
3.1. Análisis de Correspondencias
La explicación detallada de este tipo de análisis aparece en el capítulo 3 del

texto TA. Explicaremos su ejecución siguiendo el ejemplo 3.2 de dicho texto.
Ejemplo 3.2-TA ___________________________________________
La primera observación que debemos hacer es sobre el manejo de los datos.

SPSS requiere que los “valores” de las dos variables sean de tipo numérico
pero, por otro lado, éstas tienen un marcado acento de “etiqueta”. Además,
como los datos se refieren a tablas de frecuencia, no vamos a introducir los,
para este ejemplo, 6851 datos uno a uno.
Figura 3.1
Lo haremos mediante una variable de frecuencia a la que hemos denominado

Pondera. De ahí que el Editor de datos para este ejemplo sea el de la Figura
3.1. Pero observemos cómo hemos trabajado la opción de la pestaña Vista de
variables en la Figura 3.2, dando nombres a los valores de las variables.
Figura 3.2
Ahora ya tenemos preparados los datos para realizar un Análisis de

Correspondencias. Para ello ejecutaremos la secuencia:
Analizar → Reducción de datos → Análisis de correspondencias (Figura 3.3).
Figura 3.3
En el análisis hemos utilizado las opciones que aparecen en la Figura 3.4.

Resaltamos que debemos codificar las variables que forman la tabla, como se
indica en el panel de la izquierda, y que con el botón Modelo obtenemos el
cuadro de diálogo de la derecha, en donde se ve que la solución que buscamos
es de dos dimensiones y que utilizamos una distancia chi-cuadrado.
Figura 3.4
Con estas opciones obtenemos los siguientes resultados,
Correspondencias
Tabla de correspondencias
Bebe
Madre pm pv gcm gcv Margen activo
jnf 50 315 24 4012 4401
jf 9 40 6 459 514
mnf 41 147 14 1594 1796
mf 4 11 1 124 140
Margen activo 104 513 45 6189 6851
[1]
Resumen
Proporción de inercia Confianza para el Valor
Corre
Desviación
Dimensión Valor propio Inercia Chi-cuadrado Sig. Explicada Acumulada típica
1 ,050 ,003 ,908 ,908 ,013
2 ,016 ,000 ,087 ,995 ,015
3 ,004 ,000 ,005 1,000
Total ,003 19,109 ,024(a) 1,000 1,000
a 9 grados de libertad
[2]
Examen de los puntos de fila(a)
Puntuación en la dimensión Contribución
De los puntos a la inercia

de la dimensión De la dimensión a la inercia del
Madre Masa 1 2 Inercia 1 2 1 2

jnf ,642 -,165 -,015 ,001 ,347 ,009 ,997 ,003
jf ,075 ,190 ,418 ,000 ,054 ,840 ,400 ,599
mnf ,262 ,313 -,063 ,001 ,511 ,066 ,986 ,012
mf ,020 ,465 -,253 ,000 ,088 ,084 ,877 ,081
Total activo 1,000 ,003 1,000 1,000
a Normalización Simétrica
Examen de los puntos columna(a)
Puntuación en la dimensión Contribución
De los puntos a la inercia

de la dimensión De la dimensión a la inercia del
Bebe Masa 1 2 Inercia 1 2 1 2

pm ,015 1,562 -,360 ,002 ,736 ,126 ,983 ,016
pv ,075 ,265 -,008 ,000 ,105 ,000 ,960 ,000
gcm ,007 ,899 1,441 ,000 ,106 ,873 ,556 ,443
gcv ,903 -,055 -,004 ,000 ,054 ,001 ,994 ,001
Total activo 1,000 ,003 1,000 1,000
a Normalización Simétrica
Puntos de columna y de fila
Simétrica Normalización
1,5
gcm Bebe
Madre
1,0
Dimensión 2
0,5
jf
pv
0,0 jnf gcv
mnf
mf
pm
-0,5
-0,2 0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6
Dimensión 1
[3]
En [1] puede comprobarse que la tabla de doble entrada ha sido bien

creada. La inercia acumulada puede verse en [2] . A continuación aparecen
las coordenadas suministradas pos SPSS (algo distintas que las obtenidas con
el software del curso) y, por último, en [3] , el gráfico, principal objetivo del
Análisis, ampliamente comentado en TA.
Capítulo 4
Escalado Multidimensional
4.1. Escalado Multidimensional

El Escalado Multidimensional fue tratado en el capítulo 4 de TA. Aquí
estudiaremos cómo ejecutar con SPSS el Escalado Multidimensional Clásico
Métrico mediante la utilización de sus persianas. Para ejecutar los otros tipos
de escalamiento deberemos utilizar la Sintaxis de SPSS.
Ejemplo 4.1-TA ___________________________________________
Analizar → Escalas → Escalamiento multidimensional (ALSCAL). Después de

introducir los datos como aparece en la Figura 4.1, ejecutamos la secuencia
que también aparece en dicha Figura:
Figura 4.1
Se abrirá entonces la ventana de diálogo que aparece en la Figura 4.2, en

donde ya se ve que hemos incorporado todas las variables al análisis.
Ahora debemos modificar algo los dos botones que allí aparecen. En
Modelo completamos los cuadros como en la Figura 4.2, dado el tipo de datos
que tenemos.
Figura 4.2
El botón Opciones le completamos como se indica en la Figura 4.3.
Figura 4.3
Con estas selecciones obtendríamos los resultados que aparecen a

continuación,
Escalamiento multidimensional
Raw (unscaled) Data for Subject 1
1 2 3 4 5
1 ,000
2 7,500 ,000
[1] 3 8,500 2,000 ,000
4 6,000 5,000 7,500 ,000
5 9,500 7,500 8,000 8,000 ,000
6 7,000 5,000 8,500 5,500 6,000
7 8,000 2,000 2,000 7,500 2,000
8 9,500 9,000 9,000 7,000 5,000
9 5,500 5,500 9,000 7,500 7,500
10 8,500 6,000 8,000 8,000 6,500
11 9,500 9,000 7,500 8,000 1,500
12 9,000 6,000 5,500 9,000 2,000
6 7 8 9 10
6 ,000
7 7,500 ,000
8 7,500 2,000 ,000
9 6,000 2,000 2,500 ,000
10 7,500 2,500 6,000 4,500 ,000
11 7,500 3,000 2,000 6,500 5,000
12 9,000 ,500 4,500 6,500 6,000
11 12
11 ,000
12 2,500 ,000
Iteration history for the 2 dimensional solution (in squared distances)
Young's S-stress formula 1 is used.
Iteration S-stress Improvement
[2] 1 ,26241
2 ,20757 ,05484
3 ,18765 ,01992
4 ,17950 ,00815
5 ,17669 ,00281
6 ,17540 ,00129
7 ,17449 ,00091
Iterations stopped because

S-stress improvement is less than ,001000
Stress and squared correlation (RSQ) in distances
RSQ values are the proportion of variance of the scaled data

(disparities)
in the partition (row, matrix, or entire data) which
is accounted for by their corresponding distances.
Stress values are Kruskal's stress formula 1.
For matrix
Stress = ,15209 RSQ = ,85524
Configuration derived in 2 dimensions
Stimulus Coordinates
Dimension
Stimulus Stimulus 1 2
Number Name
1 V1 -2,2273 ,0931
2 V2 -,9499 -,8015
3 V3 -,1722 -1,9273
4 V4 -1,4457 ,4841
5 V5 1,3464 ,2773 [3]
6 V6 -,8397 ,9476
7 V7 ,5210 -,5959
8 V8 ,8699 1,0628
9 V9 -,3767 ,6495
10 V10 ,7265 ,4236
11 V11 1,5429 ,2237
12 V12 1,0047 -,8369
Optimally scaled data (disparities) for subject 1
1 2 3 4 5
1 ,000
2 1,808 ,000
3 2,793 1,342 ,000
4 1,342 1,342 2,553 ,000
5 3,579 2,537 2,677 2,793 ,000
6 1,808 1,342 2,793 1,342 1,808
7 2,793 1,342 1,342 2,244 1,202
8 3,305 2,793 3,166 1,808 1,342
9 1,342 1,342 2,793 1,808 1,808
10 2,793 1,808 2,553 2,553 1,808
11 3,772 2,793 2,553 2,793 ,408
12 3,305 1,808 1,342 2,793 1,166
6 7 8 9 10
6 ,000
7 2,058 ,000
8 1,808 1,342 ,000
9 1,342 1,342 1,342 ,000
10 1,808 1,342 1,342 1,342 ,000
11 2,490 1,342 1,076 1,808 1,342
12 2,793 ,408 1,342 1,808 1,342
11 12
11 ,000
12 1,342 ,000
Configuración de estímulos derivada
Modelo de distancia euclídea
1 V8
V6
V9
V4 V10 V5
Dimensión 2
V11
V1
0
V7
V2 V12
-1
-2 V3
-2 -1 0 1 2
Dimensión 1
[4]
En estos resultados se observa, en [1] , la matriz de distancias. A

continuación, en [2] , aparece el Stress de Young, algo distinto del que
utilizamos en TA pero con el mismo significado.
En [3] aparecen las coordenadas a ser representadas más abajo y, en [4] ,
el gráfico que buscamos con el escalado Multidimensional, algo distinto que el
obtenido en TA pero con la misma interpretación.
Capítulo 5
Análisis de Conglomerados
5.1. Introducción
Como sabemos, existen, básicamente, dos métodos de Análisis Cluster: uno
es el Análisis Jerárquico y otro el Algoritmo k-medias. Analizaremos estos dos
métodos en dos secciones separadas.
5.2. Análisis Jerárquico

Con SPSS es posible realizar los cinco métodos de agrupamiento
estudiados en TA: Agrupamiento simple, Agrupamiento completo,
Agrupamiento promedio, Agrupamiento centroide, y el Método de Ward, así
como utilizar las diversas distancias allí estudiadas. También podemos obtener
el dendograma.
Figura 5.1
Ejemplo 5.6-TA ___________________________________________
Después de introducir los datos como aparece en la Figura 5.1, ejecutamos la

secuencia que también aparece en dicha Figura:
Analizar → Clasificar → Conglomerados jerárquicos
apareciendo un cuadro de diálogo como el de la Figura 5.2, en donde hemos
incluido las dos variables en análisis. También aparecen allí los cuatro botones
en donde tendremos que seleccionar nuestras opciones.
Figura 5.2
Para formar los clusters utilizando un Agrupamiento centroide, seleccionamos

en el botón Método las tres opciones que aparecen en la Figura 5.3,
Figura 5.3
Agrupación de centroides, Distancia Euclídea y que no estandarice los datos

con la opción de Ninguno.
Para este ejemplo, no es necesario pinchar en el botón Estadísticos ni en
Guardar, puesto que las opciones que vienen por defecto son adecuadas.
En el botón Gráficos es necesario indicarle que nos ejecute el Dendograma.
Como en situaciones anteriores, salimos de las ventanas con Continuar.
Después de nuestras selecciones, como siempre, pinchando en el botón
Aceptar, obtenemos los resultados que vienen a continuación,
Conglomerados jerárquicos
Advertencia
La medida euclídea al cuadrado debería emplearse cuando se solicite el método de

conglomeración CENTROID, MEDIAN o WARD.
Resumen del procesamiento de los casos(a,b)
Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
5 100,0 0 ,0 5 100,0
a distancia euclídea usada
b Vinculación de centroides
Vinculación de centroides
Historial de conglomeración
Etapa en la que el
Conglomerado que se conglomerado aparece
combina por primera vez
Conglomer Conglomer Conglomer Conglomer Próxima

Etapa ado 1 ado 2 Coeficientes ado 1 ado 2 etapa
1 4 5 10,770 0 0 4
2 1 3 11,180 0 0 3
3 1 2 10,701 2 0 4
4 1 4 62,556 3 1 0
[1] [3]
Diagrama de témpanos vertical
Caso
Número de
conglomerados 5 4 2 3 1
1 X X X X X X X X X
2 X X X X X X X X
3 X X X X X X X
4 X X X X X X
Dendrograma
* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S *
* * * * *
Dendrogram using Centroid Method
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
4 òûòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòø
5 ò÷ ó
1 òø ó
3 òôòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷
2 ò÷
En ellos se observa, en [1] , en la tabla Historial de conglomeración, como

en la Etapa 1, se unen los elementos 4 y 5. En el paso segundo, Etapa 2, se
unen los elementos 1 y 3. Luego, en la Etapa 3, se une el elemento 2 al
elemento 1; mejor dicho, al cluster en el que está el elemento 1, uniéndose
finalmente el cluster donde está el elemento 4 (primer cluster formado) al
cluster donde está el elemento 1.
El Dendograma que aparece en [2] , corresponde a esa aglomeración y en
él parece que se unen aal principio los elementos casi a la vez. Lo que ocurre
es que las distancias a las que se van uniendo son muy inferiores a la de
aglomeración final, como puede verse en [3] .
5.3. Algoritmo k-medias

El proceso para realizar el algoritmo k-medias es similar al realizado para
ejecutar el análisis jerárquico. Esta vez (Figura 5.4) deberemos ejecutar la
secuencia
Analizar → Clasificar → Conglomerados de K medias

Figura 5.4
Ejemplo 5.6-TA ___________________________________________
Después de introducir los datos y ejecutar la secuencia anterior, incluimos las

dos variables en análisis (Figura 5.5)
Figura 5.5
Con el botón Guardar seleccionamos las dos opciones que permite (Figura 5.6)
Figura 5.6
Con el botón Opciones seleccionamos las marcadas en la Figura 5.7
Figura 5.7
Pulsando los botones Continuar y, finalmente, Aceptar, obtenemos los

resultados que aparecen a continuación, los cuales, lógicamente, son los
mismos que los comentados en TA.
Análisis de conglomerados de K medias
Centros iniciales de los conglomerados
Conglomerado
1 2
talla 189,00 170,00
sueldo 100,00 180,00
Historial de iteraciones(a)
Cambio en los centros

de los conglomerados
Iteración 1 2
1 5,385 8,333
2 ,000 ,000
a Se ha logrado la convergencia debido a que los centros de los conglomerados no presentan ningún
cambio o éste es pequeño. El cambio máximo de coordenadas absolutas para cualquier centro es de ,000.
La iteración actual es 2. La distancia mínima entre los centros iniciales es de 82,225.
Centros de los conglomerados finales
Conglomerado
1 2
talla 187,00 175,00
sueldo 105,00 173,33
ANOVA
Conglomerado Error
Media Media
cuadrática gl cuadrática gl F Sig.
talla 172,800 1 19,333 3 8,938 ,058
sueldo 5603,333 1 55,556 3 100,860 ,002
Las pruebas F sólo se deben utilizar con una finalidad descriptiva puesto que los conglomerados han sido
elegidos para maximizar las diferencias entre los casos en diferentes conglomerados. Los niveles críticos
no son corregidos, por lo que no pueden interpretarse como pruebas de la hipótesis de que los centros de
los conglomerados son iguales.
Número de casos en cada conglomerado
Conglomerad 1 2,000
o 2 3,000
Válidos 5,000
Perdidos ,000
Capítulo 6
Análisis Discriminante
6.1. Análisis Discriminante

El Tratamiento Informático de Análisis Discriminante que ejecuta SPSS es
algo distinto que el estudiado en el capítulo 6 de TA.
Figura 6.1
Ejemplo 6.1-TA ___________________________________________
Después de introducir los datos ejecutamos la secuencia que aparece en la

Figura 6.1:
Analizar → Clasificar → Discriminante
Apareciendo el cuadro de diálogo que aparece en la Figura 6.2, en donde se ha

incluido la variable X6 en Variable de agrupación por ser ésta la que determina
los dos grupos que componen los datos.
Figura 6.2
Las otras variables, X1, …,X5 se incluyen en la ventana Independientes. Si se

quiere obtener la Función Discriminante lineal de Fisher, se debe seleccionar
esta opción en el botón Estadísticos (Figura 6.3).
Figura 6.3
Con esta selección obtendríamos los siguientes resultados,

Discriminante
Resumen del procesamiento para el análisis de casos
Casos no ponderados N Porcentaje

Válidos 32 100,0
Excluidos Códigos de grupo
perdidos o fuera de 0 ,0
rango
Perdida al menos una
variable discriminante 0 ,0
Perdidos o fuera de
rango ambos, el
código de grupo y al
0 ,0
menos una de las
variables
discriminantes.
Total excluidos 0 ,0
Casos Totales 32 100,0
Estadísticos de grupo
N válido (según lista)

No
x6 ponderados Ponderados
1,0 x1 17 17,000
x2 17 17,000
x3 17 17,000
x4 17 17,000
x5 17 17,000
2,0 x1 15 15,000
x2 15 15,000
x3 15 15,000
x4 15 15,000
x5 15 15,000
Total x1 32 32,000
x2 32 32,000
x3 32 32,000
x4 32 32,000
x5 32 32,000
Análisis 1
Resumen de las funciones canónicas discriminantes
Autovalores
Correlación
Función Autovalor % de varianza % acumulado canónica
1 ,930(a) 100,0 100,0 ,694
a Se han empleado las 1 primeras funciones discriminantes canónicas en el análisis.
Lambda de Wilks
Contraste de Lambda de
las funciones Wilks Chi-cuadrado gl Sig.
1 ,518 18,083 5 ,003
Coeficientes estandarizados de las funciones discriminantes canónicas
Función
1
x1 ,367
x2 -,578
x3 -,017
x4 ,405
x5 ,627
Matriz de estructura
Función
1
x4 ,830
x1 ,759
x5 ,578
x3 ,246
x2 -,048
Correlaciones intra-grupo combinadas entre las variables discriminantes y las funciones discriminantes
canónicas tipificadas Variables ordenadas por el tamaño de la correlación con la función.
Funciones en los centroides de los grupos
Función
x6 1
1,0 -,877
2,0 ,994
Funciones discriminantes canónicas no tipificadas evaluadas en las medias de los grupos
Estadísticos de clasificación
Coeficientes de la función de clasificación
x6
1,0 2,0
x1 1,468 1,558
x2 2,361 2,205
x3 2,752 2,747
x4 ,775 ,952
x5 ,195 ,372
(Constante) -514,956 -545,419
Funciones discriminantes lineales de Fisher
[1]
Al final de dichos resultados, en [1] , aparecen los coeficientes cuya

diferencia son los obtenidos en TA: 1,468-1,558 = -0’09, 2,361-2,205=0’156,
2,752-2,747=0’005, 0,775-0,952=-0’177, 0,195-0,372=-0’177.
Capítulo 7
Análisis Factorial
7.1. Análisis Factorial

La ejecución del Análisis Factorial con SPSS se lleva a cabo ejecutando la
siguiente secuencia
Analizar → Reducción de datos → Análisis factorial
Como se indica e la Figura 7.1. No obstante, como no hemos dedicado mucho

espacio en el texto de TA a este tipo de análisis no lo desarrollaremos aquí
tampoco.
Figura 7.1
Capítulo 8
Modelos Log-lineales
8.1. Modelos Log-lineales

El estudio de este tipo de modelos puede seguirse en el capítulo 8 del texto
TA. La forma de introducir los datos del ejemplo que sigue fue explicada en el
capítulo 1 de este texto.
Ejemplo 8.1-TA ___________________________________________
Después de introducir los datos ejecutamos la secuencia

:
Analizar → Loglineal → Selección de modelo
Figura 8.1
A continuación nos aparecerá un ventana de diálogo como la de la Figura

8.2, en la que incluiremos todas la variables en la ventana Factores,
delimitando el rango de cada una de las variables con el botón Definir rango.
Figura 8.2
Si tocamos el botón Modelo, podemos definir el modelo log-lineal que

deseemos. Lo más interesante es utilizar la opción que viene por defecto
(Saturado) ya que, de esta manera, analizará todos los modelos log-lineales
posibles y nos dará el mejor de todos ellos. En el botón Opciones, lo mejor es
utilizar las que aparecen en la Figura 8.3.
Figura 8.3
Con todas estas selecciones, los resultados que obtendremos, pulsando

finalmente el botón Aceptar, serán los siguientes,
Loglineal jerárquico
* * * * * * * * H I E R A R C H I C A L L O G L I N E A R * * * * * * * *
DATA Information
56 unweighted cases accepted.

0 cases rejected because of out-of-range factor values.
0 cases rejected because of missing data.
56 weighted cases will be used in the analysis.
FACTOR Information
Factor Level Label

edad 3
sexo 2
fumador 2
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
DESIGN 1 has generating class
edad*sexo*fumador
Note: For saturated models ,000 has been added to all observed cells.
This value may be changed by using the CRITERIA = DELTA subcommand.
The Iterative Proportional Fit algorithm converged at iteration 1.

The maximum difference between observed and fitted marginal totals is ,000
and the convergence criterion is ,250
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Observed, Expected Frequencies and Residuals.
Factor Code OBS count EXP count Residual Std Resid
edad 1
sexo 0
fumador 0 1,0 1,0 ,00 ,00
fumador 1 11,0 11,0 ,00 ,00
sexo 1
fumador 0 7,0 7,0 ,00 ,00
fumador 1 3,0 3,0 ,00 ,00
edad 2
sexo 0
fumador 0 2,0 2,0 ,00 ,00
fumador 1 1,0 1,0 ,00 ,00
sexo 1
fumador 0 5,0 5,0 ,00 ,00
fumador 1 4,0 4,0 ,00 ,00
edad 3
sexo 0
fumador 0 2,0 2,0 ,00 ,00
fumador 1 13,0 13,0 ,00 ,00
sexo 1
fumador 0 6,0 6,0 ,00 ,00
Observed, Expected Frequencies and Residuals. (Cont.)

fumador 1 1,0 1,0 ,00 ,00
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Goodness-of-fit test statistics
Likelihood ratio chi square = ,00000 DF = 0 P = .

Pearson chi square = ,00000 DF = 0 P = .
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Tests that K-way and higher order effects are zero.
K DF L.R. Chisq Prob Pearson Chisq Prob Iteration
3 2 5,948 ,0511 7,163 ,0278 4

2 7 29,042 ,0001 26,289 ,0004 2
1 11 34,978 ,0002 37,429 ,0001 0
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Tests that K-way effects are zero.
K DF L.R. Chisq Prob Pearson Chisq Prob Iteration
1 4 5,936 ,2040 11,139 ,0250 0

2 5 23,094 ,0003 19,126 ,0018 0
3 2 5,948 ,0511 7,163 ,0278 0
Tests of PARTIAL associations.
Effect Name DF Partial Chisq Prob Iter
edad*sexo 2 4,533 ,1037 2

edad*fumador 2 ,374 ,8292 2
sexo*fumador 1 15,227 ,0001 2
edad 2 3,855 ,1455 2
sexo 1 ,286 ,5928 2
fumador 1 1,795 ,1803 2
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Note: For saturated models ,000 has been added to all observed cells.
This value may be changed by using the CRITERIA = DELTA subcommand.
Estimates for Parameters.
edad*sexo*fumador
Parameter Coeff. Std. Err. Z-Value Lower 95 CI Upper 95 CI
1 -,2747356875 ,26302 -1,04454 -,79026 ,24079

2 ,6540635032 ,27777 2,35467 ,10963 1,19850
edad*sexo
1 -,0380838588 ,26302 -,14479 -,55361 ,47744

2 -,4520733408 ,27777 -1,62749 -,99651 ,09236
edad*fumador
1 -,3281202374 ,26302 -1,24750 -,84364 ,18740

2 ,2886017987 ,27777 1,03899 -,25583 ,83304_
Estimates for Parameters. (Cont.)
sexo*fumador
1 -,5365625958 ,19113 -2,80724 -,91119 -,16194
edad
1 ,1788416633 ,26302 ,67995 -,33668 ,69436

2 -,2595429008 ,27777 -,93437 -,80398 ,28489
sexo
1 -,1235729324 ,19113 -,64652 -,49820 ,25105
fumador
1 -,0595291157 ,19113 -,31145 -,43415 ,31510
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Backward Elimination (p = ,050) for DESIGN 1 with generating class
edad*sexo*fumador
Likelihood ratio chi square = ,00000 DF = 0 P = .
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
If Deleted Simple Effect is DF L.R. Chisq Change Prob Iter
edad*sexo*fumador 2 5,948 ,0511 4
Step 1
The best model has generating class
edad*sexo
edad*fumador
sexo*fumador
Likelihood ratio chi square = 5,94817 DF = 2 P = ,051
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
edad*sexo 2 4,533 ,1037 2

edad*fumador 2 ,374 ,8292 2
sexo*fumador 1 15,227 ,0001 2
Step 2

edad*sexo
sexo*fumador
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
edad*sexo 2 6,012 ,0495 2

sexo*fumador 1 16,707 ,0000 2
Step 3
edad*sexo
sexo*fumador
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
The final model has generating class [1]

edad*sexo
sexo*fumador
The Iterative Proportional Fit algorithm converged at iteration 0.

The maximum difference between observed and fitted marginal totals is ,000
and the convergence criterion is ,250
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Observed, Expected Frequencies and Residuals.
edad 1
sexo 0
fumador 0 1,0 2,0 -1,00 -,71
fumador 1 11,0 10,0 1,00 ,32
sexo 1
fumador 0 7,0 6,9 ,08 ,03
fumador 1 3,0 3,1 -,08 -,04
edad 2
sexo 0
fumador 0 2,0 ,5 1,50 2,12
fumador 1 1,0 2,5 -1,50 -,95
sexo 1
fumador 0 5,0 6,2 -1,23 -,49
fumador 1 4,0 2,8 1,23 ,74
edad 3
sexo 0
fumador 0 2,0 2,5 -,50 -,32
fumador 1 13,0 12,5 ,50 ,14
sexo 1
fumador 0 6,0 4,8 1,15 ,52
fumador 1 1,0 2,2 -1,15 -,79
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Goodness-of-fit test statistics
Likelihood ratio chi square = 6,32264 DF = 4 P = ,176 [2]

Pearson chi square = 7,80576 DF = 4 P = ,099
En donde hemos remarcado con [1] que el programa elige como mejor
modelo (ya hechos los tests condicionales para modelos anidados de la
sección 8.4.1 de TA) el mismo que se obtuvo allí. Los tests para este mejor
modelo se observan en [2].
Capítulo 9
Regresión Logística
9.1. Regresión Logística
Este Método Estadístico se estudia en el capítulo 9 del texto TA. Su

tratamiento con SPSS se basa en ejecutar la secuencia
Analizar → Regresión → Logística binaria

Explicaremos su ejecución siguiendo el ejemplo 9.1 de dicho texto.
Ejemplo 9.1-TA ___________________________________________
Después de introducir los datos, ejecutamos la secuencia anterior, como

puede verse en la Figura 9.1
Figura 9.1
Entonces se abre una ventana de diálogo como la de la Figura 9.2 en donde

deberemos incluir la variable dependiente (necesariamente dicotómica) en la
ventana Dependiente; el resto de las covariables en Covariables, marcando
las que sean cualitativas con el botón Categórica.
Figura 9.2
Al correr ahora el programa, presionando el botón Aceptar, se obtienen los

siguientes resultados
Regresión logística
Resumen del procesamiento de los casos
Casos no ponderados(a) N Porcentaje

Casos seleccionados Incluidos en el análisis 50 100,0
Casos perdidos 0 ,0
Total 50 100,0
Casos no seleccionados 0 ,0
Total 50 100,0
a Si está activada la ponderación, consulte la tabla de clasificación para ver el número total de casos.
Codificación de la variable dependiente
Valor original Valor interno

,00 0
1,00 1
Codificaciones de variables categóricas [1]
Codificación de parámetros
Frecuencia (1) (2) (3)
activi ,00 9 1,000 ,000 ,000
1,00 12 ,000 1,000 ,000
2,00 19 ,000 ,000 1,000
3,00 10 ,000 ,000 ,000
presion ,00 24 1,000
1,00 26 ,000
angina ,00 7 1,000
1,00 43 ,000
Bloque 0: Bloque inicial

Tabla de clasificación(a,b)
Observado Pronosticado
infarto
Porcentaje
,00 1,00 correcto
Paso 0 infarto ,00 0 17 ,0
1,00 0 33 100,0
Porcentaje global 66,0
a En el modelo se incluye una constante.
b El valor de corte es ,500
Variables en la ecuación
B E.T. Wald gl Sig. Exp(B)

Paso 0 Constante ,663 ,299 4,936 1 ,026 1,941
Variables que no están en la ecuación
Puntuación gl Sig.
Paso 0 Variables Activi 2,957 3 ,398
activi(1) 2,273 1 ,132
activi(2) ,570 1 ,450
activi(3) ,806 1 ,369
angina(1) 1,410 1 ,235
presion(1) 3,566 1 ,059
Edad ,230 1 ,632
Estadísticos globales 7,395 6 ,286
Bloque 1: Método = Por pasos hacia atrás (Wald)

Pruebas omnibus sobre los coeficientes del modelo
Chi-cuadrado gl Sig.
Paso 1 Paso 8,441 6 ,208
Bloque 8,441 6 ,208
Modelo 8,441 6 ,208
Paso Paso -2,171 3 ,538
2(a) Bloque 6,270 3 ,099
Modelo 6,270 3 ,099
Paso Paso -,707 1 ,400
3(a) Bloque 5,563 2 ,062
Modelo 5,563 2 ,062
Paso Paso -1,912 1 ,167
4(a) Bloque 3,650 1 ,056
Modelo 3,650 1 ,056
a Un valor de chi-cuadrado negativo indica que ha disminuido el valor de chi-cuadrado con respecto al
paso anterior.
Resumen de los modelos
R cuadrado
-2 log de la R cuadrado de de
Paso verosimilitud Cox y Snell Nagelkerke
1 55,662(a) ,155 ,215
2 57,834(a) ,118 ,163
3 58,541(a) ,105 ,146
4 60,453(b) ,070 ,097
a La estimación ha finalizado en el número de iteración 5 porque las estimaciones de los parámetros han
cambiado en menos de ,001.
b La estimación ha finalizado en el número de iteración 4 porque las estimaciones de los parámetros han
cambiado en menos de ,001.
Tabla de clasificación(a)
Observado Pronosticado
infarto
Porcentaje
,00 1,00 correcto
Paso 1 infarto ,00 5 12 29,4
1,00 1 32 97,0
Paso 2 infarto ,00 7 10 41,2
1,00 4 29 87,9
Paso 3 infarto ,00 12 5 70,6
1,00 10 23 69,7
Paso 4 infarto ,00 0 17 ,0
1,00 0 33 100,0
a El valor de corte es ,500
Variables en la ecuación
B E.T. Wald gl Sig. Exp(B)

Paso activi 2,063 3 ,559
1(a) activi(1) -1,221 1,127 1,174 1 ,279 ,295
activi(2) ,017 1,036 ,000 1 ,987 1,017
activi(3) ,088 ,919 ,009 1 ,924 1,092
angina(1) 2,111 1,408 2,248 1 ,134 8,260
presion(1
1,178 ,703 2,812 1 ,094 3,249
)
edad -,038 ,039 ,978 1 ,323 ,962
Constant
2,083 2,223 ,877 1 ,349 8,026
e
Paso angina(1) 1,633 1,204 1,840 1 ,175 5,120
2(a) presion(1
1,328 ,671 3,916 1 ,048 3,773
)
edad -,030 ,036 ,691 1 ,406 ,971
Constant
1,429 1,808 ,625 1 ,429 4,174
e
Paso angina(1) 1,423 1,154 1,520 1 ,218 4,148
3(a) presion(1
1,253 ,651 3,699 1 ,054 3,500
)
Constant
-,036 ,421 ,007 1 ,931 ,964
e
Paso presion(1
1,181 ,638 3,423 1 ,064 3,257
4(a) )
Constant
,154 ,393 ,154 1 ,695 1,167
e
a Variable(s) introducida(s) en el paso 1: activi, angina, presion, edad.
Variables que no están en la ecuación
Puntuación gl Sig.
Paso 2(a) Variables Activi 2,187 3 ,534
activi(1) 2,171 1 ,141
activi(2) ,099 1 ,753
activi(3) ,462 1 ,497
Paso 3(b) Variables Activi 1,894 3 ,595
activi(1) 1,744 1 ,187
activi(2) ,177 1 ,674
activi(3) ,512 1 ,474
Edad ,706 1 ,401
Estadísticos globales
2,816 4 ,589
Paso 4(c) Variables Activi 1,567 3 ,667

activi(1) 1,163 1 ,281
activi(2) ,153 1 ,696
activi(3) ,631 1 ,427
angina(1) 1,699 1 ,192
Edad ,281 1 ,596
a Variable(s) eliminada(s) en el paso 2: activi.
b Variable(s) eliminada(s) en el paso 3: edad.
c Variable(s) eliminada(s) en el paso 4: angina. [2]
Es muy interesante la codificación que realiza SPSS, la cual hemos

marcado más arriba con [1] , que indica cuál será el modelo finalmente
ajustado, la cual aparentemente lleva a ajustes de modelos distintos a los
obtenidos con BMDP ó SAS.
En la última tabla hemos marcado con [2] el lugar en el que podemos
observar que la única covariable de las 4 con lo que nos quedamos será la que
no aparece allí, es decir, Presión.
Volviendo a correr el programa ahora sólo con Presión obtendríamos el
modelo final que se ajusta,
log (p/(1-p)) = 0’154 + 1’181 Presión
en donde apuntamos de nuevo la diferencia de codificaciones en las variables

para explicar la aparente diferencia con los resultados de otros paquetes
estadísticos.
Capítulo 10
Regresión Poisson
10.1. Regresión Poisson
El estudio de este tipo de modelos puede seguirse en el capítulo 10 del

texto TA. Su ejecución con SPSS consiste en la secuencia
Analizar → Loglineal → General
Ejemplo 10.1-TA __________________________________________
Después de introducir los datos y ejecutar la secuencia anterior, Figura 10.1,
Figura 10.1
En la ventana que se abra después de hacer dicha selección deberemos incluir

(Figura 10.2) la variable dependiente (es decir, la Tasa) en la ventana
Estructura de las casillas y las covariables cualitativas, Edad y Sexo, en

Factores.
.
Figura 10.2
A continuación, en el botón Modelo, elegimos la opción Personalizado y

completamos la ventana de la derecha desplazando las dos covariables como
Efectos principales (Figura 10.3).
Figura 10.3
Después de aceptar esas selecciones con el botón Continuar, volvemos a

la ventana de diálogo anterior, en donde elegimos las Opciones que aparecen
en la Figura 10.4.
Figura 10.4
Una vez aceptadas éstas con el botón Continuar y ejecutando todas las
selecciones con el botón Aceptar de la ventana de diálogo principal,
obtenemos los resultados que aparecen a continuación,
Loglineal general
Información sobre los datos
N
Casos Válidos 6
Perdidos 0
Válidos
6
ponderados
Casillas Casillas definidas 6
Ceros
0
estructurales
Ceros de
0
muestreo
Categorías edad 3
sexo 2
Información sobre la convergencia(a,b)
Número máximo de
iteraciones 20
Tolerancia de
convergencia ,00100
Máxima diferencia
absoluta final ,00013(c)
Máxima diferencia
relativa final ,00078
Número de iteraciones 3
a Modelo: Poisson
b Diseño: Constante + edad + sexo
c La iteración ha convergido ya que el máximo de cambios absolutos de las estimaciones de los
parámetros es inferior al criterio de convergencia especificado.
Contrastes de bondad de ajuste(a,b)
Valor gl Sig.
Razón de verosimilitudes ,004 2 ,998
Chi-cuadrado de Pearson ,004 2 ,998
a Modelo: Poisson [3]
Residuos y recuentos de casillas(a,b)
Observado Esperado
Residuo Residuo
edad sexo Recuento % Recuento % Residual tipificado corregido Desviación
1,00 ,00 1 16,7% ,976 16,3% ,024 ,024 ,041 ,024
1,00 1 16,7% 1,024 17,1% -,024 -,023 -,041 -,023
2,00 ,00 1 16,7% 1,038 17,3% -,038 -,037 -,066 -,038
1,00 1 16,7% ,962 16,0% ,038 ,039 ,066 ,039
3,00 ,00 1 16,7% ,985 16,4% ,015 ,015 ,025 ,015
1,00 1 16,7% 1,015 16,9% -,015 -,014 -,025 -,014
a Modelo: Poisson
Estimaciones de los parámetros(b,c)
Intervalo de confianza al
95%
Límite
Parámetro Estimación Error típico Z Sig. Límite inferior superior
Constante 2,540 ,814 3,122 ,002 ,946 4,135
[edad = 1,00] -,328 1,000 -,328 ,743 -2,288 1,632
[edad = 2,00] -,171 1,000 -,171 ,864 -2,131 1,789
[edad = 3,00] 0(a) . . . . .
[sexo = ,00] -,029 ,817 -,036 ,972 -1,630 1,572
[sexo = 1,00] 0(a) . . . . .
[1] [2]
a Este parámetro se ha definido como cero ya que es redundante.
b Modelo: Poisson
c Diseño: Constante + edad + sexo
Correlaciones de las estimaciones de los parámetros(a,b,c)
Constante [edad = 1,00] [edad = 2,00] [sexo = ,00]

Constante 1 -,616 -,604 -,495
[edad = 1,00] -,616 1 ,500 ,004
[edad = 2,00] -,604 ,500 1 -,022
[sexo = ,00] -,495 ,004 -,022 1
a Modelo: Poisson

c Los parámetros redundantes no se muestran.
Covarianzas de las estimaciones de los parámetros(a,b,c)
Constante [edad = 1,00] [edad = 2,00] [sexo = ,00]

Constante ,662 -,501 -,491 -,329
[edad = 1,00] -,501 1,000 ,500 ,003
[edad = 2,00] -,491 ,500 1,000 -,018
[sexo = ,00] -,329 ,003 -,018 ,667
a Modelo: Poisson
c Los parámetros redundantes no se muestran.
Modelo de Poisson
Frecuencias ...
Frecuencias ...
Residuos corregidos
Frecuencias ... Frecuencias ... Residuos corregidos
Gráfico Q-Q normal de residuos corregidos
1,5
1,0
Valor normal esperado
0,5
0,0
-0,5
-1,0
-1,5
-0,075 -0,050 -0,025 0,000 0,025 0,050 0,075

Residuos corregidos
Gráfico Q-Q normal de residuos corregidos
0,3
0,2
Desviación de normal
0,1
0,0
-0,1
-0,2
-0,3
-0,075 -0,050 -0,025 0,000 0,025 0,050 0,075

Residuos corregidos
En la mencionada salida se observa, marcado con [1] , la codificación que

da SPSS a los parámetros del modelo, haciendo iguales a cero [Edad=3] y
[Sexo=1] ya que de las covariables cualitativas hay que construir el Modelo con
tantas variables indicadoras como clases tengan las covariables cualitativas
menos una.
En [2] aparecen las estimaciones obtenidas, las cuales proporcionan el
Modelo
log Tasa = 2'540 - 0'328 [Edad=1] -0'171 [Edad=2] -0'029 [Sexo=0]
Esto hace que para un Hombre ([Sexo=0]) de 50 a 70 años ([Edad=2]) se

obtenga una predicción en su tasa de supervivencia igual a
log Tasa} = 2'540 - 0'328 * 0 - 0'171 * 1 - 0'029 * 1 = 2'34.
Observemos que en TA obtuvimos, en esta misma situación, prácticamente

el mismo valor pero con signo menos; la razón es que SPSS ajusta un modelo
de la forma ∑ β Xi en donde la variable dependiente que supuestamente sigue
la distribución de Poisson (habitualmente una tasa de fallo) es de la forma
r = exp{- ∑ β Xi }
Por tanto, deberemos cambiar el signo de la tasas ajustadas con SPSS,

quedando, en este caso igual a -2'34, como en TA.
Por último, en [3] , observamos el contraste del modelo ajustado que
claramente puede admitirse.
Capítulo 11
Regresión no Lineal
11.1. Regresión no Lineal

El estudio de la Regresión no Lineal se lleva a cabo en el capítulo 11 del
texto TA. Su ejecución con SPSS se obtienen mediante la secuencia
Analizar → Regresión → No lineal
Ejemplo 11.2-TA __________________________________________
Después de introducir los datos ejecutamos la secuencia anterior, como puede

verse en la Figura 11.1,
Figura 11.1
Entonces se abre una ventana de diálogo como la de la Figura 11.2 en

donde completamos las ventanas según se indica en dicha Figura.
Figura 11.2
Mención especial merece la incorporación de los parámetros. Primero debemos

darle un nombre genérico y un valor inicial (Figura 11.3).
Figura 11.3
En este caso, hemos dado como valores iniciales los mismos que dimos en el
texto TA.
Una vez completados todos los datos se pulsa el botón Aceptar y se
obtienen los siguientes resultados de entre los que destacan las estimaciones
de los parámetros dadas en [1] y los intervalos de confianza para los

parámetros, dados en [2] , los cuales implican la no eliminación de ninguno de
los parámetros al no contener al cero ninguno de los intervalos.
All the derivatives will be calculated numerically.
Iteration Residual SS b1 b2 b3 b4
1 993,2441321 70,0000000 61,0000000 -10,000000 3,00000000

1.1 67,90285456 65,6001840 54,9183822 -12,031581 3,41315663
2 67,90285456 65,6001840 54,9183822 -12,031581 3,41315663
2.1 24,33046743 64,2628457 53,7680819 -15,414270 4,39184922
3 24,33046743 64,2628457 53,7680819 -15,414270 4,39184922
3.1 20,59971311 64,6000975 54,0847130 -16,550650 4,71582674
4 20,59971311 64,6000975 54,0847130 -16,550650 4,71582674
4.1 20,46053149 64,5407676 53,9265466 -16,875970 4,80922669
5 20,46053149 64,5407676 53,9265466 -16,875970 4,80922669
5.1 20,44963384 64,5205754 53,8717716 -16,970436 4,83634021
6 20,44963384 64,5205754 53,8717716 -16,970436 4,83634021
6.1 20,44875851 64,5144551 53,8552854 -16,997416 4,84408360
7 20,44875851 64,5144551 53,8552854 -16,997416 4,84408360
7.1 20,44868814 64,5126874 53,8505316 -17,005080 4,84628342
8 20,44868814 64,5126874 53,8505316 -17,005080 4,84628342
8.1 20,44868248 64,5121838 53,8491779 -17,007254 4,84690719
9 20,44868248 64,5121838 53,8491779 -17,007254 4,84690719
9.1 20,44868203 64,5120408 53,8487936 -17,007870 4,84708406
10 20,44868203 64,5120408 53,8487936 -17,007870 4,84708406
10.1 20,44868199 64,5120002 53,8486844 -17,008045 4,84713430
Run stopped after 20 model evaluations and 10 derivative evaluations.

Iterations have been stopped because the relative reduction between
successive
residual sums of squares is at most SSCON = 1,000E-08
Nonlinear Regression Summary Statistics Dependent Variable y
Source DF Sum of Squares Mean Square
Regression 4 18193,42942 4548,35735

Residual 5 20,44868 4,08974
Uncorrected Total 9 18213,87810
(Corrected Total) 8 4276,50156
R squared = 1 - Residual SS / Corrected SS = ,99522
Asymptotic 95 %
Asymptotic Confidence Interval
Parameter Estimate Std. Error Lower Upper
b1 64,512000215 1,332847270 61,085807233 67,938193196

b2 53,848684361 2,122116694 48,393609734 59,303758988
b3 -17,00804517 2,100618342 -22,40785652 -11,60823382
b4 4,847134303 ,601470650 3,301004775 6,393263832
[1] [2] [2]

Asymptotic Correlation Matrix of the Parameter Estimates
b1 b2 b3 b4
b1 1,0000 ,7084 ,3246 -,3477

b2 ,7084 1,0000 ,6106 -,6140
b3 ,3246 ,6106 1,0000 -,9991
b4 -,3477 -,6140 -,9991 1,0000
Capítulo 12
Análisis de la Varianza con Medidas Repetidas
12.1. Análisis de la Varianza con Medidas Repetidas
Este Método Estadístico se estudia en el capítulo 12 del texto TA. Su

tratamiento con SPSS se basa en ejecutar la secuencia
Analizar → Modelo lineal general → Medidas repetidas
Ejemplo 12.1-TA __________________________________________
El propósito que se persigue es, como allí, contrastar la igualdad de

crecimiento medio entre las mandíbulas de chicos y chicas, contrastando la
hipótesis nula
H0: µh = µm
además, contrastar si ha habido variación significativa a lo largo del tiempo de

observación, contrastando
H0': µ8 = µ10 = µ12 = µ14
y analizando también, por último, si existe o no interacción entre ambos

factores, contrastando la hipótesis
H0'': No existe interacción entre Sexo y Edad

Primero debemos introducir los datos mediante la utilización de tantas
variables como clases presente la Repetición, en nuestro caso, cuatro. Esto lo
hacemos como se indica en la Figura 12.1.
Después debemos ejecutar la secuencia antes comentada, como aparece
en la Figura 12.2.
Figura 12.1
Después debemos ejecutar la secuencia antes comentada, como aparece

en la Figura 12.2.
Figura 12.2
Se abre entonces una ventana que solicita un nombre para la variable

Repetición. En la Figura 12.3 le hemos dado el nombre de edad; nos pide
también el número de niveles a los que actúa esta variable Repetición, el cual
es, en nuestro caso, igual a 4.
Figura 12.3
Finalmente, debemos presionar, primero el botón Añadir y luego Definir, para

indicarle al SPSS, cuáles de las variables que definen los datos, son los niveles
de la variable Repetición, como puede observarse en la Figura 12.4, incluyendo
también a la variable sexo en la ventana Factores inter-sujetos.
Figura 12.4
Finalmente, presionando el botón Aceptar de esta última ventana, se

obtienen los resultados que aparecen a continuación.
Modelo lineal general

Factores intra-sujetos
Medida: MEASURE_1
Variable
edad dependiente
1 edad8
2 edad10
3 edad12
4 edad14
Factores inter-sujetos
N
sexo 1 1
1
2 1
1
Contrastes multivariados(b)
Gl de la
Efecto Valor F hipótesis Gl del error Significación
Edad Traza de Pillai ,869 39,787(a) 3,000 18,000 ,000
Lambda de
,131 39,787(a) 3,000 18,000 ,000
Wilks
Traza de
6,631 39,787(a) 3,000 18,000 ,000
Hotelling
Raíz mayor de
6,631 39,787(a) 3,000 18,000 ,000
Roy
edad * sexo Traza de Pillai ,264 2,149(a) 3,000 18,000 ,130
Lambda de
,736 2,149(a) 3,000 18,000 ,130
Wilks
Traza de
,358 2,149(a) 3,000 18,000 ,130
Hotelling
Raíz mayor de
,358 2,149(a) 3,000 18,000 ,130
Roy
a Estadístico exacto
b Diseño: Intercept+sexo Diseño intra sujetos: edad
Prueba de esfericidad de Mauchly(b)
Medida: MEASURE_1
Epsilon(a)
Chi-cuadrado Greenhouse-
Efecto intra-sujetos W de Mauchly aprox. gl Significación Geisser Huynh-Feldt Límit
Edad ,599 9,583 5 ,088 ,733 ,869
Contrasta la hipótesis nula de que la matriz de covarianza error de las variables dependientes
transformadas es proporcional a una matriz identidad.
a Puede usarse para corregir los grados de libertad en las pruebas de significación promediadas. Las
pruebas corregidas se muestran en la tabla Pruebas de los efectos inter-sujetos.
b Diseño: Intercept+sexo Diseño intra sujetos: edad
Pruebas de efectos intra-sujetos.
Medida: MEASURE_1
Suma de
cuadrados Media
Fuente tipo III gl cuadrática F Significación
edad Esfericidad
asumida
149,940 3 49,980 32,551 [2] ,000
Greenhouse-
149,940 2,199 68,182 32,551 ,000
Geisser
Huynh-Feldt 149,940 2,606 57,547 32,551 ,000
Límite-inferior 149,940 1,000 149,940 32,551 ,000
edad * sexo Esfericidad
asumida
9,372 3 3,124 2,035 [3] ,119
Greenhouse-
9,372 2,199 4,262 2,035 ,139
Geisser
Huynh-Feldt 9,372 2,606 3,597 2,035 ,128
Límite-inferior 9,372 1,000 9,372 2,035 ,169
Error(edad) Esfericidad
92,125 60 1,535
asumida
Greenhouse-
92,125 43,982 2,095
Geisser
Huynh-Feldt 92,125 52,111 1,768
Límite-inferior 92,125 20,000 4,606
Pruebas de contrastes intra-sujetos
Medida: MEASURE_1
Suma de
cuadrados Media
Fuente edad tipo III Gl cuadrática F Significación
edad Lineal 146,051 1 146,051 123,999 [4] ,000
Cuadrático 1,776 1 1,776 2,260 ,148
Cúbico 2,114 1 2,114 ,800 ,382
edad * sexo Lineal 4,105 1 4,105 3,485 ,077
Cuadrático 2,071 1 2,071 2,636 ,120
Cúbico 3,196 1 3,196 1,209 ,285
Error(edad) Lineal 23,557 20 1,178
Cuadrático 15,716 20 ,786
Cúbico 52,852 20 2,643
Pruebas de los efectos inter-sujetos
Medida: MEASURE_1
Variable transformada: Promedio
Suma de
cuadrados Media
Fuente tipo III gl cuadrática F Significación
Intersección 50376,480 1 50376,480 2858,148 ,000
sexo 143,821 1 143,821 8,160 [1] ,010
Error 352,511 20 17,626
En donde hemos marcado con [1] , [2] y [3] los tres tests que estudiamos
en TA, antes mencionados, respectivamente, sobre la igualdad de los dos
niveles de Sexo, de los cuatro niveles de la variable Repetición Edad, y sobre
la ausencia de interacción entre Sexo y Edad. En [4] aparece el test de
linealidad allí estudiado.
Capítulo 13
Análisis de Series Temporales
13.1. Introducción
El Análisis de Series Temporales se estudió en el capítulo 13 de TA.
13.2. Identificación del modelo

Los gráficos necesarios para identificar el modelo se obtienen ejecutando la
secuencia
Gráficos → Serie temporal → Autocorrelación
Ejemplo 13.1-TA __________________________________________
Ejecutando la secuencia anterior (Figura 13.1)
Figura 13.1
Obtenemos los siguientes resultados en donde se observa que los dos últimos
gráficos se corresponden exactamente con las figuras 13.2 y 13.4 del texto TA,
funciones ACF y PACF respectivamente, con la excepción del primer valor que,
como allí dijimos, es siempre igual a 1 y que aquí desaparece.
Autocorrelaciones simples
MODEL: MOD_2.
Autocorrelations: niveles
Auto- Stand.
Lag Corr. Err. -1 -.75 -.5 -.25 0 .25 .5 .75 1 Box-
Ljung Prob.
ùòòòòôòòòòôòòòòôòòòòôòòòòôòòòòôòòòòôòòòòú
1 ,576 ,140 . ó*****.******
16,914 ,000
2 ,182 ,138 . ó**** .
18,639 ,000
3 -,145 ,137 . ***ó .
19,756 ,000
4 -,175 ,135 . ***ó .
21,423 ,000
5 -,150 ,134 . ***ó .
22,673 ,000
6 -,021 ,132 . * .
22,698 ,001
7 -,020 ,131 . * .
22,722 ,002
8 -,004 ,129 . * .
22,723 ,004
9 -,136 ,127 . ***ó .
23,856 ,005
10 -,154 ,126 . ***ó .
25,351 ,005
11 -,097 ,124 . **ó .
25,964 ,007
12 ,049 ,122 . ó* .
26,124 ,010
13 ,120 ,121 . ó** .
27,104 ,012
14 ,087 ,119 . ó** .
27,635 ,016
15 ,119 ,117 . ó** .
28,663 ,018
16 ,151 ,115 . ó*** .
30,374 ,016
Plot Symbols: Autocorrelations * Two Standard Error Limits .
Total cases: 48 Computable first lags: 47

Partial Autocorrelations: niveles
Pr-Aut- Stand.
Lag Corr. Err. -1 -.75 -.5 -.25 0 .25 .5 .75 1
ùòòòòôòòòòôòòòòôòòòòôòòòòôòòòòôòòòòôòòòòú
1 ,576 ,144 . ó*****.******
2 -,223 ,144 . ****ó .
3 -,227 ,144 .*****ó .
4 ,103 ,144 . ó** .
5 -,076 ,144 . **ó .
6 ,068 ,144 . ó* .
7 -,104 ,144 . **ó .
8 ,012 ,144 . * .
9 -,188 ,144 . ****ó .
10 ,003 ,144 . * .
11 ,066 ,144 . ó* .
12 ,032 ,144 . ó* .
13 ,022 ,144 . * .
14 -,093 ,144 . **ó .
15 ,230 ,144 . ó*****.
16 ,044 ,144 . ó* .
Plot Symbols: Autocorrelations * Two Standard Error Limits .
Total cases: 48 Computable first lags: 47
niveles
1,0 Coeficiente
Límite superior
de confianza
Límite inferior
de confianza
0,5
ACF
0,0
-0,5
-1,0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
No de retardos
niveles
1,0 Coeficiente
Límite superior
de confianza
Límite inferior
de confianza
0,5
ACF parcial
0,0
-0,5
-1,0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
No de retardos
13.3. Estimación de parámetros

La estimación de los parámetros del modelo ARIMA(p,d,q) seleccionado en
la sección anterior se lleva a cabo con la secuencia
Analizar → Series temporales → ARIMA
Ejemplo 13.1-TA(continuación) ________________________________
Ejecutando la secuencia anterior a los datos del ejemplo 13.1 del texto 13.1,
como se indica en la Figura 13.2 aparece la ventana de diálogo de la Figura
13.3 en donde incluimos la variable en estudio como variable Dependiente
según se indica en la Figura 13.3, así como los valores del modelo ARIMA a
ajustar
Figura 13.2
Figura 13.3
Antes de preceder a ejecutar el Análisis, es conveniente modificar un tanto

las Opciones, eligiendo las que aparecen en la Figura 13.4. En concreto, en lo
Que se refiere al número de iteraciones (aumentándolo), a los niveles de
tolerancia (disminuyéndolos) y a la eliminación de los cálculos intermedios, de
manera que sólo nos dé las estimaciones finales.
Figura 13.4
Con estas selecciones, pulsando los botones Continuar y luego Aceptar,

se obtuvieron los siguientes resultados, en donde pueden verse, en [1] , los
valores de las estimaciones obtenidas, las mismas que en TA pero con el signo
cambiado la del coeficiente de la Media Móvil. En [2] aparece el valor del
logaritmo de la verosimilitud alcanzada y, en [3] , el de la cantidad de
información de Akaike.
Arima
MODEL: MOD_1
Split group number: 1 Series length: 48

No missing data.
Melard's algorithm will be used for estimation.
Conclusion of estimation phase.

Estimation terminated at iteration number 68 because:
Sum of squares decreased by less than ,0001 percent.
FINAL PARAMETERS:
Number of residuals 48
Standard error ,45291761
Log likelihood -28,798731 [2]
AIC 63,597462 [3]
SBC 69,211065
Analysis of Variance:
DF Adj. Sum of Squares Residual Variance
Residuals 45 9,3163187 ,20513437
Variables in the Model:
B SEB T-RATIO APPROX. PROB.
AR1 ,4478397 ,22299179 2,008324 ,05063335

MA1 -,2041347 ,24527657 -,832263 ,40965538
CONSTANT 2,4100066 ,13973742 17,246680 ,00000000
[1]
The following new variables are being created:
Name Label
FIT_1 Fit for niveles from ARIMA, MOD_1 CON

ERR_1 Error for niveles from ARIMA, MOD_1 CON
LCL_1 95% LCL for niveles from ARIMA, MOD_1 CON
UCL_1 95% UCL for niveles from ARIMA, MOD_1 CON
SEP_1 SE of fit for niveles from ARIMA, MOD_1 CON
Capítulo 14
Control Estadístico de la Calidad
14.1. Gráfico de control para la media

Para obtener el gráfico de control para la media deberemos ejecutar la
secuencia,
Gráficos → Control
Explicaremos su ejecución siguiendo el ejemplo 14.1 de dicho texto.
Ejemplo 14.1-TA __________________________________________
Advertimos que el gráfico de control que se obtiene con SPSS es el caso

correspondiente a no tener un patrón dado. Además, los límites inferior y supe-
Figura 14.1
rior proporcionados por SPSS son un poco diferentes de los obtenidos en TA.
Para ejecutar este ejemplo, después de introducir los datos ejecutamos la
secuencia anterior, como se indica e la Figura 14.1. Se abrirá, entonces, una
ventana de diálogo como la de la Figura 14.2,
Figura 14.2
en donde deberemos seleccionar, para este ejemplo, el primero de los gráficos,

X-barra, R, S y también la opción, los casos son unidades .
Figura 14.3
Ahora, presionando el botón Definir se abre una ventana como la de la

Figura 14.3 en donde le indicamos cuál es la variable en observación en
Medida del proceso, en nuestro caso longitud, y cuál es la variable que define
los grupos, en la ventana Subgrupos definidos por, en nuestro ejemplo,
grupo.
Presionando finalmente le botón Aceptar, obtenemos los siguientes
resultados, en donde destaca el gráfico de control para la media, dado en [1] .
Gráfico SP
Gráfico de control: longitud
11,5
longitud
LCS =
11,47943219
11,0 Promedio =
10,09015853
LCI =
8,70088487
10,5
Media
10,0
9,5
9,0
8,5
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Nivel sigma: 3
[1]
Gráfico de control: longitud
6
longitud
LCS =
5,09278694
5 Promedio =
2,40850745
LCI = ,
00000000
4
Amplitud
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Nivel sigma: 3

Estadistica Aplicada Con SPSS

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadistica Aplicada Con SPSS

Cargado por

Copyright:

Formatos disponibles

ESTADÍSTICA APLICADA

Alfonso García Pérez

Copyright © 2005 Alfonso García Pérez

``No está permitida la reproducción total o parcial de este

Edita: Universidad Nacional de Educación a Distancia

El presente libro es la segunda parte de la tercera Unidad Didáctica del curso

Como se indicaba en la introducción de la primera parte, la gran implantación

No obstante, ya adelantamos que no es exhaustivo en cuanto al análisis de

Alfonso García Pérez

1.2. El editor de datos

Lo primero que analizaremos es cómo introducir los datos de nuestro

Ejemplo 8.1-TA ___________________________________________

En los modelos log-lineales, las variables deben ser categóricas; es decir,

Con objeto de introducir el nombre de las variables, pincharemos con el Ratón

Figura 1.3. Pinchando el 1, podremos teclear el nombre de las tres variables

En la barra de arriba (en Archivo) deberemos salvar nuestro fichero de datos.

Si nuestros datos están ya en un archivo, debemos incluirlos en el Editor de

Análisis de Componentes Principales

2.1. Análisis de Componentes Principales

El Análisis de Componentes Principales se obtiene ejecutando la secuencia:

Una vez incluidas todas las variables a utilizar en el Análisis, incluyéndolas

Ejemplo 2.1-TA ___________________________________________

Varianza total explicada

Sumas de las saturaciones al cuadrado

2.2. Sintaxis de SPSS

Aunque la forma habitual de utilizar SPPS (al menos en una primera

Si observamos de nuevo la Figura 2.2, vemos un botón denominado Pegar.

Este Programa SPSS ejecuta lo mismo que el botón Aceptar de dicha

3.1. Análisis de Correspondencias

La explicación detallada de este tipo de análisis aparece en el capítulo 3 del

Ejemplo 3.2-TA ___________________________________________

La primera observación que debemos hacer es sobre el manejo de los datos.

Lo haremos mediante una variable de frecuencia a la que hemos denominado

Ahora ya tenemos preparados los datos para realizar un Análisis de

En el análisis hemos utilizado las opciones que aparecen en la Figura 3.4.

Con estas opciones obtenemos los siguientes resultados,

Proporción de inercia Confianza para el Valor

Examen de los puntos de fila(a)

Puntuación en la dimensión Contribución

De los puntos a la inercia

Madre Masa 1 2 Inercia 1 2 1 2

Examen de los puntos columna(a)

Puntuación en la dimensión Contribución

De los puntos a la inercia

Bebe Masa 1 2 Inercia 1 2 1 2

Puntos de columna y de fila

En [1] puede comprobarse que la tabla de doble entrada ha sido bien

4.1. Escalado Multidimensional

Ejemplo 4.1-TA ___________________________________________

Analizar → Escalas → Escalamiento multidimensional (ALSCAL). Después de

Se abrirá entonces la ventana de diálogo que aparece en la Figura 4.2, en

El botón Opciones le completamos como se indica en la Figura 4.3.

Con estas selecciones obtendríamos los resultados que aparecen a

Raw (unscaled) Data for Subject 1

Iteration history for the 2 dimensional solution (in squared distances)

Young's S-stress formula 1 is used.

Iteration S-stress Improvement

Iterations stopped because

Stress and squared correlation (RSQ) in distances

RSQ values are the proportion of variance of the scaled data

Configuration derived in 2 dimensions

Optimally scaled data (disparities) for subject 1

Configuración de estímulos derivada

Modelo de distancia euclídea