Está en la página 1de 85

ESTADÍSTICA APLICADA

CON SPSS

Alfonso García Pérez


2 ESTADÍSTICA APLICADA CON SPPS

Copyright © 2005 Alfonso García Pérez

``No está permitida la reproducción total o parcial de este


libro, ni su tratamiento informático, ni la transmisión de
ninguna forma o por cualquier medio, ya sea electrónico,
mecánico, por fotocopia, por registro u otros medios, sin el
permiso previo y por escrito de los titulares del Copyright.
El contenido de este libro está registrado por el autor en el
Registro de la Propiedad Intelectual y protegido por la Ley,
que establece penas de prisión además de las correspondientes
indemnizaciones para quien lo plagiara"

Edita: Universidad Nacional de Educación a Distancia


ALFONSO GARCÍA PÉREZ 3

Contenido

Prólogo………………………………………………………. 5
Capítulo 1: Introducción al SPSS ……………………… 7
Capítulo 2: Análisis de Componentes Principales ….. 11
Capítulo 3: Análisis de Correspondencias …..……….. 15
Capítulo 4: Escalado Multidimensional ……..………... 21
Capítulo 5: Análisis de Conglomerados………..……… 27
Capítulo 6: Análisis de Discriminante …………............ 35
Capítulo 7: Análisis Factorial ……………………........... 41
Capítulo 8: Modelos Log-lineales …………………........ 43
Capítulo 9: Regresión Logística ……..……………........ 51
Capítulo 10: Regresión Poisson …....….…………......... 57
Capítulo 11: Regresión no Lineal..…..………….…........ 63
Capítulo 12: Análisis de la Varianza con Medidas
Repetidas ……….……..…..……….……… 67
Capítulo 13: Análisis de Series Temporales….…......... 73
Capítulo 14: Control Estadístico de la Calidad…......... 81
4 ESTADÍSTICA APLICADA CON SPPS
ALFONSO GARCÍA PÉREZ 5

Prólogo

El presente libro es la segunda parte de la tercera Unidad Didáctica del curso


Métodos Avanzados de Estadística Aplicada, dedicada al estudio del
Tratamiento Informático.

Como se indicaba en la introducción de la primera parte, la gran implantación


de SPSS como software de trabajo por muchos usuarios, nos ha llevado a
dedicar un volumen entero a este paquete estadístico.

No obstante, ya adelantamos que no es exhaustivo en cuanto al análisis de


todos los Métodos a los que dicho paquete se puede aplicar, ya que la mejor
manera de aprenderlo es utilizarlo y, en la mayoría de las ocasiones, los
comentarios resultan redundantes ante la sencillez de manejo de este software.

Lo que advertimos es que, como ya pasaba con BMDP o SAS, sólo se van a
poder ejecutar, básicamente, Métodos Clásicos con este software, debiendo
utilizarse el software enviado por el curso para la ejecución de Métodos
Robustos y de Remuestreo.

Ya que los ejemplos que analizaremos en este texto son los del libro Métodos
Avanzados de Estadística Aplicada. Técnicas Avanzadas, no repetiremos aquí
los enunciado de dichos ejemplos, indicándolos con la abreviatura TA y el
número del ejemplo correspondiente.

Por último, le recordamos que puede ver más grandes la figuras utilizando el
zoom de su pdf.

Alfonso García Pérez


agar-per@ccia.uned.es
6 ESTADÍSTICA APLICADA CON SPPS
ALFONSO GARCÍA PÉREZ 7

Capítulo 1

Introducción al SPSS

1.1. Introducción
Una de las características más destacadas de SPSS (en especial con
respecto a BMDP o SAS) es que no es necesario conocer un lenguaje de
programación para utilizarlo (aunque lo tiene). Su exitosa presentación de
“Métodos Estadísticos a ejecutar” en forma de persianas, permite comenzar a
utilizarlo casi sin conocimientos previos del paquete.
Por esta razón, este texto será simple y breve ya que, sin duda, la mejor
manera de aprende a manejar SPSS es utilizarlo.

1.2. El editor de datos

Lo primero que analizaremos es cómo introducir los datos de nuestro


problema, definiendo las variables a analizar con posterioridad.
Al abrir el paquete SPSS nos aparece un cuadro como el de la Figura 1.1,
en el que, si queremos ir tecleando los datos, elegiremos la opción Introducir
datos, apareciendo, a continuación el editor de datos en blanco en el que
debemos introducir los datos observados en el primer individuo de la primera
variable en la primera fila de la primera columna.
Para ir viendo cómo funciona el editor de datos, vamos a considerar un
ejemplo que analizaremos más adelante cuando estudiemos los modelos log-
lineales.

Ejemplo 8.1-TA ___________________________________________

En los modelos log-lineales, las variables deben ser categóricas; es decir,


deben definir categorías en las que clasificar los datos, pero ya veremos que
esto lo haremos antes de ejecutar el análisis en cuestión. Nosotros, de
momento, utilizaremos datos de tipo numérico. Para ello, lo más simple es ir
introduciendo los datos y más tarde, modificar, si es necesario, sus
propiedades.
8 ESTADÍSTICA APLICADA CON SPPS

Figura 1.1

Para el ejemplo en cuestión, incluiremos (por este orden) datos de las tres
variables: la variable Edad, con tres valores, 1 para los individuos menores de
20 años, 2 para los individuos entre 20 y 50 años y 3 para los individuos
mayores de 50 años.
Para la variable Sexo, dos valores, 0 para los hombres y 1 para las mujeres.
Y, finalmente, la variable Fumador, con dos valores, 0 para los individuos
que no fuman y 1 para los que sí fuman.
Así, los datos de los individuos de la tabla anterior serán los de la Figura 1.2.

Figura 1.2

Con objeto de introducir el nombre de las variables, pincharemos con el Ratón


la pestaña de abajo Vista de variables, apareciendo un panel como el de la
ALFONSO GARCÍA PÉREZ 9

Figura 1.3. Pinchando el 1, podremos teclear el nombre de las tres variables


así como sus principales características. Volveremos al editor de datos
pinchando en la pestaña inferior, Vista de datos.

Figura 1.3

En la barra de arriba (en Archivo) deberemos salvar nuestro fichero de datos.

Si nuestros datos están ya en un archivo, debemos incluirlos en el Editor de


datos con la opción: Archivo → Abrir → Datos (Figura 1.4)

Figura 1.4
10 ESTADÍSTICA APLICADA CON SPPS
ALFONSO GARCÍA PÉREZ 11

Capítulo 2

Análisis de Componentes Principales

2.1. Análisis de Componentes Principales

El Análisis de Componentes Principales se obtiene ejecutando la secuencia:


Analizar → Reducción de datos → Análisis Factorial (Figura 2.1).

Figura 2.1

Una vez incluidas todas las variables a utilizar en el Análisis, incluyéndolas


en el cuadro de la derecha con la flecha, es importante comprobar que en
Extracción se utilice la opción Componentes Principales y Gráfico de
sedimentación (Figura 2.2). Una vez seleccionadas éstas, SPSS se ejecuta
con el botón Aceptar que aparece en dicha Figura 2.2.
12 ESTADÍSTICA APLICADA CON SPPS

Ejemplo 2.1-TA ___________________________________________

Si ejecutamos la secuencia anterior con los datos del Ejemplo 2.1 del texto
Técnicas Avanzadas, se obtienen los siguientes resultados. En [1] y [2] puede
verse la variación explicada por cada componente principal.
A continuación aparece lo que SPSS denomina Gráfico de sedimentación y
que en TA denominamos Gráfico de desmoronamiento.
Por último, en [3] aparecen las Componentes Principales, con coeficientes
algo distintos de los que obteníamos en TA pero, por supuesto, con la misma
interpretación.

Figura 2.2

A. factorial

Comunalidades

Inicial Extracción
X1 1,000 ,973
X2 1,000 ,747
X3 1,000 ,817
X4 1,000 ,862
X5 1,000 ,945
X6 1,000 ,597
X7 1,000 ,781
X8 1,000 ,969
Método de extracción: Análisis de Componentes principales.
ALFONSO GARCÍA PÉREZ 13

Varianza total explicada

Sumas de las saturaciones al cuadrado


Autovalores iniciales de la extracción
% de la % de la
Componente Total varianza % acumulado Total varianza % acumulado
1 2,686 33,577 33,577 2,686 33,577 33,577
2 1,862 23,275 56,852 1,862 23,275 56,852
3 1,112 13,905 70,757 1,112 13,905 70,757
4 1,030 12,881 83,637 1,030 12,881 83,637
5 ,619 7,740 91,377
6 ,367 4,591 95,968
7 ,277 3,467 99,436
8 ,045 ,564 100,000
Método de extracción: Análisis de Componentes principales.

[1] [2]

Gráfico de sedimentación

3,0

2,5

2,0
Autovalor

1,5

1,0

0,5

0,0

1 2 3 4 5 6 7 8
Número de componente
14 ESTADÍSTICA APLICADA CON SPPS

Matriz de componentes(a)

Componente
1 2 3 4
X1 ,753 ,450 ,445 -,070
X2 -,704 ,363 ,093 -,332
X3 -,113 ,872 -,176 ,118
X4 ,064 ,764 -,443 ,279
X5 ,803 ,273 ,470 -,078
X6 ,629 -,159 -,392 ,149
X7 -,719 ,255 ,445 ,026
X8 -,222 -,140 ,326 ,891
Método de extracción: Análisis de componentes principales.
a 4 componentes extraídos
[3]

Los resultados obtenidos al ejecutar SPSS son ficheros que pueden ser
salvados y reutilizados.

2.2. Sintaxis de SPSS

Aunque la forma habitual de utilizar SPPS (al menos en una primera


aproximación al paquete) es mediante las persianas de la barra de comandos
superior, SPSS puede ser utilizado a través de un lenguaje de programación
como lo era SAS o BMDP. Este lenguaje SPSS se llama Sintaxis SPSS.

Si observamos de nuevo la Figura 2.2, vemos un botón denominado Pegar.


Si lo hubiéramos seleccionado, obtendríamos el Programa

FACTOR
/VARIABLES X1 X2 X3 X4 X5 X6 X7 X8 /MISSING LISTWISE /ANALYSIS X1 X2 X3 X4 X5
X6 X7 X8
/PRINT INITIAL EXTRACTION
/PLOT EIGEN
/CRITERIA MINEIGEN(1) ITERATE(25)
/EXTRACTION PC
/ROTATION NOROTATE
/METHOD=CORRELATION .

Este Programa SPSS ejecuta lo mismo que el botón Aceptar de dicha


Figura 2.2 y puede ser salvado, modificado y reutilizado, de manera que una
forma de ejecutar SPSS reiteradamente sin tener que ir completando las
diversas ventanas de diálogo de las persianas SPSS, es utilizar directamente
Sintaxis SPSS. Además, esta Sintaxis puede modificarse adecuándola
precisamente a aquello en lo que estamos interesados, pudiendo unirse varios
Programas en una sola Sintaxis.
ALFONSO GARCÍA PÉREZ 15

Capítulo 3

Análisis de Correspondencias

3.1. Análisis de Correspondencias

La explicación detallada de este tipo de análisis aparece en el capítulo 3 del


texto TA. Explicaremos su ejecución siguiendo el ejemplo 3.2 de dicho texto.

Ejemplo 3.2-TA ___________________________________________

La primera observación que debemos hacer es sobre el manejo de los datos.


SPSS requiere que los “valores” de las dos variables sean de tipo numérico
pero, por otro lado, éstas tienen un marcado acento de “etiqueta”. Además,
como los datos se refieren a tablas de frecuencia, no vamos a introducir los,
para este ejemplo, 6851 datos uno a uno.

Figura 3.1
16 ESTADÍSTICA APLICADA CON SPPS

Lo haremos mediante una variable de frecuencia a la que hemos denominado


Pondera. De ahí que el Editor de datos para este ejemplo sea el de la Figura
3.1. Pero observemos cómo hemos trabajado la opción de la pestaña Vista de
variables en la Figura 3.2, dando nombres a los valores de las variables.

Figura 3.2

Ahora ya tenemos preparados los datos para realizar un Análisis de


Correspondencias. Para ello ejecutaremos la secuencia:
Analizar → Reducción de datos → Análisis de correspondencias (Figura 3.3).

Figura 3.3
ALFONSO GARCÍA PÉREZ 17

En el análisis hemos utilizado las opciones que aparecen en la Figura 3.4.


Resaltamos que debemos codificar las variables que forman la tabla, como se
indica en el panel de la izquierda, y que con el botón Modelo obtenemos el
cuadro de diálogo de la derecha, en donde se ve que la solución que buscamos
es de dos dimensiones y que utilizamos una distancia chi-cuadrado.

Figura 3.4

Con estas opciones obtenemos los siguientes resultados,

Correspondencias

Tabla de correspondencias

Bebe
Madre pm pv gcm gcv Margen activo
jnf 50 315 24 4012 4401
jf 9 40 6 459 514
mnf 41 147 14 1594 1796
mf 4 11 1 124 140
Margen activo 104 513 45 6189 6851

[1]
18 ESTADÍSTICA APLICADA CON SPPS

Resumen

Proporción de inercia Confianza para el Valor

Corre
Desviación
Dimensión Valor propio Inercia Chi-cuadrado Sig. Explicada Acumulada típica
1 ,050 ,003 ,908 ,908 ,013
2 ,016 ,000 ,087 ,995 ,015
3 ,004 ,000 ,005 1,000
Total ,003 19,109 ,024(a) 1,000 1,000
a 9 grados de libertad

[2]

Examen de los puntos de fila(a)

Puntuación en la dimensión Contribución

De los puntos a la inercia


de la dimensión De la dimensión a la inercia del

Madre Masa 1 2 Inercia 1 2 1 2


jnf ,642 -,165 -,015 ,001 ,347 ,009 ,997 ,003
jf ,075 ,190 ,418 ,000 ,054 ,840 ,400 ,599
mnf ,262 ,313 -,063 ,001 ,511 ,066 ,986 ,012
mf ,020 ,465 -,253 ,000 ,088 ,084 ,877 ,081
Total activo 1,000 ,003 1,000 1,000
a Normalización Simétrica

Examen de los puntos columna(a)

Puntuación en la dimensión Contribución

De los puntos a la inercia


de la dimensión De la dimensión a la inercia del

Bebe Masa 1 2 Inercia 1 2 1 2


pm ,015 1,562 -,360 ,002 ,736 ,126 ,983 ,016
pv ,075 ,265 -,008 ,000 ,105 ,000 ,960 ,000
gcm ,007 ,899 1,441 ,000 ,106 ,873 ,556 ,443
gcv ,903 -,055 -,004 ,000 ,054 ,001 ,994 ,001
Total activo 1,000 ,003 1,000 1,000
a Normalización Simétrica
ALFONSO GARCÍA PÉREZ 19

Puntos de columna y de fila

Simétrica Normalización
1,5
gcm Bebe
Madre

1,0
Dimensión 2

0,5
jf

pv
0,0 jnf gcv
mnf

mf

pm
-0,5
-0,2 0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6
Dimensión 1

[3]

En [1] puede comprobarse que la tabla de doble entrada ha sido bien


creada. La inercia acumulada puede verse en [2] . A continuación aparecen
las coordenadas suministradas pos SPSS (algo distintas que las obtenidas con
el software del curso) y, por último, en [3] , el gráfico, principal objetivo del
Análisis, ampliamente comentado en TA.
20 ESTADÍSTICA APLICADA CON SPPS
ALFONSO GARCÍA PÉREZ 21

Capítulo 4

Escalado Multidimensional

4.1. Escalado Multidimensional


El Escalado Multidimensional fue tratado en el capítulo 4 de TA. Aquí
estudiaremos cómo ejecutar con SPSS el Escalado Multidimensional Clásico
Métrico mediante la utilización de sus persianas. Para ejecutar los otros tipos
de escalamiento deberemos utilizar la Sintaxis de SPSS.

Ejemplo 4.1-TA ___________________________________________

Analizar → Escalas → Escalamiento multidimensional (ALSCAL). Después de


introducir los datos como aparece en la Figura 4.1, ejecutamos la secuencia
que también aparece en dicha Figura:

Figura 4.1
22 ESTADÍSTICA APLICADA CON SPPS

Se abrirá entonces la ventana de diálogo que aparece en la Figura 4.2, en


donde ya se ve que hemos incorporado todas las variables al análisis.
Ahora debemos modificar algo los dos botones que allí aparecen. En
Modelo completamos los cuadros como en la Figura 4.2, dado el tipo de datos
que tenemos.

Figura 4.2

El botón Opciones le completamos como se indica en la Figura 4.3.

Figura 4.3

Con estas selecciones obtendríamos los resultados que aparecen a


continuación,
ALFONSO GARCÍA PÉREZ 23

Escalamiento multidimensional

Raw (unscaled) Data for Subject 1

1 2 3 4 5

1 ,000
2 7,500 ,000
[1] 3 8,500 2,000 ,000
4 6,000 5,000 7,500 ,000
5 9,500 7,500 8,000 8,000 ,000
6 7,000 5,000 8,500 5,500 6,000
7 8,000 2,000 2,000 7,500 2,000
8 9,500 9,000 9,000 7,000 5,000
9 5,500 5,500 9,000 7,500 7,500
10 8,500 6,000 8,000 8,000 6,500
11 9,500 9,000 7,500 8,000 1,500
12 9,000 6,000 5,500 9,000 2,000

6 7 8 9 10

6 ,000
7 7,500 ,000
8 7,500 2,000 ,000
9 6,000 2,000 2,500 ,000
10 7,500 2,500 6,000 4,500 ,000
11 7,500 3,000 2,000 6,500 5,000
12 9,000 ,500 4,500 6,500 6,000

11 12

11 ,000
12 2,500 ,000

Iteration history for the 2 dimensional solution (in squared distances)

Young's S-stress formula 1 is used.

Iteration S-stress Improvement

[2] 1 ,26241
2 ,20757 ,05484
3 ,18765 ,01992
4 ,17950 ,00815
5 ,17669 ,00281
6 ,17540 ,00129
7 ,17449 ,00091

Iterations stopped because


S-stress improvement is less than ,001000
24 ESTADÍSTICA APLICADA CON SPPS

Stress and squared correlation (RSQ) in distances

RSQ values are the proportion of variance of the scaled data


(disparities)
in the partition (row, matrix, or entire data) which
is accounted for by their corresponding distances.
Stress values are Kruskal's stress formula 1.

For matrix
Stress = ,15209 RSQ = ,85524

Configuration derived in 2 dimensions

Stimulus Coordinates

Dimension

Stimulus Stimulus 1 2
Number Name

1 V1 -2,2273 ,0931
2 V2 -,9499 -,8015
3 V3 -,1722 -1,9273
4 V4 -1,4457 ,4841
5 V5 1,3464 ,2773 [3]
6 V6 -,8397 ,9476
7 V7 ,5210 -,5959
8 V8 ,8699 1,0628
9 V9 -,3767 ,6495
10 V10 ,7265 ,4236
11 V11 1,5429 ,2237
12 V12 1,0047 -,8369

Optimally scaled data (disparities) for subject 1

1 2 3 4 5

1 ,000
2 1,808 ,000
3 2,793 1,342 ,000
4 1,342 1,342 2,553 ,000
5 3,579 2,537 2,677 2,793 ,000
6 1,808 1,342 2,793 1,342 1,808
7 2,793 1,342 1,342 2,244 1,202
8 3,305 2,793 3,166 1,808 1,342
9 1,342 1,342 2,793 1,808 1,808
10 2,793 1,808 2,553 2,553 1,808
11 3,772 2,793 2,553 2,793 ,408
12 3,305 1,808 1,342 2,793 1,166

6 7 8 9 10

6 ,000
ALFONSO GARCÍA PÉREZ 25

7 2,058 ,000
8 1,808 1,342 ,000
9 1,342 1,342 1,342 ,000
10 1,808 1,342 1,342 1,342 ,000
11 2,490 1,342 1,076 1,808 1,342
12 2,793 ,408 1,342 1,808 1,342

11 12

11 ,000
12 1,342 ,000

Configuración de estímulos derivada

Modelo de distancia euclídea

1 V8
V6
V9
V4 V10 V5
Dimensión 2

V11
V1
0

V7
V2 V12
-1

-2 V3

-2 -1 0 1 2
Dimensión 1
[4]

En estos resultados se observa, en [1] , la matriz de distancias. A


continuación, en [2] , aparece el Stress de Young, algo distinto del que
utilizamos en TA pero con el mismo significado.
En [3] aparecen las coordenadas a ser representadas más abajo y, en [4] ,
el gráfico que buscamos con el escalado Multidimensional, algo distinto que el
obtenido en TA pero con la misma interpretación.
26 ESTADÍSTICA APLICADA CON SPPS
ALFONSO GARCÍA PÉREZ 27

Capítulo 5

Análisis de Conglomerados

5.1. Introducción
Como sabemos, existen, básicamente, dos métodos de Análisis Cluster: uno
es el Análisis Jerárquico y otro el Algoritmo k-medias. Analizaremos estos dos
métodos en dos secciones separadas.

5.2. Análisis Jerárquico


Con SPSS es posible realizar los cinco métodos de agrupamiento
estudiados en TA: Agrupamiento simple, Agrupamiento completo,
Agrupamiento promedio, Agrupamiento centroide, y el Método de Ward, así
como utilizar las diversas distancias allí estudiadas. También podemos obtener
el dendograma.

Figura 5.1
28 ESTADÍSTICA APLICADA CON SPPS

Ejemplo 5.6-TA ___________________________________________

Después de introducir los datos como aparece en la Figura 5.1, ejecutamos la


secuencia que también aparece en dicha Figura:
Analizar → Clasificar → Conglomerados jerárquicos
apareciendo un cuadro de diálogo como el de la Figura 5.2, en donde hemos
incluido las dos variables en análisis. También aparecen allí los cuatro botones
en donde tendremos que seleccionar nuestras opciones.

Figura 5.2

Para formar los clusters utilizando un Agrupamiento centroide, seleccionamos


en el botón Método las tres opciones que aparecen en la Figura 5.3,

Figura 5.3
ALFONSO GARCÍA PÉREZ 29

Agrupación de centroides, Distancia Euclídea y que no estandarice los datos


con la opción de Ninguno.
Para este ejemplo, no es necesario pinchar en el botón Estadísticos ni en
Guardar, puesto que las opciones que vienen por defecto son adecuadas.
En el botón Gráficos es necesario indicarle que nos ejecute el Dendograma.
Como en situaciones anteriores, salimos de las ventanas con Continuar.
Después de nuestras selecciones, como siempre, pinchando en el botón
Aceptar, obtenemos los resultados que vienen a continuación,

Conglomerados jerárquicos

Advertencia

La medida euclídea al cuadrado debería emplearse cuando se solicite el método de


conglomeración CENTROID, MEDIAN o WARD.

Resumen del procesamiento de los casos(a,b)

Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
5 100,0 0 ,0 5 100,0
a distancia euclídea usada
b Vinculación de centroides

Vinculación de centroides
Historial de conglomeración

Etapa en la que el
Conglomerado que se conglomerado aparece
combina por primera vez

Conglomer Conglomer Conglomer Conglomer Próxima


Etapa ado 1 ado 2 Coeficientes ado 1 ado 2 etapa
1 4 5 10,770 0 0 4
2 1 3 11,180 0 0 3
3 1 2 10,701 2 0 4
4 1 4 62,556 3 1 0

[1] [3]
30 ESTADÍSTICA APLICADA CON SPPS

Diagrama de témpanos vertical

Caso
Número de
conglomerados 5 4 2 3 1
1 X X X X X X X X X
2 X X X X X X X X
3 X X X X X X X
4 X X X X X X

Dendrograma
* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S *
* * * * *

Dendrogram using Centroid Method

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+

4 òûòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòø
5 ò÷ ó
1 òø ó
3 òôòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷
2 ò÷

En ellos se observa, en [1] , en la tabla Historial de conglomeración, como


en la Etapa 1, se unen los elementos 4 y 5. En el paso segundo, Etapa 2, se
unen los elementos 1 y 3. Luego, en la Etapa 3, se une el elemento 2 al
elemento 1; mejor dicho, al cluster en el que está el elemento 1, uniéndose
finalmente el cluster donde está el elemento 4 (primer cluster formado) al
cluster donde está el elemento 1.
El Dendograma que aparece en [2] , corresponde a esa aglomeración y en
él parece que se unen aal principio los elementos casi a la vez. Lo que ocurre
es que las distancias a las que se van uniendo son muy inferiores a la de
aglomeración final, como puede verse en [3] .

5.3. Algoritmo k-medias


El proceso para realizar el algoritmo k-medias es similar al realizado para
ejecutar el análisis jerárquico. Esta vez (Figura 5.4) deberemos ejecutar la
secuencia

Analizar → Clasificar → Conglomerados de K medias


ALFONSO GARCÍA PÉREZ 31

Figura 5.4

Ejemplo 5.6-TA ___________________________________________

Después de introducir los datos y ejecutar la secuencia anterior, incluimos las


dos variables en análisis (Figura 5.5)

Figura 5.5

Con el botón Guardar seleccionamos las dos opciones que permite (Figura 5.6)
32 ESTADÍSTICA APLICADA CON SPPS

Figura 5.6

Con el botón Opciones seleccionamos las marcadas en la Figura 5.7

Figura 5.7

Pulsando los botones Continuar y, finalmente, Aceptar, obtenemos los


resultados que aparecen a continuación, los cuales, lógicamente, son los
mismos que los comentados en TA.
ALFONSO GARCÍA PÉREZ 33

Análisis de conglomerados de K medias

Centros iniciales de los conglomerados

Conglomerado
1 2
talla 189,00 170,00
sueldo 100,00 180,00

Historial de iteraciones(a)

Cambio en los centros


de los conglomerados

Iteración 1 2
1 5,385 8,333
2 ,000 ,000
a Se ha logrado la convergencia debido a que los centros de los conglomerados no presentan ningún
cambio o éste es pequeño. El cambio máximo de coordenadas absolutas para cualquier centro es de ,000.
La iteración actual es 2. La distancia mínima entre los centros iniciales es de 82,225.

Centros de los conglomerados finales

Conglomerado
1 2
talla 187,00 175,00
sueldo 105,00 173,33

ANOVA

Conglomerado Error
Media Media
cuadrática gl cuadrática gl F Sig.
talla 172,800 1 19,333 3 8,938 ,058
sueldo 5603,333 1 55,556 3 100,860 ,002
Las pruebas F sólo se deben utilizar con una finalidad descriptiva puesto que los conglomerados han sido
elegidos para maximizar las diferencias entre los casos en diferentes conglomerados. Los niveles críticos
no son corregidos, por lo que no pueden interpretarse como pruebas de la hipótesis de que los centros de
los conglomerados son iguales.

Número de casos en cada conglomerado

Conglomerad 1 2,000
o 2 3,000
Válidos 5,000
Perdidos ,000
34 ESTADÍSTICA APLICADA CON SPPS
ALFONSO GARCÍA PÉREZ 35

Capítulo 6

Análisis Discriminante

6.1. Análisis Discriminante


El Tratamiento Informático de Análisis Discriminante que ejecuta SPSS es
algo distinto que el estudiado en el capítulo 6 de TA.

Figura 6.1

Ejemplo 6.1-TA ___________________________________________

Después de introducir los datos ejecutamos la secuencia que aparece en la


Figura 6.1:
Analizar → Clasificar → Discriminante
36 ESTADÍSTICA APLICADA CON SPPS

Apareciendo el cuadro de diálogo que aparece en la Figura 6.2, en donde se ha


incluido la variable X6 en Variable de agrupación por ser ésta la que determina
los dos grupos que componen los datos.

Figura 6.2

Las otras variables, X1, …,X5 se incluyen en la ventana Independientes. Si se


quiere obtener la Función Discriminante lineal de Fisher, se debe seleccionar
esta opción en el botón Estadísticos (Figura 6.3).

Figura 6.3

Con esta selección obtendríamos los siguientes resultados,


ALFONSO GARCÍA PÉREZ 37

Discriminante

Resumen del procesamiento para el análisis de casos

Casos no ponderados N Porcentaje


Válidos 32 100,0
Excluidos Códigos de grupo
perdidos o fuera de 0 ,0
rango
Perdida al menos una
variable discriminante 0 ,0
Perdidos o fuera de
rango ambos, el
código de grupo y al
0 ,0
menos una de las
variables
discriminantes.
Total excluidos 0 ,0
Casos Totales 32 100,0

Estadísticos de grupo

N válido (según lista)


No
x6 ponderados Ponderados
1,0 x1 17 17,000
x2 17 17,000
x3 17 17,000
x4 17 17,000
x5 17 17,000
2,0 x1 15 15,000
x2 15 15,000
x3 15 15,000
x4 15 15,000
x5 15 15,000
Total x1 32 32,000
x2 32 32,000
x3 32 32,000
x4 32 32,000
x5 32 32,000
38 ESTADÍSTICA APLICADA CON SPPS

Análisis 1

Resumen de las funciones canónicas discriminantes

Autovalores

Correlación
Función Autovalor % de varianza % acumulado canónica
1 ,930(a) 100,0 100,0 ,694
a Se han empleado las 1 primeras funciones discriminantes canónicas en el análisis.

Lambda de Wilks

Contraste de Lambda de
las funciones Wilks Chi-cuadrado gl Sig.
1 ,518 18,083 5 ,003

Coeficientes estandarizados de las funciones discriminantes canónicas

Función
1
x1 ,367
x2 -,578
x3 -,017
x4 ,405
x5 ,627

Matriz de estructura

Función
1
x4 ,830
x1 ,759
x5 ,578
x3 ,246
x2 -,048
Correlaciones intra-grupo combinadas entre las variables discriminantes y las funciones discriminantes
canónicas tipificadas Variables ordenadas por el tamaño de la correlación con la función.

Funciones en los centroides de los grupos

Función
x6 1
1,0 -,877
2,0 ,994
Funciones discriminantes canónicas no tipificadas evaluadas en las medias de los grupos
ALFONSO GARCÍA PÉREZ 39

Estadísticos de clasificación

Coeficientes de la función de clasificación

x6
1,0 2,0
x1 1,468 1,558
x2 2,361 2,205
x3 2,752 2,747
x4 ,775 ,952
x5 ,195 ,372
(Constante) -514,956 -545,419
Funciones discriminantes lineales de Fisher

[1]

Al final de dichos resultados, en [1] , aparecen los coeficientes cuya


diferencia son los obtenidos en TA: 1,468-1,558 = -0’09, 2,361-2,205=0’156,
2,752-2,747=0’005, 0,775-0,952=-0’177, 0,195-0,372=-0’177.
40 ESTADÍSTICA APLICADA CON SPPS
ALFONSO GARCÍA PÉREZ 41

Capítulo 7

Análisis Factorial

7.1. Análisis Factorial


La ejecución del Análisis Factorial con SPSS se lleva a cabo ejecutando la
siguiente secuencia

Analizar → Reducción de datos → Análisis factorial

Como se indica e la Figura 7.1. No obstante, como no hemos dedicado mucho


espacio en el texto de TA a este tipo de análisis no lo desarrollaremos aquí
tampoco.

Figura 7.1
42 ESTADÍSTICA APLICADA CON SPPS
ALFONSO GARCÍA PÉREZ 43

Capítulo 8

Modelos Log-lineales

8.1. Modelos Log-lineales


El estudio de este tipo de modelos puede seguirse en el capítulo 8 del texto
TA. La forma de introducir los datos del ejemplo que sigue fue explicada en el
capítulo 1 de este texto.

Ejemplo 8.1-TA ___________________________________________

Después de introducir los datos ejecutamos la secuencia


:
Analizar → Loglineal → Selección de modelo

Figura 8.1
44 ESTADÍSTICA APLICADA CON SPPS

A continuación nos aparecerá un ventana de diálogo como la de la Figura


8.2, en la que incluiremos todas la variables en la ventana Factores,
delimitando el rango de cada una de las variables con el botón Definir rango.

Figura 8.2

Si tocamos el botón Modelo, podemos definir el modelo log-lineal que


deseemos. Lo más interesante es utilizar la opción que viene por defecto
(Saturado) ya que, de esta manera, analizará todos los modelos log-lineales
posibles y nos dará el mejor de todos ellos. En el botón Opciones, lo mejor es
utilizar las que aparecen en la Figura 8.3.

Figura 8.3
ALFONSO GARCÍA PÉREZ 45

Con todas estas selecciones, los resultados que obtendremos, pulsando


finalmente el botón Aceptar, serán los siguientes,

Loglineal jerárquico
* * * * * * * * H I E R A R C H I C A L L O G L I N E A R * * * * * * * *

DATA Information

56 unweighted cases accepted.


0 cases rejected because of out-of-range factor values.
0 cases rejected because of missing data.
56 weighted cases will be used in the analysis.

FACTOR Information

Factor Level Label


edad 3
sexo 2
fumador 2

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

* * * * * * * * H I E R A R C H I C A L L O G L I N E A R * * * * * * * *

DESIGN 1 has generating class

edad*sexo*fumador

Note: For saturated models ,000 has been added to all observed cells.
This value may be changed by using the CRITERIA = DELTA subcommand.

The Iterative Proportional Fit algorithm converged at iteration 1.


The maximum difference between observed and fitted marginal totals is ,000
and the convergence criterion is ,250

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

Observed, Expected Frequencies and Residuals.

Factor Code OBS count EXP count Residual Std Resid

edad 1
sexo 0
fumador 0 1,0 1,0 ,00 ,00
fumador 1 11,0 11,0 ,00 ,00
sexo 1
fumador 0 7,0 7,0 ,00 ,00
fumador 1 3,0 3,0 ,00 ,00

edad 2
sexo 0
fumador 0 2,0 2,0 ,00 ,00
fumador 1 1,0 1,0 ,00 ,00
sexo 1
fumador 0 5,0 5,0 ,00 ,00
fumador 1 4,0 4,0 ,00 ,00

edad 3
sexo 0
fumador 0 2,0 2,0 ,00 ,00
fumador 1 13,0 13,0 ,00 ,00
sexo 1
fumador 0 6,0 6,0 ,00 ,00

* * * * * * * * H I E R A R C H I C A L L O G L I N E A R * * * * * * * *

Observed, Expected Frequencies and Residuals. (Cont.)


46 ESTADÍSTICA APLICADA CON SPPS

Factor Code OBS count EXP count Residual Std Resid

fumador 1 1,0 1,0 ,00 ,00

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

Goodness-of-fit test statistics

Likelihood ratio chi square = ,00000 DF = 0 P = .


Pearson chi square = ,00000 DF = 0 P = .

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

Tests that K-way and higher order effects are zero.

K DF L.R. Chisq Prob Pearson Chisq Prob Iteration

3 2 5,948 ,0511 7,163 ,0278 4


2 7 29,042 ,0001 26,289 ,0004 2
1 11 34,978 ,0002 37,429 ,0001 0

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

Tests that K-way effects are zero.

K DF L.R. Chisq Prob Pearson Chisq Prob Iteration

1 4 5,936 ,2040 11,139 ,0250 0


2 5 23,094 ,0003 19,126 ,0018 0
3 2 5,948 ,0511 7,163 ,0278 0

* * * * * * * * H I E R A R C H I C A L L O G L I N E A R * * * * * * * *

Tests of PARTIAL associations.

Effect Name DF Partial Chisq Prob Iter

edad*sexo 2 4,533 ,1037 2


edad*fumador 2 ,374 ,8292 2
sexo*fumador 1 15,227 ,0001 2
edad 2 3,855 ,1455 2
sexo 1 ,286 ,5928 2
fumador 1 1,795 ,1803 2

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

Note: For saturated models ,000 has been added to all observed cells.
This value may be changed by using the CRITERIA = DELTA subcommand.

Estimates for Parameters.

edad*sexo*fumador

Parameter Coeff. Std. Err. Z-Value Lower 95 CI Upper 95 CI

1 -,2747356875 ,26302 -1,04454 -,79026 ,24079


2 ,6540635032 ,27777 2,35467 ,10963 1,19850

edad*sexo

Parameter Coeff. Std. Err. Z-Value Lower 95 CI Upper 95 CI

1 -,0380838588 ,26302 -,14479 -,55361 ,47744


2 -,4520733408 ,27777 -1,62749 -,99651 ,09236

edad*fumador
ALFONSO GARCÍA PÉREZ 47

Parameter Coeff. Std. Err. Z-Value Lower 95 CI Upper 95 CI

1 -,3281202374 ,26302 -1,24750 -,84364 ,18740


2 ,2886017987 ,27777 1,03899 -,25583 ,83304_

* * * * * * * * H I E R A R C H I C A L L O G L I N E A R * * * * * * * *

Estimates for Parameters. (Cont.)

sexo*fumador

Parameter Coeff. Std. Err. Z-Value Lower 95 CI Upper 95 CI

1 -,5365625958 ,19113 -2,80724 -,91119 -,16194

edad

Parameter Coeff. Std. Err. Z-Value Lower 95 CI Upper 95 CI

1 ,1788416633 ,26302 ,67995 -,33668 ,69436


2 -,2595429008 ,27777 -,93437 -,80398 ,28489

sexo

Parameter Coeff. Std. Err. Z-Value Lower 95 CI Upper 95 CI

1 -,1235729324 ,19113 -,64652 -,49820 ,25105

fumador

Parameter Coeff. Std. Err. Z-Value Lower 95 CI Upper 95 CI

1 -,0595291157 ,19113 -,31145 -,43415 ,31510

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

* * * * * * * * H I E R A R C H I C A L L O G L I N E A R * * * * * * * *

Backward Elimination (p = ,050) for DESIGN 1 with generating class

edad*sexo*fumador

Likelihood ratio chi square = ,00000 DF = 0 P = .

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

If Deleted Simple Effect is DF L.R. Chisq Change Prob Iter

edad*sexo*fumador 2 5,948 ,0511 4

Step 1

The best model has generating class

edad*sexo
edad*fumador
sexo*fumador

Likelihood ratio chi square = 5,94817 DF = 2 P = ,051

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

If Deleted Simple Effect is DF L.R. Chisq Change Prob Iter

edad*sexo 2 4,533 ,1037 2


edad*fumador 2 ,374 ,8292 2
sexo*fumador 1 15,227 ,0001 2

Step 2

The best model has generating class


48 ESTADÍSTICA APLICADA CON SPPS

edad*sexo
sexo*fumador

Likelihood ratio chi square = 6,32264 DF = 4 P = ,176

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

If Deleted Simple Effect is DF L.R. Chisq Change Prob Iter

edad*sexo 2 6,012 ,0495 2


sexo*fumador 1 16,707 ,0000 2

* * * * * * * * H I E R A R C H I C A L L O G L I N E A R * * * * * * * *

Step 3

The best model has generating class

edad*sexo
sexo*fumador

Likelihood ratio chi square = 6,32264 DF = 4 P = ,176

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

* * * * * * * * H I E R A R C H I C A L L O G L I N E A R * * * * * * * *

The final model has generating class [1]


edad*sexo
sexo*fumador

The Iterative Proportional Fit algorithm converged at iteration 0.


The maximum difference between observed and fitted marginal totals is ,000
and the convergence criterion is ,250

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

Observed, Expected Frequencies and Residuals.

Factor Code OBS count EXP count Residual Std Resid

edad 1
sexo 0
fumador 0 1,0 2,0 -1,00 -,71
fumador 1 11,0 10,0 1,00 ,32
sexo 1
fumador 0 7,0 6,9 ,08 ,03
fumador 1 3,0 3,1 -,08 -,04

edad 2
sexo 0
fumador 0 2,0 ,5 1,50 2,12
fumador 1 1,0 2,5 -1,50 -,95
sexo 1
fumador 0 5,0 6,2 -1,23 -,49
fumador 1 4,0 2,8 1,23 ,74

edad 3
sexo 0
fumador 0 2,0 2,5 -,50 -,32
fumador 1 13,0 12,5 ,50 ,14
sexo 1
fumador 0 6,0 4,8 1,15 ,52
fumador 1 1,0 2,2 -1,15 -,79

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
ALFONSO GARCÍA PÉREZ 49

Goodness-of-fit test statistics

Likelihood ratio chi square = 6,32264 DF = 4 P = ,176 [2]


Pearson chi square = 7,80576 DF = 4 P = ,099

En donde hemos remarcado con [1] que el programa elige como mejor
modelo (ya hechos los tests condicionales para modelos anidados de la
sección 8.4.1 de TA) el mismo que se obtuvo allí. Los tests para este mejor
modelo se observan en [2].
50 ESTADÍSTICA APLICADA CON SPPS
ALFONSO GARCÍA PÉREZ 51

Capítulo 9

Regresión Logística

9.1. Regresión Logística

Este Método Estadístico se estudia en el capítulo 9 del texto TA. Su


tratamiento con SPSS se basa en ejecutar la secuencia

Analizar → Regresión → Logística binaria


Explicaremos su ejecución siguiendo el ejemplo 9.1 de dicho texto.

Ejemplo 9.1-TA ___________________________________________

Después de introducir los datos, ejecutamos la secuencia anterior, como


puede verse en la Figura 9.1

Figura 9.1
52 ESTADÍSTICA APLICADA CON SPPS

Entonces se abre una ventana de diálogo como la de la Figura 9.2 en donde


deberemos incluir la variable dependiente (necesariamente dicotómica) en la
ventana Dependiente; el resto de las covariables en Covariables, marcando
las que sean cualitativas con el botón Categórica.

Figura 9.2

Al correr ahora el programa, presionando el botón Aceptar, se obtienen los


siguientes resultados

Regresión logística

Resumen del procesamiento de los casos

Casos no ponderados(a) N Porcentaje


Casos seleccionados Incluidos en el análisis 50 100,0
Casos perdidos 0 ,0
Total 50 100,0
Casos no seleccionados 0 ,0
Total 50 100,0
a Si está activada la ponderación, consulte la tabla de clasificación para ver el número total de casos.

Codificación de la variable dependiente

Valor original Valor interno


,00 0
1,00 1
ALFONSO GARCÍA PÉREZ 53

Codificaciones de variables categóricas [1]

Codificación de parámetros
Frecuencia (1) (2) (3)
activi ,00 9 1,000 ,000 ,000
1,00 12 ,000 1,000 ,000
2,00 19 ,000 ,000 1,000
3,00 10 ,000 ,000 ,000
presion ,00 24 1,000
1,00 26 ,000
angina ,00 7 1,000
1,00 43 ,000

Bloque 0: Bloque inicial


Tabla de clasificación(a,b)

Observado Pronosticado

infarto
Porcentaje
,00 1,00 correcto
Paso 0 infarto ,00 0 17 ,0
1,00 0 33 100,0
Porcentaje global 66,0
a En el modelo se incluye una constante.
b El valor de corte es ,500

Variables en la ecuación

B E.T. Wald gl Sig. Exp(B)


Paso 0 Constante ,663 ,299 4,936 1 ,026 1,941

Variables que no están en la ecuación

Puntuación gl Sig.
Paso 0 Variables Activi 2,957 3 ,398
activi(1) 2,273 1 ,132
activi(2) ,570 1 ,450
activi(3) ,806 1 ,369
angina(1) 1,410 1 ,235
presion(1) 3,566 1 ,059
Edad ,230 1 ,632
Estadísticos globales 7,395 6 ,286

Bloque 1: Método = Por pasos hacia atrás (Wald)


Pruebas omnibus sobre los coeficientes del modelo
54 ESTADÍSTICA APLICADA CON SPPS

Chi-cuadrado gl Sig.
Paso 1 Paso 8,441 6 ,208
Bloque 8,441 6 ,208
Modelo 8,441 6 ,208
Paso Paso -2,171 3 ,538
2(a) Bloque 6,270 3 ,099
Modelo 6,270 3 ,099
Paso Paso -,707 1 ,400
3(a) Bloque 5,563 2 ,062
Modelo 5,563 2 ,062
Paso Paso -1,912 1 ,167
4(a) Bloque 3,650 1 ,056
Modelo 3,650 1 ,056
a Un valor de chi-cuadrado negativo indica que ha disminuido el valor de chi-cuadrado con respecto al
paso anterior.

Resumen de los modelos

R cuadrado
-2 log de la R cuadrado de de
Paso verosimilitud Cox y Snell Nagelkerke
1 55,662(a) ,155 ,215
2 57,834(a) ,118 ,163
3 58,541(a) ,105 ,146
4 60,453(b) ,070 ,097
a La estimación ha finalizado en el número de iteración 5 porque las estimaciones de los parámetros han
cambiado en menos de ,001.
b La estimación ha finalizado en el número de iteración 4 porque las estimaciones de los parámetros han
cambiado en menos de ,001.

Tabla de clasificación(a)

Observado Pronosticado

infarto
Porcentaje
,00 1,00 correcto
Paso 1 infarto ,00 5 12 29,4
1,00 1 32 97,0
Porcentaje global 74,0
Paso 2 infarto ,00 7 10 41,2
1,00 4 29 87,9
Porcentaje global 72,0
Paso 3 infarto ,00 12 5 70,6
1,00 10 23 69,7
Porcentaje global 70,0
Paso 4 infarto ,00 0 17 ,0
1,00 0 33 100,0
Porcentaje global 66,0
a El valor de corte es ,500
ALFONSO GARCÍA PÉREZ 55

Variables en la ecuación

B E.T. Wald gl Sig. Exp(B)


Paso activi 2,063 3 ,559
1(a) activi(1) -1,221 1,127 1,174 1 ,279 ,295
activi(2) ,017 1,036 ,000 1 ,987 1,017
activi(3) ,088 ,919 ,009 1 ,924 1,092
angina(1) 2,111 1,408 2,248 1 ,134 8,260
presion(1
1,178 ,703 2,812 1 ,094 3,249
)
edad -,038 ,039 ,978 1 ,323 ,962
Constant
2,083 2,223 ,877 1 ,349 8,026
e
Paso angina(1) 1,633 1,204 1,840 1 ,175 5,120
2(a) presion(1
1,328 ,671 3,916 1 ,048 3,773
)
edad -,030 ,036 ,691 1 ,406 ,971
Constant
1,429 1,808 ,625 1 ,429 4,174
e
Paso angina(1) 1,423 1,154 1,520 1 ,218 4,148
3(a) presion(1
1,253 ,651 3,699 1 ,054 3,500
)
Constant
-,036 ,421 ,007 1 ,931 ,964
e
Paso presion(1
1,181 ,638 3,423 1 ,064 3,257
4(a) )
Constant
,154 ,393 ,154 1 ,695 1,167
e
a Variable(s) introducida(s) en el paso 1: activi, angina, presion, edad.

Variables que no están en la ecuación

Puntuación gl Sig.
Paso 2(a) Variables Activi 2,187 3 ,534
activi(1) 2,171 1 ,141
activi(2) ,099 1 ,753
activi(3) ,462 1 ,497
Estadísticos globales 2,187 3 ,534
Paso 3(b) Variables Activi 1,894 3 ,595
activi(1) 1,744 1 ,187
activi(2) ,177 1 ,674
activi(3) ,512 1 ,474
Edad ,706 1 ,401
Estadísticos globales
2,816 4 ,589

Paso 4(c) Variables Activi 1,567 3 ,667


activi(1) 1,163 1 ,281
activi(2) ,153 1 ,696
activi(3) ,631 1 ,427
angina(1) 1,699 1 ,192
Edad ,281 1 ,596
Estadísticos globales 4,107 5 ,534
a Variable(s) eliminada(s) en el paso 2: activi.
b Variable(s) eliminada(s) en el paso 3: edad.
c Variable(s) eliminada(s) en el paso 4: angina. [2]
56 ESTADÍSTICA APLICADA CON SPPS

Es muy interesante la codificación que realiza SPSS, la cual hemos


marcado más arriba con [1] , que indica cuál será el modelo finalmente
ajustado, la cual aparentemente lleva a ajustes de modelos distintos a los
obtenidos con BMDP ó SAS.
En la última tabla hemos marcado con [2] el lugar en el que podemos
observar que la única covariable de las 4 con lo que nos quedamos será la que
no aparece allí, es decir, Presión.
Volviendo a correr el programa ahora sólo con Presión obtendríamos el
modelo final que se ajusta,

log (p/(1-p)) = 0’154 + 1’181 Presión

en donde apuntamos de nuevo la diferencia de codificaciones en las variables


para explicar la aparente diferencia con los resultados de otros paquetes
estadísticos.
ALFONSO GARCÍA PÉREZ 57

Capítulo 10

Regresión Poisson

10.1. Regresión Poisson

El estudio de este tipo de modelos puede seguirse en el capítulo 10 del


texto TA. Su ejecución con SPSS consiste en la secuencia

Analizar → Loglineal → General

Ejemplo 10.1-TA __________________________________________

Después de introducir los datos y ejecutar la secuencia anterior, Figura 10.1,

Figura 10.1

En la ventana que se abra después de hacer dicha selección deberemos incluir


(Figura 10.2) la variable dependiente (es decir, la Tasa) en la ventana
58 ESTADÍSTICA APLICADA CON SPPS

Estructura de las casillas y las covariables cualitativas, Edad y Sexo, en


Factores.

.
Figura 10.2

A continuación, en el botón Modelo, elegimos la opción Personalizado y


completamos la ventana de la derecha desplazando las dos covariables como
Efectos principales (Figura 10.3).

Figura 10.3

Después de aceptar esas selecciones con el botón Continuar, volvemos a


la ventana de diálogo anterior, en donde elegimos las Opciones que aparecen
en la Figura 10.4.
ALFONSO GARCÍA PÉREZ 59

Figura 10.4

Una vez aceptadas éstas con el botón Continuar y ejecutando todas las
selecciones con el botón Aceptar de la ventana de diálogo principal,
obtenemos los resultados que aparecen a continuación,

Loglineal general
Información sobre los datos

N
Casos Válidos 6
Perdidos 0
Válidos
6
ponderados
Casillas Casillas definidas 6
Ceros
0
estructurales
Ceros de
0
muestreo
Categorías edad 3
sexo 2

Información sobre la convergencia(a,b)

Número máximo de
iteraciones 20
Tolerancia de
convergencia ,00100
Máxima diferencia
absoluta final ,00013(c)
Máxima diferencia
relativa final ,00078
Número de iteraciones 3
60 ESTADÍSTICA APLICADA CON SPPS

a Modelo: Poisson
b Diseño: Constante + edad + sexo
c La iteración ha convergido ya que el máximo de cambios absolutos de las estimaciones de los
parámetros es inferior al criterio de convergencia especificado.

Contrastes de bondad de ajuste(a,b)

Valor gl Sig.
Razón de verosimilitudes ,004 2 ,998
Chi-cuadrado de Pearson ,004 2 ,998
a Modelo: Poisson [3]
b Diseño: Constante + edad + sexo

Residuos y recuentos de casillas(a,b)

Observado Esperado
Residuo Residuo
edad sexo Recuento % Recuento % Residual tipificado corregido Desviación
1,00 ,00 1 16,7% ,976 16,3% ,024 ,024 ,041 ,024
1,00 1 16,7% 1,024 17,1% -,024 -,023 -,041 -,023
2,00 ,00 1 16,7% 1,038 17,3% -,038 -,037 -,066 -,038
1,00 1 16,7% ,962 16,0% ,038 ,039 ,066 ,039
3,00 ,00 1 16,7% ,985 16,4% ,015 ,015 ,025 ,015
1,00 1 16,7% 1,015 16,9% -,015 -,014 -,025 -,014
a Modelo: Poisson
b Diseño: Constante + edad + sexo

Estimaciones de los parámetros(b,c)

Intervalo de confianza al
95%
Límite
Parámetro Estimación Error típico Z Sig. Límite inferior superior
Constante 2,540 ,814 3,122 ,002 ,946 4,135
[edad = 1,00] -,328 1,000 -,328 ,743 -2,288 1,632
[edad = 2,00] -,171 1,000 -,171 ,864 -2,131 1,789
[edad = 3,00] 0(a) . . . . .
[sexo = ,00] -,029 ,817 -,036 ,972 -1,630 1,572
[sexo = 1,00] 0(a) . . . . .

[1] [2]
a Este parámetro se ha definido como cero ya que es redundante.
b Modelo: Poisson
c Diseño: Constante + edad + sexo

Correlaciones de las estimaciones de los parámetros(a,b,c)

Constante [edad = 1,00] [edad = 2,00] [sexo = ,00]


Constante 1 -,616 -,604 -,495
[edad = 1,00] -,616 1 ,500 ,004
[edad = 2,00] -,604 ,500 1 -,022
[sexo = ,00] -,495 ,004 -,022 1
a Modelo: Poisson
ALFONSO GARCÍA PÉREZ 61

b Diseño: Constante + edad + sexo


c Los parámetros redundantes no se muestran.

Covarianzas de las estimaciones de los parámetros(a,b,c)

Constante [edad = 1,00] [edad = 2,00] [sexo = ,00]


Constante ,662 -,501 -,491 -,329
[edad = 1,00] -,501 1,000 ,500 ,003
[edad = 2,00] -,491 ,500 1,000 -,018
[sexo = ,00] -,329 ,003 -,018 ,667
a Modelo: Poisson
b Diseño: Constante + edad + sexo
c Los parámetros redundantes no se muestran.

Modelo de Poisson
Frecuencias ...
Frecuencias ...
Residuos corregidos

Frecuencias ... Frecuencias ... Residuos corregidos

Gráfico Q-Q normal de residuos corregidos

1,5

1,0
Valor normal esperado

0,5

0,0

-0,5

-1,0

-1,5

-0,075 -0,050 -0,025 0,000 0,025 0,050 0,075


Residuos corregidos
62 ESTADÍSTICA APLICADA CON SPPS

Gráfico Q-Q normal de residuos corregidos

0,3

0,2

Desviación de normal
0,1

0,0

-0,1

-0,2

-0,3

-0,075 -0,050 -0,025 0,000 0,025 0,050 0,075


Residuos corregidos

En la mencionada salida se observa, marcado con [1] , la codificación que


da SPSS a los parámetros del modelo, haciendo iguales a cero [Edad=3] y
[Sexo=1] ya que de las covariables cualitativas hay que construir el Modelo con
tantas variables indicadoras como clases tengan las covariables cualitativas
menos una.
En [2] aparecen las estimaciones obtenidas, las cuales proporcionan el
Modelo

log Tasa = 2'540 - 0'328 [Edad=1] -0'171 [Edad=2] -0'029 [Sexo=0]

Esto hace que para un Hombre ([Sexo=0]) de 50 a 70 años ([Edad=2]) se


obtenga una predicción en su tasa de supervivencia igual a

log Tasa} = 2'540 - 0'328 * 0 - 0'171 * 1 - 0'029 * 1 = 2'34.

Observemos que en TA obtuvimos, en esta misma situación, prácticamente


el mismo valor pero con signo menos; la razón es que SPSS ajusta un modelo
de la forma ∑ β Xi en donde la variable dependiente que supuestamente sigue
la distribución de Poisson (habitualmente una tasa de fallo) es de la forma

r = exp{- ∑ β Xi }

Por tanto, deberemos cambiar el signo de la tasas ajustadas con SPSS,


quedando, en este caso igual a -2'34, como en TA.
Por último, en [3] , observamos el contraste del modelo ajustado que
claramente puede admitirse.
ALFONSO GARCÍA PÉREZ 63

Capítulo 11

Regresión no Lineal

11.1. Regresión no Lineal


El estudio de la Regresión no Lineal se lleva a cabo en el capítulo 11 del
texto TA. Su ejecución con SPSS se obtienen mediante la secuencia

Analizar → Regresión → No lineal

Ejemplo 11.2-TA __________________________________________

Después de introducir los datos ejecutamos la secuencia anterior, como puede


verse en la Figura 11.1,

Figura 11.1
64 ESTADÍSTICA APLICADA CON SPPS

Entonces se abre una ventana de diálogo como la de la Figura 11.2 en


donde completamos las ventanas según se indica en dicha Figura.

Figura 11.2

Mención especial merece la incorporación de los parámetros. Primero debemos


darle un nombre genérico y un valor inicial (Figura 11.3).

Figura 11.3

En este caso, hemos dado como valores iniciales los mismos que dimos en el
texto TA.
Una vez completados todos los datos se pulsa el botón Aceptar y se
obtienen los siguientes resultados de entre los que destacan las estimaciones
ALFONSO GARCÍA PÉREZ 65

de los parámetros dadas en [1] y los intervalos de confianza para los


parámetros, dados en [2] , los cuales implican la no eliminación de ninguno de
los parámetros al no contener al cero ninguno de los intervalos.

All the derivatives will be calculated numerically.

Iteration Residual SS b1 b2 b3 b4

1 993,2441321 70,0000000 61,0000000 -10,000000 3,00000000


1.1 67,90285456 65,6001840 54,9183822 -12,031581 3,41315663
2 67,90285456 65,6001840 54,9183822 -12,031581 3,41315663
2.1 24,33046743 64,2628457 53,7680819 -15,414270 4,39184922
3 24,33046743 64,2628457 53,7680819 -15,414270 4,39184922
3.1 20,59971311 64,6000975 54,0847130 -16,550650 4,71582674
4 20,59971311 64,6000975 54,0847130 -16,550650 4,71582674
4.1 20,46053149 64,5407676 53,9265466 -16,875970 4,80922669
5 20,46053149 64,5407676 53,9265466 -16,875970 4,80922669
5.1 20,44963384 64,5205754 53,8717716 -16,970436 4,83634021
6 20,44963384 64,5205754 53,8717716 -16,970436 4,83634021
6.1 20,44875851 64,5144551 53,8552854 -16,997416 4,84408360
7 20,44875851 64,5144551 53,8552854 -16,997416 4,84408360
7.1 20,44868814 64,5126874 53,8505316 -17,005080 4,84628342
8 20,44868814 64,5126874 53,8505316 -17,005080 4,84628342
8.1 20,44868248 64,5121838 53,8491779 -17,007254 4,84690719
9 20,44868248 64,5121838 53,8491779 -17,007254 4,84690719
9.1 20,44868203 64,5120408 53,8487936 -17,007870 4,84708406
10 20,44868203 64,5120408 53,8487936 -17,007870 4,84708406
10.1 20,44868199 64,5120002 53,8486844 -17,008045 4,84713430

Run stopped after 20 model evaluations and 10 derivative evaluations.


Iterations have been stopped because the relative reduction between
successive
residual sums of squares is at most SSCON = 1,000E-08

Nonlinear Regression Summary Statistics Dependent Variable y

Source DF Sum of Squares Mean Square

Regression 4 18193,42942 4548,35735


Residual 5 20,44868 4,08974
Uncorrected Total 9 18213,87810

(Corrected Total) 8 4276,50156

R squared = 1 - Residual SS / Corrected SS = ,99522

Asymptotic 95 %
Asymptotic Confidence Interval
Parameter Estimate Std. Error Lower Upper

b1 64,512000215 1,332847270 61,085807233 67,938193196


b2 53,848684361 2,122116694 48,393609734 59,303758988
b3 -17,00804517 2,100618342 -22,40785652 -11,60823382
b4 4,847134303 ,601470650 3,301004775 6,393263832

[1] [2] [2]


66 ESTADÍSTICA APLICADA CON SPPS

Asymptotic Correlation Matrix of the Parameter Estimates

b1 b2 b3 b4

b1 1,0000 ,7084 ,3246 -,3477


b2 ,7084 1,0000 ,6106 -,6140
b3 ,3246 ,6106 1,0000 -,9991
b4 -,3477 -,6140 -,9991 1,0000
ALFONSO GARCÍA PÉREZ 67

Capítulo 12

Análisis de la Varianza con Medidas Repetidas

12.1. Análisis de la Varianza con Medidas Repetidas

Este Método Estadístico se estudia en el capítulo 12 del texto TA. Su


tratamiento con SPSS se basa en ejecutar la secuencia

Analizar → Modelo lineal general → Medidas repetidas

Ejemplo 12.1-TA __________________________________________

El propósito que se persigue es, como allí, contrastar la igualdad de


crecimiento medio entre las mandíbulas de chicos y chicas, contrastando la
hipótesis nula

H0: µh = µm

además, contrastar si ha habido variación significativa a lo largo del tiempo de


observación, contrastando

H0': µ8 = µ10 = µ12 = µ14

y analizando también, por último, si existe o no interacción entre ambos


factores, contrastando la hipótesis

H0'': No existe interacción entre Sexo y Edad


Primero debemos introducir los datos mediante la utilización de tantas
variables como clases presente la Repetición, en nuestro caso, cuatro. Esto lo
hacemos como se indica en la Figura 12.1.
Después debemos ejecutar la secuencia antes comentada, como aparece
en la Figura 12.2.
68 ESTADÍSTICA APLICADA CON SPPS

Figura 12.1

Después debemos ejecutar la secuencia antes comentada, como aparece


en la Figura 12.2.

Figura 12.2

Se abre entonces una ventana que solicita un nombre para la variable


Repetición. En la Figura 12.3 le hemos dado el nombre de edad; nos pide
también el número de niveles a los que actúa esta variable Repetición, el cual
es, en nuestro caso, igual a 4.
ALFONSO GARCÍA PÉREZ 69

Figura 12.3

Finalmente, debemos presionar, primero el botón Añadir y luego Definir, para


indicarle al SPSS, cuáles de las variables que definen los datos, son los niveles
de la variable Repetición, como puede observarse en la Figura 12.4, incluyendo
también a la variable sexo en la ventana Factores inter-sujetos.

Figura 12.4

Finalmente, presionando el botón Aceptar de esta última ventana, se


obtienen los resultados que aparecen a continuación.
70 ESTADÍSTICA APLICADA CON SPPS

Modelo lineal general


Factores intra-sujetos

Medida: MEASURE_1
Variable
edad dependiente
1 edad8
2 edad10
3 edad12
4 edad14

Factores inter-sujetos

N
sexo 1 1
1
2 1
1

Contrastes multivariados(b)

Gl de la
Efecto Valor F hipótesis Gl del error Significación
Edad Traza de Pillai ,869 39,787(a) 3,000 18,000 ,000
Lambda de
,131 39,787(a) 3,000 18,000 ,000
Wilks
Traza de
6,631 39,787(a) 3,000 18,000 ,000
Hotelling
Raíz mayor de
6,631 39,787(a) 3,000 18,000 ,000
Roy
edad * sexo Traza de Pillai ,264 2,149(a) 3,000 18,000 ,130
Lambda de
,736 2,149(a) 3,000 18,000 ,130
Wilks
Traza de
,358 2,149(a) 3,000 18,000 ,130
Hotelling
Raíz mayor de
,358 2,149(a) 3,000 18,000 ,130
Roy
a Estadístico exacto
b Diseño: Intercept+sexo Diseño intra sujetos: edad

Prueba de esfericidad de Mauchly(b)

Medida: MEASURE_1

Epsilon(a)
Chi-cuadrado Greenhouse-
Efecto intra-sujetos W de Mauchly aprox. gl Significación Geisser Huynh-Feldt Límit
Edad ,599 9,583 5 ,088 ,733 ,869
Contrasta la hipótesis nula de que la matriz de covarianza error de las variables dependientes
transformadas es proporcional a una matriz identidad.
a Puede usarse para corregir los grados de libertad en las pruebas de significación promediadas. Las
pruebas corregidas se muestran en la tabla Pruebas de los efectos inter-sujetos.
b Diseño: Intercept+sexo Diseño intra sujetos: edad
ALFONSO GARCÍA PÉREZ 71

Pruebas de efectos intra-sujetos.

Medida: MEASURE_1
Suma de
cuadrados Media
Fuente tipo III gl cuadrática F Significación
edad Esfericidad
asumida
149,940 3 49,980 32,551 [2] ,000
Greenhouse-
149,940 2,199 68,182 32,551 ,000
Geisser
Huynh-Feldt 149,940 2,606 57,547 32,551 ,000
Límite-inferior 149,940 1,000 149,940 32,551 ,000
edad * sexo Esfericidad
asumida
9,372 3 3,124 2,035 [3] ,119
Greenhouse-
9,372 2,199 4,262 2,035 ,139
Geisser
Huynh-Feldt 9,372 2,606 3,597 2,035 ,128
Límite-inferior 9,372 1,000 9,372 2,035 ,169
Error(edad) Esfericidad
92,125 60 1,535
asumida
Greenhouse-
92,125 43,982 2,095
Geisser
Huynh-Feldt 92,125 52,111 1,768
Límite-inferior 92,125 20,000 4,606

Pruebas de contrastes intra-sujetos

Medida: MEASURE_1
Suma de
cuadrados Media
Fuente edad tipo III Gl cuadrática F Significación
edad Lineal 146,051 1 146,051 123,999 [4] ,000
Cuadrático 1,776 1 1,776 2,260 ,148
Cúbico 2,114 1 2,114 ,800 ,382
edad * sexo Lineal 4,105 1 4,105 3,485 ,077
Cuadrático 2,071 1 2,071 2,636 ,120
Cúbico 3,196 1 3,196 1,209 ,285
Error(edad) Lineal 23,557 20 1,178
Cuadrático 15,716 20 ,786
Cúbico 52,852 20 2,643

Pruebas de los efectos inter-sujetos

Medida: MEASURE_1
Variable transformada: Promedio
Suma de
cuadrados Media
Fuente tipo III gl cuadrática F Significación
Intersección 50376,480 1 50376,480 2858,148 ,000
sexo 143,821 1 143,821 8,160 [1] ,010
Error 352,511 20 17,626
72 ESTADÍSTICA APLICADA CON SPPS

En donde hemos marcado con [1] , [2] y [3] los tres tests que estudiamos
en TA, antes mencionados, respectivamente, sobre la igualdad de los dos
niveles de Sexo, de los cuatro niveles de la variable Repetición Edad, y sobre
la ausencia de interacción entre Sexo y Edad. En [4] aparece el test de
linealidad allí estudiado.
ALFONSO GARCÍA PÉREZ 73

Capítulo 13

Análisis de Series Temporales

13.1. Introducción

El Análisis de Series Temporales se estudió en el capítulo 13 de TA.

13.2. Identificación del modelo


Los gráficos necesarios para identificar el modelo se obtienen ejecutando la
secuencia

Gráficos → Serie temporal → Autocorrelación

Ejemplo 13.1-TA __________________________________________

Ejecutando la secuencia anterior (Figura 13.1)

Figura 13.1
74 ESTADÍSTICA APLICADA CON SPPS

Obtenemos los siguientes resultados en donde se observa que los dos últimos
gráficos se corresponden exactamente con las figuras 13.2 y 13.4 del texto TA,
funciones ACF y PACF respectivamente, con la excepción del primer valor que,
como allí dijimos, es siempre igual a 1 y que aquí desaparece.

Autocorrelaciones simples
MODEL: MOD_2.

Autocorrelations: niveles

Auto- Stand.
Lag Corr. Err. -1 -.75 -.5 -.25 0 .25 .5 .75 1 Box-
Ljung Prob.
ùòòòòôòòòòôòòòòôòòòòôòòòòôòòòòôòòòòôòòòòú
1 ,576 ,140 . ó*****.******
16,914 ,000
2 ,182 ,138 . ó**** .
18,639 ,000
3 -,145 ,137 . ***ó .
19,756 ,000
4 -,175 ,135 . ***ó .
21,423 ,000
5 -,150 ,134 . ***ó .
22,673 ,000
6 -,021 ,132 . * .
22,698 ,001
7 -,020 ,131 . * .
22,722 ,002
8 -,004 ,129 . * .
22,723 ,004
9 -,136 ,127 . ***ó .
23,856 ,005
10 -,154 ,126 . ***ó .
25,351 ,005
11 -,097 ,124 . **ó .
25,964 ,007
12 ,049 ,122 . ó* .
26,124 ,010
13 ,120 ,121 . ó** .
27,104 ,012
14 ,087 ,119 . ó** .
27,635 ,016
15 ,119 ,117 . ó** .
28,663 ,018
16 ,151 ,115 . ó*** .
30,374 ,016

Plot Symbols: Autocorrelations * Two Standard Error Limits .

Total cases: 48 Computable first lags: 47


ALFONSO GARCÍA PÉREZ 75

Partial Autocorrelations: niveles

Pr-Aut- Stand.
Lag Corr. Err. -1 -.75 -.5 -.25 0 .25 .5 .75 1
ùòòòòôòòòòôòòòòôòòòòôòòòòôòòòòôòòòòôòòòòú
1 ,576 ,144 . ó*****.******
2 -,223 ,144 . ****ó .
3 -,227 ,144 .*****ó .
4 ,103 ,144 . ó** .
5 -,076 ,144 . **ó .
6 ,068 ,144 . ó* .
7 -,104 ,144 . **ó .
8 ,012 ,144 . * .
9 -,188 ,144 . ****ó .
10 ,003 ,144 . * .
11 ,066 ,144 . ó* .
12 ,032 ,144 . ó* .
13 ,022 ,144 . * .
14 -,093 ,144 . **ó .
15 ,230 ,144 . ó*****.
16 ,044 ,144 . ó* .

Plot Symbols: Autocorrelations * Two Standard Error Limits .

Total cases: 48 Computable first lags: 47

niveles

1,0 Coeficiente
Límite superior
de confianza
Límite inferior
de confianza

0,5
ACF

0,0

-0,5

-1,0

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
No de retardos
76 ESTADÍSTICA APLICADA CON SPPS

niveles

1,0 Coeficiente
Límite superior
de confianza
Límite inferior
de confianza

0,5
ACF parcial

0,0

-0,5

-1,0

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
No de retardos

13.3. Estimación de parámetros


La estimación de los parámetros del modelo ARIMA(p,d,q) seleccionado en
la sección anterior se lleva a cabo con la secuencia

Analizar → Series temporales → ARIMA

Ejemplo 13.1-TA(continuación) ________________________________

Ejecutando la secuencia anterior a los datos del ejemplo 13.1 del texto 13.1,
como se indica en la Figura 13.2 aparece la ventana de diálogo de la Figura
13.3 en donde incluimos la variable en estudio como variable Dependiente
según se indica en la Figura 13.3, así como los valores del modelo ARIMA a
ajustar
ALFONSO GARCÍA PÉREZ 77

Figura 13.2

Figura 13.3

Antes de preceder a ejecutar el Análisis, es conveniente modificar un tanto


las Opciones, eligiendo las que aparecen en la Figura 13.4. En concreto, en lo
Que se refiere al número de iteraciones (aumentándolo), a los niveles de
tolerancia (disminuyéndolos) y a la eliminación de los cálculos intermedios, de
manera que sólo nos dé las estimaciones finales.
78 ESTADÍSTICA APLICADA CON SPPS

Figura 13.4

Con estas selecciones, pulsando los botones Continuar y luego Aceptar,


se obtuvieron los siguientes resultados, en donde pueden verse, en [1] , los
valores de las estimaciones obtenidas, las mismas que en TA pero con el signo
cambiado la del coeficiente de la Media Móvil. En [2] aparece el valor del
logaritmo de la verosimilitud alcanzada y, en [3] , el de la cantidad de
información de Akaike.

Arima

MODEL: MOD_1

Split group number: 1 Series length: 48


No missing data.
Melard's algorithm will be used for estimation.

Conclusion of estimation phase.


Estimation terminated at iteration number 68 because:
Sum of squares decreased by less than ,0001 percent.

FINAL PARAMETERS:

Number of residuals 48
Standard error ,45291761
Log likelihood -28,798731 [2]
AIC 63,597462 [3]
SBC 69,211065
ALFONSO GARCÍA PÉREZ 79

Analysis of Variance:

DF Adj. Sum of Squares Residual Variance

Residuals 45 9,3163187 ,20513437

Variables in the Model:

B SEB T-RATIO APPROX. PROB.

AR1 ,4478397 ,22299179 2,008324 ,05063335


MA1 -,2041347 ,24527657 -,832263 ,40965538
CONSTANT 2,4100066 ,13973742 17,246680 ,00000000

[1]
The following new variables are being created:

Name Label

FIT_1 Fit for niveles from ARIMA, MOD_1 CON


ERR_1 Error for niveles from ARIMA, MOD_1 CON
LCL_1 95% LCL for niveles from ARIMA, MOD_1 CON
UCL_1 95% UCL for niveles from ARIMA, MOD_1 CON
SEP_1 SE of fit for niveles from ARIMA, MOD_1 CON
80 ESTADÍSTICA APLICADA CON SPPS
ALFONSO GARCÍA PÉREZ 81

Capítulo 14

Control Estadístico de la Calidad

14.1. Gráfico de control para la media


Para obtener el gráfico de control para la media deberemos ejecutar la
secuencia,
Gráficos → Control

Explicaremos su ejecución siguiendo el ejemplo 14.1 de dicho texto.

Ejemplo 14.1-TA __________________________________________

Advertimos que el gráfico de control que se obtiene con SPSS es el caso


correspondiente a no tener un patrón dado. Además, los límites inferior y supe-

Figura 14.1
82 ESTADÍSTICA APLICADA CON SPPS

rior proporcionados por SPSS son un poco diferentes de los obtenidos en TA.
Para ejecutar este ejemplo, después de introducir los datos ejecutamos la
secuencia anterior, como se indica e la Figura 14.1. Se abrirá, entonces, una
ventana de diálogo como la de la Figura 14.2,

Figura 14.2

en donde deberemos seleccionar, para este ejemplo, el primero de los gráficos,


X-barra, R, S y también la opción, los casos son unidades .

Figura 14.3
ALFONSO GARCÍA PÉREZ 83

Ahora, presionando el botón Definir se abre una ventana como la de la


Figura 14.3 en donde le indicamos cuál es la variable en observación en
Medida del proceso, en nuestro caso longitud, y cuál es la variable que define
los grupos, en la ventana Subgrupos definidos por, en nuestro ejemplo,
grupo.
Presionando finalmente le botón Aceptar, obtenemos los siguientes
resultados, en donde destaca el gráfico de control para la media, dado en [1] .

Gráfico SP

Gráfico de control: longitud

11,5
longitud
LCS =
11,47943219
11,0 Promedio =
10,09015853
LCI =
8,70088487
10,5
Media

10,0

9,5

9,0

8,5
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Nivel sigma: 3

[1]
84 ESTADÍSTICA APLICADA CON SPPS

Gráfico de control: longitud

6
longitud
LCS =
5,09278694
5 Promedio =
2,40850745
LCI = ,
00000000
4
Amplitud

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Nivel sigma: 3

También podría gustarte