Está en la página 1de 42

ESTADÍSTICA BÁSICA APLICADA

CON SPSS

Alfonso García Pérez


María Yolanda Cabrero Ortega
2 ESTADÍSTICA BÁSICA APLICADA CON SPPS

Copyright © 2010 Alfonso García Pérez


María Yolanda Cabrero Ortega

``No está permitida la reproducción total o parcial de este


libro, ni su tratamiento informático, ni la transmisión de
ninguna forma o por cualquier medio, ya sea electrónico,
mecánico, por fotocopia, por registro u otros medios, sin el
permiso previo y por escrito de los titulares del Copyright.
El contenido de este libro está registrado por el autor en el
Registro de la Propiedad Intelectual y protegido por la Ley,
que establece penas de prisión además de las correspondientes
indemnizaciones para quien lo plagiara"

Edita: Universidad Nacional de Educación a Distancia


ALFONSO GARCÍA PÉREZ y
MARÍA YOLANDA CABRERO ORTEGA 3

Contenido

Prólogo………………………………………………………. 5
Capítulo 1: Introducción al SPSS ……………………… 7
Capítulo 2: Estadística Descriptiva ……………………. 11
Capítulo 3: Intervalos y Contrastes básicos .………… 17
Capítulo 4: Análisis de la Varianza ……..………........... 19
Capítulo 5: Regresión Lineal y Correlación ..………… 31
Capítulo 6: Tablas de Contingencia …………............... 37
4 ESTADÍSTICA BÁSICA APLICADA CON SPPS
ALFONSO GARCÍA PÉREZ y
MARÍA YOLANDA CABRERO ORTEGA 5

Prólogo

El presente texto es dedicado al Tratamiento Informático del curso Estadística


Aplicada a las Ciencias de la Salud. En él se analiza el uso de SPSS.

No obstante, ya adelantamos que no es exhaustivo en cuanto al análisis de


todos los Métodos a los que dicho paquete se puede aplicar, ya que la mejor
manera de aprenderlo es utilizarlo y, en la mayoría de las ocasiones, los
comentarios resultan redundantes ante la sencillez de manejo de este software.

Dado que los ejemplos que analizaremos en este texto son los del libro
Estadística Aplicada: Conceptos Básicos, no repetiremos aquí los enunciados
de dichos ejemplos, indicándolos con la abreviatura CB y el número del
ejemplo correspondiente.

Por último, le recordamos que puede ver más grandes la reproducciones de la


pantalla, es decir, las ventanas, utilizando el zoom de su pdf.

Alfonso García Pérez


María Yolanda Cabrero Ortega
agar-per@ccia.uned.es
6 ESTADÍSTICA BÁSICA APLICADA CON SPPS
ALFONSO GARCÍA PÉREZ y
MARÍA YOLANDA CABRERO ORTEGA 7

Capítulo 1

Introducción al SPSS

1.1. Introducción
Una de las características más destacadas de SPSS (en especial con
respecto a BMDP o SAS) es que no es necesario conocer un lenguaje de
programación para utilizarlo (aunque lo tiene). Su exitosa presentación de
“Métodos Estadísticos a ejecutar” en forma de persianas, permite comenzar a
utilizarlo casi sin conocimientos previos del paquete.
Por esta razón, este texto será simple y breve ya que, sin duda, la mejor
manera de aprende a manejar SPSS es utilizarlo.

1.2. El editor de datos


Lo primero que analizaremos es cómo introducir los datos de nuestro
problema, definiendo las variables a analizar con posterioridad.
Al abrir el paquete SPSS nos aparece un cuadro como el de la Figura 1.1,
en el que, si queremos ir tecleando los datos, elegiremos la opción Introducir
datos, apareciendo, a continuación el editor de datos en blanco en el que
debemos introducir los datos observados en el primer individuo de la primera
variable en la primera fila de la primera columna.
Para ir viendo cómo funciona el editor de datos, vamos a considerar un
ejemplo

Ejemplo 1.1 _____________________________________________

Se eligió al azar una muestra de 56 individuos de una población a los que se


clasificó según su Edad, su Sexo y según si era o no Fumador, obteniéndose
los siguientes datos:
8 ESTADÍSTICA BÁSICA APLICADA CON SPPS

Menores de 20 años
Hombre Mujer
Sí fuma 11 3
No fuma 1 7

Entre 20 y 50 años
Hombre Mujer
Sí fuma 1 4
No fuma 2 5

Mayores de 50 años
Hombre Mujer
Sí fuma 13 1
No fuma 2 6

En determinados modelos, las variables deben ser categóricas; es decir, deben


definir categorías en las que clasificar los datos. Nosotros, de momento,
utilizaremos datos de tipo numérico. Para ello, lo más simple es ir introduciendo
los datos y más tarde, modificar, si es necesario, sus propiedades.

Figura 1.1

Para el ejemplo en cuestión, incluiremos (por este orden) datos de las tres
variables: la variable Edad, con tres valores, 1 para los individuos menores de
20 años, 2 para los individuos entre 20 y 50 años y 3 para los individuos
mayores de 50 años.
Para la variable Sexo, dos valores, 0 para los hombres y 1 para las mujeres.
Y, finalmente, la variable Fumador, con dos valores, 0 para los individuos
que no fuman y 1 para los que sí fuman.
Así, los datos de los individuos de la tabla anterior serán los de la Figura 1.2.
ALFONSO GARCÍA PÉREZ y
MARÍA YOLANDA CABRERO ORTEGA 9

Figura 1.2

Con objeto de introducir el nombre de las variables, pincharemos con el Ratón


la pestaña de abajo Vista de variables, apareciendo un panel como el de la
Figura 1.3. Pinchando el 1, podremos teclear el nombre de las tres variables
así como sus principales características. Volveremos al editor de datos
pinchando en la pestaña inferior, Vista de datos.

Figura 1.3

En la barra de arriba (en Archivo) deberemos salvar nuestro fichero de datos.


Si nuestros datos están ya en un archivo, debemos incluirlos en el Editor de
datos con la opción: Archivo → Abrir → Datos (Figura 1.4)
10 ESTADÍSTICA BÁSICA APLICADA CON SPPS

Figura 1.4
ALFONSO GARCÍA PÉREZ y
MARÍA YOLANDA CABRERO ORTEGA 11

Capítulo 2

Estadística Descriptiva

2.1. Distribuciones de Frecuencias, Representaciones Gráficas,


Medidas de Posición y Dispersión
El estudio de las técnicas estudiadas aquí, puede seguirse en el Capítulo 2
del texto CB.
Una de las ventajas de SPSS es que, de una vez, obtenemos la mayoría de
los resultados en los que estamos interesados.

Ejemplo 2.1-CB ___________________________________________

Después de introducir los datos, ejecutamos la secuencia

Analizar → Estadísticos Descriptivos → Frecuencias

Figura 2.1
12 ESTADÍSTICA BÁSICA APLICADA CON SPPS

apareciéndonos una ventana de diálogo como la de la Figura 2.2

Figura 2.2

Ahora, pasamos la variable en estudio, nivel, al cuadro de la derecha,


completamos lo estadísticos que queremos calcule en el botón Estadísticos,
que en nuestro caso hemos elegido según la Figura 2.3

Figura 2.3

cerrando la ventana con el botón Continuar.


Lo mismo hacemos con el botón Gráficos, con el que, en este caso, hemos
elegido las opciones que aparecen en la Figura 2.4,
ALFONSO GARCÍA PÉREZ y
MARÍA YOLANDA CABRERO ORTEGA 13

Figura 2.4

Ya podemos ejecutar nuestras elecciones efectuadas con las anteriores


ventanas de diálogo, presionando el botón Aceptar. No obstante, queremos
señalar que, todo lo que hemos ido seleccionando, se ha ido traduciendo al
lenguaje SPSS dentro de lo que aparece en el botón Pegar, que si lo
presionamos aparecerá, en este ejemplo,

FREQUENCIES
VARIABLES=nivel
/NTILES= 4
/STATISTICS=STDDEV VARIANCE RANGE MINIMUM MAXIMUM MEAN MEDIAN MODE
SKEWNESS
SESKEW KURTOSIS SEKURT
/HISTOGRAM NORMAL
/ORDER= ANALYSIS .

Ésta es la denominada Sintaxis SPSS o Lenguaje de Programación SPSS, que


podemos salvar, guardar, modificar y ejecutar en lugar de utilizar las persianas
que aparecen arriba del Editor de Datos. No obstante, como precisamente
éstas son la ventaja de SPSS, no utilizaremos la sintaxis de este paquete sino
dichas persianas, pero queremos que el lector tenga presente siempre la
existencia subyacente de estos programas.
O bien mediante los menús o bien con la sintaxis, para este ejemplo
obtendríamos los siguientes resultados:
14 ESTADÍSTICA BÁSICA APLICADA CON SPPS

Estadísticos

nivel
N Válidos 34
Perdidos 0
Media 11,3529
Mediana 11,4500
Moda 12,50
Desv. típ. 1,87459
Varianza 3,514
Asimetría ,536
Error típ. de asimetría ,403
Curtosis ,876
Error típ. de curtosis ,788
Rango 8,70
Mínimo 7,80
Máximo 16,50
Percentiles 25 10,0500
50 11,4500
75 12,4000

nivel

Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válidos 7,80 1 2,9 2,9 2,9
8,50 1 2,9 2,9 5,9
8,60 1 2,9 2,9 8,8
9,10 1 2,9 2,9 11,8
9,20 1 2,9 2,9 14,7
9,30 1 2,9 2,9 17,6
9,70 1 2,9 2,9 20,6
9,90 1 2,9 2,9 23,5
10,10 1 2,9 2,9 26,5
10,20 1 2,9 2,9 29,4
10,30 1 2,9 2,9 32,4
10,60 1 2,9 2,9 35,3
10,80 1 2,9 2,9 38,2
11,10 2 5,9 5,9 44,1
11,30 1 2,9 2,9 47,1
11,40 1 2,9 2,9 50,0
11,50 1 2,9 2,9 52,9
11,60 1 2,9 2,9 55,9
11,80 1 2,9 2,9 58,8
11,90 1 2,9 2,9 61,8
12,00 1 2,9 2,9 64,7
12,20 1 2,9 2,9 67,6
12,30 2 5,9 5,9 73,5
ALFONSO GARCÍA PÉREZ y
MARÍA YOLANDA CABRERO ORTEGA 15

12,40 2 5,9 5,9 79,4


12,50 3 8,8 8,8 88,2
12,70 1 2,9 2,9 91,2
14,90 1 2,9 2,9 94,1
15,00 1 2,9 2,9 97,1
16,50 1 2,9 2,9 100,0
Total 34 100,0 100,0

Histograma

6
Frecuencia

Media =11,3529
Desviación típica =1,
87459
0 N =34
8,00 10,00 12,00 14,00 16,00 18,00
nivel

El histograma final se puede editar y cambiar los colores, el título, etc.


Con la secuencia

Gráficos → Histograma

podemos volver a obtener el histograma anterior, pero lo que queremos señalar


es que la persiana de Gráficos, permite obtener gráficos de ata calidad sin
tener que realizar análisis estadístico alguno.
16 ESTADÍSTICA BÁSICA APLICADA CON SPPS

Figura 2.5
ALFONSO GARCÍA PÉREZ y
MARÍA YOLANDA CABRERO ORTEGA 17

Capítulo 3

Intervalos y Contrastes básicos

3.1. Intervalos y tests t-Student


SPSS calcula, básicamente, intervalos y tests de la t de Student. Aunque en
CB resolvimos este ejemplo con un intervalo basado en la normal, lo
ejecutaremos a continuación con uno basado en la t de Student. Dado que se
consideran 35 observaciones, las diferencias apenas si existe entre ambas
metodologías.

Ejemplo 6.2-CB ___________________________________________

Después de introducir los datos, ejecutamos la secuencia

Analizar → Comparar medias → Prueba T para una muestra

Figura 3.1
18 ESTADÍSTICA BÁSICA APLICADA CON SPPS

A continuación aparece (Figura 3.2) el siguiente cuadro de diálogo en donde


hemos trasladado la variable en estudio al cuadro de la derecha.
El 0 de la ventana Valor de Prueba es la hipótesis nula a contrastar. Con el
botón Opciones podemos solicitar el intervalo de confianza para el coeficiente
de confianza deseado.

Figura 3.2

El resultado obtenido es el siguiente:

Estadísticos para una muestra

Desviación Error típ. de


N Media típ. la media
Actividad 35 ,75300 ,518283 ,087606

Prueba para una muestra

Valor de prueba = 0
95% Intervalo de
confianza para la
diferencia
Diferencia
t gl Sig. (bilateral) de medias Inferior Superior
Actividad 8,595 34 ,000 ,753000 ,57496 ,93104

Al final del segundo cuadro vemos el intervalo de confianza de confianza 0’95.


ALFONSO GARCÍA PÉREZ y
MARÍA YOLANDA CABRERO ORTEGA 19

Capítulo 4

Análisis de la Varianza

4.1. Un Factor: Diseño Completamente Aleatorizado


El estudio del test analizado aquí, puede estudiar en la Sección 8.2 del texto
CB.

Ejemplo 8.1-CB ___________________________________________

Después de introducir los datos, primero vamos a visualizar los datos dibujando
un Diagrama de Cajas mediante la secuencia (Figura 4.1)

Gráficos → Diagramas de Cajas

Figura 4.1

con lo que se abre la ventana de diálogo de la Figura 4.2


20 ESTADÍSTICA BÁSICA APLICADA CON SPPS

Figura 4.2

en la que seleccionamos definir, haciéndolo según la Figura 4.3

Figura 4.3

Ahora, con el botón Aceptar obtenemos los siguientes resultados,


ALFONSO GARCÍA PÉREZ y
MARÍA YOLANDA CABRERO ORTEGA 21

dieta
Resumen del procesamiento de los casos

Casos
Válidos Perdidos Total
dieta N Porcentaje N Porcentaje N Porcentaje
peso 1 5 100,0% 0 ,0% 5 100,0%
2 5 100,0% 0 ,0% 5 100,0%
3 5 100,0% 0 ,0% 5 100,0%

peso

36,00
peso

33,00

30,00

1 2 3
dieta

en donde destaca el último gráfico, el Diagrama de Cajas buscado, en donde


se puede apreciar que puede aceptarse una dispersión parecida en los tres
“tratamientos” del factor dieta.
22 ESTADÍSTICA BÁSICA APLICADA CON SPPS

El Análisis de la Varianza para un factor puede hacerse ahora con la


secuencia

Analizar → Comparar medias → ANOVA de un factor

pero preferimos seguir la secuencia (Figura 4.4)

Analizar → Modelo lineal general → Univariante

por ser este análisis el más simple de Modelo Lineal General

Figura 4.4

La ventana de diálogo que aparece a continuación se completa como se indica

Figura 4.5
ALFONSO GARCÍA PÉREZ y
MARÍA YOLANDA CABRERO ORTEGA 23

en la Figura 4.5. Con el botón Aceptar obtendríamos ahora los siguientes


resultados

Factores inter-sujetos

N
dieta 1 5
2 5
3 5

Pruebas de los efectos inter-sujetos

Variable dependiente: peso


Suma de
cuadrados Media
Fuente tipo III gl cuadrática F Significación
Modelo corregido 20,133(a) 2 10,067 1,144 ,351
Intersección 16800,267 1 16800,267 1909,121 ,000
dieta 20,133 2 10,067 1,144 ,351
Error 105,600 12 8,800
Total 16926,000 15
Total corregida 125,733 14
a R cuadrado = ,160 (R cuadrado corregida = ,020)

de donde destaca el último cuadro que es la tabla de Análisis de la Varianza

Ejemplo 8.2-CB ___________________________________________

Después de introducir los datos y de ver con un diagrama de cajas que puede
admitirse la hipótesis de homocedasticidad, correríamos un Análisis de la
Varianza como antes, obteniendo la tabla final

Pruebas de los efectos inter-sujetos

Variable dependiente: insulina


Suma de
cuadrados Media
Fuente tipo III gl cuadrática F Significación
Modelo corregido 154,920(a) 4 38,730 29,755 ,000
Intersección 957,071 1 957,071 735,281 ,000
estimula 154,920 4 38,730 29,755 ,000
Error 45,557 35 1,302
Total 1157,548 40
Total corregida 200,477 39
a R cuadrado = ,773 (R cuadrado corregida = ,747)
24 ESTADÍSTICA BÁSICA APLICADA CON SPPS

que indica rechazar la hipótesis nula de igualdad de los efectos medios de los
cinco estimulantes. Para ejecutar test de comparaciones múltiples elegimos el
botón Post hoc y completamos el cuadro de diálogo con varios de estos tests,
una vez trasladada la variable en estudio al cuadro de la derecha (Figura 4.6)

Figura 4.6

Los resultados así obtenidos (además de la tabla ANOVA anterior) aparecen a


continuación,

Pruebas post hoc

estimula
Comparaciones múltiples

Variable dependiente: insulina

Intervalo de confianza al
95%.
Diferencia
entre medias Límite
(I) estimula (J) estimula (I-J) Error típ. Significación Límite inferior superior
DHS de Tukey 1 2 -,0263 ,57045 1,000 -1,6663 1,6138
3 -2,2800(*) ,57045 ,003 -3,9201 -,6399
4 -4,3900(*) ,57045 ,000 -6,0301 -2,7499
5 -4,4363(*) ,57045 ,000 -6,0763 -2,7962
2 1 ,0263 ,57045 1,000 -1,6138 1,6663
3 -2,2538(*) ,57045 ,003 -3,8938 -,6137
4 -4,3638(*) ,57045 ,000 -6,0038 -2,7237
5 -4,4100(*) ,57045 ,000 -6,0501 -2,7699
3 1 2,2800(*) ,57045 ,003 ,6399 3,9201
2 2,2538(*) ,57045 ,003 ,6137 3,8938
4 -2,1100(*) ,57045 ,006 -3,7501 -,4699
ALFONSO GARCÍA PÉREZ y
MARÍA YOLANDA CABRERO ORTEGA 25

5 -2,1563(*) ,57045 ,005 -3,7963 -,5162


4 1 4,3900(*) ,57045 ,000 2,7499 6,0301
2 4,3638(*) ,57045 ,000 2,7237 6,0038
3 2,1100(*) ,57045 ,006 ,4699 3,7501
5 -,0463 ,57045 1,000 -1,6863 1,5938
5 1 4,4363(*) ,57045 ,000 2,7962 6,0763
2 4,4100(*) ,57045 ,000 2,7699 6,0501
3 2,1563(*) ,57045 ,005 ,5162 3,7963
4 ,0463 ,57045 1,000 -1,5938 1,6863
Scheffe 1 2 -,0263 ,57045 1,000 -1,8805 1,8280
3 -2,2800(*) ,57045 ,009 -4,1342 -,4258
4 -4,3900(*) ,57045 ,000 -6,2442 -2,5358
5 -4,4363(*) ,57045 ,000 -6,2905 -2,5820
2 1 ,0263 ,57045 1,000 -1,8280 1,8805
3 -2,2538(*) ,57045 ,010 -4,1080 -,3995
4 -4,3638(*) ,57045 ,000 -6,2180 -2,5095
5 -4,4100(*) ,57045 ,000 -6,2642 -2,5558
3 1 2,2800(*) ,57045 ,009 ,4258 4,1342
2 2,2538(*) ,57045 ,010 ,3995 4,1080
4 -2,1100(*) ,57045 ,018 -3,9642 -,2558
5 -2,1563(*) ,57045 ,015 -4,0105 -,3020
4 1 4,3900(*) ,57045 ,000 2,5358 6,2442
2 4,3638(*) ,57045 ,000 2,5095 6,2180
3 2,1100(*) ,57045 ,018 ,2558 3,9642
5 -,0463 ,57045 1,000 -1,9005 1,8080
5 1 4,4363(*) ,57045 ,000 2,5820 6,2905
2 4,4100(*) ,57045 ,000 2,5558 6,2642
3 2,1563(*) ,57045 ,015 ,3020 4,0105
4 ,0463 ,57045 1,000 -1,8080 1,9005
Basado en las medias observadas.
* La diferencia de medias es significativa al nivel ,05.

Subconjuntos homogéneos
insulina

Subconjunto
estimula N 1 2 3
1 8 2,6650
2 8 2,6913
DHS de 3 8 4,9450
Tukey(a,b) 4 8 7,0550
5 8 7,1013
Significación 1,000 1,000 1,000
1 8 2,6650
2 8 2,6913
3 8 4,9450
Scheffe(a,b)
4 8 7,0550
5 8 7,1013
Significación 1,000 1,000 1,000
Se muestran las medias para los grupos en subconjuntos homogéneos.
26 ESTADÍSTICA BÁSICA APLICADA CON SPPS

Basado en la suma de cuadrados tipo III


El término error es la Media cuadrática (Error) = 1,302.
a Usa el tamaño muestral de la media armónica = 8,000
b Alfa = ,05.

observándose en la última tabla los mismos grupos de tratamientos


homogénenos obtenidos en el texto CB.

4.2. Un Factor: Diseño por Bloques Aleatorizados


El estudio del test analizado aquí, puede estudiar en la Sección 8.3 del texto
CB.

Ejemplo 8.3-CB ___________________________________________

Después de introducir los datos, obtenemos la tabla de Análisis de la Varianza


ejecutando la secuencia (Figura 4.7)

Analizar → Modelo lineal general → Univariante

Figura 4.7

para completar luego el cuadro de diálogo como se indica en la Figura 4.8


ALFONSO GARCÍA PÉREZ y
MARÍA YOLANDA CABRERO ORTEGA 27

Figura 4.8

Ahora con el botón Modelo elegimos la opción Personalizado y, pasando las


variables a la ventana de la derecha, la opción de Efectos principales, ya que
en el diseño por bloques no consideramos la posibilidad de interacción entre
las variables. Con los botones Continuar y Aceptar obtenemos los siguientes
resultados,

Factores inter-sujetos

N
Vitamina 1 4
2 4
3 4
Raza 1 3
2 3
3 3
4 3

Pruebas de los efectos inter-sujetos

Variable dependiente: Peso


Suma de
cuadrados Media
Fuente tipo III gl cuadrática F Significación
Modelo corregido 165,000(a) 5 33,000 3,062 ,103
Intersección 94696,333 1 94696,333 8786,258 ,000
Vitamina 84,667 2 42,333 3,928 ,081
Raza 80,333 3 26,778 2,485 ,158
Error 64,667 6 10,778
Total 94926,000 12
28 ESTADÍSTICA BÁSICA APLICADA CON SPPS

Total corregida 229,667 11


a R cuadrado = ,718 (R cuadrado corregida = ,484)

en donde la última tabla es la de Análisis de la Varianza obtenida en CB.

4.3. Dos Factores: Diseño Completamente Aleatorizado


El estudio del test analizado aquí, puede estudiar en la Sección 8.5 del texto
CB.

Ejemplo 8.5-CB ___________________________________________

Después de introducir los datos, obtenemos la tabla de Análisis de la Varianza


ejecutando la secuencia

Analizar → Modelo lineal general → Univariante

y completando después la ventana de diálogo como se indica en la Figura 4.9

Figura 4.9

Hay muchas semejanzas con el caso anterior del diseño por bloques pero
ahora sí se admite la interacción entre variables, por lo que no hace falta
modificar el modelo; ahora lo requerimos completo. Por eso, presionando ya el
botón Aceptar, obtenemos los siguientes resultados, en donde la última tabla
es la misma de ANOVA obtenida en CB
ALFONSO GARCÍA PÉREZ y
MARÍA YOLANDA CABRERO ORTEGA 29

Factores inter-sujetos

N
Estación 1 12
2 12
3 12
4 12
Fármaco 1 16
2 16
3 16

Pruebas de los efectos inter-sujetos

Variable dependiente: Alergia


Suma de
cuadrados Media
Fuente tipo III gl cuadrática F Significación
Modelo corregido 10488,167(a) 11 953,470 44,781 ,000
Intersección 93633,333 1 93633,333 4397,652 ,000
Estación 4132,167 3 1377,389 64,691 ,000
Fármaco 6017,167 2 3008,583 141,303 ,000
Estación * Fármaco 338,833 6 56,472 2,652 ,031
Error 766,500 36 21,292
Total 104888,000 48
Total corregida 11254,667 47
a R cuadrado = ,932 (R cuadrado corregida = ,911)
30 ESTADÍSTICA BÁSICA APLICADA CON SPPS
ALFONSO GARCÍA PÉREZ y
MARÍA YOLANDA CABRERO ORTEGA 31

Capítulo 5

Regresión Lineal y Correlación

5.1. Regresión Lineal Simple


El estudio del test analizado aquí, puede estudiar en las Secciones 9.2 y
9.3 del texto CB. Como allí destacábamos, hay dos aspectos de interés: la
representación gráfica de los datos y el Análisis de la Regresión

Ejemplo 9.1-CB ___________________________________________

Después de introducir los datos, primero vamos a visualizar los datos dibujando
un Diagrama de Dispersión mediante la secuencia (Figura 5.1)

Gráficos → Interactivos → Diagrama de dispersión

Figura 5.1
32 ESTADÍSTICA BÁSICA APLICADA CON SPPS

La cantidad de oxígeno se pasa a la dependiente y la profundidad a la


independiente, obteniéndose el siguiente gráfico en donde puede verse
también la correlación entre ambas variables.

Regresión lineal

6,00 


cont_oxi

4,00

2,00

1cont_oxi = 8,63 + -0,11 * profund


R-cuadrado = 0,80 
0,00
20,00 30,00 40,00 50,00 60,00 70,00

profund

La segunda cuestión importante es contrastar, mediante la tabla de Análisis de


la Varianza para la Regresión Lineal, si puede admitirse la hipótesis nula de
que la variable independiente no es significativa a la hora de predecir a la
variable dependiente. Para ello ejecutamos la secuencia

Analizar → Regresión → Lineal

completando la ventana de diálogo que aparece como se indica en la Figura


5.2, en donde. A demás de indicar cuál es la variable independiente y
dependiente, hemos seleccionado el Método Hacia atrás.
El resto de las opciones, como la de que nos dé los estimadores o el nivel
de significación del test de la F de Snedecor de la tabla de Análisis de la
Varianza para la Regresión Lineal, ya vienen dadas por defecto.
ALFONSO GARCÍA PÉREZ y
MARÍA YOLANDA CABRERO ORTEGA 33

Figura 5.2

Los resultados así obtenidos son los siguientes, en donde de nuevo destaca la
penúltima tabla ANOVA y las estimaciones de los coeficientes de regresión de
la última tabla.

Regresión
Variables introducidas/eliminadas(b)

Variables Variables
Modelo introducidas eliminadas Método
1 profund(a) . Introducir
a Todas las variables solicitadas introducidas
b Variable dependiente: cont_oxi

Resumen del modelo

R cuadrado Error típ. de la


Modelo R R cuadrado corregida estimación
1 ,896(a) ,803 ,763 1,20444
a Variables predictoras: (Constante), profund

ANOVA(b)

Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 29,481 1 29,481 20,322 ,006(a)
Residual 7,253 5 1,451
Total 36,734 6
a Variables predictoras: (Constante), profund
34 ESTADÍSTICA BÁSICA APLICADA CON SPPS

b Variable dependiente: cont_oxi

Coeficientes(a)

Coeficientes
Coeficientes no estandarizado
estandarizados s

Modelo B Error típ. Beta t Sig.


1 (Constante) 8,631 1,077 8,010 ,000
profund -,108 ,024 -,896 -4,508 ,006
a Variable dependiente: cont_oxi

5.2. Regresión Lineal Múltiple


El estudio del test analizado aquí, puede estudiar en las Secciones 10.2 y
10.3 del texto CB. Las opciones a ejecutar son las mismas que en la sección
anterior, con la diferencia de que debemos incluir más de una variable
independiente.

Ejemplo 10.1-CB __________________________________________

Después de introducir los datos, ejecutamos

Regresión → Lineal

completando el cuadro de diálogo como se indica en la Figura 5.3

Figura 5.3

Las tres últimas tablas que así se obtienen,


ALFONSO GARCÍA PÉREZ y
MARÍA YOLANDA CABRERO ORTEGA 35

ANOVA(c)

Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 2502,390 2 1251,195 34,081 ,000(a)
Residual 440,543 12 36,712
Total 2942,933 14
2 Regresión 2502,373 1 2502,373 73,840 ,000(b)
Residual 440,561 13 33,889
Total 2942,933 14
a Variables predictoras: (Constante), X2, X1
b Variables predictoras: (Constante), X2
c Variable dependiente: Y

Coeficientes(a)

Coeficientes
Coeficientes no estandarizado
estandarizados s

Modelo B Error típ. Beta t Sig.


1 (Constante) 2,086 6,739 ,309 ,762
X1 ,057 2,613 ,006 ,022 ,983
X2 1,050 ,326 ,916 3,219 ,007
2 (Constante) 1,977 4,373 ,452 ,659
X2 1,057 ,123 ,922 8,593 ,000
a Variable dependiente: Y

Variables excluidas(b)

Estadísticos de
colinealidad
Correlación
Modelo Beta dentro t Sig. parcial Tolerancia
2 X1 ,006(a) ,022 ,983 ,006 ,154
a Variables predictoras en el modelo: (Constante), X2
b Variable dependiente: Y

indican considerar a X2 como única covariable independiente significativa y


concluir con la recta ajustada

Y = 1’977 + 1’057 X2
36 ESTADÍSTICA BÁSICA APLICADA CON SPPS
ALFONSO GARCÍA PÉREZ y
MARÍA YOLANDA CABRERO ORTEGA 37

Capítulo 6

Tablas de Contingencia

6.1. Contraste de homogeneidad de varias muestras


El estudio del test analizado aquí, puede estudiar en la Sección 12.3 del
texto CB.

Ejemplo 12.8-CB __________________________________________

Después de introducir los datos, ejecutamos la secuencia (Figura 6.1)

Datos → Ponderar casos

Figura 6.1
38 ESTADÍSTICA BÁSICA APLICADA CON SPPS

y, en el cuadro de diálogo resultante, ponderamos los datos con la variable


frecu (Figura 6.2)

Figura 6.2

Ahora ya podemos realizar el Análisis de la tabla de contingencia ejecutando la


secuencia (Figura 6.3)

Analizar → Estadísticos descriptivos → Tablas de contingencia

Figura 6.3

Ahora debemos completar el cuadro de diálogo que se abre, teniendo en


cuenta cuál variable forma las filas y cuál las columnas. Además, con el botón
Estadísticos, le pedimos el Chi-cuadrado de Pearson, que es el utilizado en
CB (Figura 6.4)
ALFONSO GARCÍA PÉREZ y
MARÍA YOLANDA CABRERO ORTEGA 39

Figura 6.4

Por último, en el botón Casillas le podemos pedir no sólo las frecuencias


observadas sino las esperadas de cada casilla. (Figura 6.5)

Figura 6.5

Los resultados así obtenidos son los siguientes:


40 ESTADÍSTICA BÁSICA APLICADA CON SPPS

Tablas de contingencia
Resumen del procesamiento de los casos

Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
Comunidad * Fumador 300 100,0% 0 ,0% 300 100,0%

Tabla de contingencia Comunidad * Fumador

Fumador
1 2 Total
Comunidad 1 Recuento 13 87 100
Frecuencia esperada 16,0 84,0 100,0
2 Recuento 17 83 100
Frecuencia esperada 16,0 84,0 100,0
3 Recuento 18 82 100
Frecuencia esperada 16,0 84,0 100,0
Total Recuento 48 252 300
Frecuencia esperada 48,0 252,0 300,0

Pruebas de chi-cuadrado

Sig. asintótica
Valor gl (bilateral)
Chi-cuadrado de Pearson 1,042(a) 2 ,594
Razón de verosimilitudes 1,069 2 ,586
Asociación lineal por lineal ,927 1 ,336
N de casos válidos
300
a 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 16,00.

destacando la última tabla en la que aparece el valor del estadístico chi-


cuadrado de Pearson, 1’042 y el p-valor del test, 0’594, los mismos valores que
en CB.

6.2. Contraste de independencia de caracteres


El estudio del test analizado aquí, puede estudiar en la Sección 12.4 del
texto CB. El análisis con SPSS es idéntico al de la sección anterior.

Ejemplo 12.9-CB __________________________________________

Después de introducir los datos, ejecutamos la secuencia (Figura 6.6)


ALFONSO GARCÍA PÉREZ y
MARÍA YOLANDA CABRERO ORTEGA 41

Datos → Ponderar casos

Figura 6.6

ponderándolos en este caso con la variable frecuen. Ahora ya podemos


ejecutar el Análisis de la tabla de contingencia ejecutando la secuencia (Figura
6.7)

Analizar → Estadísticos descriptivos → Tablas de contingencia

Figura 6.7
42 ESTADÍSTICA BÁSICA APLICADA CON SPPS

sin olvidar completar, como antes, los botones Estadísticos y Celdas. Los
resultados así obtenidos son los siguientes:

Tablas de contingencia
Resumen del procesamiento de los casos

Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
deterior * depresio 100 100,0% 0 ,0% 100 100,0%

Tabla de contingencia deterior * depresio

depresio
,00 1,00 Total
deterior ,00 Recuento 22 31 53
Frecuencia esperada 16,4 36,6 53,0
1,00 Recuento 9 38 47
Frecuencia esperada 14,6 32,4 47,0
Total Recuento 31 69 100
Frecuencia esperada 31,0 69,0 100,0

Pruebas de chi-cuadrado

Sig. asintótica Sig. exacta Sig. exacta


Valor gl (bilateral) (bilateral) (unilateral)
Chi-cuadrado de Pearson 5,823(b) 1 ,016
Corrección por
continuidad(a) 4,824 1 ,028
Razón de verosimilitudes 5,975 1 ,015
Estadístico exacto de
Fisher ,018 ,013
Asociación lineal por lineal
5,764 1 ,016
N de casos válidos 100
a Calculado sólo para una tabla de 2x2.
b 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 14,57.

observando en la última tabla los valores del estadístico de Pearson, 5’823 y el


p-valor del test asociado, 0’016, los mismos que los obtenidos en CB.

También podría gustarte