Está en la página 1de 64

Fundamentos de Biología

Aplicada I

Cuaderno de Prácticas de
Estadística con SPSS

Curso 2010-2011

Departamento de Estadística e I.O.


Universidad de Granada

Autores: Profesores de la asignatura:


Ana María Lara Porras Javier Esquivel Sánchez
Nuria Rico Castro Mª Dolores Huete Ruiz
Ismael R. Sánchez Borrego Ismael R. Sánchez Borrego
Diego Torrecillas de Amo
Silvia Valenzuela Ruiz
Índice

pág.
CONTRASTES DE HIPÓTESIS
PARAMÉTRICOS Y NO PARAMÉTRICOS 3
Ejercicio 1 3
Ejercicio 2 5
Ejercicio 3 6
Ejercicio 4 7
Ejercicio 5 9
ANÁLISIS DE REGRESIÓN 10
Ejercicio 1 10
Ejercicio 2 14
Ejercicio 3 17
Ejercicio 4 19
Ejercicio 5 22
DISEÑO DE EXPERIMENTOS 25
Ejercicio 1 25
Ejercicio 2 27
Ejercicio 3 28
Ejercicio 4 29
Ejercicio 5 31
Ejercicio 6 33
ANÁLISIS DE LA COVARIANZA 35
Ejercicio 1 35
Ejercicio 2 37
Ejercicio 3 39
Ejercicio 4 41
ANÁLISIS CLUSTER 43
Ejercicio 1 43
Ejercicio 2 50
ANÁLISIS DE DATOS CUALITATIVOS 54
Ejercicio 1 54
Ejercicio 2 57
Ejercicio 3 60
Bibliografía 62
FBA I Cuaderno de Prácticas de Estadística con SPSS 3

CONTRASTES DE HIPÓTESIS
PARAMÉTRICOS Y NO PARAMÉTRICOS

Ejercicio 1:

En un estudio sobre angina de pecho en ratas se dividió aleatoriamente a 18 animales


afectados en dos grupos de 9 individuos cada uno. A un grupo se le suministró un
placebo y al otro un fármaco experimental FL113. Después de un ejercicio controlado
sobre una “cinta sin fin” se determinó el tiempo de recuperación de cada rata. Se piensa
que el FL113 reducirá el tiempo medio de recuperación. Se dispone de la siguiente
información:

Placebo 203 229 215 220 223 233 208 228 209
FL113 221 207 185 203 187 190 195 204 212

Suponiendo que las distribuciones del tiempo necesario para la recuperación son
normales, comparar las muestras dadas para saber si se puede admitir que ambas
muestras provienen de la misma población. Efectuar los correspondientes contrastes
(sobre medias y varianzas) al nivel de significación α = 0.05.

X: “tiempo de recuperación de las ratas tratadas con placebo” → N(μ1, σ1)


Y: “tiempo de recuperación de las ratas tratadas con FL113” → N(μ2, σ2)

H0: μ1= μ2
ƒ Primer contraste
H1: μ1≠ μ2

H0: σ12= σ22


ƒ Segundo contraste
H1: σ12≠ σ22

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 4

Estadísticos de grupo

Error típ. de la
Grupo placebo o FL113 N Media Desviación típ. media
Tiempo de recuperación Grupo placebo 9 218,67 10,524 3,508
Grupo FL113 9 200,44 12,126 4,042

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 5

Ejercicio 2:
Se ha realizado un estudio para investigar el efecto del ejercicio físico en el nivel de
colesterol en plasma, en el que participaron 11 sujetos. Antes del ejercicio, se tomaron
muestras de sangre para determinar el nivel del colesterol de cada participante. Después,
los individuos fueron sometidos a un programa de ejercicios que se centraba en carreras
y marchas diarias. Al final del periodo de ejercicios, se tomaron nuevamente muestras
de sangre y se obtuvo una segunda lectura del nivel de colesterol en plasma de los
sujetos. Se quiere estimar la diferencia entre el nivel medio de colesterol antes y
después del ejercicio. Se recogieron los siguientes datos

Nivel previo mg/dl Nivel posterior mg/dl


182 198
232 210
191 194
200 220
148 138
249 220
276 219
213 161
241 210
480 313
262 226

Decidir si existen diferencias significativas entre estos niveles antes y después del
ejercicio físico.

Prueba de muestras relacionadas

Diferencias relacionadas
95% Intervalo de
confianza para la
DesviaciónError típ. de diferencia
Media típ. la media Inferior Superior t gl Sig. (bilateral)
Par 1 Colesterol antes d
ejercicio - Coleste 33,18 51,066 15,397 -1,12 67,49 2,155 10 ,057
despues del ejerc

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 6

Ejercicio 3:
En unos laboratorios clínicos se toman muestras de 650 análisis de sangre y se anota el
número de eritrocitos por milímetro cúbico de sangre. ¿Se puede admitir que el número
de eritrocitos se distribuye normalmente? Los resultados agrupados en 7 clases son los
que figuran en la tabla adjunta

Nº de eritrocitos en millones Nº de muestras


0-2,5 8
2.5-3.5 52
3.5-4.5 140
4.5-5.5 210
5.5-6.5 160
6.5-7.5 70
7.5-8.5 10

Prueba de Kolmogorov-Smirnov para una muestra

Eritrocitos
N 650
Media 5,0862
Parámetros normales(a,b) Desviación típica
1,23238

Diferencias más extremas Absoluta ,164


Positiva ,159
Negativa -,164
Z de Kolmogorov-Smirnov 4,192
Sig. asintót. (bilateral) ,000
a La distribución de contraste es la Normal.
b Se han calculado a partir de los datos.

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 7

Ejercicio 4:

Se realiza una investigación para determinar si el hecho de contraer hepatitis es


independiente de haber sido vacunado contra la enfermedad. Para ello se utilizan 1083
voluntarios varones. De ellos, se eligen aleatoriamente 549 y son vacunados con un
nuevo fármaco. Los restantes, 534, no son vacunados. Después de un cierto tiempo, se
observó que 70 de los 534 voluntarios no vacunados contrajeron la hepatitis, mientras
que solamente 11 de los 549 vacunados no la contrajeron. Los datos se muestran en la
tabla adjunta
Vacunación
Hepatitis SI NO
SI 11 70
NO 538 464

Contrastar la independencia entre la vacunación y la enfermedad con α=0.05.

Tabla de contingencia HEPATITI * VACUNACI

Recuento
VACUNACI Total
no si
HEPATITI no 464 538 1002
si 70 11 81
Total 534 549 1083

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 8

Pruebas de chi-cuadrado

Sig. asintótica Sig. exacta Sig. exacta


Valor gl (bilateral) (bilateral) (unilateral)
Chi-cuadrado de Pearson 48,242(b) 1 ,000
Corrección por
continuidad(a) 46,650 1 ,000
Razón de verosimilitud 53,194 1 ,000
Estadístico exacto de
Fisher ,000 ,000
Asociación lineal por lineal
48,197 1 ,000
N de casos válidos 1083
a Calculado sólo para una tabla de 2x2.
b 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 39,94.

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 9

Ejercicio 5:
Se realiza un estudio para investigar la asociación entre el color de las flores y la
fragancia de las azaleas silvestres. Se observan 200 plantas floridas seleccionadas
aleatoriamente. Cada una de ellas se clasifica según el color y la presencia o ausencia de
fragancia. Los datos se muestran en la tabla adjunta

Color
Fragancia Blanca Rosa Naranja
SI 12 60 58
NO 50 10 10

Pruebas de chi-cuadrado

Sig. asintótica
Valor gl (bilateral)
Chi-cuadrado de Pearson 82,293(a) 2 ,000
Razón de verosimilitud 83,848 2 ,000
Asociación lineal por lineal 59,712 1 ,000
N de casos válidos
200
a 0 casillas (,0%) tienen una frecuencia esperada inferior a 5.
La frecuencia mínima esperada es 21,70.

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 10

ANÁLISIS DE REGRESIÓN

Ejercicio 1:
Se realiza un estudio para establecer una ecuación mediante la cual se pueda utilizar la
longitud en cm. de una cierta variedad de planta al cabo de un año de vida para predecir
la longitud de esa variedad de planta en edad adulta:

Longitud en cm. Longitud en cm.


el primer año en edad adulta
15.3 30.7
14.8 32.5
12.6 26.3
18.4 35.9
17.9 34.3
15.6 28.5
18.4 37.4
14.1 29.7
20.2 38.8
21.7 40.4
20.4 40.9
16.5 33.3
15.9 30.1
17.9 35.7
16.7 31.4

Se pide:

a) Representar el diagrama de dispersión


b) Estimar los parámetros del modelo
c) Coeficientes de correlación lineal y de determinación. Interpretación
d) Plantear y contrastar el test para conocer la significación de la variable
independiente a un nivel de significación del 5 %

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 11

a) Diagrama de dispersión

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 12

42

40

38

36

34

32

30
LONG_ADU

28

26
12 14 16 18 20 22

LONG_1

b) Estimación de los parámetros del modelo

Coeficientesa

Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error típ. Beta t Sig.
1 (Constante) 5,296 2,694 1,965 ,071
LONG_1 1,663 ,156 ,947 10,657 ,000
a. Variable dependiente: LONG_ADU

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 13

c) Coeficientes de correlación lineal y de determinación. Interpretación

Resumen del modelo

R cuadrado Error típ. de la


Modelo R R cuadrado corregida estimación
1 ,947a ,897 ,889 1,4666
a. Variables predictoras: (Constante), LONG_1

d) Test de significación de la variable independiente.

ANOVAb

Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 244,306 1 244,306 113,577 ,000a
Residual 27,963 13 2,151
Total 272,269 14
a. Variables predictoras: (Constante), LONG_1
b. Variable dependiente: LONG_ADU

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 14

Ejercicio 2:
Se realiza un estudio para establecer una ecuación mediante la cual se pueda utilizar la
concentración de estrona en la saliva para predecir la concentración de dicho esteroide
en plasma libre. Se tomaron los siguientes datos de 13 varones sanos:

Concentración de estrona Concentración de estrona


en saliva pg./mL. en plasma libre en pg./mL.
7.4 30
7.5 25
8.5 31.5
9 27.5
9 39.5
11 38
13 43
14 49
14.5 55
16 48.5
17 51
18 64.5
20 63

Se pide:

a) Representar el diagrama de dispersión


b) Plantear el modelo de regresión y estimar los parámetros del modelo.
Interprétalos
c) Obtener el coeficiente de correlación lineal de Pearson y el coeficiente de
determinación
d) Obtener un intervalo de confianza al 95 % para la pendiente de la recta de
regresión
e) Contrastar la significación del coeficiente de regresión

a) Diagrama de dispersión
70,0

60,0

50,0
estrona

40,0

30,0

20,0

7,5 10,0 12,5 15,0 17,5 20,0


saliva

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 15

b) Planteamiento del modelo, estimación de los parámetros y su interpretación

Coeficientesa

Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error típ. Beta t Sig.
1 (Constante) 6,887 3,965 1,737 ,110
saliva 2,886 ,297 ,946 9,705 ,000
a. Variable dependiente: plasma

c) Coeficiente de correlación lineal de Pearson y coeficiente de determinación

Resumen del modelo

R cuadrado Error típ. de la


Modelo R R cuadrado corregida estimación
1 ,946a ,895 ,886 4,3997
a. Variables predictoras: (Constante), saliva

d) Obtener un intervalo de confianza al 95 % para la pendiente de la recta de


regresión

Coeficientesa

Coeficientes
Coeficientes no estandarizad Intervalo de confianza para
estandarizados os B al 95%
Límite
Modelo B Error típ. Beta t Sig. Límite inferior superior
1 (Constante) 6,887 3,965 1,737 ,110 -1,841 15,614
saliva 2,886 ,297 ,946 9,705 ,000 2,232 3,541
a. Variable dependiente: plasma

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 16

e) Contrastar la significación del coeficiente de regresión

ANOVAb

Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 1823,070 1 1823,070 94,180 ,000a
Residual 212,930 11 19,357
Total 2036,000 12
a. Variables predictoras: (Constante), saliva
b. Variable dependiente: plasma

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 17

Ejercicio 3:
Un aficionado a las apuestas en las carreras de caballos desea estudiar la descendencia
de una conocida raza de caballos que tiene mucho éxito en dichas carreras. Para ello
estudia la relación existente entre el peso en gramos de embriones de caballos y el
número de días transcurridos de vida de los mismos. Los datos aparecen en la siguiente
tabla:
Días Peso
7 51.3
8 79.1
9 127.4
10 183.5
11 271.3
12 431.5
13 743.7
14 1143.2
15 1893.8
16 3102.4
17 4702.7
Se pide:
a) Representar la nube de puntos
b) Plantear el modelo de regresión y obtener la ecuación del modelo ajustado
c) Bondad del ajuste

a) Representar la nube de puntos


5000

4000

3000

2000

1000

0
PESO

-1000
6 8 10 12 14 16 18

DIAS

b) Plantear el modelo de regresión y obtener la ecuación del modelo ajustado.

MODEL: MOD_1.

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 18

Lineal

ANOVA

Suma de Media
cuadrados gl cuadrática F Sig.
Regresión 16841317 1 16841317 25,551 ,001
Residual 5932167,3 9 659129,695
Total 22773485 10
La variable independiente esdías.

Resumen del modelo

R cuadrado Error típico de


R R cuadrado corregida la estimación
,860 ,740 ,711 811,868
La variable independiente esdías.

Exponencial

ANOVA

Suma de Media
cuadrados gl cuadrática F Sig.
Regresión 22,756 1 22,756 6384,193 ,000
Residual ,032 9 ,004
Total 22,789 10
La variable independiente esdías.

Resumen del modelo

R cuadrado Error típico de


R R cuadrado corregida la estimación
,999 ,999 ,998 ,060
La variable independiente esdías.

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 19

Ejercicio 4:
Una empresa fabricante de cereales para el desayuno desea conocer la ecuación que
permita predecir las ventas (en miles de euros) en función de los gastos en publicidad
infantil en televisión (en miles de euros), el tiempo diario de aparición en televisión (en
minutos) y los gastos en publicidad en los periódicos (en miles de euros). Se realiza un
estudio en el que se reúnen los datos mensuales correspondientes a los últimos 20
meses. Estos datos aparecen en la siguiente tabla:

Pub. en Tiempo Pub. en


Ventas
tv. en tv. per.
10 1 50 0.4
12 1.2 57 0.4
11 1.3 56 0.42
13 1.4 55 0.5
12 1.5 60 0.4
14 1.7 65 0.44
16 1.75 69 0.4
12 1.3 67 0.44
14 1.45 68 0.46
11 0.9 67 0.46
10 0.8 97 0.45
19 0.9 66 1.1
8.5 0.8 65 0.3
8 1 60 0.5
9 1.7 70 0.45
13 1.8 110 0.4
16 1.85 75 0.8
18 1.9 80 0.9
20 2 85 0.9
22 2 90 1.1

Se pide:

a) Ajustar un modelo de regresión lineal múltiple. Obtener una estimación de los


parámetros del modelo y su interpretación
b) Obtener e interpretar el valor de la suma de cuadrados residual
c) Contrastar la significación del modelo propuesto

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 20

a) Ajustar un modelo de regresión lineal múltiple. Obtener una estimación de los


parámetros del modelo y su interpretación

Coeficientesa

Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error típ. Beta t Sig.
1 (Constante) 2,108 2,055 1,026 ,320
PUBL_TV 3,432 1,121 ,358 3,060 ,007
TIEMP_TV 1,477E-03 ,030 ,006 ,050 ,961
PUBL_PER 11,347 1,802 ,711 6,298 ,000
a. Variable dependiente: VENTAS

b) Obtener e interpretar el valor de la suma de cuadrados residual

ANOVAb

Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 247,677 3 82,559 26,440 ,000a
Residual 49,960 16 3,123
Total 297,638 19
a. Variables predictoras: (Constante), PUBL_PER, TIEMP_TV, PUBL_TV
b. Variable dependiente: VENTAS

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 21

c) Contrastar la significación del modelo propuesto

ANOVAb

Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 247,677 3 82,559 26,440 ,000a
Residual 49,960 16 3,123
Total 297,638 19
a. Variables predictoras: (Constante), PUBL_PER, TIEMP_TV, PUBL_TV
b. Variable dependiente: VENTAS

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 22

Ejercicio 5:
Se desea estudiar la relación entre la intensidad de regadío (medida en litros por metro
cuadrado) y la productividad (medida en Kg/Ha) de una huerta de tomates. Se han
obtenido los siguientes datos:

Productividad de Intensidad de
un cultivo regadío
2500.9 590.5
2000.8 540.4
3300.4 690
2500.6 605.2
1995.8 650
3312.3 724
3409 704.8

Se pide:

a) ¿Podemos afirmar la existencia de relación lineal entre las variables?


b) Coeficiente de correlación y coeficiente de determinación. Interpretación

Además del regadío se cree que el empleo de un abono ha influido de forma lineal
en la productividad del cultivo. Por tanto se introduce en el modelo de regresión la
variable que mide el número de Kg. de abono por hectárea.

Abono 200.6 160.6 407.6 212.7 145 387.8 355

c) Ajustar un modelo de regresión lineal múltiple


d) Interpretación de los coeficientes del modelo de regresión. ¿Qué variable tiene
mayor influencia en la variación de la productividad?
e) Valor de la suma de cuadrados de la regresión. Interpretación
f) Contrastar la significación del modelo propuesto
g) Coeficiente de determinación múltiple y coeficiente de determinación múltiple
corregido. Interpretación
h) ¿Ha sido útil la adición de la variable abono?

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 23

a) ¿Muestran los datos una relación lineal?

3600

3400

3200

3000

2800

2600

2400

2200
PRODUCT

2000

1800
500 600 700 800

REGADIO

ANOVAb

Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 1557184,3 1 1557184,3 10,479 ,023a
Residual 743017,305 5 148603,461
Total 2300201,6 6
a. Variables predictoras: (Constante), REGADIO
b. Variable dependiente: PRODUCT

b) Coeficiente de correlación lineal y coeficiente de determinación. Interpretación


Correlaciones

PRODUCT REGADIO
Correlación de Pearson PRODUCT 1,000 ,823
REGADIO ,823 1,000
Sig. (unilateral) PRODUCT , ,012
REGADIO ,012 ,
N PRODUCT 7 7
REGADIO 7 7

Resumen del modelo

R cuadrado Error típ. de la


Modelo R R cuadrado corregida estimación
1 ,823a ,677 ,612 385,491
a. Variables predictoras: (Constante), REGADIO

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 24

c) Ajustar un modelo de regresión lineal múltiple


Coeficientesa

Coeficient
es
Coeficientes no estandari
estandarizados zados
Modelo B Error típ. Beta t Sig.
1 (Constante) 942,755 988,031 ,954 ,394
REGADIO ,674 1,897 ,073 ,355 ,740
ABONO 5,021 1,141 ,911 4,402 ,012
a. Variable dependiente: PRODUCT

e) Valor de la suma de cuadrados de la regresión. Interpretación

ANOVAb

Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 2173045,5 2 1086522,8 34,179 ,003a
Residual 127156,069 4 31789,017
Total 2300201,6 6
a. Variables predictoras: (Constante), ABONO, REGADIO
b. Variable dependiente: PRODUCT

g) Coeficiente de determinación múltiple y coeficiente de determinación múltiple


corregido
Resumen del modelo

R cuadrado Error típ. de la


Modelo R R cuadrado corregida estimación
1 ,972a ,945 ,917 178,295
a. Variables predictoras: (Constante), ABONO, REGADIO

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 25

DISEÑO DE EXPERIMENTOS

Ejercicio 1:

Se sabe que el dióxido de carbono tiene un efecto crítico en el crecimiento


microbiológico. Cantidades pequeñas de CO2 estimulan el crecimiento de muchos
microorganismos, mientras que altas concentraciones inhiben el crecimiento de la
mayor parte de ellos. Este último efecto se utiliza comercialmente cuando se almacenan
productos alimenticios perecederos. Se realizó un estudio para investigar el efecto del
CO2 sobre la tasa de crecimiento de Pseudomonas fragi, un corruptor de alimentos. Se
administró dióxido de carbono a cinco presiones atmosféricas diferentes. La respuesta
anotada fue el cambio porcentual en la masa celular después de un tiempo de
crecimiento de una hora. Se utilizaron diez cultivos en cada nivel. Se obtuvieron los
siguientes datos:

Nivel del factor (presión de CO2 en atmósferas)


0.0 0.083 0.29 0.5 0.86
62.6 50.9 45.5 29.5 24.9
59.6 44.3 41.1 22.8 17.2
64.5 47.5 29.8 19.2 7.8
59.3 49.5 38.3 20.6 10.5
58.6 48.5 40.2 29.2 17.8
64.6 50.4 38.5 24.1 22.1
50.9 35.2 30.2 22.6 22.6
56.2 49.9 27 32.7 16.8
52.3 42.6 40 24.4 15.9
62.8 41.6 33.9 19.6 8.8

a) Se suponen efectos fijos: ¿qué implica esto respecto de los niveles atmosféricos
elegidos?
b) Plantear la hipótesis nula a contrastar
c) Evaluar el estadístico F utilizado para contrastar H0
d) ¿Puede rechazarse H0? Explicarlo basándose en el p-valor del contraste

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 26

ANOVA

CRECIMIE
Suma de Media
cuadrados gl cuadrática F Sig.
Inter-grupos 11274,319 4 2818,580 101,628 ,000
Intra-grupos 1248,038 45 27,734
Total 12522,357 49

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 27

Ejercicio 2:
Una compañía textil utiliza diversos telares para la producción de telas. Aunque se
desea que los telares sean homogéneos con el objeto de producir tela de resistencia
uniforme se supone que puede existir una variación significativa en la resistencia de la
tela debida a la utilización de distintos telares. A su disposición tiene 5 tipos de telares
con los que realiza determinaciones de la resistencia de la tela. Este experimento se
realiza en orden aleatorio y los resultados se muestran en la tabla adjunta. Analizar los
datos y obtener las conclusiones apropiadas.

Telares Resistencia
1 51 49 50 49 51 50
2 56 60 56 56 57
3 48 50 53 44 45
4 47 48 49 44
5 43 43 46 47 45 46

a) Plantear la hipótesis nula a contrastar


b) ¿Puede rechazarse H 0 ? Explicarlo basándose en el p-valor del contraste
c) Comprobar la hipótesis de homocedasticidad

ANOVA

RESIST
Suma de Media
cuadrados gl cuadrática F Sig.
Inter-grupos 439,885 4 109,971 23,565 ,000
Intra-grupos 98,000 21 4,667
Total 537,885 25

Prueba de homogeneidad de varianzas

RESIST
Estadístico
de Levene gl1 gl2 Sig.
2,367 4 21 ,086

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 28

Ejercicio 3:
En una determinada fábrica de galletas se desea saber si las harinas de sus cuatro
proveedores producen la misma viscosidad en la masa. Para ello, produce durante un día
16 masas, 4 de cada tipo de harina y mide su viscosidad. Los resultados obtenidos se
muestran en la siguiente tabla:

Proveedor Proveedor Proveedor Proveedor


A B C D
98 97 99 96
91 90 93 92
96 95 97 95
95 96 99 98

a) Plantear la hipótesis nula a contrastar


b) ¿Puede rechazarse H 0 ? Explicarlo basándose en el p-valor del contraste
c) Comprobar la hipótesis de normalidad

ANOVA

VISCOSID
Suma de Media
cuadrados gl cuadrática F Sig.
Inter-grupos 14,188 3 4,729 ,581 ,639
Intra-grupos 97,750 12 8,146
Total 111,938 15

Normal gráfico Q-Q de Residuo para VIS


6

2
Valor Normal esperado

-2

-4

-6
-6 -4 -2 0 2 4 6

Valor observado

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 29

Ejercicio 4:
Los científicos comprometidos en el tratamiento del agua residual de arenas asfálticas
estudiaron tres métodos de tratamientos para la eliminación del carbono orgánico
(basado en W.R. Pirie, Statistical Planning and Analysis for Treatments of Tar Sand
Waste-water, Centro de Información Técnica, Oficina de Información Tecnológica y
Científica, Departamento de Energía de Estados Unidos). Los tres métodos de
tratamiento utilizados fueron: flotación de aire (FA), separación de espuma (SF) y
coagulación ferroclórica (CFC). Las mediciones del material de carbono orgánico para
los tres tratamientos arrojaron los siguientes datos:

FA SE CFC
34.6 38.8 26.7
35.1 39.0 26.7
35.6 40.1 27.0
35.8 40.9 27.1
36.1 41.0 27.5
36.5 43.2 28.1
36.8 44.9 28.1
37.2 46.9 28.7
37.4 51.6 30.7
37.7 53.6 31.2

a) Contrastar H 0 : μ1 = μ2 = μ3 al nivel α =0.10


b) Si se rechaza H 0 utilizar los contrastes de Tukey para precisar qué métodos difieren
estadísticamente entre sí

ANOVA

CARBONO
Suma de Media
cuadrados gl cuadrática F Sig.
Inter-grupos 1251,603 2 625,801 60,742 ,000
Intra-grupos 278,172 27 10,303
Total 1529,775 29

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 30

Comparaciones múltiples

Variable dependiente: carbono


HSD de Tukey
Intervalo de confianza al
90%
Diferencia de Límite
(I) metodo (J) metodo medias (I-J) Error típico Sig. Límite inferior superior
1 2 -7,72000* 1,43546 ,000 -10,7960 -4,6440
3 8,10000* 1,43546 ,000 5,0240 11,1760
2 1 7,72000* 1,43546 ,000 4,6440 10,7960
3 15,82000* 1,43546 ,000 12,7440 18,8960
3 1 -8,10000* 1,43546 ,000 -11,1760 -5,0240
2 -15,82000* 1,43546 ,000 -18,8960 -12,7440
*. La diferencia entre las medias es significativa al nivel .1.

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 31

Ejercicio 5:
Se ha realizado un estudio sobre el efecto de las temporadas de caza del ciervo en los
hábitos de éstos. Se seleccionan cuatro sendas que se sabe utilizan los ciervos. Antes de
comenzar la temporada de caza, durante la temporada y al terminar la temporada se
determinó el promedio de huellas halladas por semana en un área específica de cada
senda. Las sendas se trataron como bloques y se obtuvieron los siguientes datos:

Senda Antes Durante Después


1 62.5 57 49
2 46.5 53.3 50
3 45 59.3 37
4 24 35.7 50

a) Contrastar la hipótesis nula de igualdad de medias en los tratamientos al nivel


α =0.05
b) Contrastar la hipótesis nula de igualdad de medias en los bloques al nivel
α =0.05

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 32

Pruebas de los efectos inter-sujetos

Variable dependiente: HUELLAS


Suma de
cuadrados Media
Fuente tipo III gl cuadrática F Significación
Modelo corregido 700,631a 5 140,126 1,376 ,351
Intersección 27008,541 1 27008,541 265,137 ,000
TEMPORAD 98,482 2 49,241 ,483 ,639
SENDA 602,149 3 200,716 1,970 ,220
Error 611,198 6 101,866
Total 28320,370 12
Total corregida 1311,829 11
a. R cuadrado = ,534 (R cuadrado corregida = ,146)

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 33

Ejercicio 6:
Una industria desea comprobar el efecto que tienen cinco productos químicos sobre la
resistencia de un tipo particular de fibra. Como también puede influir la máquina
empleada en la fabricación, decide utilizar un diseño en bloques aleatorizados,
considerando las distintas máquinas como bloques. La industria dispone de cuatro
máquinas a las que asigna los cinco productos químicos en orden aleatorio. Los
resultados obtenidos se muestran en la tabla adjunta.

Tipos de máquinas
Producto químico A B C D
1 87 86 88 83
2 85 87 95 85
3 90 92 95 90
4 89 97 98 88
5 99 96 91 90

a) Contrastar la hipótesis nula de igualdad de medias en los tratamientos al nivel


α =0.05
b) Contrastar la hipótesis nula de igualdad de medias en los bloques al nivel
α =0.05
c) Si se rechaza H 0 en los apartados a) o b), utilizar los contrastes LSD y Tukey,
respectivamente, para precisar qué medias difieren estadísticamente entre sí

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 34

Comparaciones múltiples

Variable dependiente: RESIST


DMS

Intervalo de confianza al
Diferencia 95%.
(I) (J) entre Límite
PRODUCT PRODUCT medias (I-J) Error típ. Significación Límite inferior superior
1 2 -2,00 2,336 ,409 -7,09 3,09
3 -5,75* 2,336 ,030 -10,84 -,66
4 -7,00* 2,336 ,011 -12,09 -1,91
5 -8,00* 2,336 ,005 -13,09 -2,91
2 1 2,00 2,336 ,409 -3,09 7,09
3 -3,75 2,336 ,134 -8,84 1,34
4 -5,00 2,336 ,054 -10,09 ,09
5 -6,00* 2,336 ,025 -11,09 -,91
3 1 5,75* 2,336 ,030 ,66 10,84
2 3,75 2,336 ,134 -1,34 8,84
4 -1,25 2,336 ,602 -6,34 3,84
5 -2,25 2,336 ,355 -7,34 2,84
4 1 7,00* 2,336 ,011 1,91 12,09
2 5,00 2,336 ,054 -,09 10,09
3 1,25 2,336 ,602 -3,84 6,34
5 -1,00 2,336 ,676 -6,09 4,09
5 1 8,00* 2,336 ,005 2,91 13,09
2 6,00* 2,336 ,025 ,91 11,09
3 2,25 2,336 ,355 -2,84 7,34
4 1,00 2,336 ,676 -4,09 6,09
Basado en las medias observadas.
*. La diferencia de medias es significativa al nivel ,05.
*. Se ha detectado el símbolo ,05 donde se esperaba un paréntesis de cierre en el subcomando
TEST.

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 35

ANÁLISIS DE LA COVARIANZA

Ejercicio 1:

Un distribuidor de bebidas está estudiando la efectividad de los métodos de descarga,


para lo cual se mide el tiempo de descarga de unas cajas en minutos. Las bebidas se
distribuyen en tres tipos distintos de furgonetas (atendiendo a su diferente capacidad de
carga y antigüedad). Se conoce que el tiempo de descarga guarda una estrecha relación
con el volumen de cajas descargadas. Se obtuvieron los siguientes datos:

Furgoneta
1 2 3
y x y x y x
12 20 70 64 31 27
19 23 64 62 28 25
15 22 55 47 25 22
21 30 77 66 22 26
11 15 66 50 29 28
19 22 44 42 28 29

a) Planteamiento del modelo


b) Contrastar los efectos del factor y de la covariable sobre la variable respuesta
c) Indicar el porcentaje de variabilidad explicada por el modelo propuesto

SOLUCIÓN:

b) Contrastar los efectos del factor y de la covariable sobre la variable respuesta

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 36

Pruebas de los efectos inter-sujetos

Variable dependiente: TIEMPO


Suma de
cuadrados Media
Fuente tipo III gl cuadrática F Significación
Modelo corregido 7679,373a 3 2559,791 160,974 ,000
Intersección 3,758 1 3,758 ,236 ,634
FURGONET 174,246 2 87,123 5,479 ,017
VOLUMEN 592,373 1 592,373 37,252 ,000027
Error 222,627 14 15,902
Total 30374,000 18
Total corregida 7902,000 17
a. R cuadrado = ,972 (R cuadrado corregida = ,966)

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 37

Ejercicio 2:

Se quiere analizar el efecto que tienen tres tipos distintos de terreno en el rendimiento
de una determinada plantación de almendros. Se sospecha que el rendimiento del
cultivo (medido en kg.) está relacionado con la cantidad de kg. de abono recibidos. Los
datos observados se muestran en la tabla adjunta:

Terreno
A B C
Y x y x y x
130,5 20,3 110,3 15,9 155,9 44,9
144,6 44,9 100,8 22 149,1 42,33
133,9 33,8 109,6 16,9 188,9 58,9
128,4 20,8 122,7 20,2 199,4 70,8
119,2 18,2 97,4 16,9 185,7 61,9
133,8 32,8
122,8 33,9
119,4 18,3
122,7 22,7
130,8 29,7

Se pide

a) Indicar el valor de la suma de cuadrados entre tratamientos ajustada.


Interpretación
b) Contrastar los efectos del factor y de la covariable sobre la variable respuesta

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 38

Pruebas de los efectos inter-sujetos

Variable dependiente: PRODUCC


Suma de
cuadrados Media
Fuente tipo III gl cuadrática F Significación
Modelo corregido 14135,521a 3 4711,840 69,764 ,000
Intersección 10205,154 1 10205,154 151,098 ,000
TERRENO 404,959 2 202,479 2,998 ,078
ABONO 1804,347 1 1804,347 26,715 ,000
Error 1080,639 16 67,540
Total 381321,724 20
Total corregida 15216,159 19
a. R cuadrado = ,929 (R cuadrado corregida = ,916)

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 39

Ejercicio 3:
Una empresa pretende estudiar la resistencia a la ruptura de la fibra de la que está
compuesta una cuerda. Se realiza un estudio para determinar si existe diferencia
significativa en la resistencia de los tres tipos de cuerdas disponibles (atendiendo al tipo
de fibra disponible). Se cree que la temperatura a la que se realiza el experimento puede
influir en la resistencia, por lo que se utiliza un diseño en bloques aleatorizados
considerando la temperatura como bloque, con 4 niveles. La resistencia de la cuerda a la
ruptura (medida en libras) se ve afectada por su grosor (medido en 10−3 pulgadas).

Los datos se presentan en la siguiente tabla:

Cuerda
1 2 3
Temperatura y x y x y x
1 33 20 44 28 41 23
2 41 25 23 22 39 22
3 35 24 44 33 37 23
4 42 25 37 27 26 21

Se pide

a) Formular el diseño empleado


b) Analizar estos datos y extraer las conclusiones apropiadas

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 40

Pruebas de los efectos inter-sujetos

Variable dependiente: Y
Suma de
cuadrados Media
Fuente tipo III gl cuadrática F Significación
Modelo corregido 423,966a 6 70,661 4,928 ,050
Intersección 55,091 1 55,091 3,842 ,107
CUERDA 170,503 2 85,251 5,945 ,048
TEMP 91,799 3 30,600 2,134 ,215
X 358,133 1 358,133 24,974 ,004
Error 71,701 5 14,340
Total 16776,000 12
Total corregida 495,667 11
a. R cuadrado = ,855 (R cuadrado corregida = ,682)

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 41

Ejercicio 4:

Se pretende comparar la presión arterial sistólica de un grupo de fumadores según su


nivel de estudios. Para ello se realiza un estudio en el que se controla el número de
cigarrillos consumidos al día por cada una de estas personas. El nivel de estudios se
clasifica en tres niveles: estudios básicos, estudios de Secundaria y estudios
universitarios, codificados por 1, 2 y 3 respectivamente. Además se cree que la presión
arterial que sufren estos individuos podría relacionarse en forma lineal con la edad de
los fumadores. Los datos se muestran en la tabla adjunta:

Nivel de estudios
1 2 3
y X z y x z y x z
153,4 24,2 46 141,3 18,3 22 135,5 20,3 35
157,5 25,6 55 133,9 28 51 137,9 22,9 17
140,5 24,9 49 128,7 12,1 36 140,4 33 40
162,7 57,2 44 144,2 27,4 51 126,9 20,3 39
153,5 46,3 64 137,4 33,5 35 130,1 11,2 29

a) Formular el diseño empleado


b) Variación de la presión arterial sistólica que queda sin explicar y suma total de
cuadrados de la respuesta ajustada por la covariable
c) Contrastar la igualdad de los efectos del factor, así como la significación de cada
covariable
d) Proporción de variación explicada por el modelo propuesto
e) Comprobar que se cumple la hipótesis de homocedasticidad

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 42

Pruebas de los efectos inter-sujetos

Variable dependiente: PRESIÓN


Suma de
cuadrados Media
Fuente tipo III gl cuadrática F Significación
Modelo corregido 1294,773a 4 323,693 9,629 ,002
Intercept 11452,003 1 11452,003 340,655 ,000
ESTUDIOS 410,072 2 205,036 6,099 ,019
Nº_CIGAR 203,031 1 203,031 6,039 ,034
EDAD 24,663 1 24,663 ,734 ,412
Error 336,176 10 33,618
Total 302361,030 15
Total corregida 1630,949 14
a. R cuadrado = ,794 (R cuadrado corregida = ,711)

Contraste de Levene sobre la igualdad de las varianzas error

Variable dependiente: PRESIÓN


F gl1 gl2 Significación
,973 2 12 ,406
Contrasta la hipótesis nula de que la varianza error de la
variable dependiente es igual a lo largo de todos los grupos.

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 43

ANÁLISIS CLUSTER

Ejercicio 1:
Se analiza la leche de las hembras de 20 mamíferos, obteniéndose los porcentajes en
agua, proteínas, grasa y lactosa siguientes:

Mamífero Agua Proteínas Grasa Lactosa


CABALLO 90.1 2.6 1.0 6.9
BURRO 90.3 1.7 1.4 6.2
CEBRA 86.2 3.0 4.8 5.3
HAMSTER 81.9 7.4 7.2 2.7
RATA 72.5 9.2 12.6 3.3
OVEJA 82.0 5.6 6.4 4.7
RENO 64.8 10.7 20.3 2.5
MULA 90.0 2.0 1.8 5.5
CERDO 82.8 7.1 5.1 3.7
CAMELLO 87.7 3.5 3.4 4.8
BÚFALO 82.1 5.9 7.9 4.7
ZORRO 81.6 6.6 5.9 4.9
CONEJO 71.3 12.3 13.1 1.9
LLAMA 86.5 3.9 3.2 5.6
CIERVO 65.9 10.4 19.7 2.6
BISONTE 86.9 4.8 1.7 5.7
GATO 81.6 10.1 6.3 4.4
PERRO 76.3 9.3 9.5 3.0
FOCA 46.4 9.7 42.0 0.0
DELFÍN 44.9 10.6 34.9 0.9

Clasificar estos mamíferos de forma jerárquica atendiendo a dichas variables realizando


el estudio de acuerdo a las siguientes opciones de medidas de asociación y métodos de
amalgamamiento:
a) Distancia euclídea y linkage simple
b) Distancia bloque y linkage simple
c) Distancia euclídea y método del centroide
d) Distancia bloque y método del centroide
Para cada uno de las anteriores opciones se pide la matriz de distancias, el dendrograma
y la clasificación resultante si se toman 2, 3, 4 o 5 grupos diferentes.

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 44

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 45

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 46

Historial de conglomeración

Etapa en la que el
conglomerado
Conglomerado que se aparece por primera
combina vez
Conglom Conglom Conglom Conglom Próxima
Etapa erado 1 erado 2 Coeficientes erado 1 erado 2 etapa
1 2 8 ,911 0 0 3
2 6 12 1,204 0 0 6
3 1 2 1,225 0 1 11
4 7 15 1,292 0 0 18
5 10 14 1,510 0 0 7
6 6 11 1,533 2 0 9
7 10 16 1,797 5 0 8
8 3 10 1,884 0 7 11
9 6 9 1,942 6 0 10
10 4 6 2,512 0 9 12
11 1 3 3,254 3 8 15
12 4 17 3,329 10 0 15
13 5 18 3,969 0 0 14
14 5 13 4,389 13 0 16
15 1 4 5,227 11 12 16
16 1 5 6,352 15 14 18
17 19 20 7,367 0 0 19
18 1 7 8,765 16 4 19
19 1 19 24,733 18 17 0

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 47

Conglomerado de pertenencia

5 4 3 2
conglome conglome conglome conglome
Caso rados rados rados rados
1:caballo 1 1 1 1
2:burro 1 1 1 1
3:cebra 1 1 1 1
4:hamster 1 1 1 1
5:rata 2 1 1 1
6:oveja 1 1 1 1
7:reno 3 2 2 1
8:mula 1 1 1 1
9:cerdo 1 1 1 1
10:camello 1 1 1 1
11:búfalo 1 1 1 1
12:zorro 1 1 1 1
13:conejo 2 1 1 1
14:llama 1 1 1 1
15:ciervo 3 2 2 1
16:bisonte 1 1 1 1
17:gato 1 1 1 1
18:perro 2 1 1 1
19:foca 4 3 3 2
20:delfín 5 4 3 2

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 48

* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S *
* * * * *

Dendrogram using Single Linkage

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+

burro 2 òø
mula 8 òôòòòø
caballo 1 ò÷ ó
camello 10 òø ùòòòø
llama 14 òôòø ó ó
bisonte 16 ò÷ ùò÷ ó
cebra 3 òòò÷ ó
oveja 6 òø ùòø
zorro 12 òôòø ó ó
búfalo 11 ò÷ ó ó ó
cerdo 9 òòòôòø ó ùòòòòòø
hamster 4 òòò÷ ùòòò÷ ó ó
gato 17 òòòòò÷ ó ó
rata 5 òòòòòòòø ó ùòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòø
perro 18 òòòòòòòôòòò÷ ó ó
conejo 13 òòòòòòò÷ ó ó
reno 7 òûòòòòòòòòòòòòòòò÷ ó
ciervo 15 ò÷ ó
foca 19 òòòòòòòòòòòòòûòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷
delfín 20 òòòòòòòòòòòòò÷
5 grupos
4 grupos
3 grupos

2 grupos

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 49

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 50

Ejercicio 2:
Se pretende clasificar un conjunto de 26 animales mamíferos en 4 grupos
homogéneos atendiendo a su configuración dental. La información de la que se dispone
es la del número de piezas dentales. Los datos de los que se dispone son los siguientes:

Incisivos Incisivos Caninos Caninos Premolares Premolares Molares Molares


Mamífero Sup. Inf. Sup. Inf. Inf. Sup. Sup. Inf.

ALCE 0 4 1 0 3 3 3 3
ANTÍLOPE 0 4 0 0 3 3 3 3
ARDILLA 1 1 0 0 1 1 3 3
BISONTE 0 4 0 0 3 3 3 3
BUEY 0 4 0 0 3 3 3 3
CABRA 0 4 0 0 3 3 3 3
CASTOR 1 1 0 0 2 1 3 3
CIERVO 0 4 0 0 3 3 3 3
COMADREJA 3 3 1 1 3 3 1 2
HURÓN 3 3 1 1 3 3 1 2
JAGUAR 3 3 1 1 3 2 1 1
LEÓN 3 3 1 1 3 2 1 1
LINCE 3 3 1 1 2 2 1 1
LOBO 3 3 1 1 4 4 2 3
MARTA 3 3 1 1 4 4 1 2
MOFETA 3 3 1 1 3 3 1 2
MURCIÉLAGO 2 3 1 1 1 2 3 3
NUTRIA 3 2 1 1 1 2 3 3
OCELOTE 3 3 1 1 3 2 1 1
OSO 3 3 1 1 4 4 2 3
OVEJA 0 4 0 0 3 3 3 3
RATÓN 1 1 0 0 0 0 3 3
RENO 0 4 1 0 3 3 3 3
TEJÓN 3 3 1 1 3 3 1 2
VISÓN 3 3 1 1 3 3 1 2
ZORRO 3 3 1 1 4 4 2 3

Clasificar estos mamíferos utilizando el método de las k-medias para agrupar a los
mamíferos en 4 grupos.

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 51

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 52

Centros iniciales de los conglomerados

Conglomerado
1 2 3 4
Incisivos Superiores 3 0 1 3
Incisivos Inferiores 3 4 1 3
Caninos Superiores 1 0 0 1
Caninos Inferiores 1 0 0 1
Premolares Inferiores 2 3 0 4
Premolares Superiores 2 3 0 4
Molares Superiores 1 3 3 2
Molares Inferiores 1 3 3 3

Historial de iteraciones(a)

Cambio en los centros de los conglomerados


Iteración 1 2 3 4
1 1,150 ,250 1,202 ,354
2 ,000 ,000 ,000 ,000
a Se ha logrado la convergencia debido a que los centros de los conglomerados no presentan ningún
cambio o éste es pequeño. El cambio máximo de coordenadas absolutas para cualquier centro es de
,000. La iteración actual es 2. La distancia mínima entre los centros iniciales es de 3,606.

Pertenencia a los conglomerados


Conglome
Número de caso MAMIFERO rado Distancia
1 alce 2 ,750
2 antílope 2 ,250
3 ardilla 3 ,333
4 bisonte 2 ,250
5 buey 2 ,250
6 cabra 2 ,250
7 castor 3 1,054
8 ciervo 2 ,250
9 comadrej 1 ,828
10 hurón 1 ,828
11 jaguar 1 1,110
12 león 1 1,110
13 lince 1 1,150
14 lobo 4 ,354
15 marta 4 1,061
16 mofeta 1 ,828
17 murciéla 1 2,739
18 nutria 1 2,739
19 ocelote 1 1,110
20 oso 4 ,354
21 oveja 2 ,250
22 ratón 3 1,202
23 reno 2 ,750
24 tejón 1 ,828
25 visón 1 ,828
26 zorro 4 ,354

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 53

Centros de los conglomerados finales

Conglomerado
1 2 3 4
Incisivos Superiores 3 0 1 3
Incisivos Inferiores 3 4 1 3
Caninos Superiores 1 0 0 1
Caninos Inferiores 1 0 0 1
Premolares Inferiores 3 3 1 4
Premolares Superiores 2 3 1 4
Molares Superiores 1 3 3 2
Molares Inferiores 2 3 3 3

Distancias entre los centros de los conglomerados finales

Conglomerado 1 2 3 4
1 3,974 4,353 2,353
2 3,974 4,417 3,897
3 4,353 4,417 5,633
4 2,353 3,897 5,633

Número de casos en cada conglomerado

Conglomerado 1 11,000
2 8,000
3 3,000
4 4,000
Válidos 26,000
Perdidos ,000

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 54

ANÁLISIS DE DATOS CUALITATIVOS

Ejercicio 1:
Un grupo de biólogos ha opinado acerca del plan de actuación de la
Administración sobre el Parque Natural de Doñana clasificando el mismo como Bueno,
Aceptable o Malo. Los resultados de opinión teniendo en cuenta la procedencia laboral
de los mismos, según trabajen para algún organismo público o pertenezcan a otros
organismos no gubernamentales se muestran a continuación:

Opinión Bueno Aceptable Malo


Procedencia
Organismo Público 67 56 35
Organismo no Gubernamental 12 40 50

a) Clasificar las variables contempladas.


b) Introducir la información anterior y construir la tabla de contingencia plasmando
los porcentajes por columna. Comentar los resultados.
c) ¿La procedencia laboral de los biólogos influye en la opinión que expresan sobre
el plan de actuación?

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 55

Tabla de contingencia Procedencia * Opinión

Opinión
Bueno Aceptable Malo Total
Procedencia Público Recuento 67 56 35 158
% de Opinión 84,8% 58,3% 41,2% 60,8%
No Gubernamental Recuento 12 40 50 102
% de Opinión 15,2% 41,7% 58,8% 39,2%
Total Recuento 79 96 85 260
% de Opinión 100,0% 100,0% 100,0% 100,0%

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 56

Pruebas de chi-cuadrado

Sig. asintótica
Valor gl (bilateral)
Chi-cuadrado de Pearson 33,078a 2 ,000
Razón de verosimilitudes 35,395 2 ,000
Asociación lineal por
32,401 1 ,000
lineal
N de casos válidos 260
a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5.
La frecuencia mínima esperada es 30,99.

Medidas simétricas

Sig.
Valor aproximada
Nominal por Phi ,357 ,000
nominal V de Cramer ,357 ,000
Coeficiente de
,336 ,000
contingencia
N de casos válidos 260
a A i d l hi ót i lt ti
Medidas direccionales

Error típ. Sig.


a b
Valor asint. T aproximada aproximada
Nominal Lambda Simétrica ,135 ,071 1,816 ,069
por nominal Procedencia dependiente ,147 ,083 1,635 ,102
Opinión dependiente ,128 ,083 1,445 ,149
Tau de Goodman Procedencia dependiente ,127 ,037 ,000c
y Kruskal Opinión dependiente ,060 ,019 ,000c

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 57

Ejercicio 2:
Se está llevando a cabo un estudio sobre la raza canina Boxer para investigar el
grado de agresividad que presentan los perros de dicha raza. Se supone en principio, que
los síntomas de agresividad dependen fundamentalmente del nivel de adiestramiento
que han tenido estos perros durante los dos primeros años de su vida. Por este motivo,
se han investigado a 208 perros Boxer ofreciendo los siguientes resultados:

Nivel de adiestramiento Bajo Medio Alto


Grado de agresividad
Bajo 12 13 28
Medio 28 34 15
Alto 42 31 5

a) ¿Qué tipo de variables son?


b) Obtener la distribución condicionada del grado de agresividad al nivel de
adiestramiento.
c) ¿Son independientes?.

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 58

Tabla de contingencia Grado de Agresividad * Grado de Adiestramiento

Grado de Adiestramiento
Bajo Medio Alto Total
Grado de Bajo Recuento 12 13 28 53
Agresividad % de Grado de
14,6% 16,7% 58,3% 25,5%
Adiestramiento
Medio Recuento 28 34 15 77
% de Grado de
34,1% 43,6% 31,3% 37,0%
Adiestramiento
Alto Recuento 42 31 5 78
% de Grado de
51,2% 39,7% 10,4% 37,5%
Adiestramiento
Total Recuento 82 78 48 208
% de Grado de
100,0% 100,0% 100,0% 100,0%
Adiestramiento

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 59

Pruebas de chi-cuadrado

Sig. asintótica
Valor gl (bilateral)
Chi-cuadrado de Pearson 41,629a 4 ,000
Razón de verosimilitudes 40,522 4 ,000
Asociación lineal por
31,093 1 ,000
lineal
N de casos válidos 208
a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5.
La frecuencia mínima esperada es 12,23.

Medidas direccionales

Error típ. Sig.


a b
Valor asint. T aproximada aproximada
Ordinal por ordinal d de Somers Simétrica -,336 ,058 -5,668 ,000
Grado de Agresividad
-,338 ,058 -5,668 ,000
dependiente
Grado de Adiestramiento
-,334 ,058 -5,668 ,000
dependiente
a. Asumiendo la hipótesis alternativa.
b. Empleando el error típico asintótico basado en la hipótesis nula.

Medidas simétricas

Error típ. Sig.


a b
Valor asint. T aproximada aproximada
Ordinal por ordinal Tau-b de Kendall -,336 ,058 -5,668 ,000
Tau-c de Kendall -,330 ,058 -5,668 ,000
Gamma -,492 ,078 -5,668 ,000
N de casos válidos 208
a. Asumiendo la hipótesis alternativa.
b. Empleando el error típico asintótico basado en la hipótesis nula.

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 60

Ejercicio 3:
En la siguiente tabla se muestra la información de la Unidad de Paritorio de un
hospital granadino, donde aparecen las frecuencias observadas de utilización de
analgesia epidural y realización de episiotomía a las mujeres cuyo parto es asistido en
dicho centro. Los responsables de esta Unidad creen que la utilización de analgesia
epidural en el proceso del parto influye en la realización de episiotomía.

Analgesia Epidural No Sí
Episitomía
No 405 243
Sí 239 235

Se pide la realización de un estudio de asociación que de respuesta a los


responsables de la Unidad de Paritorio.

Tabla de contingencia Realización de Episiotomía * Utilización de


analgesia epidural

Utilización de
analgesia epidural
No Sí Total
Realización de NO 405 243 648
Episiotomía 62,9% 50,8% 57,8%
Si 239 235 474
37,1% 49,2% 42,2%
Total 644 478 1122
100,0% 100,0% 100,0%

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 61

Pruebas de chi-cuadrado

Sig. asintótica Sig. exacta Sig. exacta


Valor gl (bilateral) (bilateral) (unilateral)
Chi-cuadrado de Pearson 16,332b 1 ,000
Corrección por
a 15,841 1 ,000
continuidad
Razón de verosimilitudes 16,316 1 ,000
Estadístico exacto de
,000 ,000
Fisher
N de casos válidos 1122
a. Calculado sólo para una tabla de 2x2.
b. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada
es 201,94.

Medidas simétricas

Sig.
Valor aproximada
Nominal por Phi ,121 ,000
nominal V de Cramer ,121 ,000
Coeficiente de
,120 ,000
contingencia
N de casos válidos 1122
a. Asumiendo la hipótesis alternativa.
b. Empleando el error típico asintótico basado en la hipótesis
nula.

Medidas direccionales

Error típ. Sig.


a b
Valor asint. T aproximada aproximada
Nominal Lambda Simétrica ,000 ,000 .c .c
por nominal Realización de c c
,000 ,000 . .
Episiotomía dependiente
Utilización Analgesi c c
,000 ,000 . .
Epidural dependiente
Tau de Goodman Realización de d

Departamento de Estadística e I.O. Universidad de Granada


FBA I Cuaderno de Prácticas de Estadística con SPSS 62

Bibliografía Recomendada:

• Aguilera del Pino, A. M. (2001). “Tablas de Contingencia Bidimensionales”. Ed


La Muralla, S.A.
• García Leal, J., Lara Porras, A.M., Navarrete Álvarez, E., Rico Castro, N.,
Román Montoya, Y., Ruiz Castro, E. y Sánchez Borrego, I.R. (2007). “Técnicas
Estadísticas aplicadas en Biología con SPSS”. Editorial Proyecto Sur.
• Gutiérrez Jáimez, R., González Carmona, A., Torres Ruiz, F y Gallardo
Sansalvador, J.A. (1994). “Técnicas de Análisis de datos Multivariable.
Tratamiento computacional”. Universidad de Granada.
• Lara Porras, A.M. (2001) “Diseño Estadístico de Experimentos, Análisis de la
Varianza y Temas relacionados. Tratamiento Informático mediante SPSS”. Ed.
Proyecto Sur.
• Lara Porras, A.M., Sánchez Borrego, I.R., Ramos Ábalos, E.M.Raya Miranda,
R., Tarifa Blanco, J.A. y Alfonso Uxó, A. (2008) “Guía Interactiva de
Autoaprendizaje de SPSS. versión 2.1” Ed. Proyecto Sur.
• Visauta Vinacua, B. (1998) “Análisis Estadístico con SPSS para Windows.
Volumen II: Estadística multivariante”. McGraw-Hill.
• Visauta Vinacua, B. (2007) “Análisis Estadístico con SPSS 14. Estadística
Básica”. McGraw-Hill.

Bibliografía General:

• Box, G.E.P., Hunter W.G. & Hunter J.S. (1988). “Estadística para
Investigadores”. Ed. Reverté.
• Canavos, G.C. (1990). “Probabilidad y Estadística. Aplicaciones y Métodos”.
Ed. McGraw-Hill.
• Ferrán Aranaz, M. (1996). “SPSS para Windows. Programación y Análisis
Estadístico”. Serie McGraw-Hill de informática.
• García Leal, J. y Lara Porras, A.M. (1998). “Diseño Estadístico de
Experimentos. Análisis de la Varianza”. Grupo Editorial Universitario.
• Lara Porras, A.M. (2010) “Estadística para Biología y Ciencias Ambientales:
Tratamiento Informático mediante SPSS”. Ed. Proyecto Sur.
• Lara Porras, A.M. y Román Montoya, Yolanda (2010) “Aprender Estadística
analizando datos: Métodos multimedia”. Ed. Proyecto Sur.
• Lizasoain, L. y Joaristi, L. (1998) “SPSS para Windows”. Ed Paraninfo.
• Ludwig, J.A. y Reynolds, J.F. (1988) “Statistical Ecology”. J. Willey & Sons.
• Martin Andrés, A., Luna del Castillo, J.D. (2004). “Bioestadística para las
Ciencias de la Salud”. Ed. Capitel.
• Mason, R.L., Gunst, R.F. y Hess, J.L. (1989), “Statistical Design and Analysis
of Experiments”. J. Willey & Sons.
• Milton, J.S. (2007) “Estadística para Biología y Ciencias de la Salud”. Ed.
McGraw-Hill.
• Ollero Hinojosa, J., García Leal, J., Lara Porras. A.M., Martínez Andrés, A.,
Rodríguez, C., Ramos, H. (1997) “Diseño y Análisis Estadístico de
Experimentos”. Grupo Editorial Universitario.
• Sharma, S. (1996) “Applied Multivariate Techniques”. Ed. J. Wiley & Sons.

Departamento de Estadística e I.O. Universidad de Granada

También podría gustarte