Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Manual de Estadistica PDF
Manual de Estadistica PDF
Aplicada I
Cuaderno de Prácticas de
Estadística con SPSS
Curso 2010-2011
pág.
CONTRASTES DE HIPÓTESIS
PARAMÉTRICOS Y NO PARAMÉTRICOS 3
Ejercicio 1 3
Ejercicio 2 5
Ejercicio 3 6
Ejercicio 4 7
Ejercicio 5 9
ANÁLISIS DE REGRESIÓN 10
Ejercicio 1 10
Ejercicio 2 14
Ejercicio 3 17
Ejercicio 4 19
Ejercicio 5 22
DISEÑO DE EXPERIMENTOS 25
Ejercicio 1 25
Ejercicio 2 27
Ejercicio 3 28
Ejercicio 4 29
Ejercicio 5 31
Ejercicio 6 33
ANÁLISIS DE LA COVARIANZA 35
Ejercicio 1 35
Ejercicio 2 37
Ejercicio 3 39
Ejercicio 4 41
ANÁLISIS CLUSTER 43
Ejercicio 1 43
Ejercicio 2 50
ANÁLISIS DE DATOS CUALITATIVOS 54
Ejercicio 1 54
Ejercicio 2 57
Ejercicio 3 60
Bibliografía 62
FBA I Cuaderno de Prácticas de Estadística con SPSS 3
CONTRASTES DE HIPÓTESIS
PARAMÉTRICOS Y NO PARAMÉTRICOS
Ejercicio 1:
Placebo 203 229 215 220 223 233 208 228 209
FL113 221 207 185 203 187 190 195 204 212
Suponiendo que las distribuciones del tiempo necesario para la recuperación son
normales, comparar las muestras dadas para saber si se puede admitir que ambas
muestras provienen de la misma población. Efectuar los correspondientes contrastes
(sobre medias y varianzas) al nivel de significación α = 0.05.
H0: μ1= μ2
Primer contraste
H1: μ1≠ μ2
Estadísticos de grupo
Error típ. de la
Grupo placebo o FL113 N Media Desviación típ. media
Tiempo de recuperación Grupo placebo 9 218,67 10,524 3,508
Grupo FL113 9 200,44 12,126 4,042
Ejercicio 2:
Se ha realizado un estudio para investigar el efecto del ejercicio físico en el nivel de
colesterol en plasma, en el que participaron 11 sujetos. Antes del ejercicio, se tomaron
muestras de sangre para determinar el nivel del colesterol de cada participante. Después,
los individuos fueron sometidos a un programa de ejercicios que se centraba en carreras
y marchas diarias. Al final del periodo de ejercicios, se tomaron nuevamente muestras
de sangre y se obtuvo una segunda lectura del nivel de colesterol en plasma de los
sujetos. Se quiere estimar la diferencia entre el nivel medio de colesterol antes y
después del ejercicio. Se recogieron los siguientes datos
Decidir si existen diferencias significativas entre estos niveles antes y después del
ejercicio físico.
Diferencias relacionadas
95% Intervalo de
confianza para la
DesviaciónError típ. de diferencia
Media típ. la media Inferior Superior t gl Sig. (bilateral)
Par 1 Colesterol antes d
ejercicio - Coleste 33,18 51,066 15,397 -1,12 67,49 2,155 10 ,057
despues del ejerc
Ejercicio 3:
En unos laboratorios clínicos se toman muestras de 650 análisis de sangre y se anota el
número de eritrocitos por milímetro cúbico de sangre. ¿Se puede admitir que el número
de eritrocitos se distribuye normalmente? Los resultados agrupados en 7 clases son los
que figuran en la tabla adjunta
Eritrocitos
N 650
Media 5,0862
Parámetros normales(a,b) Desviación típica
1,23238
Ejercicio 4:
Recuento
VACUNACI Total
no si
HEPATITI no 464 538 1002
si 70 11 81
Total 534 549 1083
Pruebas de chi-cuadrado
Ejercicio 5:
Se realiza un estudio para investigar la asociación entre el color de las flores y la
fragancia de las azaleas silvestres. Se observan 200 plantas floridas seleccionadas
aleatoriamente. Cada una de ellas se clasifica según el color y la presencia o ausencia de
fragancia. Los datos se muestran en la tabla adjunta
Color
Fragancia Blanca Rosa Naranja
SI 12 60 58
NO 50 10 10
Pruebas de chi-cuadrado
Sig. asintótica
Valor gl (bilateral)
Chi-cuadrado de Pearson 82,293(a) 2 ,000
Razón de verosimilitud 83,848 2 ,000
Asociación lineal por lineal 59,712 1 ,000
N de casos válidos
200
a 0 casillas (,0%) tienen una frecuencia esperada inferior a 5.
La frecuencia mínima esperada es 21,70.
ANÁLISIS DE REGRESIÓN
Ejercicio 1:
Se realiza un estudio para establecer una ecuación mediante la cual se pueda utilizar la
longitud en cm. de una cierta variedad de planta al cabo de un año de vida para predecir
la longitud de esa variedad de planta en edad adulta:
Se pide:
a) Diagrama de dispersión
42
40
38
36
34
32
30
LONG_ADU
28
26
12 14 16 18 20 22
LONG_1
Coeficientesa
Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error típ. Beta t Sig.
1 (Constante) 5,296 2,694 1,965 ,071
LONG_1 1,663 ,156 ,947 10,657 ,000
a. Variable dependiente: LONG_ADU
ANOVAb
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 244,306 1 244,306 113,577 ,000a
Residual 27,963 13 2,151
Total 272,269 14
a. Variables predictoras: (Constante), LONG_1
b. Variable dependiente: LONG_ADU
Ejercicio 2:
Se realiza un estudio para establecer una ecuación mediante la cual se pueda utilizar la
concentración de estrona en la saliva para predecir la concentración de dicho esteroide
en plasma libre. Se tomaron los siguientes datos de 13 varones sanos:
Se pide:
a) Diagrama de dispersión
70,0
60,0
50,0
estrona
40,0
30,0
20,0
Coeficientesa
Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error típ. Beta t Sig.
1 (Constante) 6,887 3,965 1,737 ,110
saliva 2,886 ,297 ,946 9,705 ,000
a. Variable dependiente: plasma
Coeficientesa
Coeficientes
Coeficientes no estandarizad Intervalo de confianza para
estandarizados os B al 95%
Límite
Modelo B Error típ. Beta t Sig. Límite inferior superior
1 (Constante) 6,887 3,965 1,737 ,110 -1,841 15,614
saliva 2,886 ,297 ,946 9,705 ,000 2,232 3,541
a. Variable dependiente: plasma
ANOVAb
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 1823,070 1 1823,070 94,180 ,000a
Residual 212,930 11 19,357
Total 2036,000 12
a. Variables predictoras: (Constante), saliva
b. Variable dependiente: plasma
Ejercicio 3:
Un aficionado a las apuestas en las carreras de caballos desea estudiar la descendencia
de una conocida raza de caballos que tiene mucho éxito en dichas carreras. Para ello
estudia la relación existente entre el peso en gramos de embriones de caballos y el
número de días transcurridos de vida de los mismos. Los datos aparecen en la siguiente
tabla:
Días Peso
7 51.3
8 79.1
9 127.4
10 183.5
11 271.3
12 431.5
13 743.7
14 1143.2
15 1893.8
16 3102.4
17 4702.7
Se pide:
a) Representar la nube de puntos
b) Plantear el modelo de regresión y obtener la ecuación del modelo ajustado
c) Bondad del ajuste
4000
3000
2000
1000
0
PESO
-1000
6 8 10 12 14 16 18
DIAS
MODEL: MOD_1.
Lineal
ANOVA
Suma de Media
cuadrados gl cuadrática F Sig.
Regresión 16841317 1 16841317 25,551 ,001
Residual 5932167,3 9 659129,695
Total 22773485 10
La variable independiente esdías.
Exponencial
ANOVA
Suma de Media
cuadrados gl cuadrática F Sig.
Regresión 22,756 1 22,756 6384,193 ,000
Residual ,032 9 ,004
Total 22,789 10
La variable independiente esdías.
Ejercicio 4:
Una empresa fabricante de cereales para el desayuno desea conocer la ecuación que
permita predecir las ventas (en miles de euros) en función de los gastos en publicidad
infantil en televisión (en miles de euros), el tiempo diario de aparición en televisión (en
minutos) y los gastos en publicidad en los periódicos (en miles de euros). Se realiza un
estudio en el que se reúnen los datos mensuales correspondientes a los últimos 20
meses. Estos datos aparecen en la siguiente tabla:
Se pide:
Coeficientesa
Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error típ. Beta t Sig.
1 (Constante) 2,108 2,055 1,026 ,320
PUBL_TV 3,432 1,121 ,358 3,060 ,007
TIEMP_TV 1,477E-03 ,030 ,006 ,050 ,961
PUBL_PER 11,347 1,802 ,711 6,298 ,000
a. Variable dependiente: VENTAS
ANOVAb
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 247,677 3 82,559 26,440 ,000a
Residual 49,960 16 3,123
Total 297,638 19
a. Variables predictoras: (Constante), PUBL_PER, TIEMP_TV, PUBL_TV
b. Variable dependiente: VENTAS
ANOVAb
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 247,677 3 82,559 26,440 ,000a
Residual 49,960 16 3,123
Total 297,638 19
a. Variables predictoras: (Constante), PUBL_PER, TIEMP_TV, PUBL_TV
b. Variable dependiente: VENTAS
Ejercicio 5:
Se desea estudiar la relación entre la intensidad de regadío (medida en litros por metro
cuadrado) y la productividad (medida en Kg/Ha) de una huerta de tomates. Se han
obtenido los siguientes datos:
Productividad de Intensidad de
un cultivo regadío
2500.9 590.5
2000.8 540.4
3300.4 690
2500.6 605.2
1995.8 650
3312.3 724
3409 704.8
Se pide:
Además del regadío se cree que el empleo de un abono ha influido de forma lineal
en la productividad del cultivo. Por tanto se introduce en el modelo de regresión la
variable que mide el número de Kg. de abono por hectárea.
3600
3400
3200
3000
2800
2600
2400
2200
PRODUCT
2000
1800
500 600 700 800
REGADIO
ANOVAb
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 1557184,3 1 1557184,3 10,479 ,023a
Residual 743017,305 5 148603,461
Total 2300201,6 6
a. Variables predictoras: (Constante), REGADIO
b. Variable dependiente: PRODUCT
PRODUCT REGADIO
Correlación de Pearson PRODUCT 1,000 ,823
REGADIO ,823 1,000
Sig. (unilateral) PRODUCT , ,012
REGADIO ,012 ,
N PRODUCT 7 7
REGADIO 7 7
Coeficient
es
Coeficientes no estandari
estandarizados zados
Modelo B Error típ. Beta t Sig.
1 (Constante) 942,755 988,031 ,954 ,394
REGADIO ,674 1,897 ,073 ,355 ,740
ABONO 5,021 1,141 ,911 4,402 ,012
a. Variable dependiente: PRODUCT
ANOVAb
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 2173045,5 2 1086522,8 34,179 ,003a
Residual 127156,069 4 31789,017
Total 2300201,6 6
a. Variables predictoras: (Constante), ABONO, REGADIO
b. Variable dependiente: PRODUCT
DISEÑO DE EXPERIMENTOS
Ejercicio 1:
a) Se suponen efectos fijos: ¿qué implica esto respecto de los niveles atmosféricos
elegidos?
b) Plantear la hipótesis nula a contrastar
c) Evaluar el estadístico F utilizado para contrastar H0
d) ¿Puede rechazarse H0? Explicarlo basándose en el p-valor del contraste
ANOVA
CRECIMIE
Suma de Media
cuadrados gl cuadrática F Sig.
Inter-grupos 11274,319 4 2818,580 101,628 ,000
Intra-grupos 1248,038 45 27,734
Total 12522,357 49
Ejercicio 2:
Una compañía textil utiliza diversos telares para la producción de telas. Aunque se
desea que los telares sean homogéneos con el objeto de producir tela de resistencia
uniforme se supone que puede existir una variación significativa en la resistencia de la
tela debida a la utilización de distintos telares. A su disposición tiene 5 tipos de telares
con los que realiza determinaciones de la resistencia de la tela. Este experimento se
realiza en orden aleatorio y los resultados se muestran en la tabla adjunta. Analizar los
datos y obtener las conclusiones apropiadas.
Telares Resistencia
1 51 49 50 49 51 50
2 56 60 56 56 57
3 48 50 53 44 45
4 47 48 49 44
5 43 43 46 47 45 46
ANOVA
RESIST
Suma de Media
cuadrados gl cuadrática F Sig.
Inter-grupos 439,885 4 109,971 23,565 ,000
Intra-grupos 98,000 21 4,667
Total 537,885 25
RESIST
Estadístico
de Levene gl1 gl2 Sig.
2,367 4 21 ,086
Ejercicio 3:
En una determinada fábrica de galletas se desea saber si las harinas de sus cuatro
proveedores producen la misma viscosidad en la masa. Para ello, produce durante un día
16 masas, 4 de cada tipo de harina y mide su viscosidad. Los resultados obtenidos se
muestran en la siguiente tabla:
ANOVA
VISCOSID
Suma de Media
cuadrados gl cuadrática F Sig.
Inter-grupos 14,188 3 4,729 ,581 ,639
Intra-grupos 97,750 12 8,146
Total 111,938 15
2
Valor Normal esperado
-2
-4
-6
-6 -4 -2 0 2 4 6
Valor observado
Ejercicio 4:
Los científicos comprometidos en el tratamiento del agua residual de arenas asfálticas
estudiaron tres métodos de tratamientos para la eliminación del carbono orgánico
(basado en W.R. Pirie, Statistical Planning and Analysis for Treatments of Tar Sand
Waste-water, Centro de Información Técnica, Oficina de Información Tecnológica y
Científica, Departamento de Energía de Estados Unidos). Los tres métodos de
tratamiento utilizados fueron: flotación de aire (FA), separación de espuma (SF) y
coagulación ferroclórica (CFC). Las mediciones del material de carbono orgánico para
los tres tratamientos arrojaron los siguientes datos:
FA SE CFC
34.6 38.8 26.7
35.1 39.0 26.7
35.6 40.1 27.0
35.8 40.9 27.1
36.1 41.0 27.5
36.5 43.2 28.1
36.8 44.9 28.1
37.2 46.9 28.7
37.4 51.6 30.7
37.7 53.6 31.2
ANOVA
CARBONO
Suma de Media
cuadrados gl cuadrática F Sig.
Inter-grupos 1251,603 2 625,801 60,742 ,000
Intra-grupos 278,172 27 10,303
Total 1529,775 29
Comparaciones múltiples
Ejercicio 5:
Se ha realizado un estudio sobre el efecto de las temporadas de caza del ciervo en los
hábitos de éstos. Se seleccionan cuatro sendas que se sabe utilizan los ciervos. Antes de
comenzar la temporada de caza, durante la temporada y al terminar la temporada se
determinó el promedio de huellas halladas por semana en un área específica de cada
senda. Las sendas se trataron como bloques y se obtuvieron los siguientes datos:
Ejercicio 6:
Una industria desea comprobar el efecto que tienen cinco productos químicos sobre la
resistencia de un tipo particular de fibra. Como también puede influir la máquina
empleada en la fabricación, decide utilizar un diseño en bloques aleatorizados,
considerando las distintas máquinas como bloques. La industria dispone de cuatro
máquinas a las que asigna los cinco productos químicos en orden aleatorio. Los
resultados obtenidos se muestran en la tabla adjunta.
Tipos de máquinas
Producto químico A B C D
1 87 86 88 83
2 85 87 95 85
3 90 92 95 90
4 89 97 98 88
5 99 96 91 90
Comparaciones múltiples
Intervalo de confianza al
Diferencia 95%.
(I) (J) entre Límite
PRODUCT PRODUCT medias (I-J) Error típ. Significación Límite inferior superior
1 2 -2,00 2,336 ,409 -7,09 3,09
3 -5,75* 2,336 ,030 -10,84 -,66
4 -7,00* 2,336 ,011 -12,09 -1,91
5 -8,00* 2,336 ,005 -13,09 -2,91
2 1 2,00 2,336 ,409 -3,09 7,09
3 -3,75 2,336 ,134 -8,84 1,34
4 -5,00 2,336 ,054 -10,09 ,09
5 -6,00* 2,336 ,025 -11,09 -,91
3 1 5,75* 2,336 ,030 ,66 10,84
2 3,75 2,336 ,134 -1,34 8,84
4 -1,25 2,336 ,602 -6,34 3,84
5 -2,25 2,336 ,355 -7,34 2,84
4 1 7,00* 2,336 ,011 1,91 12,09
2 5,00 2,336 ,054 -,09 10,09
3 1,25 2,336 ,602 -3,84 6,34
5 -1,00 2,336 ,676 -6,09 4,09
5 1 8,00* 2,336 ,005 2,91 13,09
2 6,00* 2,336 ,025 ,91 11,09
3 2,25 2,336 ,355 -2,84 7,34
4 1,00 2,336 ,676 -4,09 6,09
Basado en las medias observadas.
*. La diferencia de medias es significativa al nivel ,05.
*. Se ha detectado el símbolo ,05 donde se esperaba un paréntesis de cierre en el subcomando
TEST.
ANÁLISIS DE LA COVARIANZA
Ejercicio 1:
Furgoneta
1 2 3
y x y x y x
12 20 70 64 31 27
19 23 64 62 28 25
15 22 55 47 25 22
21 30 77 66 22 26
11 15 66 50 29 28
19 22 44 42 28 29
SOLUCIÓN:
Ejercicio 2:
Se quiere analizar el efecto que tienen tres tipos distintos de terreno en el rendimiento
de una determinada plantación de almendros. Se sospecha que el rendimiento del
cultivo (medido en kg.) está relacionado con la cantidad de kg. de abono recibidos. Los
datos observados se muestran en la tabla adjunta:
Terreno
A B C
Y x y x y x
130,5 20,3 110,3 15,9 155,9 44,9
144,6 44,9 100,8 22 149,1 42,33
133,9 33,8 109,6 16,9 188,9 58,9
128,4 20,8 122,7 20,2 199,4 70,8
119,2 18,2 97,4 16,9 185,7 61,9
133,8 32,8
122,8 33,9
119,4 18,3
122,7 22,7
130,8 29,7
Se pide
Ejercicio 3:
Una empresa pretende estudiar la resistencia a la ruptura de la fibra de la que está
compuesta una cuerda. Se realiza un estudio para determinar si existe diferencia
significativa en la resistencia de los tres tipos de cuerdas disponibles (atendiendo al tipo
de fibra disponible). Se cree que la temperatura a la que se realiza el experimento puede
influir en la resistencia, por lo que se utiliza un diseño en bloques aleatorizados
considerando la temperatura como bloque, con 4 niveles. La resistencia de la cuerda a la
ruptura (medida en libras) se ve afectada por su grosor (medido en 10−3 pulgadas).
Cuerda
1 2 3
Temperatura y x y x y x
1 33 20 44 28 41 23
2 41 25 23 22 39 22
3 35 24 44 33 37 23
4 42 25 37 27 26 21
Se pide
Variable dependiente: Y
Suma de
cuadrados Media
Fuente tipo III gl cuadrática F Significación
Modelo corregido 423,966a 6 70,661 4,928 ,050
Intersección 55,091 1 55,091 3,842 ,107
CUERDA 170,503 2 85,251 5,945 ,048
TEMP 91,799 3 30,600 2,134 ,215
X 358,133 1 358,133 24,974 ,004
Error 71,701 5 14,340
Total 16776,000 12
Total corregida 495,667 11
a. R cuadrado = ,855 (R cuadrado corregida = ,682)
Ejercicio 4:
Nivel de estudios
1 2 3
y X z y x z y x z
153,4 24,2 46 141,3 18,3 22 135,5 20,3 35
157,5 25,6 55 133,9 28 51 137,9 22,9 17
140,5 24,9 49 128,7 12,1 36 140,4 33 40
162,7 57,2 44 144,2 27,4 51 126,9 20,3 39
153,5 46,3 64 137,4 33,5 35 130,1 11,2 29
ANÁLISIS CLUSTER
Ejercicio 1:
Se analiza la leche de las hembras de 20 mamíferos, obteniéndose los porcentajes en
agua, proteínas, grasa y lactosa siguientes:
Historial de conglomeración
Etapa en la que el
conglomerado
Conglomerado que se aparece por primera
combina vez
Conglom Conglom Conglom Conglom Próxima
Etapa erado 1 erado 2 Coeficientes erado 1 erado 2 etapa
1 2 8 ,911 0 0 3
2 6 12 1,204 0 0 6
3 1 2 1,225 0 1 11
4 7 15 1,292 0 0 18
5 10 14 1,510 0 0 7
6 6 11 1,533 2 0 9
7 10 16 1,797 5 0 8
8 3 10 1,884 0 7 11
9 6 9 1,942 6 0 10
10 4 6 2,512 0 9 12
11 1 3 3,254 3 8 15
12 4 17 3,329 10 0 15
13 5 18 3,969 0 0 14
14 5 13 4,389 13 0 16
15 1 4 5,227 11 12 16
16 1 5 6,352 15 14 18
17 19 20 7,367 0 0 19
18 1 7 8,765 16 4 19
19 1 19 24,733 18 17 0
Conglomerado de pertenencia
5 4 3 2
conglome conglome conglome conglome
Caso rados rados rados rados
1:caballo 1 1 1 1
2:burro 1 1 1 1
3:cebra 1 1 1 1
4:hamster 1 1 1 1
5:rata 2 1 1 1
6:oveja 1 1 1 1
7:reno 3 2 2 1
8:mula 1 1 1 1
9:cerdo 1 1 1 1
10:camello 1 1 1 1
11:búfalo 1 1 1 1
12:zorro 1 1 1 1
13:conejo 2 1 1 1
14:llama 1 1 1 1
15:ciervo 3 2 2 1
16:bisonte 1 1 1 1
17:gato 1 1 1 1
18:perro 2 1 1 1
19:foca 4 3 3 2
20:delfín 5 4 3 2
* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S *
* * * * *
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
burro 2 òø
mula 8 òôòòòø
caballo 1 ò÷ ó
camello 10 òø ùòòòø
llama 14 òôòø ó ó
bisonte 16 ò÷ ùò÷ ó
cebra 3 òòò÷ ó
oveja 6 òø ùòø
zorro 12 òôòø ó ó
búfalo 11 ò÷ ó ó ó
cerdo 9 òòòôòø ó ùòòòòòø
hamster 4 òòò÷ ùòòò÷ ó ó
gato 17 òòòòò÷ ó ó
rata 5 òòòòòòòø ó ùòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòø
perro 18 òòòòòòòôòòò÷ ó ó
conejo 13 òòòòòòò÷ ó ó
reno 7 òûòòòòòòòòòòòòòòò÷ ó
ciervo 15 ò÷ ó
foca 19 òòòòòòòòòòòòòûòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷
delfín 20 òòòòòòòòòòòòò÷
5 grupos
4 grupos
3 grupos
2 grupos
Ejercicio 2:
Se pretende clasificar un conjunto de 26 animales mamíferos en 4 grupos
homogéneos atendiendo a su configuración dental. La información de la que se dispone
es la del número de piezas dentales. Los datos de los que se dispone son los siguientes:
ALCE 0 4 1 0 3 3 3 3
ANTÍLOPE 0 4 0 0 3 3 3 3
ARDILLA 1 1 0 0 1 1 3 3
BISONTE 0 4 0 0 3 3 3 3
BUEY 0 4 0 0 3 3 3 3
CABRA 0 4 0 0 3 3 3 3
CASTOR 1 1 0 0 2 1 3 3
CIERVO 0 4 0 0 3 3 3 3
COMADREJA 3 3 1 1 3 3 1 2
HURÓN 3 3 1 1 3 3 1 2
JAGUAR 3 3 1 1 3 2 1 1
LEÓN 3 3 1 1 3 2 1 1
LINCE 3 3 1 1 2 2 1 1
LOBO 3 3 1 1 4 4 2 3
MARTA 3 3 1 1 4 4 1 2
MOFETA 3 3 1 1 3 3 1 2
MURCIÉLAGO 2 3 1 1 1 2 3 3
NUTRIA 3 2 1 1 1 2 3 3
OCELOTE 3 3 1 1 3 2 1 1
OSO 3 3 1 1 4 4 2 3
OVEJA 0 4 0 0 3 3 3 3
RATÓN 1 1 0 0 0 0 3 3
RENO 0 4 1 0 3 3 3 3
TEJÓN 3 3 1 1 3 3 1 2
VISÓN 3 3 1 1 3 3 1 2
ZORRO 3 3 1 1 4 4 2 3
Clasificar estos mamíferos utilizando el método de las k-medias para agrupar a los
mamíferos en 4 grupos.
Conglomerado
1 2 3 4
Incisivos Superiores 3 0 1 3
Incisivos Inferiores 3 4 1 3
Caninos Superiores 1 0 0 1
Caninos Inferiores 1 0 0 1
Premolares Inferiores 2 3 0 4
Premolares Superiores 2 3 0 4
Molares Superiores 1 3 3 2
Molares Inferiores 1 3 3 3
Historial de iteraciones(a)
Conglomerado
1 2 3 4
Incisivos Superiores 3 0 1 3
Incisivos Inferiores 3 4 1 3
Caninos Superiores 1 0 0 1
Caninos Inferiores 1 0 0 1
Premolares Inferiores 3 3 1 4
Premolares Superiores 2 3 1 4
Molares Superiores 1 3 3 2
Molares Inferiores 2 3 3 3
Conglomerado 1 2 3 4
1 3,974 4,353 2,353
2 3,974 4,417 3,897
3 4,353 4,417 5,633
4 2,353 3,897 5,633
Conglomerado 1 11,000
2 8,000
3 3,000
4 4,000
Válidos 26,000
Perdidos ,000
Ejercicio 1:
Un grupo de biólogos ha opinado acerca del plan de actuación de la
Administración sobre el Parque Natural de Doñana clasificando el mismo como Bueno,
Aceptable o Malo. Los resultados de opinión teniendo en cuenta la procedencia laboral
de los mismos, según trabajen para algún organismo público o pertenezcan a otros
organismos no gubernamentales se muestran a continuación:
Opinión
Bueno Aceptable Malo Total
Procedencia Público Recuento 67 56 35 158
% de Opinión 84,8% 58,3% 41,2% 60,8%
No Gubernamental Recuento 12 40 50 102
% de Opinión 15,2% 41,7% 58,8% 39,2%
Total Recuento 79 96 85 260
% de Opinión 100,0% 100,0% 100,0% 100,0%
Pruebas de chi-cuadrado
Sig. asintótica
Valor gl (bilateral)
Chi-cuadrado de Pearson 33,078a 2 ,000
Razón de verosimilitudes 35,395 2 ,000
Asociación lineal por
32,401 1 ,000
lineal
N de casos válidos 260
a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5.
La frecuencia mínima esperada es 30,99.
Medidas simétricas
Sig.
Valor aproximada
Nominal por Phi ,357 ,000
nominal V de Cramer ,357 ,000
Coeficiente de
,336 ,000
contingencia
N de casos válidos 260
a A i d l hi ót i lt ti
Medidas direccionales
Ejercicio 2:
Se está llevando a cabo un estudio sobre la raza canina Boxer para investigar el
grado de agresividad que presentan los perros de dicha raza. Se supone en principio, que
los síntomas de agresividad dependen fundamentalmente del nivel de adiestramiento
que han tenido estos perros durante los dos primeros años de su vida. Por este motivo,
se han investigado a 208 perros Boxer ofreciendo los siguientes resultados:
Grado de Adiestramiento
Bajo Medio Alto Total
Grado de Bajo Recuento 12 13 28 53
Agresividad % de Grado de
14,6% 16,7% 58,3% 25,5%
Adiestramiento
Medio Recuento 28 34 15 77
% de Grado de
34,1% 43,6% 31,3% 37,0%
Adiestramiento
Alto Recuento 42 31 5 78
% de Grado de
51,2% 39,7% 10,4% 37,5%
Adiestramiento
Total Recuento 82 78 48 208
% de Grado de
100,0% 100,0% 100,0% 100,0%
Adiestramiento
Pruebas de chi-cuadrado
Sig. asintótica
Valor gl (bilateral)
Chi-cuadrado de Pearson 41,629a 4 ,000
Razón de verosimilitudes 40,522 4 ,000
Asociación lineal por
31,093 1 ,000
lineal
N de casos válidos 208
a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5.
La frecuencia mínima esperada es 12,23.
Medidas direccionales
Medidas simétricas
Ejercicio 3:
En la siguiente tabla se muestra la información de la Unidad de Paritorio de un
hospital granadino, donde aparecen las frecuencias observadas de utilización de
analgesia epidural y realización de episiotomía a las mujeres cuyo parto es asistido en
dicho centro. Los responsables de esta Unidad creen que la utilización de analgesia
epidural en el proceso del parto influye en la realización de episiotomía.
Analgesia Epidural No Sí
Episitomía
No 405 243
Sí 239 235
Utilización de
analgesia epidural
No Sí Total
Realización de NO 405 243 648
Episiotomía 62,9% 50,8% 57,8%
Si 239 235 474
37,1% 49,2% 42,2%
Total 644 478 1122
100,0% 100,0% 100,0%
Pruebas de chi-cuadrado
Medidas simétricas
Sig.
Valor aproximada
Nominal por Phi ,121 ,000
nominal V de Cramer ,121 ,000
Coeficiente de
,120 ,000
contingencia
N de casos válidos 1122
a. Asumiendo la hipótesis alternativa.
b. Empleando el error típico asintótico basado en la hipótesis
nula.
Medidas direccionales
Bibliografía Recomendada:
Bibliografía General:
• Box, G.E.P., Hunter W.G. & Hunter J.S. (1988). “Estadística para
Investigadores”. Ed. Reverté.
• Canavos, G.C. (1990). “Probabilidad y Estadística. Aplicaciones y Métodos”.
Ed. McGraw-Hill.
• Ferrán Aranaz, M. (1996). “SPSS para Windows. Programación y Análisis
Estadístico”. Serie McGraw-Hill de informática.
• García Leal, J. y Lara Porras, A.M. (1998). “Diseño Estadístico de
Experimentos. Análisis de la Varianza”. Grupo Editorial Universitario.
• Lara Porras, A.M. (2010) “Estadística para Biología y Ciencias Ambientales:
Tratamiento Informático mediante SPSS”. Ed. Proyecto Sur.
• Lara Porras, A.M. y Román Montoya, Yolanda (2010) “Aprender Estadística
analizando datos: Métodos multimedia”. Ed. Proyecto Sur.
• Lizasoain, L. y Joaristi, L. (1998) “SPSS para Windows”. Ed Paraninfo.
• Ludwig, J.A. y Reynolds, J.F. (1988) “Statistical Ecology”. J. Willey & Sons.
• Martin Andrés, A., Luna del Castillo, J.D. (2004). “Bioestadística para las
Ciencias de la Salud”. Ed. Capitel.
• Mason, R.L., Gunst, R.F. y Hess, J.L. (1989), “Statistical Design and Analysis
of Experiments”. J. Willey & Sons.
• Milton, J.S. (2007) “Estadística para Biología y Ciencias de la Salud”. Ed.
McGraw-Hill.
• Ollero Hinojosa, J., García Leal, J., Lara Porras. A.M., Martínez Andrés, A.,
Rodríguez, C., Ramos, H. (1997) “Diseño y Análisis Estadístico de
Experimentos”. Grupo Editorial Universitario.
• Sharma, S. (1996) “Applied Multivariate Techniques”. Ed. J. Wiley & Sons.