Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadistica para Educacion Fisica
Estadistica para Educacion Fisica
SEGUNDA EDICIÓN
1
Fernando Maureira Cid
________________________________________________________________________
2
Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________
3
Fernando Maureira Cid
________________________________________________________________________
4
Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________
5
Fernando Maureira Cid
________________________________________________________________________
6
Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________
7
Fernando Maureira Cid
________________________________________________________________________
8
Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________
INTRODUCCIÓN 19
ANEXOS 257
9
Fernando Maureira Cid
________________________________________________________________________
10
Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________
INTRODUCCIÓN 19
PARTE I
ESTADÍSTICA DESCRIPTIVA 21
11
Fernando Maureira Cid
________________________________________________________________________
PARTE II
MUESTRAS Y PROBABILIDADES 77
PARTE III
ESTADÍSTICA INFERENCIAL UNIVARIADA PARAMÉTRICA 101
12
Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________
PARTE IV
ESTADÍSTICA INFERENCIAL UNIVARIADA NO PARAMÉTRICA 201
13
Fernando Maureira Cid
________________________________________________________________________
ANEXOS 257
14
Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________
15
Fernando Maureira Cid
________________________________________________________________________
16
Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________
17
Fernando Maureira Cid
________________________________________________________________________
18
Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________
19
Fernando Maureira Cid
________________________________________________________________________
Cada capítulo presenta los análisis Espero que este libro pueda ser una
de datos en su versión manual y en el guía para estudiantes de pre-grado y
programa estadístico SPSS 22.0. magíster en educación física, como así
Es importante destacar que los ejem- también para profesionales del área que
plos mostrados en cada uno de los capítu- deseen explorar y desarrollar la inves-
los y temas de este libro son FICTICIOS y tigación científica y ayuden de este modo
solo formulados para ilustrar los análisis al crecimiento de nuestra disciplina.
correspondientes.
20
Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________
21
Fernando Maureira Cid
________________________________________________________________________
22
Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________
________________________________________________________________________
23
Fernando Maureira Cid
________________________________________________________________________
24
Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________
persona, una familia, un colegio, una Estas variables pueden ser dicotó-
región, un país, etc. micas (cuando poseen dos catego-
rías) o policotómicas (tres o más ca-
i) Caso o registro: corresponde al con- tegorías). Por ejemplo:
junto de mediciones realizadas sobre Sexo de un sujeto: masculino-feme-
una unidad de análisis. Por ejemplo: nino (variable dicotómica)
el sexo, la edad, el curso y el IMC de Presencia o ausencia de un atributo:
una persona; la fuerza, velocidad, embarazada – no embarazada (varia-
resistencia y flexibilidad de un depor- ble dicotómica)
tista, etc. Religión: cristiano, musulmán, pro-
testante, budista, etc. (variable poli-
cotómica)
1.2 NIVELES DE MEDICION Estado civil: soltero, casado, separa-
do, viudo (variable policotómica).
Los datos obtenidos de nuestras va- Comuna de residencia: Santiago Cen-
riables evaluadas pueden ser de dos ti- tro, Recoleta, Providencia, Ñuñoa,
pos: a) categóricos; b) numéricos. Deter- Maipú, etc. (variable policotómica).
minar correctamente el nivel de medición
(o naturaleza de los datos) es fundamen- b) Variables categóricas ordinales: Son
tal en estadística, ya que esto determinará aquellas donde las categorías poseen
finalmente que tipos de análisis podemos un orden jerárquico, es decir, hay
realizar con ellos. categorías mayores o más importan-
tes que otras. Por ejemplo:
Cursos del colegio (1°, 2°, 3°, 4°, etc.)
1.2.1 Datos categóricos Nivel de desarrollo de patrones mo-
tores (bajo, medio y alto)
Las variables categóricas son las que IMC (bajo-peso, normal, sobrepeso,
obeso)
Puesto de trabajo (rector, director,
registran la presencia de un atributo. Es
importante destacar que las categorías
deben ser excluyentes, es decir, un mismo subdirector, jefe de UTP, profesor,
sujeto no puede estar en dos categorías al etc.)
mismo tiempo. La cantidad de categorías
va a depender de las características del
atributo medido. Son ejemplos de datos 1.2.2 Datos numéricos
categóricos la puntuación baja, media y
alta de un test; la presencia y ausencia de También conocidas como variables
una cualidad; el tipo de colegio (munici- continuas o discretas. Las variables nu-
pal, subvencionado y particular), etc. méricas son las que presentan el resul-
Las variables categóricas se dividen a tado de sus observaciones como núme-
su vez en dos grupos: ros, permiten ordenar los valores en un
continuo y el intervalo entre cada par de
a) Variables categóricas nominales: Son valores es siempre el mismo indepen-
aquellas donde las categorías no po- diente del lugar donde este (el intervalo
seen un orden, todas valen los mismo. entre el 4 y el 5 es el mismo que entre el
25
Fernando Maureira Cid
________________________________________________________________________
26
Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________
das de tendencia central, medidas de dis- estructurales (en este libro se abordará la
persión, medidas de posición y medidas estadística descriptiva y la univariada).
de forma (Fig. 1.3).
Por su parte, la estadística inferen-
cial se divide en Univariada (cuando en 1.4 DESARROLLO HISTÓRICO DE
la investigación existe una sola variable LA ESTADÍSTICA
dependiente, pudiendo existir 1 o más va-
riables independientes) y Multivariada La estadística es tan antigua como
(cuando en la investigación existen dos o la escritura y corresponde a un elemento
más variables dependientes, pudiendo complementario a todas las ciencias. La
existir una o más variables independien- historia de esta disciplina puede clasifi-
tes). La estadística univariada puede divi- carse en 4 etapas: Censos, Aritmética Po-
dirse en paramétrica y no paramétrica, lítica, Cálculo de probabilidades y Esta-
existiendo en ambos casos prueba para dística moderna.
comparar grupos y para realizar asocia-
ciones entre variables (Fig. 1.4). Por su a) La primera etapa de la estadística se
parte, la estadística multivariada se conoce como los censos, ya que se
divide en métodos de dependencia, basa en la descripción de la población
métodos de interdependencia y métodos y riquezas por parte de los gobernan-
27
Fernando Maureira Cid
________________________________________________________________________
28
Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________
29
Fernando Maureira Cid
________________________________________________________________________
30
Capítulo 1. Conceptos básicos en estadística
________________________________________________________________________
31
Fernando Maureira Cid
________________________________________________________________________
32
Capítulo 2. Estadística descriptiva: representación de datos
________________________________________________________________________
________________________________________________________________________
33
Fernando Maureira Cid
________________________________________________________________________
Ejemplo 2.1
Un profesor busca conocer el IMC de 15 estudiantes de primer año básico de un colegio
de Santiago, para ello mide la talla y el peso de ellos y luego calcula el IMC obteniendo
los siguientes resultados:
Paso 1:
Para elaborar la tabla de frecuencia debemos agrupar los valores del IMC obtenidos en
diversas categorías:
Paso 2:
Calculamos la frecuencia relativa (fr) de cada categoría con la siguiente fórmula:
(fórmula 1) fr = n1 * 100
N
Paso 3:
Calculamos la frecuencia acumulada con la frecuencia relativa de la primera categoría,
luego la frecuencia relativa de la segunda más la primera categoría, luego la tercera más
la segunda y más la primera, así sucesivamente.
34
Capítulo 2. Estadística descriptiva: representación de datos
________________________________________________________________________
Paso 4:
Elaboramos la tabla de frecuencia con los datos anteriores:
Ejemplo 2.2
Un profesor desea conocer cómo se distribuyen las notas de sus estudiantes en el último
control realizado. Los resultados obtenidos fueron los siguientes:
Paso 1:
Debido a que la variable es numérica es necesario establecer intervalos de clases:
Notas entre 2,0 y 2,9 Notas entre 4,0 y 4,9 Notas entre 6,0 y 6,9
Notas entre 3,0 y 3,9 Notas entre 5,0 y 5,9
35
Fernando Maureira Cid
________________________________________________________________________
Paso 2:
Construimos la tabla de frecuencia como en el ejemplo 2.1:
36
Capítulo 2. Estadística descriptiva: representación de datos
________________________________________________________________________
Figura 2.1 Gráfico de barra del porcentaje de IMC en estudiantes de primer año medio
de un colegio de la ciudad de Santiago.
Figura 2.2 Gráfico de barra del IMC comparando estudiantes de sexo masculino y
femenino de primer año medio de un colegio de la ciudad de Santiago.
37
Fernando Maureira Cid
________________________________________________________________________
Figura 2.3 Gráfico de torta de la distribución de una muestra según sexo. Los varones
representan el 40% (144° del círculo) y las damas el 60% (216° del círculo).
38
Capítulo 2. Estadística descriptiva: representación de datos
________________________________________________________________________
Ejemplo 2.3
Un entrenador evalúo la flexibilidad de 18 gimnastas varones (edades entre 9 y 11 años)
mediante una prueba de elevación frontal de la pierna. Los resultados fueron los
siguientes:
Paso 1:
El primer dígito de cada valor se convierte en el tallo y el segundo en la hoja, ubicando
los tallos en forma ascendente. Luego el segundo dígito se ubica a la izquierda del tallo:
5 7
6 03569
7 048
8 148
9 001245
Ejemplo 2.4
Un profesor evaluó el desarrollo de los patrones motores en 42 estudiantes de tercer año
básico de un colegio de Santiago. El test presenta una puntuación de 1 a 5 (1=muy bajo;
2=bajo; 3=ni bajo ni alto; 4=alto; 5=muy alto). A continuación se presenta la tabla de
frecuencia con los resultados:
La frecuencia relativa de las puntuaciones del test de patrones motores de tercer año
básico se presenta en el siguiente histograma:
39
Fernando Maureira Cid
________________________________________________________________________
Ejemplo 2.5
Un profesor evaluó la coordinación de 15 niños de 6 años de un colegio de Santiago,
mediante una escala de 1 a 5 (1=muy baja; 2=baja; 3=ni baja ni alta; 4=alta; 5=muy alta) y
obtuvo los siguiente resultados:
..
40
Capítulo 2. Estadística descriptiva: representación de datos
________________________________________________________________________
Paso 1:
Elaboramos el histograma y unimos el centro de cada barra con una recta, entregando la
forma del polígono de frecuencia:
Paso 2:
Elaboramos el histograma con la frecuencia acumulada y unimos las barras con una
recta, entregando la ojiva.
41
Fernando Maureira Cid
________________________________________________________________________
Luego debemos ingresar los descriptores de las variables que utilizaremos presionando
Vista de variables en la barra inferior, con esto aparece una pantalla como la figura 2.8.
En la primera columna colocamos los nombres de las variables. En la columna Tipo
aparece el concepto de numérico (en variables numéricas) o cadena (en variables
categóricas, con nombres en lugar de números). En la columna Decimales podemos
modificar la cantidad de decimales de nuestros valores.
42
Capítulo 2. Estadística descriptiva: representación de datos
________________________________________________________________________
43
Fernando Maureira Cid
________________________________________________________________________
Para realizar todos los análisis estadísticos debemos ir a Analizar que se ubica en la
barra superior y se desplegará el índice general de pruebas. Cuando seleccionamos una
de estas alternativas se desplegará un nuevo índice con los análisis particulares para
cada caso.
44
Capítulo 2. Estadística descriptiva: representación de datos
________________________________________________________________________
Para obtener una tabla de frecuencia y los gráficos en el SPSS 22.0 vamos en el
menú a:
Analizar
Estadísticos descriptivos
Frecuencia
45
Fernando Maureira Cid
________________________________________________________________________
46
Capítulo 3. Estadística descriptiva: medidas centrales, dispersión y posición
________________________________________________________________________
________________________________________________________________________
Ejemplo 3.1
Un profesor ha evaluado la velocidad en 30 metros lanzados de nueve estudiantes de
primer año medio de un colegio de Santiago y ha encontrado los siguientes resultados:
Paso 1:
Calculamos la media aritmética con la siguiente fórmula:
= ∑ Xi (fórmula 2)
n
∑ X1 = suma del valor de todas las observaciones o datos
n = número total de observaciones
.
47
Fernando Maureira Cid
________________________________________________________________________
Ahora con los datos del ejemplo 3.1 reemplazamos en la fórmula de la media:
= 7,30 + 8,15 + 4,60 + 9,10 + 6,40 + 5,50 + 7,25 + 6,30 + 8,05 = 6,96
9
Ejemplo 3.2
En un partido de básquetbol de la liga nacional ocho jugadores de un equipo realizan
lanzamientos a la canasta (independiente que estos terminen en puntos o no) y su
entrenador registra el número de intentos de cada uno de ellos y obtiene la siguiente
tabla:
.
En la primera columna vemos el número de jugadores, en la segunda los lanzamientos a
la canasta realizadas en el primer tiempo por cada uno de ellos que generan una media
de 5,25. Finalmente, en la tercera columna observamos una cantidad similar de
lanzamientos excepto en el jugador seis que de 2 lanzamiento aumento a 75, por lo
tanto, la media aumento a 14,38. Esto sirve para graficar como un solo dato outlier
produce grandes variaciones en la media de un conjunto de datos.
a los datos extremos (outliers), es decir, nes de menor a mayor. Esta se obtiene
datos demasiado atípicos o extremos pro- con el número total de observaciones y la
ducen cambios importantes en ella (ejem- suma de una unidad, luego el resultado
plo 3.2). es dividido en 2 entregando el lugar don-
de se encuentra la mediana (ejemplo 3.3).
3.1.2 Mediana Este análisis se utiliza con datos numé-
ricos, pero también con datos ordinales y
Corresponde al dato que ocupa la es una medida robusta, muy poco sen-
posición central al ordenar las observacio- sible a los datos outliers.
48
Capítulo 3. Estadística descriptiva: medidas centrales, dispersión y posición
________________________________________________________________________
Ejemplo 3.3
Un profesor evaluó la motricidad de 15 niños de edades pre-escolares de un jardín
infantil de Santiago y los resultados del test se presentan ordenados de menor a mayor
en la siguiente tabla:
Paso 1:
Calculamos la mediana con la siguiente fórmula:
Mediana = n + 1 (fórmula 3)
2
n = número total de observaciones
Mediana = 15 + 1 = 16 = 8
2 2
.
Como los valores de los lugares 5° y 6° son 7 y 8, respectivamente, es necesario obtener
la media aritmética de dichos valores:
49
Fernando Maureira Cid
________________________________________________________________________
Ejemplo 3.4
Un entrenador evaluó la cantidad de abdominales en un minuto que realizan 18
seleccionados universitarios de fútbol como parte del proceso de evaluación de su
condición física y los resultados fueron los siguientes:
La moda es el número 60, ya que es el valor que se presenta más veces en este conjunto
de datos (6 en total).
Figura 3.1 Distribuciones según sus modas. En la imagen superior izquierda se grafica
una distribución unimodal, en la imagen superior derecha una distribución bimodal y en
la imagen inferior una distribución multimodal.
50
Capítulo 3. Estadística descriptiva: medidas centrales, dispersión y posición
________________________________________________________________________
Ejemplo 3.5
Un entrenador evaluó la fuerza del tren superior en 14 seleccionados de Judo. Esto se
realizó a través de una RM en press banca y los resultados fueron los siguientes:
Paso 1:
Calculamos el rango con la siguiente fórmula:
Rango = 128 – 78 = 50
51
Fernando Maureira Cid
________________________________________________________________________
Ejemplo 3.6
Un investigador desea conocer los niveles de memoria visual de 11 estudiantes de
pedagogía en educación física de una universidad de Santiago y para ello se aplica un
test neuropsicológico. Los resultados de las observaciones son los siguientes:
Paso 1:
Calculamos la varianza con la siguiente fórmula:
(fórmula 5) S2 = ∑(Xi – 2
n–1
∑(Xi – )2 = suma de los cuadrados de la diferencia entre cada puntuación y la media de las
puntuaciones
n = número de datos
Paso 2:
Calculamos la suma de cuadrados para los datos de la memoria:
Paso 3:
Aplicamos la fórmula 5 para nuestros datos:
52
Capítulo 3. Estadística descriptiva: medidas centrales, dispersión y posición
________________________________________________________________________
Ejemplo 3.7
Utilizando la varianza del ejemplo 3.6 sobre la memoria de los estudiantes
universitarios, calculamos la desviación estándar con la siguiente fórmula:
S = √S2 (fórmula 6)
S = √2,855 = 1,689
53
Fernando Maureira Cid
________________________________________________________________________
54
Capítulo 3. Estadística descriptiva: medidas centrales, dispersión y posición
________________________________________________________________________
Ejemplo 3.7
Un profesor midió la estatura de 21 estudiantes de cuarto año medio de un colegio de la
comuna de Santiago en la clase de educación física. Los resultados fueron los siguientes:
Paso 1:
Los datos siempre deben ser ordenados de menor a mayor.
Paso 2:
Calculamos los percentiles con la siguiente fórmula:
P= n*K (fórmula 7)
100
n = número de datos
K = percentil que se desea conocer
55
Fernando Maureira Cid
________________________________________________________________________
Ejemplo 3.8
Utilizando los mismos valores del ejemplo 3.7
Paso 1:
Calculamos los cuartiles con la siguiente fórmula:
(fórmula 8) Qx = K * (n + 1)
4
K = valor del cuartil (1, 2 o 3)
n = número de datos
(fórmula 9) Qx = Li + K * (Ls – Li )
4
Ls = límite superior del intervalo
Li = límite inferior del intervalos
.
56
Capítulo 3. Estadística descriptiva: medidas centrales, dispersión y posición
________________________________________________________________________
Q1 = 1 * (21 + 1) = 22 = 5,5
4 4
Q2 = 2 * (21 + 1) = 44 = 11
4 4
Q3 = 3 * (21 + 1) = 66 = 16,5
4 4
Analizar
Estadísticos descriptivos
Frecuencia
57
Fernando Maureira Cid
________________________________________________________________________
El programa mostrará una pantalla como la figura 3.4 con un cuadro a la izquierda que
muestra nuestras variables, las cuales llevaremos al cuadro derecho (variables). Hecho
esto presionamos Estadísticos abriéndose una pantalla como figura 3.5.
58
Capítulo 3. Estadística descriptiva: medidas centrales, dispersión y posición
________________________________________________________________________
Una vez marcados los estadísticos que deseamos presionamos Continuar para volver a
la pantalla de frecuencia y presionamos Aceptar.
La hoja de cálculos del programa nos entrega una tabla como la siguiente:
.
En la tabla 3.1 observamos la cantidad de datos válidos, la cantidad de datos perdidos,
la media, la mediana, la moda, la desviación estándar, la varianza, el rango de los datos,
59
Fernando Maureira Cid
________________________________________________________________________
el mínimo y el máximo de los datos, el cuartil 0,25 (percentil 25), el cuartil 0,50 (percentil
50) y el cuartil 0,75 (percentil 75) y los deciles que corresponden a los percentiles 10, 20,
30, etc.
60
Capítulo 4. Estadística descriptiva: medidas de forma y gráfico de caja
________________________________________________________________________
________________________________________________________________________
de la curva de una distribución en rela-
ción a su imagen derecha-izquierda. Una Distribución asimétrica negativa: es
distribución es simétrica si la mitad iz- aquella donde los datos se agru-
quierda es igual a su mitad derecha (Fig. pan hacia la derecha, dejando una
4.1) y por lo tanto, la mayor parte de los cola hacia la izquierda, por lo tanto,
datos se encuentran cercanos a la media, la mayoría de los datos se encuentran
existiendo pocos casos en los extremos. cerca de las puntuaciones más altas.
En este tipo de distribuciones la media, la En estas distribuciones la media es
mediana y la moda poseen igual valor. menor que la mediana (Fig. 4.2).
61
Fernando Maureira Cid
________________________________________________________________________
Ejemplo 4.1
Un profesor evaluó la capacidad de planificación de los estudiantes de pedagogía en
educación física de una universidad de Santiago. Los resultados de las puntuaciones
fueron los siguientes:
Paso 1:
Calculamos la asimetría con la siguiente fórmula:
n * S3
∑(Xi – 3
= suma de cada observación menos la media de todas las observaciones elevada al
cubo
n = número de datos
S3 = desviación estándar de los datos al cubo
Paso 2:
Calculamos la suma de cubos para los datos de la planificación:
62
Capítulo 4. Estadística descriptiva: medidas de forma y gráfico de caja
________________________________________________________________________
Paso 3:
Para obtener el coeficiente de asimetría de Fisher reemplazamos en la fórmula 10:
63
Fernando Maureira Cid
________________________________________________________________________
Figura 4.3 Tipos de curtosis. Una distribución platicúrtica (imagen superior izquierda),
una distribución mesocúrtica (imagen superior derecha) y una distribución leptocúrtica
(imagen inferior).
Ejemplo 4.2
Para el cálculo de la curtosis utilizaremos los datos de la planificación de los estudiantes
de educación física:
.
Paso 1:
Calculamos la curtosis con la siguiente fórmula:
∑(Xi – 3
= suma de cada observación menos la media de todas las observaciones elevada a la
cuarta
n = número de datos
S3 = desviación estándar de los datos a la cuarta
.
64
Capítulo 4. Estadística descriptiva: medidas de forma y gráfico de caja
________________________________________________________________________
Paso 2:
Calculamos la suma de valores a la cuarta para los datos de la planificación:
Paso 3:
Para obtener el coeficiente de apuntamiento de Fisher reemplazamos en la fórmula 11:
curtosis de cero. Corresponde a una
distribución normal. Los datos se en- Asimétrica positiva–mesocúrtica:
cuentran distribuidos de igual manera asimetría izquierda y curtosis de ce-
a la derecha e izquierda de la media y ro. Los datos se encuentran distri-
formando una curva de altura media buidos hacia la izquierda de la dis-
(Fig 4.4). tribución (valores menores) y forman
una curva de altura media.
Simétrica–platicúrtica: asimetría de
cero y curtosis negativa. Los datos se Asimétrica positiva–platicúrtica: asi-
encuentran distribuidos de igual ma- metría izquierda y curtosis negativa.
65
Fernando Maureira Cid
________________________________________________________________________
(valores menores) y forman una cur-
va achatada. Asimétrica negativa–platicúrtica:
asimetría derecha y curtosis negativa.
Asimétrica positiva–leptocúrtica: asi- Los datos se encuentran distribuidos
metría izquierda y curtosis positiva. hacia la derecha de la distribución
Los datos se encuentran distribuidos (valores mayores) y forman una cur-
hacia la izquierda de la distribución va achatada.
(valores menores) y forman una cur-
va alargada. Asimétrica negativa–leptocúrtica:
asimetría derecha y curtosis positiva.
Asimétrica negativa–mesocúrtica: Los datos se encuentran distribuidos
asimetría derecha y curtosis de cero. hacia la derecha de la distribución
Los datos se encuentran distribuidos (valores mayores) y forman una cur-
hacia la derecha de la distribución va alargada.
66
Capítulo 4. Estadística descriptiva: medidas de forma y gráfico de caja
________________________________________________________________________
Ejemplo 4.3
Un profesor evaluó la motivación hacia la clase de educación física de 12 estudiantes de
tercer año de enseñanza media de un colegio de Santiago. De ello se obtuvo la siguiente
tabla ordenada de menor a mayor:
.
Paso 1:
Determinar el dato menor y mayor, la mediana, el cuartil inferior y el cuartil superior y
la distancia intercuartil (Di) que se obtiene con la siguiente fórmula:
Di = CS – SI (fórmula 12)
CS = valor del cuartil superior
S3 = valor del cuartil inferior
.
Al realizar los cálculos con el ejemplo 4.3 tenemos:
Dato menor= 10
Dato mayor= 55
Mediana= 20,5
Cuartil inferior= 13,5
Cuartil superior= 29,5
Distancia intercuartil= 29,5 – 13,5 = 16
67
Fernando Maureira Cid
________________________________________________________________________
Paso 2:
Luego debemos determinar las cotas (límites de separación de los datos de la mediana)
para decidir si un dato es outlier (extremo, anómalos o atípicos) cuando caiga entre la 1°
y 2° cota inferior o superior o si un dato es outlier severo cuando caiga fuera de la 2° cota
inferior o superior. La primera cota se obtiene con la siguiente fórmula:
Paso 3:
Con estos valores se debe dibujar una escala con el rango de variación de los datos,
marcar la mediana y los cuartiles (inferior y superior) dibujando una caja entre los
cuartiles.
Paso 4:
Desde el cuartil inferior se traza una línea con bigotes hasta el dato menor de la muestra
y de igual forma del cuartil superior se traza una línea hasta el dato mayor. Esto
siempre y cuando ningún dato sobrepase la 1° o 2° cota inferior o superior, ya que de
68
Capítulo 4. Estadística descriptiva: medidas de forma y gráfico de caja
________________________________________________________________________
ser así la línea se traza hasta el dato mayor antes de la 1° cota y se marcan estos datos
outlier con un * y los datos outlier extremos con un °.
Figura 4.5 Box-plot donde se observa la mediana (20,5), el cuartil inferior (13,5), el cuartil
superior (29,5), el dato menor (10), el dato mayor antes de la 1° cota superior (38) y un
dato outlier (55).
69
Fernando Maureira Cid
________________________________________________________________________
Ejemplo 4.4
Un profesor evaluó la agilidad y el desarrollo motor de 11 estudiantes de 5° año básico
de un colegio de Santiago. En la tabla siguiente se observan los puntajes obtenidos:
.
Paso 1:
Construimos un gráfico en cuyo eje X colocaremos la variable agilidad y en el eje Y la
variable motricidad. Luego ubicaremos un punto en la intersección de las dos
puntuaciones que obtuvo cada sujeto del ejemplo:
.
70
Capítulo 4. Estadística descriptiva: medidas de forma y gráfico de caja
________________________________________________________________________
71
Fernando Maureira Cid
________________________________________________________________________
no son lineales, aunque muestran relación del año, ya que entre los meses de marzo
entre las variables (positiva o negativa) y agosto existe en nuestro país un núme-
pero se caracterizan porque una variable ro constante y bajo de personas que asis-
posee valores constantes o existen modi- ten regularmente al gimnasio, situación
ficaciones pequeñas (aumento o disminu- que cambia radicalmente a partir de sep-
ción), pero de pronto se producen cam- tiembre, cuando la cantidad aumenta,
bios de gran envergadura produciendo duplicándose o triplicándose).
una curva en el gráfico (por ejemplo, la En la figura 4.8 se observan gráficos
relación entre el uso del gimnasio para de diferentes tipos de relación entre los
mejorar la apariencia física y los meses datos de dos variables.
Analizar
Estadísticos descriptivos
Frecuencia
El programa mostrará una pantalla como la figura 4.10 con un cuadro a la izquierda que
muestra nuestras variables, las cuales llevaremos al cuadro derecho (Variables). Hecho
esto presionamos Estadísticos abriéndose una pantalla como figura 4.11.
72
Capítulo 4. Estadística descriptiva: medidas de forma y gráfico de caja
________________________________________________________________________
Una vez marcados los estadísticos que deseamos presionamos Continuar para volver a
la pantalla de frecuencia y presionamos Aceptar.
La hoja de cálculos del programa nos entrega una tabla como la siguiente:
73
Fernando Maureira Cid
________________________________________________________________________
Gráficos
Cuadro de diálogo antiguos
Diagramas de cajas
Cuando presionamos Diagrama de caja aparece una pantalla como la figura 4.13. Aquí
marcamos Simple si queremos graficar una variable o Agrupación si son dos o más
variables
74
Capítulo 4. Estadística descriptiva: medidas de forma y gráfico de caja
________________________________________________________________________
Luego presionamos Definir y los datos numéricos que deseamos graficar los llevamos
al cuadro Variable y la variable nominal al cuadro Eje de categorías. Luego
presionamos Aceptar.
75
Fernando Maureira Cid
________________________________________________________________________
76
Capítulo 4. Estadística descriptiva: medidas de forma y gráfico de caja
________________________________________________________________________
77
Fernando Maureira Cid
________________________________________________________________________
78
Capítulo 5. Muestra y muestreo
________________________________________________________________________
________________________________________________________________________
79
Fernando Maureira Cid
________________________________________________________________________
lísticas (sujetos elegidos al azar entre to- Del nivel de confianza: corresponde
dos los que componen la población, por al grado de certeza que un evento
lo tanto, todos tienen las mismas posibili- ocurra. Recordemos que la probabi-
dades de formar parte de la muestra y los lidad se mide entre 0 y 1, siendo 0
casos son representativos de dicha pobla- una absoluta desconfianza de que un
ción) o no probabilísticas (sujetos que evento acontezca y 1 una absoluta
son escogidos por la facilidad de acceso a confianza que dicho evento ocurra.
ellos, no todos los sujetos de la población Los niveles de confianza más utiliza-
tienen posibilidades de ser escogidos y no dos en ciencias sociales son 0,05 y
pretende que los casos sean representati- 0,01.
vos, aunque pudiesen serlo). Del carácter finito o infinito de la
En ambos casos resulta necesario población: las poblaciones finitas son
determinar un número de sujetos que aquellas de tamaños reducidos y
vamos a evaluar y esto depende de tres cuyo valor conocemos (generalmente
aspectos: bajo 100.000 unidades de análisis) y
las poblaciones infinitas son aquellas
Del error muestral permitido: es el de gran tamaño y cuyo valor desco-
valor de equivocación que aceptamos nocemos (generalmente sobre 100.000
para los estadísticos de la muestra al unidades de análisis). Por ejemplo,
ser extrapolados con los parámetros una población finita son los estudian-
de la población. Los niveles habitua- tes de enseñanza media de un colegio
les son de 0,05 (5% de error) y 0,01 de la comuna de Santiago Centro y
(1% de error). A medida que disminu- una población infinita son los estu-
ye el error permitido aumenta el ta- diantes de enseñanza media de todos
maño de la muestra. los colegios de Chile.
80
Capítulo 5. Muestra y muestreo
________________________________________________________________________
Ejemplo 5.1
Un investigador desea conocer si existe diferencia en los niveles de fuerza de tren su-
perior de los estudiantes de cuarto año medio de colegios de la ciudad de Santiago. Para
ello determina un nivel de confianza del 95% (0,05) y un error permitido del 5% (0,05).
Paso 1:
Para calcular el tamaño de la muestra de una población infinita (n) utilizamos la
siguiente fórmula:
n= Z2 pq (fórmula 15)
e2
Por lo tanto, es necesario medir a 384 estudiantes de cuarto año medio de colegios de la
ciudad de Santiago.
81
Fernando Maureira Cid
________________________________________________________________________
Ejemplo 5.2
Un investigador desea conocer los hábitos de estudio de los estudiantes de primer año
de la carrera de educación física de una Universidad. La población es de 200
estudiantes, el nivel de confianza es de 95% (0,05) y el error permitido del 5% (0,05).
Paso 1:
Para calcular el tamaño de la muestra de una población finita (n) utilizamos la
siguiente fórmula:
(fórmula 16) n= N .
1 + e2 * (N – 1)
Z2 * pq
N = tamaño de la población
e2 = error muestral permitido elevado al cuadrado
Z2 = nivel de confianza elevada al cuadrado
pq = varianza de la población
82
Capítulo 5. Muestra y muestreo
________________________________________________________________________
83
Fernando Maureira Cid
________________________________________________________________________
Ejemplo 5.3
Para conocer las diferencias en el desarrollo de patrones motores de niños de NB1 de
colegios particulares, subvencionados y municipales de la comuna de Recoleta debemos
conocer:
Paso 1:
Como no existe la misma cantidad de estudiantes de NB1 en los colegios municipales,
subvencionado y particulares en la comuna de Recoleta, utilizamos la siguiente fórmula
para calcular el tamaño de la muestra por cada segmento:
fh = 384 = 0,077
5000
Paso 2:
Ahora multiplicamos el valor fh por la cantidad de sujetos de cada grupo y obtenemos
la muestra de cada grupo:
Así al sumar el total de los niños que deben ser evaluados de cada grupo se obtienen los
384 de la muestra total.
84
Capítulo 5. Muestra y muestreo
________________________________________________________________________
85
Fernando Maureira Cid
________________________________________________________________________
86
Capítulo 6. Distribuciones de probabilidades
________________________________________________________________________
________________________________________________________________________
evento ocurra y por lo tanto debería-
mos salir preparados con un para- Espacio muestral: corresponde a to-
guas. Las probabilidades fluctúan dos los posibles eventos aleatorios
entre 0 y 1 (0% y 100%). que puedan existir. Por ejemplo, seis
eventos aleatorios en el caso de un
Evento: es el resultado futuro de una dado: sus seis caras.
decisión. Por ejemplo, decidimos lan-
zar un dado y para ello existen seis La estadística inferencial trata sobre
eventos posibles (las seis caras de un los eventos aleatorios, por lo tanto, todas
dado). En el ejemplo anterior de la las futuras referencias a eventos serán de
lluvia existen dos eventos posibles este tipo. La probabilidad (px) de que un
respecto del paraguas: llevarlo o no evento ocurra se puede calcular con la
llevarlo. siguiente fórmula:
px = na (fórmula 18)
Em
na = número de eventos aleatorios
Em = tamaño de espacio muestral
87
Fernando Maureira Cid
________________________________________________________________________
88
Capítulo 6. Distribuciones de probabilidades
________________________________________________________________________
Ejemplo 6.1
En una fábrica de elaboración de balones de fútbol el 5% de los artículos presenta algún
defecto. ¿Cuál es la probabilidad de encontrar 3 balones defectuosos de una muestra de
6 balones?
.
Paso 1:
Determinar la probabilidad de ocurrencia con la siguiente fórmula:
(fórmula 19)
89
Fernando Maureira Cid
________________________________________________________________________
Ejemplo 6.2
Un voleibolista tiene una probabilidad de acierto en su saque de un 75% (0,75). Si en un
partido se escogen al azar 5 saques, calcular la posibilidad que cero, uno, dos, tres,
cuatro y cinco saques sean correctos.
Paso 1:
Determinar la probabilidad total (p(X|n,p) con la siguiente fórmula:
90
Capítulo 6. Distribuciones de probabilidades
________________________________________________________________________
91
Fernando Maureira Cid
________________________________________________________________________
Ejemplo 6.3
En un partido de básquetbol de la liga amateur el 20% de los lanzamientos realizados
desde fuera de la zona se convierten en canastas de 3 puntos. Calcular la posibilidad que
en un partido donde se realizan 30 lanzamientos fuera de la zona, 8 de ellos se convierta
en canastas de tres puntos.
Paso 1:
Determinar la probabilidad de Poisson (p(x)) con la siguiente fórmula:
n = 30
p = 20% = 0,2
x! = 8
np = 30 * 0,2 = 6
92
Capítulo 6. Distribuciones de probabilidades
________________________________________________________________________
Ejemplo 6.4
En una bodega de gimnasio sin luz, hay 10 balones de los cuales 7 son de color negro y 3
de color blanco. De una muestra de 4 balones calcule la posibilidad de sacar 2 de color
negro.
Paso 1:
Determinar la probabilidad con el modelo hipergeométrico con la siguiente fórmula:
(fórmula 22)
R = éxitos de la población
x = éxitos de la muestra
n = número de la muestra
N = total de la población
N = 10
n=4
R = 7 balones negros
x = 2 balones negros
93
Fernando Maureira Cid
________________________________________________________________________
Figura 6.4 Una distribución normal es aquella cuya asimetría y curtosis es igual a cero.
Estas distribuciones presentan una forma acampanada. En el esquema se puede observar
el porcentaje de la muestra que se encuentra en el área bajo la curva por cada desviación
estándar, mostrando valores hacia la derecha e izquierda de la curva.
94
Capítulo 6. Distribuciones de probabilidades
________________________________________________________________________
Ejemplo 6.5
Un profesor evaluó a la flexibilidad de tronco a 562 estudiantes de enseñanza media,
obteniendo una media de 17,2 cms. y una desviación estándar de 4,28. Ahora desea
conocer cuál es la probabilidad de que un estudiante escogido al azar tenga una
flexibilidad menor o igual a 15 cms.
Paso 1:
En estos casos es necesario estandarizar los datos mediante una calificación Z que se
obtiene con la fórmula siguiente:
Paso 2:
Buscamos en la tabla de probabilidades de una distribución Z (Anexo 1) y observamos
que para Z= -0,5 el área bajo la curva es 0,3085.
Paso 3:
Hacemos la suma o resta de áreas para encontrar la posibilidad buscada. En este caso no
es necesario restar el área a 1 (100%) como se observa en la figura 6.5
95
Fernando Maureira Cid
________________________________________________________________________
Figura 6.5 Área bajo la curva de interes para estudiantes con flexibilidad a 5 cms.
Ejemplo 6.6
Utilizado los mismos datos del ejemplo 6.5, ahora el profesor desea conocer cuál es la
probabilidad de que un estudiante escogido al azar tenga una flexibilidad mayor o igual
a 20 cms.
Paso 1:
Puntuación Z para 20 = 20 – 17,2 = 2,8 = 0,7
4,28 4,28
Paso 2:
Buscamos en la tabla de probabilidades de una distribución Z (Anexo 1) y observamos
que para Z= 0,7 el área bajo la curva es 0,7580.
96
Capítulo 6. Distribuciones de probabilidades
________________________________________________________________________
Paso 3:
Hacemos la suma o resta de áreas para encontrar la posibilidad buscada. En este caso es
necesario restar el área a 1 (100%) como se observa en la figura 6.6
Figura 6.6 Área bajo la curva de interes para estudiantes con flexibilidad a 20 cms.
97
Fernando Maureira Cid
________________________________________________________________________
98
Capítulo 6. Distribuciones de probabilidades
________________________________________________________________________
Figura 6.8 Distribución Chi Cuadrada. La línea continua representa una distribución Chi
cuadrada con 1 grado de libertad, la línea cortada con 3 grados de libertad y la línea de
puntos con 6 grados de libertad.
Figura 6.9 Distribución F. La línea continua representa una distribución F con 10 grados
de libertad en el grupo 1 e infinitos grados de libertad en el grupo 2, la línea cortada con
10 grados de libertad en el grupo 1 y 10 grados de libertad en el grupo 2 y la línea de
puntos con 10 grados de libertad en el grupo 1 y 4 grados de libertad en el grupo 2.
99
Fernando Maureira Cid
________________________________________________________________________
Chi-cuadrado: https://es.slideshare.net/sevilla_carlos2004/distribucion-de-chi-cuadrado
100
Capítulo 6. Distribuciones de probabilidades
________________________________________________________________________
101
Fernando Maureira Cid
________________________________________________________________________
102
Capítulo 7. Estadística inferencial: aspectos básicos
________________________________________________________________________
________________________________________________________________________
103
Fernando Maureira Cid
________________________________________________________________________
Figura 7.1 Áreas bajo la curva normal de aceptación y rechazo de la hipótesis nula. En la
imagen izquierda se observa un área para hipótesis de dos colas y en la imagen derecha
para hipótesis de una cola.
mayor puntuación en la encuesta de hábi- del área bajo la curva (área de aceptación
tos de estudio, por lo tanto, esta hipótesis de la hipótesis nula) se valora en térmi-
es de dos colas. nos de 1,64 desviaciones estándar en
En otro ejemplo, el mismo investíga- sentido positivo o negativo (α=0,05). Un
dor quiere conocer si existen diferencias 98% del área bajo la curva se valora en
en los niveles de fuerza de los estudiantes 2,32 desviaciones estándar (α=0,01) y el
de educación física de una universidad, 99,9% área bajo la curva se valora en 3,70
según el sexo de la muestra y para ello desviaciones estándar (α=0,00 .
plantea las siguientes hipótesis:
104
Capítulo 7. Estadística inferencial: aspectos básicos
________________________________________________________________________
y a los cuales medimos. Por ejemplo, he- insesgado si su valor esperado coin-
mos determinado la media y la desvia- cide con el parámetro a estimar. Por
ción estándar de la velocidad en una ca- ejemplo, la media de una muestra
rrera de 100 mts. planos de una muestra aleatoria es un estimador insesgado
aleatoria de 360 estudiantes de segundo de la media de la población, ya que
año medio y ahora queremos conocer el valor esperado de la media mues-
esos mismos valores de la población de tral coincide con el valor de la media
2.500 estudiantes de segundo medio de poblacional.
donde se extrajo la muestra. Para esto Consistencia: Un estimador será
necesitamos realizar una estimación de la consistente si a medida que aumenta
media y la desviación estándar de la el tamaño de la muestra, el valor del
población. estimador se aproxima al valor del
La estimación de parámetros se di- parámetro de la población.
vide en estimaciones puntuales y estima- Eficiencia: Un estimador es más
ciones por intervalos. eficiente (preciso) que otro si presen-
ta una varianza menor.
Suficiencia: Un estimador será sufi-
Estimaciones puntuales ciente si resume toda la información
relevante contenida en la muestra, de
Tratan de asignar un solo valor lo manera que ningún otro estimador
más cercano posible al valor del pueda entregar información adicio-
parámetro de la población. Estas estima- nal sobre el parámetro.
ciones requieren de un estimador que no
es otra cosa que un estadístico que per- Para obtener un estimador puntual
mite conocer características de la pobla- se selecciona una muestra que permita
ción. minimizar el error de la diferencia del
Para cada parámetro pueden existir parámetro y el estadístico (esto se logra
varios estimadores y la forma de seleccio- con el muestreo adecuado, situación que
nar el correcto es en base a cuatro propie- se analizó en el capítulo 5). Luego se
dades: calcula el estadístico muestral y se utiliza
como estimación del parámetro verifi-
Carencia de sesgo: Un estimador será cando las cuatro propiedades menciona-
105
Fernando Maureira Cid
________________________________________________________________________
das anteriormente. Por ejemplo, un inves- guntan por la población, aunque solo
tigador desea conocer la edad promedio contemos con los estadísticos de la
de egreso de los estudiantes de la carrera muestra.
de educación física de una Universidad Una vez determinado el nivel de
de Santiago y para ello selecciona una confianza (95%, 99%, etc.) procedemos a
muestra de 50 estudiantes. El valor de la refutar la hipótesis nula si el estadístico
media de la muestra será un estimador cae en la región de rechazo y la admiti-
puntual de la media de la población de mos cierta si cae en la región de acepta-
egresados. ción.
Cuando se toma una decisión
estadística hay que tener cuidado de no
Estimaciones por intervalos cometer los errores tipo I y tipo II.
El error tipo I también llamado
Es una forma de establecer dos error alfa (α se comete cuando un
valores entre los cuales se encuentra el investigador no acepta la hipótesis nula
parámetro que deseamos conocer con una siendo esta verdadera, es decir, se
confianza de 1 – α. Esto ayuda en la concluye que existe una diferencia entre
precisión y confiabilidad del estimador grupos, existe relación entre ellos o existe
puntual. A este intervalo se le denomina diferencia entre la muestra y la pobla-
intervalo de confianza. Por ejemplo, una ción, cuando en realidad no existe.
media poblacional nunca será conocida, El error tipo II también llamado
pero con la información de la muestra error beta (β es el error que se comete
podemos determinar dos valores entre los cuando un investigador no rechaza la
cuales se incluirá la verdadera media hipótesis nula siendo esta falsa, es decir,
poblacional con una confianza del 95% se concluye que no existe diferencia entre
(esto se verá en detalle más adelante en grupos, no existe relación entre ellos o no
este capítulo). existe diferencia entre la muestra y la
población, cuando en realidad si existe.
La potencia de un contraste es la
Contraste de hipótesis probabilidad de rechazar una hipótesis
nula cuando esta es incorrecta. Esto se
Es el proceso de decisión donde puede definir como 1 – β. Cuanto mayor
contrastamos o comparamos la hipótesis es la varianza de la población menor es la
nula con los datos empíricos y determi- potencia y cuanto mayor sea el tamaño
namos si es o no compatible con ellos. de la muestra mayor es la potencia del
Recuerde que las hipótesis siempre pre- contraste.
106
Capítulo 7. Estadística inferencial: aspectos básicos
________________________________________________________________________
Ejemplo 7.1
Un investigador evaluó la fuerza de 252 adultos mayores de entre 65 y 75 años de
diversos centros y fundaciones de Santiago, obteniendo una media de 35,8 y una
desviación estándar de 7,36. Ahora se desea conocer cuál será error estándar de la
media. La población presenta una variación de 8,5 puntos.
Paso 1:
Si conocemos las desviación estándar de la población, el error estándar de la media (e.e.)
se obtiene con la siguiente fórmula:
Paso 2:
Calcular la desviación estándar de la población:
σ = √8,5 = 2, 5
Paso 3
Calcular el error estándar de la media con la fórmula 24:
Con esto el investigador puede concluir que el error estándar de la media es de 0,184.
107
Fernando Maureira Cid
________________________________________________________________________
Ejemplo 7.2
Un investigador evaluó la agilidad de 52 estudiantes de tercer año básico de 2 colegios
de Santiago, obteniendo una media de 6,50 y una desviación estándar de 2,14. Ahora se
desea conocer cuál será la diferencia de la media de la muestra y de la población.
Paso 1:
Si desconocemos las desviación estándar de la población, el error estándar de la media
(e.e.) se obtiene con la siguiente fórmula:
Con esto el investigador puede concluir que el error estándar de la media es de 0,296.
Ejemplo 7.3
Un entrenador de fútbol evaluó los tiros al arco realizado por sus 3 jugadores delanteros
durante los partidos de la liga nacional, obteniendo una media de 9,5 lanzamientos por
partido. En el torneo existe una media de 12,1 lanzamientos por partido con una
desviación estándar de 2,8. Ahora se desea conocer si existen diferencias entre los
resultados obtenidos por el equipo en relación con la media nacional. Para ello se
establecen las hipótesis:
H0 = =
≠
1 2
H1 = 1 2
Paso 1:
Para establecer si existe diferencia entre la media muestral y la poblacional, es necesario
utilizar las puntuación Z que se obtiene con la siguiente fórmula:
108
Capítulo 7. Estadística inferencial: aspectos básicos
________________________________________________________________________
De lo anterior el entrenador puede concluir que siendo -1,605 menor a -1,96 (una
desviación Z) se debe aceptar la H0 de igualdad y por lo tanto, no existen diferencias
significativas entre el rendimiento de tiros al arco de los 3 delanteros del equipo y la
media nacional.
Una vez que hemos determinado el estas operaciones varían según un hecho
error estándar de la media, podemos cal- específico: la desviación estándar (S) de
cular los IC y realizar el contraste de hi- la población es conocida (ejemplo 7.4) o
pótesis entre la media muestral y la po- es desconocida (ejemplo 7.5). De igual
blacional. En este punto es importante forma es posible establecer IC para pro-
aclarar que los cálculos necesarios para porciones (ejemplo 7.6).
Ejemplo 7.4
Un investigador desea estimar los intervalos de confianza al extrapolar la media de su
muestra aleatoria a los de la población y para ello evaluó la flexibilidad a 108 niños de
cuarto año básico de tres colegio de Santiago obteniendo una media de 15,7 cm. y una
desviación estándar muestral de 3,29. Según los registros la población de estudiantes de
esos cursos posee una desviación estándar de 5,89. El investigador determinó un nivel
de confianza de 0,05 (por ende un valor Z= 1,96).
Datos:
= 15,7 S = 3,29 σ = 2,89
e.e. = 2,89 / √108 = 0,278
Paso 1:
Calcular los IC para una población con desviación estándar conocida con la siguiente
fórmula:
= media de la muestra
± = más para el IC superior y menos para el IC inferior
Z = nivel de confianza
e.e.= error estándar de la media (fórmula 24)
.
109
Fernando Maureira Cid
________________________________________________________________________
Paso 2:
Siguiendo con el ejemplo 7.4, se sabe que la media de la población es de 16,4 entonces el
investigador se pregunta ¿los estudiantes de la muestra tendrán una media de
flexibilidad menor que la población?
Datos:
= 15,7 S = 3,29 µ = 16,4
σ = 2,89 e.e. = 0,278
H0 = =
1 ≠
1 2
H1 = 2
De lo anterior el investigador puede concluir que siendo -2,518 mayor a -1,96 (una
desviación Z) se debe rechazar la H0 de igualdad y por lo tanto, existen diferencias
significativas entre la flexibilidad de los estudiantes evaluados y la flexibilidad media
poblacional.
Ejemplo 7.5
Un profesor evaluó la ejecución de la voltereta adelante en 18 niños de quinto año
básico de un colegio de Santiago. La media de la evaluación fue de 3,17 y una
desviación estándar de 1,21. Ahora se desea establecer los intervalos de confianza de la
media de la población (a un nivel de 0,05).
Datos:
= 3,17 S = 1,21
Grados de libertad (gl) = 18 – 1 = 17
e.e. = 1,21 / √ 8 = 0,285
110
Capítulo 7. Estadística inferencial: aspectos básicos
________________________________________________________________________
Paso 1:
Calcular los IC para una población con desviación estándar desconocida con la
siguiente fórmula:
= media de la muestra
± = más para el IC superior y menos para el IC inferior
t = valor t
e.e.= error estándar de la media (fórmula 25)
.
El valor t se obtiene de una tabla t student (Anexo 2) donde es necesario ubicar el valor
de significancia a utilizar y los grados de libertad de la muestra, el valor de intersección
corresponde al valor t en la fórmula. Por ejemplo, para 7 gl y un nivel de confianza de
0,05 el valor es de 1,89.
Paso 2:
Siguiendo con el ejemplo 7.5, se sabe que la media de la población es de 2,31 entonces el
investigador se pregunta ¿los estudiantes de la muestra tendrán una media en la
ejecución de la voltereta mayor que la población?
111
Fernando Maureira Cid
________________________________________________________________________
Datos:
= 3,17 S = 2,21 µ = 2,31
e.e. = 0,285 t = 2,11
H0 = =
1 ≠
1 2
H1 = 2
De lo anterior el investigador puede concluir que siendo 3,018 mayor a 1,96 (una
desviación Z) se debe rechazar la H0 de igualdad y por lo tanto, existen diferencias
significativas entre la puntuación de la ejecución de la voltereta en la muestra y la
población.
Ejemplo 7.6
Un investigador desea conocer los intervalos de confianza de la proporción de niños con
obesidad a partir de su muestra aleatoria de 357 estudiantes de primer año de
enseñanza básica de diversos colegios de la ciudad de Santiago. El porcentaje de obesos
de la muestra fue del 20,5% (0,205) y el nivel de confianza determinado fue de 0,05 (Z =
1,96).
Datos:
p = 20,5% = 0,205
n = 357
Paso 1:
Calcular los IC para proporciones con la siguiente fórmula:
(fórmula 29)
112
Capítulo 7. Estadística inferencial: aspectos básicos
________________________________________________________________________
Esto significa que el intervalo de confianza 0,164 (16,4%) a 0,246 (24,6%) contiene el
porcentaje de obesidad de la población con una confianza del 95%.
Paso 2:
Siguiendo con el ejemplo 7.6, se sabe que el porcentaje de obesidad de la población es de
24,0% entonces el investigador se pregunta ¿los estudiantes de la muestra tendrán un
porcentaje menor de obesidad que la población?
Datos:
p = 20,5% = 0,205
P = 24,8% = 0,248
n = 357
H0 = p = P
H1 = p ≠ P
(fórmula 30)
113
Fernando Maureira Cid
________________________________________________________________________
De lo anterior el investigador puede concluir que siendo -1,89 menor a -1,96 (una
desviación Z) se debe aceptar la H0 de igualdad y por lo tanto, no existen diferencias
significativas entre la proporción de obsesos de la muestra y de la población.
114
Capítulo 8. Normalidad de los datos
________________________________________________________________________
________________________________________________________________________
y para ello utilizamos el estadístico de
La variable dependiente debe pre- Kolmogorov-Smirnov (prueba KS), el
sentar una distribución normal.
cual permite contrastar la hipótesis que
La variable dependiente debe ser la distribución teórica es igual a la distri-
numérica (intervalar o de razón). bución observada (Ejemplo 8.1).
Ejemplo 8.1
Un profesor evaluó la agilidad de 35 estudiantes de tercer año medio de un colegio de
Santiago. Ahora quiere saber si estos datos poseen una distribución normal.
Consideraciones:
Variable: agilidad
1 grupo: 35 estudiantes
H0 = No existen diferencias estadísticamente significativas entre la distribución
teórica y la distribución observada.
115
Fernando Maureira Cid
________________________________________________________________________
Paso 1:
Cada frecuencia acumulada se divide por la frecuencia acumulada total (en este caso 35)
para obtener la frecuencia observada (fo).
Paso 2:
La frecuencia acumulada total (en este caso 35) se divide por la cantidad de categorías
(en este caso 10) para obtener la frecuencia relativa teórica (frt).
..
116
Capítulo 8. Normalidad de los datos
________________________________________________________________________
Paso 3:
La frecuencia acumulada teórica (fat) se obtiene con la suma de una categoría más las
anteriores de la frecuencia relativa teórica.
Paso 4:
Ahora cada fat se divide por la frecuencia acumulada total (en este caso 35) para obtener
la frecuencia teórica (ft).
Paso 5:
Finalmente a cada frecuencia observada (fo) se le resta la frecuencia teórica (ft) y así
obtenemos cada valor de diferencia (D).
117
Fernando Maureira Cid
________________________________________________________________________
Paso 6
La diferencia máxima (Dmáx) corresponde al valor KS (en este caso es de -0,157). Ahora
el investigador debe contrastar el valor KS obtenido (sin importar su signo positivo o
negativo) con los valores críticos de D (Anexo 3) según el nivel de confianza escogido.
Para el ejemplo, con 0,05 y 35 datos tenemos un valor KS de 0,22425.
Como KS = 0,157 < 0,22425 debemos aceptar H0 que plantea una distribución teórica
igual a la observada, es decir, los datos poseen una distribución normal.
Ejemplo 8.2
Un profesor evaluó la coordinación de 11 estudiantes de tercer año básico de un colegio
de Santiago. Ahora quiere saber si estos datos poseen una distribución normal.
118
Capítulo 8. Normalidad de los datos
________________________________________________________________________
Consideraciones:
Variable: coordinación
1 grupo: 11 estudiantes
H0 = No existen diferencias estadísticamente significativas entre la distribución
teórica y la distribución observada.
Paso 1:
Calcular el X(n-1+1) – Xi :
Paso 2:
Calcular ain [X(n-1+1) – Xi] obteniendo el valor ain del anexo 4 según N de la muestra.
119
Fernando Maureira Cid
________________________________________________________________________
Paso 3:
Calcular ∑(Xi – )2
Paso 3:
Reemplazamos en la fórmula 30:
Ahora el investigador debe contrastar el valor W obtenido con los valores críticos de W
(Anexo 5) según el nivel de confianza escogido. Para el ejemplo, con 0,05 y 11 datos
tenemos un valor W de 0,850.
120
Capítulo 8. Normalidad de los datos
________________________________________________________________________
Como W = 0,948 > 0,850 debemos rechazar H0 que plantea una distribución teórica igual
a la observada, es decir, los datos no poseen una distribución normal.
Analizar
Pruebas no paramétricas
Cuadro de dialogo antiguo
KS de una muestra
121
Fernando Maureira Cid
________________________________________________________________________
El programa nos entrega una tabla como la figura 8.1, donde se observa el número de
sujetos, la media y desviación estándar de los datos, las diferencias más extremas al
comparar las frecuencias teóricas y las frecuencias observadas, un valor Z de la prueba
de normalidad de Kolmogorov-Smirnov y la Sig. o valor p de la prueba KS.
122
Capítulo 8. Normalidad de los datos
________________________________________________________________________
Analizar
Frecuencia
Explorar
123
Fernando Maureira Cid
________________________________________________________________________
El programa nos entrega varias tablas, pero las que nos interesa es la tabla 8.2, donde se
observa la prueba de Kolmogorv-Smirnov con la corrección de Lilliefors, la cual se suele
utilizar debido a que la prueba KS por sí sola resulta ser muy conservadora.
124
Capítulo 8. Normalidad de los datos
________________________________________________________________________
En la figura 8.6 muestra cada valor observado y lo compara con cada valor esperado
(distribución normal). Si ambos valores coinciden se encontraran en una línea recta.
Si el ajuste de los datos no es buena entonces los puntos pueden adquirir diferentes
distribuciones (Figura 8.7).
125
Fernando Maureira Cid
________________________________________________________________________
126
Capítulo 9. Homogeneidad de varianzas
________________________________________________________________________
________________________________________________________________________
Ejemplo 9.1
Un investigador evalúo las estrategias de aprendizaje de los alumnos de 2 cursos,
obteniendo una media de 3,16 (S=0,97) con los puntajes de los 32 estudiantes del curso A
y una media de 3,74 (S=1,11) con los puntajes de los 35 estudiantes del curso B. Ahora se
desea saber si existe diferencia entre las varianzas de los grupos.
Consideraciones:
Variable: estrategias de aprendizaje
2 grupos: curso A y curso B
H0 = No existen diferencias estadísticamente significativas entre las varianzas del
curso A y B.
Paso 1:
Calcular la varianzas de los grupos A y B:
127
Fernando Maureira Cid
________________________________________________________________________
Paso 2:
Calcular el valor F con la siguiente fórmula:
F = 1,232 = 1,309
0,941
Paso 3:
Ahora el investigador debe contrastar el valor F obtenido con los valores críticos de F
(Anexo 6) según el nivel de confianza escogido y los grados de libertad (n – 1) de cada
grupo. Para el ejemplo, con 0,05 y gl1=31 y gl2=34 tenemos un valor F de 1,841.
Como el valor F =1,309 < 1,841 debemos aceptar H0 que plantea la igualdad de varianza
entre los dos grupos.
128
Capítulo 9. Homogeneidad de varianzas
________________________________________________________________________
Ejemplo 9.2
Un profesor evalúo la capacidad de aciertos en lanzamientos a la canasta en básquetbol
en estudiantes de enseñanza media de un colegio. Cada curso estuvo constituido por 40
alumnos. El primer año obtuvo una media de 15,7 (S=2,45), segundo año 14,8 (S=1,95),
tercer año 17,2 (S=3,80) y cuarto año 16,4 (S=2,96). Ahora se desea saber si las varianzas
de los cuatro grupos son iguales.
PRUEBA DE COCHRAN
Consideraciones:
Variable: aciertos en lanzamientos en básquetbol
4 grupos: 1°, 2°, 3° y 4° año
H0 = No existen diferencias estadísticamente significativas entre las varianzas de los
cuatro cursos.
Paso 1:
Calcular la varianzas de los grupos:
Paso 2:
Calcular el valor R de Cochran con la siguiente fórmula:
Paso 3:
Ahora el profesor debe contrastar el valor R obtenido con los valores críticos de R
(Anexo 7) según el nivel de confianza escogido y los valores correspondientes al núme-
129
Fernando Maureira Cid
________________________________________________________________________
ro de muestra y número de grupos. Para el ejemplo, con 0,05 y N°1=40 y N°2=4 tenemos
un valor R de 0,3720.
Como el valor R = 0,437 > 0,3720 debemos rechazar H0 que plantea la igualdad de
varianza entre los cuatro grupos.
PRUEBA DE HARTLEY
Paso 1:
Para el mismo ejemplo 8, calculamos el valor F de Hartley con la siguiente fórmula:
130
Capítulo 9. Homogeneidad de varianzas
________________________________________________________________________
Paso 2:
Ahora el profesor debe contrastar el valor F obtenido con los valores críticos de F
(Anexo 6) según el nivel de confianza escogido y los valores correspondientes al
número de muestra y número de grupos. Para el ejemplo, con 0,05 y N°1=40 y N°2=4
tenemos un valor F de 2,606.
Como el valor F = 3,8 > 2,606 debemos rechazar H0 que plantea la igualdad de varianza
entre los cuatro grupos.
Ejemplo 9.3
Un investigador evalúo la capacidad de atención en seleccionados universitarios de
cuatro deportes. El primer grupo estuvo constituido por 15 seleccionados de voleibol
con una media de 7,97 puntos (S=1,05), el segundo grupo de 18 seleccionados de fútbol
con 8,03 (S=1,96), el tercer grupo de 16 seleccionados de básquetbol con 9,12 (S=0,98) y el
cuarto grupo de 14 seleccionados de hándbol con 8,54 (S=1,45). Ahora se desea saber si
las varianzas de los cuatro grupos son iguales.
Consideraciones:
Variable: atención
4 grupos: seleccionados de voleibol, fútbol, básquetbol y hándbol.
H0 = No existen diferencias estadísticamente significativas entre las varianzas de los
cuatro grupos.
Paso 1:
Calcular la varianza de cada grupo.
131
Fernando Maureira Cid
________________________________________________________________________
Paso 2:
Calcular el valor B de Bartlett con la siguiente fórmula:
(fórmula 36)
132
Capítulo 9. Homogeneidad de varianzas
________________________________________________________________________
Paso 3:
Ahora el investigador debe contrastar el valor X2 obtenido con los valores críticos de X2
(Anexo 8) según el nivel de confianza escogido y los gl (n – 1). Para el ejemplo, con 0,05
y gl=3 tenemos un valor X2 de 7,815.
Como el valor X2 = 34,50 > 7,815 debemos rechazar H0 que plantea la igualdad de
varianza entre los cuatro grupos.
133
Fernando Maureira Cid
________________________________________________________________________
Analizar
Estadísticos descriptivos
Explorar
134
Capítulo 9. Homogeneidad de varianzas
________________________________________________________________________
135
Fernando Maureira Cid
________________________________________________________________________
También debe contrastar el valor p calculado (p=0,650) siendo p>0,05 se debe aceptar la
hipótesis nula que plantea la homogeneidad de las varianzas.
136
Capítulo 10. Comparación de dos grupos
________________________________________________________________________
________________________________________________________________________
Ejemplo 10.1
Un investigador midió la fuerza prensil en 9 varones de 15 años y 7 varones de 17 años
de un colegio de Santiago. Las puntuaciones se observan en la tabla siguiente:
137
Fernando Maureira Cid
________________________________________________________________________
H0 = =
1 ≠
1 2
H1 = 2
Paso 1:
Calcular el error estándar de la diferencia de medias independientes, que corresponde
al error posible entre la diferencia de dos o más grupos que forman la muestra y de dos
o más grupos que conforman la población.
(fórmula 38)
(fórmula 39)
138
Capítulo 10. Comparación de dos grupos
________________________________________________________________________
Paso 2:
Calcular los intervalos de confianza de diferencia de medias independientes con la
siguiente fórmula:
Paso 3:
Para saber si la diferencia de medias es significativa debemos calcular el valor t de
muestras independientes que se obtiene con la siguiente fórmula:
t= 1 – 2 (fórmula 41)
e.e.
1 = media grupo 1
2 = media grupo 2
El valor t de muestras independientes fue de 3,963 (no importa el signo del valor
obtenido). Luego calculamos los grados de libertad [(n1 – 1) + (n2 – 1)] = 14. Con ambos
139
Fernando Maureira Cid
________________________________________________________________________
Como el valor t = 3,963 > 1,76 se debe rechazar H0 y podemos concluir que existen
diferencias entre las medias de los grupos.
Paso 4:
Calcular el tamaño del efecto de la prueba t para muestras independientes, que
corresponde a la magnitud de la diferencia de dos medias, es decir, nos índica si la
diferencia es pequeña, mediana o grande. El tamaño del efecto (ES) corresponde a una
comparación en desviaciones típicas (Z) y en dos muestras independientes se calcula
con la siguiente fórmula:
(fórmula 42) ES = 1 – 2
σ
1 = media grupo 1
2 = media grupo 2
(fórmula 43)
140
Capítulo 10. Comparación de dos grupos
________________________________________________________________________
El tamaño del efecto de la diferencia de las dos medias independientes fue de 2,68 (no
importa el signo negativo). Para Cohen (1988) estos efectos se pueden clasificar en:
Por lo tanto, podemos asumir que la diferencia de medias de la fuerza prensil entre el
grupo de varones de 15 años y el grupo de varones de 17 años posee una diferencia
significativa y dicha diferencia es grande (ES=2,68).
Ejemplo 10.2
Un investigador evaluó la motivación por la clase de educación física de 10 estudiantes
de sexto básico de un colegio de Santiago en marzo y luego en julio. Las puntuaciones
se observan en la tabla siguiente:
141
Fernando Maureira Cid
________________________________________________________________________
H0 = =
1 ≠
1 2
H1 = 2
Paso 1:
Calcular la diferencia de medias de cada valor ( 1 – ) y elevarlas al cuadrado (
2 1 –
2)2
142
Capítulo 10. Comparación de dos grupos
________________________________________________________________________
Paso 2:
Calcular la suma de cuadrados de la diferencia (∑d2) que se obtiene con la siguiente
fórmula:
Paso 3:
Calcular la desviación estándar de diferencia de medias relacionadas (SD) que se
obtiene con la siguiente fórmula:
(fórmula 45)
Paso 4:
Calcular el error estándar de diferencia de medias relacionadas (e.e.D) que se obtiene
con la siguiente fórmula:
(fórmula 46)
143
Fernando Maureira Cid
________________________________________________________________________
Paso 5:
Calcular los intervalos de confianza de diferencia de medias relacionadas con la
siguiente fórmula:
144
Capítulo 10. Comparación de dos grupos
________________________________________________________________________
Paso 6:
Para saber si la diferencia de medias es significativa debemos calcular el valor t de
muestras relacionadas que se obtiene con la siguiente fórmula:
t= D . (fórmula 48)
e.e.D
t = -2,1 = -3,477
0,604
El valor t de muestras relacionadas fue de -3,477. Con un α=0,05 y gl= el valor t= ,83.
Ahora seguimos la regla de decisión:
Como t= 3,477 > 1,83 se debe rechazar H0 y podemos decir que existen diferencias entre
las medias de los grupos. Por lo anterior, es que el investigador puede concluir que los
estudiantes de sexto básico aumentaron su motivación por la clase de educación física
entre marzo y julio.
Paso 7:
Calcular el tamaño del efecto de la prueba t para muestras relacionadas, que se calcula
con la siguiente fórmula:
σpost
= media post-intervención
post
145
Fernando Maureira Cid
________________________________________________________________________
El tamaño del efecto de la diferencia de las dos medias relacionadas fue de 2,21. Por lo
tanto, podemos asumir que la diferencia de medias de la motivación por la clase de
educación física es grande, ya que las puntuaciones han variado en más de 1 desviación
estándar (ES=2,21).
En primer lugar debemos constatar que se cumplen los supuestos para la aplicación de
una prueba t para una muestra:
Analizar
Comparar medias
Prueba t para una muestra
Figura 10.1 Prueba t para una muestra en el menú del SPSS 22.0.
146
Capítulo 10. Comparación de dos grupos
________________________________________________________________________
La hoja de cálculos del programa nos entrega las dos tablas siguientes:
147
Fernando Maureira Cid
________________________________________________________________________
En primer lugar debemos constatar que se cumplen los supuestos para la aplicación de
una prueba t para muestras independientes:
Analizar
Comparar medias
Prueba t para muestras independientes
Figura 10.3 Prueba t para muestras independientes en el menú del SPSS 22.0.
148
Capítulo 10. Comparación de dos grupos
________________________________________________________________________
Hecho esto presionamos Continuar para volver a la pantalla de prueba t para muestras
independientes y presionamos Aceptar.
La hoja de cálculos del programa nos entrega dos tablas como las siguientes:
149
Fernando Maureira Cid
________________________________________________________________________
150
Capítulo 10. Comparación de dos grupos
________________________________________________________________________
En primer lugar debemos constatar que se cumplen los supuestos para la aplicación de
una prueba t para muestras relacionadas:
Analizar
Comparar medias
Prueba t para muestras relacionadas
Figura 10.5 Prueba t para muestras relacionadas en el menú del SPSS 22.0.
151
Fernando Maureira Cid
________________________________________________________________________
Luego presionamos Aceptar. La hoja de cálculos del programa nos entrega tres tablas
como las siguientes:
152
Capítulo 10. Comparación de dos grupos
________________________________________________________________________
valor Sig. o valor p=0,010 < 0,05 por lo cual se debe rechazar H0 que establece que no
existe relación entre las mediciones. El valor r =0,211 indica una relación positiva entre
las mediciones y si bien dicha asociación es baja, tiene sentido realizar la prueba t entre
los dos conjuntos de datos.
153
Fernando Maureira Cid
________________________________________________________________________
154
Capítulo 11. Análisis de varianza
________________________________________________________________________
________________________________________________________________________
Cuando necesitamos comparar la
media de tres o más grupos no resulta La variable dependiente debe pre-
sentar una distribución normal.
eficiente agruparlos en dúos y realizar
comparaciones de diferencia de medias La variable dependiente debe ser
numérica.
con pruebas t para muestras indepen-
dientes, ya que al aumentar el número de Debe cumplirse la homocedastici-
análisis también aumenta la posibilidad dad u homogeneidad de varianza
entre los grupos.
de cometer el error tipo I. Por lo tanto, en
estas situaciones es necesario realizar un Debe existir independencia de las
análisis de varianza (ANOVA). mediciones de los grupos.
Ejemplo 11.1
Un investigador evalúa los hábitos de estudio de los alumnos de 3 carreras univer-
sitarias: grupo 1 educación física, grupo 2 kinesiología y grupo 3 nutrición. Los puntajes
obtenidos se observan en la tabla siguiente:
155
Fernando Maureira Cid
________________________________________________________________________
Ahora se desea saber si existe diferencia entre las medias de los tres grupos. Para ello,
se establecen las siguientes hipótesis:
H0 = = =
≠ ≠
1 2 3
H1 = 1 2 3
Paso 1:
Los valores obtenidos en cada observación de los grupos deben ser elevados al
cuadrado y calcular la suma de valores cuadrados de cada grupo.
(∑x)2 = 43 + 57 + 60 = 160
Paso 2:
Calcular la suma de cuadrados totales (SCT) con la siguiente fórmula:
156
Capítulo 11. Análisis de varianza
________________________________________________________________________
Paso 3:
Calcular la suma de cuadrados inter-grupos (SCinter) con la siguiente fórmula:
(fórmula 51)
Paso 4:
Calcular la suma de cuadrados intra-grupos (SCintra) con la siguiente fórmula:
Paso 5:
Calcular los cuadrados medios inter-grupos (CMinter) con la siguiente fórmula:
157
Fernando Maureira Cid
________________________________________________________________________
Paso 6:
Calcular los cuadrados medios intra-grupos (CMintra) con la siguiente fórmula:
Paso 7:
Calcular el valor F de análisis de varianza con la siguiente fórmula:
F = 15,91 = 14,320
1,111
158
Capítulo 11. Análisis de varianza
________________________________________________________________________
Los datos calculados en el análisis de varianza deben ser presentados en una tabla como
la siguiente:
El valor F del análisis de varianza fue de 14,320 ahora se debe encontrar el valor crítico
de F (Anexo 6), donde debemos ubicar los gl de los cuadrados medios inter e intra-
grupos, buscando los gl menor entre ellos en la primera fila (horizontal) y los gl
mayores en la primera columna (vertical).
Con los datos del ejemplo 1 los 2 gl inter-grupos se buscan en primera fila y los 23 gl
intra-grupos en la primera columna. La intersección de ambos fue un valor F de 3,422.
Como F = 14,320 > 3,422 se debe rechazar H0 y podemos decir que existen diferencias
entre las medias de los grupos. Por lo anterior, es que el investigador puede concluir
que los hábitos de estudio de los alumnos de educación física, kinesiología y nutrición
son diferentes.
159
Fernando Maureira Cid
________________________________________________________________________
Siguiendo con el ejemplo 11.1, el valor F= 14,320 con lo cual aceptamos que hay
diferencias entre los grupos. Ahora utilizamos la prueba de Tukey:
Paso 1:
Se ubican las medias de los grupos de mayor a menor y la diferencia entre ellas.
Paso 2:
Obtener un cuadrado medio intra-grupo promedio (CMintraX) con la siguiente fórmula:
(fórmula 56)
k = número de sujetos
n= número de sujetos de cada grupo
.
Con los datos del ejemplo 11.1 reemplazamos en la fórmula 56:
160
Capítulo 11. Análisis de varianza
________________________________________________________________________
Paso 3:
Calcular el error estándar de una media (Sx) con la siguiente fórmula:
Sx = √ 0, 28 = 0,358
Paso 4:
Determinar el valor Q (Anexo 7) con el número de grupos (3) y los grados de libertad
dentro de los grupos (9 + 9 + 8= 24 – 1 = 23):
Paso 5:
Se calcula D con la siguiente fórmula:
D = Q * Sx (fórmula 58)
Q= valor Q
Sx= error estándar de una media
.
Con los datos del ejemplo 11.1 tenemos:
161
Fernando Maureira Cid
________________________________________________________________________
Paso 6:
Se compara el valor D con las diferencias de los pares de medias de los grupos. Valores
mayores que D significa diferencia entre los grupos.
Con los datos del ejemplo 11.1 tenemos:
Por lo tanto, es posible concluir que las puntuaciones de los hábitos de estudio entre
estudiantes de nutrición y kinesiología son estadísticamente iguales. En cambio,
educación física posee una media menor que las otra dos carreras.
En primer lugar debemos constatar que se cumplen los supuestos para la aplicación de
una prueba ANOVA:
162
Capítulo 11. Análisis de varianza
________________________________________________________________________
Luego presionamos opciones y aparece un cuadro como la figura 11.3. Aquí marcamos
Descriptivos, test de homogeneidad de varianzas, Brown-Forsythe y Welch.
Hecho esto presionamos continuar para volver a la pantalla de ANOVA.
163
Fernando Maureira Cid
________________________________________________________________________
164
Capítulo 11. Análisis de varianza
________________________________________________________________________
En la tabla 11.3 (la prueba de ANOVA de un factor como tal) se observan las sumas de
cuadrados, los grados de libertad, los cuadrados medios (medias cuadráticas), el valor F
y la Sig. bilateral o valor p.
Ahora el investigador debe contrastar el valor F calculado con el valor crítico de F
(Anexo 6) obteniendo: 3,100 > 2,696.
También debe contrastar el valor p calculado (p=0,029) siendo p<0,05 se debe rechazar la
hipótesis nula que plantea la igualdad de medias de los tres grupos.
NOTA:
Las pruebas de Welch y Brown-Forsythe son buenas alternativas al estadístico F cuando
no se pueden asumir varianzas iguales de los grupos (valor F<0,05 en la prueba de
Levene).
Si la prueba de ANOVA de un factor indica que existen diferencias entre tres o más
grupos, resulta necesario conocer entre cuales grupos se dan esas diferencias. En el
paquete estadístico SPSS 22.0 cuando estamos en la pantalla ANOVA de un factor (Fig.
11.2) marcamos Post-Hoc y aparece una pantalla como la figura 11.4.
Marcamos Tukey si asumimos varianzas iguales o Games-Howell si no asumimos
varianzas iguales. Hecho esto presionamos continuar para volver a la pantalla de
ANOVA de un factor y presionamos Aceptar.
165
Fernando Maureira Cid
________________________________________________________________________
Figura 11.4 Pantalla de Post hoc del ANOVA de un factor en el SPSS 22.0.
Si marcamos Tukey la hoja de cálculos del programa nos entrega las dos tablas
siguientes:
166
Capítulo 11. Análisis de varianza
________________________________________________________________________
En la tabla 11.5 se puede observar la diferencia de medias entre cada par de grupos
evaluados (que se calcula restando a la media del grupo 1 la media del grupo 2), el error
estándar de diferencia de medias de muestras independientes, la Sig. o valor p y los
intervalos de confianza de la diferencia de medias independientes.
Los valores sig iguales o menores de 0,05 indican que se debe rechazar la H0. Por su
parte, la diferencia de medias nos permite conocer cuál de los dos grupos comparados
posee una puntuación mayor. Si el valor es positivo el primer grupo posee un puntaje
mayor, por el contrario, si el valor es negativo el primer grupo posee una puntación
menor que el segundo grupo. Por ejemplo, la diferencia de medias del grupo 2 y 3
presenta un valor p=0,015 < 0,05 lo que indica que existen diferencias entre estos dos
grupos. El valor de diferencia de medias es de 0,87500 lo cual significa que el grupo 2
posee una media mayor que el grupo 3.
En la tabla 11.6 se observan los cuatro grupos, el número de sujetos de cada grupo y
subconjuntos donde se aglutinan los grupos. En este caso hay un subconjunto con el
grupo 3, 1 y 4 y otro subconjunto con el grupo 1, 4 y 2. Entre los grupos que se
encuentran en el mismo subconjunto no existen diferencias significativas en sus medias
(grupo 3 = grupo 1 = grupo 4 y grupo 1 = grupo 4 = grupo 2), por lo tanto, en el ejemplo
sólo se observan diferencias entre el grupo 3 y 2.
167
Fernando Maureira Cid
________________________________________________________________________
https://es.slideshare.net/yerkob/15-test-estadisticos
168
Capítulo 12. ANOVA de medidas repetidas
________________________________________________________________________
________________________________________________________________________
Cuando tenemos un grupo y le he-
mos realizado dos mediciones a través del La variable dependiente debe pre-
sentar una distribución normal.
tiempo (antes y después de una interven-
ción o en un momento inicial y otro La variable dependiente debe ser
numérica.
posterior) es posible determinar si existen
diferencias entre ambas mediciones a Debe cumplirse la homocedastici-
través de una prueba t para muestras dad u homogeneidad de varianza
relacionadas. Pero cuando las mediciones entre los grupos.
Ejemplo 12.1
Un profesor de gimnasia aplicó un entrenamiento de mejora de la flexibilidad a un
grupo de 11 gimnastas de 8 y 9 años durante 3 meses. Una de las pruebas que compone
la batería de medición es el sit and reach que fue evaluado antes del entrenamiento,
luego de 6 semanas y a las 12 semanas entregando los resultados de la tabla siguiente:
169
Fernando Maureira Cid
________________________________________________________________________
Ahora el profesor quiere saber si existen diferencias entre las 3 mediciones, es decir, si el
programa de entrenamiento provocó mejoras en las puntuaciones de esta evaluación.
Para ello, se establecen las siguientes hipótesis:
H0 = = = 3
1 ≠ 2 ≠
1 2
H1 = 3
Paso 1:
Calcular la suma de cuadrados de cada grupo
Paso 2:
Calcular la suma de cuadrados totales (SCT) con la siguiente fórmula:
170
Capítulo 12. ANOVA de medidas repetidas
________________________________________________________________________
Paso 3:
Calcular la suma de cuadrados inter-grupos (SCI) con la siguiente fórmula:
Paso 4:
Calcular la suma de cuadrados inter-sujetos (SCB) con la siguiente fórmula:
171
Fernando Maureira Cid
________________________________________________________________________
Paso 5:
Calcular la suma de cuadrados residual (SCr) con la siguiente fórmula:
Paso 6:
Calcular los grados de libertad con las siguientes fórmulas:
J = número de grupos
n = número de sujetos de cada grupo
N = número total de mediciones
..
Ahora con el ejemplo 12.1 reemplazamos en las fórmulas de grados de libertad:
glinter-grupos = 3 – 1 = 2
glinter-sujetos = 11 – 1 = 10
glresidual = (3 – 1)*(11 – 1) = 2*10 = 20
gltotal = 33 – 1 = 32
Paso 7:
Calcular la media cuadrática inter-grupos (MCI) con la siguiente fórmula:
glinter-grupos
SCi = Suma de cuadrado inter-grupos
..,
172
Capítulo 12. ANOVA de medidas repetidas
________________________________________________________________________
Paso 8:
Calcular la media cuadrática residual o intra-grupos (MCr) con la siguiente fórmula:
Paso 9:
Calcular el valor F con la siguiente fórmula:
F = 72,365 = 190,94
0,379
..
173
Fernando Maureira Cid
________________________________________________________________________
El valor F del análisis de varianza de medidas repetidas fue de 190,94 ahora se debe
encontrar el valor crítico de F (Anexo 6), donde debemos ubicar los gl inter-sujetos y los
gl residuales. Con los datos del ejemplo 2 los 2 glinter-sujetos se buscan en primera fila y los
20 glresiduales en la primera columna. La intersección de ambos fue un valor F de 3,493.
Como F= 190,94 > 3,49 se debe rechazar H0 y podemos decir que existen diferencias
entre las tres medias de los grupos. Por lo anterior, es que el profesor puede concluir
que las puntuaciones del test de sit and reach de flexibilidad son diferentes en los tres
momentos de medición. Por lo tanto, el programa de entrenamiento provocó una
mejora de esta cualidad física.
Siguiendo con el ejemplo 12.1, el valor F= 190,94 con lo cual aceptamos que hay
diferencias entre las 3 mediciones. Ahora utilizamos la prueba de Bonferroni:
Paso 1:
Calcular intervalos de confianza para todos los pares de medias posibles, con la
siguiente fórmula:
174
Capítulo 12. ANOVA de medidas repetidas
________________________________________________________________________
(fórmula 70)
1= media grupo 1
2 = media grupo 2
tn-k,α/2 = valor t con número de sujetos menos número de grupos y un alfa dividido en 2
S2w = varianza de todos los datos
n1 = número de sujetos grupo 1
n2 = número de sujetos grupo 2
Paso 2:
El método de Bonferroni trata de establecer intervalos de confianza para cada par de
medias comparadas en el ANOVA de un factor de medidas repetidas y luego
determinar si existe diferencias entre ellas de la siguiente forma:
175
Fernando Maureira Cid
________________________________________________________________________
En el caso del ejemplo 12.1 se puede observar que ninguno de los intervalos de
confianza calculado para cada par de medias (-3,301 y -0,699; -6,401 y -3,799; -4,401 y -
1,799) contiene al cero, por lo tanto, existen diferencias significativas entre las tres
mediciones de flexibilidad realizadas con el test de sit and reach.
En primer lugar debemos constatar que se cumplen los supuestos para la aplicación de
una prueba ANOVA de medidas repetidas:
Analizar
Modelo lineal general
Medidas repetidas
176
Capítulo 12. ANOVA de medidas repetidas
________________________________________________________________________
Cuando aparece el cuadro de la figura 12.2 en el rectángulo superior (nombre del factor
intra-sujetos) colocamos el nombre de nuestra variable dependiente. En el cuadro de
número de niveles colocamos el número de veces que medimos a la muestra (3, 4, 5,
etc.) y presionamos Añadir. Esto permitirá que se active el botón Definir.
177
Fernando Maureira Cid
________________________________________________________________________
Luego presionamos Aceptar. La hoja de cálculos del programa nos entrega varias tablas
por defecto, pero nos interesan las siguientes:
178
Capítulo 12. ANOVA de medidas repetidas
________________________________________________________________________
179
Fernando Maureira Cid
________________________________________________________________________
En la tabla 12.4 observamos la suma de cuadrados, gl, media cuadrática, valor F y Sig. o
valor p. En caso del cumplimiento del supuesto de esfericidad se emplean los valores de
esfericidad asumida, donde F es mayor al valor crítico de F (Anexo 6) y p=0,013 < 0,05
por lo tanto, se rechaza la H0 y se asume que existen diferencias entre las medias de las
tres mediciones.
Si no se asume esfercidad en los datos y se desea utilizar un estadístico univariado se
utilizan las tres alternativas corregidas (Greenhouse-Geisser, Huynh-Feldt, Límite
inferior). Siendo la primera de ellas la más conservadora y la que se utiliza en caso de
haber diferencias entre los tres análisis.
Si la prueba de ANOVA de medidas repetidas indica que existen diferencias entre tres o
más grupos, resulta necesario conocer entre cuales grupos se dan esas diferencias. Para
ello utilizamos la prueba post-hoc de Bonferroni.
En la figura 12.3 se observa la pantalla Opciones del ANOVA de medidas repetidas
donde se debe seleccionar Opciones. En la figura 12.5 llevamos nuestra variable
dependiente del cuadro de la izquierda a la derecha. Luego marcamos Comparar
efectos, lo que permitirá desplegar el índice de ajuste del intervalo de confianza donde
marcamos Bonferroni.
Posteriormente presionamos Continuar para volver a la pantalla de ANOVA de
medidas repetidas y presionamos Aceptar.
180
Capítulo 12. ANOVA de medidas repetidas
________________________________________________________________________
Figura 12.5 Pantalla opciones del ANOVA de medidas repetidas en el SPSS 22.0.
181
Fernando Maureira Cid
________________________________________________________________________
En la tabla 12.5 se observa la media de cada medición, el error estándar de cada media y
los intervalos de confianza de la media de cada grupo.
182
Capítulo 13. Correlación y regresión
________________________________________________________________________
________________________________________________________________________
Ejemplo 13.1
Un investigador evaluó el tiempo de práctica de actividad física semanal de 10
estudiantes de tercer año medio de un colegio de Santiago y las notas obtenidas por
ellos durante su año académico.
..
183
Fernando Maureira Cid
________________________________________________________________________
Ahora el investigador quiere saber si existe una relación significativa entre los puntajes
alcanzados por los estudiantes, es decir, si los alumnos que realizan más actividad física
son los mismos que logran mejores notas. Para ello, se establecen las siguientes
hipótesis:
H0 = 1 se relaciona 2
H1 = 1 no se relaciona 2
Paso 1:
Calcular la covarianza (Cov) de las variables. Esta es el promedio de los productos de
las desviaciones de las variables respectos a sus medias. Esto se obtiene con la siguiente
fórmula:
Ahora con los datos del ejemplo 13.1 reemplazamos en la fórmula 71:
184
Capítulo 13. Correlación y regresión
________________________________________________________________________
Paso 2:
Calcular la correlación de Pearson (r) con la siguiente fórmula:
185
Fernando Maureira Cid
________________________________________________________________________
Como r= 0,943 > 0,666 se debe rechazar H0 y podemos decir que existe relación entre las
variables.
La correlación de Pearson puede tomar valores entre -1 y 1 midiendo la fuerza de
asociación lineal de las variables. Un valor r de cero indica que no existe correlación de
X e Y, valores positivos indica una correlación positiva y viceversa.
Este coeficiente de correlación es muy influenciado por datos extremos (outlier) y solo se
utiliza cuando existe relaciones lineales entre variables, por esta razón es necesario
construir un gráfico de dispersión para determinar la linealidad de los datos antes de
utilizar este análisis.
Por lo anterior, es que el investigador del estudio del ejemplo 13.1 puede concluir que
los estudiantes que practican más actividad física son los mismos que poseen mejor
rendimiento académico y que esta relación es muy alta (r = 0,943).
186
Capítulo 13. Correlación y regresión
________________________________________________________________________
Ejemplo 13.2
Un investigador evaluó el tiempo de práctica de actividad física y los niveles de estrés
de un grupo de 10 estudiantes universitarios. Ahora quiere saber si la práctica de
actividad física puede predecir los niveles de estrés en estos estudiantes.
Paso 1:
Calcular el modelo de regresión lineal que consiste en ajustar los datos a una línea recta
mediante la siguiente ecuación:
187
Fernando Maureira Cid
________________________________________________________________________
β0 = ordenada de origen
β1 = pendiente
ε = error aleatorio
En un modelo de regresión es deseable que la media de los errores aleatorios sea cero.
Ahora debemos encontrar la recta que más se ajuste a nuestros datos, es decir, buscar
los valores de β0 y β1 que hagan mínimos los errores de estimación.
Paso 2:
Calcular los valores que hagan mínima la suma de los errores al cuadrado (SSE)
mediante el método de mínimos cuadrados que se obtiene con la siguiente fórmula:
188
Capítulo 13. Correlación y regresión
________________________________________________________________________
= media de y
= media de x
β1 = 26,4 = 0,653
40,4
y = -0,126 + 0,653 * Xi
189
Fernando Maureira Cid
________________________________________________________________________
Paso 1:
Realizar el contraste de hipótesis para la regresión lineal, con el fin de conocer si el
efecto de la variable X sobre la variable y es significativo. Por eso se plantean las
siguientes hipótesis:
H 0 = β1 = β0
H 1 = β1 ≠ β0
SSyy = 18,4
β1 = 0,653
SSxy = 26,4
n = 10
190
Capítulo 13. Correlación y regresión
________________________________________________________________________
Paso 2:
Calcular el estadístico de contraste t para regresión lineal con la siguiente fórmula:
(fórmula 81)
b1 = constante 0
Contrastar el valor t obtenido con el valor crítico de t del anexo 2 con un α=0,05 y n – gl
(10 – 2 = 8) que en este caso es de 1,85 y seguir la siguiente regla de decisión:
1,85 < 10,919 podemos concluir que existen efectos significativos de la práctica de
actividad física sobre el estrés de los 10 estudiantes universitarios evaluados.
En primer lugar debemos constatar que se cumplen los supuestos para la aplicación de
una correlación de Pearson:
Analizar
Correlación
Bivariada
191
Fernando Maureira Cid
________________________________________________________________________
La hoja de cálculos del programa nos entrega una tabla como la 12.1 en la cual se
observa la correlación de Pearson, la Sig. o valor p y el número de sujetos de la muestra.
Se debe contrastar el valor p calculado (p=0,010) siendo p<0,05 se debe rechazar la
192
Capítulo 13. Correlación y regresión
________________________________________________________________________
Esta prueba se utiliza para determinar si existe una relación lineal entre dos variables,
pero controlando el posible efecto de una tercera variable y determinar si esa relación es
estadísticamente significativa (no se debe al azar).
En primer lugar debemos constatar que se cumplen los supuestos para la aplicación de
una correlación Bivariada:
Analizar
Correlación
Parcial
193
Fernando Maureira Cid
________________________________________________________________________
La hoja de cálculos del programa nos entrega una tabla como la 13.2 donde se observa la
correlación parcial entre la variable 1 y 2 (r= 0,128) controlando la variable 3.
El investigador debe utilizar la misma regla de correlación que en el coeficiente de
correlación de Pearson.
También debe contrastar el valor p calculado (p=0,128) siendo p>0,05 se debe aceptar la
hipótesis nula que plantea que no existe relación entre las variables.
194
Capítulo 13. Correlación y regresión
________________________________________________________________________
..
En primer lugar debemos constatar que se cumplen los supuestos para la aplicación de
una regresión simple:
Analizar
Regresión
Simple
195
Fernando Maureira Cid
________________________________________________________________________
196
Capítulo 13. Correlación y regresión
________________________________________________________________________
La hoja de cálculos del programa nos entrega unas tablas como las siguientes:
197
Fernando Maureira Cid
________________________________________________________________________
198
Capítulo 13. Correlación y regresión
________________________________________________________________________
.
La tabla 12.9 muestra los estadísticos descriptivos (mínimo, máximo, media, desviación
estándar y número de sujetos) de los residuos de la ecuación de regresión. Es
importante que las medias del residuo bruto, valor pronosticado típico y residuo típico
sean de cero.
199
Fernando Maureira Cid
________________________________________________________________________
200
Capítulo 13. Correlación y regresión
________________________________________________________________________
201
Fernando Maureira Cid
________________________________________________________________________
202
Capítulo 14. Comparación de dos grupos
________________________________________________________________________
________________________________________________________________________
Ejemplo 14.1
Un investigador evaluó los niveles de estrés de un conjunto de 9 profesores de
educación física de dos colegios de Santiago. El nivel de estrés se midió en una escala de
0= nada, 1=bajo, 2=medio y 3=alto. Los resultados fueron los siguientes:
Ahora el investigador quiere saber si existen diferencias significativas entre los puntajes
alcanzados por los profesores de los dos colegios.
Paso 1:
Asignar un rango a cada puntaje obtenido ordenándolos de menor a mayor (los dos
grupos juntos). El rango corresponde a la suma del número de orden de los mismos va-
203
Fernando Maureira Cid
________________________________________________________________________
Paso 2:
Calcular la suma de rangos de cada grupo (∑Rx)
Paso 3:
Calcular el valor U de Mann-Whitney (U) con la siguiente fórmula:
(fórmula 82)
204
Capítulo 14. Comparación de dos grupos
________________________________________________________________________
En el ejemplo 14.1 el valor U es de 6,5 > 1, se debe aceptar H0 y concluir que no existen
diferencias en los niveles de estrés de los profesores de educación física de los dos
colegios de Santiago.
Si alguno de los grupos tiene 20 o más casos no es posible utilizar la tabla de U de
Mann-Whitney, entonces el valor U debe convertirse en puntuación Z con la siguiente
fórmula:
(fórmula 83)
205
Fernando Maureira Cid
________________________________________________________________________
El valor Z obtenido debe ser contrastado con el valor Z para un α=0,05. Como -0,857 <
1,96 se debe aceptar la H0 que plantea la igualdad de medias entre los dos grupos.
Ejemplo 14.2
Un investigador evaluó los niveles de confianza de 6 jugadores de fútbol reservas antes
y después de la aplicación de un programa psicológico orientado a la mejora de la
autopercepción. El nivel de confianza se midió en una escala de 1=bajo, 2=medio y
3=alto. Los resultados obtenidos fueron los siguientes:
Ahora el investigador quiere saber si existen efectos de dicho programa y por ende una
mejora en la confianza de los jugadores reservas.
Paso 1:
Obtener la diferencia entre la primera y segunda medición de cada sujeto. Luego
asignar un rango a cada puntaje obtenido de la misma forma que en la prueba U de
Mann-Whitney (no se deben considerar las diferencias de cero).
206
Capítulo 14. Comparación de dos grupos
________________________________________________________________________
Paso 2:
La suma de rangos con menor valor debe ser contrastado con los valores críticos de W
(Anexo 12) con el número de sujetos ajustados y un α=0,05. Para el ejemplo .2 con 0
rangos positivos y un n= 6 – 1= 5 se obtiene un valor W de cero.
207
Fernando Maureira Cid
________________________________________________________________________
(fórmula 84) ZT = W – T
ST
W = valor estadístico de Wilcoxon
T = Media de la T de Wilcoxon
(fórmula 86)
El valor Z obtenido debe ser contrastado con el valor Z para un α=0,05. Como 2,20 >
1,96 se debe rechazar la H0 que plantea la igualdad de medias entre las dos mediciones.
208
Capítulo 14. Comparación de dos grupos
________________________________________________________________________
Ejemplo 14.3
Un investigador evaluó los estilos de enseñanza de profesores de educación física
clasificándolos en tradicionales, que fomenta la participación del alumno y que implica
cognoscitivamente al alumno. Ahora se desea conocer si existen diferencias en la
preferencia de cada estilo de enseñanza entre profesores hombres y mujeres.
Paso 1:
Organizar una tabla de contingencia donde en la columnas se representan los grupos y
en las fila las categorías. Luego sumar los totales marginales por columnas y filas.
Paso 2:
Obtener la frecuencia esperada (fe) para cada valor con la siguiente fórmula:
Paso 3:
Calcular el valor de Chi-cuadrado (X2) con la siguiente fórmula:
209
Fernando Maureira Cid
________________________________________________________________________
(fórmula 88)
f0 = frecuencia observada
fe = frecuencia esperada
= 2,82 + 1,74 + 0,14 + 2,82 + 1,74 + 0,14 = 0,77 + 0,47 + 0,05 + 0,85 + 0,52 + 0,06
3,68 3,68 2,63 3,32 3,32 2,37
= 2,72
Paso 4:
Calcular los grados de libertad de X2 con la siguiente fórmula:
f = número de filas
c = número de columnas
gl = (3 – 1)*(2 – 1) = 2*1 = 2
El valor X2 fue de 2,72 ahora se debe encontrar el valor crítico de X2 (Anexo 8), donde
debemos ubicar los gl (en este caso 2) y un nivel de confianza de 0,05.
210
Capítulo 14. Comparación de dos grupos
________________________________________________________________________
Como X2 = 2,72 < 5,991 se debe aceptar H0 y podemos decir que no existen diferencias
entre los grupos.
Por lo anterior, es que el investigador puede concluir que los profesores de educación
física hombres y mujeres no poseen diferentes estilos de enseñanza.
Ejemplo 14.4
Un investigador evaluó si la actividad física es un factor protector para no fumar. Para
ello se entrevistó a 19 personas, de las cuales 11 decían realizar actividad física, en tanto
8 no lo hacían. Por otra parte, del total de la muestra 9 afirman fumar y 10 afirmaban no
hacerlo..
Paso 1:
Organizar una tabla de contingencia donde en la columnas se representan los grupos y
en las fila las categorías. Luego sumar los totales marginales por columnas y filas.
Paso 2:
Calcular el valor de X2 con la siguiente fórmula:
211
Fernando Maureira Cid
________________________________________________________________________
El valor X2 fue de 6,36 ahora se debe encontrar el valor crítico de X2 (Anexo 8), donde
debemos ubicar siempre 1 gl y un nivel de confianza de 0,05.
Como X2= 6,36 > 3,841 se debe rechazar H0 y podemos decir que existen diferencias entre
los grupos.
Por lo anterior, es que el investigador puede concluir que las personas que realizan
actividad física tienen menos tendencia a fumar que las personas que no realizan
actividad física.
212
Capítulo 14. Comparación de dos grupos
________________________________________________________________________
Ejemplo 14.5
Un investigador quiere saber si una charla de beneficios de la actividad física puede
incentivar a un grupo de personas a inscribirse en un gimnasio. Para ello se evaluó a los
sujetos antes y después de la intervención. Ahora se desea conocer si existieron cambios.
Paso 1:
Organizar una tabla donde:
La celdilla A (cruce de asistirán al gimnasio) se ubica la cantidad de sujetos que
mantienen su respuesta positiva hacia el gimnasio.
En la celdilla B (cruce de asistirán y no asistirán al gimnasio) se ubican los sujetos que
cambian su respuesta de positiva a negativa hacia el gimnasio.
La celdilla C (cruce de no asistirán y asistirán al gimnasio) se ubican los sujetos que
cambian su respuesta de negativa a positiva hacia el gimnasio.
La celdilla D (cruce de no asistirán la gimnasio) se ubican los sujetos que mantienen su
respuesta negativa hacia el gimnasio.
Después
Paso 2:
Calcular el valor X2 con la siguiente fórmula:
213
Fernando Maureira Cid
________________________________________________________________________
El valor X2 fue de 7,2 ahora se debe encontrar el valor crítico de X2 (Anexo 8), donde
debemos ubicar siempre 1 gl y un nivel de confianza de 0,05.
Con los datos del ejemplo 14.5 el valor X2 de la tabla es 3,841.
Ahora debemos seguir la regla de decisión:
Como X2 = 7,2 > 3,841 se debe rechazar H0 y podemos decir que existen diferencias entre
los grupos.
Por lo anterior, es que el investigador puede concluir que las personas que reciben una
charla sobre los beneficios de la actividad física tienden a cambiar su opinión sobre la
inscripción en un gimnasio.
Ejemplo 14.6
Un investigador desea conocer si existen diferencias entre el porcentaje de estudiantes
que poseen un IMC normal (72 sujetos, 62% del total) y los que presentan sobrepeso (30
sujetos, 26% del total) en los cursos de enseñanza secundaria de un colegio de Santiago.
Paso 1:
Calcular el valor de Z con la siguiente fórmula:
(fórmula 92)
..
214
Capítulo 14. Comparación de dos grupos
________________________________________________________________________
Paso 2:
Ahora contrastamos la puntuación Z con la distribución normal de puntuaciones Z con
el correspondiente nivel de confianza escogido. En contrastes unilaterales (también
llamados de una cola) para un nivel de 0,05 la puntuación Z es de -1,65 a +1,65. Para un
nivel de 0,01 la puntuación Z es de -2,33 a +2,33. En contrastes bilaterales (también
llamados de dos colas) para un nivel de 0,05 la puntuación Z es de -1,96 a + 1,96. Para un
nivel de 0,01 la puntuación Z es de -2,58 a +2,58.
En el ejemplo 14.6 la puntuación Z= 3,78 > 2,58 razón por la cual se rechaza H 0 y se
asume que existen diferencias entre el porcentaje de estudiantes de la muestra con IMC
normal y con sobrepeso.
14.7 PRUEBA U DE
MANN-WHITNEY EN SPSS
Analizar
Pruebas no paramétricas
Cuadro de diálogo antiguo
Dos muestras independientes
Hecho esto presionamos definir grupos abriéndose un cuadro como la figura 14.3.
215
Fernando Maureira Cid
________________________________________________________________________
Figura 14.2 Pantalla de pruebas para dos muestras independientes en el SPSS 22.0.
Figura 14.3 Pantalla de pruebas para dos muestras independientes (definir grupos) en el
SPSS 22.0.
216
Capítulo 14. Comparación de dos grupos
________________________________________________________________________
En el cuadro 14.3 de definen los códigos de los dos grupos que se desean comparar.
Luego se presiona Comparar y se vuelve a la pantalla de la figura 14.2. Presionamos
Aceptar.
En la tabla 14.1se observa los grupos comparados, el número de sujetos por grupo (76 y
71), la suma de rangos y el rango promedio que se obtiene con la suma de rangos
dividido por el número de observaciones del grupo.
Ahora el investigador debe contrastar el valor Z de la tabla con el valor crítico Z (-0,371
< 1,96).
También debe contrastar el valor p calculado (p=0,711) siendo p>0,05 se debe aceptar la
hipótesis nula que plantea que no existe diferencia entre la media de los grupos.
217
Fernando Maureira Cid
________________________________________________________________________
Analizar
Pruebas no paramétricas
Cuadro de diálogo antiguo
Dos muestras relacionadas
.
Figura 14.5 Pantalla Pruebas para dos muestras relacionadas en el menú del SPSS 22.0.
218
Capítulo 14. Comparación de dos grupos
________________________________________________________________________
En la tabla 14.3 se muestran los rangos promedio y la suma de rangos de cada grupo
que se comparan con la prueba de Wilcoxon.
En la tabla 14.4 se observan el valor Z y un valor Sig. de la prueba.
Ahora el investigador debe contrastar el valor Z de la tabla con el valor crítico Z (-1,900
< 1,96).
También debe contrastar el valor p calculado (p=0,057) siendo p>0,05 se debe aceptar la
hipótesis nula que plantea que no existe diferencia entre las dos mediciones del grupo.
Analizar
Estadísticos descriptivos
Tablas cruzadas
219
Fernando Maureira Cid
________________________________________________________________________
En la figura 14.7 presionamos Estadísticos y se abre una pantalla como la figura 14.8,
aquí marcamos la opción Chi Cuadrada. Hecho esto presionamos continuar para volver
a la pantalla de tablas de contingencia y presionamos Aceptar.
220
Capítulo 14. Comparación de dos grupos
________________________________________________________________________
La hoja de cálculos del programa nos entrega unas tablas como las siguientes:
..
221
Fernando Maureira Cid
________________________________________________________________________
En la tabla 14.5 se observa la cantidad de casos femeninos en cada curso y los casos
masculinos de cada categoría.
En la tabla 14.6 se observa el valor Chi cuadrado de Pearson, la razón de verosimilitud
que corresponde a una prueba para estudiar la relación entre variables categóricas que
se interpreta igual que la prueba X2, la asociación lineal por lineal, el número total de
casos de la muestra, los grados de libertad de X2, los grados de libertad de la razón de
verosimilitud que se obtiene de igual forma que los gl de X2, los grados de libertad de la
asociación lineal por lineal y la Sig. o valor p de la prueba X2, razón de verosimilitud y
de la asociación lineal por lineal.
222
Capítulo 14. Comparación de dos grupos
________________________________________________________________________
Analizar
Pruebas no paramétricas
Cuadro de diálogo antiguo
Dos muestras relacionadas
Figura 14.9 Pantalla Pruebas para dos muestras relacionadas en el SPSS 22.0.
223
Fernando Maureira Cid
________________________________________________________________________
La hoja de cálculos del programa nos entrega las dos tablas siguientes:
En la tabla 14.9 se observa que de las personas que dijeron que NO en la 1° medición 40
de ellas continuaban respondiendo que NO en la segunda medición (cruce No-No de la
tabla), de las personas que dijeron que NO en la 1° medición 36 de ellas respondieron
que SI en la segunda medición (cruce No-Si de la tabla), de las personas que dijeron que
SI en la 1° medición 43 contestaron No en la segunda medición (cruce Si-No de la tabla)
y de las personas que dijeron que SI en la 1° medición 28 de ellas mantenían su
respuesta en la segunda medición (cruce Si-Si de la tabla).
En la tabla 14.10 se observa el número total de sujetos de la muestra y la Sig. o valor p
de la prueba de McNemar.
Ahora el investigador debe contrastar el X2 calculado con el valor crítico de X2 (Anexo 8)
obteniendo: 0,456 > 3,841.
También debe contrastar el valor p calculado (p=0,500) siendo p>0,05 se debe aceptar la
hipótesis nula que plantea la igualdad entre las categorías de los dos grupos.
224
Capítulo 15. Comparación de tres o más grupos
________________________________________________________________________
________________________________________________________________________
Ejemplo 15.1
Un investigador evaluó los niveles de IMC de estudiantes de primero, segundo y
tercero básico de un colegio de Santiago. El IMC se clasifico en 1=bajo-peso, 2=normal,
3=sobrepeso y 4=obeso. Los resultados obtenidos fueron los siguientes:
Paso 1:
Asignar un rango a cada puntaje obtenido tal como se explicó en la prueba U de Mann-
Whitney.
225
Fernando Maureira Cid
________________________________________________________________________
Paso 2:
Calcular la suma (∑Rx) y media ( ) de rangos de cada grupo:
Rx
}
Paso 3:
Se consideran los casos con las mismas puntuaciones como empates y el número de
casos como valor t. Por ejemplo, en la tabla anterior hay 7 casos que obtuvieron una
puntuación de 2 por lo tanto, el valor t de 2 puntos es 7.
..
226
Capítulo 15. Comparación de tres o más grupos
________________________________________________________________________
Paso 4:
Calcular el valor de Kruskal-Wallis (KW) con la fórmula 93 si no hay empates y con la
94 si existen empates:
(fórmula 93)
(fórmula 94)
Como en el ejemplo 15.1 existen empates en los rangos utilizamos la fórmula 94:
227
Fernando Maureira Cid
________________________________________________________________________
El valor KW fue de 3,587 ahora se debe encontrar el valor crítico de KW (Anexo 13),
donde debemos ubicar el número de sujetos de cada grupo (6-6-5) y un nivel de
confianza de 0,05.
Como el valor KW= 3,587 < 5,77 se debe aceptar H0 y podemos decir que no existen
diferencias entre los grupos.
Por lo anterior, es que el investigador puede concluir que el IMC de los estudiantes de
primer, segundo y tercer año básico de un colegio de Santiago es igual.
COMPARACIONES MÚLTIPLES
Paso 1:
Calcular la diferencia de las medias de los rangos de cada grupo.
228
Capítulo 15. Comparación de tres o más grupos
________________________________________________________________________
Paso 2:
Calcular el valor crítico de la diferencia entre cada par de grupos con la siguiente
fórmula:
(fórmula 95)
229
Fernando Maureira Cid
________________________________________________________________________
Como se puede observar ninguna diferencia entre par de grupos es mayor que los
valores críticos obtenidos al comparar los pares:
Por lo tanto, es posible asumir que no existen diferencias entre los tres grupos
comparados.
Ejemplo 15.2
Un profesor evaluó los niveles de destreza técnica en la ejecución de una voltereta en
estudiantes de primer año medio en marzo, julio y octubre. Los niveles se clasificaron
en 1=mal, 2=medio, 3=bien y 4=sobresaliente. Los resultados fueron los siguientes:
Paso 1:
Asignar un rango a cada puntaje. Se ordenan las puntuaciones de menor a mayor en
cada sujeto. Como tenemos tres mediciones el rango menor será 1 y el mayor 3. Cuando
dos mediciones sean iguales les corresponde la media de los rangos, por ejemplo, el
sujeto 1 posee tres valores diferentes, por lo tanto, sus rangos son 1, 2 y 3. Pero el sujeto
3 posee valores de 1, 1 y 2, por lo tanto, el rango de los dos primeros valores
corresponde a la suma del orden dividido en dos ((1 + 2)/2 = 1,5).
230
Capítulo 15. Comparación de tres o más grupos
________________________________________________________________________
Paso 2:
Calcular la suma de rangos de cada grupo (∑Rx):
Paso 3:
Se consideran los casos con las mismas puntuaciones en cada sujeto como empates y el
número de casos como valor t. Por ejemplo, en la tabla anterior el caso 3 posee dos
puntuaciones de 1,5 por lo tanto, el valor t de 1,5 puntos en ese caso es de 2. Los rangos
que aparecen solo una vez en cada sujeto reciben un valor t de 1.
Paso 4:
Calcular el valor de Friedman (X2r) con la fórmula 96 si no hay empates y con la 97 si
existen rangos empatados:
231
Fernando Maureira Cid
________________________________________________________________________
(fórmula 96)
(fórmula 97)
= 504 = 9,33
54
El valor X2r fue de 9,33 ahora se debe encontrar el valor crítico de X2 (Anexo 8), donde
debemos ubicar los gl y un nivel de confianza de 0,05.
232
Capítulo 15. Comparación de tres o más grupos
________________________________________________________________________
Como X2 = 9,33 > 6,40 se debe rechazar H0 y podemos decir que existen diferencias entre
las diversas mediciones.
Por lo anterior, es que el profesor puede concluir que la destreza técnica en la ejecución
de la voltereta en estudiante de primer año medio mejoró entre los meses de marzo,
julio y octubre.
COMPARACIONES MÚLTIPLES
Paso 1:
Calcular la diferencia de las sumas de los rangos entre cada medición.
Paso 2:
Calcular el valor crítico de la diferencia entre cada par de grupos con la siguiente
fórmula:
(fórmula 98)
233
Fernando Maureira Cid
________________________________________________________________________
Ejemplo 15.3
Un entrenador evaluó si un grupo de asistentes a un club deportivo seguía asistiendo a
los entrenamientos pese a la extensión del programa. Las mediciones se realizaron la
cuarta, la octava y la decimosegunda semana. Los niveles se clasificaron en 0=no asiste y
1=asiste. Ahora se desea conocer si existen diferencias entre las tres mediciones.
234
Capítulo 15. Comparación de tres o más grupos
________________________________________________________________________
Paso 1:
Contar los aciertos por sujeto y elevarlos al cuadrado (L2). Contar los aciertos por
medición y elevarlos al cuadrado (G2).
Paso 2:
Calcular el valor Q con la siguiente fórmula:
El valor Q fue de 9, ahora se debe encontrar el valor crítico de X2 (Anexo 8), donde
debemos ubicar los gl (k – 1) y un nivel de confianza de 0,05.
235
Fernando Maureira Cid
________________________________________________________________________
Como X2= 9 > 5,991 se debe rechazar H0 y podemos decir que existen diferencias entre
las diversas mediciones.
Por lo anterior, es que el entrenador puede concluir que los asistentes a un
entrenamiento de larga duración disminuyen a medida que se progresa en la programa,
es decir, existen muchos más participantes al comienzo del programa que a la
decimosegunda semana.
Analizar
Pruebas no paramétricas
Cuadro de diálogo antiguo
K muestras independientes
236
Capítulo 15. Comparación de tres o más grupos
________________________________________________________________________
Figura 15.2 Pantalla de Prueba para varias muestras independientes en SPSS 22.0.
Luego en la pantalla de la figura 15.2 presionamos definir rangos y colocamos las dos
etiquetas extremas de las categorías (en este caso categoría 1 y 4).
Hecho esto presionamos Continuar para volver a la pantalla de prueba para k muestras
independientes y presionamos Aceptar.
Figura 15.3 Pantalla para definir grupos en varias muestras independientes en SPSS
22.0.
La hoja de cálculos del programa nos entrega las dos tablas siguientes:
237
Fernando Maureira Cid
________________________________________________________________________
En la tabla 15.1 se observa el número de sujetos por grupo y la media de rangos de cada
grupo.
En la tabla 15.2 se muestra el valor en la distribución de Chi-cuadrado que se obtiene a
partir del estadístico de Kruskal-Wallis, los grados de libertad (n – 1, por lo tanto 3 – 1 =
2) y la Sig. o valor p.
NOTA:
238
Capítulo 15. Comparación de tres o más grupos
________________________________________________________________________
Analizar
Pruebas no paramétricas
Cuadro de diálogo antiguo
K muestras relacionadas
Figura 15.5 Pantalla prueba para varias muestras relacionadas en SPSS 22.0.
239
Fernando Maureira Cid
________________________________________________________________________
La hoja de cálculos del programa nos entrega las dos tablas siguientes:
NOTA:
Cuando la prueba de Friedman entrega diferencia entre los grupos, es necesario realizar
pruebas de U de Mann-Whitney entre cada par de grupos para determinar entre
quienes existen diferencias significativas, de igual forma que en la prueba de Kruskal-
Wallis (utilizando la corrección de Bonferroni).
240
Capítulo 15. Comparación de tres o más grupos
________________________________________________________________________
Analizar
Pruebas no paramétricas
Cuadro de diálogo antiguo
K muestras relacionadas
Figura 15.6 Pantalla prueba para varias muestras relacionadas en SPSS 22.0.
La hoja de cálculos del programa nos entrega las dos tablas siguientes:
241
Fernando Maureira Cid
________________________________________________________________________
NOTA:
242
Capítulo 16. Asociación de variables
________________________________________________________________________
________________________________________________________________________
Ejemplo 16.1
Un investigador evaluó los niveles de estrés y la asistencia a un programa de actividad
física de un grupo de trabajadores de una empresa. Las variables se clasificaron en:
243
Fernando Maureira Cid
________________________________________________________________________
Ahora el investigador quiere saber si existe relación significativa entre los niveles de
estrés y la asistencia al programa, es decir, si los trabajadores que más asisten al
programa de actividad física son los mismos que tienen menores niveles de estrés. Para
ello establece las siguientes hipótesis:
H1= Existe relación entre los niveles de estrés y la asistencia al programa de actividad
física.
H0= No existe relación entre los niveles de estrés y la asistencia al programa de
actividad física.
Paso 1:
Asignar un rango a cada puntaje obtenido tal como se explicó en la prueba U de Mann-
Whitney.
a) Variable estrés
.
a) Variable asistencia al programa de act. física
..
244
Capítulo 16. Asociación de variables
________________________________________________________________________
Paso 2:
Calcular la diferencia de rangos de Rx y Ry y luego elevar esas diferencias al cuadrado.
.
Paso 3:
Se consideran los casos con las mismas puntuaciones como empates y el número de
casos como valor t. Por ejemplo, en la tabla anterior hay 5 casos que obtuvieron una
puntuación de 2 puntos en la variable X por lo tanto el valor t de 2 puntos es 5.
Paso 4:
Calcular la correlación de Spearman (rs) con la fórmula 100 cuando no hay rangos
empatados y la fórmula 101 cuando si lo hay:
(fórmula 100)
N = número de sujetos
D2 = diferencia entre los rangos de X e Y elevados al cuadrado
..
245
Fernando Maureira Cid
________________________________________________________________________
(fórmula 101)
N = número de sujetos
D2 = diferencia entre los rangos de X e Y elevados al cuadrado
T = suma de las diferencias de t3 menos t
El valor rs fue de -0,749 ahora se debe encontrar el valor crítico de Spearman (Anexo
14), donde debemos ubicar el número de casos (N) y un nivel de confianza de 0,05.
Con un N= 0 y un α=0,05 el valor rs= 0,648. Ahora debemos seguir la regla de decisión:
246
Capítulo 16. Asociación de variables
________________________________________________________________________
Como rs = -0,790 > 0,648 se debe rechazar H0 y podemos decir que existe relación lineal
entre las diversas mediciones.
Por lo anterior, es que el investigador puede concluir que existe relación entre los
niveles de estrés y la asistencia a un programa de actividad física. Además la correlación
es alta y negativa (-0,790), es decir, que a más práctica física menores niveles de estrés.
Ejemplo 16.2
Un investigador evaluó la práctica de algún deporte de padres e hijos obteniendo los
siguientes resultados:
Ahora el investigador desea saber si existe alguna relación entre la práctica deportiva de
los padres y la práctica deportiva de sus hijos, es decir, si los hijos de padres que
realizan algún deporte también lo realizan en forma regular.
247
Fernando Maureira Cid
________________________________________________________________________
Paso 1:
Organizar una tabla de contingencia donde en la columnas se representan los grupos y
en las fila las categorías. Luego sumar los totales marginales por columnas y filas.
Paso 2:
Calcular la correlación de Phi (rø) con la siguiente fórmula:
(fórmula 102)
Paso 3:
La correlación de Phi está relacionada con la prueba X2 de 2x2, por lo tanto, es necesario
calcularla con la fórmula 87.
El valor X2 fue de 3,23 ahora se debe encontrar el valor crítico de X2 (Anexo 8), donde
debemos ubicar siempre 1 gl y un nivel de confianza de 0,05.
Con los datos del ejemplo 16.2 el valor X2 de la tabla es 3,841.
248
Capítulo 16. Asociación de variables
________________________________________________________________________
Como X2= 3,23 < 3,841 por lo tanto se debe aceptar H0 y podemos decir que no existe
relación entre los grupos.
Por lo anterior, es que el investigador puede concluir que la práctica de actividad física
de los hijos no está influenciada por la práctica de actividad física de los padres.
En caso que el estadístico X2 permita rechazar la H0, el valor Phi entrega el tipo de
correlación (positiva o negativa) y la fuerza de la asociación (baja, media o alta).
Analizar
Correlaciones
Bivariadas
249
Fernando Maureira Cid
________________________________________________________________________
La hoja de cálculos del programa nos entrega una tabla como la 16.1 donde se observa la
correlación de Spearman, la Sig. o valor p y el número de sujetos de la muestra.
La correlación de Spearman se interpreta de igual forma que Pearson.
También se debe contrastar el valor p calculado (p=0,000) siendo p<0,05 se debe
rechazar la hipótesis nula que plantea que no existe relación lineal entre las variables.
250
Capítulo 16. Asociación de variables
________________________________________________________________________
Analizar
Estadísticos descriptivos
Tablas cruzadas
251
Fernando Maureira Cid
________________________________________________________________________
La hoja de cálculos del programa nos entrega las tablas 16.2 y 16.3. En la primera se
observa la cantidad de respuestas SI y No de la variable 1 y la variable 2.
En la tabla 16.3 se observa el coeficiente de correlación de Phi, el coeficiente de
correlación V de Cramer que corresponde a una pequeña modificación del coeficiente
Phi y la Sig. o valor p.
252
Capítulo 16. Asociación de variables
________________________________________________________________________
253
Fernando Maureira Cid
________________________________________________________________________
254
Capítulo 16. Asociación de variables
________________________________________________________________________
Mendenhall, W., Beaver, R. & Beaver, B. Stiegler, S. (1986). The history of statistics.
(2010). Introducción a la probabi-lidad Harvard University Press.
y estadística. México DF: Cengage
Learning.
255
Fernando Maureira Cid
________________________________________________________________________
256
Capítulo 16. Asociación de variables
________________________________________________________________________
257
Fernando Maureira Cid
________________________________________________________________________
258
Capítulo 16. Asociación de variables
________________________________________________________________________
ANEXO 1
Probabilidades acumuladas de la distribución normal estándar
259
Fernando Maureira Cid
________________________________________________________________________
260
Capítulo 16. Asociación de variables
________________________________________________________________________
ANEXO 2
Tabla de valores críticos de la distribución t de Student
261
Fernando Maureira Cid
________________________________________________________________________
ANEXO 3
Tabla de valores críticos de la prueba KS para una muestra
262
Capítulo 16. Asociación de variables
________________________________________________________________________
ANEXO 4
Coeficientes ain para el contraste de Shapiro-Wilks
n 1 2 3 4 5 6 7 8 9
2 0,7071 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
3 0,7071 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
4 0,6872 0,1677 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
5 0,6646 0,2413 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
6 0,6431 0,2806 0,0875 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
7 0,6233 0,3031 0,1401 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
8 0,6052 0,3164 0,1743 0,0561 0,0000 0,0000 0,0000 0,0000 0,0000
9 0,5888 0,3244 0,1976 0,0947 0,0000 0,0000 0,0000 0,0000 0,0000
10 0,5739 0,3291 0,2141 0,1224 0,0399 0,0000 0,0000 0,0000 0,0000
11 0,5601 0,3315 0,2260 0,1429 0,0695 0,0000 0,0000 0,0000 0,0000
12 0,5475 0,3325 0,2347 0,1586 0,0922 0,0303 0,0000 0,0000 0,0000
13 0,5359 0,3325 0,2412 0,1707 0,1099 0,0539 0,0000 0,0000 0,0000
14 0,5251 0,3318 0,2495 0,1802 0,1240 0,0727 0,0240 0,0000 0,0000
15 0,5150 0,3306 0,2495 0,1878 0,1353 0,0880 0,0433 0,0000 0,0000
16 0,5056 0,3229 0,2521 0,1988 0,1447 0,1005 0,0593 0,0196 0,0000
17 0,4968 0,3273 0,2540 0,1988 0,1524 0,1109 0,0725 0,0359 0,0000
18 0,4886 0,3253 0,2553 0,2027 0,1587 0,1197 0,0837 0,0496 0,0163
19 0,4808 0,3232 0,2561 0,2059 0,1641 0,1271 0,0932 0,0612 0,0303
20 0,4734 0,3211 0,2565 0,2085 0,1686 0,1334 0,1013 0,0711 0,0422
21 0,4643 0,3185 0,2578 0,2119 0,1736 0,1339 0,1092 0,0804 0,0530
22 0,4590 0,3156 0,2571 0,2131 0,1764 0,1443 0,1150 0,0878 0,0618
23 0,4542 0,3126 0,2563 0,2139 0,1787 0,1480 0,1201 0,0941 0,0696
24 0,4493 0,3098 0,2554 0,2145 0,1807 0,1512 0,1245 0,0997 0,0764
25 0,4450 0,3069 0,2543 0,2148 0,1822 0,1539 0,1283 0,1046 0,0823
26 0,4407 0,3043 0,2533 0,2151 0,1836 0,1563 0,1316 0,1089 0,0876
27 0,4366 0,3018 0,2522 0,2152 0,1848 0,1584 0,1346 0,1128 0,0923
28 0,4328 0,2992 0,2510 0,2151 0,1857 0,1601 0,1372 0,1162 0,0965
29 0,4291 0,2968 0,2499 0,2150 0,1864 0,1616 0,1395 0,1192 0,1002
30 0,4254 0,2944 0,2487 0,2148 0,1870 0,1630 0,1415 0,1219 0,1036
31 0,4220 0,2921 0,2475 0,2145 0,1874 0,1641 0,1433 0,1243 0,1066
32 0,4118 0,2898 0,2463 0,2141 0,1878 0,1651 0,1449 0,1265 0,1093
33 0,4156 0,2876 0,2451 0,2137 0,1880 0,1660 0,1463 0,1284 0,1118
34 0,4127 0,2854 0,2439 0,2132 0,1882 0,1667 0,1475 0,1301 0,1140
35 0,4096 0,2834 0,2427 0,2127 0,1883 0,1673 0,1487 0,1317 0,1160
36 0,4068 0,2813 0,2415 0,2121 0,1883 0,1678 0,1496 0,1331 0,1179
37 0,4040 0,2794 0,2403 0,2116 0,1883 0,1683 0,1505 0,1344 0,1196
38 0,4015 0,2774 0,2391 0,2110 0,1881 0,1686 0,1513 0,1356 0,1211
39 0,3989 0,2755 0,2380 0,2104 0,1880 0,1689 0,1520 0,1366 0,1225
40 0,3964 0,2737 0,2368 0,2098 0,1878 0,1691 0,1526 0,1376 0,1237
263
Fernando Maureira Cid
________________________________________________________________________
n 10 11 12 13 14 15 16 17 18
2 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
3 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
4 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
5 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
6 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
7 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
8 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
10 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
11 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
12 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
13 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
15 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
16 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
17 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
18 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
19 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
20 0,0140 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
21 0,0263 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
22 0,0368 0,0122 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
23 0,0459 0,0228 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
24 0,0539 0,0321 0,0107 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
25 0,0610 0,0403 0,0200 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
26 0,0672 0,0476 0,0284 0,0094 0,0000 0,0000 0,0000 0,0000 0,0000
27 0,0728 0,0540 0,0358 0,0178 0,0000 0,0000 0,0000 0,0000 0,0000
28 0,0778 0,0598 0,0424 0,0253 0,0084 0,0000 0,0000 0,0000 0,0000
29 0,0822 0,0650 0,0483 0,0320 0,0159 0,0000 0,0000 0,0000 0,0000
30 0,0862 0,0697 0,0537 0,0381 0,0227 0,0076 0,0000 0,0000 0,0000
31 0,0899 0,0739 0,0585 0,0435 0,0289 0,0144 0,0000 0,0000 0,0000
32 0,0931 0,0777 0,0629 0,0485 0,0344 0,0206 0,0068 0,0000 0,0000
33 0,0961 0,0812 0,0669 0,0530 0,0395 0,0262 0,0187 0,0000 0,0000
34 0,0988 0,0844 0,0706 0,0572 0,0441 0,0314 0,0187 0,0062 0,0000
35 0,1013 0,0873 0,0739 0,0610 0,0484 0,0361 0,0239 0,0119 0,0000
36 0,1036 0,0900 0,0770 0,0645 0,0523 0,0404 0,0287 0,0172 0,0057
37 0,1056 0,0924 0,0798 0,0677 0,0559 0,0444 0,0331 0,0220 0,0110
38 0,1075 0,0947 0,0824 0,0706 0,0592 0,0481 0,0372 0,0264 0,0158
39 0,1092 0,0967 0,0848 0,0733 0,0622 0,0515 0,0409 0,0305 0,0203
40 0,1108 0,0986 0,0870 0,0759 0,0651 0,0546 0,0444 0,0343 0,0244
264
Capítulo 16. Asociación de variables
________________________________________________________________________
n 1 2 3 4 5 6 7 8 9
41 0,3940 0,2719 0,2357 0,2091 0,1876 0,1693 0,1531 0,1384 0,1249
42 0,3917 0,2701 0,2345 0,2085 0,1874 0,1694 0,1535 0,1392 0,1259
43 0,3894 0,2684 0,2334 0,2078 0,1871 0,1695 0,1539 0,1398 0,1269
44 0,3872 0,2667 0,2323 0,2072 0,1868 0,1695 0,1542 0,1405 0,1278
45 0,3850 0,2651 0,2313 0,2065 0,1865 0,1695 0,1545 0,1410 0,1286
46 0,3830 0,2635 0,2302 0,2058 0,1862 0,1695 0,1548 0,1415 0,1293
47 0,3808 0,2620 0,2291 0,2052 0,1859 0,1695 0,1550 0,1420 0,1300
48 0,3789 0,2604 0,2281 0,2045 0,1855 0,1693 0,1551 0,1423 0,1306
49 0,3770 0,2589 0,2271 0,2038 0,1851 0,1692 0,1553 0,1472 0,1312
50 0,3751 0,2574 0,2260 0,2032 0,1847 0,1691 0,1554 0,1430 0,1317
n 10 11 12 13 14 15 16 17 18
41 0,1123 0,1004 0,0891 0,0782 0,0677 0,0575 0,0476 0,0379 0,0283
42 0,1136 0,1020 0,0909 0,0804 0,0701 0,0602 0,0506 0,0411 0,0318
43 0,1149 0,1035 0,0927 0,0824 0,0724 0,0628 0,0534 0,0442 0,0352
44 0,1160 0,1049 0,0943 0,0842 0,0745 0,0651 0,0560 0,0471 0,0383
45 0,1170 0,1062 0,0959 0,0860 0,0765 0,0673 0,0584 0,0497 0,0412
46 0,1180 0,1073 0,0972 0,0876 0,0783 0,0694 0,0607 0,0522 0,0439
47 0,1189 0,1085 0,0986 0,0892 0,0801 0,0713 0,0628 0,0546 0,0465
48 0,1197 0,1095 0,0998 0,0906 0,0817 0,0731 0,0648 0,0568 0,0489
49 0,1205 0,1105 0,1010 0,0919 0,0832 0,0748 0,0667 0,0588 0,0511
50 0,1212 0,1113 0,1020 0,0932 0,0846 0,0764 0,0685 0,0608 0,0532
265
Fernando Maureira Cid
________________________________________________________________________
ANEXO 5
Tabla de valores críticos de la prueba de Shapiro-Wilks
266
Capítulo 16. Asociación de variables
________________________________________________________________________
ANEXO 6
Tabla de valores críticos de la distribución F de Fisher (α= , 5
gl 1 2 3 4 5 6 7 8 9
1 161,446 199,499 215,707 224,583 230,160 233,988 236,767 238,884 240,543
2 18,513 19,000 19,164 19,247 19,296 19,329 19,353 19,371 19,385
3 19,128 9,552 9,277 9,117 9,013 8,941 8,887 8,845 8,812
4 7,709 6,944 6,591 6,388 6,256 6,163 6,094 6,041 5,999
5 6,608 5,786 5,409 5,192 5,050 4,950 4,876 4,818 4,772
6 5,987 5,143 4,757 4,534 4,387 4,284 4,207 4,147 4,099
7 5,591 4,737 4,347 4,120 3,972 3,866 3,787 3,726 3,677
8 5,318 4,459 4,066 3,838 3,688 3,581 3,500 3,438 3,388
9 5,117 4,256 3,863 3,633 3,482 3,374 3,293 3,230 3,179
10 4,965 4,103 3,708 3,478 3,326 3,217 3,135 3,072 3,020
11 4,844 3,982 3,587 3,357 3,204 3,095 3,012 2,948 2,896
12 4,747 3,885 3,490 3,259 3,106 2,996 2,913 2,849 2,796
13 4,667 3,805 3,411 3,179 3,025 2,915 2,832 2,767 2,714
14 4,600 3,739 3,344 3,112 2,958 2,848 2,764 2,699 2,646
15 4,543 3,682 3,287 3,056 2,901 2,790 2,707 2,641 2,588
16 4,494 3,634 3,239 3,007 2,852 2,741 2,657 2,591 2,538
17 4,451 3,592 3,197 2,965 2,810 2,699 2,614 2,548 2,494
18 4,414 3,555 3,160 2,928 2,773 2,661 2,577 2,510 2,456
19 4,381 3,522 3,127 2,895 2,740 2,628 2,544 2,477 2,423
20 4,351 3,493 3,098 2,866 2,711 2,599 2,514 2,447 2,423
21 4,325 3,467 3,072 2,840 2,685 2,573 2,488 2,420 2,366
22 4,301 3,443 3,049 2,817 2,661 2,549 2,464 2,397 2,342
23 4,279 3,422 3,028 2,796 2,640 2,528 2,442 2,375 2,320
24 4,260 3,403 3,009 2,776 2,621 2,508 2,423 2,355 2,300
25 4,242 3,385 2,991 2,759 2,603 2,490 2,405 2,337 2,282
26 4,225 3,369 2,975 2,743 2,587 2,474 2,388 2,321 2,265
27 4,210 3,354 2,960 2,728 2,572 2,459 2,373 2,305 2,250
28 4,196 3,340 2,947 2,714 2,558 2,445 2,359 2,291 2,236
29 4,183 3,328 2,934 2,701 2,545 2,432 2,346 2,278 2,223
30 4,171 3,316 2,922 2,690 2,534 2,421 2,334 2,266 2,211
40 4,085 3,232 2,839 2,606 2,449 2,336 2,249 2,180 2,124
50 4,034 3,183 2,790 2,557 2,400 2,286 2,199 2,130 2,073
60 4,002 3,150 2,758 2,525 2,368 2,254 2,167 2,097 2,040
70 3,978 3,128 2,736 2,503 2,346 2,231 2,143 2,074 2,017
80 3,960 3,111 2,719 2,486 2,329 2,214 2,126 2,056 1,999
90 3,947 3,098 2,706 2,473 2,316 2,201 2,113 2,043 1,986
100 3,936 3,087 2,696 2,463 2,305 2,191 2,103 2,032 1,975
200 3,888 3,041 2,650 2,417 2,259 2,144 2,056 1,985 1,927
500 3,860 3,014 2,623 2,390 2,232 2,117 2,028 1,957 1,899
267
Fernando Maureira Cid
________________________________________________________________________
268
Capítulo 16. Asociación de variables
________________________________________________________________________
gl 1 2 3 4 5 6 7 8
1 4052,185 4999,340 5403,534 5624,257 5763,955 5858,950 5928,334 5980,954
2 98,502 99,000 99,164 99,251 99,302 99,331 99,357 99,375
3 34,116 30,816 29,457 28,710 28,237 27,911 27,671 27,489
4 21,198 18,000 16,694 15,977 15,522 15,207 14,976 14,799
5 16,258 13,274 12,060 11,392 10,967 10,672 10,456 10,289
6 13,745 10,925 9,780 9,148 8,746 8,466 8,260 8,102
7 12,246 9,547 8,451 7,847 7,460 7,191 6,993 6,840
8 11,259 8,649 7,591 7,006 6,632 6,371 6,178 6,029
9 10,562 8,022 6,992 6,422 6,057 5,802 5,613 5,467
10 10,044 7,559 6,552 5,994 5,636 5,386 5,200 5,057
11 9,646 7,206 6,217 5,668 5,316 5,069 4,886 4,744
12 9,330 6,927 5,953 5,412 5,064 4,821 4,640 4,499
13 9,074 6,701 5,739 5,205 4,862 4,620 4,441 4,302
14 8,862 6,515 5,564 5,035 4,695 4,456 4.278 4,140
15 8,683 6,359 5,417 4,893 4,556 4,318 4.142 4,004
16 8,531 6,226 5,292 4,773 4,437 4,202 4,026 3,890
17 8,400 6,112 5,185 4,669 4,336 4,101 3,927 3,791
18 8,285 6,013 5,092 4,579 4,248 4,015 3,841 3,705
19 8,185 5,926 5,010 4,500 4,171 3,939 3,765 3,631
20 8,096 5,849 4,938 4,431 4,103 3,871 3,699 3,564
21 8,017 5,780 4,874 4,369 4,042 3,812 3,640 3,506
22 7,945 5,719 4,817 4,313 3,988 3,758 3,587 3,453
23 7,881 5,664 4,765 4,264 3,939 3,710 3,539 3,406
24 7,823 5,614 4,718 4,218 3,895 3,667 3,496 3,363
25 7,770 5,568 4,675 4,177 3,855 3,627 3,457 3,324
26 7,721 5,526 4,637 4,140 3,818 3,591 3,421 3,288
27 7,677 5,488 4,601 4,106 3,785 3,558 3,388 3,256
28 7,636 5,453 4,568 4,074 3,754 3,528 3,358 3,226
29 7,598 5,420 4,538 4,045 3,725 3,499 3,330 3,198
30 7,562 5,390 4,510 4,018 3,699 3,473 3,305 3,173
40 7,314 5,178 4,313 3,818 3,514 3,291 3,124 2,993
50 7,171 5,057 4,199 3,720 3,408 3,186 3,020 2,890
60 7,077 4,977 4,126 3,649 3,339 3,119 2,953 2,823
70 7,011 4,922 4,074 3,600 3,291 3,071 2,906 2,777
80 6,963 4,881 4,036 3,563 3,255 3,036 2,871 2,742
90 6,925 4,849 4,007 3,535 3,228 3,009 2,845 2,715
100 6,895 4,824 3,984 3,513 3,206 2,988 2,823 2,694
200 6,763 4,713 3,881 3,414 3,110 2,893 2,730 2,601
500 6,686 4,648 3,821 3,357 3,054 2,838 2,675 2,547
269
Fernando Maureira Cid
________________________________________________________________________
gl 9 10 15 20 40 50 100
1 6022,397 6055,925 6156,974 6208,662 6286,427 6302,260 6333,925
2 99,397 99,397 99,433 99,448 99,477 99,477 99,491
3 27,345 27,228 26,872 26,690 26,411 26,354 26,241
4 14,659 14,546 14,198 14,019 13,745 13,690 13,577
5 10,158 10,051 9,722 9,553 9,291 9,238 9,130
6 7,976 7,874 7,559 7,396 7,143 7,091 6,987
7 6,719 6,620 6,314 6,155 5,908 5,858 5,755
8 5,911 5,814 5,515 5,359 5,116 5,065 4,963
9 5,351 5,257 4,962 4,808 4,567 4,517 4,415
10 4,942 4,849 4,558 4,405 4,165 4,115 4,014
11 4,632 4,539 4,251 4,099 3,860 3,810 3,708
12 4,388 4,296 4,010 3,858 3,619 3,569 3,467
13 4,191 4,100 3,815 3,665 3,425 3,375 3,272
14 4,030 3,939 3,656 3,505 3,256 3,215 3,112
15 3,895 3,805 3,522 3,372 3,132 3,081 2,977
16 3,780 3,691 3,409 3,259 3,018 2,967 2,863
17 3,682 3,593 3,312 3,162 2,920 2,869 2,764
18 3,597 3,508 3,227 3,077 2,835 2,784 2,678
19 3,523 3,434 3,153 3,003 2,761 2,709 2,602
20 3,457 3,368 3,088 2,938 2,695 2,643 2,535
21 3,398 3,310 3,030 2,880 2,636 2,584 2,476
22 3,346 3,258 2,978 2,827 2,583 2,531 2,422
23 3,299 3,211 2,931 2,780 2,536 2,483 2,373
24 3,256 3.168 2,889 2,738 2,492 2,440 2,329
25 3,217 3,129 2,850 2,699 2,453 2,400 2,289
26 3,182 3,094 2,815 2,664 2,417 2,364 2,252
27 3,149 3,062 2,783 2,632 2,384 2,330 2,218
28 3,120 3,032 2,753 2,602 2,354 2,300 2,187
29 3,092 3,005 2,726 2,574 2,325 2,271 2,158
30 3,067 2,979 2,700 2,549 2,299 2,245 2,131
40 2,888 2,801 2,522 2,369 2,114 2,058 1,938
50 2,785 2,698 2,419 2,265 2,007 1,949 1,825
60 2,718 2,632 2,352 2,198 1,936 1,877 1,749
70 2,672 2,585 2,306 2,150 1,886 1,826 1,695
80 2,637 2,551 2,271 2,115 1,849 1,788 1,655
90 2,611 2,524 2,244 2,088 1.820 1,759 1.623
100 2,590 2,503 2,223 2,067 1,797 1,735 1,598
200 2,497 2,411 2,129 1,971 1,694 1,629 1,481
500 2,443 2,356 2,075 1,915 1,633 1,566 1,408
270
Capítulo 16. Asociación de variables
________________________________________________________________________
ANEXO 7
Tabla de valores críticos para la prueba de homogeneidad de
varianzas de Cochran (α= , 5
N° de grupos
gl 2 3 4 5 6 7
1 0,9985 0,9969 0,9065 0,8412 0,7808 0,7271
2 0,9750 0,8709 0,7679 0,6838 0,6161 0,5612
3 0,9392 0,7977 0,6841 0,5981 0,5321 0,4800
4 0,9057 0,7457 0,6278 0,5441 0,4803 0,4307
5 0,8772 0,7071 0,4447 0,5895 0,5065 0,3974
6 0,8534 0,6771 0,5598 0,4783 0,4184 0,3726
7 0,8332 0,6530 0,5365 0,4564 0,3980 0,3535
8 0,8159 0,6333 0,5175 0,4387 0,3817 0,3384
9 0,8010 0,6167 0,5017 0,4241 0,3682 0,3259
16 0,7341 0,5466 0,4366 0,3645 0,3135 0,2756
36 0,6602 0,4748 0,3720 0,3066 0,2612 0,2278
144 0,5813 0,4031 0,3093 0,2513 0,2119 0,1833
N° de grupos
gl 8 9 10 15 20
1 0,6798 0,6385 0,6020 0,4709 0,3894
2 0,5157 0,4775 0,4450 0,3346 0,2705
3 0,4377 0,4027 0,3733 0,2758 0,2205
4 0,3910 0,3584 0,3311 0,2419 0,1921
5 0,3595 0,3286 0,3029 0,2195 0,1735
6 0,3362 0,3067 0,2823 0,2034 0,1602
7 0,3185 0,2901 0,2666 0,1911 0,1501
8 0,3043 0,2768 0,2541 0,1815 0,1422
9 0,2926 0,2659 0,2439 0,1736 0,1357
16 0,2462 0,2226 0,2032 0,1429 0,1108
36 0,2022 0,1820 0,1655 0,1144 0,0879
144 0,1616 0,1446 0,1308 0,0889 0,0675
271
Fernando Maureira Cid
________________________________________________________________________
ANEXO 8
Tabla de valores críticos de la distribución X2
272
Capítulo 16. Asociación de variables
________________________________________________________________________
ANEXO 9
Tabla de valores críticos para la prueba Q (Tukey-Snedecor α= , 5
gl 2 3 4 5 6 7 8 9
1 17,97 26,98 32,82 37,08 40,41 43,12 45,40 47,36
2 6,08 8,28 9,80 10,89 11,73 12,43 13,03 13,54
3 4,50 5,91 6,83 7,51 8,04 8,47 8,85 9,18
4 3,93 5,04 5,76 6,29 6,70 7,06 7,35 7,60
5 3,64 4,60 5,22 5,67 5,93 6,38 6,58 6,80
6 3,46 4,34 4,90 5,31 5,63 5,89 6,12 6,32
7 3,34 4,16 4,68 5,06 5,35 5,59 5,82 5,99
8 3,26 4,04 4,53 4,89 5,17 5,40 5,60 5,77
9 3,20 3,95 4,42 4,76 5,02 5,24 5,43 5,60
10 3,15 3,88 4,33 4,66 4,91 5,12 5,30 5,46
11 3,11 3,82 4,26 4,58 4,82 5,03 5,20 5,35
12 3,08 3,77 4,20 4,51 4,75 4,95 5,12 5,27
13 3,06 3,73 4,15 4,46 4,69 4,88 5,05 5,19
14 3,03 3,70 4,11 4,41 4,64 4,83 4,99 5,13
15 3,01 3,67 4,08 4,37 4,59 4,78 4,94 5,08
16 3,00 3,65 4,05 4,34 4,56 4,74 4,90 5,03
17 2,98 3,62 4,02 4,31 4,52 4,70 4,86 4,99
18 2,97 3,61 4,00 4,28 4,49 4,67 4,83 4,96
19 2,96 3,59 3,98 4,26 4,47 4,64 4,79 4,92
20 2,95 3,58 3,96 4,24 4,45 4,62 4,77 4,90
24 2,92 3,53 3,90 4,17 4,37 4,54 4,68 4,81
30 2,89 3,48 3,84 4,11 4,30 4,46 4,60 4,72
40 2,86 3,44 3,79 4,04 4,23 4,39 4,52 4,63
60 2,83 3,40 3,74 3,98 4,16 4,31 4,44 4,55
120 2,80 3,36 3,69 3,92 4,10 4,24 4,36 4,47
∞ 2,77 3,32 3,63 3,86 4,03 4,17 4,29 4,39
273
Fernando Maureira Cid
________________________________________________________________________
ANEXO 10
Tabla de valores críticos del coeficiente de correlación de Pearson
274
Capítulo 16. Asociación de variables
________________________________________________________________________
ANEXO 11
Tabla de valores críticos de la prueba U de Mann-Whitney
n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
1 - - - - - - - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - -
2 - - - - - - - 0 0 0 0 0 0 0 0 0 0 0 0
- - - - - - - - - - - - - - - - - - -
3 - - - - 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7
- - - - - - - - 0 0 0 1 1 1 2 2 2 2 3
4 - - - 0 1 2 3 4 4 5 6 7 8 9 10 11 11 12 13
- - - - - 0 0 1 1 2 2 3 3 4 5 5 6 6 7
5 - - 0 1 2 3 5 6 7 8 9 11 12 13 14 15 17 18 19
- - - - 0 1 2 3 3 4 5 6 7 7 8 9 10 11 12
6 - - 1 2 3 5 6 8 10 11 13 14 16 17 19 21 22 24 25
- - - 0 1 2 3 4 5 6 7 9 10 11 12 13 15 16 17
7 - - 1 3 5 6 8 10 12 14 16 18 29 22 24 26 28 30 32
- - - 0 2 3 4 6 7 9 10 12 13 15 16 18 19 21 22
8 - 0 2 4 6 8 10 13 15 17 19 22 24 26 29 31 34 36 38
- - - 1 3 4 6 8 9 11 13 15 17 18 20 22 24 26 28
9 - 0 2 4 7 19 12 14 16 18 23 26 28 31 34 37 39 42 45
- - 0 1 3 5 7 9 11 13 16 18 20 22 24 27 29 31 33
10 - 0 3 5 8 11 14 17 20 23 26 29 33 36 39 42 45 48 52
- - 0 2 4 5 9 11 13 16 18 21 24 26 29 31 34 37 39
11 - 0 3 6 9 13 16 19 23 26 30 33 37 40 44 47 51 55 58
- - 0 2 5 7 10 13 16 18 21 24 27 30 33 36 39 42 45
12 - 0 4 7 11 14 18 22 26 29 33 37 41 45 49 53 57 61 65
- - 1 3 6 9 12 15 18 21 24 27 31 34 37 41 44 47 51
13 - 0 4 8 12 15 20 24 28 33 37 41 45 50 54 59 63 67 72
- - 1 3 7 10 13 17 20 24 27 31 34 38 42 45 49 53 57
14 - 0 5 9 13 17 22 26 31 36 40 45 50 55 59 64 67 74 78
- - 1 4 7 11 15 18 22 26 30 34 38 42 46 50 54 58 63
15 - 0 5 10 14 19 24 29 34 39 44 49 54 59 64 70 75 80 85
- - 2 5 8 12 16 20 24 29 33 37 42 46 51 55 60 64 69
16 - 0 6 11 15 21 26 31 37 42 47 53 59 64 70 75 81 86 92
- - 2 5 9 13 18 22 27 31 46 41 45 50 55 60 65 70 74
17 - 0 6 11 17 22 28 34 39 45 51 57 63 67 75 81 87 93 99
- - 2 6 10 15 19 24 29 34 39 44 49 54 60 65 70 75 81
18 - 0 7 12 18 24 30 36 42 48 55 61 67 74 80 86 93 99 106
- - 2 6 11 16 21 26 31 37 42 47 53 58 64 70 75 81 87
19 - 0 7 13 19 25 32 38 45 52 58 65 72 78 85 92 99 106 113
- - 3 7 12 17 22 28 33 39 45 51 57 63 69 74 81 87 93
Los valores de la ° línea para cada n corresponde a un α=0,05
275
Fernando Maureira Cid
________________________________________________________________________
Los valores de la 2° línea para cada n corresponde a un α=0,0
ANEXO 12
Tabla de valores críticos de la prueba de rangos de Wilcoxon
n 0,05 0,01
1 - -
2 - -
3 - -
4 - -
5 - -
6 1 -
7 2 -
8 4 0
9 6 2
10 8 3
11 11 5
12 14 7
13 17 10
14 21 13
15 25 16
16 30 19
17 35 23
18 40 28
19 46 32
20 52 37
21 59 43
22 66 49
23 73 55
24 81 61
25 90 68
276
Capítulo 16. Asociación de variables
________________________________________________________________________
ANEXO 13
Tabla de valores críticos de la prueba de varianza unifactorial de Kruskal-Wallis
277
Fernando Maureira Cid
________________________________________________________________________
278
Capítulo 16. Asociación de variables
________________________________________________________________________
ANEXO 14
Tabla de valores críticos del coeficiente de correlación de Spearman
279
Fernando Maureira Cid
________________________________________________________________________
280