Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Y DE SISTEMAS
ELECCIÓN DEL ESTADÍSTICO ADECUADO EN LA INVESTIGACIÓN
Prof. Dr. Guillermo Antonio Mas Azahuanche
2 O E 2 / E
Donde O = frecuencia observada, E = Frecuencia esperada: en tal caso para el caras es:
2
47 50 2 0.18 , y para sello: 2
53 50 2 0.18 , por lo que la suma de
50 50
estas categorías es: 0.18 + 0.18 = 0.36.
1
El significado de la bondad de ajuste se conoce calculando los grados de libertad y
usando tabla de distribución de 2 : si la chi cuadrada calculada es mayor que el
de la tabla, se rechaza la hipótesis nula, concluyendo que las predicciones eran
incorrectas (en este experimento, los grados de libertad serían [2 - 1] = 1). El valor
crítico (por tabla) para una 2 para este ejemplo es α = 0.05, y v = 1 es 3.84, o sea
n ad bc
2
2
p
a b ! c d ! a c !b d !
a ! b! c ! d ! n!
2
2) que la variable sea continua;
Cuando se desea comparar dos grupos en los que se ha medido una variable
cuantitativa continua, cuya distribución no es semejante a la curva normal, o bien
cuando la variable en estudio es cuantitativa y discreta, la prueba U de Mann-
Whitney es una buena alternativa para comparar dos promedios independientes
usando la t de Student; esto con los siguientes supuestos:
1) que las dos muestras de tamaño, n y m, usadas para el análisis hayan sido
extraídas de manera independiente y en forma aleatoria, de sus respectivas
poblaciones;
4) si las poblaciones son diferentes, que éstas varíen solamente respecto de sus
medianas.
3
grupos independientes. Las conclusiones con esta prueba se basan en la
comparación de un valor H calculado versus un valor H crítico, de acuerdo con si
los grupos son uno grande (n >5) y el otro pequeño (K = 3, 4 o 5 y n < 5).
4
distribuyen normalmente; de lo contrario, se elige el coeficiente de correlación de
Spearman
La regresión lineal se usa para predecir los cambios en una variable independiente
(en caso de una regresión lineal simple) o varias (en caso de una regresión lineal
múltiple) que pueden afectar el valor de la variable dependiente. Para el análisis de
la regresión lineal es necesario considerar que la variable dependiente sea continua
y con tenga una distribución normal, en tanto que la relación entre una variable
dependiente e independiente es lineal, y si tal suposición no se cumple, los
resultados pueden ser incorrectos, mientras que para una variable independiente,
no es necesario que se distribuya normalmente; sin embargo, para el análisis de
correlación, ambas deben distribuirse de manera normal. En cuanto a la regresión
lineal, ésta se usa para expresar, en una ecuación, la relación que hay entre las
variables dependiente e independiente; de tal manera que si estamos interesados
en saber del número de visitas a un Servicio de Urgencias (variable independiente
conocida como variable x), con relación al número de admisiones al hospital
(variable dependiente conocida como variable y), el análisis de la regresión lineal
se usa para saber su ecuación. De esta forma se estima la ecuación de la línea
recta representada como y = a + bx, donde los coeficientes a y b son el intercepto
de la línea estimada en el eje, ya que y es la pendiente.
5
anormal y el tamaño de muestra es menor a 11 casos, lo que está indicado es
emplear pruebas no paramétricas o de libre distribución.
En el siguiente cuadro podemos ver los requisitos que se necesita en forma genérica
las pruebas estadísticas:
6
USO DEL PAQUETE ESTADÍSTICO SPSS
INTRODUCCIÓN
7
son más lentos y poco confiables, pero también son el medio más común de
concentrar los datos.
Método de tabulación manual mecánica
Implica la utilización de calculadoras, sumadoras y cualquier instrumento mecánico,
con el cual se hace la concentración de datos apoyándose en las operaciones
aritméticas y los cálculos que se registran en estos instrumentos.
Método de tabulación automatizado
En este caso la recopilación de datos se hace utilizando equipos electrónicos de
cálculo o de cómputo como es el SPSS, Excel y otros. Con el apoyo de éstos, se
hace una concentración más rápida de resultados a través de la tabulación y
clasificación de información. Los resultados se presentan así en forma más
confiable, con mayor profundidad y en un menor tiempo.
Método de tabulación estadística
Utilizando las técnicas estadísticas, matemáticas y de cálculo que se aplican en la
recolección, tabulación y clasificación de la información recopilada, se pretende
profundizar en los resultados, hacer proyecciones de los datos y mejorar los cálculos
e interpretaciones de los mismos.
La utilización de estas técnicas es independiente de las técnicas anteriores; más
bien las complementan.
Método de tabulación computacional
En los modernos sistemas de computación es posible efectuar no sólo la
recopilación, la tabulación y el análisis de datos, sino que, además, se ha agregado
una serie de sistemas que ayudan a la elaboración de instrumentos de recopilación,
concentración y presentación de resultados en gráficas, cuadros e incluso
documentos que resumen la información obtenida.
En Internet existen servicios de captura, recopilación y concentración de resultados,
además de muchas páginas de información al respecto.
Métodos de análisis
Se trata de la elección del método o los métodos de análisis que serán aplicados
durante el desarrollo de la investigación. Por ahora, sólo vamos a indicar los
nombres de aquellos métodos más utilizados.
8
Método analítico sintético.
Método inductivo deductivo.
Método objetivo subjetivo.
Método cuantitativo cualitativo.
Método estadístico-dinámico.
Método empírico pragmático.
Método hipotético deductivo.
Análisis de datos
Se refiere a la forma de utilizar la estadística para poder interpretar los datos
obtenidos.
Propiamente, es la agrupación de datos en rangos significativos que se concentran
conforme a una adecuada selección para dar una interpretación útil al investigador.
Al respecto, existen varias formas de utilizar la estadística; sin embargo, para los
efectos de este proceso general de investigación sólo se consideran cuatro casos:
estadística descriptiva, estadística probabilística, estadística multidimensional y
proyecciones.
Estadística descriptiva
Es aquella rama de la estadística donde se interpretan fielmente los datos, ya sea
que se presenten en gráficas, cuadros, resúmenes, etcétera. Aquí, los datos sólo
se utilizan sin admitir que se modifique ninguno de ellos, esto es, se utilizan tal y
como se obtuvieron en la realidad.
Estadística probabilística
Es aquella técnica estadística que analiza el comportamiento probabilístico de los
resultados obtenidos en la recopilación de datos, con la finalidad de proyectar y
encontrar, mediante estimaciones estadísticas, las relaciones entre esos datos y los
grados de probabilidad, incertidumbre o certeza en el manejo de la información.
Esto nos permite inferir a partir de los datos algún comportamiento o tendencia útil
para la investigación.
Estadística multidimensional
Es una clasificación de carácter informal que se hace de la estadística aplicada a
los modernos métodos de análisis y de cálculo, la cual se complementa con la
9
conjugación estadística de variables significativas para el investigador. Con la
aplicación de estos métodos estadísticos se busca interpretar un comportamiento
del fenómeno observado mediante la conjugación de diversos factores, ya sean
estadísticos, matemáticos o proyectivos.
Proyecciones
Gracias al excelente apoyo de los sistemas de cómputo para la recopilación y el
análisis de los datos, es posible efectuar proyecciones, detectar tendencias y hacer
representaciones a futuro de la información obtenida. El objetivo de estas
proyecciones es analizar y predecir el posible comportamiento de los datos. Por lo
general, los programas para hacer proyecciones se conocen como simuladores y
su costo de utilización es muy alto. Por ejemplo, el laboratorio de Simulación que
tiene la facultad de Ingeniería de la URP.
Cabe indicar que las técnicas de análisis de datos antes mencionadas sólo son de
carácter ilustrativo y la única intención de presentarlas es poder vislumbrar sus
posibles aplicaciones. Por esa razón, se recomienda que el investigador recurra a
libros especializados sobre el tema, con la finalidad de hacer más acertado el
análisis de los datos, de acuerdo con la profundidad, confiabilidad y exigencia del
tema de investigación.
10
5. Determinar qué prueba estadística paramétrica o no paramétrica es la más
adecuada.
Cuando se pretende probar una hipótesis respecto a uno o más parámetros de una
población que tiende a una distribución normal, las pruebas usadas son las de la
estadística paramétrica, como la t de Student.
Por lo contrario, si los procedimientos estadísticos no requieren plantear inferencias
acerca de los parámetros de la población (su media y dispersión) se le conoce como
no paramétricos, o de distribución libre (ya que no se hacen suposiciones acerca de
la distribución de la población de donde procede la muestra.
11
2) Son aplicables a los datos jerarquizados;
3) Se pueden usar cuando dos series de observaciones provienen de
distintas poblaciones;
4) Son la única alternativa cuando el tamaño de muestra es pequeño; y,
5) Son útiles a un nivel de significancia previamente especificado.
En términos generales, se puede considerar que, aunque la potencia de las pruebas
estadísticas paramétricas es mayor que la que ofrecen las pruebas no paramétricas,
ya que con ellas es la probabilidad de rechazar la hipótesis nula cuando ésta
realmente es falsa (error de tipo II: 1-α), es conveniente comentar que el adecuado
tamaño de muestra es un requisito indispensable para aumentar la eficacia de una
prueba: a medida que aumenta el tamaño de muestra, disminuye la posibilidad de
cometer el error de tipo II.
Características comunes de las pruebas no paramétricas.
a. Independencia de las observaciones aleatorias a excepción de datos pareados.
b. Pocas asunciones con respecto a la distribución de la población.
c. La variable dependiente es medida en escala categórica.
d. El punto primario es el ordenamiento por rangos o por frecuencias.
e. Las hipótesis se hacen sobre rangos, mediana o frecuencias de los datos.
f. El tamaño de muestra requerido es menor (30 o menores).
12
Características de las pruebas no paramétricas.
Ventajas
a. Determinación sencilla. Mediante fórmulas simples de combinación.
b. Fáciles de aplicar. Las operaciones matemáticas son la jerarquización,
conteo, suma y resta.
c. Rápidas de aplicar. Cuando las muestras son pequeñas.
d. Campos de aplicación. A grupos mayores de poblaciones.
e. Menos susceptibles a la contravención de los supuestos. Ya que los
supuestos son escasos y menos complicados.
f. Tipo de medición requerida. Se pueden utilizar con datos ordinales o
nominales.
g. Tamaño de la muestra. Cuando la muestra es menor a 10 son sencillas,
rápidas y sólo un poco menos eficaces. Conforme aumenta el tamaño de la
muestra se hacen más laboriosas y tardadas, y menos efectivas. Pero con
una PC y el software adecuado nos facilita su ejecución.
h. Efectividad estadística. Cuando se satisfacen los supuestos de la prueba no
paramétrica son igual de efectivas. Si se satisfacen los supuestos de una
prueba paramétrica con muestras pequeñas son un poco menos efectivas y
se vuelven menos eficaces a medida que aumenta el tamaño de muestra.
Desventajas
a. Si se puede utilizar una prueba paramétrica y se usa una no paramétrica hay
una pérdida de información.
b. En muestras grandes las pruebas no paramétricas son muy laboriosas. Con
una PC y el software adecuado nos facilita su ejecución.
13
PRUEBAS DE NORMALIDAD
Para evaluar la normalidad de un conjunto de datos tenemos el Test de
Kolmogorov-Smirnov y el test de Shapiro-Wilks
Ejemplo: Aquí se tiene una distribución de datos de 187 Hombres y 197 Mujeres:
Las pruebas analíticas del SPSS de que dispone esta opción son: Kolmogorov-
Smirnov con la modificación de Lillierfors y la prueba de Shapiro-Wilks. Esta última
la realiza el SPSS si el tamaño muestral es inferior a 30, es decir, da por defecto las
dos pruebas; mientras que si el nº de individuos es superior a 30, sólo da como
resultado la de Kolmogorov-Smirnov.
La prueba de Kolmogorov-Smirnov con la modificación de Lillierfors es la más
utilizada y se considera uno de los test más potentes para muestra mayores de 30
casos. En este test la Hipótesis nula
Ho: es que el conjunto de datos siguen una distribución normal. Y la
Hipótesis Alternativa H1: es que no sigue una distribución normal.
Este test se basa en evaluar un estadístico:
Dn = ⎟Fn (x) – F(x)⎟
Fn (x): es la distribución empírica
F (x): s la distribución teórica, que en este caso es la normal
Si el valor del estadístico supera un determinado valor, que depende del nivel de
significación con el que uno quiera rechazar la hipótesis nula, diremos que esa
colección de datos no se distribuye según una distribución normal. Lillierfors tabuló
14
este estadístico para el caso más habitual en el que desconocemos la media y la
varianza poblacional y las estimamos a partir de los datos muestrales. El SPSS ya
utiliza esta prueba modificada.
La prueba de Shapiro-Wilks se basa en estudiar el ajuste de los datos graficados
sobre un gráfico probabilístico en el que cada dato es un punto cuyo valor de abscisa
el valor observado de probabilidad para un valor determinado de la variable, y el de
ordenada el valor esperado de probabilidad.
En este test la Hipótesis nula Ho: El conjunto de datos siguen una distribución
normal. Y la
Hipótesis Alternativa H1: es que no sigue una distribución normal.
El estadístico W de Shapiro-Wilks mide la fuerza del ajuste con una recta. Cuanto
mayor sea este estadístico mayor desacuerdo habrá con la recta de normalidad, por
lo que podremos rechazar la hipótesis nula. La prueba de Shapiro-Wilks está
considerada como la prueba más potente para muestra inferiores a 30 casos.
Para ejecutar: se debe ir a: analizar – estadísticos descriptivos - Explorar
15
Luego sale esta ventana:
Podemos observar que los datos son más de 30. Por esta razón usaremos la prueba de Normalidad de
Kolmogovov-Smirnov
16
Aquí el p-valor que arroja el SPSS es 0.000 en ambos casos Hombres y Mujeres es
menor a 0.05. Por lo tanto, la distribución de los datos tanto de Hombres como de
Mujeres tienen una Distribución Normal.
Prueba de Kruskal-Wallis
Concepto clave En esta sección se describe la prueba de Kruskal-Wallis, que utiliza
rangos de datos de tres o más muestras independientes para probar la hipótesis
nula de que las muestras provienen de poblaciones con medianas iguales.
Cuando utilizamos el análisis de varianza de un factor (ANOVA) para probar la
hipótesis nula de que tres o más poblaciones tienen la misma media, pero el ANOVA
requiere que todas las poblaciones implicadas tengan distribuciones normales.
La prueba de Kruskal-Wallis no requiere distribuciones normales
Definición
La prueba de Kruskal-Wallis (también llamada la prueba H) es una prueba no
paramétrica que utiliza rangos de datos muestrales de tres o más poblaciones
independientes. Se utiliza para probar la hipótesis nula de que las muestras
independientes provienen de poblaciones con medianas iguales; la hipótesis
alternativa es la aseveración de que las poblaciones tienen medianas que no son
iguales.
H0: Las muestras provienen de poblaciones con medianas iguales.
H1: Las muestras provienen de poblaciones con medianas que no son iguales.
17
Prueba de Kruskal-Wallis
Requisitos
1. Tenemos al menos tres muestras independientes, las cuales se seleccionan al
azar.
2. Cada muestra tiene al menos cinco observaciones.
3. No existe el requisito de que las poblaciones tengan una distribución normal o
alguna otra distribución particular
Notación
N : número total de observaciones en todas las muestras combinadas
k : número de muestras
R1 : suma de los rangos de la muestra 1, que se calcula utilizando el
procedimiento
que se describe a continuación
n1 : número de observaciones de la muestra 1
Para la muestra 2, la suma de los rangos es R2 y el número de observaciones es
n2, y
se utiliza una notación similar para las otras muestras.
Estadístico de prueba
R12 R2 2 Rk
2
3 N 1
12
H
N N 1 n1 n2 nk
Valores críticos
1. La prueba es de cola derecha.
2. gl : k - 1. (Puesto que el estadístico de prueba H puede aproximarse por medio
de una distribución Chi cuadrada, utilice tabla con k - 1 grados de libertad,
donde k es el número de muestras diferentes).
18
3. Calcule H utilizando los resultados del paso 2, con la notación y el estadístico
de prueba descritos en el recuadro anterior.
El estadístico de prueba H es básicamente una medida de la varianza de las
sumas de rangos
R1, R2, . . . , Rk. Si los rangos están distribuidos de forma equitativa entre los
grupos muestrales, entonces H debe ser un número relativamente pequeño.
Si las muestras son muy diferentes, entonces los rangos serán excesivamente
bajos en algunos grupos y altos en otros, con el efecto neto de que H será grande.
En consecuencia, sólo los valores grandes de H nos llevan al rechazo de la
hipótesis nula de que las muestras provienen de poblaciones idénticas. La prueba
de Kruskal-Wallis es, por lo tanto, una prueba de cola derecha.
Ejemplo 1. ¿La energía solar es la misma todos los días? Un estudiante vive
en una casa con sistema eléctrico solar. A la misma hora de cada día, reúne
lecturas de voltaje con un medidor conectado al sistema y los resultados se listan
en la tabla al margen. Utilice un nivel de significancia de 0.05 y pruebe la
aseveración de que las lecturas de voltaje tienen la misma mediana para los tres
diferentes tipos de día. Podríamos esperar que un sistema solar proporcione más
energía eléctrica en días soleados que en días nublados o lluviosos. ¿Podemos
concluir que los días soleados dan como resultado mayores cantidades de energía
eléctrica? Los datos son:
Soleado Nublado Lluvioso
13,5 12,7 12,1
13 12,5 12,2
13,2 12,6 12,3
13,9 12,7 11,9
13,8 13 11,6
14 13 12,2
Solución:
19
H1: Las lecturas de las muestras de voltaje del medidor de energía eléctrica solar
en días soleados, Nublados y lluviosos sus medianas no son iguales.
20
Luego nos sale el resultado de la prueba Kruskal Wallis
Prueba de Kruskal-Wallis
Podemos observar que los días soleados dan como resultado mayores cantidades de
energía.
Estadísticos de
pruebaa,b
Voltaje
Chi-cuadrado 14,840
gl 2
Sig. asintótica 0,001
a. Prueba de Kruskal Wallis
b. Variable de agrupación:
Estado_Tiempo
Resultados:
El estadístico de la prueba: H = 14,840
El valor crítico: 2, 0.95 5.99 . En la Chi cuadrado. Sale de la tabla Chi Cuadrada. El sub
2
21
El p-valor que nos arroja el SPSS es 0.001 que es menor que 0.05. Por lo tanto, existe
evidencia suficiente para justificar el rechazo de la aseveración de que los grupos tienen las
mismas medianas de las lecturas de voltaje son iguales en los tres tipos de días diferentes.
(Se acepta la hipótesis alterna H1)
Ejemplo 2. Ejercicio y estrés. Se realizó un estudio para investigar los efectos del
ejercicio sobre el estrés. La siguiente tabla es la lista de lecturas de presión
sanguínea sistólica (en mmHg) de sujetos, antes de iniciar 25 minutos de ejercicio
aeróbico en bicicleta y antes de generarles estrés por medio de una prueba de
aritmética y otra de expresión verbal. Utilice un nivel de significancia de 0.05 para
probar la aseveración de que los diferentes grupos de sujetos tienen la misma
mediana de la presión sanguínea. Con base en los resultados, ¿se puede
considerar que los grupos son muestras de la misma población?
22
Aceptamos y luego se tiene:
Prueba de Kruskal-Wallis
23
Resultados: El estadístico de la prueba: H = 6.034
El valor crítico: 2, 0.95 7.81 (sale de la tabla) . En la Chi cuadrado. El sub índice 3
2
24
2. ¿Afecta el peso de un automóvil las heridas en la cabeza producidas en un
choque?
Se obtuvieron datos de experimentos de choques realizados por el departamento
de Seguridad Vial. Se compraron automóviles nuevos, se impactaron contra una
barrera fija a 35 mi/h y se registraron las mediciones en un maniquí en el asiento
del conductor. Utilice los datos muestrales listados abajo para probar las diferencias
en las mediciones de heridas en la cabeza (de acuerdo con el Head Injury Criterion,
HIC) en cuatro categorías de peso. ¿Existe evidencia suficiente para concluir que
las mediciones de heridas en la cabeza para las cuatro categorías de peso de
automóviles no son las mismas? ¿Sugieren los datos que los automóviles más
pesados son más seguros en un choque?
Subcompacto: 681 428 917 898 420
Compacto: 643 655 442 514 525
Mediano: 469 727 525 454 259
25
diferentes. Es la prueba no paramétrica considerada más potente para comparar 2
variables continuas independientes. La prueba no parámetrica es análoga a la
prueba de “t” de 2 muestras, cuando no se dan todas las condiciones exigidas para
aplicar la “t” de student. Originalmente el método fue propuesto por Wilcoxon (1945)
y después aplicado por Mann y Whitney (1947). La prueba Mann-Whitney como
muchos otros procedimientos no parámetricos se usa para los datos arreglados en
rangos. En este caso los datos se deben organizar en rangos de mayor a menor
marcando 1 para datos mayor hasta n para datos menores o viceversa, donde N
(tamaño total) = n1 + n2. La prueba de hipótesis está basada sobre la significancia
n1 n1 1
U c n1 n2 R1 , si R1 < R2
2
Donde, U c es el valor tabulado n1 n2 , donde n1 , n2 son las observaciones en las
n2 n2 1
U n1 n2 R2 , si R1 > R2
2
R2 es la sumatoria de rangos de observaciones en la muestra 2, por lo tanto,
26
Solución: Hipótesis
Ho: Las estaturas de estudiantes masculinos y femeninos son iguales.
H1: Las estaturas de estudiantes masculinos y femeninos no son iguales.
Nivel de significación : 0.05
Prueba de Mann-Whitney
27
El p- valor es 0.012 menor que 0.05. Por lo que se acepta la hipótesis alterna H1
“Las estaturas de estudiantes masculinos y femeninos no son iguales”.
Ejercicio 1 Los siguientes datos muestran horas anuales perdidas por enfermedad
de los 24 hombres y mujeres de la Minera Antamina. Al nivel de significancia de
0.05, ¿existe alguna diferencia atribuible al
sexo? Utilice la prueba U de Mann-Whitney.
Hombres 31 44 25 30 70 63 54 42 36 22 25 50
Mujeres 38 34 33 47 58 83 18 36 41 37 24 48
M1=M2=M3=M4..........Mk
Ha: Las medianas de las poblaciones difieren significativamente, por lo que los
2
r k O
ij Ei j
2
i 1 j 1 Ei j
Donde Oij = número observado de casos clasificados en la hilera i de la columna j.
Eij = número de casos esperados conforme a Ho para ser clasificados en la hilera i de la
Regla de decisión. La hipótesis nula (Ho) se rechazará si 2 c 2 , (r-1, α ) donde r
29
Variedades Rendimiento
V1 83 91 94 89 89 96 92 90 91
V2 91 90 81 83 83 84 88 91 89 84
V3 101 100 91 93 96 95 94
V4 78 82 81 77 79 81 80 81
Hipótesis:
H :M =M =M =M las medianas de rendimiento son iguales entre las cuatro variedades.
o 1 2 3 4:
Ha : M1≠M2≠M3≠M4 al menos un par de medianas es diferente.
Procedimiento:
2
3 4.7 2 6 4.22 0 3.7 2 17.97
4 .7 4 .2 3. 7
De la tabla se obtiene con g.l. = 4-1=3 y alfa α= 0.05, 2 7.82
Conclusión: Se rechaza la Ha, la mediana de rendimiento es diferente, al menos en dos variedades
Usando el SPSS:
30
Prueba de la mediana
Frecuencias
Variedades
Variedad 1 Variedad 2 Variedad 3 Variedad 4
Rendimiento > Mediana 6 3 7 0
<= Mediana 3 7 0 8
31
Estadísticos de pruebaa
Rendimiento
N 34
Mediana 89,0000
Chi-cuadrado 17,543b
gl 3
Sig. 0,001
asintótica
a. Variable de agrupación: Variedades
b. 7 casillas (87,5%) han esperado
frecuencias menores que 5. La frecuencia
mínima de casilla esperada es 3,3.
Como el p-valor es 0.001 es menor que 0.05 se rechaza la hipótesis nula y al menos
una de las medinas es diferente.
Ejemplo 2. Se tomó una prueba sobre aprendizaje y estrés idéntica a dos grupos
de estudiantes de Medicina de dos universidades distintas. Las puntuaciones
obtenidas por cada grupo están representadas en la siguiente tabla:
Grupo1 54 65 66 71 73 78 78 80 82 87 92 93 95
Grupo2 51 53 54 61 64 66 67 69 71 74 76 80 81 85 89 90 94
¿Qué conclusión se puede obtener del examen aplicado a los dos grupos? Use α = 0.05
Solución:
Hipótesis:
H :M (x ) = M (x ). Las medianas de los puntajes de la prueba sobre aprendizaje y estrés de
o E 1 E 2
ambos grupos de estudiantes de Medicina son iguales.
Ha : M (x ) ≠ M (x ). Las medianas de los puntajes de la prueba sobre aprendizaje y estrés de
E 1 E 2
ambos grupos de estudiantes de Medicina no son iguales.
Colocamos los datos en el SPSS
32
Luego nos dará el SPSS el siguiente resultado. La Mediana total de los dos grupos es: 75
M 2
8 6.5 7 8.5 5 6.5 10 8.5
2
2
2
2
1.22171946
E
6.5 8 .5 6.5 8 .5
Luego el Estadístico de la prueba es: 1.22171946
De la tabla se obtiene con g.l. = 2-1=1 y alfa α= 0.05, el valor critico es: 2 3.84
Conclusión:
Como: M E
2
1.222 Crit 3.84 , se tiene que no se rechaza la hipótesis nula. Podemos
2
concluir que las muestras provienen de dos poblaciones con medianas iguales.
33
Como el p-valor es 0.462 es menor que 0.05 no se rechaza la hipótesis nula, podemos
concluir que las muestras provienen de dos poblaciones con medianas iguales. Esto
corrobora lo anterior.
Ejercicios:
1. ¿Existe diferencia entre el nivel de salud mental de los estudiantes de educación secundaria en unm
área rural y un área urbana?
Urbana 35 26 27 21 27 38 23 25 25 27 45 46 33 26 46 41
Rural 29 50 43 22 42 47 42 32 50 37 34 31
Grupo1 52 66 61 71 73 78 78 80 82 87 98 96 91
Grupo2 55 50 53 61 64 66 67 69 71 72 76 80 83 85 85 90 94
¿Qué conclusión se puede obtener del examen aplicado a los dos grupos? Use α = 0.05
Solución:
3. Unos investigadores están interesados en saber si cuatro enfermedades provocan por término medio
el mismo grado de ansiedad. Para ello se toman cuatro muestras de 6, 7, 5 y 4 personas, pasándoles a
cada una de ellas un test que mide el grado de ansiedad del individuo en una escala de 0 a 10.
34
Test de Friedman (Variables cuantitativas)
Requisitos
12
X r2 = ( R i )2 3n(k + 1)
nk(k + 1)
Ejemplo 1: Los siguientes datos sobre la cantidad de alimentos consumidos (g) por
ocho ratas después de 0, 24 y 72 horas de comida ¿Los datos indican una
diferencia? ¿El consumo promedio de alimentos para las tres condiciones
35
experimentales son iguales? Pruebe una diferencia en el verdadero consumo
promedios de alimentos usando la prueba de Friedman. Use α = 0.01.
36
Tengamos en cuenta que la estadística de prueba es:
(Fr = Chi-Cuadrada = 13.067) es corregido por la existencia de lazos en las filas de
los datos.
Para el nivel de significación α = 0.01 se tiene que p-valor: 0.001 < 0.01.
Se rechaza la hipótesis nula.
Conclusión:
En el nivel de significancia α = 0.01, existe suficiente evidencia para concluir que
hay una diferencia en el verdadero consumo medio de alimentos en ratas para los
tres experimentos
Ejercicio 1: Un hospital desea evaluar la gravedad de 4 enfermedades distintas.
Para ello se elige al azar 5 médicos que se le asignan a las enfermedades valores
ene escala de 1 a 5.
Enfermedades
Médicos 1 2 3 4
1 3 4 3 2
2 2 2 4 2
3 4 4 3 3
4 1 1 3 2
5 4 3 5 1
Ejercicio 2: Se usan cuatro fertilizantes diferentes, uno en cada uno de seis
terrenos diferentes; el experimento se repite usando tres tipos diferentes de
semilla. Se observa la producción por área obteniéndose los siguientes resultados:
37
Terreno
Semilla Fertilizante 1 2 3 4 5 6
1 80.5 87.0 86.1 82.1 79.3 84.2
2 90.1 83.4 82.4 84.9 87.1 98.3
1 3 87.0 89.1 91.0 84.4 92.2 85.3
4 88.0 90.3 86.1 83.1 90.8 84.7
1 79.1 77.6 84.1 83.3 76.6 81.0
2 87.0 82.0 80.6 79.5 86.2 84.1
2 3 82.6 81.4 89.0 86.3 84.0 88.1
4 81.5 87.9 80.4 83.1 87.1 82.3
1 85.4 89.2 90.0 83.4 87.1 82.3
2 92.3 90.1 88.1 85.3 86.3 92.9
3 3 92.0 90.2 87.2 94.3 88.4 95.1
4 89.3 93.6 90.8 87.6 93.7 82.9
https://www.freelibros.org/estadistica/introduccion-a-la-inferencia-estadistica-
armando-aguilar-marquez-jorge-altamira-ibarra-y-omar-garcia-leon.html
38
Manuel Gómez-Gómez,* Cecilia Danglot-Banck,* Leopoldo Vega-Franco
http://www.medigraphic.com/pdfs/pediat/sp-2003/sp032i.pdf
https://www.uv.mx/rmipe/files/2015/09/Estadistica.pdf
Protocolo de la investigación
https://s3.amazonaws.com/academia.edu.documents/38062890/BUENO_2.pdf?AWSAccessKe
yId=AKIAIWOWYYGZ2Y53UL3A&Expires=1523558022&Signature=%2FafNHn59c5o6urEpe8M3
NN5yJ4c%3D&response-content-
disposition=inline%3B%20filename%3DFrancisco_Javier_Jimenez_Mendez.pdf
39