Está en la página 1de 39

FACULTAD DE INGENIERÍA INDUSTRIAL

Y DE SISTEMAS
ELECCIÓN DEL ESTADÍSTICO ADECUADO EN LA INVESTIGACIÓN
Prof. Dr. Guillermo Antonio Mas Azahuanche

SELECCIÓN DE UNA PRUEBA ESTADÍSTICA NO PARAMÉTRICA

La prueba estadística conocida como chi cuadrada (  2 ) es una prueba cualitativa


para saber si las diferencias entre las frecuencias observadas y las esperadas son
o no significativas en uno o más grupos categóricos. La hipótesis nula en esta
prueba plantea que no existen diferencias entre las frecuencias esperadas y las
observadas, es así que la  2 se emplea también para conocer la bondad de ajuste
de las observaciones y resume si la discrepancia entre las frecuencias observadas
y las esperadas es o no significativa; en cambio, la  2 de independencia se usa
para conocer la relación entre dos variables de una muestra, y para saber si los dos
factores están o no relacionados. La  2 usa variables nominales (categóricas) o
datos ordinales, en lugar de medias y varianzas. En cuanto a la bondad de ajuste
de la  2 , ésta parte de la suposición planteada en términos de que si se tira una
moneda al aire 100 veces, los resultados esperados son que 50 veces sea cara y
50 sello; si a un lado de esta suposición se obtienen 47 caras y 53 sellos, tal
divergencia ocurre porque ¿la moneda tiene un sesgo o es por casualidad? La
hipótesis nula para tal experimento plantea que las frecuencias observadas son
cercanas a las frecuencias esperadas. La hipótesis alterna es que las frecuencias
no sean próximas a lo esperado, así la fórmula:


 2   O  E 2 / E 
Donde O = frecuencia observada, E = Frecuencia esperada: en tal caso para el caras es:

2 
47  50 2  0.18 , y para sello:  2 
53  50 2  0.18 , por lo que la suma de
50 50
estas categorías es: 0.18 + 0.18 = 0.36.
1
El significado de la bondad de ajuste se conoce calculando los grados de libertad y
usando tabla de distribución de  2 : si la chi cuadrada calculada es mayor que el
de la tabla, se rechaza la hipótesis nula, concluyendo que las predicciones eran
incorrectas (en este experimento, los grados de libertad serían [2 - 1] = 1). El valor
crítico (por tabla) para una  2 para este ejemplo es α = 0.05, y v = 1 es 3.84, o sea

que es mayor de la  2 estimada 0.36, lo que no rechaza la hipótesis nula y, por lo


tanto, el sorteo fue justo.
Es pertinente mencionar que en la prueba de  2 aplicada a tablas de contingencia
de 2 x 2 no se calculan las frecuencias esperadas:

n ad  bc 
2
 
2

a  cb  d a  cc  d 


En general, cuando la frecuencia esperada es menor de dos en alguna de las
casillas, o éstas tienen un 20% o más de cifras menores a cinco, no se debe usar la
 2 , y en las tablas de 2 x 2 se recomienda hacer la llamada corrección de
continuidad (de Yates): que consiste en restar la mitad de las diferencias entre las
frecuencias observadas y las esperadas en el numerador de la  2 , antes de elevar

al cuadrado, por lo que el valor de la  2 disminuye. La prueba exacta de Fisher es,

en cierta forma, semejante a la  2 y se usa al analizar las tablas de contingencia


de dos filas y dos columnas, cuando los números en cualquier casilla de la tabla de
contingencia, son < 5

p
a  b ! c  d ! a  c !b  d !
a ! b! c ! d ! n!

Se hace la comparación de medias con la prueba de la suma de rangos de Wilcoxon,


la cual usa la magnitud de las diferencias entre las mediciones respecto a un
supuesto parámetro de ubicación; cabe agregar que esta prueba tiene los siguientes
supuestos:

1) que la muestra sea aleatoria;

2
2) que la variable sea continua;

3) que la población se distribuya de manera simétrica alrededor de la media, y

4) que la escala de medición sea al menos de intervalos; en esencia, esta prueba


revela si las medianas son diferentes.

La prueba de la mediana es para probar la hipótesis nula de que dos muestras


independientes fueron extraídas de poblaciones con medianas iguales.

Cuando se desea comparar dos grupos en los que se ha medido una variable
cuantitativa continua, cuya distribución no es semejante a la curva normal, o bien
cuando la variable en estudio es cuantitativa y discreta, la prueba U de Mann-
Whitney es una buena alternativa para comparar dos promedios independientes
usando la t de Student; esto con los siguientes supuestos:

1) que las dos muestras de tamaño, n y m, usadas para el análisis hayan sido
extraídas de manera independiente y en forma aleatoria, de sus respectivas
poblaciones;

2) que la escala de medición sea por lo menos ordinal;

3) que la variable de interés sea continua, y

4) si las poblaciones son diferentes, que éstas varíen solamente respecto de sus
medianas.

En la comparación de dos grupos pareados usando sus proporciones, cuando la


variable es nominal, la prueba indicada es la de McNemar, que se puede usar
cuando se comparan dos procedimientos para medir la misma característica o
cuando se contrastan las opiniones de dos expertos.

La comparación de tres o más distribuciones independientes usando la prueba de


Kruskal-Wallis se usa cuando la variable no tiene una distribución semejante a la
curva normal o es de tipo discreto. Esta prueba supone que hay un diseño con una
variable independiente o de índole cualitativa nominal con más de dos modalidades:
las que definen a los grupos por pertenecer a conjuntos diferentes y se denominan

3
grupos independientes. Las conclusiones con esta prueba se basan en la
comparación de un valor H calculado versus un valor H crítico, de acuerdo con si
los grupos son uno grande (n >5) y el otro pequeño (K = 3, 4 o 5 y n < 5).

La prueba de Cochran evalúa si tres o más conjuntos con frecuencias o


proporciones iguales difieren significativamente entre ellos. La igualación se
fundamenta en las características relevantes de los sujetos, o bien en el hecho de
que los mismos son usados en diferentes condiciones. Esta prueba es
particularmente aplicable a datos de tipo categórico (en escala nominal) o bien en
observaciones ordinales (o de intervalo) dicotómicas.

El análisis bilateral de la varianza por jerarquías de Friedman se usa siempre y


cuando los datos sean medidos al menos en una escala ordinal y puedan ordenarse
en una clasificación bilateral. Si se pretende saber si existe una relación entre dos
variables, se habla de una correlación, y ésta se calcula estimando su coeficiente
de correlación (r), la que puede ser positiva o negativa. Cabe mencionar que la
correlación positiva ocurre cuando las puntuaciones altas de una variable se asocian
con puntajes altos de la otra, en tanto que una correlación negativa es cuando las
puntuaciones altas de una variable están asociadas con puntuaciones bajas en el
otro extremo.

Es pertinente mencionar que el análisis de correlación se usa para cuantificar la


magnitud o fuerza de la relación entre variables dependientes (por ejemplo, el
número de admisiones) y las variables independientes (como el número de dosis de
medicamentos, la edad, visita al Servicio de Urgencias, etc.). Es pertinente
mencionar que el valor de r se encuentra siempre entre –1 y +1. Un valor r cerca de
+1 indica una relación lineal positiva fuerte, en comparación con un valor cercano a
1, lo que indica una fuerte relación lineal negativa. La hipótesis nula es, por ejemplo,
cuando no hay ninguna relación entre el número de admisiones y el número de dosis
de medicamentos, donde la correlación es de p < 0.05, indica que el valor nulo de
no relación es rechazado, aceptando la hipótesis alterna de que sí existe una
relación. Es conveniente mencionar que el coeficiente de correlación de Pearson
(paramétrico) se emplea si se puede asumir que dos variables continuas se

4
distribuyen normalmente; de lo contrario, se elige el coeficiente de correlación de
Spearman

La regresión lineal se usa para predecir los cambios en una variable independiente
(en caso de una regresión lineal simple) o varias (en caso de una regresión lineal
múltiple) que pueden afectar el valor de la variable dependiente. Para el análisis de
la regresión lineal es necesario considerar que la variable dependiente sea continua
y con tenga una distribución normal, en tanto que la relación entre una variable
dependiente e independiente es lineal, y si tal suposición no se cumple, los
resultados pueden ser incorrectos, mientras que para una variable independiente,
no es necesario que se distribuya normalmente; sin embargo, para el análisis de
correlación, ambas deben distribuirse de manera normal. En cuanto a la regresión
lineal, ésta se usa para expresar, en una ecuación, la relación que hay entre las
variables dependiente e independiente; de tal manera que si estamos interesados
en saber del número de visitas a un Servicio de Urgencias (variable independiente
conocida como variable x), con relación al número de admisiones al hospital
(variable dependiente conocida como variable y), el análisis de la regresión lineal
se usa para saber su ecuación. De esta forma se estima la ecuación de la línea
recta representada como y = a + bx, donde los coeficientes a y b son el intercepto
de la línea estimada en el eje, ya que y es la pendiente.

En lo que atañe a la regresión logística, ésta es una variante de la regresión lineal


que se usa para definir la relación que hay entre dos o más variables, cuando la
variable dependiente es dicotómica y las independientes son datos categóricos o
continuos; a este respecto, en el cuadro 2 se pueden ver las pruebas estadísticas
aplicadas según el tipo de variable. Es así como se puede concluir que cuando se
emplean variables cuantitativas continuas, la media aritmética y la desviación
estándar de las muestras con una distribución normal, se dice que existe
homogeneidad de varianzas, es decir, con varianzas similares, con un tamaño de
muestra suficiente (mayor a 30 casos); en tal caso se usan las pruebas estadísticas
paramétricas; pero cuando no se cumplen estos requisitos, si la distribución es

5
anormal y el tamaño de muestra es menor a 11 casos, lo que está indicado es
emplear pruebas no paramétricas o de libre distribución.

En el siguiente cuadro podemos ver los requisitos que se necesita en forma genérica
las pruebas estadísticas:

Cuadro 2: Flujo para elegir la prueba estadística adecuada.

6
USO DEL PAQUETE ESTADÍSTICO SPSS

INTRODUCCIÓN

Uso de un software estadístico: los métodos estadísticos tratados en el presente


trabajo para la elaboración de tesis de Titulación, son más fáciles de aplicar si se
utiliza un software para hacer los cálculos. Prácticamente en cualquier software
estadístico se incluyen los métodos aquí tratados. Por ejemplo, en el SPSS se
incluyen en los menús de Analizar que aparecen en la pantalla principal.
En particular, para hacer una estimación puntual y por intervalo, para cualquier
medida de posición y/o medida de dispersión, la secuencia a elegir es la siguiente:
Estadísticos descriptivos; entonces, se declara la variable a analizar, la cual fue
previamente capturada en una ventana vista de datos y después se pide en las
opciones aceptar y sale los resultados que se requiere. Así se podrá analizar los
datos que se tiene que procesar en el trabajo de Tesis de Titulación que lo haremos
en forma práctica en el laboratorio asignado para esta tarea. Primero daremos una
idea del procesamiento de los datos, luego nos centraremos en las pruebas no
paramétricas ya que las pruebas paramétricas son más sencillas de tratar con una
PC y un software estadístico en nuestro caso usaremos el SPSS y Excel de acuerdo
a las características de las variables y objetivo de nuestra investigación.
Procesamiento de datos
Es la forma de captura y almacenamiento de los datos para la recopilación,
tabulación y cálculo de la información obtenida con cualquiera de las herramientas
antes indicadas. El propósito es concentrar la información, tabular los datos y
concentrar sus resultados en cifras estadísticas, diagramas, tablas, gráficas,
cuadros representativos y demás elementos necesarios para hacer la interpretación
adecuada del fenómeno en estudio. Entre algunas formas de procesamiento de
estos datos encontramos las siguientes.
Método de tabulación manual
La forma más simple de recolectar, tabular y clasificar los datos obtenidos y el
método más sencillo de aplicar es el conteo de datos, aunque también existen otros
métodos manuales como la sumatoria y el promedio de resultados. Estos métodos

7
son más lentos y poco confiables, pero también son el medio más común de
concentrar los datos.
Método de tabulación manual mecánica
Implica la utilización de calculadoras, sumadoras y cualquier instrumento mecánico,
con el cual se hace la concentración de datos apoyándose en las operaciones
aritméticas y los cálculos que se registran en estos instrumentos.
Método de tabulación automatizado
En este caso la recopilación de datos se hace utilizando equipos electrónicos de
cálculo o de cómputo como es el SPSS, Excel y otros. Con el apoyo de éstos, se
hace una concentración más rápida de resultados a través de la tabulación y
clasificación de información. Los resultados se presentan así en forma más
confiable, con mayor profundidad y en un menor tiempo.
Método de tabulación estadística
Utilizando las técnicas estadísticas, matemáticas y de cálculo que se aplican en la
recolección, tabulación y clasificación de la información recopilada, se pretende
profundizar en los resultados, hacer proyecciones de los datos y mejorar los cálculos
e interpretaciones de los mismos.
La utilización de estas técnicas es independiente de las técnicas anteriores; más
bien las complementan.
Método de tabulación computacional
En los modernos sistemas de computación es posible efectuar no sólo la
recopilación, la tabulación y el análisis de datos, sino que, además, se ha agregado
una serie de sistemas que ayudan a la elaboración de instrumentos de recopilación,
concentración y presentación de resultados en gráficas, cuadros e incluso
documentos que resumen la información obtenida.
En Internet existen servicios de captura, recopilación y concentración de resultados,
además de muchas páginas de información al respecto.
Métodos de análisis
Se trata de la elección del método o los métodos de análisis que serán aplicados
durante el desarrollo de la investigación. Por ahora, sólo vamos a indicar los
nombres de aquellos métodos más utilizados.

8
 Método analítico sintético.
 Método inductivo deductivo.
 Método objetivo subjetivo.
 Método cuantitativo cualitativo.
 Método estadístico-dinámico.
 Método empírico pragmático.
 Método hipotético deductivo.
Análisis de datos
Se refiere a la forma de utilizar la estadística para poder interpretar los datos
obtenidos.
Propiamente, es la agrupación de datos en rangos significativos que se concentran
conforme a una adecuada selección para dar una interpretación útil al investigador.
Al respecto, existen varias formas de utilizar la estadística; sin embargo, para los
efectos de este proceso general de investigación sólo se consideran cuatro casos:
estadística descriptiva, estadística probabilística, estadística multidimensional y
proyecciones.
Estadística descriptiva
Es aquella rama de la estadística donde se interpretan fielmente los datos, ya sea
que se presenten en gráficas, cuadros, resúmenes, etcétera. Aquí, los datos sólo
se utilizan sin admitir que se modifique ninguno de ellos, esto es, se utilizan tal y
como se obtuvieron en la realidad.
Estadística probabilística
Es aquella técnica estadística que analiza el comportamiento probabilístico de los
resultados obtenidos en la recopilación de datos, con la finalidad de proyectar y
encontrar, mediante estimaciones estadísticas, las relaciones entre esos datos y los
grados de probabilidad, incertidumbre o certeza en el manejo de la información.
Esto nos permite inferir a partir de los datos algún comportamiento o tendencia útil
para la investigación.
Estadística multidimensional
Es una clasificación de carácter informal que se hace de la estadística aplicada a
los modernos métodos de análisis y de cálculo, la cual se complementa con la

9
conjugación estadística de variables significativas para el investigador. Con la
aplicación de estos métodos estadísticos se busca interpretar un comportamiento
del fenómeno observado mediante la conjugación de diversos factores, ya sean
estadísticos, matemáticos o proyectivos.
Proyecciones
Gracias al excelente apoyo de los sistemas de cómputo para la recopilación y el
análisis de los datos, es posible efectuar proyecciones, detectar tendencias y hacer
representaciones a futuro de la información obtenida. El objetivo de estas
proyecciones es analizar y predecir el posible comportamiento de los datos. Por lo
general, los programas para hacer proyecciones se conocen como simuladores y
su costo de utilización es muy alto. Por ejemplo, el laboratorio de Simulación que
tiene la facultad de Ingeniería de la URP.
Cabe indicar que las técnicas de análisis de datos antes mencionadas sólo son de
carácter ilustrativo y la única intención de presentarlas es poder vislumbrar sus
posibles aplicaciones. Por esa razón, se recomienda que el investigador recurra a
libros especializados sobre el tema, con la finalidad de hacer más acertado el
análisis de los datos, de acuerdo con la profundidad, confiabilidad y exigencia del
tema de investigación.

Valoración de los datos estadísticos de carácter cuantitativo. Sus


características son:
1. Determinar el nivel de medida de la variable de interés.
2. Valorar la distribución de las variables.
 Medidas de tendencia central para cada variable.
 Sesgo y curtosis para cada variable.
 Valoración visual de la distribución de los datos.
 Examinar los diagramas de las probabilidades de la distribución.
 Si se considera necesario transformar las variables.
 Ver los resultados de la transformación.
3. Ver la homogeneidad de las varianzas.
4. Ver el tamaño de muestra total y de los subgrupos.

10
5. Determinar qué prueba estadística paramétrica o no paramétrica es la más
adecuada.
Cuando se pretende probar una hipótesis respecto a uno o más parámetros de una
población que tiende a una distribución normal, las pruebas usadas son las de la
estadística paramétrica, como la t de Student.
Por lo contrario, si los procedimientos estadísticos no requieren plantear inferencias
acerca de los parámetros de la población (su media y dispersión) se le conoce como
no paramétricos, o de distribución libre (ya que no se hacen suposiciones acerca de
la distribución de la población de donde procede la muestra.

Características comunes de las pruebas paramétricas.


a. Independencia de las observaciones a excepción de datos pareados.
b. Las observaciones para la variable dependiente se han obtenido de manera
aleatoria de una población con distribución normal.
c. La variable dependiente es medida al menos en una escala de intervalo.
d. Se recomienda un tamaño de muestra mínimo de 30 sujetos por grupo.
e. Los datos son obtenidos de poblaciones que tienen varianzas iguales (una
varianza no debe ser el doble o mayor que la otra).
f. Habitualmente las hipótesis se hacen sobre valores numéricos,
especialmente el promedio de una población µ, como ejemplo:
H 0 : 1  2
H1 : 1  2
g. Otros posibles requisitos: variable independiente nominal o de intervalo,
homocedasticidad (para cada nivel de la variable independiente hay una
variación similar de la variable dependiente) y casillas de igual tamaño.
Pruebas No Paramétricas
Con las pruebas no paramétricas se puede trabajar con muestras pequeñas de
datos categóricos u ordinales, independientemente de la distribución de las
muestras que se desea contrastar. Moses considera que las pruebas no
paramétricas:
1) Son más fáciles de aplicar;

11
2) Son aplicables a los datos jerarquizados;
3) Se pueden usar cuando dos series de observaciones provienen de
distintas poblaciones;
4) Son la única alternativa cuando el tamaño de muestra es pequeño; y,
5) Son útiles a un nivel de significancia previamente especificado.
En términos generales, se puede considerar que, aunque la potencia de las pruebas
estadísticas paramétricas es mayor que la que ofrecen las pruebas no paramétricas,
ya que con ellas es la probabilidad de rechazar la hipótesis nula cuando ésta
realmente es falsa (error de tipo II: 1-α), es conveniente comentar que el adecuado
tamaño de muestra es un requisito indispensable para aumentar la eficacia de una
prueba: a medida que aumenta el tamaño de muestra, disminuye la posibilidad de
cometer el error de tipo II.
Características comunes de las pruebas no paramétricas.
a. Independencia de las observaciones aleatorias a excepción de datos pareados.
b. Pocas asunciones con respecto a la distribución de la población.
c. La variable dependiente es medida en escala categórica.
d. El punto primario es el ordenamiento por rangos o por frecuencias.
e. Las hipótesis se hacen sobre rangos, mediana o frecuencias de los datos.
f. El tamaño de muestra requerido es menor (30 o menores).

Pruebas paramétricas y su alternativa no paramétrica

Tipo de Prueba Prueba


problema paramétrica no paramétrica
Medidas repetidas Prueba del signo
Medidas repetidas 2
periodos “t” pareada Wilcoxon
Más de 2 periodos
Muestras
Independientes ANOVA Friedman
Muestras
independientes 2 “t” de Studen Prueba de la mediana -
grupos independiente U de Mann-Whitney
Muestras ANOVA
independientes más de Prueba de la mediana -
de 2 grupos una vía Kruskal-Wallis
Medidas de rho de Speasrman - tau
asociación r de Pearson de Kendall

12
Características de las pruebas no paramétricas.
Ventajas
a. Determinación sencilla. Mediante fórmulas simples de combinación.
b. Fáciles de aplicar. Las operaciones matemáticas son la jerarquización,
conteo, suma y resta.
c. Rápidas de aplicar. Cuando las muestras son pequeñas.
d. Campos de aplicación. A grupos mayores de poblaciones.
e. Menos susceptibles a la contravención de los supuestos. Ya que los
supuestos son escasos y menos complicados.
f. Tipo de medición requerida. Se pueden utilizar con datos ordinales o
nominales.
g. Tamaño de la muestra. Cuando la muestra es menor a 10 son sencillas,
rápidas y sólo un poco menos eficaces. Conforme aumenta el tamaño de la
muestra se hacen más laboriosas y tardadas, y menos efectivas. Pero con
una PC y el software adecuado nos facilita su ejecución.
h. Efectividad estadística. Cuando se satisfacen los supuestos de la prueba no
paramétrica son igual de efectivas. Si se satisfacen los supuestos de una
prueba paramétrica con muestras pequeñas son un poco menos efectivas y
se vuelven menos eficaces a medida que aumenta el tamaño de muestra.
Desventajas
a. Si se puede utilizar una prueba paramétrica y se usa una no paramétrica hay
una pérdida de información.
b. En muestras grandes las pruebas no paramétricas son muy laboriosas. Con
una PC y el software adecuado nos facilita su ejecución.

Técnicas No Paramétricas según Tipo de escala de Medición: Se pueden agrupar así:

Nivel de Medida Nominal Ordinal


Binomial Kolmogovov-Smirnov
Una muestra Chi Cuadrado Rachas
Dos muestras relacionadas McNemar Signos-Wicolxon
Mediana
Dos muestras Ficher U de Mann-Whitney
independientes Chi Cuadrado Kolmogovov-Smirnov
K muestras relacionadas Q de Cochran Friedman
K muestras independientes Chi Cuadrado Kruskal-Wallis

13
PRUEBAS DE NORMALIDAD
Para evaluar la normalidad de un conjunto de datos tenemos el Test de
Kolmogorov-Smirnov y el test de Shapiro-Wilks
Ejemplo: Aquí se tiene una distribución de datos de 187 Hombres y 197 Mujeres:

Las pruebas analíticas del SPSS de que dispone esta opción son: Kolmogorov-
Smirnov con la modificación de Lillierfors y la prueba de Shapiro-Wilks. Esta última
la realiza el SPSS si el tamaño muestral es inferior a 30, es decir, da por defecto las
dos pruebas; mientras que si el nº de individuos es superior a 30, sólo da como
resultado la de Kolmogorov-Smirnov.
La prueba de Kolmogorov-Smirnov con la modificación de Lillierfors es la más
utilizada y se considera uno de los test más potentes para muestra mayores de 30
casos. En este test la Hipótesis nula
Ho: es que el conjunto de datos siguen una distribución normal. Y la
Hipótesis Alternativa H1: es que no sigue una distribución normal.
Este test se basa en evaluar un estadístico:
Dn = ⎟Fn (x) – F(x)⎟
Fn (x): es la distribución empírica
F (x): s la distribución teórica, que en este caso es la normal
Si el valor del estadístico supera un determinado valor, que depende del nivel de
significación con el que uno quiera rechazar la hipótesis nula, diremos que esa
colección de datos no se distribuye según una distribución normal. Lillierfors tabuló

14
este estadístico para el caso más habitual en el que desconocemos la media y la
varianza poblacional y las estimamos a partir de los datos muestrales. El SPSS ya
utiliza esta prueba modificada.
La prueba de Shapiro-Wilks se basa en estudiar el ajuste de los datos graficados
sobre un gráfico probabilístico en el que cada dato es un punto cuyo valor de abscisa
el valor observado de probabilidad para un valor determinado de la variable, y el de
ordenada el valor esperado de probabilidad.
En este test la Hipótesis nula Ho: El conjunto de datos siguen una distribución
normal. Y la
Hipótesis Alternativa H1: es que no sigue una distribución normal.
El estadístico W de Shapiro-Wilks mide la fuerza del ajuste con una recta. Cuanto
mayor sea este estadístico mayor desacuerdo habrá con la recta de normalidad, por
lo que podremos rechazar la hipótesis nula. La prueba de Shapiro-Wilks está
considerada como la prueba más potente para muestra inferiores a 30 casos.
Para ejecutar: se debe ir a: analizar – estadísticos descriptivos - Explorar

15
Luego sale esta ventana:

Se coloca: la frecuencia en la ventana Lista de dependientes y el género en Lista de factores y se marca


gráficos

Se marca: Gráficos de normalidad con pruebas

Se marca continuar y luego Aceptar en el cuadro anterior.

Podemos observar que los datos son más de 30. Por esta razón usaremos la prueba de Normalidad de
Kolmogovov-Smirnov

16
Aquí el p-valor que arroja el SPSS es 0.000 en ambos casos Hombres y Mujeres es
menor a 0.05. Por lo tanto, la distribución de los datos tanto de Hombres como de
Mujeres tienen una Distribución Normal.

Prueba de Kruskal-Wallis
Concepto clave En esta sección se describe la prueba de Kruskal-Wallis, que utiliza
rangos de datos de tres o más muestras independientes para probar la hipótesis
nula de que las muestras provienen de poblaciones con medianas iguales.
Cuando utilizamos el análisis de varianza de un factor (ANOVA) para probar la
hipótesis nula de que tres o más poblaciones tienen la misma media, pero el ANOVA
requiere que todas las poblaciones implicadas tengan distribuciones normales.
La prueba de Kruskal-Wallis no requiere distribuciones normales
Definición
La prueba de Kruskal-Wallis (también llamada la prueba H) es una prueba no
paramétrica que utiliza rangos de datos muestrales de tres o más poblaciones
independientes. Se utiliza para probar la hipótesis nula de que las muestras
independientes provienen de poblaciones con medianas iguales; la hipótesis
alternativa es la aseveración de que las poblaciones tienen medianas que no son
iguales.
H0: Las muestras provienen de poblaciones con medianas iguales.
H1: Las muestras provienen de poblaciones con medianas que no son iguales.

Para aplicar la prueba de Kruskal-Wallis, calculamos el estadístico de prueba H, el


cual tiene una distribución que puede aproximarse por medio la distribución Chi
cuadrada, siempre y cuando cada muestra tenga al menos cinco observaciones.
Cuando utilizamos la distribución Chi cuadrada en este contexto, el número de
grados de libertad es k - 1, donde k es el número de muestras.

17
Prueba de Kruskal-Wallis
Requisitos
1. Tenemos al menos tres muestras independientes, las cuales se seleccionan al
azar.
2. Cada muestra tiene al menos cinco observaciones.
3. No existe el requisito de que las poblaciones tengan una distribución normal o
alguna otra distribución particular

Notación
N : número total de observaciones en todas las muestras combinadas
k : número de muestras
R1 : suma de los rangos de la muestra 1, que se calcula utilizando el
procedimiento
que se describe a continuación
n1 : número de observaciones de la muestra 1
Para la muestra 2, la suma de los rangos es R2 y el número de observaciones es
n2, y
se utiliza una notación similar para las otras muestras.

Estadístico de prueba
 R12 R2 2 Rk 
2

  3 N  1
12
H     
N N  1  n1 n2 nk 
Valores críticos
1. La prueba es de cola derecha.
2. gl : k - 1. (Puesto que el estadístico de prueba H puede aproximarse por medio
de una distribución Chi cuadrada, utilice tabla con k - 1 grados de libertad,
donde k es el número de muestras diferentes).

Procedimiento para calcular el valor del estadístico de prueba H


1. Combine temporalmente todas las muestras en una muestra grande y asigne un
rango a cada valor muestral. (Ordene los valores del menor al mayor, y en caso de
empates, asigne a cada observación la media de los rangos implicados).
2. En cada muestra, calcule la suma de los rangos y calcule el tamaño muestral.

18
3. Calcule H utilizando los resultados del paso 2, con la notación y el estadístico
de prueba descritos en el recuadro anterior.
El estadístico de prueba H es básicamente una medida de la varianza de las
sumas de rangos
R1, R2, . . . , Rk. Si los rangos están distribuidos de forma equitativa entre los
grupos muestrales, entonces H debe ser un número relativamente pequeño.
Si las muestras son muy diferentes, entonces los rangos serán excesivamente
bajos en algunos grupos y altos en otros, con el efecto neto de que H será grande.
En consecuencia, sólo los valores grandes de H nos llevan al rechazo de la
hipótesis nula de que las muestras provienen de poblaciones idénticas. La prueba
de Kruskal-Wallis es, por lo tanto, una prueba de cola derecha.
Ejemplo 1. ¿La energía solar es la misma todos los días? Un estudiante vive
en una casa con sistema eléctrico solar. A la misma hora de cada día, reúne
lecturas de voltaje con un medidor conectado al sistema y los resultados se listan
en la tabla al margen. Utilice un nivel de significancia de 0.05 y pruebe la
aseveración de que las lecturas de voltaje tienen la misma mediana para los tres
diferentes tipos de día. Podríamos esperar que un sistema solar proporcione más
energía eléctrica en días soleados que en días nublados o lluviosos. ¿Podemos
concluir que los días soleados dan como resultado mayores cantidades de energía
eléctrica? Los datos son:
Soleado Nublado Lluvioso
13,5 12,7 12,1
13 12,5 12,2
13,2 12,6 12,3
13,9 12,7 11,9
13,8 13 11,6
14 13 12,2
Solución:

Se cumplen todos los requisitos para usar Prueba de Kruskal-Wallis


Hipótesis:
H0: Las lecturas de las muestras de voltaje del medidor de energía eléctrica solar
en días soleados, Nublados y lluviosos tienen medianas iguales.

19
H1: Las lecturas de las muestras de voltaje del medidor de energía eléctrica solar
en días soleados, Nublados y lluviosos sus medianas no son iguales.

Usamos el SPSS. Primero introducimos los datos luego: Vamos a Analizar-


Pruebas no paramétricas – cuadro de dialogo antiguos – k-muestras
independientes

Luego sale la ventana:

Aquí pasamos: El Voltaje a Lista de Variables de prueba y El estado del tiempo a


variable de agrupación. Luego definimos cuantas variables independientes son (en
nuestro caso son tres el mínimo será 1 y el máximo será 3). Se pone Continuar y
luego Aceptar.

20
Luego nos sale el resultado de la prueba Kruskal Wallis

Prueba de Kruskal-Wallis

Podemos observar que los días soleados dan como resultado mayores cantidades de
energía.
Estadísticos de
pruebaa,b
Voltaje
Chi-cuadrado 14,840
gl 2
Sig. asintótica 0,001
a. Prueba de Kruskal Wallis
b. Variable de agrupación:
Estado_Tiempo

Resultados:
El estadístico de la prueba: H = 14,840
El valor crítico:  2, 0.95 5.99 . En la Chi cuadrado. Sale de la tabla Chi Cuadrada. El sub
2

índice 2 es de que se tiene 3 variables se le resta 1, y el 0.95 es con un 95% de confianza)

21
El p-valor que nos arroja el SPSS es 0.001 que es menor que 0.05. Por lo tanto, existe
evidencia suficiente para justificar el rechazo de la aseveración de que los grupos tienen las
mismas medianas de las lecturas de voltaje son iguales en los tres tipos de días diferentes.
(Se acepta la hipótesis alterna H1)

Ejemplo 2. Ejercicio y estrés. Se realizó un estudio para investigar los efectos del
ejercicio sobre el estrés. La siguiente tabla es la lista de lecturas de presión
sanguínea sistólica (en mmHg) de sujetos, antes de iniciar 25 minutos de ejercicio
aeróbico en bicicleta y antes de generarles estrés por medio de una prueba de
aritmética y otra de expresión verbal. Utilice un nivel de significancia de 0.05 para
probar la aseveración de que los diferentes grupos de sujetos tienen la misma
mediana de la presión sanguínea. Con base en los resultados, ¿se puede
considerar que los grupos son muestras de la misma población?

Mujer Hombre Mujer Hombre


Limeña Limeño Provinciana Provinciano
117 115,67 119,67 124,33
130,67 120,67 106 111
102,67 133 108,33 99,67
93,67 120,33 107,33 128,33
96,33 124,67 117 102
92 118,33 113,33 127,33
Solución: Se cumplen todos los requisitos para usar Prueba de Kruskal-Wallis
Hipótesis:
H0: Las lecturas de presión sanguínea sistólica de hombres y mujeres Limeños y de
hombres y mujeres Provincianos para ver los efectos del ejercicio sobre el estrés
tienen medianas iguales.
H1: Las lecturas de presión sanguínea sistólica de hombres y mujeres Limeños y de
hombres y mujeres Provincianos para ver los efectos del ejercicio sobre el estrés
sus medianas no son iguales.
Usamos el SPSS. Primero introducimos los datos luego: Vamos a Analizar- Pruebas
no paramétricas – cuadro de dialogo antiguos – k-muestras independientes

22
Aceptamos y luego se tiene:

Prueba de Kruskal-Wallis

Se puede observar que el hombre Limeño tiene mayor presión sanguínea.

23
Resultados: El estadístico de la prueba: H = 6.034
El valor crítico:  2, 0.95 7.81 (sale de la tabla) . En la Chi cuadrado. El sub índice 3
2

es de que se tiene 4 variables se le resta 1, y el 0.95 es con un 95% de confianza)


El p-valor que nos arroja el SPSS es 0.110 que es mayor que 0.05. Por lo tanto,
no existe evidencia suficiente para justificar el rechazo de que los diferentes
grupos tienen misma presión sanguínea mediana. (No se rechaza la hipótesis nula
H0). Se puede considerar que los grupos son de la misma población.
Ejercicios: 1. Prueba de laboratorio de inflamabilidad de ropa de dormir para
niños. Se realizaron pruebas de inflamabilidad en ropa de dormir para niños. Se
utilizó la prueba Vertical Semirestrained, en la cual se quemaron piezas de tela en
condiciones controladas.
Después de apagar el fuego, se midió y registró la longitud de la porción quemada.
Al margen se presentan los resultados para la misma tela probada en laboratorios
diferentes. Puesto que se utilizó la misma tela, los diferentes laboratorios deberían
haber obtenido los mismos resultados. ¿Fue así?
Laboratorio
1 2 3 4 5
2,9 2,7 3,3 3,3 4,1
3,1 3,4 3,3 3,2 4,1
3,1 3,6 3,5 3,4 3,7
3,7 3,2 3,5 2,7 4,2
3,1 4,0 2,8 2,7 3,1
4,2 4,1 2,8 3,3 3,5
3,7 3,8 3,2 2,9 2,8
3,9 3,8 2,8 3,2
3,1 4,3 3,8 2,9
3,0 3,4 3,5
2,9 3,3

24
2. ¿Afecta el peso de un automóvil las heridas en la cabeza producidas en un
choque?
Se obtuvieron datos de experimentos de choques realizados por el departamento
de Seguridad Vial. Se compraron automóviles nuevos, se impactaron contra una
barrera fija a 35 mi/h y se registraron las mediciones en un maniquí en el asiento
del conductor. Utilice los datos muestrales listados abajo para probar las diferencias
en las mediciones de heridas en la cabeza (de acuerdo con el Head Injury Criterion,
HIC) en cuatro categorías de peso. ¿Existe evidencia suficiente para concluir que
las mediciones de heridas en la cabeza para las cuatro categorías de peso de
automóviles no son las mismas? ¿Sugieren los datos que los automóviles más
pesados son más seguros en un choque?
Subcompacto: 681 428 917 898 420
Compacto: 643 655 442 514 525
Mediano: 469 727 525 454 259

Grande: 384 656 602 687 360

3. ¿Afecta el peso de un automóvil las heridas en el pecho producidas en un


choque?
Se obtuvieron datos de experimentos de choques realizados por el departamento
de Seguridad Vial. Se compraron automóviles nuevos y se impactaron contra una
barrera fija a 35 mi/h; abajo se presentan los datos de desaceleración del pecho (g).
Utilice los datos para probar la hipótesis nula de que las diferentes categorías
de peso tienen medianas que no son iguales. ¿Sugieren los datos que los
automóviles más pesados son más seguros en un choque?
Subcompacto: 55 47 59 49 42
Compacto: 57 57 46 54 51
Mediano: 45 53 49 51 46
Grande: 44 45 39 58 44

Prueba de rangos para 2 muestras (Mann-Whitney)


El procedimiento no parámetrico es propuesto para la prueba entre la “dispersión”
o “variabilidad” de 2 poblaciones. Esta prueba es aplicable para comparar 2
variables continuas independientes. Las dos muestras pueden tener dos tamaños

25
diferentes. Es la prueba no paramétrica considerada más potente para comparar 2
variables continuas independientes. La prueba no parámetrica es análoga a la
prueba de “t” de 2 muestras, cuando no se dan todas las condiciones exigidas para
aplicar la “t” de student. Originalmente el método fue propuesto por Wilcoxon (1945)
y después aplicado por Mann y Whitney (1947). La prueba Mann-Whitney como
muchos otros procedimientos no parámetricos se usa para los datos arreglados en
rangos. En este caso los datos se deben organizar en rangos de mayor a menor
marcando 1 para datos mayor hasta n para datos menores o viceversa, donde N
(tamaño total) = n1 + n2. La prueba de hipótesis está basada sobre la significancia

del estadístico (Uc) Mann-Whitney:

n1 n1  1
U c  n1 n2  R1 , si R1 < R2
2
Donde, U c es el valor tabulado n1  n2  , donde n1 , n2 son las observaciones en las

muestras 1 y 2 , R1 es la suma de los rangos de observaciones de la muestra 1.

n2 n2  1
U   n1 n2   R2 , si R1 > R2
2
R2 es la sumatoria de rangos de observaciones en la muestra 2, por lo tanto,

si U' > U en tabla correspondiente al modelo, se rechaza la hipótesis nula.


En resumen, se puede notar que después de ordenar los datos en rango de 2
muestras se calcula U ó U'. Cuando se necesita calcular ambos rangos, se usa:
N  N  1
R1  R 2 
2 .

Las hipótesis se plantean de la siguiente forma:


Ho: es que no hay diferencias y la
H1: es que si hay diferencias
Ejemplo: En un salón de clases hay 12 estudiantes 7 varones y 5 mujeres.
Verificar la hipótesis nula en la cual no hay diferencia entre las estaturas de
estudiantes de ambos sexos
Estatura
Hombres 193 188 185 183 180 178 170
Mujeres 175 173 168 165 163

26
Solución: Hipótesis
Ho: Las estaturas de estudiantes masculinos y femeninos son iguales.
H1: Las estaturas de estudiantes masculinos y femeninos no son iguales.
Nivel de significación : 0.05

Prueba de Mann-Whitney

Aquí observamos que mejor estatura tienen los varones.


Estadísticos de pruebaa
Datos
U de Mann-Whitney 2,000
W de Wilcoxon 17,000
Z -2,517
Sig. asintótica (bilateral) 0,012
Significación exacta [2*(sig. 0,010b
unilateral)]
a. Variable de agrupación: Estatura
b. No corregido para empates.

27
El p- valor es 0.012 menor que 0.05. Por lo que se acepta la hipótesis alterna H1
“Las estaturas de estudiantes masculinos y femeninos no son iguales”.

Ejercicio 1 Los siguientes datos muestran horas anuales perdidas por enfermedad
de los 24 hombres y mujeres de la Minera Antamina. Al nivel de significancia de
0.05, ¿existe alguna diferencia atribuible al
sexo? Utilice la prueba U de Mann-Whitney.
Hombres 31 44 25 30 70 63 54 42 36 22 25 50
Mujeres 38 34 33 47 58 83 18 36 41 37 24 48

Ejemplo 2 Veinte vendedores del Súper mercado Metro recibieron capacitación en


ventas durante el año pasado. Algunos fueron enviados a un programa nacional
conducido por maestros en ventas. Los otros se capacitaron en las oficinas de la
compañía con el gerente de ventas. Se dan los porcentajes de las cuotas
de ventas logrados por ambos grupos durante el último año. El señor Silva,
presidente, cree que los antecedentes, las aptitudes de ventas y la motivación de
ambos grupos son comparables. Al nivel
de significancia de 0.05, ¿ha resultado mejor alguno de los dos métodos de
capacitación? Use la prueba
U de Mann-Whitney.

Porcentaje de las cuotas logrado


Maestros en ventas 90 95 105 110 100 75 80 90 105 120
Compañía 80 90 100 120 95 95 90 100 95 105

K muestras independientes: Prueba de la mediana


La prueba de la mediana determina si K grupos independientes (no
necesariamente de igual tamaño) han sido tomados de la misma población o de
poblaciones con medianas iguales. Es útil cuando la variable en estudio ha sido
medida por lo menos en una escala ordinal. Es una prueba más general que la de
Kruskal-Wallis, aunque no tan potente.
El test se basa en que, si las dos medianas son iguales, la proporción de casos de
cada muestra que son mayores o menores que la mediana global serán iguales.
Pero, por el contrario, si ambas medianas son diferentes, la proporción de casos
por encima o por debajo de la mediana global serán significativamente diferentes
28
en ambas muestras. Es decir, realiza tablas de contingencia al categorizar la
variable continua en dos categorías según el valor de la mediana.
Suposiciones:
1. Las dos muestras deben ser extraídas aleatoria o independientemente de sus
respectivas poblaciones.
2. La escala de medición de la variable de respuesta debe ser al menos ordinal.
Hipótesis:
Ho: Las medianas de las poblaciones son iguales, por lo que los tratamientos

experimentales tienen el mismo efecto. Lo que normalmente se expresa como: Ho:

M1=M2=M3=M4..........Mk

Ha: Las medianas de las poblaciones difieren significativamente, por lo que los

tratamientos tienen efectos diferentes. Ha: M1≠M2≠M3≠......... Mk

También puede ser:


Ha: Es que al menos una es diferente.

Para probar la hipótesis de nulidad de que las K muestras proceden de la


misma población con respecto a las medianas, calculamos el valor de  2 con la
fórmula:

  
2
r k O
ij  Ei j 
2

i 1 j 1 Ei j
Donde Oij = número observado de casos clasificados en la hilera i de la columna j.
Eij = número de casos esperados conforme a Ho para ser clasificados en la hilera i de la
Regla de decisión. La hipótesis nula (Ho) se rechazará si  2 c   2 , (r-1, α ) donde r

es el número de poblaciones o reglones en una tabla de contingencia de r × 2.


donde r es el número de poblaciones o renglones de una tabla de contingencia de
r x 2.
Ejemplo. Se realizó un experimento con cuatro variedades de maíz, con el fin de
determinar si existen diferencias significativas en cuanto a su rendimiento. Las
cuatro variedades fueron asignadas aleatoriamente a 34 parcelas experimentales
ubicadas en la misma localidad. El rendimiento en Kg fue registrado para cada una
de las 34 parcelas, obteniéndose los siguientes resultados (Tabla ).

29
Variedades Rendimiento
V1 83 91 94 89 89 96 92 90 91
V2 91 90 81 83 83 84 88 91 89 84
V3 101 100 91 93 96 95 94
V4 78 82 81 77 79 81 80 81

Hipótesis:
H :M =M =M =M las medianas de rendimiento son iguales entre las cuatro variedades.
o 1 2 3 4:
Ha : M1≠M2≠M3≠M4 al menos un par de medianas es diferente.
Procedimiento:

El cálculo del estadístico (con papel y lápiz y calculadora) de prueba se presenta a


continuación:
1° Se ordenan las 34 observaciones en orden creciente de magnitud, sin perder de
vista que la población pertenece cada observación.
2° Se calcula la mediana (Me) del conjunto de observaciones ya ordenadas en el
inciso 1. De esta manera la mediana resulta ser = 89
3° Se clasifican las 34 observaciones de acuerdo a la siguiente tabla de
contingencia de 4x2 (r X c).
Variedades Observaciones < 89 Observaciones >89 Total:fila
V1 3 (4.7) 6 (4.2) 9
V2 7 (5.2) 3 (4.7) 10
V3 0 (3.7) 7 (3.2)) 7
V4 8 (4.2) 0 (3.7 8
Total: Columna 18 16 34
El cálculo del estadístico de prueba se presenta a continuación:

2 
3  4.7 2  6  4.22    0  3.7 2  17.97
4 .7 4 .2 3. 7
De la tabla se obtiene con g.l. = 4-1=3 y alfa α= 0.05,  2  7.82
Conclusión: Se rechaza la Ha, la mediana de rendimiento es diferente, al menos en dos variedades

Usando el SPSS:

30
Prueba de la mediana

Frecuencias
Variedades
Variedad 1 Variedad 2 Variedad 3 Variedad 4
Rendimiento > Mediana 6 3 7 0
<= Mediana 3 7 0 8

31
Estadísticos de pruebaa
Rendimiento
N 34
Mediana 89,0000
Chi-cuadrado 17,543b
gl 3
Sig. 0,001
asintótica
a. Variable de agrupación: Variedades
b. 7 casillas (87,5%) han esperado
frecuencias menores que 5. La frecuencia
mínima de casilla esperada es 3,3.

Como el p-valor es 0.001 es menor que 0.05 se rechaza la hipótesis nula y al menos
una de las medinas es diferente.
Ejemplo 2. Se tomó una prueba sobre aprendizaje y estrés idéntica a dos grupos
de estudiantes de Medicina de dos universidades distintas. Las puntuaciones
obtenidas por cada grupo están representadas en la siguiente tabla:
Grupo1 54 65 66 71 73 78 78 80 82 87 92 93 95
Grupo2 51 53 54 61 64 66 67 69 71 74 76 80 81 85 89 90 94
¿Qué conclusión se puede obtener del examen aplicado a los dos grupos? Use α = 0.05
Solución:
Hipótesis:
H :M (x ) = M (x ). Las medianas de los puntajes de la prueba sobre aprendizaje y estrés de
o E 1 E 2
ambos grupos de estudiantes de Medicina son iguales.
Ha : M (x ) ≠ M (x ). Las medianas de los puntajes de la prueba sobre aprendizaje y estrés de
E 1 E 2
ambos grupos de estudiantes de Medicina no son iguales.
Colocamos los datos en el SPSS

32
Luego nos dará el SPSS el siguiente resultado. La Mediana total de los dos grupos es: 75

Grupo 1 Grupo 2 Total


Encima de la mediana 8 (6.5) 7 (8.5) 15
Debajo de la mediana 5 (6.5) 10 (8.5) 15
13 17 30
El cálculo del estadístico de prueba se presenta a continuación:

M 2

8  6.5 7  8.5 5  6.5 10  8.5
2

2

2

2
 1.22171946
E
6.5 8 .5 6.5 8 .5
Luego el Estadístico de la prueba es: 1.22171946
De la tabla se obtiene con g.l. = 2-1=1 y alfa α= 0.05, el valor critico es:  2  3.84
Conclusión:
Como: M E
2
 1.222   Crit  3.84 , se tiene que no se rechaza la hipótesis nula. Podemos
2

concluir que las muestras provienen de dos poblaciones con medianas iguales.

Ahora con el SPSS

33
Como el p-valor es 0.462 es menor que 0.05 no se rechaza la hipótesis nula, podemos
concluir que las muestras provienen de dos poblaciones con medianas iguales. Esto
corrobora lo anterior.
Ejercicios:

1. ¿Existe diferencia entre el nivel de salud mental de los estudiantes de educación secundaria en unm
área rural y un área urbana?

Urbana 35 26 27 21 27 38 23 25 25 27 45 46 33 26 46 41
Rural 29 50 43 22 42 47 42 32 50 37 34 31

2. Se ha tomado un examen idéntico a dos grupos de estudiantes de Psicología de universidades


distintas. Los puntajes obtenidos son los siguientes:

Grupo1 52 66 61 71 73 78 78 80 82 87 98 96 91
Grupo2 55 50 53 61 64 66 67 69 71 72 76 80 83 85 85 90 94
¿Qué conclusión se puede obtener del examen aplicado a los dos grupos? Use α = 0.05
Solución:
3. Unos investigadores están interesados en saber si cuatro enfermedades provocan por término medio
el mismo grado de ansiedad. Para ello se toman cuatro muestras de 6, 7, 5 y 4 personas, pasándoles a
cada una de ellas un test que mide el grado de ansiedad del individuo en una escala de 0 a 10.

Enfermedad Grado de ansiedad


1 4 3 7 8 6 4
2 5 2 4 7 8 2 4
3 4 6 7 9 7
4 5 7 3 5

34
Test de Friedman (Variables cuantitativas)

Tenemos k variables en columnas y n elementos en filas. Ordenamos cada fila de


menor a mayor según las diferentes columnas desde 1 hasta k (esto sería el rango
que ocupa cada variable para ese caso). Si no hubiera diferencias entre las
variables esperamos que los rangos estén repartidos en cada columna de manera
uniforme y solo encontraremos entre ellas pequeñas diferencias debidas al azar.
El estadístico sigue una distribución de  2 con grados de libertad K-1.
Contrasta la hipótesis nula:
 La hipótesis nula es que los rangos sumados para cada columna (cada
variable) sean iguales; y la
 La hipótesis alterna es que al menos uno es diferente

Requisitos

 Es libre de curva, no tiene una distribución específica.


 Observaciones medidas en escala ordinal de la variable dependiente.
 Los tratamientos son asignados en forma aleatoria y no existe interacción
entre bloques y tratamientos.
 Se utiliza para comparar más de dos mediciones de rangos (medianas) a
una misma muestra bajo condiciones diferentes y determinar que la
diferencia no se deba al azar (que la diferencia sea estadísticamente
significativa). Es una “t” de student para muestras dependientes.

12
X r2 =  (  R i )2  3n(k + 1)
nk(k + 1)

Donde, n: número de sujetos de la muestra


K: número de mediciones que se realizado a cada sujeto de la muestra.
Ri : rango de cada una de las puntuaciones.

 R : suma de rango para cada conjunto de puntuaciones.


i

Ejemplo 1: Los siguientes datos sobre la cantidad de alimentos consumidos (g) por
ocho ratas después de 0, 24 y 72 horas de comida ¿Los datos indican una
diferencia? ¿El consumo promedio de alimentos para las tres condiciones

35
experimentales son iguales? Pruebe una diferencia en el verdadero consumo
promedios de alimentos usando la prueba de Friedman. Use α = 0.01.

0 Horas 24 Horas 72 Horas


3,5 5,9 13,9
3,7 8,1 12,6
1,6 8,1 8,1
2,5 8,6 6,8
2,8 8,1 14,3
2,0 5,9 4,2
5,9 9,5 14,5
2,5 7,9 7,9
Solución: Usamos la prueba de Friedman
H0:  0   24   72

H1: El consumo promedio de alimentos para las tres condiciones experimentales


no son iguales
Usamos el SPSS.

Tenemos el siguiente resultado

36
Tengamos en cuenta que la estadística de prueba es:
(Fr = Chi-Cuadrada = 13.067) es corregido por la existencia de lazos en las filas de
los datos.
Para el nivel de significación α = 0.01 se tiene que p-valor: 0.001 < 0.01.
Se rechaza la hipótesis nula.
Conclusión:
En el nivel de significancia α = 0.01, existe suficiente evidencia para concluir que
hay una diferencia en el verdadero consumo medio de alimentos en ratas para los
tres experimentos
Ejercicio 1: Un hospital desea evaluar la gravedad de 4 enfermedades distintas.
Para ello se elige al azar 5 médicos que se le asignan a las enfermedades valores
ene escala de 1 a 5.
Enfermedades
Médicos 1 2 3 4
1 3 4 3 2
2 2 2 4 2
3 4 4 3 3
4 1 1 3 2
5 4 3 5 1
Ejercicio 2: Se usan cuatro fertilizantes diferentes, uno en cada uno de seis
terrenos diferentes; el experimento se repite usando tres tipos diferentes de
semilla. Se observa la producción por área obteniéndose los siguientes resultados:

37
Terreno
Semilla Fertilizante 1 2 3 4 5 6
1 80.5 87.0 86.1 82.1 79.3 84.2
2 90.1 83.4 82.4 84.9 87.1 98.3
1 3 87.0 89.1 91.0 84.4 92.2 85.3
4 88.0 90.3 86.1 83.1 90.8 84.7
1 79.1 77.6 84.1 83.3 76.6 81.0
2 87.0 82.0 80.6 79.5 86.2 84.1
2 3 82.6 81.4 89.0 86.3 84.0 88.1
4 81.5 87.9 80.4 83.1 87.1 82.3
1 85.4 89.2 90.0 83.4 87.1 82.3
2 92.3 90.1 88.1 85.3 86.3 92.9
3 3 92.0 90.2 87.2 94.3 88.4 95.1
4 89.3 93.6 90.8 87.6 93.7 82.9

Sugerencia: Las hipótesis pueden ser de la siguiente manera:


H0: Ninguno de los fertilizantes tiende a tener valores de producción más grande
que ninguno de los demás.
H1: Existe por lo menos uno de los fertilizantes que tiende a tener valores de
producción más grandes que al menos uno de los demás.
Bibliografía
 Gamarra G., Rivera T., Wong F., Pujay O. Lima (2016) “Estadística e
Investigación con Aplicaciones de SPSS”. Ed. San Marcos.
 Romero F. Lima (2001) “Aprendiendo estadística V I” Ed. Hozlo S.R.L.
 Romero F. Lima (2001) “Aprendiendo estadística V II” Ed. Hozlo S.R.L.
 Roberto Hernández Sampieri, Metodología de la investigación, 4a. edición,
México, McGrawHill, 2006, pág. 755.
 Aguilar, J. Altamira, O. García. México (2014) “Introducción a la Inferencia
Estadística” Ed. Pearson

https://www.freelibros.org/estadistica/introduccion-a-la-inferencia-estadistica-
armando-aguilar-marquez-jorge-altamira-ibarra-y-omar-garcia-leon.html

 Gómez M., Danglot C., Vega L. “Revista Mexicana de Pediatría” México


(2003)

38
Manuel Gómez-Gómez,* Cecilia Danglot-Banck,* Leopoldo Vega-Franco

http://www.medigraphic.com/pdfs/pediat/sp-2003/sp032i.pdf

 Gómez M., Danglot C., Vega L. “Revista Mexicana de Pediatría”. Cómo


seleccionar una prueba estadística. Primera parte. México (2013). Manuel
Gómez-Gómez,* Cecilia Danglot-Banck,* Leopoldo Vega-Franco
http://www.medigraphic.com/pdfs/pediat/sp-2013/sp131g.pdf
 Gómez M., Danglot C., Vega L. “Revista Mexicana de Pediatría”. Cómo
seleccionar una prueba estadística México. Segunda parte(2013). Manuel
Gómez-Gómez,* Cecilia Danglot-Banck,* Leopoldo Vega-Franco
http://www.medigraphic.com/pdfs/pediat/sp-2013/sp132g.pdf
 Mario F. Triola México (2009) “Estadistica” Décima Edición Ed. Pearson

https://www.uv.mx/rmipe/files/2015/09/Estadistica.pdf

 Lara Porras A.M. (2001). “Diseño estadístico de experimentos, análisis de la


varianza y temas relacionados: tratamiento informático mediante SPSS”.
Ed.: Proyecto Sur.
https://dialnet.unirioja.es/servlet/libro?codigo=114861

 Protocolo de la investigación

https://s3.amazonaws.com/academia.edu.documents/38062890/BUENO_2.pdf?AWSAccessKe
yId=AKIAIWOWYYGZ2Y53UL3A&Expires=1523558022&Signature=%2FafNHn59c5o6urEpe8M3
NN5yJ4c%3D&response-content-
disposition=inline%3B%20filename%3DFrancisco_Javier_Jimenez_Mendez.pdf

39

También podría gustarte