Está en la página 1de 85

Arroyo Jimnez Joseline Adriana.

Arroyo Jimnez Joseline Adriana.

Introduccin.3
Conceptos Bsicos4
Objetivos...4
Tipos de Pruebas Paramtricas..5

Prueba del valor Z de la distribucin normal7

Prueba T de Student para datos relacionados (muestras dependientes)13

Prueba T de Student para datos no relacionados (muestras independientes)18

Prueba T de Student-Welch para dos muestras independientes con varianzas no


homogneas..22

Prueba de ji cuadrada de Bartlett para demostrar la homogeneidad de varianzas.26

Prueba F (anlisis de varianza o ANOVA).32

Tipo de pruebas no paramtricas36


Para escala nominal:

Leyes de la probabilidad y prueba binomial37

Prueba ji2 de Pearson para una muestra41

Prueba ji2 de Pearson para dos y ms muestras independientes44

Prueba de bondad del ajuste mediante47

Prueba ji2 de proporciones para tres o ms muestras independientes.

..49

Prueba de probabilidad exacta de Fischer y Yates52

Prueba de McNemar para muestras dependientes55

Prueba Q de Cochran para tres o ms muestras dependientes57

Anlisis secuencial.60

Para escala ordinal:

Prueba de Kolmogorov-Smirnov para una muestra62

Prueba de U Mann-Whitney para dos muestras independientes63

Prueba de Wilcoxon de rangos sealados y pares igualados para dos


muestras dependientes70

Anlisis de varianza de una entrada de Kruskal-Wallis para ms de dos


muestras independientes.73

Anlisis de varianza de doble entrada por rangos de Friedman para ms de


dos muestras dependientes76

Bibliografa85

Introduccin.
La estadstica es una de las herramientas ms ampliamente utilizadas en la
investigacin cientfica. Su aplicacin en instituciones gubernamentales y
educativas, en los negocios y en la industria, en la banca y en otros quehaceres
diarios hacen de la estadstica una herramienta indispensable. Sin embargo el
trmino Estadstica tiene varios significados para diferentes personas; para la
gente comn y corriente la estadstica solamente significa nmeros. En el periodo
de la maana se pueden encontrar la estadstica ms reciente sobre los delitos de
la ciudad; de asesinatos, de robos de automviles; de asaltos y dems delitos que
hayan sido denunciados en determinado periodo de tiempo; de los nacimientos y
muertes que han ocurrido, o en relacin con el deporte, el nmero de partidos
ganados y perdidos por equipos integrantes de la liga de ese deporte. Para otras
personas es un mtodo para obtener, presentar y escribir grandes cantidades de
datos, y para otras es un mtodo para tomar decisiones en situaciones difciles. El
objetivo bsico de este fascculo es aclarar los significados de Estadstica, definir
sus conceptos bsicos utilizados con frecuencia y analizar los usos y abusos de los
mtodos estadsticos. Aunque los significados sean diferentes, todos ellos forman
parte del concepto total de Estadstica. La palabra tiene su sentido ms amplio
para aquellas personas cuyo trabajo requiere un conocimiento de los aspectos ms
tcnicos de la estadstica. Para estas personas, la palabra tiene relacin con
aquellos conceptos y tcnicas que se utilizan en la recopilacin, organizacin,
resumen, anlisis, interpretacin y comunicacin de informacin numrica. Estos
conceptos y tcnicas juegan un papel importante en las actividades que realizan los
profesionales de todas las ciencias.

Conceptos Bsicos.
La estadstica inferencial es una parte de la estadstica que comprende los
mtodos y procedimientos que por medio de la induccin determina propiedades
de una poblacin estadstica, a partir de una pequea parte de la misma. La
estadstica inferencial comprende como aspectos importantes:

La toma de muestras o muestreo, que se refiere a la forma adecuada de


considerar una muestra que permita obtener conclusiones estadsticamente
vlidas y significativas.
La estimacin de parmetros o variables estadsticas, que permite estimar
valores poblacionales a partir de muestras de mucho menor tamao.
El contraste de hiptesis, que permite decidir si dos muestras son
estadsticamente diferentes, si un determinado procedimiento tiene un efecto
estadstico significativo, etc.
El diseo experimental.
La inferencia bayesiana.
Los mtodos no paramtricos

Objetivo:
La estadstica inferencial tiene como objetivo generalizar los resultados de un
subconjunto de datos a todo el conjunto. Seguidamente se define los conceptos
bsicos de esta rama de la matemtica:

Definicin 1 Poblacin: conjunto de datos que se desea estudiar. Estos datos deben
verse como valores de una misma variable, la cual se utiliza para designar la
poblacin.
Definicin 2 Muestra: subconjunto de datos que se seleccionan de la poblacin. As,
la estadstica inferencial busca generalizar los resultados obtenidos en una muestra
a toda la poblacin. Si la muestra es igual a la poblacin, la generalizacin o
estudio se le llama censo y es exacta.

Estadstica de pruebas paramtrica.


La estadstica paramtrica es una rama de la estadstica inferencial que comprende los
procedimientos estadsticos y de decisin que estn basados en las distribuciones de los
datos reales.
Se llaman as porque su clculo implica una estimacin de los parmetros de la poblacin
con base en muestras estadsticas. Mientras ms grande sea la muestra ms exacta ser la
estimacin, mientras ms pequea, ms distorsionada ser la media de las muestras por
los valores raros extremos.
Suposiciones que subyacen a la utilizacin de las pruebas paramtricas.

1. El nivel de medicin debe ser al menos de intervalo. Debemos tomar una decisin a
cerca de nuestra variable dependiente. Es realmente un nivel de intervalo? Si es
una escala no estandarizada, o si se basa en estimaciones o calificaciones con
humanos. Frecuentemente aparecen como intervalo pero lo reducimos a nivel
ordinal al darles rango.

2. Los datos de la muestra se obtienen de una poblacin normalmente distribuida.


Este principio suele mal entenderse como: la muestra debe distribuirse
normalmente, "no es as". La mayora de las muestras son demasiado pequeas
para siquiera parecerse a una distribucin normal, la cual solo obtiene su
caracterstica en forma de campana con la acumulacin de muchas puntuaciones.

3. La varianza de las 2 muestras no son significativamente diferentes, esto se conoce


como el principio de homogeneidad de la varianza, Los especialistas en estadstica
han investigado ms sobre ese requisito, el cual sabia exigir varianzas muy
similares. Estos se ignoran cuando tratamos con muestras relacionadas sin gran
riesgo de distorsionar nuestro resultado. Para muestras no relacionadas
necesitamos ser ms cuidadosos cuando los tamaos de las muestras sean
bastante diferentes.

Ventajas de las Pruebas Paramtricas:

Menos posibilidad de errores.


Robustas (dan estimaciones probabilsticas bastante exactas).
Ms poder de eficiencia.
Ms sensibles a los rasgos de los datos recolectados.

Desventajas de las Pruebas Paramtricas:

Ms complicadas de calcular.
Limitaciones en los tipos de datos que se pueden evaluar.

Tipos de Pruebas Paramtricas:


o

Prueba del valor Z de la distribucin normal

Prueba T de Student para datos relacionados (muestras dependientes)

Prueba T de Student para datos no relacionados (muestras independientes)

Prueba T de Student-Welch para dos muestras independientes con varianzas


no homogneas

Prueba de ji cuadrada de Bartlett para demostrar la homogeneidad de


varianzas

Prueba F (anlisis de varianza o ANOVA)

Prueba del valor Z de la distribucin normal.


Se dice que muchos fenmenos en el campo de la salud se distribuyen
normalmente. Esto significa que si uno toma al azar un nmero suficientemente
grande de casos y construye un polgono de frecuencias con alguna variable
continua, por ejemplo peso, talla, presin arterial o temperatura, se obtendr una
curva de caractersticas particulares, llamada distribucin normal. Es la base del
anlisis estadstico, ya que en ella se sustenta casi toda la inferencia estadstica.
La grfica de la distribucin normal tiene la forma de una campana, por este
motivo tambin es conocida como la campana de Gauss. Sus caractersticas son las
siguientes:
Es una distribucin simtrica.
Es asinttica, es decir sus extremos nunca tocan el eje horizontal, cuyos valores
tienden a infinito.
En el centro de la curva se encuentran la media, la mediana y la moda.
El rea total bajo la curva representa el 100% de los casos.
Los elementos centrales del modelo son la media y la varianza.

Esta distribucin es un modelo matemtico que permite determinar probabilidades


de ocurrencia para distintos valores de la variable. As, para determinar la
probabilidad de encontrar un valor de la variable que sea igual o inferior a un
cierto valor xi, conociendo el promedio y la varianza de un conjunto de datos, se
debe reemplazar estos valores (media, varianza y xi) en la frmula matemtica del
modelo. El clculo resulta bastante complejo pero, afortunadamente, existen tablas
estandarizadas que permiten eludir este procedimiento.
En el grfico, el rea sombreada corresponde a
la probabilidad de encontrar un valor de la
variable que sea igual o inferior a un valor
dado.
Esa
probabilidad
es
la
que
aprenderemos a determinar usando una tabla
estandarizada.

El valor Z se define matemticamente con la frmula:

Dnde:

Z = valor estadstico de la curva normal de frecuencias.


X = cualquier valor de una muestra estadstica.
= promedio o media aritmtica obtenido de la muestra estadstica, valor
representativo.
s = desviacin estndar.

Pasos:
1. Calcular el promedio y la desviacin estndar de las observaciones de la
muestra en estudio.
2. Del valor del cual se desea obtener una inferencia estadstica, calcular la
diferencia que existe con respecto al promedio: X.
3. Dividir la diferencia calculada entre la desviacin estndar obtenida de la
muestra en estudio, que corresponde al valor Z.
4. Localizar el valor Z calculado, en la tabla de probabilidades asociadas con
valores tan extremos como los valores observados de Z en la distribucin
normal y obtener la probabilidad de que exista una magnitud de
discrepancia entre los valores X y .
5. Decidir si se acepta o rechaza la hiptesis.

Ejemplo:
Un mdico que labora en una poblacin acostumbra efectuar mediciones de peso
y talla a sus pacientes, de los cuales dos tienen pesos que difieren de las tres
medidas de tendencia central, pero particularmente del promedio. El mdico est
interesado en saber si los pesos de sus dos pacientes corresponden a esa
poblacin y qu tanto difieren de la representacin de su grupo de asistencia
mdica y de estudio.Los pesos corporales de la poblacin estudiada se encuentran
listados del ms bajo al ms alto en la tabla siguiente, y el mdico ha marcado los
puntos donde se localizan la media aritmtica, la mediana y la moda. Los pesos de
sus pacientes problema son de 54 y 80 kg.

Pacientes adultos de tallas


similares que asisten a
consulta mdica.

Eleccin de la prueba estadstica.


El modelo de investigacin tiene una muestra. Las mediciones de la tabla anterior
son cuantitativas, de variable continua, por lo tanto, tienen una escala de intervalo.
Los intervalos entre un peso menor y otro mayor y entre todos los valores parecen
no diferir notoriamente y permiten suponer que se distribuyen normalmente.

Planteamiento de la hiptesis.
o Hiptesis alterna (Ha). Los pesos corporales de los dos sujetos de
investigacin y asistencia mdica (54 y 80 kg) difieren
significativamente del promedio, por lo tanto, no corresponden a la
poblacin.
o Hiptesis nula (Ho). Las diferencias de los pesos de los sujetos de
estudio se deben al azar, por lo cual no hay diferencias significativas y
corresponden a la misma poblacin.

Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.

Zona de rechazo.

Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.

Aplicacin de la prueba estadstica.

Tomando en cuenta los pasos, se calcula el promedio o media aritmtica. De


acuerdo con la siguiente frmula:

La desviacin estndar se calcula con la ecuacin siguiente:

Una vez calculados el promedio y la desviacin estndar, se calcula el valor Z.

En la tabla de probabilidades asociadas en valores extremos como los de 2 en la


distribucin normal, se busca la localizacin de los valores Z1 y Z2 calculados, a fin
de obtener la probabilidad de su magnitud de discrepancia con respecto a la
media aritmtica.
El primer valor de Z1 es 1.69, de modo que se localiza el 1.6 y en la interseccin de
la columna 0.09, correspondiente a las centsimas, se observa el valor 0.0455. Esta
es la probabilidad de que el valor 54 kg pertenezca a la poblacin de pesos
corporales, donde el promedio es 73.2 kg y la desviacin estndar 11.39 kg.
El segundo valor de Z2 es 0.6, de manera que en la tabla se observa esa cifra y en la
interseccin de la columna 0.00 se halla el valor 0.2743.

Decisin.

El valor de Z1 tiene una probabilidad menor que la de significancia. Para este caso,
se acepta Ha y se rechaza Ho. Para el valor de Z2, la probabilidad es
aproximadamente de 0.27, pero de cualquier manera mayor que el nivel de
significancia, el cual se ubica en la zona de rechazo. Se acepta Ho y se rechaza Ha.

Interpretacin.

El peso del individuo que tiene 54 kg difiere notoriamente del promedio, que es la
representativa de esa poblacin, a un nivel de confianza menor que 0.05; en
cambio, el otro sujeto slo difiere a un nivel mayor que 0.05 de confianza, lo cual
significa que est dentro de la poblacin de tallas similares.
La siguiente figura contiene tanto el polgono de frecuencias en funcin de una
serie de clases elaboradas con las observaciones de 150 pesos corporales, como los
lmites de las desviaciones estndar con respecto al promedio. Los valores Z de los
dos pesos problema se dibujan con dos flechas, de acuerdo con los valores de
peso que corresponden. La Z1 se encuentra muy por fuera de -1 desviacin
estndar y muy cercana a -2 desviaciones estndar. Para ser ms precisos, tiene
1.69 desviaciones estndar, igual al valor Z; en cambio, el valor Z 2 tiene 0.6
desviaciones estndar y an se encuentra dentro del lmite de +1 desviacin
estndar. Cabe recordar que +1 y -1 desviaciones estndar se encuentran
aproximadamente en el 68% de las mediciones.

Con todo lo anterior se comprende el significado del valor Z en la curva normal de


frecuencias: es el nmero de desviaciones estndar que se desvan con respecto al
promedio o media aritmtica.

Prueba T de Student para datos relacionados.


(Muestras dependientes)
Es una prueba paramtrica de comparacin de dos muestras relacionadas, debe
cumplir las siguientes caractersticas:

Asignacin aleatoria de los grupos


Homocedasticidad (homogeneidad de las varianzas de la variable
dependiente de los grupos)
Distribucin normal de la variable dependiente en los dos grupos.
Nivel intervalo o de razn de la variable dependiente
Su funcin es comparar dos mediciones de puntuaciones (medias
aritmticas) y determinar que la diferencia no se deba al azar (que las
diferencia
Sea estadsticamente significativa.

Consideraciones para su uso:


o El nivel de medicin, en su uso debe ser de intervalo o posterior.
o El diseo debe ser relacionado.
o Se deben cumplir las premisas paramtricas.
En cuanto a la homogeneidad de varianzas, es un requisito que tambin debe
satisfacerse y una manera prctica es demostrarlo mediante la aplicacin de la
prueba ji cuadrada de Bartlett. Este procedimiento se define por medio de la
siguiente frmula:
Dnde:
t = valor estadstico del procedimiento.
= Valor promedio o media aritmtica de las diferencias entre los
momentos antes y despus.
sd = desviacin estndar de las diferencias entre los momentos
antes y despus.
N = tamao de la muestra.

La media aritmtica de las diferencias se obtiene de la manera siguiente:

La desviacin estndar de las diferencias se logra como sigue:

Pasos:
1. Ordenar los datos en funcin de los momentos antes y despus, y obtener
las diferencias entre ambos.
2. Calcular la media aritmtica de las diferencias ( ).
3. Calcular la desviacin estndar de las diferencias (sd).
4. Calcular el valor de t por medio de la ecuacin.
5. Calcular los grados de libertad (gl) gl = N - 1.
6. Comparar el valor de t calculado con respecto a grados de libertad en la
tabla respectiva, a fin de obtener la probabilidad.
7. Decidir si se acepta o rechaza la hiptesis.

Ejemplo:

Objetivo:

Comparar los niveles de ansiedad de jvenes no asertivos antes y despus de


participar en un entrenamiento de habilidades sociales.
Especificaciones. 10 jvenes no asertivos que asisten a la Clnica Universitaria de
Salud Integral (CUSI) del campus Iztacala. Se evalu el nmero de

comportamientos ansiosos que reportaban los jvenes antes y despus del


entrenamiento.
Eleccin y justificacin de la prueba estadstica T de Student para grupos
relacionados.
1. Las mediciones son cuantitativas con variables continuas y una escala de
intervalo.

2. Nmero de observaciones N=10.


3. Una VD numrica: puntajes de 10 jvenes no asertivos que asisten a la CUSI.
4. Una VI con 2 niveles: Antes y despus del entrenamiento.
5. Dos muestras relacionadas: los mismos sujetos evaluados en dos momentos
diferentes.

Planteamiento de la hiptesis.
o

Hiptesis alterna (Ha). El nivel de ansiedad de jvenes no asertivos


disminuye despus de participar en un entrenamiento en habilidades
sociales, existiendo diferencias significativas entre antes y despus. Ha: X 1
< X2.

Hiptesis nula (Ho). Los cambios observados antes y despus del


entrenamiento en habilidades sociales se deben al azar, y no hay
diferencias entre ambos perodos. Ho: X1 X2.

Nivel de significacin.

Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho. a = 0.05

Zona de rechazo.

Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
1. Si la to tt se rechaza Ho.
2. Si la p(to) a se rechaza Ho.

Puntaje obtenido de 10 jvenes no asertivos que asisten a la CUSI.

Clculo de la prueba estadstica.

a = 0.05
gl = 9
to = 5.79
tt = 2.262

El valor calculado o obtenido de t (5.79) se compara con los valores crticos de la


distribucin t (tabla), y se observa que a una probabilidad de 0.05 le corresponde
2.262 de t. Por tanto, el clculo tiene un probabilidad menor que 0.05.

Decisin.

Como to es de 5.79, con 9 grados de libertad, tiene un valor de probabilidad menor


que
0.05,
entonces
se
acepta
Ha
y
se
rechaza
Ho.
to > tt se rechaza Ho. Hay una reduccin en los niveles de ansiedad en 10 jvenes
no asertivos que asisten a la CUSI despus de un entrenamiento.
P(0.05) < a = 0.05 se rechaza Ho.

Interpretacin.

El nivel de ansiedad de jvenes no asertivos disminuye despus de participar en un


entrenamiento en habilidades sociales, existiendo diferencias significativas entre
antes y despus.

Prueba T de Student para datos no relacionados


(Muestras independientes)
Todas las pruebas paramtricas, en las cuales se incluye la t de Student y la F de
Fischer, se basan en supuestos tericos para utilizarse. Dichos supuestos
matemticos las hacen vlidas, pues al analizar las mediciones de las
observaciones, se tienen procedimientos de gran potencia-eficiencia para evitar
error del tipo I.
En tales pruebas paramtricas se exige una serie de requisitos para aplicarlas como
instrumento estadstico:
1. Las observaciones deben ser independientes.
2. Las observaciones se deben efectuar en universos poblacionales distribuidos
normalmente.
3. Las mediciones se deben elaborar en una escala de intervalo, entendiendo
que una escala de intervalo exige que puedan efectuarse todas las
operaciones aritmticas admisibles. Tambin se requiere que los intervalos
entre las mediciones tengan la misma magnitud.
4. Las varianzas de los grupos deben ser homogneas, de modo que cabe
aclarar que en las mediciones realizadas en biomedicina, es poco probable
encontrar varianzas iguales. Por ello, se utiliza la prueba ji cuadrada de
Barlett para decidir si las diferencias observables en la magnitud de las
varianzas son significativas o no.
El modelo matemtico que en seguida se presenta, corresponde a dos muestras
independientes.

Dnde:
t = valor estadstico de la prueba t de Student.
=
valor
promedio
del
grupo
1.
1
=
valor
promedio
del
grupo
2.
2
sp = desviacin estndar ponderada de ambos grupos.
N1 = tamao de la muestra del grupo 1.
N2 = tamao de la muestra del grupo 1.

Ecuacin para obtener la desviacin estndar ponderada:

Dnde:
sp = desviacin estndar ponderada.
SC = suma de cuadrados de cada grupo.
N = tamao de la muestra 1 y 2.

Pasos:
1. Determinar el promedio o media aritmtica de cada grupo de poblacin.
2. Calcular las varianzas de cada grupo, a fin de demostrar la homogeneidad
de varianzas mediante la prueba de X2 de Bartlett.
3. Calcular la suma de cuadrados de cada grupo: Suma de cuadrados (SC) =
S(X - )2.
4. Calcular la desviacin estndar ponderada (sp) de ambos grupos.
5. Obtener la diferencia absoluta entre los grupos (

6. Aplicar la frmula y obtener el valor estadstico de t.


7. Calcular los grados de libertad (gl). gl = N1 + N2 -2
8. Obtener la probabilidad del valor t en la tabla.
9. Decidir si se acepta o rechaza la hiptesis.

2).

Ejemplo:
Un investigador ha obtenido la talla de 20 nios de 5 aos de edad, de dos
condiciones socioeconmicas contrastantes (alta y baja). Considera que ambos
grupos de poblacin tienen estaturas diferentes.
Eleccin de la prueba estadstica.
Tenemos un modelo experimental con dos muestras independientes.

Planteamiento de la hiptesis.
o Hiptesis alterna (Ha). Las tallas de nios de 5 aos de las dos
muestras, de condiciones socioeconmicas contrastantes, son
distintas.
o Hiptesis nula (Ho). Las diferencias observadas en las tallas de nios
de las dos muestras de condicin socioeconmica similar se deben al
azar.

Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo
.Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.

Talla en cm de nios de condiciones socioeconmicas baja y alta.

Aplicacin de la prueba estadstica.


Suma de cuadrados.

Desviacin estndar ponderada.

Ecuacin t.

gl = N1 + N2 -2 = 10 + 10 - 2 = 18

El valor de to se compara con los valores crticos de la tabla (tt) con 18 grados de
libertad, y se obtiene que en el valor ms cercano al calculado, la probabilidad es
de 0.001 (valor crtico de t: 3.92).

Decisin.
Como el valor de to (3.99) tiene una probabilidad de significancia menor
que 0.001, tambin es menor que 0.05, propuesto como nivel de
significancia, por lo cual se acepta Ha y se rechaza Ho.

Interpretacin.
Las diferencias en talla de ambos nios de condiciones socioeconmicas
antagnicas (alta y baja) difieren notoriamente en el nivel de confianza de p
menor que 0.001.

Prueba T de Student-Welch
(Para dos muestras independientes con varianzas no homogneas.)
Esta prueba estadstica es de utilidad para contrastar hiptesis en funcin de la
media aritmtica, pero dada la heterogeneidad de las varianzas, no es aplicable la
prueba t de Student.
En este modelo estadstico, el agregado de Welch consiste en una ecuacin para
calcular los grados de libertad, de manera que disminuye el error por la no
homogeneidad de las varianzas. Por otra parte, existe una modificacin de la
ecuacin original de la correspondiente t de Student, que es la siguiente:

Dnde:
t = estadstico equivalente a t de Student.
1 = media aritmtica del grupo 1.
2 = media aritmtica del grupo 2.
2
s 1 = varianza del grupo 1.
s22 = varianza del grupo 2.
n1 = tamao de la muestra del grupo 1.
n2 = tamao de la muestra del grupo 2.
El clculo de los grados de libertad se realiza con la frmula siguiente:

Dnde:
s21 = varianza del grupo 1.
s22 = varianza del grupo 2.
n1 = tamao de la muestra del grupo 1.
n2 = tamao de la muestra del grupo 2.

Pasos:
1. Determinar el promedio, la varianza y el tamao de la muestra de cada
poblacin en el estudio.
2. Aplicar la ecuacin t.
3. Calcular los grados de libertad (gl) de acuerdo con la ecuacin dada.
4. Comparar el valor de t calculado respecto a los grados de libertad con los
valores de t crticos.
5. Decidir si se acepta o rechaza la hiptesis.

Ejemplo:

El siguiente ejemplo contiene varianzas homogneas (Ver Prueba de ji


cuadrada de Bartlett para demostrar la homogeneidad de varianzas), y esta
prueba es para varianzas no homogneas, pero, para el caso de aplicar esta
prueba, nos es de utilidad. Y con esto podremos aplicarla cuando
encontremos algunas muestras que presenten dicha condicin para la prueba
(varianzas no homogneas).
Un investigador realiza un estudio para mostrar que los niveles de ansiedad de las
personas obsesas que asisten de manera constante a tratamiento para control de
peso corporal es mayor que el de los obesos que no asisten a tratamiento.
Especificaciones: Participaron 28 personas obesas (hombres y mujeres). 14
personas obesas que no asistan a tratamiento y 14 que asistan de manera regular
a algn tipo de tratamiento. A los 28 participantes se les solicit que dieran
respuesta a la escala de estado de ansiedad (IDARE), la cual est diseada para
evaluar el grado de ansiedad ante situaciones cotidianas. Los puntajes de la escala
varan en un rango de 20 a 80 puntos, siendo los puntajes ms altos los indicativos
de un mayor nivel de ansiedad.
Eleccin de la prueba estadstica.
El modelo experimental tiene dos muestras independientes

Planteamiento de Hiptesis.
o Hiptesis alterna (Ha). Existe una diferencia significativa en el nivel de
ansiedad de personas obesas que asisten a tratamiento constante y
personas obesas que no asisten a tratamiento.
o

Hiptesis nula (Ho). No existe una diferencia significativa en el nivel de


ansiedad de personas obesas que asisten a tratamiento constante y
personas obesas que no asisten a tratamiento, todo se debe al azar, por
lo tanto, ambos grupos son iguales y no difieren significativamente.

Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.

Zona de rechazo.

Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.

Aplicacin de la prueba estadstica.


Primeramente obtenemos las medias y varianzas de cada grupo.

= 68.93
2 = 52.5
2
s 1 = 558.9286 / (14 - 1) = 42.99
s21 = 837.5 / (14 - 1) = 64.42
1

Aplicamos la ecuacin t.

Obtenemos los grados de libertad.

El valor t calculado (5.93), con 21 grados de libertad, se comparan con la tabla, y se


observa que al valor crtico (tt) de 2.080 corresponde a una probabilidad de 0.05.
De esta manera, el estadstico t 5.93 tiene una probabilidad menor que 0.05.
Decisin.
Como la probabilidad no se ubica en la zona de rechazo, se rechaza Ho y se acepta
Ha.

Interpretacin.

Las personas obesas que asisten a un tratamiento constante para bajar de peso,
tienen un nivel de ansiedad mayor que las personas obesas que no asisten a
tratamiento.

Prueba de prueba (ji cuadrada de Bartlett)


(Para demostrar la homogeneidad de varianzas)
En estadstica y estadstica aplicada se denomina prueba (pronunciado como "jicuadrado" y a veces como "chi-cuadrado") a cualquier prueba en la que el
estadstico utilizado sigue una distribucin si la hiptesis nula es cierta. Algunos
ejemplos de pruebas son:

La prueba de Pearson, la cual tiene numerosas aplicaciones:

La prueba de frecuencias

La prueba de independencia

La prueba de bondad de ajuste

La prueba de Pearson con correccin por continuidad o correccin de


Yates

La prueba de Bartlett de homogeneidad de varianzas

La prueba de Bartlett se utiliza para probar la hiptesis nula,


que todas las
variaciones de poblacin k son iguales frente a la alternativa de que al menos
dos son diferentes. Permite saber, en funcin de la probabilidad, si la
discrepancia entre varianzas fue dada por el azar o por otros factores de error
no deseados por el experimentador.
La X2 de Bartlett se define matemticamente con la ecuacin siguiente:

Dnde:
X2Bartlett = valor estadstico de esta prueba.
ln = logaritmo natural.
s2 = varianza.
n = tamao de la muestra del grupo.
K = nmero de grupos participantes.
N = tamao total (sumatoria de las muestras).

Pasos:

1. Obtener el tamao de la muestra (n) y la varianza (s2) de cada grupo.


2. Multiplicar la varianza de cada grupo por los grados de libertad y sumarlas:
s2 (n - 1).
3. Transformar la varianza de cada grupo en el logaritmo natural y multiplicarla
por los grados de libertad de su grupo: ln s2 (n - 1).
4. Obtener la sumatoria de los grados de libertad de todos los grupos: S (n 1).
5. Obtener la sumatoria de los valores calculados: Slns2 (n - 1).
6. Dividir la sumatoria de los productos de la varianza por
los grados de libertad (s2 (n - 1)) entre la sumatoria de los
grados de libertad (s (n - 1)), transformar el resultado en
logaritmo natural y multiplicarlo por la sumatoria de los
grados de libertad:

7. Obtener la diferencia del paso 6 y 5.

8. Dividir la diferencia obtenida entre el factor de ajuste, el cual est en funcin


del nmero de grupos que intervienen en el anlisis estadstico:

9. El valor obtenido corresponde al estadstico ji cuadrada de Bartlett. Calcular


los grados de libertad (gl): gl = K - 1.
10. Comparar el valor de ji cuadrada de Bartlett con los valores crticos de la
distribucin de ji cuadrada de Pearson.
11. Decidir si se acepta o rechaza la hiptesis.

Ejemplo:

Un investigador realiz un estudio para mostrar que los niveles de ansiedad de las
personas obsesas que asisten de manera constante a tratamiento para control de
peso corporal es mayor que el de los obesos que no asisten a tratamiento. l desea
saber si las varianzas de los grupos son homogneas o no.
Especificaciones: Participaron 28 personas obesas (hombres y mujeres). 14
personas obesas que no asistan a tratamiento y 14 que asistan de manera regular
a algn tipo de tratamiento. A los 28 participantes se les solicit que dieran
respuesta a la escala de estado de ansiedad (IDARE), la cual est diseada para
evaluar el grado de ansiedad ante situaciones cotidianas. Los puntajes de la escala
varan en un rango de 20 a 80 puntos, siendo los puntajes ms altos los indicativos
de un mayor nivel de ansiedad.
Eleccin de la prueba estadstica.
modelo experimental tiene dos

El

muestras

independientes.

Vase:

Estadstica/Flujogramas/Flujograma 4

Planteamiento de Hiptesis.

Hiptesis alterna (Ha). El investigador, al observar los valores de las varianzas


de los dos grupos, percibe que son diferentes entre s, pero ignora si las
fuentes de error son las mismas. La hiptesis se refiere a que las varianzas,
de acuerdo con lo observado, son diferentes..

Hiptesis nula (Ho). Las diferencias observadas entre las varianzas se debe al
azar; por lo tanto, son iguales y la fuente de error probablemente es la
misma.

Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.

Zona de rechazo.

Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.

Aplicacin de la prueba estadstica.

Primeramente se determina el tamao de la muestra y las varianzas de cada grupo,


con lo cual creamos una tabla de apoyo.
s21 = 558.9286 / (14 - 1) = 42.99
s22 = 837.5 / (14 - 1) = 64.42

Clculo de ln.
Para este clculo utilizamos una tabla logartmica de base 10 (logaritmos comunes)
log(10)s21 = 42.99 = 0.6325 + 1 = 1.6325
log(10)s22 = 64.42 = 0.8089 + 1 = 1.8089

El logaritmo de base (10) del numero neperiano es 0.4343. Al dividir un logaritmo


de base (10) de un nmero entero entre 0.4343, se obtiene el logaritmo natural de
ese nmero, entonces:

N = 28
K=2
(n - 1) = 26
s2 (n - 1) = 1396.33
lns2 (n - 1) = 103

Entonces tenemos ya los clculos requeridos para poder aplicar la prueba X2


Bartlett.

*Hacemos un parntesis para calcular el (ln) de:

Continuamos con el clculo de la X2 de Bartlett.

Calculamos los grados de libertad (gl):


gl = K - 1 = 2 -1 = 1
El valor de ji cuadrada de Bartlett calculado se compara con los valores crticos de
la distribucin de ji cuadrada de Pearson, y resulta que el valor 3.48 con 1 grado de
libertad corresponde a una probabilidad de 0.05.

Decisin.

Como el valor de ji cuadrada de Bartlett es notoriamente menor que el crtico, el


cual equivale a 0.05, la probabilidad de ji cuadrada de 0.46 con 1 grado de libertad
mayor que 0.05. Por lo tanto, se acepta Ho y se rechaza Ha.

Interpretacin.

Existe homogeneidad de las varianzas, es decir, an cuando los valores de error


estadstico difieren entre s, el procedimiento seala que es un efecto aleatorio y
existe gran probabilidad de que la fuente o fuentes de variacin sean las mismas.

Prueba F
(Anlisis de varianza o ANOVA)
Anlisis de la varianza permite contrastar la hiptesis nula de que las medias de K
poblaciones (K >2) son iguales, frente a la hiptesis alternativa de que por lo
menos una de las poblaciones difiere de las dems en cuanto a su valor esperado.
Este contraste es fundamental en el anlisis de resultados experimentales, en los
que interesa comparar los resultados de K 'tratamientos' o 'factores' con respecto a
la variable dependiente o de inters.

El Anova requiere el cumplimiento los siguientes supuestos:


o Las poblaciones (distribuciones de probabilidad de la variable
dependiente correspondiente a cada factor) son normales.
o Las K muestras sobre las que se aplican los tratamientos son
independientes.
o Las poblaciones tienen todas igual varianza (homoscedasticidad).:
o Las personas de los diversos subgrupos deben seleccionarse mediante el
muestreo aleatorio, a partir de poblaciones normalmente distribuidas.
o La varianza de los subgrupos debe ser homognea.
o Las muestras que constituyen los grupos deben ser independientes.
Amenos de que las muestras sean independientes, y que por lo tanto,
generen estimaciones de varianza independientes, la razn de las
varianzas inter e intra no adoptar la distribucin F.

Ejemplos:

Con los datos de la encuesta sobre transporte, Enctrans.sav, razonar si puede


aceptarse que el tipo de transporte utilizado, Trans, influye sobre la variable
tiempo.
Con la opcin de men Grficos > Barras de error > Simple y con el botn Definir
se selecciona como Variable Tiempo y en Eje de categoras la variable Trans; al
aceptar se obtiene la siguiente representacin grfica:

Como puede observarse, los puntos que representan a las medias de cada grupo
aparecen dispersos a diferentes niveles; sobre todo la media del grupo definido por
el factor Tren. El intervalo de confianza para la media correspondiente al grupo
definido por el factor Metro est contenido dentro del intervalo correspondiente al
grupo definido por el factor Bus, as como, el intervalo correspondiente al factor
Coche est contenido dentro de los intervalos correspondientes definidos por los
factores Metro y Otros. El grfico, por tanto, parece sugerir no una nica poblacin
sino tres poblaciones con distintas medias.
Para realizar el anlisis de la varianza propiamente dicho la secuencia es Analizar >
Comparar medias > ANOVA de un factor. En el cuadro de dilogo se selecciona
Tiempo como variable Dependiente y Trans como Factor. Para contrastar la
hiptesis de igualdad de varianzas se abre con el botn correspondiente el cuadro
de dilogo ANOVA de un factor: Opciones y se activa Homogeneidad de varianzas.
Si se desea un anlisis descriptivo del comportamiento de la variable dependiente
dentro de cada grupo se activa tambin la opcin Descriptivos. Al aceptar se
obtienen los siguientes cuadros de resultados:

Este cuadro contiene un anlisis descriptivo de la variable dependiente por grupos,


as como, los lmites superior e inferior para la media de cada grupo al 95% de
confianza.

El estadstico de Levene toma un valor lo suficientemente pequeo para no


rechazar la hiptesis de homocesdaticidad a los niveles de significacin habitual.

En el cuadro de resultados del ANOVA, el valor del estadstico de prueba, F=6,450,


es significativamente distinto de 1 para cualquier nivel de significacin y, por lo
tanto, se rechaza la hiptesis nula de igualdad de medias y queda confirmada la
primera impresin proporcionada por el grfico de barras de error.

Estadstica de pruebas no paramtrica.


La estadstica no paramtrica es una rama de la estadstica inferencial que
estudia las pruebas y modelos estadsticos cuya distribucin subyacente no se
ajusta a los llamados criterios paramtricos.
Las pruebas no paramtricas nos permiten analizar datos en escala nominal u
ordinal a pesar de que no se conozcan los parmetros de una poblacin, utilizada
para hacer un contraste de hiptesis.

Utilizacin:
o

Cuando los datos puntualizan a las escalas nominal u ordinal.

Se utiliza solo la frecuencia.

Poblaciones pequeas.

Cuando se desconocen los parmetros media, moda, etc.

Cuando los datos son independientes.

Cuando se quiere contrastar o comparar hiptesis.

Investigaciones de tipo social. (Muestras pequeas no representativas >5).

Cuando se requiere de establecer el nivel de confianza o significatividad en


las diferencias.

Cuando la muestra es seleccionada no probabilsticamente.

Tipo de pruebas no paramtricas:

Para escala nominal:


o

Leyes de la probabilidad y prueba binomial

Prueba ji2 de Pearson para una muestra

Prueba ji2 de Pearson para dos y ms muestras independientes

Prueba de bondad del ajuste mediante ji2

Prueba ji2 de proporciones para tres o ms muestras independientes

Prueba de probabilidad exacta de Fischer y Yates

Prueba de McNemar para muestras dependientes

Prueba Q de Cochran para tres o ms muestras dependientes

Anlisis secuencial

Para escala ordinal:

Prueba de Kolmogorov-Smirnov para una muestra

Prueba de U Mann-Whitney para dos muestras independientes

Prueba de Wilcoxon de rangos sealados y pares igualados para dos


muestras dependientes

Anlisis de varianza de una entrada de Kruskal-Wallis para ms de dos


muestras independientes

Anlisis de varianza de doble entrada por rangos de Friedman para ms de


dos muestras dependientes

Leyes de la probabilidad y prueba binomial


En la naturaleza existen dos clases de fenmenos: los determinsticos y los
probabilsticos.
a. Fenmenos determinsticos. Son aquellos en los que se conocen y renen
todas las variables o premisas, por ejemplo: la gravedad.
b. Fenmenos probabilsticos. Son aquellos fenmenos en los que se
desconocen algunas variables, pero si se renen las conocidas, tendrn la
posibilidad de presentarse (p) o de no manifestarse (q), por ejemplo, por
ejemplo: cuando un grupo de personas se pone en contacto con un
paciente que padece alguna enfermedad infecciosa. Todos tienen la
probabilidad de ser contagiados (p) o de no serlo (q); asimismo, tienen la
probabilidad de manifestar o no la enfermedad.
De las circunstancias deducidas (p y q), si se lanza una moneda al aire y se pide
guila, la esperanza de este suceso p corresponde a 0.5 o ; lo contrario, o sea,
que salga sol, tambin representa la misma proporcin de 0.5. De ello se deduce
que al sumar los eventos p y q, ambos resultan igual a uno. En ese momento se
simple con la primera ley de la probabilidad: la ley de la adicin, la cual establece
que la suma de los eventos simples de un experimento es igual a la probabilidad
de ocurrencia del evento.
En un fenmeno con diversos eventos posibles, la suma de las proporciones
correspondiente a cada evento ser igual a uno, por ejemplo: si un sujeto se
expone al contacto con pacientes que tengan alguna enfermedad contagiosa,
tendr, posiblemente, eventos distintos, como presentar la enfermedad en una
forma severa, moderada o leve o asintomtica, e incluso no manifestar algn dato
clnico o de gabinete que represente la enfermedad. Cada uno de estos posibles
eventos tendr una proporcin diferente de ocurrencia, de acuerdo con
circunstancias debidas al husped, al entorno y al agente infectante, pero de
cualquier manera la suma de todos ellos resultar igual a 1.
Ensayo de Bernoulli.
Experimento aleatorio que produce en cada ensayo nicamente 1 de 2 resultados
mutuamente excluyentes. Por conveniencia se suele denominar arbitrariamente
uno de los resultados de un ensayo de Bernoulli como xito o fracaso. Se suele
denotar p a la probabilidad de que un xito ocurra y q a la probabilidad de que
ocurra un fracaso.

-q
p
Distribucin Binomial.
Es cuando se quiere determinar la probabilidad de que x xitos sean observados en
n ensayos, el orden en que ocurren los xitos no tiene importancia. Podemos
calcular este nmero siguiendo la frmula de las combinaciones, n causas, de las
cuales x es de un tipo y n-x es de otro tipo.
Cxn(p)x(q)n-x
Como es sabido, si consultamos libros estadsticos nos encontramos a veces, que
las frmulas son estructuradas diferente, por ejemplo, encontramos otra:
Pxi = nCr pr - q(n-r)

Dnde:
Pxi = probabilidad de acontecimientos de un evento.
nCr = nmero de combinaciones.
n = nmero total de eventos.
r = valor del arreglo esperado.
p = probabilidad de ocurrencia.
q = Probabilidad de no ocurrencia.

Ejemplos:
Se lanza una moneda cuatro veces, para calcular las probabilidades
correspondientes aplicando la frmula anterior. Esto se inicia con la probabilidad
de que resulten cuatro guilas y cero soles, y para el caso se simboliza como:

Como se advierte, las probabilidades calculadas mediante los procedimientos


previos son idnticos; slo hasta elaborar una tabla de densidad de probabilidades.
Densidad de probabilidades de los eventos de un suceso.
xi
4 guilas
3 guilas
2 guilas
1 guila
0 guilas
Total

Pxi
1/16 = 0.0625
4/16 = 0.25
6/16 = 0.375
4/16 = 0.25
1/16 = 0.625
16/16 = 1.0

Despus de realizar los clculos, es evidente que la ley de la adicin y


multiplicacin de la probabilidad se ha cumplido, por ejemplo, en la tabla anterior
se muestra la suma de todas las probabilidades, en la cual la probabilidad del
suceso, que corresponde al total = 1.
Ahora bien, con lo anterior ya entendido, pasemos a un ejemplo ms complejo.
Lanzamos 5 dados simultneamente, cabe tener en cuenta que un dado tiene seis
caras y para cada una existe la probabilidad de 1/6 contra 5/6 de no ocurrencia.

En la siguiente tabla se muestran las probabilidades de los diferentes eventos


propuestos de un suceso, as, se puede observar que lo menos probable es un
valor muy cercano a cero y lo ms factible es una probabilidad muy grande de
presentarse el evento.
Densidad de probabilidades de los eventos de un suceso.
xi

Pxi

5 caras iguales
4 caras iguales, 1 diferente
3 caras iguales, 2 diferentes
2 caras iguales, 3 diferentes
1 cara , 4 diferentes
0 caras , 5 diferentes
Total

1/7776 = 0.00013
25/7776 = 0.0032
250/7776 = 0.032
1250/7776 = 0.161
3125/7776 = 0.40
3125/7776 = 0.40
7776/7776 = 0.99633

El clculo de probabilidades explicado corresponde al modelo estadstico


denominado prueba binomial, llamado as en funcin de que est sujeto a la
distribucin binomial, es decir, a la forma del desarrollo de un binomio cuando se
eleva a determinada potencia, como se ve en la siguiente tabla, en la que el
binomio p + q se eleva a distintos exponentes.
Potencia de un binomio (p + q)
Binomio y potencia Desarrollo
(p + q)0
(p + q)1
(p + q)2
(p + q)3
(p + q)4
(p + q)5
(p + q)n

1
p+q
p2 + 2pq + q2
p3 + 3p2q + 3pq2 + q3
p4 + 4p3q + 6p2q2 + 4pq3 + q4
p5 + 5p4q + 10p3q2 + 10p2q3 + 5pq4 + q5
pn + npn-1q + ............................ qn

Prueba ji cuadrada de Pearson


(Para una muestra)
La prueba estadstica de X2 para una muestra se emplea frecuentemente como
prueba de bondad de ajuste, sin embargo, en un plan experimental, en el que se
cuenta con un grupo muestral, con diversas subclases y las mediciones estn en
escala nominal, resulta muy til este procedimiento.
La eficacia de la prueba est de acuerdo con el tamao de la muestra, pues con un
grado de libertad, si hay dos subclases, algunos autores consideran que la prueba
es insensible, no obstante la informacin que aporta ms de dos categoras es
satisfactoria en funcin de la frmula:
Dnde:
X2 = valor estadstico de ji cuadrada.
fo = frecuencia observada.
fe = frecuencia esperada.

La ji cuadrada se utiliza cuando:

Cuando los datos puntualizan a las escalas nominal u ordinal.


Se utiliza solo la frecuencia.
Poblaciones pequeas.
Cuando se desconocen los parmetros media, moda, etc.
Cuando los datos son independientes.
Cuando se quiere contrastar o comparar hiptesis.
Investigaciones de tipo social - muestras pequeas no representativas >5.
Cuando se requiere de establecer el nivel de confianza o significatividad en
las diferencias.
Cuando la muestra es seleccionada no probabilsticamente.
X2 permite establecer diferencias entre f y se utiliza solo en escala nominal.
Poblacin > a 5 y < a 20.

Pasos.
1. Arreglar las categoras y las frecuencias observadas.
2. Calcular los valores tericos esperados para el modelo experimental o tipo
de distribucin muestral: normal, binomial y de Poisson.
3. Calcular las diferencias de las frecuencias observadas en el experimento con
respecto a las frecuencias esperadas.

4. Elevar al cuadrado las diferencias y dividirlas entre los valores esperados de


cada categora.
5. Efectuar la sumatoria de los valores calculados.
6. Calcular los grados de libertad (gl) en funcin de nmero de categoras [K]:
gl = K - 1.
7. Comparar el estadstico X2 con los valores de la distribucin de ji cuadrada
en la tabla.
8. Decidir si se acepta o rechaza la hiptesis X2c X2t se rechaza Ho.

Ejemplo:
Un investigador quiere comparar si hay diferencias en la cantidad de cigarros
fumados por causa del estrs en personas que trabajan.
Eleccin de la prueba.
El modelo experimental tiene una muestra.

Planteamiento de la hiptesis.
Hiptesis alterna (Ha). Habr diferencia significativa entre la cantidad de
cigarros fumados por causa del estrs en personas que trabajan.
Hiptesis nula (Ho). No Habr diferencia significativa entre la cantidad de
cigarros fumados por causa del estrs en personas que trabajan.
Nivel de significacin.

Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.

Zona de rechazo.

Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.

Aplicacin de la prueba estadstica.

El clculo de la frecuencia esperada se efecta en virtud de que para una hiptesis


nula, a todas las casillas corresponde un valor igual, por lo tanto:

fo = 18
fe = 6

gl = 3 + 1 = 2
a = 0.05
El valor calculado de X2 se compara con los valores crticos de la tabla de valores
crticos de X2. Se puede observar que para una probabilidad de 0.05 corresponde la
cifra de 5.99; por lo tanto, el estadstico ji cuadrada de 4.3 tiene una probabilidad
mayor que 0.05.

Decisin.

En virtud de que la probabilidad obtenida al calcular el valor de X2 est dentro de la


regin de rechazo, se acepta Ho y se rechaza Ha. X2c X2t se rechaza Ho
Entonces
tenemos
que:
4.3 < 5.99 se acepta Ho \ No hay diferencias significativas entre el consumo de
cigarros por causa del estrs.

Interpretacin.

El consumo de cigarros por causa del estrs se puede considerar como efecto del
azar.

Prueba ji cuadrada de Pearson


(Para dos y ms muestras independientes)
Cuando las observaciones de una investigacin corresponden a muestras
independientes y las mediciones se tienen en escala nominal, la prueba de ji
cuadrada es el procedimiento de eleccin para el contraste de hiptesis. Esta
prueba estadstica se emplea en el anlisis de dos o ms grupos y de dos o ms
variables.
La eficacia de la prueba no se ha determinado con exactitud; sin embargo, a
medida que el tamao de la muestra aumenta, el valor de probabilidad de error
para aceptar hiptesis alternas (Ha o Ho) se acerca a 1. En sentido opuesto, cuando
el nmero de la muestra es menor que 20, se pierde eficacia. En estas condiciones,
es conveniente no aplicar la prueba de ji cuadrada, pero existen alternativas.
a. Si en el modelo experimental se tiene una tabla de contingencias de 2 X 2 y
la muestra total es menor a 20 e incluye cero en alguna casilla, la prueba
estadstica aconsejable ser la de probabilidad exacta de Fischer y Yates.
b. Con grupos mltiples, pero con frecuencias pequeas, menores que cinco,
se recomienda usar la prueba de ji cuadrada de proporciones.
Las dos alternativas propuestas aumentan notoriamente la eficacia con muestras de
tamao pequeo y se limita la probabilidad de cometer el error del tipo I.
La frmula es:
Dnde:
X2 = valor estadstico de ji cuadrada.
fo = frecuencia observada.
fe = frecuencia esperada.

Pasos:

1. Arreglar las observaciones en una tabla de contingencias.


2. Determinar el valor terico de las frecuencias para cada casilla.
3. Calcular las diferencias entre los valores observados con respecto a los
tericos de cada casilla.
4. Elevar al cuadrado las diferencias y dividirlas entre el valor terico de la
casilla correspondiente.
5. Obtener la sumatoria de los valores anteriores, que es el estadstico X2.
6. Calcular los grados de libertad (gl): gl = (K columnas -1) [H hileras -1].

7. El valor de X2 se compara con los valores crticos de ji cuadrada de la tabla


de valores crticos de X2 y de acuerdo con los grados de libertad, y se
determina la probabilidad.
8. Decidir si se acepta o rechaza la hiptesis X2c X2t se rechaza Ho.

Ejemplo:

Comparar si el factor gnero influyes en la cantidad de cigarros fumados por causa


del estrs en personas que trabajan.

Eleccin de la prueba estadstica.


El modelo experimental tiene dos muestras independientes

Planteamiento de la hiptesis.

Hiptesis alterna (Ha). Habr diferencia significativa entre la cantidad de


cigarros fumados por causa del estrs en hombres y mujeres que trabajan.
Hiptesis nula (Ho). No Habr diferencia significativa entre la cantidad de
cigarros fumados por causa del estrs en hombres y mujeres que trabajan.

Nivel de significacin

Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.

Aplicacin de la prueba estadstica.

Calculamos los valores tericos para cada casilla.

Una vez obtenidos los valores tericos, aplicamos la frmula.

= 0.05 + 1.49 + 0.18 + 0.04 + 1.23 + 0.16 = 3.15

Clculo de los grados de libertad (gl).


gl = (K - 1) (H - 1) = (3 - 1) (2 - 1) = 2
El valor 3.15 con 2 grados de libertad se compara con los valores crticos de ji
cuadrada; as, se puede observar que ala cifra 5.99 corresponde la probabilidad de
0.05, lo cual significa que el estadstico calculado tiene una probabilidad mayor que
0.05.
Decisin.
En razn de que el valor de ji cuadrada de 3.15 tiene una probabilidad mayor
que 0.05, cae en la zona de rechazo. Por tanto se acepta Ho y se rechaza Ha. X2c
< X2t se rechaza Ho
3.15 > 5.99 se rechaza Ho \ Si hay diferencias significativas entre el consumo de
cigarros por causa del estrs entre hombres y mujeres que trabajan.
Interpretacin.
El consumo de cigarros por causa del estrs entre hombres y mujeres que
trabajan, se debe a factores del azar.

Prueba ji cuadrada de Pearson.


(Para tres o ms muestras)

Ejemplo:

En una investigacin transversal de enfermedad diarreica en nios menores de seis


aos, un mdico tuvo el inters de conocer si existan diferencias respecto a
condicin socioeconmica de una poblacin a la que estudio.
Eleccin de la prueba estadstica
El modelo experimental tiene 3 o ms muestras independientes.

Planteamiento de la hiptesis.

Hiptesis alterna (Ha). La mayor frecuencia de la enfermedad diarreica se


observa en la condicin socioeconmica baja; a su vez, la mayor frecuencia
observada en nios sanos es la condicin alta. Estas diferencias son
significativas.
Hiptesis nula (Ho). Las diferencias que se observan en las frecuencias de
enfermedad diarreica en las tres clases socioeconmicas se deben al azar.

Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.
Para todo valor de probabilidad
mayor que 0.05, se acepta Ho y se
rechaza Ha.
Contingencia de la diarrea.

Aplicacin de la prueba estadstica.


Calculamos los valores tericos para cada casilla.
Una vez obtenidos los valores tericos, aplicamos la frmula.

Clculo de los grados de libertad (gl).


gl = (K - 1) (H - 1) = (2 - 1) (3 - 1) = 2
a = 0.05
El valor crtico de ji cuadrada con 2 grados de libertad ms cercano al calculado es
de 10.83, con una probabilidad igual a 0.001.
Decisin.
El estadstico calculado de 29.64 con 2 grados de libertad tiene una probabilidad
inferior a 0.001 y menor que 0.05, cayendo en el nivel de significancia. Por lo tanto,
se acepta Ha y se rechaza Ho.
Interpretacin.
Diferencias significativas entre las frecuencias observadas de enfermedad diarreica
en los tres grupos de condicin socioeconmica. La poblacin de nios de
condicin socioeconmica baja muestra la frecuencia ms alta de diarrea, con
respecto a los otros grupos sociales. Estas diferencias son significativas al nivel de
confianza de p menor que 0.001, segn la grfica siguiente.
Entre las clases socioeconmicas media y alta parece no existir diferencia alguna, lo
cual se puede comprobar al construir las tablas de contingencias y al ejecutar la
prueba X2 como ejercicio e interpretarla.
Contingencia 2 X 2; clase media y alta en oposicin a clase baja.

X2(1gl) = 29.66 p menor que 0.001


Contingencia 2 X 2; clase media y alta en oposicin a clase baja.

X2(1gl) = 0.008 p menor que 0.05

Prueba de bondad del ajuste mediante ji cuadrada


De los datos obtenidos en una experimentacin, a veces es necesario conocer el
tipo de distribucin a la cual se ajustan adecuadamente (normal, binomial o de
Poisson). As, el investigador podr tambin elegir el procedimiento estadstico ms
adecuado. Al respecto, es vlido el ejemplo siguiente:

Ejemplo:
Ajuste de datos para una distribucin normal, de un conjunto de mediciones en la
tabla de nios de 5 aos. Tamao de la muestra 100.
Eleccin de la prueba estadstica.
El modelo experimental tiene una muestra y nuestro objetivo es la bondad del
ajuste.
Planteamiento de la hiptesis.

Hiptesis alterna (Ha). Las frecuencias observadas difieren de las que


corresponden a una distribucin normal.
Hiptesis nula (Ho). Las diferencias observadas entre los valores observados
y los tericos se deben al azar.

Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Talla de nios de 5 aos de edad.

Aplicacin de la prueba estadstica.


Para calcular el valor terico, se debe aplicar el valor Z; por lo tanto, primero
se debe obtener el valor promedio y la desviacin estndar de los valores
por ajustar.

= 100.1
s = 3.91
En seguida se determinan los lmites reales de cada clase y se calcula el valor Z para
cada lmite real.

Para cada valor de Z, se localiza el valor del rea bajo la curva de valores Z.
Obtencin de valores tericos de la distribucin normal.

Una vez anotados los valores del rea bajo la curva normal para cada Z, se calcula
el rea que corresponde a cada talla. Para fines prcticos y a fin de ejecutar el
procedimiento, el signo de Z se mantiene en el valor del rea bajo la curva, y se
realiza de la manera siguiente:
Clase 90 - 93 = -0.4656 - (-0.4951) = 0.0295
Clase 94 - 97 = -0.2852 - (-0.4656) = 0.1804
Clase 98 - 101 = 0.091 - (-0.2852) = 0.3762
Clase 102 - 105 = 0.3944 - 0.091 = 0.3034
Clase 106 - 109 = 0.4884 - 0.3944 = 0.094

Cada valor del rea para la curva de clase se multiplica por el tamao de la muestra
(N); en este caso corresponde a 100. Para obtener los valores tericos, se
selecciona el valor entero ms cercano.
En seguida se aplica la ecuacin de X2.

X2 = S 1.333 + 0 + 0.105 + (-0.1) + (-0.111) = 1.227


Clculo de los grados de libertad.
gl = K - 1 - 1 = 5 - 1 - 1 = 3
El valor de X2 calculado con 3 gl se compara con los respectivos valores crticos de
la tabla de valores crticos de X2 y corresponde a 7.82 para una probabilidad de
0.05.
Decisin.
En virtud de que el valor calculado cae en la zona de rechazo, se acepta Ho y
se rechaza Ha.
Interpretacin.
Los valores de las frecuencias observadas para las cinco series de talla tienen
una distribucin normal y no difiere de los valores calculados en funcin de
las reas bajo la curva normal tipificada

Prueba ji cuadrada de proporciones


(Para tres o ms muestras independientes)
La prueba de ji cuadrada de proporciones (X2) es un modelo estadstico aplicable
cuando en el modelo experimental se tienen mltiples muestras (tres o ms
muestras) independientes.
La razn de dicha prueba estadstica radica en que si el tamao de las muestras es
pequeo (menor que 5), conservar la misma eficacia que la X2 de Pearson con
tamaos grandes de muestra.
La frmula de esta prueba es:
Dnde:
X2 = estadstica de ji cuadrada.
= proporcin promedio de que acontezca
el suceso.
= proporcin promedio de que no
acontezca el suceso, expresada en
proporcin.
p = proporcin observada del suceso.
Ni = tamao de la muestra del subgrupo.
Pasos.
1. Elaborar una tabla de contingencias y calcular las proporciones de cada
subgrupo. Determinar las probabilidades promedio de que acontezca o no
el suceso.
2. Calcular las diferencias de las probabilidades observadas con respecto a la
probabilidad promedio (p - ), elevarlas al cuadrado (p - )2, multiplicarlas
por el tamao de la muestra del subgrupo y obtener la sumatoria Ni (p )2.
3. Calcular el recproco del producto de y
4. Multiplicar este ltimo valor por la sumatoria calculada, que corresponde al
estadstico X2p.
5. Calcular los grados de libertad y el nmero de hileras -1 (H - 1).
6. Comparar el estadstico de ji cuadrada de proporciones en la tabla de
valores crticos de X2, de modo que se obtenga la probabilidad.
7. Decidir si se acepta o rechaza la hiptesis.

Ejemplo:
Un investigador desea conocer el efecto que ejerce el ambiente fsico de sobre
estimulacin en las caractersticas estructurales del cerebro, de manera que lo
propone como alternativa para mejorar las alteraciones que la desnutricin
proteico calrica produce en el encfalo. En virtud de ello, planea un diseo
experimental con 24 ratas de la raza Wistar, a la mitad de las cuales induce a la
desnutricin con una dieta baja en protenas. A las ratas restantes les aporta una
dieta normal para roedores. Divide estos dos subgrupos de animales en tres
condiciones ambientales.

Al trmino del experimento, los animales son sacrificados y se les extrae el cerebro,
para obtener el peso hmedo. El investigador considera a la masa total como un
primer indicador de los cambios estructurales del encfalo.
En virtud de que los pesos enceflicos poseen varianzas desiguales, no se
distribuyen normalmente y los intervalos de los pesos no tienen una progresin
aritmtica, el investigador decide no utilizar una prueba paramtrica. Por ello, elige
distribuir los pesos en funcin de la mediana.

Eleccin

de

la

prueba

estadstica.
El modelo experimental tiene tres o ms grupos independientes. Vase:
Estadstica/Flujogramas/Flujograma 4
Planteamiento de la hiptesis.
Hiptesis alterna (Ha). Las frecuencias observadas de las ratas, cuyos pesos
se distribuyeron en funcin de la mediana, muestran diferencias
significativas entre bien nutridos y desnutridos. Asimismo, hay diferencias en
los animales aislados y estimulados.
Hiptesis nula (Ho) Las diferencias en las frecuencias en la distribucin con
base en la mediana de los pesos enceflicos se deben al azar.
Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.

Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.

Aplicacin de la prueba estadstica.

Las frecuencias observadas de los pesos cerebrales distribuidos en funcin de la


mediana y el clculo de las proporciones para cada subgrupo.
Peso enceflico de 24 ratas.

Clculo de los grados de libertad (gl).


gl = H - 1 = 6 - 1 = 5
2
El estadstico X p de 12 se compara con los valores crticos de X2 y se determina la
probabilidad. Se puede observar que el valor de 11.07 con cinco grados de libertad
corresponde a un valor de p igual a 0.05. El calculado es mayor que el crtico y, por
lo tanto, con p menor que 0.05.
Decisin.
En razn de que el valor estadstico tiene una probabilidad menor que 0.05,
cae en el nivel de significancia, de manera que se acepta Ha y se rechaza Ho.
Interpretacin.
Existen diferencias significativas, al nivel de confianza de p menor que 0.05,
entre las frecuencias de los pesos de los cerebros distribuidos en relacin
con la mediana. En los animales bien nutridos se observan bajas frecuencias
inferiores a la mediana, en oposicin a lo observado en ratas desnutridas.
Respecto al ambiente, parece que no hay diferencias entre los aislados y los
estimulados; sin embargo, al aplicarse la prueba estadstica, los animales no
contestan la pregunta planteada por la hiptesis alterna, en el sentido de que en
los estimulados y los aislados tambin existen diferencias.

Prueba de probabilidad exacta de Fischer y Yates


Esta prueba estadstica se utiliza frecuentemente como alternativa, cuando no se
puede aplicar la ji cuadrada de Pearson. Es un procedimiento ms eficaz en la
escala nominal con dos muestras independientes. La razn de esto se basa en que
se calcula directamente la probabilidad de una serie de arreglos de frecuencias
observadas en una tabla de contingencia de 2 X 2, dada en una distribucin
hipergeomtrica.
La ecuacin para calcular la probabilidad exacta de Fischer y Yates es la siguiente:

Pasos.
1. Arreglar las frecuencias observadas en una tabla de contingencia 2 X 2.
+ Muestra I A B
Muestra II C D
2. Obtener los totales de las hileras (A + B) y (C + D) y de las columnas: (A + C)
y (B + D), as como el gran total (GT).
3. Obtener los valores factoriales de los totales de hileras y columnas y
despus multiplicarlos.
4. Calcular los factoriales del gran total y multiplicar ste por todos los
factoriales de cada casilla de la tabla de contingencia.
5. Dividir el primer valor de producto de factoriales entre el segundo. Este
resultado es la probabilidad exacta de Fischer y Yates.
6. Decidir si se acepta o rechaza la hiptesis, en funcin de la probabilidad.

Ejemplo:
Un investigador rene una muestra de 15 sujetos con problemas de obesidad. Elige
al azar a 7 pacientes para ensayar una nueva tcnica teraputica para bajar de
peso, y a los 8 restantes les aplica una tcnica usada regularmente para el mismo
efecto.
Eleccin de la prueba estadstica.
Se tiene un modelo experimental con dos muestras independientes

Planteamiento de la hiptesis.
Hiptesis alterna (Ha). Existe mayor frecuencia de perder peso al aplicar la
nueva tcnica teraputica, en comparacin con lo observado al aplica una
tcnica usada regularmente.
Hiptesis nula (Ho). Las diferencias observadas en las dos tcnicas
teraputicas se deben al azar.

Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.

Aplicacin de la prueba estadstica.

El valor de probabilidad calculado es menor que el nivel de significacin (0.05).


Decisin.
En virtud de que la probabilidad exacta de Fischer y Yates es menor que
0.05, cae en el nivel de significacin; por lo tanto, se acepta Ha y se rechaza
Ho.
Interpretacin.
La nueva tcnica teraputica es significativamente efectiva para el
tratamiento de la obesidad, a un nivel de confianza de p = 0.03.

Prueba de McNemar
( Para muestras dependientes)

Este procedimiento es til cuando las muestras son dos y resultan dependientes. EL
tipo de escala es nominal.
Dicha prueba estadstica es un equivalente de la prueba t de Student para muestras
dependientes y slo aplicable cuando existen dos momentos: antes y despus.
Cuando en el momento experimental hay diversos momentos de cambio con base
en uno previo, convendr utilizar la prueba Q de Cochran. Ambos procedimientos
se distribuyen igual que la ji cuadrada, por lo que el estadstico calculado se
simboliza como ji cuadrada.
La ecuacin es la siguiente:

Pasos:

1. Arreglar los datos en funcin de una tabla de contingencias 2 X 2, como se


muestra abajo, donde las casillas A y D corresponden a los cambios
realizados en el tratamiento; por su parte, las casillas C y B no mostraron
cambio alguno. Los signos sealan los cambios que se suscitaron de antes a
despus del tratamiento.

2. Aplicacin de la ecuacin de McNemar, la cual da a entender la diferencia


existente entre las casillas A y D, que son los cambios realizados en el
experimento: restar 1 (corresponde a la correccin de continuidad), elevarlo
al cuadrado y dividirlo entre la sumatoria de A + D. Esto representa el valor
de ji cuadrada de la prueba de McNemar.
3. Calcular los grados de libertad, que como es obligado para este
procedimiento, siempre sern iguales a uno.
4. Comparar el valor estadstico calculado para valores crticos de ji cuadrada.
5. Decidir si se acepta o rechaza la hiptesis.

Ejemplo:

Un investigador en medicina preventiva observa que los empleados en una fbrica


padecen frecuentemente un cuadro diarreico, motivo de gran ausencia. Todos los
empleados comen en el comedor de la fbrica como goce de una prestacin
laboral. El investigador supone que el comn denominador de la causa de la
diarrea es el sitio de ingestin de alimentos, es decir, existe una higiene inadecuada
en la preparacin de la comida; sin embargo, la higiene personal de los empleados
no es suficiente para atribuir toda la culpa al personal de la cocina. Por lo tanto,
elige una muestra al azar de 50 individuos, de los cuales resulta que 34 de ellos
presentan un cuadro diarreico frecuente y 16 no lo padecen. As, sugiere que, bajo
vigilancia, se apliquen medidas de higiene personal, consistentes en exhaustivo
lavado de manos antes de ingerir alimentos, en un perodo de dos semanas.
Al finalizar el tratamiento, obtiene los resultados siguientes: de los 34 sujetos con
un cuadro diarreico frecuente, despus del tratamiento de lavado de manos, 16
lograron hacer desaparecer el proceso intestinal y 18 persistieron con evacuaciones
diarreicas; a su vez, el grupo de 16 personas asintomticas, cuatro de ellas
presentaron diarrea a pesar del lavado de manos y 12 se mantuvieron en las
mismas condiciones.
Eleccin de la prueba estadstica.
El modelo experimental tiene dos muestras dependientes.

Planteamiento de la hiptesis.
Hiptesis alterna (Ha). El lavado de manos, como medida preventiva y factor
de higiene personal, presenta cambios significativos de enfermedad
diarreica en los empleados que asisten al comedor de la fbrica en estudio.
Hiptesis nula (Ho). Las diferencias que se observan en las frecuencias de
cambio por el lavado de manos se deben al azar.
Nivel de significacin.

Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.

Zona de rechazo.

Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.

Resultado de la contingencia 2 X 2.

Aplicacin de la prueba estadstica.

Clculo de los grados de libertad (gl).


gl = 1.
El estadstico X2 de McNemar se compara con los valores crticos de ji cuadrada.
Con un grado de libertad, se observa que 3.84 corresponde a una probabilidad de
0.05, mientras que el clculo corresponde a una probabilidad menor que 0.05.

Decisin.

Interpretacin.

En razn de que el valor de X2 calculado tiene una probabilidad menor que


0.05, cae en el nivel de significancia, por lo tanto, se acepta Ha y se rechaza
Ho.
El lavado de manos ejerci significativos cambios en la enfermedad diarreica
de los empleados de la fbrica, lo cual significa que la higiene personal
deficiente contribuye de manera notoria en la frecuencia del proceso
intestinal, causa del ausentismo.
La aplicacin de la prueba estadstica no cancela la participacin de la
higiene defectuosa en la preparacin de los alimentos por parte del personal
de la cocina, pues 4/16 empleados, que haban estado asintomticos y bajo
exhaustivo lavado de manos antes de comer, manifestaron diarrea; sin
embargo, la prueba estadstica revela que la higiene personal participa de
manera ms significativa que el defecto en la preparacin de la comida.

Prueba Q de Cochran
(Para tres o ms muestras dependientes)
La prueba Q de Cochran es una tcnica estadstica, extensin de la prueba de
McNemar, que se utiliza en los modelos experimentales con tres o ms muestras
dependientes o relacionadas entre s, es decir, esta poblacin sirve como su propio
control, en el que existe un perodo previo y otro ulterior; adems, el tipo de escala
debe ser nominal.
El valor calculado en la prueba Q de Chochran se distribuye igual que la ji
cuadrada, por lo cual el smbolo utilizado ser X2Q.
La ecuacin es la siguiente:
Dnde:
X2Q = estadstico ji cuadrada de la
prueba Q de Cochran.
K = nmero de tratamientos.
Gn = nmero total de respuestas
de cambio de cada tratamiento o
columna.
Lc = nmero total de respuestas de
cambio por individuo de la
muestra o hileras.

Pasos:
1. Arreglar la muestra individualmente con sus respuestas de cambio.
2. Efectuar las sumatorias de cambios por cada tratamiento o columna (Gn
y S Gn).
3. Efectuar la sumatoria de cambios por cada hilera y elevarla al cuadrado y, a
su vez, las sumatorias de stas (S Lc y S Lc2).
4. Aplicar la frmula de la prueba Q de Cochran, de modo que se obtenga el
valor X2Q.
5. Calcular los grados de libertad (gl) con K tratamientos -1.
6. Comparar el estadstico X2Q obtenido con respecto a los gl en la distribucin
de ji cuadrada.
7. Decidir si se acepta o rechaza la hiptesis.

Ejemplo:
Un psiclogo investiga el aprendizaje simple en 15 ratas, a las que aplica cuatro
tratamientos diferentes a intervalos de un mes cada uno, para lo cual utiliza
laberintos distintos.
Los tratamientos corresponden a cuatro frmacos, que segn afirman los
fabricantes de los productos, tienen capacidad para facilitar el aprendizaje.
El investigador, para evitar que por efectos acumulativos de los frmacos pudiera
haber error, al suponer que una droga administrada en el cuarto perodo incidiera
en mayor aprendizaje, aplica en secuencias y aleatoriamente los tratamientos, de
modo que las respuestas de los animales emitidas en el laberinto, en funcin de un
perodo fijo (tiempo crtico determinado por el experimentador), le permiten
discriminar si fueron positivas (1) o negativas (0).
En los cambios ejercidos en el aprendizaje de las ratas y que se evalan como 1 y 0,
se toma la referencia con respecto al inicio del experimento para cada animal. Por
tanto, se considera que se trata de muestras dependientes y por diversos perodos.
Eleccin de la prueba estadstica.
El modelo experimental tiene tres o ms muestras dependientes.
Planteamiento de la hiptesis.

Hiptesis alterna (Ha). Los frmacos favorecen el aprendizaje simple en las


ratas en estudio. De esta forma, se muestran diferencias significativas entre,
antes y despus de los tratamientos.
Hiptesis nula (Ho). Los cambios observados entre los perodos previo y
posterior a los tratamientos se deben al azar.
Nivel de significacin.

Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.

Solucin de laberintos.

Aplicacin de la prueba estadstica.

Clculo de los grados de libertad (gl).


gl= K (tratamientos) - 1 = 4 - 1 = 3
El estadstico X2Q calculado se compara con los valores crticos de la distribucin de
ji cuadrada y se localiza con 3 gl y un valor de 7.82 con una probabilidad igual a
0.05. De esta manera, la cifra 6.06 tiene una probabilidad mayor que 0.05.
Decisin.
En razn de que el estadstico calculado tiene una probabilidad mayor que
0.05, cae en la zona de rechazo, por lo cual se acepta Ho y se rechaza Ha.
Interpretacin.
Ningn frmaco a nivel experimental en ratas produjo un cambio
significativo y parece que se debe al azar, aun cuando en el tercer
tratamiento, 12 de 15 ratas presentaron cambio positivo. Esto seguramente
ocurri debido al tamao de la muestra, y el investigador habr de
aumentar el nmero de animales para definir mejor el fenmeno.

Anlisis secuencial
Inicialmente, la prueba estadstica de anlisis secuencial fue un procedimiento
aplicable en fbricas, para un mejor control de calidad. De acuerdo con este
principio, se planteaba de la manera siguiente:
P1 = proporciones de calidad satisfactoria.
a = probabilidad de rechazar un lote de calidad aceptable.
P2 = proporcin de calidad inaceptable.
b = probabilidad de aceptar un lote de calidad inaceptable.
En las ciencias psicolgicas, existen problemas que se pueden plantear de manera
similar -en trminos de un estricto sentido matemtico-, pues diversas
observaciones no permiten avanzar en la investigacin, debido a que implican
cambios muy lentos y el nmero de datos disponibles est en razn de la
esperanza de vida del observador, ms que de su inters o capacidad para trabajar
en esta tarea. Algunas enfermedades son raras y el mejor mtodo para adquirir los
conocimientos y la capacidad necesarios a fin de ayudar a las vctimas consiste en
utilizar una tcnica acumulativa en el anlisis de las observaciones.
En ese orden de ideas, se pudo advertir que en la investigacin psicolgica existen
algunos diseos experimentales en los que este modelo estadstico se ajusta
adecuadamente. El ejemplo ms claro es aquel en el que el investigador, una vez
que colecta una muestra de un tamao suficiente, con respecto al fenmeno por el
cual est interesado, slo logra reunir pocos casos. La magnitud de esta muestra se
debi al azar.
El planteamiento bajo el aspecto de la investigacin se realiza de la forma
siguiente:
Pa = proporcin de calidad inaceptable para Ha.
a = probabilidad de rechazar la hiptesis de nulidad (Ho).
Po = proporcin de calidad inaceptable para Ho.
b = probabilidad de rechazar la hiptesis alterna (Ha).

Pasos:
1. Obtener las frecuencias del fenmeno por estudiar (Pa y Po) e imponer los
valores de la probabilidad.
2. Calcular las pendientes para delimitar las zonas de aceptacin y rechazo de
las hiptesis (Ha y Ho).
3. Graficar las pendientes de regresin de las zonas limitadas y anlisis de la
casustica en funcin de la frecuencia acumulada en la grfica.
4. Aplicar el formulario, que en el curso de esta seccin se expondr con el fin
de calcular los valores del tamao de la muestra para cada valor de la escala
de probabilidad (0, Po, Po + Pa / 2, Pa y 1.
5. Decidir si se acepta o rechaza la hiptesis o si se contina la observacin,
respecto al tamao de la muestra calculada.

Ejemplo:
Un investigador est interesado en demostrar que la administracin por va oral de
grandes volmenes de lquido condiciona un factor de morbilidad y letalidad en el
periodo perinatal en 364 recin nacidos. De esta forma, elige dos grupos al azar, a
uno de los cuales le administra pequeos volmenes de lquidos y al otro un gran
volumen. Entre los diversos aspectos analizados, existe un grupo de 24 bebs que
manifestaron permeabilidad del conducto arterioso (PCA), de los cuales 13
mostraron insuficiencia cardiaca y 11 no la tuvieron. El investigador los relaciona en
funcin de los ingresos de lquidos.
Eleccin de la prueba estadstica.
El modelo experimental tiene dos muestras independientes.

Planteamiento de la hiptesis.

Hiptesis alterna (Ha). La muestra obtenida aleatoriamente de un total de


364 nios nacidos revela una alta morbilidad de insuficiencia cardiaca en la
permeabilidad del conducto arterioso, debida a un alto ingreso de lquidos
por va oral.
Hiptesis nula (Ho). Con el tamao de la muestra obtenida aleatoriamente,
los cambios observados son producto del azar. No hay diferencias entre
ambos grupos por la ingestin de lquidos por va oral.

Nivel de significacin.

La frecuencia acumulada de casos de insuficiencia cardiaca y alto volumen de


lquidos alcanz una zona de aceptacin, donde alfa (a) = 0.05.
Zona de rechazo.
La frecuencia acumulada de casos de insuficiencia cardiaca y bajo volumen de
lquidos alcanz la zona de aceptacin de Ho, donde beta (b) = 0.05.
Observacin en parejas de nios recin nacidos.

Aplicacin de la prueba estadstica.

Pa = proporcin de bebs sin insuficiencia cardiaca y con alto volumen de lquidos


= 1/12 = 0.08
a = 0.05
Po = proporcin de insuficiencia cardiaca y baja ingestin de lquidos = 2/12 =
0.17
b = 0.05

Formula:
Las pendientes por calcular se basan en la ecuacin de la lnea recta que sigue:
Y = bX + a
Dnde:
Y = valores del eje de las ordenadas.
a = punto de interseccin de la pendiente en el eje de las ordenadas.
b = incremento de Y cuando aumenta X.
X = valores del eje de las abscisas.
Clculo de las pendientes.

Al sustituir las literales de la ecuacin de la lnea recta, se construyen dos


ecuaciones de las pendientes:

De las dos frmulas anteriores, se simplifica y queda:

De acuerdo con la ecuacin anterior, se calculan los lmites de los errores a y b, es


decir, se delimitan las zonas de aceptacin y rechazo de la hiptesis, se analiza
cada observacin del investigador, y luego se grafica en frecuencias acumuladas de
valores absolutos.
En funcin de las ecuaciones calculadas, queda como sigue:
Y y Y' = 0.1366X 3.908

En seguida se calculan dos puntos de la recta, en el sentido de qu frecuencia se


espera cuando la poblacin total es cero y cul otra con un valor diferente de cero.
Y = 0.1366 (0) + 3.908 = 3.908
Y' = 0.1366 (0) - 3.908 = 3.908
Segn el valor X = 5
Y = 0.1366 (5) + 3.908 = 4.591
Y' = 0.1366 (5) - 3.908 = 3.225
Los valores de Y corresponden a los lmites de la zona de rechazo de Ho y
aceptacin de Ha, mientras que los correspondientes a Y' limitan la zona de
aceptacin de Ho y rechazo de Ha. En la figura se dibujan los puntos
correspondientes y se unen con una lnea, como se ve en la grfica siguiente.

Lmites de las zonas de aceptacin y rechazo.


Posteriormente se analiza cada caso y se dibujan en puntos de frecuencia
acumulada, por ejemplo, en la tabla anterior muestra las observaciones del
investigador, y se aprecia que la pareja 1 exhibe insuficiencia cardiaca y un gran
volumen de la ingesta, adems de estar acorde con la hiptesis alterna. Por lo
tanto, se dirige hacia el lado positivo, donde se ubica el error alfa. Las parejas 2, 3 ,
4, 5 y 6 tienen la misma caracterstica y continan acumulndose en el lado
positivo; en cambio, las parejas 7 y 8 no son congruentes con Ha, por lo cual no
pueden acumularse y se mantienen en el mismo nivel. A su vez, las parejas
subsecuentes estn de acuerdo con Ha y se acumulan.
Con la frecuencia acumulada, el grupo alcanz y rebas la lnea lmite del error alfa,
y la probabilidad de error fue menor que 0.05.

Decisin.
El estudio presentado, con el tamao de la muestra disponible, alcanz la
zona de error alfa mediante la acumulacin de sus frecuencias, por lo cual se
acepta Ha y se rechaza Ho.
Interpretacin.
En el ejemplo se verifica que el tamao de la muestra de la poblacin
estudiada fue suficiente para comprobar la hiptesis de trabajo del
investigador. En este sentido, los nios recin nacidos mostraron aumento
en la morbilidad y mortalidad por insuficiencia cardiaca, en presencia de
permeabilidad del conducto arterioso e ingestin de un gran volumen de
lquidos. Por otra parte, tambin es cierto que a los nios de la misma
cardiopata se les previno la insuficiencia cardiaca, al restringirles la ingestin
de lquidos.
Bajo el supuesto de que la frecuencia acumulada no hubiera alcanzado
cualquiera de las zonas y se hubiera mantenido en el rea intermedia, se
debe aplicar el formulario para determinar los valores promedio del tamao
de la muestra para cada probabilidad. Para fines de aprendizaje, se
desarrollarn e interpretarn como se indica en la siguiente tabla.
Valores de aceptacin y rechazo.

Dicha tabla muestra los valores promedio del tamao de la muestra, y se puede
observar que cuando la probabilidad es (Pa + Po) / 2 le corresponde la cifra 112.
Esto significa que el estudio requiere tal tamao de muestra y no necesariamente
los 364 recin nacidos, con quienes se llev a cabo el estudio.

Para la probabilidad de Po, el valor promedio de muestra es de 62 nios recin


nacidos. De stos, si 29 no presentan insuficiencia cardiaca con una gran ingestin
de lquidos en la existencia de permeabilidad del conducto arterioso, se aceptar
tcitamente Ho; en cambio, de un conjunto de 77 recin nacidos, si slo cuatro o
un valor cercano a cuatro presentan la cardiopata e insuficiencia cardiaca con alta
ingestin de lquidos por va oral, ello ser suficiente para aceptar Ha.
Se debe tener en cuenta que los valores promedio de la muestra en relacin con
cada probabilidad se han calculado en funcin de las proporciones originales del
estudio, es decir, Pa = 0.17 y Po = 0.08.
Clculos.
Utilizando el formulario de la tabla anterior, tenemos que:

Como se apreci, las tcnicas disponibles para anlisis secuencial requieren algo
ms que clculos matemticos que la mayora de los procedimientos estadsticos
descritos en cualquier libro de estadstica. Estas pruebas estadsticas de anlisis
secuencial permiten no slo interpretar los resultados de una investigacin, sino
tambin saber si el tamao de la muestra fue suficiente para demostrar las
hiptesis.

Prueba de Kolmogorov-Smirnov
(Para una muestra)
La prueba de Kolmogorov-Smirnov para una muestra se considera un
procedimiento de "bondad de ajuste", es decir, permite medir el grado de
concordancia existente entre la distribucin de un conjunto de datos y una
distribucin terica especfica. Su objetivo es sealar si los datos provienen de una
poblacin que tiene la distribucin terica especificada.
Mediante la prueba se compara la distribucin acumulada de las frecuencias
tericas (ft) con la distribucin acumulada de las frecuencias observadas (f obs), se
encuentra el punto de divergencia mxima y se determina qu probabilidad existe
de que una diferencia de esa magnitud se deba al azar.
En las tareas de investigacin se pudo obtener un conjunto de observaciones, en
las cuales se supone que tienen una distribucin normal, binomial, de Poisson, etc.
Para el caso, las frecuencias de las distribuciones tericas deben contrastar con las
frecuencias observadas, a fin de conocer cul distribucin se adecua mejor al
modelo.

Pasos:

1. Calcular las frecuencias esperadas de la distribucin terica especfica por


considerar para determinado nmero de clases, en un arreglo de rangos de
menor a mayor.
2. Arreglar estos valores tericos en frecuencias acumuladas.
3. Arreglar acumulativamente las frecuencias observadas.
4. Aplicar la ecuacin D = ft - f obs, donde D es la mxima discrepancia de
ambas.
5. Comparar el valor estadstico D de Kolmogorov-Smirnov en la tabla de
valores crticos de D.
6. Decidir si se acepta o rechaza la hiptesis.

Ecuacin:
D = ft - fobs
En esta ecuacin se aprecia que el procedimiento es muy simple y quiz lo que
parezca ms complicado corresponde al clculo de la frecuencia esperada de cada
tipo de distribucin terica. Por lo tanto, en la marcha de los ejercicios se
presentar cada uno de ellos y la manera de aplicar la prueba estadstica.

Ejemplo:
En una investigacin, consistente en medir la talla de 100 nios de 5 aos de edad,
se desea saber si las observaciones provienen de una poblacin normal.

Eleccin de la prueba estadstica.

El modelo experimental tiene una muestra y es factible un arreglo en el carcter


ordinal o en los rangos de las series de clases.

Planteamiento de la hiptesis.

Hiptesis alterna (Ha). Los valores observados de las frecuencias para cada
clase son diferentes de las frecuencias tericas de una distribucin normal.
Hiptesis nula (Ho). Las diferencias entre los valores observados y los
tericos de la distribucin normal se deben al azar.

Nivel de significacin.

Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Tabla de 100 nios. Los valores X + s son 99.2 2.85.

Aplicacin de la prueba estadstica.


Primero se elaboran los clculos de los valores tericos esperados para la
distribucin normal.

Inicialmente se determina el valor Z de los lmites de cada clase en la serie, por


ejemplo: en la primera clase se determinan el lmite inferior y el superior (90 y 93), y
en las subsecuentes slo los lmites superiores (97, 101, 105 y 109). Para cada valor
de Z, se localiza el rea bajo la curva norma tipificada. (Vase: tabla de reas bajo la
curva normal tipificada de 0 a 2).
Los clculos de valores Z, son de la forma siguiente:
Y as sucesivamente.
Para cada valor Z, se localiza el rea de la curva tipificada de la tabla de nmeros
aleatorios. A partir de estos valores, se obtiene la diferencia entre los lmites de
clases entre el superior y el inferior, por ejemplo: 0.4997 - 0.4793 = 0.020, 0.4793 0.2357 = 0.2436, 0.2357 - (-0.2794) = 0.5151, -0.2794 - (-0.4854) = 0.206 y -0.4854 (-0.4994) = 0.014.
Estos resultados de diferencias se multiplican por el tamao de la muestra (100
nios), luego se obtienen las frecuencias tericas y despus se arreglan en
frecuencias acumuladas.
Clculos de los valores tericos.
Las frecuencias acumuladas tericas y las observadas se arreglan en los rangos
correspondientes, como se muestra en la siguiente tabla, y posteriormente se
aplica la frmula de Kolmogorov-Smirnov.
Clculo estadstico D de Kolmogorov-Smirnov.
D = ft - fobs = - 0.036
La diferencia mxima D es igual a -0.049, valor que se compara con los valores
crticos de D en la prueba muestral de Kolmogorov-Smirnov y se obtiene la
probabilidad de la existencia de esa magnitud de acuerdo con la prueba de
Kolmogorov-Smirnov. El valor N es 100 y el mayor nmero de N en la tabla es 35,
por lo cual se aplica la frmula al pie de la tabla:
Para la probabilidad de lo anterior quiere decir que para todo valor menor que el
crtico para una probabilidad de 0.05, la probabilidad correspondiente es mayor
que 0.05, y todo valor mayor que D al calculado tinen una probabilidad menor que
0.05, o sea, es inversamente proporcional al crtico determinado o localizado en la
tabla.
Decisin.
En virtud de lo anterior, el estadstico de Kolmogorov-Smirnov obtendo es menor
que el crtico y su probabilidad mayor que 0.05, por lo tanto, se acepta Ho y se
rechaza Ha.
Interpretacin.
Las frecuencias observadas y las tericas calculadas no difieren significativamente.
Por lo tanto, las observaciones tienen una distribucin normal.

Prueba de U Mann-Whitney
(Para dos muestras independientes)

Esta prueba estadstica es til cuando las mediciones se pueden ordenar en escala
ordinal (es decir, cuando los valores tienden a una variable continua, pero no
tienen una distribucin normal) y resulta aplicable cuando las muestras son
independientes.
Este procedimiento es una buena alternativa cuando no se puede utilizar la prueba
t de Student, en razn de no cumplir con los requisitos que esta prueba exige.
La frmula es la siguiente:
Dnde:
U1 y U2 = valores estadsticos de U MannWhitney.
n1 = tamao de la muestra del grupo 1.
n2 = tamao de la muestra del grupo 2.
R1 = sumatoria de los rangos del grupo 1.
R2 = sumatoria de los rangos del grupo 2.

Pasos:
1. Determinar el tamao de las muestras (n1 y n2). Si n1 y n2 son menores que
20, se consideran muestras pequeas, pero si son mayores que 20, se
consideran muestras grandes.
2. Arreglar los datos en rangos del menor al mayor valor. En caso de que
existan ligas o empates de rangos iguales, se debern detectar para un
ajuste posterior.
3. Calcular los valores de U1 y U2, de modo que se elija el ms pequeo para
comparar con los crticos de U Mann-Whitney de la tabla de probabilidades
asociadas con valores pequeos como los de U en la prueba de MannWhitney.
4. En caso de muestras grandes, calcular el valor Z, pues en estas condiciones
se distribuye normalmente.
5. Decidir si se acepta o rechaza la hiptesis.

Ejemplo para muestras pequeas:


Un experimentador utiliza dos mtodos para ensear a leer a un grupo de 10 nios
de 6 aos, quienes ingresan por primera vez a la escuela. El experimentador quiere
demostrar que el procedimiento ideado por l es ms efectivo que el tradicional;
para ello, mide el desempeo en la lectura en funcin de la fluidez, comprensin,
anlisis y sntesis.
El plan experimental preliminar consiste en elegir al azar tanto una muestra de 10
nios como el mtodo por utilizar.
Eleccin de la prueba estadstica.
El modelo experimental tiene dos muestras independientes. Las mediciones revelan
que no se satisfacen los requisitos para utilizar una media aritmtica, en razn de
que uno de los valores en cada muestra se aleja demasiado de las dems; por lo
tanto, no corresponde a una escala de intervalo, de manera que se decide usar una
escala ordinal. Vase: Estadstica/Flujogramas/Flujograma 2

Planteamiento de la hiptesis.

Hiptesis alterna (Ha). Las calificaciones de ejecucin de lectura, segn el


mtodo de enseanza del experimentador son ms altas y diferentes que las
observadas en el mtodo tradicional.
Hiptesis nula (Ho). Las diferencias observadas entre las calificaciones de
ejecucin de lectura mediante los dos mtodos se deben al azar.

Nivel de significacin.

Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Dos mtodos diferentes aplicados en dos grupos de nios.

Aplicacin de la prueba estadstica.

De acuerdo con los paso, las observaciones se deben ordenar en rangos del menor
al mayor.
Rangos de lectura de la tabla anterior.

Calculamos la U.
De los dos valores de U calculados, se elge el ms pequeo (4) y se comparan con
los valores crticos de U Mann-Whitney.
En caso de que el valor de U calculado no se localice en las tablas
correspondientes, se transformar en la frmula siguiente:
U = n1n2 - U'
En esta frmula, U' corresponde al valor ms alto.
Decisin.
A la probabilidad del valor U de Mann-Whitney, calculado anteriormente,
corresponde 0.048, el cual es ms pequeo que el nivel de significancia; por
lo tanto, se acepta Ha y se rechaza Ho.
Interpretacin.
Entre las calificaciones de la ejecucin de lectura mediante los dos mtodos
de enseanza existe una diferencia significativa a un nivel de probabilidad
de error menor que 0.05; es decir, aun cuando las muestras son pequeas,
las calificaciones ms altas mediante el mtodo diseado por el
experimentador sealan ms efectividad, con la probabilidad de equivocarse
de 0.048 para aceptarlo.

Prueba de Wilcoxon de rangos sealados y pares igualados


(para dos muestras dependientes)

Este modelo estadstico corresponde a un equivalente de la prueba t de Student,


pero se aplica en mediciones en escala ordinal para muestras dependientes.
Cuando el tipo de medicin no cumpla con los requisitos que la prueba t de
Student exige, la de Wilcoxon es una alternativa de aceptable eficacia para
contrastar hiptesis. El mtodo es aplicable a muestras pequeas, siempre y
cuando sean mayores que 6 y menores que 25. Las muestras grandes deben ser
mayores a 25 y ste se debe transformar en valor de Z, para conocer la
probabilidad de que aquella sea o no significativa.
Dicha prueba estadstica consiste en sumar los rangos de signo frecuente; por ello,
no se tiene una ecuacin o frmula, como se observa en otras pruebas estadsticas.
Se utiliza cuando:
Trabaja con datos de tipo ordinal.
Establece diferencias de magnitudes (+ y -).
Direccin.

Prueba de dos colas: No se sabe en que direccin se pueden dar las


diferencias.
Prueba de una cola: Si sabemos en que direccin estn las diferencias.
Dos muestras apareadas.
Establece las diferencias .
Con muestras grandes (> 25) se intenta lograr la distribucin normal (se
utiliza la prueba Z).

Pasos:
1. Arreglar las observaciones pareadas y obtener las diferencias de cada pareja.
2. Arreglar las diferencias en funcin de rangos como valores absolutos, sin
importar el signo, pero de manera que los rangos conserven el signo
correspondiente a la diferencia.
3. Obtener la sumatoria de los rangos cuyo signo es el menos frecuente, por
ejemplo: si el signo es +, se considerar para efectuar sumatorias; sin
embargo, la sumatoria mencionada finalmente pierde el signo.
4. Si se trata de muestras pequeas, comparar el valor obtenido con los valores
crticos de la tabla de Wilcoxon.
5. Distribuir las muestras mayores que 25 bajo la curva normal y, por tanto,
calcular el valor Z, en referencia al cual se debe consultar la probabilidad de
diferir con respecto al promedio en la tabla de probabilidades asociadas.
6. Decidir si se acepta o rechaza la hiptesis.

Ejemplo para muestras pequeas utilizando la prueba de dos colas:


Un investigador desea comparar el grado de hiperactividad en obesos cuando
estn en un programa para bajar de peso (dieta) y sin programa para bajar de
peso.
Eleccin de la prueba estadstica
Se tienen dos muestras dependientes y, por el tipo de medicin, es posible listarlas
en una escala ordinal.

Planteamiento de la hiptesis.

Hiptesis alterna (Ha). Existe diferencia significativa entre el grado de


hiperactividad en obesos cuando estn en un programa de dieta y sin el
programa de dieta.
Hiptesis nula (Ho). No existe diferencia significativa entre el grado de
hiperactividad en obesos cuando estn en un programa de dieta y sin el
programa de dieta, esto es debido al azar.

Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Aplicacin de la prueba estadstica.
Con base a los pasos, se obtienen las diferencias observadas en los incrementos de
hiperactividad en obesos, estando en un programa de dieta o no. Estos valores
podrn tener signos positivos y negativos, los cuales quedaran abolidos al
ordenarse los rangos y stos los adoptan.

Sumatoria de T = 15.5
El valor T de la prueba de Wilcoxon obtenido se compara con los valores crticos de
la tabla T en pruebas de rangos sealados de pares iguales de Wilcoxon, y se
puede apreciar que para ser significativo (es decir, por debajo de 0.05, que fue el
nivel de significancia), requiere que este 0.05 sea menor; por lo tanto, la
probabilidad es mayor que 0.05.
tc = 15.5
tt = 8
Para dos colas = a = 0.05
N= 10
tc tt \ rechaza Ho
Decisin.
En virtud de que la probabilidad es mayor que 0.05, se acepta Ho y se
rechaza Ha.
Interpretacin.
Las diferencias en el incremento o disminucin de la hiperactividad en
personas obesas con dieta o sin dieta, no son significativas. Estadsticamente
resultan iguales, en razn de que pueden ser diferencias dadas al azar.

Anlisis de varianza de una entrada de Kruskal-Wallis


(para ms de dos muestras independientes)
Esta prueba estadstica de anlisis de varianza de entrada simple de Kruskal-Wallis
es una extensin de la prueba de U Mann-Whitney, en razn de que se usan
rangos para su aplicacin; por otra parte, este procedimiento se emplea cuando el
modelo experimental contiene ms de dos muestras independientes.
Dicha prueba se define matemticamente de la forma siguiente:
Dnde:
H = valor estadstico de la
prueba de Kruskal-Wallis.
N = tamao total de la muestra.
Rc2 = sumatoria de los rangos
elevados al cuadrado.
ni = tamao de la muestra de
cada grupo.
L = ajuste dado por el ajuste de
ligas o empates de los rangos.
El ajuste L se calcula de la manera siguiente:
Dnde:
Li = valor de nmero de empates de un rango.
N = tamao total de la muestra.

Se utiliza cuando:

Cuando son diferentes tratamientos o condiciones.


Muestras pequeas.
Se utiliza escala ordinal.
Si las muestras se seleccionaron de las diferentes poblaciones.
Contrastar hiptesis (direccional o no direccional).

Pasos:
1. Ordenar las observaciones en rangos de todos los grupos, del ms pequeo
al mayor.
2. Asignar el rango para cada observacin en funcin de cada grupo de
contraste, elabora la sumatoria de rangos, elevar al cuadrado este valor y
dividirlo entre el nmero de elementos que contiene (ni).
3. Detectar las ligas o empates entre los rangos de cada grupo y aplicar la
ecuacin (L) para obtener el ajuste.
4. Aplicar la ecuacin de Kruskal-Wallis y obtener el estadstico H.
5. Calcular los rangos de libertad (gl): gl = K grupos - 1.
6. Comparar el estadstico H, de acuerdo con los grados de libertad, en la tabla
de distribucin de ji cuadrada en razn de distribuirse de forma similar.
7. Decidir si se acepta o rechaza la hiptesis.

Ejemplo:
Un investigador estudia el efecto benfico de cuatro sustancias anticonvulsionantes
(fenobarbital, difenilhidantoinato -DFH-, diacepam y clonacepam), para proteger
contra la muerte producida por un convulsionante, la tiosemicarbazida, la cual se
manifiesta despus de crisis clnica y tnica, respectivamente. El investigador elige
al azar a 24 ratones de la misma edad y peso y les inyecta anticonvulsionante
previamente a la tiosemicarbazida. A partir de este momento, inicia la cuenta en
tiempo, hasta que mueren los ratones; adems mide las observaciones en horas de
tiempo transcurrido.

Eleccin de la prueba estadstica.

Las mediciones se realizan en horas, por lo que la variable puede ser continua y, en
consecuencia, una escala de intervalo; sin embargo, algunos ratones no murieron y
el tiempo est calificado nominalmente como infinito. Este obstculo impide
concederle la calificacin de escala de intervalo, por lo cual se elige una escala de
tipo ordinal
Planteamiento de la hiptesis.
Hiptesis alterna (Ha). La proteccin de la muerte por drogas
anticonvulsionante contra el frmaco convulsionante tiosemicarbazida, se

muestra diferente entre los cuatro grupos, y hay mejor proteccin por el
diacepam.
Hiptesis nula (Ho). Las diferencias observadas en los cuatro grupos de
frmacos anticonvulsionantes, para evitar la muerte producida por la
tiosemicarbazida, se deben al azar.

Nivel de significacin.

Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Tiempo en horas que tarda el frmaco en causar la muerte en ratones.

Aplicacin de la prueba estadstica.

De acuerdo con los pasos, se inicia con el ordenamiento de todas las observaciones
a partir del valor ms pequeo hasta el mayor y la deteccin de las ligas o empates.

Arreglo de los datos para asignar rangos y detectar las ligas o empates.

Una vez efectuado el ordenamiento en rangos de las observaciones, se hacen las


sumatorias de los rangos. Para facilitar esta tarea, elabrese una tabla en la que
sustituyan los datos.
Sustitucin por rangos. Observaciones de la primera tabla.

Se calcula el valor de ajuste por ligas con la siguiente frmula:

Con el ajuste de L, se procede a calcular el valor estadstico de la prueba de


Kruskal-Wallis.

Calculamos los grados de libertad.


gl = K grupos - 1 = 4 - 1 = 3
El estadstico H calculado de 15.4, se compara con los valores crticos de ji
cuadrada. En seguida se busca en esa hilera la cifra de grados de libertad (3) hasta
el nivel de significancia de 0.05 y se observa el valor 7.82, hasta los crticos 11.34 y
16.27, donde se encuentra el calculado. Esto quiere decir que la probabilidad de
que exista una diferencia se halla a una probabilidad de error entre 0.01 y 0.001.
Decisin.
Como el valor estadstico H tiene una probabilidad menor que 0.01 y ste es
menor que el nivel de significancia, se acepta Ha y se rechaza Ho.
Interpretacin.
Entre las drogas anticonvulsionantes, existe diferencia significativa en cuanto
a la proteccin de muerte a los ratones cuando se les inyecta el frmaco
tiosemicarbazida. El diacepam se manifest principalmente con los rangos
ms altos y se muestra distinto de los dems anticonvulsionantes (vase la
siguiente figura).

Sumatoria de rangos de las observaciones.

Bibliografa.
Roberto Zavala Aguilar. Estadstica Bsica. Mxico: trillas, 2011
Jay L. Devore. Probabilidad y Estadstica. 7 edicin. Ao: 2008.
Editorial: CENGAGE Learning
Lincoln L. CHAO. Introduccin a la estadstica. Decima Noven
reimpresin. Mxico. Ao:2004. Editorial: Continental
Mario. F. Triola. Estadstica. 10 edicin. Pearson Educacin,
Mxico, 2009
Jhonson/ Patricia Kuby. Estadstica elemental lo esencial. 3
edicin. Ao: 2004. Editorial: Thomson
Jhon E. Freund. Irwin Miller. Marylees Miller. Estadstica
matemtica con aplicaciones. 6 edicin. Pearson educacin,
Mxico, 2000.
Willian Mendenhall. Robert J. Beaver. Barbara M. Beaver.
Introduccin a la probabilidad y estadstica. 12 edicion. Ao:
2008. Editorial: CENGAGE Learning

También podría gustarte