Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Introduccin.3
Conceptos Bsicos4
Objetivos...4
Tipos de Pruebas Paramtricas..5
..49
Anlisis secuencial.60
Bibliografa85
Introduccin.
La estadstica es una de las herramientas ms ampliamente utilizadas en la
investigacin cientfica. Su aplicacin en instituciones gubernamentales y
educativas, en los negocios y en la industria, en la banca y en otros quehaceres
diarios hacen de la estadstica una herramienta indispensable. Sin embargo el
trmino Estadstica tiene varios significados para diferentes personas; para la
gente comn y corriente la estadstica solamente significa nmeros. En el periodo
de la maana se pueden encontrar la estadstica ms reciente sobre los delitos de
la ciudad; de asesinatos, de robos de automviles; de asaltos y dems delitos que
hayan sido denunciados en determinado periodo de tiempo; de los nacimientos y
muertes que han ocurrido, o en relacin con el deporte, el nmero de partidos
ganados y perdidos por equipos integrantes de la liga de ese deporte. Para otras
personas es un mtodo para obtener, presentar y escribir grandes cantidades de
datos, y para otras es un mtodo para tomar decisiones en situaciones difciles. El
objetivo bsico de este fascculo es aclarar los significados de Estadstica, definir
sus conceptos bsicos utilizados con frecuencia y analizar los usos y abusos de los
mtodos estadsticos. Aunque los significados sean diferentes, todos ellos forman
parte del concepto total de Estadstica. La palabra tiene su sentido ms amplio
para aquellas personas cuyo trabajo requiere un conocimiento de los aspectos ms
tcnicos de la estadstica. Para estas personas, la palabra tiene relacin con
aquellos conceptos y tcnicas que se utilizan en la recopilacin, organizacin,
resumen, anlisis, interpretacin y comunicacin de informacin numrica. Estos
conceptos y tcnicas juegan un papel importante en las actividades que realizan los
profesionales de todas las ciencias.
Conceptos Bsicos.
La estadstica inferencial es una parte de la estadstica que comprende los
mtodos y procedimientos que por medio de la induccin determina propiedades
de una poblacin estadstica, a partir de una pequea parte de la misma. La
estadstica inferencial comprende como aspectos importantes:
Objetivo:
La estadstica inferencial tiene como objetivo generalizar los resultados de un
subconjunto de datos a todo el conjunto. Seguidamente se define los conceptos
bsicos de esta rama de la matemtica:
Definicin 1 Poblacin: conjunto de datos que se desea estudiar. Estos datos deben
verse como valores de una misma variable, la cual se utiliza para designar la
poblacin.
Definicin 2 Muestra: subconjunto de datos que se seleccionan de la poblacin. As,
la estadstica inferencial busca generalizar los resultados obtenidos en una muestra
a toda la poblacin. Si la muestra es igual a la poblacin, la generalizacin o
estudio se le llama censo y es exacta.
1. El nivel de medicin debe ser al menos de intervalo. Debemos tomar una decisin a
cerca de nuestra variable dependiente. Es realmente un nivel de intervalo? Si es
una escala no estandarizada, o si se basa en estimaciones o calificaciones con
humanos. Frecuentemente aparecen como intervalo pero lo reducimos a nivel
ordinal al darles rango.
Ms complicadas de calcular.
Limitaciones en los tipos de datos que se pueden evaluar.
Dnde:
Pasos:
1. Calcular el promedio y la desviacin estndar de las observaciones de la
muestra en estudio.
2. Del valor del cual se desea obtener una inferencia estadstica, calcular la
diferencia que existe con respecto al promedio: X.
3. Dividir la diferencia calculada entre la desviacin estndar obtenida de la
muestra en estudio, que corresponde al valor Z.
4. Localizar el valor Z calculado, en la tabla de probabilidades asociadas con
valores tan extremos como los valores observados de Z en la distribucin
normal y obtener la probabilidad de que exista una magnitud de
discrepancia entre los valores X y .
5. Decidir si se acepta o rechaza la hiptesis.
Ejemplo:
Un mdico que labora en una poblacin acostumbra efectuar mediciones de peso
y talla a sus pacientes, de los cuales dos tienen pesos que difieren de las tres
medidas de tendencia central, pero particularmente del promedio. El mdico est
interesado en saber si los pesos de sus dos pacientes corresponden a esa
poblacin y qu tanto difieren de la representacin de su grupo de asistencia
mdica y de estudio.Los pesos corporales de la poblacin estudiada se encuentran
listados del ms bajo al ms alto en la tabla siguiente, y el mdico ha marcado los
puntos donde se localizan la media aritmtica, la mediana y la moda. Los pesos de
sus pacientes problema son de 54 y 80 kg.
Planteamiento de la hiptesis.
o Hiptesis alterna (Ha). Los pesos corporales de los dos sujetos de
investigacin y asistencia mdica (54 y 80 kg) difieren
significativamente del promedio, por lo tanto, no corresponden a la
poblacin.
o Hiptesis nula (Ho). Las diferencias de los pesos de los sujetos de
estudio se deben al azar, por lo cual no hay diferencias significativas y
corresponden a la misma poblacin.
Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Decisin.
El valor de Z1 tiene una probabilidad menor que la de significancia. Para este caso,
se acepta Ha y se rechaza Ho. Para el valor de Z2, la probabilidad es
aproximadamente de 0.27, pero de cualquier manera mayor que el nivel de
significancia, el cual se ubica en la zona de rechazo. Se acepta Ho y se rechaza Ha.
Interpretacin.
El peso del individuo que tiene 54 kg difiere notoriamente del promedio, que es la
representativa de esa poblacin, a un nivel de confianza menor que 0.05; en
cambio, el otro sujeto slo difiere a un nivel mayor que 0.05 de confianza, lo cual
significa que est dentro de la poblacin de tallas similares.
La siguiente figura contiene tanto el polgono de frecuencias en funcin de una
serie de clases elaboradas con las observaciones de 150 pesos corporales, como los
lmites de las desviaciones estndar con respecto al promedio. Los valores Z de los
dos pesos problema se dibujan con dos flechas, de acuerdo con los valores de
peso que corresponden. La Z1 se encuentra muy por fuera de -1 desviacin
estndar y muy cercana a -2 desviaciones estndar. Para ser ms precisos, tiene
1.69 desviaciones estndar, igual al valor Z; en cambio, el valor Z 2 tiene 0.6
desviaciones estndar y an se encuentra dentro del lmite de +1 desviacin
estndar. Cabe recordar que +1 y -1 desviaciones estndar se encuentran
aproximadamente en el 68% de las mediciones.
Pasos:
1. Ordenar los datos en funcin de los momentos antes y despus, y obtener
las diferencias entre ambos.
2. Calcular la media aritmtica de las diferencias ( ).
3. Calcular la desviacin estndar de las diferencias (sd).
4. Calcular el valor de t por medio de la ecuacin.
5. Calcular los grados de libertad (gl) gl = N - 1.
6. Comparar el valor de t calculado con respecto a grados de libertad en la
tabla respectiva, a fin de obtener la probabilidad.
7. Decidir si se acepta o rechaza la hiptesis.
Ejemplo:
Objetivo:
Planteamiento de la hiptesis.
o
Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho. a = 0.05
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
1. Si la to tt se rechaza Ho.
2. Si la p(to) a se rechaza Ho.
a = 0.05
gl = 9
to = 5.79
tt = 2.262
Decisin.
Interpretacin.
Dnde:
t = valor estadstico de la prueba t de Student.
=
valor
promedio
del
grupo
1.
1
=
valor
promedio
del
grupo
2.
2
sp = desviacin estndar ponderada de ambos grupos.
N1 = tamao de la muestra del grupo 1.
N2 = tamao de la muestra del grupo 1.
Dnde:
sp = desviacin estndar ponderada.
SC = suma de cuadrados de cada grupo.
N = tamao de la muestra 1 y 2.
Pasos:
1. Determinar el promedio o media aritmtica de cada grupo de poblacin.
2. Calcular las varianzas de cada grupo, a fin de demostrar la homogeneidad
de varianzas mediante la prueba de X2 de Bartlett.
3. Calcular la suma de cuadrados de cada grupo: Suma de cuadrados (SC) =
S(X - )2.
4. Calcular la desviacin estndar ponderada (sp) de ambos grupos.
5. Obtener la diferencia absoluta entre los grupos (
2).
Ejemplo:
Un investigador ha obtenido la talla de 20 nios de 5 aos de edad, de dos
condiciones socioeconmicas contrastantes (alta y baja). Considera que ambos
grupos de poblacin tienen estaturas diferentes.
Eleccin de la prueba estadstica.
Tenemos un modelo experimental con dos muestras independientes.
Planteamiento de la hiptesis.
o Hiptesis alterna (Ha). Las tallas de nios de 5 aos de las dos
muestras, de condiciones socioeconmicas contrastantes, son
distintas.
o Hiptesis nula (Ho). Las diferencias observadas en las tallas de nios
de las dos muestras de condicin socioeconmica similar se deben al
azar.
Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo
.Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Ecuacin t.
gl = N1 + N2 -2 = 10 + 10 - 2 = 18
El valor de to se compara con los valores crticos de la tabla (tt) con 18 grados de
libertad, y se obtiene que en el valor ms cercano al calculado, la probabilidad es
de 0.001 (valor crtico de t: 3.92).
Decisin.
Como el valor de to (3.99) tiene una probabilidad de significancia menor
que 0.001, tambin es menor que 0.05, propuesto como nivel de
significancia, por lo cual se acepta Ha y se rechaza Ho.
Interpretacin.
Las diferencias en talla de ambos nios de condiciones socioeconmicas
antagnicas (alta y baja) difieren notoriamente en el nivel de confianza de p
menor que 0.001.
Prueba T de Student-Welch
(Para dos muestras independientes con varianzas no homogneas.)
Esta prueba estadstica es de utilidad para contrastar hiptesis en funcin de la
media aritmtica, pero dada la heterogeneidad de las varianzas, no es aplicable la
prueba t de Student.
En este modelo estadstico, el agregado de Welch consiste en una ecuacin para
calcular los grados de libertad, de manera que disminuye el error por la no
homogeneidad de las varianzas. Por otra parte, existe una modificacin de la
ecuacin original de la correspondiente t de Student, que es la siguiente:
Dnde:
t = estadstico equivalente a t de Student.
1 = media aritmtica del grupo 1.
2 = media aritmtica del grupo 2.
2
s 1 = varianza del grupo 1.
s22 = varianza del grupo 2.
n1 = tamao de la muestra del grupo 1.
n2 = tamao de la muestra del grupo 2.
El clculo de los grados de libertad se realiza con la frmula siguiente:
Dnde:
s21 = varianza del grupo 1.
s22 = varianza del grupo 2.
n1 = tamao de la muestra del grupo 1.
n2 = tamao de la muestra del grupo 2.
Pasos:
1. Determinar el promedio, la varianza y el tamao de la muestra de cada
poblacin en el estudio.
2. Aplicar la ecuacin t.
3. Calcular los grados de libertad (gl) de acuerdo con la ecuacin dada.
4. Comparar el valor de t calculado respecto a los grados de libertad con los
valores de t crticos.
5. Decidir si se acepta o rechaza la hiptesis.
Ejemplo:
Planteamiento de Hiptesis.
o Hiptesis alterna (Ha). Existe una diferencia significativa en el nivel de
ansiedad de personas obesas que asisten a tratamiento constante y
personas obesas que no asisten a tratamiento.
o
Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
= 68.93
2 = 52.5
2
s 1 = 558.9286 / (14 - 1) = 42.99
s21 = 837.5 / (14 - 1) = 64.42
1
Aplicamos la ecuacin t.
Interpretacin.
Las personas obesas que asisten a un tratamiento constante para bajar de peso,
tienen un nivel de ansiedad mayor que las personas obesas que no asisten a
tratamiento.
La prueba de frecuencias
La prueba de independencia
Dnde:
X2Bartlett = valor estadstico de esta prueba.
ln = logaritmo natural.
s2 = varianza.
n = tamao de la muestra del grupo.
K = nmero de grupos participantes.
N = tamao total (sumatoria de las muestras).
Pasos:
Ejemplo:
Un investigador realiz un estudio para mostrar que los niveles de ansiedad de las
personas obsesas que asisten de manera constante a tratamiento para control de
peso corporal es mayor que el de los obesos que no asisten a tratamiento. l desea
saber si las varianzas de los grupos son homogneas o no.
Especificaciones: Participaron 28 personas obesas (hombres y mujeres). 14
personas obesas que no asistan a tratamiento y 14 que asistan de manera regular
a algn tipo de tratamiento. A los 28 participantes se les solicit que dieran
respuesta a la escala de estado de ansiedad (IDARE), la cual est diseada para
evaluar el grado de ansiedad ante situaciones cotidianas. Los puntajes de la escala
varan en un rango de 20 a 80 puntos, siendo los puntajes ms altos los indicativos
de un mayor nivel de ansiedad.
Eleccin de la prueba estadstica.
modelo experimental tiene dos
El
muestras
independientes.
Vase:
Estadstica/Flujogramas/Flujograma 4
Planteamiento de Hiptesis.
Hiptesis nula (Ho). Las diferencias observadas entre las varianzas se debe al
azar; por lo tanto, son iguales y la fuente de error probablemente es la
misma.
Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Clculo de ln.
Para este clculo utilizamos una tabla logartmica de base 10 (logaritmos comunes)
log(10)s21 = 42.99 = 0.6325 + 1 = 1.6325
log(10)s22 = 64.42 = 0.8089 + 1 = 1.8089
N = 28
K=2
(n - 1) = 26
s2 (n - 1) = 1396.33
lns2 (n - 1) = 103
Decisin.
Interpretacin.
Prueba F
(Anlisis de varianza o ANOVA)
Anlisis de la varianza permite contrastar la hiptesis nula de que las medias de K
poblaciones (K >2) son iguales, frente a la hiptesis alternativa de que por lo
menos una de las poblaciones difiere de las dems en cuanto a su valor esperado.
Este contraste es fundamental en el anlisis de resultados experimentales, en los
que interesa comparar los resultados de K 'tratamientos' o 'factores' con respecto a
la variable dependiente o de inters.
Ejemplos:
Como puede observarse, los puntos que representan a las medias de cada grupo
aparecen dispersos a diferentes niveles; sobre todo la media del grupo definido por
el factor Tren. El intervalo de confianza para la media correspondiente al grupo
definido por el factor Metro est contenido dentro del intervalo correspondiente al
grupo definido por el factor Bus, as como, el intervalo correspondiente al factor
Coche est contenido dentro de los intervalos correspondientes definidos por los
factores Metro y Otros. El grfico, por tanto, parece sugerir no una nica poblacin
sino tres poblaciones con distintas medias.
Para realizar el anlisis de la varianza propiamente dicho la secuencia es Analizar >
Comparar medias > ANOVA de un factor. En el cuadro de dilogo se selecciona
Tiempo como variable Dependiente y Trans como Factor. Para contrastar la
hiptesis de igualdad de varianzas se abre con el botn correspondiente el cuadro
de dilogo ANOVA de un factor: Opciones y se activa Homogeneidad de varianzas.
Si se desea un anlisis descriptivo del comportamiento de la variable dependiente
dentro de cada grupo se activa tambin la opcin Descriptivos. Al aceptar se
obtienen los siguientes cuadros de resultados:
Utilizacin:
o
Poblaciones pequeas.
Anlisis secuencial
-q
p
Distribucin Binomial.
Es cuando se quiere determinar la probabilidad de que x xitos sean observados en
n ensayos, el orden en que ocurren los xitos no tiene importancia. Podemos
calcular este nmero siguiendo la frmula de las combinaciones, n causas, de las
cuales x es de un tipo y n-x es de otro tipo.
Cxn(p)x(q)n-x
Como es sabido, si consultamos libros estadsticos nos encontramos a veces, que
las frmulas son estructuradas diferente, por ejemplo, encontramos otra:
Pxi = nCr pr - q(n-r)
Dnde:
Pxi = probabilidad de acontecimientos de un evento.
nCr = nmero de combinaciones.
n = nmero total de eventos.
r = valor del arreglo esperado.
p = probabilidad de ocurrencia.
q = Probabilidad de no ocurrencia.
Ejemplos:
Se lanza una moneda cuatro veces, para calcular las probabilidades
correspondientes aplicando la frmula anterior. Esto se inicia con la probabilidad
de que resulten cuatro guilas y cero soles, y para el caso se simboliza como:
Pxi
1/16 = 0.0625
4/16 = 0.25
6/16 = 0.375
4/16 = 0.25
1/16 = 0.625
16/16 = 1.0
Pxi
5 caras iguales
4 caras iguales, 1 diferente
3 caras iguales, 2 diferentes
2 caras iguales, 3 diferentes
1 cara , 4 diferentes
0 caras , 5 diferentes
Total
1/7776 = 0.00013
25/7776 = 0.0032
250/7776 = 0.032
1250/7776 = 0.161
3125/7776 = 0.40
3125/7776 = 0.40
7776/7776 = 0.99633
1
p+q
p2 + 2pq + q2
p3 + 3p2q + 3pq2 + q3
p4 + 4p3q + 6p2q2 + 4pq3 + q4
p5 + 5p4q + 10p3q2 + 10p2q3 + 5pq4 + q5
pn + npn-1q + ............................ qn
Pasos.
1. Arreglar las categoras y las frecuencias observadas.
2. Calcular los valores tericos esperados para el modelo experimental o tipo
de distribucin muestral: normal, binomial y de Poisson.
3. Calcular las diferencias de las frecuencias observadas en el experimento con
respecto a las frecuencias esperadas.
Ejemplo:
Un investigador quiere comparar si hay diferencias en la cantidad de cigarros
fumados por causa del estrs en personas que trabajan.
Eleccin de la prueba.
El modelo experimental tiene una muestra.
Planteamiento de la hiptesis.
Hiptesis alterna (Ha). Habr diferencia significativa entre la cantidad de
cigarros fumados por causa del estrs en personas que trabajan.
Hiptesis nula (Ho). No Habr diferencia significativa entre la cantidad de
cigarros fumados por causa del estrs en personas que trabajan.
Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
fo = 18
fe = 6
gl = 3 + 1 = 2
a = 0.05
El valor calculado de X2 se compara con los valores crticos de la tabla de valores
crticos de X2. Se puede observar que para una probabilidad de 0.05 corresponde la
cifra de 5.99; por lo tanto, el estadstico ji cuadrada de 4.3 tiene una probabilidad
mayor que 0.05.
Decisin.
Interpretacin.
El consumo de cigarros por causa del estrs se puede considerar como efecto del
azar.
Pasos:
Ejemplo:
Planteamiento de la hiptesis.
Nivel de significacin
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Ejemplo:
Planteamiento de la hiptesis.
Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.
Para todo valor de probabilidad
mayor que 0.05, se acepta Ho y se
rechaza Ha.
Contingencia de la diarrea.
Ejemplo:
Ajuste de datos para una distribucin normal, de un conjunto de mediciones en la
tabla de nios de 5 aos. Tamao de la muestra 100.
Eleccin de la prueba estadstica.
El modelo experimental tiene una muestra y nuestro objetivo es la bondad del
ajuste.
Planteamiento de la hiptesis.
Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Talla de nios de 5 aos de edad.
= 100.1
s = 3.91
En seguida se determinan los lmites reales de cada clase y se calcula el valor Z para
cada lmite real.
Para cada valor de Z, se localiza el valor del rea bajo la curva de valores Z.
Obtencin de valores tericos de la distribucin normal.
Una vez anotados los valores del rea bajo la curva normal para cada Z, se calcula
el rea que corresponde a cada talla. Para fines prcticos y a fin de ejecutar el
procedimiento, el signo de Z se mantiene en el valor del rea bajo la curva, y se
realiza de la manera siguiente:
Clase 90 - 93 = -0.4656 - (-0.4951) = 0.0295
Clase 94 - 97 = -0.2852 - (-0.4656) = 0.1804
Clase 98 - 101 = 0.091 - (-0.2852) = 0.3762
Clase 102 - 105 = 0.3944 - 0.091 = 0.3034
Clase 106 - 109 = 0.4884 - 0.3944 = 0.094
Cada valor del rea para la curva de clase se multiplica por el tamao de la muestra
(N); en este caso corresponde a 100. Para obtener los valores tericos, se
selecciona el valor entero ms cercano.
En seguida se aplica la ecuacin de X2.
Ejemplo:
Un investigador desea conocer el efecto que ejerce el ambiente fsico de sobre
estimulacin en las caractersticas estructurales del cerebro, de manera que lo
propone como alternativa para mejorar las alteraciones que la desnutricin
proteico calrica produce en el encfalo. En virtud de ello, planea un diseo
experimental con 24 ratas de la raza Wistar, a la mitad de las cuales induce a la
desnutricin con una dieta baja en protenas. A las ratas restantes les aporta una
dieta normal para roedores. Divide estos dos subgrupos de animales en tres
condiciones ambientales.
Al trmino del experimento, los animales son sacrificados y se les extrae el cerebro,
para obtener el peso hmedo. El investigador considera a la masa total como un
primer indicador de los cambios estructurales del encfalo.
En virtud de que los pesos enceflicos poseen varianzas desiguales, no se
distribuyen normalmente y los intervalos de los pesos no tienen una progresin
aritmtica, el investigador decide no utilizar una prueba paramtrica. Por ello, elige
distribuir los pesos en funcin de la mediana.
Eleccin
de
la
prueba
estadstica.
El modelo experimental tiene tres o ms grupos independientes. Vase:
Estadstica/Flujogramas/Flujograma 4
Planteamiento de la hiptesis.
Hiptesis alterna (Ha). Las frecuencias observadas de las ratas, cuyos pesos
se distribuyeron en funcin de la mediana, muestran diferencias
significativas entre bien nutridos y desnutridos. Asimismo, hay diferencias en
los animales aislados y estimulados.
Hiptesis nula (Ho) Las diferencias en las frecuencias en la distribucin con
base en la mediana de los pesos enceflicos se deben al azar.
Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Pasos.
1. Arreglar las frecuencias observadas en una tabla de contingencia 2 X 2.
+ Muestra I A B
Muestra II C D
2. Obtener los totales de las hileras (A + B) y (C + D) y de las columnas: (A + C)
y (B + D), as como el gran total (GT).
3. Obtener los valores factoriales de los totales de hileras y columnas y
despus multiplicarlos.
4. Calcular los factoriales del gran total y multiplicar ste por todos los
factoriales de cada casilla de la tabla de contingencia.
5. Dividir el primer valor de producto de factoriales entre el segundo. Este
resultado es la probabilidad exacta de Fischer y Yates.
6. Decidir si se acepta o rechaza la hiptesis, en funcin de la probabilidad.
Ejemplo:
Un investigador rene una muestra de 15 sujetos con problemas de obesidad. Elige
al azar a 7 pacientes para ensayar una nueva tcnica teraputica para bajar de
peso, y a los 8 restantes les aplica una tcnica usada regularmente para el mismo
efecto.
Eleccin de la prueba estadstica.
Se tiene un modelo experimental con dos muestras independientes
Planteamiento de la hiptesis.
Hiptesis alterna (Ha). Existe mayor frecuencia de perder peso al aplicar la
nueva tcnica teraputica, en comparacin con lo observado al aplica una
tcnica usada regularmente.
Hiptesis nula (Ho). Las diferencias observadas en las dos tcnicas
teraputicas se deben al azar.
Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Prueba de McNemar
( Para muestras dependientes)
Este procedimiento es til cuando las muestras son dos y resultan dependientes. EL
tipo de escala es nominal.
Dicha prueba estadstica es un equivalente de la prueba t de Student para muestras
dependientes y slo aplicable cuando existen dos momentos: antes y despus.
Cuando en el momento experimental hay diversos momentos de cambio con base
en uno previo, convendr utilizar la prueba Q de Cochran. Ambos procedimientos
se distribuyen igual que la ji cuadrada, por lo que el estadstico calculado se
simboliza como ji cuadrada.
La ecuacin es la siguiente:
Pasos:
Ejemplo:
Planteamiento de la hiptesis.
Hiptesis alterna (Ha). El lavado de manos, como medida preventiva y factor
de higiene personal, presenta cambios significativos de enfermedad
diarreica en los empleados que asisten al comedor de la fbrica en estudio.
Hiptesis nula (Ho). Las diferencias que se observan en las frecuencias de
cambio por el lavado de manos se deben al azar.
Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Resultado de la contingencia 2 X 2.
Decisin.
Interpretacin.
Prueba Q de Cochran
(Para tres o ms muestras dependientes)
La prueba Q de Cochran es una tcnica estadstica, extensin de la prueba de
McNemar, que se utiliza en los modelos experimentales con tres o ms muestras
dependientes o relacionadas entre s, es decir, esta poblacin sirve como su propio
control, en el que existe un perodo previo y otro ulterior; adems, el tipo de escala
debe ser nominal.
El valor calculado en la prueba Q de Chochran se distribuye igual que la ji
cuadrada, por lo cual el smbolo utilizado ser X2Q.
La ecuacin es la siguiente:
Dnde:
X2Q = estadstico ji cuadrada de la
prueba Q de Cochran.
K = nmero de tratamientos.
Gn = nmero total de respuestas
de cambio de cada tratamiento o
columna.
Lc = nmero total de respuestas de
cambio por individuo de la
muestra o hileras.
Pasos:
1. Arreglar la muestra individualmente con sus respuestas de cambio.
2. Efectuar las sumatorias de cambios por cada tratamiento o columna (Gn
y S Gn).
3. Efectuar la sumatoria de cambios por cada hilera y elevarla al cuadrado y, a
su vez, las sumatorias de stas (S Lc y S Lc2).
4. Aplicar la frmula de la prueba Q de Cochran, de modo que se obtenga el
valor X2Q.
5. Calcular los grados de libertad (gl) con K tratamientos -1.
6. Comparar el estadstico X2Q obtenido con respecto a los gl en la distribucin
de ji cuadrada.
7. Decidir si se acepta o rechaza la hiptesis.
Ejemplo:
Un psiclogo investiga el aprendizaje simple en 15 ratas, a las que aplica cuatro
tratamientos diferentes a intervalos de un mes cada uno, para lo cual utiliza
laberintos distintos.
Los tratamientos corresponden a cuatro frmacos, que segn afirman los
fabricantes de los productos, tienen capacidad para facilitar el aprendizaje.
El investigador, para evitar que por efectos acumulativos de los frmacos pudiera
haber error, al suponer que una droga administrada en el cuarto perodo incidiera
en mayor aprendizaje, aplica en secuencias y aleatoriamente los tratamientos, de
modo que las respuestas de los animales emitidas en el laberinto, en funcin de un
perodo fijo (tiempo crtico determinado por el experimentador), le permiten
discriminar si fueron positivas (1) o negativas (0).
En los cambios ejercidos en el aprendizaje de las ratas y que se evalan como 1 y 0,
se toma la referencia con respecto al inicio del experimento para cada animal. Por
tanto, se considera que se trata de muestras dependientes y por diversos perodos.
Eleccin de la prueba estadstica.
El modelo experimental tiene tres o ms muestras dependientes.
Planteamiento de la hiptesis.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Solucin de laberintos.
Anlisis secuencial
Inicialmente, la prueba estadstica de anlisis secuencial fue un procedimiento
aplicable en fbricas, para un mejor control de calidad. De acuerdo con este
principio, se planteaba de la manera siguiente:
P1 = proporciones de calidad satisfactoria.
a = probabilidad de rechazar un lote de calidad aceptable.
P2 = proporcin de calidad inaceptable.
b = probabilidad de aceptar un lote de calidad inaceptable.
En las ciencias psicolgicas, existen problemas que se pueden plantear de manera
similar -en trminos de un estricto sentido matemtico-, pues diversas
observaciones no permiten avanzar en la investigacin, debido a que implican
cambios muy lentos y el nmero de datos disponibles est en razn de la
esperanza de vida del observador, ms que de su inters o capacidad para trabajar
en esta tarea. Algunas enfermedades son raras y el mejor mtodo para adquirir los
conocimientos y la capacidad necesarios a fin de ayudar a las vctimas consiste en
utilizar una tcnica acumulativa en el anlisis de las observaciones.
En ese orden de ideas, se pudo advertir que en la investigacin psicolgica existen
algunos diseos experimentales en los que este modelo estadstico se ajusta
adecuadamente. El ejemplo ms claro es aquel en el que el investigador, una vez
que colecta una muestra de un tamao suficiente, con respecto al fenmeno por el
cual est interesado, slo logra reunir pocos casos. La magnitud de esta muestra se
debi al azar.
El planteamiento bajo el aspecto de la investigacin se realiza de la forma
siguiente:
Pa = proporcin de calidad inaceptable para Ha.
a = probabilidad de rechazar la hiptesis de nulidad (Ho).
Po = proporcin de calidad inaceptable para Ho.
b = probabilidad de rechazar la hiptesis alterna (Ha).
Pasos:
1. Obtener las frecuencias del fenmeno por estudiar (Pa y Po) e imponer los
valores de la probabilidad.
2. Calcular las pendientes para delimitar las zonas de aceptacin y rechazo de
las hiptesis (Ha y Ho).
3. Graficar las pendientes de regresin de las zonas limitadas y anlisis de la
casustica en funcin de la frecuencia acumulada en la grfica.
4. Aplicar el formulario, que en el curso de esta seccin se expondr con el fin
de calcular los valores del tamao de la muestra para cada valor de la escala
de probabilidad (0, Po, Po + Pa / 2, Pa y 1.
5. Decidir si se acepta o rechaza la hiptesis o si se contina la observacin,
respecto al tamao de la muestra calculada.
Ejemplo:
Un investigador est interesado en demostrar que la administracin por va oral de
grandes volmenes de lquido condiciona un factor de morbilidad y letalidad en el
periodo perinatal en 364 recin nacidos. De esta forma, elige dos grupos al azar, a
uno de los cuales le administra pequeos volmenes de lquidos y al otro un gran
volumen. Entre los diversos aspectos analizados, existe un grupo de 24 bebs que
manifestaron permeabilidad del conducto arterioso (PCA), de los cuales 13
mostraron insuficiencia cardiaca y 11 no la tuvieron. El investigador los relaciona en
funcin de los ingresos de lquidos.
Eleccin de la prueba estadstica.
El modelo experimental tiene dos muestras independientes.
Planteamiento de la hiptesis.
Nivel de significacin.
Formula:
Las pendientes por calcular se basan en la ecuacin de la lnea recta que sigue:
Y = bX + a
Dnde:
Y = valores del eje de las ordenadas.
a = punto de interseccin de la pendiente en el eje de las ordenadas.
b = incremento de Y cuando aumenta X.
X = valores del eje de las abscisas.
Clculo de las pendientes.
Decisin.
El estudio presentado, con el tamao de la muestra disponible, alcanz la
zona de error alfa mediante la acumulacin de sus frecuencias, por lo cual se
acepta Ha y se rechaza Ho.
Interpretacin.
En el ejemplo se verifica que el tamao de la muestra de la poblacin
estudiada fue suficiente para comprobar la hiptesis de trabajo del
investigador. En este sentido, los nios recin nacidos mostraron aumento
en la morbilidad y mortalidad por insuficiencia cardiaca, en presencia de
permeabilidad del conducto arterioso e ingestin de un gran volumen de
lquidos. Por otra parte, tambin es cierto que a los nios de la misma
cardiopata se les previno la insuficiencia cardiaca, al restringirles la ingestin
de lquidos.
Bajo el supuesto de que la frecuencia acumulada no hubiera alcanzado
cualquiera de las zonas y se hubiera mantenido en el rea intermedia, se
debe aplicar el formulario para determinar los valores promedio del tamao
de la muestra para cada probabilidad. Para fines de aprendizaje, se
desarrollarn e interpretarn como se indica en la siguiente tabla.
Valores de aceptacin y rechazo.
Dicha tabla muestra los valores promedio del tamao de la muestra, y se puede
observar que cuando la probabilidad es (Pa + Po) / 2 le corresponde la cifra 112.
Esto significa que el estudio requiere tal tamao de muestra y no necesariamente
los 364 recin nacidos, con quienes se llev a cabo el estudio.
Como se apreci, las tcnicas disponibles para anlisis secuencial requieren algo
ms que clculos matemticos que la mayora de los procedimientos estadsticos
descritos en cualquier libro de estadstica. Estas pruebas estadsticas de anlisis
secuencial permiten no slo interpretar los resultados de una investigacin, sino
tambin saber si el tamao de la muestra fue suficiente para demostrar las
hiptesis.
Prueba de Kolmogorov-Smirnov
(Para una muestra)
La prueba de Kolmogorov-Smirnov para una muestra se considera un
procedimiento de "bondad de ajuste", es decir, permite medir el grado de
concordancia existente entre la distribucin de un conjunto de datos y una
distribucin terica especfica. Su objetivo es sealar si los datos provienen de una
poblacin que tiene la distribucin terica especificada.
Mediante la prueba se compara la distribucin acumulada de las frecuencias
tericas (ft) con la distribucin acumulada de las frecuencias observadas (f obs), se
encuentra el punto de divergencia mxima y se determina qu probabilidad existe
de que una diferencia de esa magnitud se deba al azar.
En las tareas de investigacin se pudo obtener un conjunto de observaciones, en
las cuales se supone que tienen una distribucin normal, binomial, de Poisson, etc.
Para el caso, las frecuencias de las distribuciones tericas deben contrastar con las
frecuencias observadas, a fin de conocer cul distribucin se adecua mejor al
modelo.
Pasos:
Ecuacin:
D = ft - fobs
En esta ecuacin se aprecia que el procedimiento es muy simple y quiz lo que
parezca ms complicado corresponde al clculo de la frecuencia esperada de cada
tipo de distribucin terica. Por lo tanto, en la marcha de los ejercicios se
presentar cada uno de ellos y la manera de aplicar la prueba estadstica.
Ejemplo:
En una investigacin, consistente en medir la talla de 100 nios de 5 aos de edad,
se desea saber si las observaciones provienen de una poblacin normal.
Planteamiento de la hiptesis.
Hiptesis alterna (Ha). Los valores observados de las frecuencias para cada
clase son diferentes de las frecuencias tericas de una distribucin normal.
Hiptesis nula (Ho). Las diferencias entre los valores observados y los
tericos de la distribucin normal se deben al azar.
Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Tabla de 100 nios. Los valores X + s son 99.2 2.85.
Prueba de U Mann-Whitney
(Para dos muestras independientes)
Esta prueba estadstica es til cuando las mediciones se pueden ordenar en escala
ordinal (es decir, cuando los valores tienden a una variable continua, pero no
tienen una distribucin normal) y resulta aplicable cuando las muestras son
independientes.
Este procedimiento es una buena alternativa cuando no se puede utilizar la prueba
t de Student, en razn de no cumplir con los requisitos que esta prueba exige.
La frmula es la siguiente:
Dnde:
U1 y U2 = valores estadsticos de U MannWhitney.
n1 = tamao de la muestra del grupo 1.
n2 = tamao de la muestra del grupo 2.
R1 = sumatoria de los rangos del grupo 1.
R2 = sumatoria de los rangos del grupo 2.
Pasos:
1. Determinar el tamao de las muestras (n1 y n2). Si n1 y n2 son menores que
20, se consideran muestras pequeas, pero si son mayores que 20, se
consideran muestras grandes.
2. Arreglar los datos en rangos del menor al mayor valor. En caso de que
existan ligas o empates de rangos iguales, se debern detectar para un
ajuste posterior.
3. Calcular los valores de U1 y U2, de modo que se elija el ms pequeo para
comparar con los crticos de U Mann-Whitney de la tabla de probabilidades
asociadas con valores pequeos como los de U en la prueba de MannWhitney.
4. En caso de muestras grandes, calcular el valor Z, pues en estas condiciones
se distribuye normalmente.
5. Decidir si se acepta o rechaza la hiptesis.
Planteamiento de la hiptesis.
Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Dos mtodos diferentes aplicados en dos grupos de nios.
De acuerdo con los paso, las observaciones se deben ordenar en rangos del menor
al mayor.
Rangos de lectura de la tabla anterior.
Calculamos la U.
De los dos valores de U calculados, se elge el ms pequeo (4) y se comparan con
los valores crticos de U Mann-Whitney.
En caso de que el valor de U calculado no se localice en las tablas
correspondientes, se transformar en la frmula siguiente:
U = n1n2 - U'
En esta frmula, U' corresponde al valor ms alto.
Decisin.
A la probabilidad del valor U de Mann-Whitney, calculado anteriormente,
corresponde 0.048, el cual es ms pequeo que el nivel de significancia; por
lo tanto, se acepta Ha y se rechaza Ho.
Interpretacin.
Entre las calificaciones de la ejecucin de lectura mediante los dos mtodos
de enseanza existe una diferencia significativa a un nivel de probabilidad
de error menor que 0.05; es decir, aun cuando las muestras son pequeas,
las calificaciones ms altas mediante el mtodo diseado por el
experimentador sealan ms efectividad, con la probabilidad de equivocarse
de 0.048 para aceptarlo.
Pasos:
1. Arreglar las observaciones pareadas y obtener las diferencias de cada pareja.
2. Arreglar las diferencias en funcin de rangos como valores absolutos, sin
importar el signo, pero de manera que los rangos conserven el signo
correspondiente a la diferencia.
3. Obtener la sumatoria de los rangos cuyo signo es el menos frecuente, por
ejemplo: si el signo es +, se considerar para efectuar sumatorias; sin
embargo, la sumatoria mencionada finalmente pierde el signo.
4. Si se trata de muestras pequeas, comparar el valor obtenido con los valores
crticos de la tabla de Wilcoxon.
5. Distribuir las muestras mayores que 25 bajo la curva normal y, por tanto,
calcular el valor Z, en referencia al cual se debe consultar la probabilidad de
diferir con respecto al promedio en la tabla de probabilidades asociadas.
6. Decidir si se acepta o rechaza la hiptesis.
Planteamiento de la hiptesis.
Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Aplicacin de la prueba estadstica.
Con base a los pasos, se obtienen las diferencias observadas en los incrementos de
hiperactividad en obesos, estando en un programa de dieta o no. Estos valores
podrn tener signos positivos y negativos, los cuales quedaran abolidos al
ordenarse los rangos y stos los adoptan.
Sumatoria de T = 15.5
El valor T de la prueba de Wilcoxon obtenido se compara con los valores crticos de
la tabla T en pruebas de rangos sealados de pares iguales de Wilcoxon, y se
puede apreciar que para ser significativo (es decir, por debajo de 0.05, que fue el
nivel de significancia), requiere que este 0.05 sea menor; por lo tanto, la
probabilidad es mayor que 0.05.
tc = 15.5
tt = 8
Para dos colas = a = 0.05
N= 10
tc tt \ rechaza Ho
Decisin.
En virtud de que la probabilidad es mayor que 0.05, se acepta Ho y se
rechaza Ha.
Interpretacin.
Las diferencias en el incremento o disminucin de la hiperactividad en
personas obesas con dieta o sin dieta, no son significativas. Estadsticamente
resultan iguales, en razn de que pueden ser diferencias dadas al azar.
Se utiliza cuando:
Pasos:
1. Ordenar las observaciones en rangos de todos los grupos, del ms pequeo
al mayor.
2. Asignar el rango para cada observacin en funcin de cada grupo de
contraste, elabora la sumatoria de rangos, elevar al cuadrado este valor y
dividirlo entre el nmero de elementos que contiene (ni).
3. Detectar las ligas o empates entre los rangos de cada grupo y aplicar la
ecuacin (L) para obtener el ajuste.
4. Aplicar la ecuacin de Kruskal-Wallis y obtener el estadstico H.
5. Calcular los rangos de libertad (gl): gl = K grupos - 1.
6. Comparar el estadstico H, de acuerdo con los grados de libertad, en la tabla
de distribucin de ji cuadrada en razn de distribuirse de forma similar.
7. Decidir si se acepta o rechaza la hiptesis.
Ejemplo:
Un investigador estudia el efecto benfico de cuatro sustancias anticonvulsionantes
(fenobarbital, difenilhidantoinato -DFH-, diacepam y clonacepam), para proteger
contra la muerte producida por un convulsionante, la tiosemicarbazida, la cual se
manifiesta despus de crisis clnica y tnica, respectivamente. El investigador elige
al azar a 24 ratones de la misma edad y peso y les inyecta anticonvulsionante
previamente a la tiosemicarbazida. A partir de este momento, inicia la cuenta en
tiempo, hasta que mueren los ratones; adems mide las observaciones en horas de
tiempo transcurrido.
Las mediciones se realizan en horas, por lo que la variable puede ser continua y, en
consecuencia, una escala de intervalo; sin embargo, algunos ratones no murieron y
el tiempo est calificado nominalmente como infinito. Este obstculo impide
concederle la calificacin de escala de intervalo, por lo cual se elige una escala de
tipo ordinal
Planteamiento de la hiptesis.
Hiptesis alterna (Ha). La proteccin de la muerte por drogas
anticonvulsionante contra el frmaco convulsionante tiosemicarbazida, se
muestra diferente entre los cuatro grupos, y hay mejor proteccin por el
diacepam.
Hiptesis nula (Ho). Las diferencias observadas en los cuatro grupos de
frmacos anticonvulsionantes, para evitar la muerte producida por la
tiosemicarbazida, se deben al azar.
Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Tiempo en horas que tarda el frmaco en causar la muerte en ratones.
De acuerdo con los pasos, se inicia con el ordenamiento de todas las observaciones
a partir del valor ms pequeo hasta el mayor y la deteccin de las ligas o empates.
Arreglo de los datos para asignar rangos y detectar las ligas o empates.
Bibliografa.
Roberto Zavala Aguilar. Estadstica Bsica. Mxico: trillas, 2011
Jay L. Devore. Probabilidad y Estadstica. 7 edicin. Ao: 2008.
Editorial: CENGAGE Learning
Lincoln L. CHAO. Introduccin a la estadstica. Decima Noven
reimpresin. Mxico. Ao:2004. Editorial: Continental
Mario. F. Triola. Estadstica. 10 edicin. Pearson Educacin,
Mxico, 2009
Jhonson/ Patricia Kuby. Estadstica elemental lo esencial. 3
edicin. Ao: 2004. Editorial: Thomson
Jhon E. Freund. Irwin Miller. Marylees Miller. Estadstica
matemtica con aplicaciones. 6 edicin. Pearson educacin,
Mxico, 2000.
Willian Mendenhall. Robert J. Beaver. Barbara M. Beaver.
Introduccin a la probabilidad y estadstica. 12 edicion. Ao:
2008. Editorial: CENGAGE Learning