Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Zamalloa Cornejo
INTRODUCCIÓN AL MUESTREO
La investigación científica es la respuesta del hombre frente a un problema, ya sea
para resolverlo o para conocer su naturaleza o efectos. Sea cual fuere el problema o
problemas a estudiar o la clase de investigación a realizar no son sucesos aislados, más
bien están interrelacionadas por lo que es necesario la intervención del ingenio del
investigador, por lo que este tiene tres alternativas:
1- Estudiar un caso:
Es cuando el estudio de un ejemplar permite generalizar sus características al total.
2- Estudiar la totalidad de casos:
La observación de la totalidad de los casos, teóricamente sería el procedimiento
perfecto y sus conclusiones tener consistencia absoluta; sin embargo en la práctica es casi
siempre imposible y sobre todo innecesario, tanto desde el punto de vista científico como
del económico.
Es decir no necesitamos tomar toda la sopa para saber si está demasiado salada; si
se movió bastante, basta con probar una cucharada
3- Elegir un grupo que represente a la totalidad de los casos:
Este grupo elegido se llama muestra a partir del cual podemos conseguir informaciones
precisas sobre la naturaleza y comportamiento de la población.
En cuanto al período que abarca el estudio, la investigación puede ser prospectiva
o retrospectiva; de acuerdo con el tiempo y la evolución del fenómeno puede ser
transversal o longitudinal; sobre la base de los fines de la investigación ésta puede ser
descriptiva o comparativa y finalmente de acuerdo con la actitud del investigador puede
ser de observación o experimentación. Estas clasificaciones no son exhaustivas ni
excluyentes, muy por el contrario, una investigación puede combinar alguno de estos
criterios.
DEFINICIÓN.-
Es un procedimiento científico para la obtención de muestras estadísticamente
significativas de una población que permitirá estimar los parámetros poblacionales con
un grado de confianza fijado previamente.
Es la teoría que se utiliza para estudiar las relaciones existentes entre la población
y las muestras extraídas de la misma, es decir permite conocer con exactitud la naturaleza
y comportamiento de una población, partiendo de una muestra extraída de ella.
1
Bioestadística Mgt. Rina M. Zamalloa Cornejo
2
Bioestadística Mgt. Rina M. Zamalloa Cornejo
DEFINICION:
- Unidad de Análisis:
O elemento de la población, es la unidad para la que se debe obtener información
estadística. En un estudio puede haber más de una unidad de análisis.
- Población:
O universo es la totalidad de individuos o elementos en las cuales puede presentarse
determinada característica susceptible de ser estudiada, cuantificable en un período y
lugar determinado. Puede ser la población finita o infinita.
- Marco de Muestreo:
Es la población definida, delimitada con fines de estudio de donde se extraerá la muestra.
- Unidad de Muestreo:
Es la unidad seleccionada del marco de muestreo.
- Parámetro:
Parámetro es una medida resumen usada para describir alguna característica de toda la
población, para determinar su valor es necesario utilizar la información de la población
por lo tanto, las decisiones se tomarán con certidumbre total.
Los parámetros más usados son:
Media poblacional ()
Varianza poblacional 2( )
Proporción poblacional ( p )
- Estadístico:
O estadígrafo, es una medida usada para describir alguna característica de la
muestra y la toma de decisiones contiene un grado de incertidumbre.
Los estadísticos más usados son:
Media muestral ( X )
Varianza muestral ( S 2 )
Proporción muestral ( p̂ )
3
Bioestadística Mgt. Rina M. Zamalloa Cornejo
- Error ( ) :
MUESTREO PROBABILÍSTICO:
Se basa en la teoría de las probabilidades y como tal considera la probabilidad de
selección de cada unidad de muestreo, así como todo el proceso establecido para la
selección de las muestras. Los métodos de muestreo probabilístico más usados son:
- Muestreo Aleatorio Simple
- Muestreo Aleatorio Sistemático
- Muestreo Estratificado
- Muestreo por Conglomerados
4
Bioestadística Mgt. Rina M. Zamalloa Cornejo
Las probabilidades asociadas a la selección de cada una de las 3 fichas son 1/10
para la primera, 1/9 para la segunda y 1/8 para la tercera.
Para conocer la probabilidad de extraer una muestra que contenga 3 elementos
cualesquiera tal como 2,4,6 se extrae primero cualquiera de los tres números con una
probabilidad de 3/10, luego se extrae cualquiera de las 2 restantes con una probabilidad
de 2/9 y por último el tercero con una probabilidad de 1/8, entonces la probabilidad total
para obtener una muestra de tres elementos es:
3 2 1 1
----- x ---- x ---- = ------
10 9 8 120
de donde todas las muestras de tamaño 3 de una población de 10 elementos tienen 1/120
probabilidad de ser seleccionadas.
Generalizando tenemos que la probabilidad de obtener una muestra de tamaño n
de una población de tamaño N es igual a:
p = 1 / N Cn
Si el muestreo es con reemplazo, la población se torna infinita y una ficha puede
ser seleccionada más de una vez, entonces la probabilidad de que cada elemento sea
seleccionado es 1/N.
Si bien el procedimiento de las fichas y urnas es satisfactorio en la práctica es
reemplazado por la tabla de números aleatorios con la ventaja de reducir el trabajo y
asegurar de mejor forma que todos los elementos tengan la misma probabilidad de
selección.
Ejemplo
Se quiere estudiar la proporción de niños afectados por enfermedades pulmonares, para
lo cual se extrajo una muestra de tamaño 12 de una población de 836 niños. Enumere los
niños que serán considerados en la muestra.
Solución:
Se acude a la tabla de números aleatorios. Se elige primera fila onceava columna,
tomando números de tres cifras, luego se busca en el listado a los niños que corresponden
a esos números.
5
Bioestadística Mgt. Rina M. Zamalloa Cornejo
= z0
n
z 02 02
n=
2
A( z 0 ) = ; z 0 se ve en la tabla normal estándar
2
LI = X −
IC ( )100 % =
LS = X +
A = LS − LI = X + − ( X − ) = 2
6
Bioestadística Mgt. Rina M. Zamalloa Cornejo
2 N − n
LI = X − z0
n N − 1 z 02 2 N
IC ( )100 % = n=
( N − 1) 2 + z 02 2
2 N − n
LS = X + z
−
0
n N 1
A( z 0 ) = ; z 0 se ve en la tabla normal estándar (Apéndice)
2
A( z 0 ) = ; z 0 se ve en la tabla normal estándar (Apéndice)
2
- Cuando la población es finita y el muestreo es sin reemplazo:
pˆ ( 1 − pˆ ) N − n
LI = pˆ − z0
N −1 z 02 p(1 − p) N
IC ( p )100 %
n
= n=
LS = pˆ + z pˆ ( 1 − pˆ ) N − n ( N − 1) 2 + z 02 p(1 − p)
N −1
0
n
A( z 0 ) = ; z 0 se ve en la tabla normal estándar (Apéndice)
2
Ejemplos
1. Se desea estimar la proporción de personas adultas que sufren afecciones bronquiales,
para ello se tomó una muestra piloto de 150 personas adultas en la que se encontró que
40 están afectadas.
a) ¿Cuál es el tamaño de la muestra con un error del 4%?
b) Con esta base y suponiendo que dicha ciudad tiene 4500 personas adultas, ¿cuál es el
tamaño de la muestra con un error del 4%?
Solución:
40
a) n0 = 150 x = 40 p = = 0, 267
150
7
Bioestadística Mgt. Rina M. Zamalloa Cornejo
= 0,04
0,95
A( z 0 ) = = = 0,475 ; entonces z 0 = 1,96
2 2
z02 p (1 − p )
n=
2
(1,962 )(0, 267)(1 − 0, 267)
= = 469,9 470
0, 042
b) N = 4500
z02 p(1 − p) N
n=
( N − 1) 2 + z02 p(1 − p )
MUESTREO ESTRATIFICADO
Este procedimiento es el indicado para poblaciones heterogéneas, considera la
variabilidad dentro de la población para extraer una muestra más precisa y eficiente que
los que se pueden obtener con el muestreo aleatorio simple o con el sistemático.
En el muestreo estratificado, las operaciones fundamentales del muestreo como
son la determinación del tamaño de la muestra y las estimaciones, se efectúan siguiendo
los siguientes pasos:
1. Estudio de la población para formar las subpoblaciones o estratos.
2. Cálculo del tamaño de la muestra estratificada.
3. Efectuar la afijación o asignación de la muestra para cada caso.
4. Seleccionar la muestra de cada estrato.
5. Estimación de los parámetros partiendo de los estadísticos encontrados.
8
Bioestadística Mgt. Rina M. Zamalloa Cornejo
estrato h y n = nh .
h2
Sabemos que E[ X ] = h y Var[X h ] = (1 - f h ) .
nh
Por los factores que intervienen, el cálculo del tamaño de muestra estratificada es
un tanto diferente al del MAS. Entre estos factores se tiene el número de estratos y el tipo
9
Bioestadística Mgt. Rina M. Zamalloa Cornejo
AFIJACION PROPORCIONAL.-
Consiste en seleccionar en cada estrato la misma proporción de elementos que
marca el tamaño de la muestra y la población, es decir la tasa de muestreo n/N; por lo
tanto la afijación proporcional es sólo un repartimiento proporcional sobre la base de la
siguiente relación:
N h nh
=
N n
AFIJACION ÓPTIMA.-
Considera no sólo el tamaño del estrato, sino también la variabilidad dentro de
cada estrato, esto es la desviación estándar de la característica en la que estamos
interesados. Con este criterio la ecuación para determinar el tamaño de la muestra en cada
estrato es:
N h h
nh = n
N
h h
donde:
n es el tamaño de la muestra estratificada
nh es el tamaño de la muestra del estrato h
Nh es el tamaño del estrato h
h es la desviación estándar del estrato h.
Cuando se trabaja con proporciones la ecuación es:
N h p h (1 − p h )
nh = n
N p (1 − p )
h h h
Muchos autores consideran esta afijación óptima como la de Neyman por ser el
autor que la desarrolló.
10
Bioestadística Mgt. Rina M. Zamalloa Cornejo
MUESTREO DE CONGLOMERADOS
Los tres métodos de selección de muestras que hasta aquí se han visto se aplican
a marcos de muestreo en los que las unidades de análisis están ordenadas y listadas para
la selección de la muestra. Esta situación no siempre se presenta en la práctica, pues no
siempre se dispone de una lista, cuya preparación puede tener un costo prohibitivo,
debiéndose por tanto recurrir al muestreo de conglomerados.
La conglomeración reduce la eficiencia del muestreo debido a que el error de
muestreo de una muestra de un tamaño dado es mayor que el error de muestreo de una
muestra no conglomerada del mismo tamaño, por lo que el ahorro de dinero puede ser
sólo aparente. En este método se debe buscar la menor homogeneidad posible dentro
(entre las unidades) de los conglomerados y la mayor homogeneidad entre los
conglomerados. Esto es lo contrario que lo que se debe buscar en el método de la
estratificación, en donde debe haber la mayor homogeneidad dentro (entre las unidades)
estratos y la menor homogeneidad posible entre los estratos.
En conclusión, el muestreo por conglomerados es eficaz solamente cuando los
conglomerados son numerosos y de pequeños tamaños, homogéneos entre ellos y cuyos
individuos en cada conglomerado son heterogéneos.
PRUEBA DE HIPÓTESIS
Las secciones anteriores han mostrado cómo se puede estimar un parámetro a
partir de los datos contenidos en una muestra. Puede encontrarse ya sea un sólo número
(estimador puntual) o un intervalo de valores posibles (intervalo de confianza). Sin
embargo, muchos problemas de ingeniería, ciencia, y administración, requieren que se
tome una decisión entre aceptar o rechazar una proposición sobre algún parámetro. Esta
proposición recibe el nombre de hipótesis. Este es uno de los aspectos más útiles de la
inferencia estadística, puesto que muchos tipos de problemas de toma de decisiones,
pruebas o experimentos en el mundo de las ciencias, pueden formularse como problemas
de prueba de hipótesis.
Hipótesis estadística:
Una hipótesis estadística es una proposición o supuesto sobre los parámetros de una o
más variables aleatorias o poblaciones.
11
Bioestadística Mgt. Rina M. Zamalloa Cornejo
Es importante recordar que las hipótesis siempre son proposiciones sobre la población o
distribución bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del
parámetro de la población especificado en la hipótesis nula se determina en una de tres
maneras diferentes:
• Puede ser resultado de la experiencia pasada o del conocimiento del proceso,
entonces el objetivo de la prueba de hipótesis usualmente es determinar si ha
cambiado el valor del parámetro.
• Puede obtenerse a partir de alguna teoría o modelo que se relaciona con el proceso
bajo estudio. En este caso, el objetivo de la prueba de hipótesis es verificar la
teoría o modelo.
• Cuando el valor del parámetro proviene de consideraciones externas, tales como
las especificaciones de diseño o ingeniería, o de obligaciones contractuales. En
esta situación, el objetivo usual de la prueba de hipótesis es probar el
cumplimiento de las especificaciones.
Un procedimiento que conduce a una decisión sobre una hipótesis en particular
recibe el nombre de prueba de hipótesis. Los procedimientos de prueba de hipótesis
dependen del empleo de la información contenida en la muestra aleatoria de la población
de interés. Si esta información es consistente con la hipótesis, se concluye que ésta es
verdadera; sin embargo, si esta información es inconsistente con la hipótesis, se concluye
que esta es falsa. Debe hacerse hincapié en que la verdad o falsedad de una hipótesis en
particular nunca puede conocerse con certidumbre, a menos que pueda examinarse a toda
la población. Usualmente esto es imposible en muchas situaciones prácticas. Por tanto, es
necesario desarrollar un procedimiento de prueba de hipótesis teniendo en cuenta la
probabilidad de llegar a una conclusión equivocada.
La hipótesis nula, representada por H 0 , es la afirmación sobre una o más
12
Bioestadística Mgt. Rina M. Zamalloa Cornejo
estadística es un proceso que nos lleva a tomar una decisión de rechazar o no rechazar la
hipótesis nula H 0 en contraposición de la hipótesis alterna H1 a un nivel de significación
suficiente para refutarla. El rechazo significa que los datos de la muestra proporcionan
evidencia suficiente de que la hipótesis nula es falsa.
Es una regla que cuando los valores experimentales son observados nos conducen
a una decisión a rechazar o no rechazar la hipótesis bajo consideración a la luz de la
información proporcionada por una muestra extraída de la población bajo estudio.
Cualquiera sea la decisión tomada a partir de una prueba de hipótesis, ya sea de
rechazo o no de la hipótesis nula H 0 se puede incurrir en error.
Tipos de errores
En la prueba de hipótesis pueden cometerse dos tipos posibles de errores:
• El error tipo I se define como el rechazo de la hipótesis nula H 0 cuando ésta es
verdadera.
• El error tipo II se define como la aceptación de la hipótesis nula cuando ésta es
falsa.
Por tanto, al probar cualquier hipótesis estadística, existen cuatro situaciones
diferentes que determinan si la decisión final es correcta o errónea.
Es obvio que, quien toma las decisiones quiera reducir al máximo las
probabilidades de cometer cualquiera de estos dos tipos de errores, esto no es fácil debido
a que las probabilidades de cometer ambos tipos de errores son inversamente
proporcionales, para cualquier prueba dada, sin embargo, un aumento en el tamaño
muestral n reducirá ambos tipos de errores de forma simultánea.
Nivel de significación
El nivel de significación o tamaño de la región crítica representado por , se
define como la probabilidad de cometer error tipo I, es decir:
= PError tipo I = Prechazar H0 / H0 es verdadera
Los valores que se emplean frecuentemente para son próximos a cero (0,01;
0,02; 0,05; …).
La probabilidad de cometer error tipo II está representada por :
Los pasos que se deben seguir para realizar una prueba de hipótesis son:
1. Formular las hipótesis nula y alterna de acuerdo al problema
Prueba unilateral o de una cola
• Prueba unilateral de cola inferior o tipo I:
14
Bioestadística Mgt. Rina M. Zamalloa Cornejo
H 0 : 0 H1 : 0
pruebas de hipótesis con respecto a la media poblacional , se siguen los siguientes pasos
I II III
2.- Establecer el nivel de significación .
( X − 0 ) n
3.- Estadístico de Prueba: zc =
15
Bioestadística Mgt. Rina M. Zamalloa Cornejo
5.- Conclusiones:
Tipo I: Se acepta H 0 si zc − z0 y se rechaza H 0 si zc − z0
16
Bioestadística Mgt. Rina M. Zamalloa Cornejo
H 0 : 0 H 0 : 0 H 0 : = 0
H1 : 0 H1 : 0 H1 : 0
I II III
2.- Establecer el nivel de significación .
( X − 0 ) n
3.- Estadístico de Prueba: tc =
S
5.- Conclusiones:
Tipo I: Se acepta H 0 si tc −t0 y se rechaza H 0 si tc −t0
17
Bioestadística Mgt. Rina M. Zamalloa Cornejo
5.- Conclusiones:
Tipo I: Se acepta H 0 si yc y0 y se rechaza H 0 si yc y0
El supuesto de varianzas iguales que se hace al comparar las medias de dos poblaciones,
deberá ahora probarse mediante la estadística F
5.- Conclusión
Se acepta H 0 si fc f 0 y se rechaza H 0 si fc f 0
promedios.
I II III
2.- Establecer el nivel de significación .
18
Bioestadística Mgt. Rina M. Zamalloa Cornejo
X1 − X 2
3.- Estadístico de Prueba: zc =
12 22
+
n1 n2
5.- Conclusiones:
Tipo I: Se acepta H 0 si zc − z0 y se rechaza H 0 si zc − z0
5.- Conclusiones:
Tipo I: Se acepta H 0 si tc −t0 y se rechaza H 0 si tc −t0
19
Bioestadística Mgt. Rina M. Zamalloa Cornejo
5.- Conclusiones:
Tipo I: Se acepta H 0 si tc −t0 y se rechaza H 0 si tc −t0
Para la diferencia de medias cuando las muestras están pareadas o relacionadas (misma
medición, misma unidad experimental, circunstancias diferentes) podemos usar la prueba
de diferencia de medias donde D = 1 − 2 . Sin embargo, debemos notar que la varianza
( 2
D = 12 + 22 − 2 1 2 )
poblacionales no tienen por qué ser iguales. Es decir, supongamos que obtenemos una
muestra aleatoria de n pares de observaciones ( X 1 , Y1 ) ...... ( X n , Yn ) de poblaciones
población con media X , y (Y1 , Y2 , ...., Yn ) indica la muestra de la población con media
Y .
donde:
Di = X i − Yi , i = 1,...., n
y varianza desconocida,
D2 ;.
La varianza poblacional
D2 se puede estimar por la varianza muestral S D2 que sería la
D i
D= i =1
n
Un estimador puntual de la media poblacional de las diferencias:
D = X − y
D n
3.- Estadístico de Prueba: tc =
SD
4.- Región Crítica
21
Bioestadística Mgt. Rina M. Zamalloa Cornejo
5.- Conclusiones:
Tipo I: Se acepta H 0 si tc −t0 y se rechaza H 0 si tc −t0
DISEÑO EXPERIMENTAL
INTRODUCCIÓN.
Los modelos de “Diseño de experimentos” son modelos estadísticos clásicos cuyo
objetivo es averiguar si unos determinados factores influyen en la variable de interés y, si
existe influencia de algún factor, cuantificarla. Ejemplos donde habría que utilizar estos
modelos son los siguientes:
experimental será pequeño y habrá poca variación en los resultados del experimento. Pero
si se experimenta en procesos industriales, administrativos, ... la variabilidad es grande
en la mayoría de los casos.
DEFINICION
Un experimento es una prueba o ensayo y un experimento diseñado es una prueba o serie
de pruebas en las cuales se inducen cambios deliberados en las variables de entrada de un
proceso o sistema de manera que sea posible observar e identificar las causas de los
cambios en la respuesta de salida.
El proceso o sistema bajo estudio puede representarse por medio del modelo.
23
Bioestadística Mgt. Rina M. Zamalloa Cornejo
permitan un análisis objetivo y así obtener deducciones válidas con respecto al problema
bajo investigación.
Unidad experimental
Es el objeto o entidad, al que se le aplica un tratamiento y en el que se mide, evalúa y
analiza el efecto del tratamiento. La unidad puede ser: una parcela, un paciente en un
hospital, una porción de masa, un surco para el cultivo de papas, etc.
Factor
Es todo procedimiento o variables cuyo efecto se desea medir y comparar con los otros
factores. Implica un conjunto particular de condiciones, que se debe imponer a una
unidad experimental dentro de los confines del diseño seleccionado con el objeto de medir
y comparar sus efectos. Los niveles de un factor son los tipos o grados específicos del
factor que se tendrán en cuenta en la realización del experimento.
Tratamiento
Es una combinación específica de los niveles de los factores en estudio. Son, por tanto,
las condiciones experimentales que se desean comparar en el experimento. En un diseño
con un único factor son los distintos niveles del factor y en un diseño con varios factores
son las distintas combinaciones de niveles de los factores.
Error Experimental
Es la medida de la variación existente entre observaciones de las unidades
experimentales tratadas en forma similar, en un diseño experimental se tiene una
variabilidad inherente a la unidad experimental, es decir son las variaciones provocadas
por las causas no asignables y otra variabilidad debida a los tratamientos y la suma de
estas dos variabilidades nos da la variabilidad total.
Un experimento se realiza por alguno de los siguientes motivos:
• Determinar las principales causas de variación en la respuesta.
• Encontrar las condiciones experimentales con las que se consigue un valor
extremo en la variable de interés o respuesta.
24
Bioestadística Mgt. Rina M. Zamalloa Cornejo
ANÁLISIS DE VARIANZA
Los modelos de ANVA son la herramienta fundamental para adentrarse en la naturaleza
de la variación de los acontecimientos; permiten discernir mejor las causas de los
fenómenos y los efectos de los factores involucrados. No solo lo introduce en la misma
Naturaleza de las cosas, sino que es la herramienta básica para el diseño de experimentos.
Toda vez que necesite buscar las causas que hayan descontrolado sus técnicas de
laboratorio o de producción, podrá usar la filosofía de estos modelos para realizar su
investigación.
El ANVA puede ser considerado como una manera de verificar si dos o más medias
muestrales fueron extraídas de una misma población o de poblaciones con el mismo valor
esperado. En consecuencia, cuando estas medias muestrales no sean coincidentes habrá
que suponer que provienen de poblaciones diferentes por el efecto causado por un factor
en estudio. Como por ejemplo, comparar las medias muestrales de un placebo versus las
medias de muestras con diferentes dosis de un medicamento. O bien, la comparación entre
sí de varias marcas comerciales, proveedoras de drogas o kits de medición, como además
comparar varios operadores, o equipos, o pipetas entre sí, etc.
Cuando se trabaja con dos muestras se usa el modelo de Student para muestras
independientes como se vio en los temas anteriores. El ANVA es un método más general,
que se extiende a más de dos muestras y se puede demostrar que coincide con Student si
se aplica a solo dos muestras. Es decir, el modelo de Student es un caso particular del
ANVA.
Estos modelos desarrollados por R. A. Fisher a principios de este siglo, tienen una
distribución teórica esperada: la función F, tabulada por G. W. Snedecor.
25
Bioestadística Mgt. Rina M. Zamalloa Cornejo
.
.
.
Ti yi1 yi 2 ….. yij ….. yin yi•
.
.
.
Ta ya1 ya2 ….. yaj ….. yan ya•
26
Bioestadística Mgt. Rina M. Zamalloa Cornejo
tratamiento, toda la variación que existe entre las unidades pasa a formar parte del
error experimental.
a) Cuando el material experimental es homogéneo.
b) Donde es posible la pérdida de unidades experimentales.
c) Cuando el material experimental es pequeño, por eso su uso en condiciones de
campo es limitado.
CARACTERÍSTICAS
- Los tratamientos se distribuyen al azar en todas las unidades experimentales y el
número de repeticiones o unidades por tratamiento puede ser igual o diferente.
- Este diseño es muy útil cuando las unidades experimentales tiene una variabilidad
uniformemente repetida.
VENTAJAS
a) Este diseño es fácil de planear.
b) Permite el máximo número de grados de libertad para el error.
c) Su análisis es sencillo.
d) Puede utilizarse desigual número de repeticiones sin complicar el análisis.
DESVENTAJAS
1.- La principal desventaja es que es más apropiado para pequeño número de
tratamiento y para un material experimental homogéneo y uniformemente
repartido.
2.- El error experimental incluye toda la variabilidad posible debido a otros factores.
donde:
a) Cada yij que se observa constituye una muestra aleatoria de una de las
poblaciones representadas.
b) Las observaciones yij también son independientes y se encuentran distribuidos
con + i y varianza 2 .
d) Los tratamientos en este caso son de efectos fijos, más aun los efectos de los
tratamientos se consideran como desviaciones con respecto a la media general, es decir
t
i =1
i =0
Puesto que los efectos son considerados desviaciones de la media general entonces:
i = + i
Una forma equivalente de expresar las hipótesis son:
H0: 1 = 2 = 3 = ... = a = 0
28
Bioestadística Mgt. Rina M. Zamalloa Cornejo
a n a
y.. = yij = yi . ; el total de todas las observaciones
i =1 j =1 i =1
además:
yi .
yi . = ; promedio de la observación del i – ésimo tratamiento.
n
y..
y .. = ; promedio de todas las observaciones.
an
La suma total de desvíos al cuadrado puede dividirse del modo siguiente
2
i =1 j =1 i =1 j =1
i =1 j =1
i =1 j =1 i =1 j =1 i =1 j =1
i =1 j =1
Por lo tanto
Donde :
i =1 j =1
29
Bioestadística Mgt. Rina M. Zamalloa Cornejo
a n
SC = ( yi . − y ..) ; suma de cuadrados debido a los tratamientos
2
i =1 j =1
SCE = ( yij − yi .)
a n
2
; suma de cuadrados debido al error
i =1 j =1
PARA EL ERROR
Puesto que SCT = SC + SCE entonces SCE = SCT − SC
glSCE = ( an − 1) − ( a −1)
glSCE = a ( n −1)
La suma de cuadrados divididos entre sus grados de libertad da origen a lo que se conoce
como cuadrados medios; entonces:
30
Bioestadística Mgt. Rina M. Zamalloa Cornejo
SC SC
CM = = ; cuadrado medio del tratamiento
gl ( SC ) a − 1
SCE SCE
CME = = ; cuadrado medio del error
gl ( SCE ) t ( r − 1)
SC SCE
, 2 son variables aleatorias independientes con (t – 1) y t(r – 1) grados de libertad
2
respectivamente.
a
n i2
y E CM = 2 + i =1 indica que el CM es un estimador sesgado de 2 y
a −1
DECISIÓN:
CM
Puesto que FC = y F0 = F , (a − 1), a (n − 1)
CME
a) Si FC F0 no se rechaza la hipótesis nula
además para = 0,05 se dice que la diferencia es significativa “*” y para = 0,01 se
dice que la diferencia es altamente significativa “**”.
El cuadro que refleja la metodología se denomina cuadro de análisis de varianza
(ANVA) y es el siguiente :
31
Bioestadística Mgt. Rina M. Zamalloa Cornejo
TOTAL an − 1 SCT
La variable
(y
i• − y j • ) − ( i − j )
ta ( n −1) gl , así un intervalo de confianza al 100 % para
1 1
CME +
ni n j
i − j está dado por:
LI = yi• − y j • − t0 CME 1 + 1
n n
i j
IC ( i − j ) =
100 %
1 1
LI = yi• − y j • + t0 CME +
ni n j
De aquí:
32
Bioestadística Mgt. Rina M. Zamalloa Cornejo
1 1
LSD = t0 CME + y t0 = t , a (n − 1) gl prueba de dos colas
n n
i j
Por lo tanto se rechaza H 0 y se acepta que hay diferencia de medias si yi• − y j • LSD
PRUEBA DE TUKEY
Cuando realizamos un análisis de varianza, un valor de F significativo nos indica que
no todas las condiciones producen el mismo efecto sobre la variable independiente. Con
el fin de tener mayores elementos para la toma de decisiones es importante saber donde
se encuentran dichas diferencias significativas y si éstas siguen una tendencias que nos
permitan una mejor toma de decisiones.
Una prueba que nos permite evaluar dicha diferenciación es la prueba deTukey, que
mide la diferencia de los valores de la medias de dos grupos en términos de la varianza
intragrupal.
33
Bioestadística Mgt. Rina M. Zamalloa Cornejo
Se prueban las diferencias entre las medias empezando con la media más grande contra
la segunda más grande, y así sucesivamente,
comparando en cada caso con un valor crítico obtenido por tablas.
Es muy eficaz y popular debido a su poder de discriminación.
Si el nivel de protección es α, entonces las pruebas de las medias tienen un nivel de
significación igual o mayor que α.
COEFICIENTE DE VARIABILIDAD
Es una medida de variabilidad relativa (sin unidades de medida) cuyo uso es para
cuantificar en términos porcentuales la variabilidad de las unidades experimentales frente
a la aplicación de un determinado tratamiento. En experimentación no controlada
(condiciones de campo) se considera que un coeficiente de variabilidad mayor a 35% es
elevado por lo que se debe tener especial cuidado en las interpretaciones y ó conclusiones;
en condiciones controladas (laboratorio) se considera un coeficiente de variabilidad
mayor como elevado. La expresión estimada del coeficiente de variabilidad es:
S
CV = 100%
X
34