Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CAPTULO 2
MARCO TEORICO
2. MARCO TERICO
En la presente seccin se expondrn los conceptos estadsticos, analticos y diferentes
pruebas relacionadas con los mismos. El respaldo terico de esta tesis es diverso y
complejo por lo que algunos conceptos necesarios sern tratados en el presente captulo.
Sera imposible abarcar todos aquellos que el tema requiere, recalcando que ese no es el
objetivo de esta investigacin, por lo que se hablar fundamentalmente de aquellos que
son los ms relevantes.
Los conceptos a estudiar en el presente capitulo son:
Concepto de Familia
Comparaciones dependientes e independientes
Diseo Completamente Aleatorizado.
2.1
Concepto de Familia
Cualquier coleccin de inferencias para las cuales sea significativo tomar en cuenta
algunas medidas combinadas de errores se le llama familia. Ver Hochberg y Tamhane
(1987). Por conveniencia tambin Hochberg y Tamhane (1987) utilizan el trmino de
familia como una coleccin de problemas o parmetros sobre los cuales las inferencias
son hechas como una familia.
La forma en la cual se construya una familia depende mucho del tipo de investigacin
que se quiera realizar. Si es puramente exploratoria, las preguntas de inters o lneas de
inferencia son generadas por la exploracin o curioseo en los datos. Si es puramente
confirmatoria las preguntas surgen conforme la investigacin avanza. Algunos estudios
empricos combinan aspectos de ambos tipos de investigacin.
Existen diferentes tipos de familias:
Familias Finitas.- La familia consiste en una serie de comparaciones limitada a
un valor real contable.
Familias Infinitas.- Cuando se desea examinar cualquier contraste entre
cualquier grupo de medias, la familia consiste en todos los contrastes posibles,
cuya cardinalidad es infinita no contable.
2.2
utiliza
= ci i
i =1
c =0
i =1 i
c di = 0
i =1 i
2.3
asignacin del material experimental como el orden en que se realizan las pruebas
individuales o ensayos se determinan aleatoriamente
Una de las ventajas que acarrea trabajar con un diseo que se encuentre completamente
aleatorizado es que logra que todas las observaciones involucradas en este se conviertan
en variables aleatorias independientes, punto que resulta necesario en el uso de modelos
estadsticos; otra ventaja alcanzada con esto es el de anular los efectos de factores no
previstos que pudieran presentarse a lo largo de la investigacin.
2.4
el caso en un futuro puedan reconocer que tan lejos o cerca se encuentra el resultado de
la regin de rechazo; por lo general en estas investigaciones no se reporta tanto nivel de
detalle, de hecho en algunos casos solo se muestran conclusiones, lo que impone y
predispone el nivel de nominal elegido originalmente a otros experimentadores para
el mismo anlisis.
Obsrvese las figuras 2.1 y 2.2. En la figura 2.1, se ilustra el ejemplo de cuando la F
calculada cae en la zona de aceptacin.
Real
Nominal
F
F.Calc
Zona de Aceptacin
P.C
Zona de Rechazo
11
En la figura 2.2 se muestra el caso contrario donde F calculada cae en zona de rechazo;
en base al criterio de que si Valor P < nominal entonces la F Calculada se encuentra
en la zona de Rechazo.
Nominal
Real
F
P.C
F.Calc
Zona de Aceptacin
Zona de Rechazo
2.5
H 0 : i = j , i j
Lo anterior analizado a travs del criterio de rechazo:
12
Y i. Y
j.
i = ismo tratamiento
j = jsmo tratamiento
a = tratamientos
gl.error = grados libres error ( gl.total gl.tratamientos)
Donde:
Sy =
CM E
n
Prueba de Tukey
Donde q =
CM E
n
y max y min
, que es lo que se conoce como estadstico del rango
CM E n
Prueba DMS
13
donde t
2
, N a
es el 1 100% cuantil de la distribucin t N a grados de libertad.
2
Prueba de Duncan
R p = r ( p, f )
CM E
n
Prueba SNK
Procedimiento similar a la prueba de Duncan, salvo que las diferencias crticas entre
las medias se calculan en una forma un tanto diferente, su criterio es el siguiente:
K p = q ( p, f )
CM E
n
Prueba de Bonferroni
t * , f
CM E
n
Donde:
14
t * , f = t
2b
,f
b = Nmero de comparaciones
f = Grados libres del error
t = Distribucin de student con N-a grados de libertad.
2.5.2
Prueba Scheff
S ,u = S Cu (a 1) F ,a 1, N a
Donde:
a
S Cu = CM E
i =1
ciu2
ni
2.6
DSM
Para medidas alejadas real es mayor al nominal y para medias cercanas el valor
Es una prueba adecuada pero nicamente para comparar la media mnima contra la
mxima, para el resto de las medias se vuelve restrictiva.
TUKEY
Caso parecido a SNK donde resulta una prueba exacta, pero nicamente
comparando la media mnima contra la mxima, esto resulta a que utiliza una misma
mtrica para comparar todas las medias, lo cual hace que la prueba se vuelva
restrictiva.
BONFERRONI
Resulta una prueba restrictiva para cualquier comparacin, esto debido a que la
prueba arroja el resultado de una cota.
SCHEFFE
16
2.7
2.-
Inicializar CONT = 0
3.-
4.-
5.-
6.-
xi x j
CMES
n
17
7.-
Comparar:
DEs > DE CONT = CONT +1
8.-
9.-
Se calcula:
P.Value =
CONT
B
2.7.1
Estadsticos de Orden
Los estadsticos de orden, tambin conocidos como ordinales, son indispensables para el
planteamiento y desarrollo dentro de las pruebas de rango mltiple ya que son
importantes para ordenar las muestras aleatorias de las diversas poblaciones utilizadas.
Como su nombre lo indica su principal fin es ordenar los datos que sern utilizados
dentro de los experimentos, esto en base a determinados criterios que pueden ser de
orden creciente o decreciente. Para el caso de la presente investigacin se utiliza el
concepto de Mood y Graybill (1972):
Sea X1,X2,,Xn una muestra aleatoria procedente de la densidad f(x) y suponga que se
ordenan las Y1,Y2,,Yn en donde las Yi son las mismas que las Xi dispuestas en orden
de magnitud creciente Y1<Y2<<Yn. Las Y1,Y2,,Yn son conocidas como los
estadsticos de orden u ordinales de la muestra aleatoria X1,X2,,Xn
Parzen (1960) comparte el criterio de orden creciente de Mood y Graybill (1972)
18
2.7.2
mltiple.
2.-
3.-
4.-
5.-
Leer el contraste.
6.-
7.-
SC Contraste
CM E
8.-
9.-
10.-
11.-
12.-
Comparar:
B
FCalc
> FCalc Cont = Cont + 1
B
FCalc
< FCalc Continua
Calcular el Valor P:
ValorP =
Cont
B
Esto se lleva a cabo hasta que el nmero total de simulaciones haya sido
cubierto.
14.-
20
2.8
Existen dos maneras diferentes de aplicar las pruebas de rango mltiple, a continuacin
se muestra el planteamiento de cada una de estas:
Pruebas Protegidas
A estas pruebas se les conoce como de un solo paso, esto quiere decir que las
pruebas de rango mltiple se aplican directamente sin realizar con antelacin un
anlisis de varianza. Es posible calificar a estas pruebas como un anlisis puro o
menos manipulado, por lo cual los resultados se esperan diferentes a los arrojados
por las pruebas de dos pasos.
2.9
Tipos de Errores
Este error se define como la probabilidad de que por lo menos una de las comparaciones
hechas dentro de la familia est equivocada, es decir:
FWE ( F , P ) = Pr{M ( F , P ) > 0 }
Valor que representa la probabilidad de falla para cada una de las comparaciones en
forma individual sin considerar la familia completa, esto es:
PCE = E {M( F , P )}
N(F )
La relacin de los errores anteriores puede ser vista como:
PCE FWE PFE
Lo anterior indica que el Per-Family resulta una cota superior para el Familiwise y el
Per-Comparison representa una cota inferior para el mismo.
2.10
22
Los diferentes tipos de error varan segn la familia a la cual el investigador haga
referencia y la relacin entre las inferencias que integren a dicha familia (independientes
o dependientes).
Para familias finitas y con inferencias mutuamente independientes, el porcentaje de
error para una inferencia individual es por lo tanto:
PCE =
(1)
PFE = N ( F )
(2)
FWE = 1 (1 ) N ( F
(3)
PCE
0.05
0.05
0.05
0.05
0.05
0.05
0.05
0.05
FWE
0.05
0.23
0.40
0.54
0.64
0.78
0.87
0.92
PFE
0.05
0.25
0.50
0.75
1.00
1.50
2.00
2.50
23
por lo tanto es posible considerar el PCE como un valor comn para familias finitas e
infinitas.
Cmo una observacin importante que hacen Hochberg y Tamhane (1987) podra
recalcarse que se asume de manera general como porcentaje de error, al error Tipo I
(Probabilidad de rechazar Ho dado que Ho es cierta), a menos que un error diferente se
especifique con antelacin.
Con lo presentado anteriormente se puede conocer el nivel de requerido para lograr
un FWE deseado, simplemente despejando la ecuacin (3), como se muestra en el
siguiente ejemplo:
FWE = 1 (1 ) N ( F )
1 FWE = (1 ) N ( F )
N (F )
1 FWE = 1
= 1 N ( F ) 1 FWE
1
= 1 (1 FWE )
N (F )
= 1 (1 0.05) 63 = .0008
2.11
Al tratar el tema de los diferentes tipos de error, una de las preguntas ms comunes a
responder es Cul error es el que se debe de controlar en un proceso de comparacin
mltiple?
24
La respuesta a dicha pregunta vara demasiado segn el punto de vista de los diferentes
autores, por ejemplo Tukey (1953), despus de examinar los diferentes tipos de errores
llega a la conclusin de que el Familiwise (FWE) es el que debe ser controlado,
argumentando: El FWE debe ser un error estndar, por lo tanto rara vez cualquier
otro tipo de error ser apropiado controlar, Tukey rechaza la importancia del PCE
Spjotvoll (1972), recomienda el uso del PFE para el caso de familias finitas, sustentando
sus razones en los siguientes puntos:
El PFE es tcnicamente ms fcil de trabajar que el FWE.
El PFE impone una pena directa en base a la proporcin de errores.
El PFE es un lmite superior del FWE por lo cual el control de este ltimo va
25
Por otra parte Duncan (1955) nombra aproximaciones para controlar los errores dentro
de las familias finitas de inferencias; en esta aproximacin el PCE controla los niveles
de tradicionales, pero el FWE al incrementar solamente como 1 (1 ) N ( F
el mejor candidato ya que provee el lmite superior sobre cualquier nivel de una
hiptesis seleccionada.
Es importante recalcar que sin importar el tipo de error que se decida controlar el
experimentador tiene la facultad de elegir el nivel de que desea emplear. Si este
requiere una alta validez estadstica para controlar sus errores los niveles tradicionales
de para las inferencias simples ms comunes se encuentra en los rangos de
0.01 0.10, cuando el experimentador tolera una baja validez estadstica puede
controlar a niveles ms liberales como 0.10 0.25. (Rangos dados por Hochberg y
Tamhane (1987) para controlar los niveles del FWE)
Para el caso de investigaciones confirmatorias por lo general se presentan con familias
finitas, los tres diferentes tipos de error son buenos candidatos para controlarse, sin
embargo para llegar a una conclusin correcta es necesario conocer las inferencias
individualmente, esto lo mencionan Hochberg y Tamhane (1987) Para que una
decisin final sea la correcta, es necesario que todas las inferencias estn
simultneamente correctas entonces claramente el FWE puede ser controlado
A conclusin del anlisis anterior, es posible decir que es necesario determinar con
claridad la naturaleza del experimento as como lo que se desea alcanzar con la
investigacin, para que de esta maneara se conozca acorde a las necesidades y
propiedades del estudio el error que se requiere controlar.
27