Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadisticaaplicadaalaeducacinsuperior 130518195819 Phpapp01
Estadisticaaplicadaalaeducacinsuperior 130518195819 Phpapp01
MILITAR
DE
INGENIERIA
UNIDAD
ACADMICA
SANTA
CRUZ
UNIDAD DE POSTGRADO
ESTADSTICA
SUPERIOR
APLICADA
LA
EDUCACIN
INTRODUCCION
Una manera potencial para remediar la brecha entre teora y prctica es llevar a cabo
experimentos de diseo que:
- Buscan desarrollar una ciencia de diseo de la educacin.
- Puedan guiar el desarrollo de ambientes de aprendizaje eficaces novedosos
restriccin, la lnea que une a y/x debe de ser una recta, por lo tanto se puede tener una de
las siguientes situaciones:
Y
Puede ser que se tenga una relacin positiva entre las variables X y Y, esto quiere decir que
a medida que aumenta X, Y tambin aumenta.
Otra situacin que se puede dar es una relacin inversa, es decir, que a medida que aumenta
X, Y disminuye.
En el ltimo caso se recurre al hecho de que regresin tambin se entiende como la
tangente inversa del ngulo de inclinacin de una recta. En los dos primeros casos las rectas
tienen pendiente y en el tercer caso, no hay pendiente lo cual indica que no existe regresin
lineal entre ambas variables.
Supuesto 3. Homogeneidad de varianza
Esta suposicin es muy importante en el anlisis de regresin. La varianza de la
distribuciones de "Y" son idnticas para todos los valores de "X". En otras palabras, se
supone que y/x1 = y/x2 = y/xn = , donde es la varianza comn (desconocida) para
todas las distribuciones de "Y", independientemente del valor de "X". Esto quiere decir,
que la media de "Y" se modifica con el valor de "X", pero la varianza se mantiene
constante.
Supuesto 4. Independencia
Los valores de "Y" debern ser estadsticamente independiente. Un ejemplo donde se viola
este supuesto es cuando se realizan mediciones de peso a un mismo individuo en un lapso
menor a una hora.
Supuesto 5. Normalidad
La distribucin de "Y" para cualquier valor de "X" es normal. Esto equivale a suponer que
la variable aleatoria no observable es normal y su media es cero ya que "X" se toma
como variable no aleatoria susceptible a ser manipulada por el investigador.
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior
Para construir un diagrama de dispersin lo primero que se tiene que hacer es determinar
quin es la variable dependiente y quin es la variable independiente, es decir, establecer la
relacin entre dichas variables. Esta relacin debe ser lo ms natural posible.
En el caso del problema, es de suponerse que a medida que aumenta la produccin tambin
se incrementarn los costos de produccin por todo lo concerniente a ello (materia prima,
horas hombres, gastos de energa, etc.). Entonces definimos a X, variable independiente, a
la Produccin y a Y, variable dependiente, a los costos de produccin. De acuerdo a esto se
tiene lo siguiente:
Produccin (X)
(miles de millones de $us)
10
18
12
16
22
36
30
32
26
12
Costo (Y)
(miles de millones $u)
3
5
4
5
8
12
10
14
12
3
16
14
12
10
8
6
4
2
0
0
10
15
20
25
30
35
40
produccin de las mismas, es decir, se concluir que existe una relacin positiva entre estas
variables y adems se puede ver que esta relacin tiende a ser lineal.
Para llegar a obtener estos estimadores se hace uso de la tcnica propuesta por Carl Gauss
(1777-1855). Este mtodo se basa en la idea de obtener estimadores para los componentes
del modelo que minimicen la suma de cuadrados de las distancias entre los valores
observados (Yi) y los estimados ( ). Esto significa que se tiene que minimizar la suma de
cuadrados de las longitudes de los segmentos de las lneas verticales que unen los datos
observados con la recta estimada como se muestra en la Figura 3.
. Donde:
Coeficiente de Regresin
Ejemplo:
Retomando los datos que se utilizaron para construir el diagrama de dispersin y aclarando
que X es Produccin (miles de millones de $us) y Y Costos (miles de millones de $us)
y haciendo uso de las ecuaciones derivadas a travs de la tcnica de mnimos cuadrados se
tiene lo siguiente:
Totales
Promedio
XY
X2
Y2
10
30
100
18
90
324
25
12
48
144
16
16
80
256
25
22
176
484
64
36
12
432
1296
144
30
10
300
900
100
32
14
448
1024
196
26
12
312
676
144
12
36
144
214
21.4
76
7.6
1952
5348
732
( )
( )
(
) (
)
(
(
)
)(
)
)
Este dato indica que del 100% de la variabilidad de Y (Costos), el 89.36% es debido a X
(Produccin), por lo tanto tambin se puede concluir que existe un 10.64% de variabilidad
de Y (Costos) que no es debida a X (Produccin), a esto se le conoce como variabilidad no
explicada. En este caso se puede concluir tambin que la ecuacin estimada sirve para
predecir (existe regresin lineal simple.
Anlisis de Varianza de la Regresin Lineal Simple (ANARE)
De forma general se entienden por anlisis de varianza a la particin de la variabilidad total
en fuentes de variacin conocidas que en el caso de regresin lineal son las siguientes:
debida a la regresin
Para tratar de ser un poco ms explcito, estas dos fuentes de variacin se derivan del
modelo aditivo lineal de la regresin lnea simple el cual es:
Esto tiene correspondencia con una tabla de varianza o salida de
varianza que para regresin lineal simple es la siguiente:
FV
Regresin
Error
Total
gl
1
n-2
n-1
SC
SCRegresin
CM
Fc
Ft
(, glreg, glerr)
SCError
SCTotales
fuente de variacin.
(
(
La cuarta columna es para los Cuadrados Medios (CM) que viene a ser las estimaciones
propiamente dichas de las varianza de cada una de las fuentes de variacin. Estas resultan
de dividir las sumas de cuadrados de stas entre sus grados de libertad.
La quinta columna denominada como Fc se refiere a los F calculados que resultan de
dividir el cuadrado medio de regresin entre el cuadrado medio del error, es decir, de la
variabilidad no debida a la regresin. Es por ello que el error se considera como un trmino
de comparacin entre la variabilidad debida a regresin y el mismo. Si el cuadrado medio
del error es mayor que el cuadrado medio de regresin, el resultado que se obtendr ser
pequeo y posiblemente menor que el valor de la siguiente columna Ft o F de tabla,
valor que se extrae de una tabla de F con un nivel de significancia, grados de libertad de
regresin y los grados de libertad del error.
Para entender mejor lo anterior se debe de partir del juego de hiptesis que se prueba en un
ANARE. Este es:
Ho: 1 = 0
Ha: 1 0
La hiptesis nula (Ho) asume el efecto de igual o nulidad de efecto y es la hiptesis que se
somete a prueba. Partiendo del hecho de que asume el efecto de nulidad, en este caso indica
que no existe regresin lineal simple, y asume que la relacin entre X y Y es una lnea recta
sin pendiente, es por ello que es igual a cero.
Por hiptesis alternativa se entiende aquella que contradice a la hiptesis nula y que es
aceptada una vez que se rechaza la hiptesis nula. Es por ello que est como 1 0 ya que
una igualdad se contradice con una desigualdad. Esto significa que la recta tiene pendiente,
es decir, que existe regresin lineal simple.
Ahora bien, todo el ANARE se hace para realizar la prueba de hiptesis de que si existe o
no regresin lineal simple.
Se entiende como prueba de hiptesis al proceso a travs del cual se prueba la plausibilidad
de una hiptesis.
Al realizar la prueba de hiptesis se debe llegar una decisin de aceptar o rechazar Ho.
Cundo no se rechaza Ho?, cuando el Fc Ft y se rechaza cuando el Fc Ft. A lo anterior
se le llama Regla de Decisin la cual es la siguiente:
No Rechazo de Ho si Fc Ft
Rechazo de Ho si Fc Ft
Si la hiptesis nula no se rechaza significa que no existe regresin lineal simple, por lo
tanto la ecuacin estimada no sirve para predecir, si se rechaza Ho, inmediatamente se
acepta la hiptesis alternativa la que indica que s existe regresin lineal simple.
Un aspecto que todava no se ha aclarado es Nivel de Significancia, , entendido como
la probabilidad de tomar una decisin equivocada (conocido tambin como Error Tipo I) es
por ello que los valores del son pequeos 0.1.
Haciendo el ANARE a un = 0.01 se tiene lo siguiente:
(
= 154.4
(
FV
Regresin
Error
Total
gl
1
8
9
SC
137.6897
16.4310
154.4
CM
137.6897
2.053875
Fc
67.0389
Ft
11.26
)y(
0). La recta de
estimacin debe dibujarse dentro del rea de exploracin, es decir, el rea determinada por
el diagrama de dispersin que donde se tiene informacin de ambas variables.
Para el caso del ejemplo que se ha venido tratando la grfica de la recta de estimacin sera
como se muestra a continuacin.
16
y = 0.4237x - 1.468
R = 0.8936
14
12
10
8
6
4
2
0
0
10
15
20
25
30
35
40
Regresin Mltiple
No siempre la dependencia en caso de existir se pueda deber a una sola variable, puede ser
que Y como variable dependiente se vea afectada por ms de una variable independiente,
en este caso se habla de regresin lineal mltiple, aspecto que no se desarrolla en este
documento.
Asociacin
fuerte
y 0 r < 0.4
dbil
No hay asociacin
negativa
-0.8 r < - Asociacin
0.4
negativa
0.8
-0.4 r 0
No hay asociacin
0.8 r 1
Asociacin
fuerte
positiva
( )
( )
)(
)(
( )
= 0.9452
)
Este valor indica que existe una asociacin fuerte y positiva entre estas variables, es decir,
entre la produccin y los costos de esas empresas.
Diferencias entre Regresin Lineal Simple y Correlacin Lineal Simple
Se pueden llegar a establecer las siguientes diferencias:
Regresin Lineal Simple
Mide la cantidad de cambios en Y por un
nico cambio en X.
Existe una variable dependiente y otra
independiente
1 puede tomar cualquier valor en la recta
numrica
usando
las
repeticiones
necesarias,
usando
unidades
experimentales
los
ms
Diseos Experimentales:
Es un mtodo cientfico de investigacin que consiste en hacer operaciones prcticas
destinadas a demostrar, comprobar o descubrir fenmenos o principios bsicos. Tiene como
propsito proporcionar la mxima cantidad de informacin a un costo mnimo.
Disear un experimento es planificarlo, qu es lo que se pretende experimentar, es
planearlo de modo que se tenga la secuencia completa de pasos tomados de antemano para
asegurar que la informacin que se obtendr permita un anlisis objetivo que conduzca a
deducciones (demostracin de hiptesis) vlidas con respecto al problema de investigacin
previamente establecido.
Principios Bsicos de la Experimentacin:
Los principios bsicos de la experimentacin son tres: Repeticin, Azarizacin y Control
Local.
Repeticin. Es la reproduccin del experimento bsico llamado tambin rplica y
solamente a travs de ella se pueden obtener conclusiones de un fenmeno. Tiene dos
funciones: Proporcionar una estimacin del error experimental y brindar una medicin ms
precisa de los efectos de los tratamientos, es decir, que hace posible la prueba de
significancia.
Azarizacin. Es la asignacin de los tratamientos a las unidades experimentales de modo
que todas tengan la misma posibilidad de recibir un tratamiento. Tiene la como funcin
hacer vlida la prueba de significancia.
Control Local. Es la cantidad de balanceo, bloqueo o agrupamiento de las unidades
experimentales que se emplean en el diseo adoptado. Tiene la funcin de hacer ms
eficiente el diseo experimental, es decir, hacer ms sensitiva la prueba de significancia
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior
reduciendo con ello la magnitud del error. Los criterios de agrupamiento van a depender del
tipo de ciencia donde se est experimentando.
Exigencias de la Experimentacin:
Las exigencias de la experimentacin son: Tipicidad, Uniformidad, Grado de Precisin,
Control efectivo de las medidas y observaciones.
Tipicidad. Llamado tambin representatividad, hace mencin que no se pueden extrapolar
resultados a condiciones diferentes a las que se originaron.
Uniformidad. Indica que todas las unidades experimentales deben ser tratadas
uniformemente y que la nica diferencia entre ellos sea los tratamientos que se estn
evaluando en ellas. Esto evita tener resultados enmascarados en los experimentos.
Grado de Precisin. Un experimento bien planeado debe permitir al investigador medir
diferencias en los tratamientos con el grado de precisin esperado evitando para ello
comete errores al montar el ensayo y en su misma ejecucin. Esto debe ser una tarea de
primer orden por parte del investigador. Es por ello que se debe tener especial cuidado en la
conduccin y manejo del experimento.
Control efectivo de las medidas y observaciones. Es necesario hacer anotaciones de las
manifestaciones de las unidades experimentales que permitan explicar ciertos aspectos del
experimento.
Los diseos experimentales como tal se dividen en dos grupos: diseos experimentales
simples y diseos experimentales complejos.
Entre los diseos experimentales simples se tiene al Diseo Completamente al Azar,
Diseo en Bloques Completamente al Azar, Diseo Cuadrado Latino principalmente.
Donde:
Yij = Variable Respuesta
= Efecto comn a todas las observaciones
Ti = Efecto del i-simo tratamiento
Eij = Erro experimental o error del modelo
3.3.2. Normalidad:
Los trminos del error son aleatorios, independientes y normalmente distribuidos. Este
supuesto es de gran importancia ya que cuando los datos no se distribuyen normalmente los
coeficientes de variacin son muy elevados. Cuando los datos de una variable no presentan
normalidad, existen algunas tipos de transformaciones en dependencia de la caracterstica
de los datos de la variable en cuestin que la hacen normal.
Para probar normalidad tambin existen varias tcnicas entre las que se pueden mencionar
la prueba de Shapiro-Wilk y la de Lilliefors. Si el lector est interesado en profundizar
sobre estas pruebas se le sugiere consultar a Ramrez y Lpez (1993). (Mtodos
Estadsticos no Paramtricos)
3.3.3. Aditividad y Linealidad del Modelo:
Lo anterior se cumple en el modelo aditivo lineal ya que todos los efectos se suman y son
lineales porque cada uno de sus elementos del modelo lineal, estn a la potencia "1".
3.3.4. Independencia:
Es t e s upuest o i m pl i ca que l os t rm i nos del error so n aleatorios, no
correlacionados (independientes) normalmente distribuidos; adems, de las varianzas y las
medias de las distintas muestras.
3.4. Anlisis de varianza para este Diseo
El anlisis de varianza consiste en la particin de la variacin total en fuentes de variacin
conocidas y la que no es conocida se atribuye al error. El anlisis de varianza separa parte de
la varianza causada por efectos accidentales, no sistemticos (error experimental o
simplemente error) de los causados por efectos sistemticos conocidos (tratamientos).
Antes de mostrar la tabla de anlisis de varianza para e s t e d i s e o s e m u e s t r a a
continuacin
un
cuadro
de
1
Y11
Y21
Y31
Yi1
Y.1
1
2
3
i
Y.j
REPETICIONES
2
3
Y12
Y13
Y22
Y23
Y32
Y33
Yi2
Yi3
Y.2
Y.3
j
Y1j
Y2j
Y3j
Yij
Y.j
Yi.
Y1.
Y2.
Y3.
Y i.
Y..
El modelo lineal para este diseo tiene solo dos fuentes de variacin y es el siguiente:
El modelo aditivo de un Diseo Completamente al Azar se corresponde con las
salidas de varianza que se muestran en los Cuadro 2 y 3.
Cuadro 2. Salida de varianza para un Diseo Completamente al Azar con igual
nmero de repeticiones (diseo balanceado).
F.V
gl
SC
Tratamiento
t-1
SCTRAT.
Error
t(r-1)
SCError
Total
tr-1
SCTotales
CM
Fc
Ft
(
Donde:
F.V = Fuente de variacin
gl = Grados de libertad
SC = Suma de Cuadrados
CM = Cuadrado Medio
Fc = F calculado
Ft = F tabulado que se encuentra en la tabla de F a un nivel de significancia
(probabilidad de error tipo I), grados de libertad de los tratamientos y grados de libertad del
error
En caso de que los tratamientos tengan diferentes nmero de repeticiones (diseo
desbalanceado) la salida de varianza es la siguiente:
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior
gl
SC
Tratamiento
t-1
SCTRAT.
Error
n-t
SCError
Total
n-1
SCTotales
CM
Fc
Ft
(
Tratamiento
1
2
3
4
5
1
1.53
3.15
3.89
8.18
5.86
2
1.61
3.96
4.80
5.64
5.46
3
3.75
3.59
3.69
7.36
5.69
Repeticiones
4
5
2.89
3.26
1.89
1.45
5.70
5.62
5.33
8.82
6.49
7.81
6
7
8
2.83
2.86
2.59
3.49
1.56
2.44
5.79
4.75
5.33
5.26
8.75
7.10
9.03
7.49
8.98
Adaptado de Wyane (1970)
1
1.53
3.15
3.89
8.18
5.86
22.61
1
2
3
4
5
Y.j
2
1.61
3.96
4.8
5.64
5.46
21.47
3
3.75
3.59
3.69
7.36
5.69
24.08
Repeticiones
4
5
2.89 3.26
1.89 1.45
5.7 5.62
5.33 8.82
6.49 7.81
22.3 26.96
6
7
2.83 2.86
3.49 1.56
5.79 4.75
5.26 8.75
9.03 7.49
26.4 25.41
Yi.
8
2.59 21.32
2.44 21.53
5.33 39.57
7.1
56.44
8.98 56.81
26.44 195.67
S
0.5791
0.9702
0.6621
2.2212
2.0718
Y..
(
(
)
)
Analizando los resultados obtenidos al aplicar las ecuaciones de trabajo para este diseo es
importante sealar que ninguna de estas sumas de cuadrados puede ser negativa ya que son
componentes de varianza y la varianza nunca puede ser negativa. Por otra parte, se puede
observar que la Suma de Cuadrados Totales es la mayor, en verdad sta es la variacin
total y ninguna de las dems puede ser mayor que sta. Adems se puede observar que la
Suma de Cuadrados del Error se obtiene por diferencia entre la Suma de Cuadrados
Totales y la de Tratamiento. Esto es producto de la aplicacin misma de lo que es anlisis
de varianza.
Una vez obtenidas las sumas de cuadrados correspondientes, el siguiente paso es construir
gl
4
35
39
SC
CM
Fc
F(0.01, 4, 35)
154.921015 38.7302538 29.7714584
3.908
45.5321625 1.30091893
200.453178
C.V. = 23.32%
provoc que la hiptesis nula sea rechazada. Para este fin, existen las llamadas pruebas de
Rangos Mltiples. Entre estas pruebas estn:
Mtodo de Duncan
Mtodo de Scheff.
Ha: |
La hiptesis nula, que es la que se prueba, asume el efecto de igualdad de los promedios a
comparar es por ello que la diferencia es igual a cero y por lo tanto, la hiptesis alternativa
contradice la hiptesis nula con una desigualdad.
La regla de decisin es la siguiente:
NRHo
Valor
crtico
de
la
prueba
est
dentro
de
la
diferencia:
|
| o bien
. Los especialistas hacen mencin que este mtodo es adecuado para comparar un
, donde:
Donde:
Es el valor extrado de una tabla especial de rango estudentizado, con los grados de
libertad del error y con la disposicin relativa de las medias en el arreglo.
CMError = Cuadrado Medio del Error
r = Nmero de repeticiones.
Donde:
q = Valor obtenido de tablas especiales de rango estudentizado, para los grados de
libertad del error y con la disposicin relativa de las medias en el arreglo
CMError = Cuadrado medio del error
r = nmero de repeticiones
Donde:
q = Valor obtenido de tablas especiales de rango estudentizados, para los grados de
libertad del error y con la disposicin relativa de las medias en el arreglo
CMError = Cuadrado medio del error
r = nmero de repeticiones
Donde:
t = Nmero de tratamientos
F = Valor que se obtiene de la distribucin de F de Snedecor con t-1 y los grados de
libertad del error.
CError = Cuadrado medio del error, y ri, rj representan el nmero de observaciones usadas
para calcular cada media muestra
Ejemplo.
A continuacin se aplican todas las pruebas de rangos mltiples antes expuestas de manera
que se pueda realizar una comparacin entre stas. Los promedios por tratamiento son los
siguientes:
Promedio
2.665
2.69125
4.94625
7.055
7.10125
Tratamiento
5
4
3
2
1
Promedios Ordenados
7.10125
7.055
4.94625
2.69125
2.665
prueba de DMS.
Cuadro 7. Resultado de la prueba de DMS para los tratamientos estudiados.
Comparacin
Diferencia de Medias
T5 versus T4
T5 versus T3
T5 versus T2
T5 versus T1
T4 versus T3
T4 versus T2
T4 versus T1
T3 versus T2
T3 versus T1
T2 versus T1
ns = No significativo * = significativo
0.04625
2.155
4.41
4.43625
2.10875
4.36375
4.39
2.255
2.28125
0.02625
Resultado de la
comparacin
ns
*
*
*
*
*
*
*
*
ns
Comparacin
a
a
b
c
c
Promedios con literales distintas son estadsticamente diferentes segn el mtodo de DMS (P 0.01).
Para realizar la prueba de Duncan lo primero que se debe hacer es obtener los valores
estudentizados extrados de la tabla de Duncan. En este caso se estn utilizando valores
interpolados ya que no existen en la tabla grado de libertad igual a 35 solo hay entre 30 y
40 por lo tanto lo que se hizo fue promediar los dos valores. Estos son los siguientes:
2
3.855
1.554549
3
4.025
1.623103
4
4.13
1.665445
5
4.195
1.691656
Aqu se puede ver el efecto secuencial de Duncan ya que utiliza un comparador distinto
segn el nmero de medias a comparar.
Los resultados de aplicar la prueba son los siguientes:
Cuadro 9. Contrastacin de las diferencias entre medias adyacentes con los valores
crticos de Duncan.
Promedios
7.10125
Tratamientos
5
5
0
7.10125
4
7.055
3
4.94625
2
2.69125
1
2.665
RMS
1.69166
ns = No significativo * = significativo
Promedios
7.055
4.94625 2.69125
2.665
4
3
2
1
0.04625 ns 2.155 *
4.41*
4.43625 *
0
2.10875* 4.36375*
4.39*
0
2.255*
2.28125*
0
0.02625 ns
0
1.66544
1.62310 1.55455
Tratamiento
5
4
3
2
1
Comparacin
a
a
b
c
c
Promedios con literales distintas son estadsticamente diferentes segn el mtodo de Duncan (P 0.01).
Como se puede observar, en este caso los resultados obtenidos son los mismos que en la
prueba de DMS, por lo tanto, la interpretacin es la misma.
Aplicando SNK:
Al igual que la prueba de Duncan, SNK es una prueba secuencial lo que indica que utiliza
un valor diferente para cada comparacin de acuerdo al nmero de medias a comparar. Los
valores q y valores crticos de SNK se muestran en el Cuadro 10.
Cuadro 10. Valores estudentizados de la prueba de SNK de acuerdo al nmero de
medias adyacentes a comparar y valores crticos de la misma.
Medias a comparar
q(0.01, 35)
SNK
2
3.855
1.55454932
3
4.41
1.778356
4
4.75
1.9154628
5
4.99
2.0122441
Los resultados al aplicar la prueba de rangos mltiples de SNK se resumen en el Cuadro 11.
Cuadro 11. Resultados de la comparacin de medias segn el mtodo de SNK.
Promedios
7.10125
Tratamientos
5
5
0
7.10125
4
7.055
3
4.94625
2
2.69125
1
2.665
SNK
2.0122441
ns = No significativo * = significativo
Promedios
7.055
4
0.04625 ns
0
4.94625
3
2.155 *
2.10875*
0
2.69125
2
4.41*
4.36375*
2.255*
0
1.9154628
1.778356
1.554549
2.665
1
4.43625 *
4.39*
2.28125*
0.02625 ns
0
Comparacin
a
a
b
c
c
Promedios con literales distintas son estadsticamente diferentes segn el mtodo de SNK (P 0.01)
En este caso, los resultados de aplicacin del mtodo de SNK coinciden con el anterior y
por ende, la interpretacin es la misma.
Aplicando ahora el mtodo de Tukey o Diferencia Honesta Mnima se tiene lo siguiente:
Tukey no es un mtodo secuencial, es decir, que utiliza un solo valor estudentizado para
obtener el valor crtico de prueba, utiliza la misma tabla que SNK pero con el nmero
mximo de medias a comparar.
q(0,01, 5, 35) = 4.99
Diferencia de Medias
T5 versus T4
T5 versus T3
T5 versus T2
T5 versus T1
T4 versus T3
T4 versus T2
T4 versus T1
T3 versus T2
T3 versus T1
T2 versus T1
ns = No significativo * = significativo
0.04625
2.155
4.41
4.43625
2.10875
4.36375
4.39
2.255
2.28125
0.02625
Resultado de la
comparacin
ns
*
*
*
*
*
*
*
*
ns
Tratamiento
5
4
3
2
1
Comparacin
a
a
b
c
c
Promedios con literales distintas son estadsticamente diferentes segn el mtodo de Tukey (P 0.01).
Mtodo de Scheff
(
La prueba de Scheff al igual que Tukey no es una prueba secuencial por lo tanto solo
utiliza un valor de F de Snedecor que se extrae un nivel de significancia , para el caso
del ejemplo = 0.01, con los grado de libertad de tratamientos y los del error experimental.
De acuerdo a esto se tiene lo siguiente:
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior
Diferencia de Medias
T5 versus T4
T5 versus T3
T5 versus T2
T5 versus T1
T4 versus T3
T4 versus T2
T4 versus T1
T3 versus T2
T3 versus T1
T2 versus T1
ns = No significativo * = significativo
0.04625
2.155
4.41
4.43625
2.10875
4.36375
4.39
2.255
2.28125
0.02625
Resultado de la
comparacin
ns
ns
*
*
ns
*
*
*
*
ns
Comparacin
a
a
a
b
b
Promedios con literales distintas son estadsticamente diferentes segn el mtodo de Scheff (P 0.01).
En el Cuadro 14 se resumen los resultados obtenidos por cada una de las pruebas de
separacin de medias aplicados.
Cuadro 14. Resumen de los resultados obtenidos al aplicar las pruebas de rangos
mltiples de DMS, Duncan, SNK, Tukey y Scheff a un nivel de
significancia de = 0.05.
Tratamiento Promedio
5
7.10125
4
7.055
3
4.94625
2
2.69125
1
2.665
DMS
a
a
b
c
c
Duncan
a
a
b
c
c
SNK
a
a
b
c
c
Tukey
a
a
b
c
c
Scheff
a
a
a
b
b
Donde:
Yij = Variable respuesta
= Efecto comn a todas las observaciones
Bj = Efecto de la j-sima repeticin; j = 1, 2, 3,...r repeticiones
Ti = Efecto del j-simo tratamiento; i = 1, 2, 3, i, tratamiento
Eij = Error experimental
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior
TRATAMIENTOS
1
2
3
i
Y.j
BLOQUES
2
3
Y12
Y13
Y22
Y23
Y32
Y33
Yi2
Yi3
Y.2
Y.3
1
Y11
Y21
Y31
Yi1
Y.1
Yi.
j
Y1j
Y2j
Y3j
Yij
Y.j
Y1.
Y2.
Y3.
Y i.
Y..
gl
SC
CM
Bloque
r-1
SCBloque
CMBloque
Tratamiento
t-1
SCTRAT.
CMTRAT.
(t-1)(r-1) SCError
tr-1
SCTotales
CMError
Error
Total
Fc
Ft
En este diseo se prueban dos juegos de hiptesis uno para bloques y otros para
tratamientos. Estas hiptesis son las siguientes:
Para tratamiento
Ho: 1 - 2 - 3 - i = 0 (T1 - T2 - T3 - Ti = 0)
Ha: 1 - 2 - 3 - i 0(T1 - T2 - T3 - Ti 0).
Para Bloques
Ho: B1 - B2 - B3 - Bj = 0 (B1 - B2 - B3 - Bj = 0)
Ha: B1 - B2 - B3 - Bj 0 (B1 - B2 - B3 Bj 0).
Las ecuaciones de trabajo para realizar el anlisis de varianza de este diseo son las
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior
siguientes:
; Factor de Correccin
Ejemplo:
Un fisioterapeuta deseaba comparar tres mtodos para ensear a los pacientes el uso de
cierto aparato prottico. Tena la sensacin de que la rapidez de aprendizaje sera diferente
para pacientes de diferentes edades y deseaba disear un experimento en el que pudiera
tomarse en consideracin la influencia de la edad. Para ello seleccin tres pacientes en cada
uno de los cuatros grupos de edades para participar en el experimento y, en cada grupo de
edad se asign un paciente aleatoriamente a cada uno de los mtodos de enseanza. Los
mtodos de instruccin corresponden a los tratamientos y los cinco grupos de edades
corresponden a los bloques. La variable medida fue el tiempo (das) requerido para
aprender el uso de cierto aparato prottico. Los datos son los siguientes:
Cuadro 16. Tiempo requerido para el manejo de un aparato prottico bajo tres
modalidades de enseanza en grupos de diferentes edades.
Mtodo de
Enseanza
A
B
C
Y.j
< a 20
7
9
10
26
Edades (aos)
20 a 29
30 a 39
40 a 49
8
9
10
9
9
9
10
12
12
27
30
31
Yi.
50 y ms
11
45
12
48
14
58
37
151
Adaptado de Wyane (1970)
(7 + 8 +14)-1520.06667 = 46.93333
(
)
(
gl
4
2
8
15
SC
CM
6.2333
9.26666
0.43333
Fc
14.38465
21.38458
F(0.01)
7.006
8.649
46.93333
Interpretacin de Resultados
Es necesario recalcar que en un diseo de bloques completamente al azar la variable que se
est bloqueando no es de inters estudiar, en este caso, el fisioterapeuta est interesado en
el manejo del aparato prottico sin embargo, el presume que la edad puede estar afectando
esta velocidad de aprendizaje en este tipo de pacientes y por ello que organiza el
experimento y agrupa las unidades experimentales de acuerdo a las edades de los paciente.
Cuando se establece un diseo en bloques completamente al azar, es necesario estar seguro
que en verdad el factor de estorbo existe, caso contrario se pierde grados de libertad en el
error, lo cual hace que las diferencias dentro de los tratamientos (error experimental) sean
mayores con las consecuencias que corresponden.
Para el caso del ejemplo, se puede verificar en la salida de varianza que existe diferencias
significativas (P 0.01) en bloques lo cual indica, que el investigador tena razn en
realizar el bloqueo por edades de los pacientes. Esto indica tambin que la velocidad de
aprendizaje (vista como el manejo del aparato prottico), se ve afectada por la edad.
Por otra parte, este mismo anlisis indica que los mtodos de enseanza afectan o ejercen
efecto significativo en la velocidad de aprendizaje de los pacientes. Esto se puede concluir
a un 99% de confiabilidad.
Dado que el anlisis de varianza report diferencias significativas en el tiempo de
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior
aprendizaje, se debe aplicar una prueba de rangos mltiples para verificar cul de las
tcnicas de enseanza.
Para realizar lo antes expuesto lo primero que hay que hacer es ordenar las medias por
magnitud (descendente) como se muestra en el Cuadro 18.
Promedios
9
9.6
11.6
Mtodo de Enseanza
C
B
A
Promedios Ordenados
11.6
9.6
9
1.65742075
Diferencias de Medias
2.0
2.6
0.6
Resultado de la Comparacin
*
*
ns
Resumiendo los resultados de las comparaciones realizadas se puede resumir a travs del
siguiente rango de mrito
Mtodo de Enseanza
C
B
A
Comparacin
a
b
b
Lo anterior indica que el mtodo donde los pacientes tardan menos son el A y el B, ambos
mtodos son estadsticamente iguales, es decir, que ejercen el mismo efecto sobre el tiempo
que duran los pacientes para aprender el manejo de aparato prottico y el mtodo donde se
tarda ms es el mtodo C ya que aqu los pacientes tardan en promedio 11 das y que fue
diferente (P 0.01) a los dems mtodos.
5. DISEO CUADRADO LATINO (DCL)
Anteriormente se han analizado los casos de l os di seos C om pl et am ent e al Az ar
donde el m at eri al experimental tiene que ser homogneo y Bloques al Azar, donde el
material experimental presenta un factor sistemtico o de estorbo. Sin embargo, en la
investigacin se presentan casos donde el material experimental presenta dos tipos de
efectos no sistemticos o sea dos factores de estorbo, que no son de inters en la
investigacin pero pueden afectar los resultados del experimento. Adems, imposibilita el uso
de los diseos antes mencionados.
5.1. Cundo Utilizar este Diseo?
El diseo Cuadrado Latino, es considerado como una variante del diseo Bloques
al Azar. Este diseo es de gran utilidad cuando el material experimental presenta dos efectos
de estorbo. Permite controlar dos efectos sistemticos que afectan al material experimental,
adems del efecto de tratamiento que es el de inters estudiar. Tiene la caracterstica de
controlar los efectos de estorbo a travs de hileras y columna, o sea un doble bloqueo.
Para que los efectos de las hileras y las columnas no se confundan con el de los
tratamientos, stos se ubican de tal forma que un tratamiento no se repite en la misma
columna y la misma hilera. Por esta razn, la cantidad de tratamiento coincide con el
mismo nmero de filas y columnas.
La principal restriccin de este diseo es que el nmero de repeticiones es igual al nmero
de tratamiento, si este ltimo es considerable el nmero de repeticiones requerido se vuelve
impracticable. Son pocos usados los Cuadros Latinos 12 x 12, mientras que el tamao ms
comn es desde 5 x 5 hasta 8 X 8. Est e di seo present a hast a ciert o punto la
m is m a d e s v e n t a j a q u e l o s B l o q u e s a l A z a r d e q u e , e l e r r o r experimental por
unidad, se aumente con el tamao del cuadro.
Columnas
C1
Y11
Y21
Y31
Yi1
Y.1
C2
Y12
Y22
Y32
Yi2
Y.2
C3
Y13
Y23
Y33
Yi3
Y.3
Cj
Y1j
Y2j
Y3j
Yij
Y.j
Yi.
Y1.
Y2.
Y3.
Yi.
Y..
Los tratamientos estn entre las hileras y las columnas bajo las caractersticas que se han
mencionado anteriormente, es por ello que hay que hacer un resumen de los tratamientos en
otro cuadrado como se muestra a continuacin.
Repeticiones
R2
R3
Y12
Y13
Y22
Y23
Y32
Y33
Yi2
Yi3
Y..2
Y..3
R1
Y11
Y21
Y31
Yi1
Y..1
T1
T2
T3
Tk
Yi.
Rj
Y1j
Y2j
Y3j
Yij
Y..j
Y1.
Y2.
Y3.
Y..k
Y
gl
Hileras
t-1
SCHileras CMHileras
Columnas
t-1
SCColumn CMColumn
Tratamiento
t-1
SCTRAT.
CMTRAT.
(t-1)(t-2) SCError
t-1
SCTotales
CMError
Error
Total
SC
CM
Fc
Ft
Las ecuaciones de trabajo para el anlisis de varianza de este diseo son las siguientes:
(
Ejemplo:
Peso
P1
P2
P3
P4
Grupo Etreo
E2
E3
9.5 F2
7.0 F4
10.0 F1
8.5 F3
6.5 F4
7.0 F1
5.0 F3
6.0 F2
E1
10.0 F1
8.0 F2
7.0 F3
6.0 F4
E4
11.5 F3
9.0 F4
8.0 F2
9.0 F1
Lo primero que se debe hacer es resumir la informacin para columnas e hileras. Esta es la
siguiente:
Peso
P1
P2
P3
P4
Y.j.
E1
10.0
8.0
7.0
6.0
Grupo Etreo
E2
E3
9.5
7.0
10.0
8.5
6.5
7.0
5.0
6.0
E4
11.5
9.0
8.0
9.0
31.0
31.0
37.5
28.5
Yi..
38.0
35.5
28.5
26.0
128.0
Y..k
F1
F2
F3
F4
10.0
8.0
7.0
6.0
10.0
9.5
5.0
6.5
7.0
6.0
8.5
7.0
9.0
8.0
11.5
9.0
36.0
31.5
32.0
28.5
)
(
)
(
)
(
)
(
gl
3
3
3
6
15
SC
24.125
11.125
7.125
4.625
47.0
CM
FC
8.0416667 10.432432
3.7083333 4.8108108
2.375
3.0810811
0.7708333
Ft (0.05)
4.757
4.757
4.757
6. DISEOS FACTORIALES
Como se mencion en un principio, todos los diseos hasta ahora desarrollados son diseos
simples donde solo se ha analizado el efecto de tratamiento. Sin embargo, se presentan
situaciones donde la interrogante a investigar se encuentra supeditada por varios factores
controlables, por ejemplo:
Factor B
b1
a1b1
a2b1
a3b1
b2
a1b2
a2b2
a3b2
b3
a1b3
a2b3
a3b3
b4
a1b4
a2b4
a3b4
Factor B
b1
b2
b3
bj
b1
b2
b3
bj
b1
b2
b3
bj
b1
b2
b3
bj
a1
a2
a3
ai
1
Y111
Y121
Y131
Y1j1
Y211
Y221
Y231
Y2j1
Y311
Y321
Y331
Y3j1
Yi11
Yi21
Yi31
Yij1
Repeticiones
2
3
Y112
Y113
Y122
Y123
Y132
Y133
Y1j2
Y1j3
Y212
Y213
Y222
Y223
Y232
Y233
Y2j2
Y2j3
Y312
Y313
Y322
Y323
Y332
Y333
Y3j2
Y3j3
Yi12
Yi13
Yi22
Yi23
Yi32
Yi33
Yij2
Yij3
k
Y11k
Y12k
Y13k
Y1jk
Y21k
Y22k
Y23k
Y2jk
Y31k
Y32k
Y33k
Y3jk
Yi1k
Yi2k
Yi3k
Yijk
Yij.
Y11.
Y12.
Y13.
Y1j.
Y21.
Y22.
Y23.
Y2i.
Y31.
Y32.
Y33.
Y3j.
Yi1.
Yi2.
Yi3.
Yij.
b1
Y11.
Y21.
Y31.
Yi1.
Y.1.
a1
a2
a3
ai
Y.j.
b2
Y12.
Y22.
Y32.
Yi2.
Y.2.
Factor B
b3
Y13.
Y23.
Y33.
Yi3.
Y.3.
b4
Y14.
Y24.
Y34.
Yi4.
Y.4.
bj
Y1j.
Y2j.
Y3j.
Yij.
Y.j.
Yi..
Y1..
Y2..
Y3..
Yi..
Y
)
(
gl
SC
Factor A
a-1
SCA
F(,glA, gl Error)
Factor B
b-1
SCB
F(,glB, gl Error)
A*B
(a-1)(b-1)
SCAB
Error
ab(r-1)
SCError
Total
abr-1
SCTotales
CM
Fc
)(
(
Ft
F(,glAB, gl Error)
gl
SC
Bloque
k-1
SCBloques
Factor A
a-1
SCA
F(,glA, gl Error)
Factor B
b-1
SCB
F(,glB, gl Error)
A*B
(a-1)(b-1)
SCAB
Error
(ab-1)(r-1)
SCError
Total
abr-1
SCTotales
CM
Fc
)(
(
Ft
F(, glbloque, gl
Error
F(,glAB, gl Error)
En este caso se adicionara una hiptesis ms que sera la de bloque y si hubiera un rechazo
de Ho, la interpretacin sera la misma que se ha mencionado anteriormente.
Ejemplo
Un mdico est interesado en determinar si tanto el estado nutricional como la edad (grupo
etreo) de la madre tiene efecto sobre el peso del recin nacido. Los estados nutricionales
de su inters fueron: Normal, Sobrepeso y Obesa, y los grupos etreos fueron: menores a 15
aos, 15 a 18 aos, 19 a 30 aos y mayores a 30 aos. Seleccion de forma aleatoria cuatro
madres para cada combinacin de los niveles de los dos factores, estado nutricional y grupo
etreo). Los pesos obtenidos en gramos fueron los que se reportan en el Cuadro 30.
En este caso se tiene un experimento bifactorial, Estado Nutricional y Grupo Etreo, cada
uno con tres y cuatro niveles, respectivamente. Esto hace que se tenga un bifactorial 3 x 4
(esto vendra a ser un factorial completo asimtrico, asimtrico por no tienen el mismo
nmero de niveles y completo por se estudian todos los niveles que han sido propuestos por
el investigador. Por otra parte se tiene cuatro repeticiones por tratamiento (combinacin),
entonces viene a ser un bifactorial 3 x 4 con 4 repeticiones, haciendo un total de 48
unidades experimentales como se muestra en el Cuadro 30.
Para los datos del Cuadro 30 realice lo siguiente:
a. Proponga y describa un modelo aditivo lineal para el experimento.
b. Proponga los juegos de hiptesis a probar.
c. Realice el anlisis de varianza correspondiente de acuerdo al modelo aditivo lineal
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior
Normal
Con sobrepeso
Obesa
Menor de 15
15 a 18
19 a 30
Mayor a 30
Menor de 15
15 a 18
19 a 30
Mayor a 30
Menor de 15
15 a 18
19 a 30
Mayor a 30
1
1800
2000
3000
3100
2100
2500
2700
2900
3000
3100
2800
2800
Repeticiones
2
3
1900
1700
2400
2900
2800
2900
3300
2600
1800
1900
2900
3200
2900
3100
2600
3200
2800
2400
3300
2900
2500
3200
3100
3400
4
2000
3000
3200
2800
2200
2900
3500
2700
2500
3400
3100
3500
Grupo
Etreo
Menor de 15
15 a 18
Normal
19 a 30
Mayor a 30
Menor de 15
15 a 18
Con sobrepeso
19 a 30
Mayor a 30
Menor de 15
15 a 18
Obesa
19 a 30
Mayor a 30
1
1800
2000
3000
3100
2100
2500
2700
2900
3000
3100
2800
2800
Repeticiones
2
3
1900
1700
2400
2900
2800
2900
3300
2600
1800
1900
2900
3200
2900
3100
2600
3200
2800
2400
3300
2900
2500
3200
3100
3400
4
2000
3000
3200
2800
2200
2900
3500
2700
2500
3400
3100
3500
Yij.
7400
10300
11900
11800
8000
11500
12200
11400
10700
12700
11600
12800
Mayor a 30
11800
11400
12800
36000
Yi..
41400
43100
47800
132300
b. Juego de Hiptesis
Como existen dos factores y sus interacciones, las hiptesis son las siguientes:
Para el factor Estado Nutricional:
Ho: Normal- Sobre peso- Obesa = 0
Ha: Normal- Sobre peso- Obesa 0
Para el factor Grupo Etreo:
Ho: menores de 15 - 15 a 18 - 19 a 30 - mayores 30 aos = 0
Ha: menores de 15 - 15 a 18 - 19 a 30 - mayores 30 aos 0
Para las interacciones:
Ho: a1b1 - a1b2 - a1b3 - a1b4 - a3b4 = 0
Ha: a1b1 - a1b2 - a1b3 - a1b4 - a3b4 0
c. Anlisis de varianza
(
)
(
)
(
(
(
)
(
)
)
Con estos clculos se construye la salida o tabla de varianza como se muestra en el Cuadro
33.
Cuadro 33. Salida de varianza para el diseo bifactorial en un DCA del ejemplo.
F.V
Estado Nutricional
Grupo Etreo
Interaccin
Error
Total
gl
2
3
6
36
47
SC
1373750
5510625
1196250
2957500
11038125
CM
686875
1836875
199375
82152.778
Fc
8.3609467
22.359256
2.4268808
Ft (0.01)
5.248
4.377
3.351
De acuerdo a los resultados del anlisis de varianza se puede concluir con 99% de
confiabilidad que el peso de los recin nacidos se ve afectado por el Estado Nutricional y
por el Grupo Etreo de las madres, es decir, que ejercen efectos significativos (P < 0.01) en
el peso de los recin nacidos, no as las interacciones de los niveles estudiados ya que sta
result ser no significativa. Esto indica que los factores estudiados ejercen efectos aditivos
o bien que actan de forma independiente en la variable respuesta.
d. Separacin de media de Tukey al 99% de confiabilidad
Cuando se dan este tipo de resultados hay que determinar el nivel o niveles de cada factor
que provocaron el rechazo de la hiptesis nula en el anlisis de varianza. Para ello hay que
hacer los ajustes necesarios como se muestra en el Cuadro 34.
Cuadro 34. Ajuste de los efectos principales y secundarios para la separacin de
medias.
Efecto
Total
Promedio
Yi..
Y.j.
AB
Yij.
Ajuste
Estado Nutricional
Normal
Con sobrepeso
Obesa
Totales
41400
43100
47800
Promedio
2587.5
2693.75
2987.5
Ordenando los promedios de los niveles del factor Estado Nutricional y estableciendo las
comparaciones correspondiente se tiene lo siguiente:
Estado Nutricional
Obesa
Con sobrepeso
Normal
Promedio
2987.5
2693.75
2587.5
Comparaciones
Obesa-Sobrepeso
Obesa- Normal
Sobrepeso - Normal
Diferencias Resultado
a
293.75 ns
ab
400 *
b
106.25 ns
En este caso se puede decir que de los niveles del factor Estado Nutricional, solo el nivel
Obesa ejerci un efecto distinto (P <0.01) en el peso de los recin nacidos.
Los ajustes para los niveles del factor Grupo Etreo se tiene lo siguiente:
Grupo Etreo
Menor de 15
15 a 18
19 a 30
Mayor a 30
Totales
26100
34500
35700
36000
Promedio
2175
2875
2975
3000
Ordenando los promedios de los niveles del factor Grupo Etreo y estableciendo las
comparaciones correspondiente se tiene lo siguiente:
Comparaciones
Mayor a 30 - 19 a 30
Mayor a 30 - 15 a 18
Mayor a 30 - Menor a 15
19 a 30 - 15 a 18
19 a 30 - Menor a 15
15 a 18 - Menor a 15
Grupo Etreo
Mayor a 30
19 a 30
15 a 18
Menor de 15
Diferencias
25 ns
125 ns
825*
100 ns
800 *
700 *
Promedio
3000
2975
2875
2175
Resultado
a
a
a
b
De acuerdo a los resultados de Tukey se puede concluir que de los niveles del factor Grupo
Etreo, solamente uno de stos ejerci un efecto distinto el peso de los recin nacidos como
las madres menores de 15 aos.
COCHRAN, W. y G.M. COX. 1991. Diseos Experimentales. 2da. Edic. Edit. Trillas.
Mxico, D.F.
FREUD, R.J. and R.C. LITTELL. 1991. SAS System for Regression. SAS Institute Inc,
Cary. N.C. USA.
HERRERA HARO, J.G y G. LORENZANA. 1994. Aplicaciones del SAS (Statistical
Analysis System) a los Mtodos Estadsticos. Instituto Tecnolgico Agropecuario
de Oaxaca. Oaxaca, Mxico.
HILDERBRAND, P.E. y F. POEY. 1989. Ensayos Agronmicos en Fincas segn el
Enfoque de Sistemas Agropecuarios. Edit. Agropecuaria Latinoamericana, Inc.
Estados Unidos de Norteamrica.
INFANTE GIL, S. y G. ZARATE DE LARA. 1990. Mtodos Estadsticos. Un enfoque
interdiciplinario. 2da. Edic. Edit. Trillas. Mxico, D.F.
LITTLE, T. y F.J. HILLS. 1989. Mtodos Estadsticos para la Investigacin Agropecuaria.
2da. Edic. Edit. Trillas. Mxico, D.F.
LOPEZ, P.F. 1989. Uso del SAS para anlisis estadsticos de datos experimentales. Centro
Agronmico Tropical de Investigacin y Enseanza C.A.T.I.E. Turrialba, Costa
Rica.
MARTINEZ-GARZA, A. 1988. Diseos Experimentales. Mtodos y Elementos de Teora.
Edit. Trillas. Mxico, D.F,
MARTINEZ-GARZA, A. 1994. Experimentacin Agrcola. Mtodos Estadsticos.
Universidad Autnoma Chapingo. Chapingo, Mxico.
MARTINEZ
SOLARIS,
F.
http://cdn.slidesharecdn.com/ss_thumbnails/estadisticaydiseosexperimentales110925201348-phpapp02-thumbnail.jpg?1316999785
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior
2111.