Documentos de Académico
Documentos de Profesional
Documentos de Cultura
EJEMPLO 11. CA CON DIFERENTE NÚMERO DE REPETICIONES
Supóngase que tenemos como tratamientos las variedades de arroz, en toneladas; UE´s sonlas parcelas, en
hectáreas y las VR´s son el rendimiento en
Ton/Ha.Llevar cabo un ANAVA con un nivel de significancia 0.05 e intérprete el resultado.
Cálculos
Conclusión
Con un nivel de significancia del 5% y en condiciones similares bajo las cuales serealizó el experimento, se
concluye que no todas las variedades estudiadas producen elmismo efecto en el rendimiento de grano.
Comprobación con SAS
TEORÍA DEL DCA
Definición
DCA:
Ventajas
Desventajas
Se puede obtener baja precisión cuando las unidades experimentales no sean muy
homogéneas y así ser ineficiente.
Usos
Para ilustrar el diseño, supongamos que queremos determinar si cuatro dosificaciones de un hormigón A,B,C
y D presentan una misma resistencia característica a compresión. Para ello se han elaborado 5 probetas para
cada tipo de dosificación y, a los 28 días, se han roto las probetas a compresión simple y los resultados son
los que hemos recogido en la tabla que sigue.
DOSIFICACIONES DE HORMIGÓN
A B C D
Resistencia 42 45 64 5
característica a 39 46 61 5
compresión fck (Mpa)
48 45 50 6
43 39 55 5
Este tipo de diseño se llama completamente al azar porque todas las repeticiones experimentales se realizan
en orden aleatorio completo, pues44 no se han tenido en cuenta otros43factores de interés. Si durante58el estudio 6
se hacen N pruebas, éstas se deben realizar al azar, de forma que los posibles efectos ambientales y
temporales se vayan repartiendo equitativamente entre los tratamientos.
Para este caso, la variable de respuesta es la resistencia característica del hormigón a compresión (MPa),
la unidad experimental es la probeta de hormigón y el factor es la dosificación de hormigón. En este caso se
El número de repeticiones a
trata de un diseño realizar enhemos
balanceado porque cada tratamiento
realizado eldepende de la variabilidad
mismo número que se
de repeticiones (5)espera observar
para cada uno
en los datos, a la diferencia mínima
de los tratamientos (dosificaciones). que el experimentador considera que es importante detectar y al nivel de
confianza que se desea tener en las conclusiones. Normalmente se recomiendan entre 10 y 30 mediciones en
cada tratamiento. Con 10 mediciones se podrían detectar diferencias de medias mayores o iguales a 1,5
sigmas con una probabilidad alta, y con 30 mediciones se podrían detectar diferencias mayores o iguales a
0,7 sigmas.
Normalidad
Varianza constante (igual varianza en los tratamientos)
Indepedencia
Para los que queráis saber qué ha pasado con nuestro experimento con las amasadas, os diré que que el
ANOVA dió como resultado el rechazo de la igualdad de medias, es decir, que la resistencia media se ve
afectada por la dosificación. Sin embargo, las cuatro dosificaciones no son igual de efectivas, pues existen
diferencias significativas entre las resistencias medias de cada una de ellas. De hecho, las dosificaciones A y
B no presentan diferencias significativas entre sí, tampoco entre la C y la D, sin embargo, entre ambos grupos
sí que hay diferencias significativas. Asimismo, se ha podido comprobar que se cumplieron los supuestos de
normalidad, varianza constante e independencia.
Os dejo en el siguiente vídeo cómo se puede utilizar el software SPSS para realizar un diseño de
experimentos completamente al azar.
Referencias:
Box, G.E.; Hunter, J.S.; Hunter, W.G. (2008). Estadística para investigadores. Diseño, innovación y
descubrimiento. Segunda Edición, Ed. Reverté, Barcelona.
Gutiérrez, H.; de la Vara, R. (2003). Análisis y diseño de experimentos. McGraw-Hill, México.
Vicente, M.L.; Girón, P.; Nieto, C.; Pérez, T. (2005). Diseño de experimentos. Soluciones con SAS y SPSS.
Pearson Educación, Madrid.
Índice
1Historia y terminología
2Representación a través de un arreglo ortogonal
3Clases equivalentes de cuadrados latinos
4El número de cuadrados latinos
5Aplicaciones
6Cuadrados latinos y rompecabezas matemáticos
7Véase también
8Referencias
9Enlaces externos
Historia y terminología[editar]
El nombre cuadrado latino se origina con Leonhard Euler, quien utilizó caracteres latinos como
símbolos.
Un cuadrado latino se dice que está reducido (o "normalizado" o "de forma estandarizada") si
la primera fila y la primera columna están en orden natural. Por ejemplo, el primer cuadrado
está reducido, porque la primera fila y la primera columna son 1, 2, 3.
Es posible hacer un cuadrado latino permutando (reordenando) las filas y las columnas.
1 1 1
2 1 2
3 1 12
4 4 576
5 56 161280
6 9408 812851200
7 16942080 61479419904000
8 535281401856 108776032459082956800
9 377597570964258816 5524751496156892842531225600
1
7580721483160132811489280 9982437658213039871725064756920320000
0
1 53639377732773712981196735407 77696683617177014410744434673423068231106
1 71840 5600000
Para cada n, cada clase isotópica (secuencia A040082 en OEIS) contiene hasta
(n!)3 cuadrados latinos (el número exacto varia), y cada clase principal
(secuencia A003090 en OEIS) contiene alguna de las 1, 2, 3 o 6 clases isotópicas.
1 1 1
2 1 1
3 1 1
4 2 2
5 2 2
6 12 22
7 147 564
8 283657 1676267
9 19270853541 115618721533
10 34817397894749939 208904371354363006
Aplicaciones[editar]
El estadístico inglés Ronald Fisher se valió del uso de los cuadrados latinos para mejorar
significativamente los métodos agrícolas, cuando se hallaba investigando la eficacia de los
fertilizantes en el rendimiento de las cosechas. Buscó la manera de plantar cosechas en
similares condiciones de suelo de modo que la calidad de la tierra no fuese un factor
indeseable que influyese en el rendimiento de la cosecha. Si bien la única manera de
asegurarse de tener condiciones idénticas de tierra era utilizar siempre el mismo suelo, en la
práctica esto es casi imposible, pues se deberían desenterrar y volver a plantar las cosechas
varias veces.1
Por otra parte, aunque sí se pudiera hacer esto último, las condiciones meteorológicas serían
otro factor indeseable. Para evitar esto, por ejemplo en un caso en que se tuviese un campo
cuadrado dividido en 16 parcelas, se puede concebir un cuadrado latino en que la descripción
del campo sea tal que la calidad del suelo varíe «vertical» y «horizontalmente». Entonces se
aplican al azar los 4 fertilizantes («a», «b», «c», y «d») con la única condición de que cada
fertilizante aparece una sola vez en cada fila y en cada columna. De esta manera se busca
eliminar la variación de la calidad de tierra. Si hubiese otro factor que pudiese influir en el
rendimiento, por ejemplo, el momento del día (A, B, C, D) en que se aplica el tratamiento,
entonces puede utilizarse un cuadrado latino ortogonal al anterior donde se identifiquen dichos
momentos del día. De esta manera cada pareja momento-fertilizante se aplicará en una única
parcela.1
Así, un plan podría ser:1
plan, MOMENTO
a, A b, B c, C d, D
b, C a, D d, A c, B
c, D d, C a, B b, A
d, B c, A b, D a, C
Véase también[editar]
cuadrado greco-latino
cuadrado mágico
sudoku
Referencias[editar]
1. ↑ Saltar a:a b c Tony Crilly (2011). 50 cosas que hay que saber sobre matemáticas. Ed.
Ariel. ISBN 978-987-1496-09-9.
Enlaces externos[editar]
Bogomolny, Alexander. «Latin Squares (An Interactive Gizmo)». Interactive Mathematics
Miscellany and Puzzles (en inglés).
Bogomolny, Alexander. «Infinite Latin Square: an Interactive Gizmo». Interactive
Mathematics Miscellany and Puzzles (en inglés).
Magic Square in Latin Square (en inglés)
Diseño factorial
Ir a la navegaciónIr a la búsqueda
Este artículo o sección sobre matemáticas necesita ser wikificado, por
favor, edítalo para que cumpla con las convenciones de estilo.
Este aviso fue puesto el 25 de diciembre de 2008.
Índice
1Historia
2Notación
3Ejemplo real
4Análisis de Yates
5Prueba F de Fisher
6Referencias
7Véase también
Historia[editar]
Los diseños factoriales fueron utilizados en el siglo XIX por Jhon Bennet Lawes y
Henry J. Gilbert de la Estación experimental de Rothamsted.
Ronald Fisher discutió en 1926 que los diseños «complejos», tales como los
diseños factoriales, eran más eficientes que estudiar un factor a la vez. Fisher
escribió: «ningún aforismo se repite tan frecuentemente respecto de las pruebas
de campo, que aquel de que a la Naturaleza debemos hacerle pocas preguntas, o,
idealmente, hacérselas de a una. Quien escribe está convencido de que este
punto de vista está totalmente equivocado».
Un diseño factorial permite que el efecto de varios factores e incluso las
interacciones entre ellos sean determinados con el mismo número de ensayos que
son necesarios para determinar cualquiera de los efectos por sí solo con el mismo
grado de exactitud.
Frank Yates realizó importantes contribuciones, particularmente en el análisis de
diseños, mediante el análisis de Yates.
Es posible que el término "factorial" no haya sido utilizado en forma impresa hasta
1935, cuando Fisher la utilizó en su libro El diseño de experimentos.
Notación[editar]
Ejemplo real[editar]
El experimento factorial más simple contiene dos niveles para cada uno de dos
factores. Suponga que un ingeniero desea estudiar la energía total usada por cada
uno de dos diferentes motores, A y B, funcionando cada uno en alguna de las
siguientes dos velocidades: 2000 o 3000 RPM. El experimento factorial consistiría
en cuatro elementos experimentales: motor A a 2000 RPM, motor B a 2000 RPM,
motor A a 3000 RPM, y motor B a 3000 RPM. Cada combinación de un solo nivel
seleccionado con cada factor está presente una vez.
Este experimento es un ejemplo de un experimento factorial de 2^2 (o 2x2),
nombrado así porque considera dos niveles (la base) para cada uno de dos
factores (la potencia o exponente), o #niveles #factores, produciendo 22=4 puntos
factoriales.
Los diseños pueden implicar muchas variables independientes. Como otro
ejemplo, los efectos de tres variables entradas se pueden evaluar en ocho
condiciones experimentales ilustradas como las esquinas de un cubo. Esto se
puede conducir con o sin repetición, dependiendo de su propósito previsto y
recursos disponibles. Proporcionará los efectos de las tres variables
independientes en la variable dependiente y las interacciones posibles (en caso de
haber más de 3 se habla de un hiperespacio).
Análisis de Yates[editar]
La técnica fundamental consiste en repartir el total en componentes
mediante sumas de cuadrados. Esta técnica tuvo efectos secundarios en el
modelo. Por ejemplo, demostramos el modelo para un ANOVA simplificado con un
tipo de tratamiento en diversos niveles.
Los grados de libertad se pueden repartir de manera similar y
especifican distribuciones chi-cuadrado que describen las sumas asociadas de
cuadrados.
Prueba F de Fisher[editar]
Se utiliza para las comparaciones de los componentes de la desviación total. Por
ejemplo, en una forma, o el solo-factor ANOVA, la significación estadística es
probada para comparando la estadística de la prueba de F
donde:
1. Número de tratamientos: , I
2. Total de casos: , nT'
a distribución F con el del I-1, secundario< del > n< T> /sub grados de
libertad. Usar la F-distribución es un candidato natural porque
la estadística de la prueba es el cociente de dos sumas malas de los
cuadrados que tienen a distribución .
Referencias[editar]
1.-Frank Yates and Kenneth Mather (1963). "Ronald Aylmer Fisher".
Biographical Memoirs of Fellows of the Royal Society of London 9: 91–
120. http://digital.library.adelaide.edu.au/coll/special//fisher/fisherbiog.pdf.
2.-Ronald Fisher (1926). "The Arrangement of Field Experiments". Journal
of the Ministry of Agriculture of Great Britain 33: 503–
513. https://web.archive.org/web/20110928044736/http://digital.library.adela
ide.edu.au/coll/special//fisher/48.pdf.
factores.
Diseño de dos factores
Usted puede ejecutar el diseño factorial completo o una fracción del diseño factorial.
NOTA
Cuando usted tiene un diseño factorial con puntos centrales, puede probar si existe
curvatura en la superficie de respuesta. Sin embargo, no puede modelar el efecto de
esa curvatura en ningún lugar, excepto en el punto central. En otras palabras, solo
puede calcular los valores ajustados en los puntos de vértice y el punto central del
diseño, por lo que no puede crear una gráfica de contorno. Debe tener términos
cuadráticos (por ejemplo, términos al cuadrado) en el modelo a fin de modelar la
curvatura en toda la superficie de respuesta. Esto es posible con un diseño de
superficie de respuesta. Usted puede ampliar el diseño factorial con puntos axiales
para crear un diseño de superficie de respuesta central compuesto a partir de un
diseño factorial.
Comparación
Los siguientes diagramas muestran un diseño factorial completo en comparación con
un diseño factorial fraccionado de ½.
Orden estándar
Fracción (Yates) Generador de diseño
1 – – – + – –
2 + – – – + –
3 – + – – – +
4 + + – + + +
5 – – + + + +
6 + – + – – +
7 – + + – + –
8 + + + + – –
1. D = –AB E = –AC
2. D = AB E = –AC
3. D = –AB E = AC
4. D = AB E = AC
Por ejemplo, supongamos que usted no pudo realizar el diseño con los cinco factores
establecidos en su nivel alto. La fracción principal contiene este punto, pero la tercera
fracción no.
Diseño de medidas repetidas El diseño de medidas repetidas es una extensión del diseño de
bloques, en que el sujeto sustituye al bloque y actúa de control propio. Con este formato, los
sujetos de la muestra reciben todos los tratamientos y repiten medidas o registros de respuesta;
asimismo, la comparación de los tratamientos es intra-sujeto. ..//..
Esto es así porque, al actuar el sujeto de bloque, la variabilidad debida a las diferencias
individuales es eliminada del error. De este modo, el diseño de medidas repetidas constituye
una estructura más potente que los diseños completamente aleatorizados.
Efectos de orden Los efectos de orden (order effects) se derivan de la propia estructura del
diseño de medidas repetidas, y deben ser neutralizados para que no confundan los efectos de
los tratamientos.
Tipos de efectos de orden A) Efecto de período (period effect) B) Efecto residual (carry-over
effect)
Efecto de período Los efectos de período ocurren cuando, independientemente del tratamiento
aplicado, el sujeto responde al período o posición que, en la secuencia, ocupa el tratamiento
(período de administración). Cabe, por lo tanto, la posibilidad de que el sujeto responda mejor
al período que al tratamiento en sí mismo. Cuando esto ocurre, el efecto de período confunde la
acción del tratamiento.
Efecto residual El efecto residual, conocido por error progresivo, se caracteriza por la
persistencia de la acción de un tratamiento más allá del período o tiempo de aplicación.
Representa la progresiva acumulación tanto de los efectos facilitadores de la respuesta (efecto
de la práctica, aprendizaje, etc.) como de los efectos obstaculizadores (como la fatiga mental,
cansancio físico, etc.) ..//..
Cuando, como es frecuente en esos casos, se produce una persistencia del efecto del
tratamiento anterior sobre el tratamiento siguiente, se corre el riesgo de que los efectos queden
contaminados.
Clasificación del diseño en función de los factores Simple (SxA) Diseños de medidas repetidas
Factorial (SxAxB, SxAxBxC, etc.)
La principal ventaja del diseño, dada su especial disposición, es la posibilidad de extraer del
error una de sus fuentes de variación más importante: la variación atribuida a las diferencias
individuales.
Supóngase, por ejemplo, que la variable sujetos, simbolizada por S, actúa a n valores, y que el
factor A -variable de tratamiento-, a a valores que son aplicados, de forma secuencial, a los
sujetos de la muestra. Nótese la similitud entre este diseño y el diseño bifactorial dado que,
analíticamente, la variable de sujetos actúa como si fuera un factor. La diferencia estriba sólo
en la naturaleza y objetivo de las dos variables. ..//..
La variable S representa la variabilidad entre sujetos y no es, por lo tanto, un factor manipulado
sino de control. La variable A es una dimensión de variación manipulada por el investigador. El
propósito del experimento sigue siendo el análisis del posible impacto de la variable de
tratamiento sobre la variable de respuesta. ..//..
Con este formato, no sólo se controlan las diferencias individuales, por el pseudo-factor de
sujetos, sino que se minimiza la variancia del error al sustraer una de sus principales
fuentes. ..//..
Así, el diseño de medidas repetidas simple es el procedimiento más eficaz para probar el efecto
del tratamiento. Al controlar las diferencias interindividuales, este diseño es un potente
procedimiento de análisis porque al reducir el error se aumenta la precisión y efectividad en
probar los efectos de la variable de tratamiento.
Formato del diseño de medidas repetidas simple, S x A (Gp:) Y.. (Gp:) Tratamientos (Gp:) A1
(Gp:) A2 (Gp:) A3 (Gp:) Aj (Gp:) … (Gp:) S1 (Gp:) S2 (Gp:) Sn (Gp:) . . . (Gp:) Y11 Y12 Y13 … Y1j
Y21 Y22 Y23 … Y2j ……………………………………………………………………………………………… Yn1 Yn2
Yn3 … Ynj (Gp:) Medias (Gp:) Sujetos (Gp:) Medias (Gp:) Y1. (Gp:) Y2. (Gp:) . . . (Gp:) Yn.
(Gp:) Y.1 (Gp:) Y.2 (Gp:) … (Gp:) Y.3 (Gp:) Y.j
Modelo de prueba de hipótesis Paso 1. Se asume, por hipótesis de nulidad, que los efectos de los
tratamientos son nulos. Es decir, H0: µ1 = µ2 = µ3
Paso 2. Según la hipótesis experimental o hipótesis de efectividad se asume que, uno o más
tratamientos o efectos es significativo (distinto de cero). En términos estadísticos se afirma
que: H1: µ1 ? µ2, o µ1 ? µ3, o µ2 ? µ3 H1: por lo menos una desigualdad
Modelo estructural
Modelo aditivo
Asimismo, para que el modelo sea válido, se asume que: a) ?i ? NID(0,s?²) b) eij ? NID(0,se²)
c) S = s?²11' + se²I
Cuadro resumen del ANOVA: Diseño de medidas repetidas (Gp:) F0.95(2/4) = 6.94 (Gp:) an-
1=8 (Gp:) 16.16 (Gp:) Total (T) (Gp:) >0.05 >0.05 (Gp:) 2.11 5.86 (Gp:) 1.71 4.75 0.81 (Gp:) (n-
1)=2 (a-1)=2 (n-1)(a-1)=4 (Gp:) 3.42 9.49 3.25 (Gp:) Suj (S) Trat (A) SujxTrat (SxA) (Gp:) p
(Gp:) F (Gp:) CM (Gp:) g.l (Gp:) SC (Gp:) F.V.
Modelo de prueba de hipótesis Paso 5. Dado que el valor empírico de F es menor que el teórico,
se acepta la hipótesis de nulidad relativa a la variable de sujetos y a la de tratamiento, a un nivel
del riesgo del cinco por ciento.
Supuesto de uniformidad o simetría compuesta Según esta restricción, conocida por condición
de uniformidad o simetría compuesta, se asume una variancia común para las distintas
medidas repetidas y una covariancia común para los diferentes pares de medidas (prueba de
Box, 1950)
Decisión estadística Se calcula el valor del estadístico B con distribución aproximada a chi-
cuadrado y con [a² + a - 4]/2 grados de libertad: B = (1 - C)M = (1 - 075)(15.2) = 3.8 y [3² + 3 -
4]/2 = 4 g.l. ..//..
El valor teórico de chi-cuadrado es ?0.95 (4) = 9.49 Puesto que este valor es mayor que el valor
empírico calculado, 3.8 < 9.49, se infiere la aceptación de la hipótesis de nulidad y, por tanto,
que la matriz de variancia y covariancia muestral se ajusta al patrón específico asumido en la
población.
Supuesto de esfericidad Huynh y Feldt (1970) y Rouanet y Lepine (1970) han mostrado que es
suficiente el cumplimento de una condición más débil o condición de esfericidad (circularidad).
Esta condición sólo requiere que las variancias de las diferencias entre todos los pares de
medidas repetidas sean iguales (prueba de esfericidad de Mauchley, 1940)
Alternativas de análisis del diseño de medidas repetidas Sub F normal ANOVA F conservadora
F ajustada Diseño de medidas repetidas MANOVA
Fórmulas para el cálculo de los grados de libertad de las F 's
Factores de ajuste Epsilón de: Greenhouse y Geisser (1959) Huynh y Feldt (1970)
Valores teóricos de las F 's de las distintas pruebas, a un nivel de significación de 0.05 Tipo de
Grados de libertad Valor teórico de prueba Numerador Denominador F para a = 0.05 Normal 2
4 6.94 Ajustada 1 3 10.13 Conservadora 1 2 18.51
Estadísticos descriptivos
Prueba de esfericidad