Está en la página 1de 10

Reimpreso con permiso de la oficina de papelería de su majestad.

ARREGLO de experimentos de
campo autor! s Nota (17 CMS. 502a) * de aproximadamente 1923, el Departamento de estadística
en Rothamsted había sido referido mucho con la precisión de los experimentos de campo en la
agricultura y con modificaciones en su diseño, teniendo la doble objetivo de aumentar la precisión
y de proveer una estimación válida de error. Estos dos hacl clesiderata sido algo confuso en la
mente de los experimentadores y en el presente trabajo fue el primer intento del autor ajuste Oilt
los principios racionales que él podría proceder. El papel es un precursor para el libro sobre el
diseño de los experimentos publicados nueve años más tarde.
503-513, ( 1 926) . 83
EL arreglo de la estación Experimental de Rothamsted de R. A. FISHER, SC.d, de
experimentos de campo. La presente Posiåon. — la situación actual del arte de la
experimentación de campo es uno de muy especial interés. Por más de quince años
se ha convertido la atención de los agricultores a los errores de experimentos de
campo. Durante este período, han demostrado experimentos del tipo ensayo de
uniformidad de la magnitud y la ubicuidad de esa clase de error que no puede
atribuirse a descuido en la tierra de medición o pesaje de los productos, y que es
por lo tanto descrito como debido a" heterogeneidad del suelo "; mucho ingenio se
ha expendido en la elaboración de planes para la disposición adecuada de las
parcelas; y no sin resultado, porque puede haber pocas dudas de que el estándar de
precisión ha sido materialmente, aunque muy irregular. Lo que hace interesante a
la situación actual es que ahora es posible demostrar (a) que la real posición del
problema es mucho más intrincado que...El concepto que ha permitido desarrollar
una técnica nueva y crítica de arreglo en parcelas es que una estimación de los
errores de campo derivado de cualquier experimento particular puede o no ser
una estimación válida, y en campo real práctica generalmente no es válido
estimación de los errores reales que afectan a la medias o diferencias de las
medias de los cuales es necesario estimar el error.

Cuando es un resultado significativo P — ¿Qué se entiende por una estimación


válida de error? La respuesta debe buscarse en el uso que una estimación del error
debe ser puesto. Imaginemos en el contorno más amplio el proceso por el cual se
lleva a cabo un ensayo de campo, tales como las pruebas de material de valor
manurial real o supuesta. A en el acre de tierra se aplica el estiércol; acre segunda
o, sembrado con semilla similar y tratado en todas las otras formas como la
primera, recibe ninguno del estiércol. Cuando el producto se pesa, se encuentra que
el acre que recibe el estiércol ha producido una cosecha más grande hecho por,
digamos, 10 por ciento. El estiércol ha anotado un éxito, pero la confianza con que
se debe recibir un resultado por la compra pública depende totalmente la manera en
que el experimento se llevó a cabo.

Es la primera crítica a contestar: — "¿qué razón existe para pensar que, incluso si
no hay estiércol había sido aplicado, el acre que lo recibió realmente no todavía
han dado el mayor rendimiento? "El experimentador temprano habría tenido que
responder simplemente que había escogido la tierra bastante, que no tenía ninguna
razón para esperar que un acre a ser mejor que el otro y (posiblemente) él había
pesado el producto de estas dos hectáreas en años anteriores y nunca había
conocido a variar en un 10 por ciento. El último argumento solo lleva cualquier
peso. Ilustrará el significado de las pruebas de significación si tenemos en cuenta
de cuántos años el producto debe se han registrado para hacer las pruebas
convincentes.

En primer lugar, si el experimentador podría decir que en veinte años de


experiencia con un tratamiento uniforme la diferencia a favor de los acres
tratados con estiércol tenido nunca antes tocado 10 por ciento. , la evidencia
habría llegado a un punto llamado punto de importancia; es conveniente dibujar
la línea en el nivel en el cual podemos decir: "Hay algo en el tratamiento, o
casualidad ha producido tal como no ocurre más de una vez en ensayos twentv."
Este nivel, que podríamos llamar el 5 por ciento. punto, estaría indicada, aunque
muy áspero, por la mayor desviación de oportunidad observada en veinte ensayos
sucesivos. Para localizar el 5 por ciento. punto con exactitud que debemos
tenemos sobre experiencia de 500 años, para entonces, podríamos suponer que
no cambios progresivos en la fertilidad estaban en progreso, contar las
desviaciones mayores de veinticinco y trazar la línea entre el vigésimo quinto y el
vigésimo sexto desviación más grande. Si la diferencia entre las dos hectáreas...

Si uno en veinte no parece suficientemente altas probabilidades, podemos, si


preferimos, trazamos la línea en uno de los cincuenta (los 2 por punto de siglo), o
uno en cien (1 por punto de siglo). Personalmente, el escritor prefiere un bajo
nivel de significación del 5 por ciento. punto e ignoran completamente todos los
resultados que no alcanzan este nivel. Debe considerarse un hecho científico
establecido como experimental sólo si un experimento bien diseñado raramente
falla a este nivel de significancia. La probabilidad muy alta a veces reclamada por
los resultados experimentales generalmente debe ser descontada, por imprecisos
métodos de estimación de error 505.
tienen más influencia que tiene el estándar particular elegido de importancia.

Puesto que el experimentador temprano sin duda podría no haber producido


un registro de los rendimientos de 500 años, falla la prueba directa de
importancia; sin embargo si tuviera diez anterior uniforme de registros años que
todavía podría hacer hacia fuera un caso, si podría afirmar que bajo tratamiento, la
diferencia nunca había venido cerca de 10 por ciento. Su argumento ahora es
mucho menos directa; quiere convencernos de tal error como.10 por ciento. por
casualidad ocurren en menos del 5 por ciento. de un juicio justo, y él sólo puede
apelar a diez ensayos. Por otra parte, durante los diez años conoce el valor real del
error. De estos puede calcular un error estándar, o más bien una estimación del
error estándar, para que el experimento está sujeto; y, si la diferencia observada
es muchas veces mayor que este error de estándar, él afirma que es significativo. A
¿cuántas veces mayor trace las líneas? Este factor depende de la cantidad de
experiencia que se basa el error estándar. If en diez valores...

Si así ponemos nuestra confianza en la teoría de errores, todo el cálculo


necesario es encontrar el error estándar. En el caso simple elegido anteriormente (en el
que, por simplicidad, se asume que cada uno de los dos acres la otra golpea igualmente
a menudo) todo lo que es necesario es multiplicar cada uno de los diez errores por sí
mismo, formando así su plaza, para encontrar el promedio de las diez plazas y a fi ND la
raíz cuadrada de la media. La media de las diez plazas se llama la varianza y su raíz
cuadrada se llama el error estándar. El procedimiento descrito arriba, confiando en la
teoría de errores, implica algunos supuestos sobre la naturaleza de los errores de
campo; pero estos supuestos de hecho no se disputan y han sido ampliamente
verificados en el examen de los resultados de los ensayos de uniformidad.

Medición de la exactitud de la replicación. — lt sería sumamente incómodo si cada ensayo


tuvo que ser precedida por una sucesión de diez ensayos de uniformidad; por lo tanto, puesto
que el único propósito de estos ensayos debe proporcionar una estimación del error estándar,
los medios han sido concebidos para obtener dicha estimación de los rendimientos reales del
prueba año.506

El método adoptado es el de la replicación. Si habíamos desafiado, como antes, el


resultado de un experimento realizado, digamos, hace diez años, si no
probablemente han referido a la experiencia de años anteriores, pero que debe
haber aprendido que cada prueba acre fue dividido en, digamos, cuatro cuartos
separados; y que las dos hectáreas estaban sistemáticamente entrelazadas en
ocho tiras ABBAABBA, donde A es la parte de abonado y B el unmanured.*

Además de dar una estimación del error de tal mezcla de parcelas


experimentales es de valor en disminuir el error real que representa la diferencia
de fertilidad real entre las dos hectáreas. Es obvio que tales diferencias en
fertilidad generalmente será mayores en bloques enteros de tierra ampliamente
separados, que en estrechas tiras adyacentes. Esta importante ventaja de reducir
el error de estándar del experimento ha sido confundida a menudo con la finalidad
de la replicación en proporcionar una estimación del error; y, en esta confusión,
tipos de arreglo sistemático se han introducido y ampliamente empleado que
proporcionan en conjunto falsas estimaciones de error, porque las condiciones,
sobre el cual un experimento replicado brinda una estimación válida de error, no
han sido adherido a.

Errores erróneamente estimada. — el error de que se requiere una estimación es


que en la diferencia de rendimiento entre la zona marcada y la zona marcada B, es
decir, es un error en la diferencia entre las parcelas tratadas de manera diferente
en relación con el abono de prueba. La estimación del error por el ensayo
replicado depende de las diferencias entre parcelas tratadas por igual. Una
estimación del error derivada tan sólo será válida para su propósito si nos
aseguramos de, en el arreglo en parcelas, pares de parcelas tratadas por igual no
están más cercanas juntas o más separadas que, o en cualquier otro medio
pertinente, distinguir pares de parcelas tratadas diferentemente. Ahora en casi
todos los arreglos sistemáticos de parcelas replicadas cuidado de poner la a
diferencia de parcelas tan juntos como sea posible y las parcelas como en
consecuencia tan alejadas como sea posible, introduciendo así una flagrante
violación de las condiciones en que un estimación es posible.

Es una manera de asegurarse de que se obtendrá una estimación válida de error


para arreglar las parcelas deliberadamente al azar * este principio fue empleado
en un experimento sobre la influencia del clima sobre la efectividad de fosfatos y
nitrógeno se alude por Sir John Russell (3). el autor debe declinar toda
responsabilidad por el diseño de este experimento. que es, sin embargo: un buen
ejemplo de su clase. 507 para que ninguna distinción puede arrastrarse entre
pares de parcelas tratadas por igual y un trato diferente; en este caso una
estimación del error, derivado de la forma habitual de las variaciones de los
conjuntos de parcelas tratada por igual, puede ser aplicado para probar la
significación de la diferencia observada entre las medias de parcelas tratadas
diferentemente.

La estimación del error es válida, porque si imaginamos un gran número de


diferentes resultados obtenidos por diferentes arreglos al azar, la relación de lo
real al error estimado, calculado desde cero para cada uno de estos arreglos, se
distribuirán en realidad en el distribución teórica por la que se prueba la
importancia del resultado. Mientras que si un grupo de acuerdos se elige tales que
los errores reales en este grupo son en general menos que los correspondientes a
los arreglos al azar, ahora se ha demostrado que los errores. Estimados, en un
grupo, será mayor que es generalmente en arreglos al azar, y que, en
consecuencia, dentro de un grupo, la prueba de significación adolece. Es
particularmente debe ser observado que los métodos del acuerdo, en que los
experimentadores han dirigido conscientemente, y que reducen los errores reales,
aparecerán de sus errores estándar (falso) estimadas que no más pero menos
precisa que si un arreglo al azar había sido aplicada; w...

Una distinción necesaria. — la pregunta importante se le pedirá en este punto en


cuanto a si es necesario, con el fin de obtener una estimación válida de error, darle
todas las ventajas en la precisión a obtener del cultivo de parcelas, que se desea
comparar , tan cerca junto como sea posible. La respuesta es que no es necesario
renunciar a tal ventaja. Dos cosas son necesarias, sin embargo: (a) que debe
establecerse una distinción aguda entre los componentes de error que deben ser
eliminados en el campo y los que no deben eliminarse; y que mientras que la
eliminación de una clase debe ser completa, no se deberá hacer ningún intento para
eliminar a la otra; (b) que el proceso estadístico de la estimación del error se
modificará para tener en cuenta de 508 el arreglo del campo, y para que igualmente
se eliminarán los componentes de error realmente eliminado en el campo en el
laboratorio de estadístico.

Conciliación así los dos deseos de reducción de error y de la estimación válida de


error, debe hacerse hincapié que ningún principio es en el grado más pequeño en
peligro. Un experimento o bien admite una estimación válida de error, o no lo hace;
Si lo hace, o no, no depende la disposición real de las parcelas, sino solamente en la
manera en que ese acuerdo se llegó. Si el arreglo ABBAABBA llegó a escribiendo
una sucesión de sándwiches "ABBA, que no admita cualquier estimación de cierta
validez, aunque" estudiante "(2)
ha mostrado razones para pensar que al tratar a cada "sándwich" como una unidad,
las incertidumbres de la situación se reducen mucho. Si, sin embargo, la misma
disposición sucedió que se produzcan las condiciones que cada par de tiras
contiene una A y una B, pero que el que vino primero será decidido por el
lanzamiento de una moneda, entonces una estimación válida puede obtenerse de
las cuatro diferencias en rendimiento en th pares e cuatro tiras. No es ahora los
sándwiches"pero los pares de tiras que proporcionan unidades independientes de
información, y estas unidades son el doble del número de los"bocadillos".

Por otra parte, si el experimento se repite, ya sea por la replicación en el mismo


campo, o en diferentes granjas dispersadas sobre el país, el arreglo debe ser
obtenido nuevo por casualidad para cada repetición, por lo que calculable y sólo
una pequeña proporción de los casos será reproducir el arreglo de sandwich.

Así se puede garantizar la validez de estimación por métodos apropiados de


acuerdo, y por otra parte, hay razón para pensar que los experimentos bien
diseñados, rindiendo una estimación válida de error y por lo tanto capaz de pruebas
de significación genuina, dará errores reales tan pequeños como los más
ingeniosos arreglos sistemáticos. Es difícil probar esta afirmación salvo por
experimentar en los datos proporcionados por ensayos de uniformidad, ya que, en
ausencia de cualquier estimación satisfactoria del error, es imposible decir con
certeza cómo exacto o inexacto, tales arreglos sistemáticos en realidad son;

mientras que el agregado de la uniformidad de datos de los ensayos, hasta ahora


disponibles, están apenas adecuados para tal prueba. Lo que puede decirse con
certeza es que experimentos capaces de pruebas genuinas de significación
fácilmente pueden ser diseñados para ser mucho más preciso que cualquier
experimentos normalmente 509.

Un útil método. — la distinción entre errores eliminados en el campo y los


errores que deben ser aleatorios cuidadosamente con el fin de proporcionar una
estimación válida de los errores que no se pueden eliminar, puede hacerse más clara
uno de los tipos más útiles y flexibles de acuerdo, a saber, el arreglo en bloques al
azar del"." Supongamos que cinco variedades son a probar, y que se decide darle a
cada variedad siete parcelas, haciendo treinta y cinco en total. sería un experimento
perfectamente válido para dividir la tierra en partes iguales de treinta y cinco, de
cualquier manera uno satisfecho, y luego asignar siete porciones elegidas totalmente
al azar a cada tratamiento. En tal caso, como se ha señalado anteriormente, ninguna
modificación se introduce en el proceso de estimar el error estándar de los
resultados, para ninguna parte del campo se ha eliminado la heterogeneidad.

En la mayoría de tierra, sin embargo, obtendremos un error estándar más


pequeño y por lo tanto un experimento más valioso, si procedemos de lo
contrario. La tierra se divide primero en siete bloques, que, para el presente
propósito, deben ser tan compactos como sea posible; cada uno de estos bloques
se divide en cinco parcelas, y éstos son asignados en cada caso a las cinco
variedades, de forma independiente y totalmente al azar. Si esto se hace, los
componentes de heterogeneidad del suelo que producen las diferencias en
fertilidad entre las parcelas de la misma manzana se ser completamente al azar,
mientras que los componentes que producen diferencias en fertilidad entre
diferentes bloques eliminado completamente. Para calcular una estimación del
error de tal experimento, debe de tener cuidado para eliminar la variación debido
a las diferencias entre los bloques, y para ello se han desarrollado métodos exactos
(1. pp. 176-232).

La mayoría experimentadores en llevar a cabo una asignación aleatoria de las parcelas será
dado una sacudida eléctrica para encontrar cuánto igualmente que las parcelas se distribuyen;
tres o cuatro parcelas de la misma variedad, por ejemplo, pueden caer juntos en la esquina
donde se unen cuatro cuadras. Este sentimiento tiene alguna medida de la magnitud a que
estimaciones de error son viciadas por sistemáticas arreglos regulares, para, como hemos
visto, si los rechazos del experimentador el arreglo llegamos por casualidad como en
conjunto muy mal,"o de otras maneras"cocineros"del arreglo a sus ideas preconcebidas, lo
hará bien (y probablemente) aumenta el error estándar, según la estimación de los
rendimientos;510

o, si es mala suerte o su juicio, va a aumentar los errores reales mientras reduce su


estimación de ellos. La Latina los fines de ensayos y de los tipos simples de
manurial juicio en el que cada comparación posible es de igual importancia, el
problema de diseñar experimentos de campo económico y eficaz, reduce a dos
principios fundamentales (i) la división de la área experimental en las parcelas tan
pequeñas como sea posible conforme al tipo de maquinaria agrícola usada y las
precauciones adecuadas contra el efecto de borde; (ii) el uso de arreglos que
eliminar una fracción máxima de la heterogeneidad del suelo y sin embargo
proporciona una estimación válida de los errores residuales. De estas
disposiciones, por lejos el más eficiente, según lo juzgado por experimentos sobre
datos del ensayo de uniformidad, es la que el escritor ha llamado la Plaza de la
Latina.

Arreglos sistemáticos en una plaza, en el que el número de filas y de


columnas es igual al número de variedades, como el A B C D E A B C D E A B C
D D E A B c D E A B C B C D C I) E A B E A B C D B C D E A

se han utilizado previamente para ensayos en, por ejemplo, Irlanda y Dinamarca;
pero el término "cuadro latino" no debería aplicarse a tales disposiciones tan
sistemáticas. El problema de la Plaza de la Latina, de que el nombre fue pedido
prestado, como formula de Euler, consiste en la enumeración de cada arreglo
posible, sujeto a las condiciones que cada fila y cada columna contendrá una
parcela de cada variedad. En consecuencia, el término cuadro latino sólo se debe
aplicar a un proceso de aleatorización por que uno es seleccionado al azar sobre el
total del latín plazas posible o, al menos, para especificar los requisitos agrícolos
más estrictamente, hacia fuera de un número de Latina Plazas en su conjunto, de
los cuales cada par de parcelas, no en la misma fila o columna, pertenece
igualmente con frecuencia para el mismo tratamiento.

La técnica de laboratorio real para obtener un cuadrado Latino de este tipo al


azar, no será de interés muy general, ya que se diferencia en los cuadrados de 5 X
5 y 6 X 6, siendo con mucho los tamaños más útiles. Se puede obtener muy
rápidamente, y el laboratorio de estadística en Rothamsted está dispuesto a
suministrar estos u otros tipos de arreglos al azar, con la intención de
experimentadores; Este procedimiento se considera la 511

más deseable ya que es muy probable que nuevos principios serán, en sus inicios,
ser, de algún detalle, mal entendidas y mal aplicada una consecuencia para que su
creador, que se ha hecho

responsable para explicar, no puede ser considerado totalmente libre de culpa.


Experimentación complejo. — sólo una minoría de campo experimentos mineral de tipo
simple, caracterizado por ensayos, en el que todas las comparaciones posibles son de igual
importancia. En la mayoría de los experimentos que implican tratamiento abono o cultural,
las comparaciones con factores individuales, por ejemplo, con o sin fosfato, son de mucho
mayor interés y de importancia práctica que las comparaciones posibles mucho más
numerosos que implican varios factores. Esta circunstancia, a través de un proceso de
razonamiento, que puede ilustrarse mejor con un ejemplo práctico, lleva a la consecuencia
notable que experimentos grandes y complejos tienen una emciency mucho mayor que los
simples.
Ningún aforismo es moro repite con frecuencia en conexión con ensayos de campo, de
que debemos pedir naturaleza pocas preguntas, o, idealmente, una pregunta, a la vez. El
escritor está convencido de que este punto de vista es totalmente erróneo. Naturaleza, sugiere,
mejor responden a una lógica y pensamiento cuestionario; de hecho, si le pedimos una sola
pregunta, ella a menudo se negará a contestar hasta que algún otro tema ha sido discutido.

Un buen ejemplo de experimento complejo o con invierno avena lleva a cabo


por el Sr. Eden en Rothamsted este año y se muestra en el diagrama.

Abono nitrogenado en forma de sulfato (S) o (M) muriato de amoniaco, se aplica como
apósito más temprano o tarde en la estación, en las cantidades representado por 0, 1, 2.
Cuando no se aplica abono, por supuesto, no podemos distinguir entre sulfato y cloruro, o
entre aplicaciones tempranas y tardías; sin embargo,

desde la comparación general 0 versus mi dosis es una de las comparaciones importantes


a realizar, el número de parcelas no recibiendo ningún abono nitrogenado (que
corresponde áspero a las parcelas de supuesto "control" de los mayores experimentos) se
hace para ser iguales en número a los parcelas recibieron una o dos dosis. Esto hace
tratamientos de doce, y estos se replican en el bosquejo anterior en ocho bloques al azar.

Tenga en cuenta lo que una oportunidad de "mala" distribución a menudo los


suministros; las parcelas de cloruro están todos agrupadas juntos en el primer bloque,
mientras que forman una banda sólida en todo el bloque de arriba a la derecha; en el
bloque de abajo a la derecha, también todas las parcelas tempranas son por un lado y
todas las parcelas finales en el otro.

512

EARLY
LATE LATE EARLY
EARLY 1M 2M 2M
1M
LATE LATE EARLY LATE LATE
EARLY EARLY
LATE EARLY LATE EARLY
2M
EARLY EARLY LATE EARLY LATE LATE
LATE EARLY EARLY LATE
2M 2M 1M LATE
EARLY EARLY
LATE LATE EARLY
2M 2M
EARLY LATE EARLY EARLY LATE EARLY EARLY
1M 2M 1M
LATE EARLY LATE LATE

LATE EARLY LATE EARLY LATE


2M 1M 2M
EARLY EARLY LATE LATE EARLY LATE
1M 1M 2M
LATE LATE EARLY EARLY LATE
2M
EARLY EARLY EARLY LATE LATE
FIG. 1.—A COMPLEX EXPERIMENT WITH WINTER OATS.

El valor de tales experimentos grandes y complejos es que todas las


comparaciones necesarias se pueden hacer con conocidos y, probablemente, de
alta precisión; cualquier diferencia general entre el sulfato y cloruro, entre
aplicaciones tempranas y tardías, o atribuibles a la cantidad de abono nitrogenado,
puede basarse en comparaciones de treinta y dos, cada una de ellas es afectada sólo
por tal heterogeneidad del suelo que existe entre las parcelas en el mismo bloque.

Para hacer estos tres conjuntos de comparaciones, con la misma precisión, por
métodos de pregunta única, requeriría 224 parcelas, contra nuestro 96; pero
además muchas otras comparaciones también pueden ser con igual precisión, el
modo para todas las combinaciones de los factores afectados han sido exploradas.
Más importante de todos, las conclusiones de las comparaciones de
singlefactor se dará, por la variación de las condiciones no esenciales, una base
mucho más inductiva que podría obtenerse por métodos de pregunta única, sin
repeticiones extensas de la experimento.

En la instancia anterior no se respetan ninguna posible interacción de los factores; en


otros casos a veces ser ventajoso deliberadamente a sacrificar toda posibilidad de
obtener información sobre algunos puntos, estos se cree con confianza para ser urF
importante y por lo tanto para aumentar la precisión alcanzable en cuestiones de mayor
momento.

También podría gustarte