Está en la página 1de 27

Introducción al Diseño de

Experimentos

Ignacio Méndez Gómez-Humarán


imendez@cimat.mx
5.1 Sir Ronald Aylmer Fisher (1890 – 1962)
Fue un matemático, biólogo evolucionista y genetista británico. Fue descrito por
Anders Hald como:

“Un genio que casi sin ayuda de nadie creó las bases para la ciencia
estadística moderna”

y Richard Dawkins lo describió como:

“el más grande de los sucesores de Darwin”

Por un lado sentó las bases para la aplicación de


métodos estadísticos al diseño de experimentos
científicos

y por el otro desarrolló la teoría de la genética de


poblaciones junto con Sewall G. Wright y J. B. S.
Haldane.
Se graduó por la Universidad de Cambridge en 1912 y en 1919 comenzó a trabajar en la estación
experimental de la Estación Experimental de Rothamsted, en Hertfordshire, Inglaterra.

Desarrolló técnicas para obtener mayor cantidad de información útil a partir de muestras más
pequeñas, describe la importancia del cálculo con datos muestrales, la aleatoriedad y el análisis de
la varianza entre otras técnicas.

Publicó su metodología estadística en “Statistical Methods for Research Workers” (1925).

Posteriormente, introdujo los principios básicos de la aleatorización en su libro “The Design of


Experiments” (1935), en el cual describe una metodología estructurada y organizada que permite
obtener información estadística confiable para establecer la relación entre diversos factores (X) que
afectan a un proceso y el resultado de ese proceso (Y).

Gracias a Fisher, la estadística se convierte en parte fundamental de la metodología científica.


5.2 Introducción
Población objetivo: concepto flexible determinado en función de los intereses de la investigación o
estudio en cuestión. Tendrá ciertas características que dependen de factores constantes (criterios que
definen a la población) y su variabilidad dependerá de factores no constantes (no considerados en la
definición de la población).

Si se denotan por A, B, C, y D las condiciones constantes en la población y por E, F, G, H,....., las no


constantes (estas últimas siempre so infinitas) la población se representara por:
ABCD/EFGH...

Una población más general estará definida por menos criterios constantes, así la población:
ABC/DEFGH...,

tiene mayor grado de generalidad.


La suposición de Fisher fue que las poblaciones en la mayoría de
los casos siguen distribuciones normales, y que la media depende
de condiciones constantes, esto es, si Y es la medición de los
elementos de la población, tenemos:

Yi ~ N ( (ABCD), 2 (EFGH...))

esto es que Y sigue una distribución aproximadamente normal


con parámetros  (media) que depende de las condiciones
constantes A, B, C y D; y con varianza 2, que depende de las
condiciones no constantes y no consideradas.
Fisher postuló además que si se comparan varias poblaciones con un mismo grado de
generalidad, las varianzas serán iguales. Esto se ha comprobado prácticamente
(empíricamente) en muchos tipos de experimentos.

Así las variantes de la característica D en estudio se pueden representar por poblaciones


del tipo:

Yij ~ N ( (ABCDj), 2 (EFGH...))

donde Y representa la medición del el elemento i-ésimo perteneciente a la población j-


ésima.
5.3 El Modelo Lineal de Fisher

Si la población esta descrita por ABCD/EFGH..., el modelo lineal será:

Yi =  (ABCD) + i
donde la característica Y del elemento i-ésimo es igual a la constante  más un error aleatorio i.

El modelo lineal mas general es simplemente Yi =  + i .


Los tres supuestos básicos de todo modelo lineal se representan por:

i ~ N IID (0, 2)


la de los supuestos es:
a) los errores aleatorios siguen una distribución normal con media cero y varianza 2
(Normalidad).
b) Las varianzas son iguales en todas las poblaciones del mismo grado de generalidad en
estudio (Homocedasticidad u homogeneidad de varianzas).
c) Los errores deberán ser independientes entre si y estar idénticamente distribuidos
(Independencia).
Cuando se pretende comparar dos o más poblaciones con el mismo grado de
generalidad, el modelo es

Yij = j (ABCDj) + ij

Donde j es la media de la característica en la población j-ésima. Dado que j = 


+ j, entonces el modelo apropiado es:

Yij =  (ABC) + j (Dj) + ij


El experimento en si, es la elección de variantes de la característica D bajo
estudio, la toma de muestras de las j poblaciones y los cuidados durante la
producción controlada de esas muestras de determinadas poblaciones en estudio.

El análisis estadístico de los resultados, se basa en el modelo teórico que se cree


que es el más adecuado para representar el cambio en las medias de las
poblaciones estadísticas estudiadas (que se generan al variar los niveles de uno o
más factores).
5.4 Propuesta de diseño de experimentos

Ejemplo: Investigación educativa


Se pretende estudiar el efecto del método de enseñanza
en el rendimiento de los alumnos de educación media
superior.
5.4.1 Diseño de un factor
FACTOR METODO DE ENSEÑANZA

Nivel I Nivel II Nivel III

Enseñanza Uso de métodos Enseñanza


Tradicional audiovisuales abierta

Efecto de tres métodos de enseñanza en educación


Media Superior.
Hipótesis de investigación: El factor A tiene una influencia importante sobre la
medición de interés y (respuesta), que se observa en los elementos que se estudian.

Factor A
Factor A con
3 Niveles

A1 A2 A3
Se asignan aleatoriamente, los elementos o unidades estudiadas a diferentes niveles
del factor en estudio (experimento).
Se toma una muestra aleatoria en cada uno de los grupos definidos por los niveles del
factor en estudio, vigilando que otros posibles factores no tengan una influencia
importante en la respuesta que se estudia. (cuasi-experimento).
De las muestras obtenidas, se establecen las estimaciones
correspondientes y se prueba el modelo teórico propuesto:

yij =  + j + ij
̂ = Media general
estimada
y11 y12 y13
y22 y22 y23 Hipótesis estadística:
. . . Ho: 1 = 2 = 3
. . . ó
yn1 yn2 yn3 Ho: |1| + |2| + |3| =0

ˆ 1  ˆ  ˆ 1 ˆ 2  ˆ  ˆ 2 ˆ 3  ˆ  ˆ 3
Se contrasta el modelo (ANOVA), se estiman los parámetros y se realizan
las comparaciones múltiples o contrastes pertinentes y se realizan
gráficos para evaluar el ajuste y supuestos del modelo.
5.4.2 Diseño de un factor y un bloque

FACTOR METODO DE ENSEÑANZA


Nivel I Nivel II Nivel III
FACTOR DE CONFUSION
Enseñanza Uso de métodos Enseñanza
Nivel socioeconómico
Tradicional audiovisuales abierta

Alto

Medio

Bajo

Efecto de tres métodos de enseñanza en educación Media Superior, el


efecto del factor nivel socioeconómico se considera independiente (Factor
de confusión).
Hipótesis de investigación: El factor A tiene una influencia importante sobre la
medición de interés que se observa en los elementos que se estudian, pero existe un
factor de confusión considerado en el diseño.
Factor de confusión ( en tres bloques homogeneos al interior):
B1 B2 B3

A1 A1 A1
A2 A2 A2 Factor A con
3 Niveles
A3 A3 A3

Se asignan aleatoriamente, los niveles del factor en estudio en cada uno de los
diferentes bloque del factor de confusión (experimento).
Se toma una muestra aleatoria en cada uno de los grupos definidos por los niveles del
factor en estudio, en cada uno de los bloques o grupos posibles del factor de confusión
(cuasi-experimento).
De las muestras obtenidas, se establecen las estimaciones
correspondientes y se prueba el modelo teórico propuesto

yij =  + j + Bi + ij o yhij =  + j + Bi + hij


Media estimada por bloque
y111 y121 y131
. . . ˆ b1  ˆ  B̂1
yn11 yn21 yn31 Hipótesis estadística:
Ho: 1 = 2 = 3
y112 y122 y132 ó
. . . ˆ b 2  ˆ  B̂2 Ho: |1| + |2| + |3| =0
yn12 yn22 yn32

y113 y123 y133


. . . ˆ b3  ˆ  B̂3 En el modelo se considera
yn13 yn23 yn33 la variación debida al bloque
separada de la fluctuación
al azar, lo que supone una
ˆ 1  ˆ  ˆ 1 ˆ 3  ˆ  ˆ 3 comparación más eficiente.
ˆ 2  ˆ  ˆ 2 Media por grupo
estimada
5.4.3 Diseño de dos factores
FACTOR HABITOS
DE ESTUDIO
A B
FACTOR METODO I
DE ENSEÑANZA

II

III

Efecto de tres métodos de enseñanza en educación Media Superior y


dos tipos de hábitos de estudios. Es posible la existencia del efecto
combinado de ambos factores (Interacción).
Hipótesis de investigación: Tanto el factor A como el factor B tienen una
influencia sobre la medición de interés en los elementos de estudio.

Factor A con
Factor A 3 Niveles

A11 A12 A13


Factor B con
Factor B
2 Niveles
A21 A22 A23

Se asignan aleatoriamente, los elementos o unidades estudiadas a las


diferentes combinaciones de los niveles de los factores (experimento).

Se toma una muestra aleatoria en cada uno de los grupos definidos por
los niveles combinados de los factores en estudio, vigilando que otros
posibles factores no tengan influencia importante en la medición de
interés que se estudia. (cuasi-experimento).
De las muestras obtenidas, se establecen las estimaciones
correspondientes y se prueba el modelo teórico propuesto:

yhij =  + j + i + ij + hij Hipótesis estadísticas:

Medias del factor B


Ho: |1| + |2| + |3| =0
y111 y112 y113
. . . ˆ 1.  ˆ  ˆ 1 Ho: |1| + |2| =0
Yn11 Yn12 Yn13
y
Y121 Y122 Y123
. . . ˆ 2  ˆ  ˆ 2 Ho: |11| + |12| + |13| +
Yn21 Yn22 Yn23 |21| + |22| + |23| = 0

ˆ 1  ˆ  ˆ 1 ˆ 2  ˆ  ˆ 2 ˆ 3  ˆ  ˆ 3
Medias del factor A Medias de la interacción AB

Además se prueba el efecto combinado de ˆ ij  ˆ  ˆi  ˆ j  ˆ ij


ambos factores (interacción), con promedios:
DISEÑO FACTORIAL 2 x 3
FACTOR 1

A B

I
FACTOR 2

II

III
5.4.4 Diseño de dos factores y un bloque

FACTOR HABITOS FACTOR DE CONFUSION


DE ESTUDIO Nivel socioeconómico
A B
Alto
FACTOR METODO I
DE ENSEÑANZA Medio
Bajo
II

III
De las muestras obtenidas, se establecen las estimaciones
correspondientes y se prueba el modelo teórico propuesto:

yhij =  + j + i + ij + Bk+ hijk Hipótesis estadísticas:

Ho: |1| + |2| + |3| =0


ˆ 1  ˆ  ˆ 1 ˆ 2  ˆ  ˆ 2 ˆ 3  ˆ  ˆ 3
Medias del factor A Ho: |1| + |2| =0
ˆ 1.  ˆ  ˆ 1 ˆ 2  ˆ  ˆ 2
y
Medias del factor B
Ho: |11| + |12| + |13| +
ˆ1  ˆ  B1 ˆ 2  ˆ  B2 ˆ 3  ˆ  B3 |21| + |22| + |23| = 0
Medias del Bloque
Se prueban los efectos principales y el
ˆ ij  ˆ  ˆi  ˆ j  ˆ ij efecto de interacción, controlando la
Medias de la interacción AB variabilidad adicional del bloque.
5.4.5 Diseño de dos factores anidados

FACTOR TIPO DE
CARRERA
A B
FACTOR METODO I
DE ENSEÑANZA POR
TIPO DE ESCUELA

II

III

Efecto de tres métodos de enseñanza por tipos de escuela en educación media


superior y dos carreras. El efecto de carrera esta anidado en el método de
enseñanza por escuela.
Hipótesis de investigación: Tanto el factor A como el factor B en los niveles
observados de A, tienen una influencia sobre la medición de interés en los
elementos de estudio.

Factor A Factor A con


3 Niveles

A1 A2 A3

Factor B con 3 Niveles


B1 B2 B3 B1 B2 B3 B1 B2 B3 dentro cada nivel de A.

Se asignan aleatoriamente, los elementos o unidades estudiadas a las diferentes


niveles de B en cada grupo de A (experimento).

Se toma una muestra aleatoria en cada uno de los grupos definidos por los niveles
del factor B en cada uno de los grupos del factor A (pseudoexperimento).
NOTA: No se puede considerar el efecto independiente del factor A debido al orden jerárquico de los factores.
De las muestras obtenidas, se establecen las estimaciones
correspondientes y se prueba el modelo teórico propuesto:

yhij =  + i + j(i) + h(ij) Hipótesis estadísticas:

Ho: |1| + |2| + |3| =0


Medias del factor A
ˆ 1  ˆ  ˆ 1 ˆ 2  ˆ  ˆ 2 ˆ 3  ˆ  ˆ 3 y

Ho: |1(1)| + |1(2)| + |1(3)| +


Medias del factor B dentro de los niveles de A |2(1)| + |2(2)| + |2(3)| = 0

ˆ 1(1)  ˆ  ˆ 1  ˆ 1(1) ˆ 1( 2 )  ˆ  ˆ 2  ˆ 1( 2 ) ˆ 1( 3)  ˆ  ˆ 3  ˆ 1( 3)

ˆ 2 (1)  ˆ  ˆ 1  ˆ 2 (1) ˆ 2 ( 2 )  ˆ  ˆ 2  ˆ 2 ( 2 ) ˆ 2 ( 3)  ˆ  ˆ 3  ˆ 2 ( 3)

ˆ 3(1)  ˆ  ˆ 1  ˆ 3(1) ˆ 3( 2 )  ˆ  ˆ 2  ˆ 3( 2 ) ˆ 3( 3)  ˆ  ˆ 3  ˆ 3( 3)

En éste caso, se prueba el efecto principal de los niveles de A y el efecto


combinado de los niveles de B dentro de cada uno de los niveles de A.
PRECAUCIÓN!!
Todo experimento, a pesar de la aleatorización y el diseño es susceptible
de sesgos, por lo que es imperativo el realizar no solo un buen diseño,
también una cuidadosa conducción del estudio para evitar posibles
factores de confusión y disminuir al máximo la posibilidad de incurrir en
errores; ya que una vez realizado el estudio será casi imposible corregir o
controlar sesgos.

También podría gustarte