Está en la página 1de 52

Estadística para

Biociencias
XS-0215

Escuela de Estadística
Profesor: Jose Flores Ramírez
II - 2022
Grupo 01 – V: 17:00-19:00
S: 13:00-16:00
Agenda
II Parcial
Tema 9
Dudas

2
Introducción al
diseño de Tema 9

experimentos
Conceptos básicos

• Cualquier experiencia científica en donde se provoca de manera


consciente algún cambio y además, se observa e interpreta el resultado
con alguna finalidad previamente determinada
• Además, en el experimento científico se realiza un control de algunos
factores
• Incluye el diseño de todos los ejercicios de recolección de información
donde hay variación y donde el experimentador puede tener completo
control o no
4
https://thenounproject.com/
5
25g

50g

100g

6
Conceptos básicos

01
Factor

Es una variable categórica (o


02
Nivel de factor
categorizada) con varios niveles para
la cual se quiere investigar el efecto Los factores tienen niveles de
que tiene un cambio en ella sobre aplicación, donde los niveles
una variable respuesta. implican una cantidad o
magnitud

Unidad experimental
03
Unidades que reciben/se les aplican
los tratamientos bajo estudio
7
Conceptos básicos

04
Tratamiento
• Es algo que los investigadores administran a las unidades
experimentales.
• Cuando un experimento tiene un solo factor los tratamientos
son los niveles del factor
• Si el experimento tiene dos o más factores, cada tratamiento
es la combinación de los niveles de los factores

8
25g

50g

100g

* * *

1 cda * 4 cda

9
¿Qué es
experimento?
• Variable dependiente
• Variable independiente

10
Conceptos básicos

06
Repetición
Cuando un tratamiento es aplicado a
Error experimental 05 mas de una unidad experimental en
un experimento.
Es inherente a todo proceso
Para poder calcular el error
experimental se necesita de varias
repeticiones
11
Conceptos básicos

07
Aleatorizar

Se busca que la asignación de las


unidades experimentales sea a grupos
específicos (tratamientos) 08
Replicación/Repetir
Ayuda a minimizar los sesgos
sistemáticos que se puedan presentar Repetir el experimento básico
Denota la cantidad de repeticiones
independientes de un experimento
bajo idénticas condiciones
experimentales
12
Conceptos básicos

Asignación de unidades a los grupos


Por aleatorización Sin aleatorización
Se selecciona una muestra Se seleccionan muestras
Se pueden
Selección de unidades

Aleatoria

aleatoria de una población; luego aleatorias de poblaciones


realizar
las unidades se asignan de forma distintas existentes. inferencias a la
aleatoria a los diferentes grupos de población
tratamientos.
Se encuentra un grupo de Se examinan colecciones de
No aleatoria

unidades de estudio; luego las unidades disponibles de


unidades se asignan de forma grupos distintos
aleatoria a los grupos de
tratamientos.

Se pueden realizar
inferencias causales 13
25g

50g

100g

14
25g

50g

100g

* *

1 cda * 4 cda * *

15
*

* *

* *

* *

* *

16
Conceptos básicos

09
Control

Se busca reducir la variabilidad y el


10
Uso de testigos
error experimental mediante otras
variables secundarias o atributos que Es el grupo control para poder
puedan influir en los resultados medir de mejor manera los
efectos producidos por los
. tratamientos

Prueba a ciegas
11 Para pruebas es importante que las
personas no puedan identificar que
se les está brindando 17
Conceptos básicos

Consideraciones en el diseño
• Aunque no se requiere tener igual cantidad de unidades experimentales bajo cada
tratamiento (cc. diseño balanceado), la potencia de la prueba de hipótesis (rechazar
la hipótesis nula cuando debe ser rechazada) aumenta conforme las muestras
tengan tamaños tan parecidos como sea posible.
• El desempeño de las pruebas será mejor conforme las unidades experimentales
sean más similares en todos los aspectos excepto en el tratamiento aplicado; sin
embargo, para obtener resultados más generalizables se pueden incluir factores de
ruido controlables o medibles que pueden ser considerados en el modelo.

18
Conceptos básicos

Consideraciones en el diseño

• En un diseño totalmente experimental, cada unidad experimental debe ser


asignada aleatoriamente a cada uno de los tratamientos bajo estudio.
• En la práctica no siempre es posible hacer una asignación aleatoria de las unidades
a los tratamientos. Esto limita el alcance del diseño.
• Los factores de ruido que no se pueden controlar se deben medir para tomarse en
cuenta en el momento del análisis de tal forma que no oscurezcan los resultados.

19
Conceptos básicos – Modelo básico

Las mediciones se pueden descomponer en tres componentes básicos:


1) Promedio general (𝜇)
2) Tratamiento utilizado (𝜏𝑖 )
3) Intrínseco a la unidad experimental (𝜀𝑖𝑗 ) que toma en cuenta todas las fuentes de
variación no controladas por el diseño

𝑦𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝜀𝑖𝑗

𝜏𝑖 : Efecto del tratamiento (efectos fijos, aleatorios o mixtos)

20
Conceptos básicos - Modelos

Efectos Fijos Efectos Aleatorios


Los niveles son fijados por el experimentador Los niveles son escogidos
antes de iniciar el experimento. Las conclusiones aleatoriamente desde una población.
son válidas para los niveles estudiados.

25g

50g

100g

21
Conceptos básicos - Hipótesis

Hipótesis:

𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 =⋯= 𝜇𝑘 ↔ 𝐻0 : 𝜏1 = 𝜏2 = 𝜏3 = ⋯ = 𝜏𝑘 = 0
𝐻1 : 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝑑𝑒 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙𝑒𝑠 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 |
𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝑝𝑎𝑟 𝑑𝑒 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 𝑝𝑟𝑜𝑑𝑢𝑐𝑒𝑛 𝑚𝑒𝑑𝑖𝑎𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒𝑠 𝑒𝑛𝑡𝑟𝑒 𝑠í

k es el número de poblaciones a comparar

22
Conceptos básicos – Análisis de variancia

ANOVA ANDEVA
ANalysis ANálisis

Of DE

VAriance VArianza

Verificar, examinando variancias muestrales, si tres o más poblaciones tienen distintos


promedios

23
Conceptos básicos – Análisis de variancia

Tabla de análisis de variancia


Es una tabla que resume las diferentes fuentes de variación en que se divide la
variación total de los datos.
La tabla regularmente tiene las siguientes columnas:
1. Fuente de variación.
2. Sumas de cuadrados (SM) (numeradores de los cuadros medios)
3. Grados de libertad (denominadores de los cuadrados medios)
4. Cuadrados medios (CM)
5. El valor F (la relación que existe entre el cuadrado medio de tratamientos y
el cuadrado medio de error)
6. Probabilidad correspondiente al valor F obtenido
24
Conceptos básicos - supuestos

Hay 3 supuestos principales para poder realizar análisis de variancia

1. Todas las poblaciones se distribuyen normalmente


2. Las poblaciones deben tener variancias iguales
3. Las muestras son seleccionadas de manera independiente

25
Conceptos básicos – Prueba F

Funciona para poner a prueba si dos muestras provienen de poblaciones con variancias
iguales o si se desea comparar varias medias poblacionales de manera simultánea

Características de la distribución F:

• No negativa

• Continua

• Sesgo positivo

• Asintótica

26
Conceptos básicos – Prueba F

La F es una variable aleatoria a partir de:


𝑈1
ൗ𝑑
1
𝐹=
𝑈2
ൗ𝑑
2

Siendo:
• 𝑈1 𝑦 𝑈2 variables aleatorias de una distribución Chi-Cuadrada y estadísticamente
independientes entre ellas
• 𝑑1 𝑦 𝑑2 grados de libertad respectivos

27
Conceptos básicos – Prueba F

Para el análisis del análisis de varianza se usa la Razón F:

𝑣𝑎𝑟 𝑒𝑛𝑡𝑟𝑒 𝐶𝑀𝑇


𝐹= =
𝑣𝑎𝑟 𝑑𝑒𝑛𝑡𝑟𝑜 𝐶𝑀𝐸

Es importante considerar que esta razón se puede usar a conveniencia según


lo que se necesite averiguar, e inclusive despejar para obtener alguna de las
otras partes del análisis de varianza

28
Conceptos básicos – Análisis de variancia

• Variación entre tratamientos (var entre):


La variación entre tratamientos mide la variación que hay entre los promedios de los
diferentes tratamientos y el promedio general

2
෍ 𝑛𝑗 𝑦ത𝐽ሶ − 𝑦ത
𝑣𝑎𝑟 𝑒𝑛𝑡𝑟𝑒 = 𝐶𝑀𝑇 =
𝑘−1
𝑛𝑗 : número de datos por tratamiento
k: número de grupos

29
Conceptos básicos – Análisis de variancia

• Variación dentro de tratamientos (var dentro):


La mejor estimación de la variabilidad dentro de tratamientos es el promedio
ponderado de las varianzas para cada tratamiento (𝑠𝑗2 )

෍(𝑛𝑗 − 1)𝑠𝑗2
𝑣𝑎𝑟 𝑑𝑒𝑛𝑡𝑟𝑜 = 𝐶𝑀𝐸 =
𝑛−𝑘
k: número de grupos
𝑠𝑗2 : variancia de cada grupo

30
Conceptos básicos – Conceptos

Hay dos tipos de diseño (para este curso):

1. Análisis de una vía

2. Análisis de dos vías

31
ANOVA
1 vía

32
ANOVA 1 vía

• En el análisis de una vía, las unidades experimentales se asignan en forma


aleatoria a los diferentes niveles de un solo factor (cada factor es un
tratamiento).
• El objetivo del análisis es determinar si la variabilidad existente entre los
promedios de los distintos niveles del factor es mayor que la variabilidad
dentro de los niveles del factor.
• Se utiliza la prueba F

33
25g

50g

100g

34
ANOVA 1 vía

Fuentes de variación:
Varianza
entre los
grupos

Varianza total
• Suma de la
variabilidad dentro
y entre los grupos

Varianza
dentro
de los
grupos

35
25g

50g
Mantequilla
100g
25g 50g 100g
1 0,8 0,2
0,3 0,3 1,5
2,5 0,7 0,9

36
ANOVA 1 vía

Fuentes de variación:

Fuente de Suma de Grados de


Cuadrado medio Valor F
variación cuadrados libertad
CMT /
Tratamiento SCT k-1 CMT = SCT / (k-1)
CME
Error SCE n-k CME = SCE / (n-k)
Total SCTotal n-1

37
Crecimiento (cm)
Ejemplo 1 Control Sombra Sol
100% 100%

42 23 25
Se desea saber si el crecimiento
promedio (en cm) de una 32 30 27
determinada planta se ve influido
por la exposición directa del sol 51 31 30
durante todo el día. Después de
52 22 48
cuatro meses de trabajo de
campo, se obtienen los 33 35 25
siguientes datos.
45 24 35
Ponga a prueba la hipótesis a un
5% de significancia. 29

38
Ejercicio 1

El director de una empresa desea determinar si tres programas de


capacitación tienen efectos diferentes en los niveles de productividad. Se
seleccionan al azar 14 empleados a los cuales se les aplicó un examen al
terminar la capacitación y los resultados se presentan a continuación.
¿Con un 5% de significancia se puede decir que al menos una de las
calificaciones promedio es diferente según el tipo de capacitación recibida?
• Autodidacta: 85, 72, 83, 80

• Por computadora: 80, 84, 81, 78, 82

• Con supervisor: 82, 80, 85, 90, 88

39
ANOVA
2 vías

40
ANOVA 2 vías

Existe otro factor que puede afectar cada una de las unidades experimentales
Se hace con el fin de minimizar la variación dentro del tratamiento
Una variable que complementa o colabora con lo que realmente se quiere encontrar
diferencias
Bloque:
• En muchas situaciones los bloques se construyen de forma natural.
• Se utilizan tantas unidades dentro de un bloque como tratamientos se estén
analizando.
• Se aplican los tratamientos aleatoriamente a las unidades dentro de cada
bloque
41
ANOVA 2 vías

Fuentes de variación:

Varianza total Varianza


Varianza Varianza
• Suma de la dentro
entre los del
variabilidad dentro y de los
grupos Bloque
entre los grupos y grupos
bloque

42
ANOVA 2 vías

Fuentes de variación:

Fuente de Suma de Grados de


Cuadrado medio Valor F
variación cuadrados libertad
CMT /
Tratamiento SCT k-1 CMT = SCT / (k-1)
CME
CMBl /
Bloques SCBl f-1 CMBl = SCBl / (f-1)
CME
Error SCE (f-1)(k-1) CME = SCE / [(f-1)(k-1)]
Total SCTotal (f*k)-1

43
Ejemplo 2

Fertilizantes
Se seleccionan aleatoriamente Altura
parcelas en una zona Control Regular Casero Orgánico
determinada para ver si existe
Baja 71 51 62 70
diferencias en la cantidad de
plantas vivas por hectárea luego Media 65 60 68 64
de unos meses según el
fertilizante utilizado. Se toma Alta 68 61 70 65
adicionalmente en consideración
la altura a la que se encuentra la
finca de la parcela.

44
Ejercicio 2

Se quiere hacer una medición si hay diferencia entre 3 marcas de cereales con bajo
contenido de azúcares (porcentaje según dieta diaria). Se analizan muestras de
cada marca en 4 instrumentos diferentes a un 96% de confianza

Cereales
Instrumento
Marca A Marca B Marca C

Instrumento I 9,16 11,70 9,44

Instrumento II 9,67 10,68 7,65

Instrumento III 8,91 9,91 7,14

Instrumento IV 9,93 8,89 8,41


45
Ejercicios

46
EJERCICIO 3

Para una investigadora de la salud es de interés conocer la edad promedio en que las mujeres
se realizaron por primera vez la citología cérvico vaginal (prueba para detectar cáncer de
cérvix) en tres ciudades del país. Tiene la hipótesis de que las mujeres se realizan a diferentes
edades la citología en cada ciudad. Para ello selecciona una muestra de 6 mujeres en cada
una de las ciudades, la información obtenida se presenta a continuación:

Edad
Ciudad 1 Ciudad 2 Ciudad 3
50 59 57
39 59 44
Ponga a prueba la 41 47 56
38 26 24
hipótesis a un 5% de 50 43 55
significancia 54 60 28
47
EJERCICIO 4

Debido a la pandemia muchas personas han sido despedidas de su trabajo, por lo que
surge el interés de comparar la edad promedio de las personas desempleadas de la Gran
Área Metropolitana, resto del Valle Central y el resto del país. Se seleccionó una muestra de
5 personas en cada región y se obtuvo la siguiente información:

Edad
GAM Resto VC Resto país

38 32 59
Ponga a prueba la 37 45 41
hipótesis a un 5% de 40 37 52
37 54 57
significancia
33 58 44
48
EJERCICIO 5

Se hace un estudio para determinar si existen diferencias entre las cantidades de veneno
inyectada por tres especies de serpientes venenosas (Mamba negra, Mamba verde y Mamba
verde Africana). Se seleccionaron serpientes de cada especie, así como de su sexo ya que se
conoce que puede ser una variable confusora, se obtuvo la siguiente información:

Especie
Mamba
Sexo Mamba Mamba
verde
negra verde
Africana
Ponga a prueba la
Hembra 20 9 18
hipótesis a un 5% de
significancia Macho 18 11 19
49
EJERCICIO 6

Se diseñó un experimento donde se utilizaron diferentes cantidades de azúcar y tipo de


chips para cocinar una serie de galletas. Para azúcar se usó 100, 150 y 200 gramos y
para los chips: Chocolate, Macadamia y maní. Se tiene como hipótesis que las
puntuaciones promedio para los diferentes niveles de azúcar y tipo de chip son diferentes.
Los datos (puntuaciones) recolectados se muestran a continuación:

Azúcar Chocolate Macadamia Maní


100 70 71 52
150 62 58 40
200 62 73 54
Ponga a prueba la
hipótesis a un 5% de
significancia
50
EJERCICIO 7

Se evaluó la preferencia de 3 mermeladas con Mermelada Panel Preferencia

diferentes cantidades de aditivos de sabor. 1 1 1


2 1 5
Participaron 5 panelistas y usaron una escala
3 1 8
de 1 a 20 para evaluar el nivel de preferencia 1 2 2
por el sabor de cada mermelada (1=le 2 2 8
disgusta extremadamente, 20=le gusta 3 2 14

extremadamente). Se espera que los puntajes 1 3 10


2 3 9
de preferencia para un mismo panelista sean 3 3 16
consistentes y que haya diferencias de gusto 1 4 6
entre los panelistas por lo que se justifica 2 4 13

considerar al panelista como un bloque al que 3 4 18


1 5 16
se le aplican los 3 tratamientos. Ponga a
2 5 14
prueba la hipótesis a un 5% de significancia. 3 5 15 51
Dudas | Comentarios

Muchas gracias!

52

También podría gustarte