Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Clase 7 - Bioestadística y Diseño Experimental 29072020 PDF
Clase 7 - Bioestadística y Diseño Experimental 29072020 PDF
Ingeniería Agronómica
2020
Medidas de tendencia central
- Media
- Mediana
MEDIDAS DESCRIPTIVAS - Moda
Proporción
𝑴𝒆𝒅𝒊𝒂 𝒎𝒖𝒆𝒔𝒕𝒓𝒂𝒍:
293
# flores fi Fi xi*fi 𝑋ത = = 5,86
0 1 1 50
0
1 1 2 1 En promedio las plantas tienen 5,86 flores. Sin embargo, por ser una variable
2 3 5 6 discreta, se sugiere dar un dato acorde a la variable, en este caso, se indicaría que
3 6 11 18 en promedio las plantas tienen 6 flores
4 4 15 16
5 4 19 20 𝑴𝒆𝒅𝒊𝒂𝒏𝒂:
6 9 28 54
7 8 36 56 𝑐𝑜𝑚𝑜 𝑛 = 50 → 𝑝𝑎𝑟 −−−→ 𝑑𝑎𝑡𝑜𝑠 𝑒𝑛 𝑙𝑎𝑠 𝑝𝑜𝑠𝑖𝑐𝑖𝑜𝑛𝑒𝑠 25 𝑦 26
8 7 43 56 6+6
9 4 47 36 𝑀𝑒 𝑋 = =6
2
10 3 50 30
Suma 50 293 El 50% de las plantas tienen 6 o menos flores y el otro 50% tiene 6 o más flores.
𝑴𝒐𝒅𝒂:
𝑀𝑜 𝑋 = 6
1 𝑛 1 𝑛
σ𝑖=1 𝑥𝑖 − 𝑋ത 3
∗ 𝑓𝑖 σ𝑖=1 𝑥𝑖 − 𝑋ത 4 ∗ 𝑓𝑖
𝐴𝑠 = 𝑛 𝐶𝑢 = 𝑛 2 −3
1 𝑛 3/2 1 𝑛
σ𝑖=1 𝑥𝑖 − 𝑋ത 2 ∗ 𝑓𝑖 σ𝑖=1 𝑥𝑖 − 𝑋ത 2 ∗ 𝑓𝑖
𝑛 𝑛
1 1
(−240,01) −4,8 (4285,06) 85,7
50 𝐶𝑢 = 50
𝐴𝑠 = = = −0,32 2 − 3 = 36,49 − 3 = 2,35 − 3 = −0,65
1 3/2 14,85 1
(302,02) (302,02)
50 50
La distribución de frecuencia de los datos es asimétrica a La distribución de frecuencia de los datos es tan baja como
izquierda, o tiene sesgo negativo una curva platicúrtica.
U. 2
Medidas de ubicación y posición
𝑃𝑟 (𝑥 ) 𝐷𝑟 (𝑥 ) 𝑄𝑟 (𝑥 )
Es decir, que existen 100 percentiles: Es decir, que existen 10 deciles: Es decir, que existen 4 cuartiles:
𝑃1 (𝑥), 𝑃2 𝑥 , … , 𝑦 𝑃100 (𝑥). 𝐷1 (𝑥), 𝐷2 𝑥 , … , 𝑦 𝐷10 (𝑥). 𝑄1 (𝑥), 𝑄2 𝑥 , 𝑄3 𝑥 , 𝑄4 (𝑥).
𝐷1 𝑥 = 𝑃10 𝑥 → el 10% de las observaciones son menores o iguales que este valor y el otro 90% de las observaciones son mayores o iguales que
este valor.
𝐷2 𝑥 = 𝑃20 𝑥 → el 20% de las observaciones son menores o iguales que este valor y el otro 80% de las observaciones son mayores o iguales que
este valor
𝐷3 𝑥 = 𝑃30 𝑥 → el 30% de las observaciones son menores o iguales que este valor y el otro 70% de las observaciones son mayores o iguales que
este valor
𝐷4 𝑥 = 𝑃40 𝑥 → el 40% de las observaciones son menores o iguales que este valor y el otro 60% de las observaciones son mayores o iguales que
este valor.
𝐷6 𝑥 = 𝑃60 𝑥 → el 60% de las observaciones son menores o iguales que este valor y el otro 40% de las observaciones son mayores o iguales que
este valor
𝐷7 𝑥 = 𝑃70 𝑥 → el 70% de las observaciones son menores o iguales que este valor y el otro 30% de las observaciones son mayores o iguales que
este valor
𝐷8 𝑥 = 𝑃80 𝑥 → el 80% de las observaciones son menores o iguales que este valor y el otro 20% de las observaciones son mayores o iguales que
este valor
𝐷9 𝑥 = 𝑃90 𝑥 → el 90% de las observaciones son menores o iguales que este valor y el otro 10% de las observaciones son mayores o iguales que
este valor
𝑄1 𝑥 = 𝑃25 𝑥
𝑄2 𝑥 = 𝑃50 𝑥 = 𝐷5 𝑥 = 𝑀𝑒(𝑥)
𝑄3 𝑥 = 𝑃75 𝑥
BoxPlot
𝑃𝑟 (𝑥 ) 𝐷𝑟 (𝑥 ) 𝑄𝑟 (𝑥 )
𝑛+1 𝑟
𝐿𝑟 =
100
3. Si 𝐿𝑟 es un número entero, el percentil 𝑟 -ésimo será el promedio entre los valores que se encuentren en dicha
posición 𝐿𝑟 y en la posición siguiente 𝐿𝑟 + 1
4. Si 𝐿𝑟 no es un número entero, se redondeará al valor siguiente (por encima), y el percentil buscado será el que se
encuentre en la posición obtenida.
Cuando la variable es continua,
se encuentra tabulada y
agrupada por intervalos o
clases, las anteriores medidas se
calculan de la siguiente manera:
𝑚
𝑋𝑖 𝑓𝑖
𝑋ത = 𝑠𝑖𝑒𝑛𝑑𝑜 𝑚 𝑙𝑎 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠, 𝑦 𝑋𝑖 𝑙𝑎 𝑚𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠
𝑛
𝑖=1
𝑛 𝑓𝑖+1
− 𝐹𝑖−1 𝑀𝑜 𝑋 = 𝐿𝑖 + 𝐶𝑖
𝑀𝑒 𝑋 = 𝐿𝑖 + 𝐶𝑖 2
𝑓𝑖−1 + 𝑓𝑖+1
𝑓𝑖
Donde, Siendo,
𝑛
𝐿𝑖 : límite inferior del intervalo que contiene la ubicación 𝑓𝑖 : la mayor frecuencia absoluta, y
2
𝐶𝑖 : Amplitud de clase 𝑓𝑖−1 : la frecuencia absoluta anterior a 𝑓𝑖
𝐹𝑖−1 : Frecuencia absoluta acumulada anterior a 𝐹𝑖 𝑓𝑖+1 : la frecuencia absoluta siguiente a 𝑓𝑖
𝑛
𝐹𝑖−1 ≤ < 𝐹𝑖
2
𝑚
𝑋𝑖 − ത
𝑋 2
∗ 𝑓𝑖
2
𝑆 = 𝑠𝑖𝑒𝑛𝑑𝑜 𝑚 𝑙𝑎 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠, 𝑦 𝑋𝑖 𝑙𝑎 𝑚𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠
𝑛−1
𝑖=1
1 𝑚 1 𝑚
σ𝑖=1 𝑋𝑖 − 𝑋ത 4 ∗ 𝑓𝑖 σ𝑖=1 𝑋𝑖 − 𝑋ത 3
∗ 𝑓𝑖
𝐶𝑢 = 𝑛 −3 𝐴𝑠 = 𝑛
2 3/2
1 𝑚 1 𝑚
σ𝑖=1 𝑋𝑖 − 𝑋ത 2 ∗ 𝑓𝑖 σ𝑖=1 𝑋𝑖 − 𝑋ത 2 ∗ 𝑓𝑖
𝑛 𝑛
clases
fi Fi Xi Xi*fi
lim inf lim sup
5,0 5,9 3 3 5,43 5,43 * 3: 16,29
5,9 6,7 10 13 6,30 6,3 * 10: 63
6,7 7,6 11 24 7,17 7,17 * 11: 78,87
7,6 8,5 14 38 8,03 8,03 * 14: 112,42
8,5 9,3 11 49 8,90 8,9 * 11: 97,9
9,3 10,2 4 53 9,77 9,77 * 4: 39,08
Total 53 407,56
𝑚
𝑋𝑖 𝑓𝑖 407,56
𝑋ത = = = 7,69
𝑛 53
𝑖=1
En promedio los 53 autos de la muestra emiten 7,69 toneladas métricas de dióxido de carbono por año
clases
fi Fi Xi Xi*fi
lim inf lim sup
5,00 5,87 3 3 5,43 5,43 * 3: 16,29
5,87 6,73 10 13 6,30 6,3 * 10: 63
6,73 7,60 11 24 𝐹𝑖−1 7,17 7,17 * 11: 78,87
7,60 𝐿𝑖 8,47 14 𝑓𝑖 38 𝐹𝑖 8,03 8,03 * 14: 112,42
8,47 9,33 11 49 8,90 8,9 * 11: 97,9
9,33 10,20 4 53 9,77 9,77 * 4: 39,08
Total 53 407,56
𝑛 53
𝑛 1. Calcular = = 26,5
− 𝐹𝑖−1 2 2
𝑀𝑒 𝑋 = 𝐿𝑖 + 𝐶𝑖 2 2. Identificar en la columna de las frecuencias absolutas acumuladas
𝑓𝑖 𝑛
dónde cae el valor de , el valor encontrado será 𝐹𝑖
2
3. 𝐹𝑖−1 será la frecuencia absoluta acumulada anterior a 𝐹𝑖
26,5 − 24 4. Identificar 𝐿𝑖 , el límite inferior del intervalo que contiene la
𝑀𝑒 𝑋 = 7,60 + 0,87 𝑛
14 ubicación
2
5. 𝑓𝑖 será la frecuencia absoluta que se encuentre al frente de 𝐹𝑖
𝑀𝑒 𝑋 = 7,76 6. 𝐶𝑖 : Amplitud de clase = 0,87 (ver tabla)
7. Reemplazar los valores en la formula de 𝑀𝑒 𝑋
𝑀𝑜(𝑋) = 8,03
𝑚
ത 2
𝑋𝑖 − 𝑋 ∗ 𝑓𝑖 72,65
2 2
𝑆 = = = 1,40 𝑇𝑀
𝑛−1 52
𝑖=1
La variable GHG o emisiones de los vehículos de motor, presenta una dispersión de 1,18
toneladas métricas.
𝑆= 1,40 = 1,18 𝑇𝑀
Siguiendo la regla empírica, podría indicarse que el 68% de los autos emiten entre 6,51 y
8,87 toneladas métricas de dióxido de carbono por año.
1 𝑚 1 𝑚
σ𝑖=1 𝑋𝑖 − 𝑋ത 3
∗ 𝑓𝑖 σ𝑖=1 𝑋𝑖 − 𝑋ത 4 ∗ 𝑓𝑖
𝐴𝑠 = 𝑛 𝐶𝑢 = 𝑛 −3
3/2 2
1 𝑚 1 𝑚
σ𝑖=1 𝑋𝑖 − 𝑋ത 2 ∗ 𝑓𝑖 σ𝑖=1 𝑋𝑖 − 𝑋ത 2 ∗ 𝑓𝑖
𝑛 𝑛
1 1
(−7) (215,03)
53 𝐶𝑢 = 53
𝐴𝑠 = 3/2
= −0,08 2 − 3 = −0,84
1 1
(72,65) 72,65
53 53
Como 𝐴𝑠 = −0,08 < 0 se puede indicar que Como Cu = −0,84 < 0 se puede indicar que
la distribución de los datos de la variable GHG la distribución de los datos de la variable GHG
es asimétrica a izquierda (sesgo negativo). es tan plana como una platicúrtica.
clases
fi Fi Xi Xi*fi
lim inf lim sup 𝑛∗𝑟 53∗40
5,00 5,87 3 3 5,43 5,43 * 3: 16,29 1. Calcular = = 21,2
100 100
5,87 6,73 10 13 𝐹𝑖−1 6,30 6,3 * 10: 63 2. Identificar en la columna de las frecuencias absolutas
6,73 𝐿𝑖 7,60 11 𝑓𝑖 24 𝐹𝑖 7,17 7,17 * 11: 78,87 𝑛∗𝑟
acumuladas dónde cae el valor de , el valor encontrado
7,60 8,47 14 38 8,03 8,03 * 14: 112,42 100
8,47 9,33 11 49 8,90 8,9 * 11: 97,9 será 𝐹𝑖
9,33 10,20 4 53 9,77 9,77 * 4: 39,08 3. 𝐹𝑖−1 será la frecuencia absoluta acumulada anterior a 𝐹𝑖
Total 53 407,56 4. Identificar 𝐿𝑖 , el límite inferior del intervalo que contiene la
𝑛∗𝑟
ubicación
100
5. 𝑓𝑖 será la frecuencia absoluta que se encuentre al frente de
𝐹𝑖
Calcular el Percentil 40 -> 𝑟 = 40 6. 𝐶𝑖 : Amplitud de clase = 0,87 (ver tabla)
7. Reemplazar los valores en la formula de 𝑀𝑒 𝑋
𝑛∗𝑟
− 𝐹𝑖−1
𝑃𝑟 𝑋 = 𝐿𝑖 + 𝐶𝑖 100
𝑓𝑖
21,2 − 13
𝑃40 𝑋 = 6,73 + 0,87
11 El 40% de los autos emiten 7,38 o menos toneladas métricas de
dióxido de carbono por año, y el otro 60% de los autos emiten 7,38
𝑃40 𝑋 = 7,38 o más toneladas métricas de dióxido de carbono por año.
clases
fi Fi Xi Xi*fi
lim inf lim sup 𝑛∗𝑟 53∗75
5,00 5,87 3 3 5,43 5,43 * 3: 16,29 1. Calcular = = 39,75
100 100
5,87 6,73 10 13 6,30 6,3 * 10: 63 2. Identificar en la columna de las frecuencias absolutas
6,73 7,60 11 24 7,17 7,17 * 11: 78,87 𝑛∗𝑟
acumuladas dónde cae el valor de , el valor encontrado
7,60 8,47 14 38 𝐹𝑖−1 8,03 8,03 * 14: 112,42 100
8,47 𝐿𝑖 9,33 11 𝑓𝑖 49 𝐹𝑖 8,90 8,9 * 11: 97,9 será 𝐹𝑖
9,33 10,20 4 53 9,77 9,77 * 4: 39,08 3. 𝐹𝑖−1 será la frecuencia absoluta acumulada anterior a 𝐹𝑖
Total 53 407,56 4. Identificar 𝐿𝑖 , el límite inferior del intervalo que contiene la
𝑛∗𝑟
ubicación
100
5. 𝑓𝑖 será la frecuencia absoluta que se encuentre al frente de
𝐹𝑖
Calcular el Percentil 75 -> 𝑟 = 75 6. 𝐶𝑖 : Amplitud de clase = 0,87 (ver tabla)
7. Reemplazar los valores en la formula de 𝑀𝑒 𝑋
𝑛∗𝑟
− 𝐹𝑖−1
𝑃𝑟 𝑋 = 𝐿𝑖 + 𝐶𝑖 100
𝑓𝑖
39,75 − 38
𝑃75 𝑋 = 8,47 + 0,87 El 75% de los autos emiten 8,61 o menos toneladas métricas de dióxido de
11 carbono por año, y el otro 25% de los autos emiten 8,61 o más toneladas
métricas de dióxido de carbono por año.
𝑃75 𝑋 = 8,61
El calculo de los Deciles 𝐷𝑟 𝑋 y Cuartiles 𝑄𝑟 𝑋 es análogo al proceso realizado para calcular un percentil.
𝑛∗𝑟
Nótese que lo único que cambia es el denominador en la fracción . Así mismo, la interpretación es similar en ambas
100
medidas.
𝑛∗𝑟 𝑛∗𝑟
− 𝐹𝑖−1 − 𝐹𝑖−1
𝐷𝑟 𝑋 = 𝐿𝑖 + 𝐶𝑖 10 𝑄𝑟 𝑋 = 𝐿𝑖 + 𝐶𝑖 4
𝑓𝑖 𝑓𝑖
Ejercicio
1. Calcular el Decil 6 y 4
2. Calcular el Cuartil 2 y 3