Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Análisis de la varianza
Regresión y correlación
Diseños de ANOVA
1) ESTADÍSTICA DESCRIPTIVA. Conceptos básicos
BIOESTADÍSTICA moderna:
Imposible de conocer en su
totalidad (CENSO)
INFERENCIA
representación estadística
de la población.
- No aleatorio:
sistemático
estratificado
Distribución de frecuencias
Muestreo al azar
Var: peso al nacer
89 71-80 0 0
101 81-90 1 10
93 91-100 1 10
132 101-110 2 20
116 111-120 3 30
149 121-130 2 20
115 131-140 1 1
128 141-150 0 0
120 151-160 0 0
n=10
Distribución de frecuencias muestral y poblacional
n N
Estadístico Parámetro
muestral poblacional
ESTADÍSTICA DESCRIPTIVA
Estadísticos de Estadísticos de
localización o de dispersión
tendencia central
1
1 σ𝑛𝑖=1 Media armónica para datos xR = 1/x
= 𝑥
H𝑥 𝑛
Estadísticos de localización o de tendencia central
MEDIANA:
MODA:
describen la forma de la
distribución.
distribuciones con
igual 𝑥, n
distinta dispersión
Estadísticos de dispersión
RANGO:
Diferencia entre el mayor y el menor valor de la distribución. No es muy robusto dado
que es muy sensible a outliers.
DESVIACIÓN:
Diferencia de cada dato con la media: 𝑑 = 𝑥𝑖 − 𝑥
𝑥 𝑥𝑖 − 𝑥 𝑑2
𝑥 = 7,713
σ𝑛 (𝑥
𝑖=1 𝑖 − 𝑥) 2
VARIANZA o CUADRADOS MEDIOS de una muestra 𝑠2 = 𝑛
ESTADÍSTICO PARÁMETRO
de la muestra de la población
σ𝑛𝑖=1 𝑥
𝑥= 𝜇
𝑛
σ𝑛
𝑖=1(𝑥𝑖 − 𝑥)
2
𝑠2 = 𝜎2
𝑛 −1
σ𝑛
𝑖=1(𝑥𝑖 − 𝑥) 2
𝜎
𝑠= 𝑛 −1
𝑛 − 1, grados de libertad
Distribución de frecuencias - Probabilidad
Probabilidad de obtener un valor de la distribución, P [f] = casos favorables / casos totales
81-90 1 10 P [140] ≤ 1/10 ≤ 0.1 83.5 385 4,06 P [140] ≤ 200/9465 ≤ 0.2
91-100 1 10 91.5 888 9,38
99.5 1729 18,26
101-110 2 20
107.5 2240 23,77
111-120 3 30
115.5 2007 21,20
121-130 2 20
123.5 1233 13,02
131-140 1 1
131.5 641 6,77
141-150 0 0
139.5 201 2,12
151-160 0 0
147.5 74 0,78
161-170 0 0
155.5 14 0,14
171-180 0 0
163.5 5 0,05
n=10 100% 171,5 1 0,01
n=9465 100%
Distribución de probabilidad
𝑓
P = 𝑛→𝑁
lim
𝑁
𝑥, 𝑠2
Distribución teórica
f esperadas
de probabilidad
𝜇, 𝜎2
Distribución de probabilidad Normal
Distribución de frecuencias para variables continuas
X Z , densidad, df/dx
X , variable biológica
𝜇, media
𝜎, desviación estándar
𝜋, 𝑒 constantes
𝜎 = 0.5
𝜎=1
𝜎=1
𝜇=4 𝜇=8
Propiedades
Función distribución
normal
ESTADÍSTICA PARAMÉTRICA: se basa en que los estadísticos (𝑥, 𝑠) de una muestra son
estimadores de los parámetros (𝜇, 𝜎) de la población.
En general, las variables biológicas siguen una distribución normal (𝜇, 𝜎), dado que:
Variable: color del pelo del ratón Factor: agrega 1 unidad de pigmentación cuando
está presente (C=1)
p = P [C] = 0.5
Asume que la presencia o ausencia tienen igual
q = P [c] = 0.5 probabilidad en un individuo.
fesp {0.5, 0.5} {0.25, 0.50, 0.25} {0.125, 0.375, 0.375, 0,125}
C (pigmentación)
marca límite f fA % fA
de clase superior
del int.
59.5 63.5 2 2 0.02
67.5 71.5 6 8 0.08
75.5 79.5 39 47 0.50
83.5 87.5 385 432 4.6
91.5 95.5 888 1320 13.9
99.5 103.5 1729 3049 32.2
107.5 111.5 2240 5289 55.9
115.5 119.5 2007 7296 77.1
123.5 127.5 1233 8529 90.1
131.5 135.5 641 9170 96.9
139.5 143.5 201 9371 99.0
147.5 151.5 74 9445 99.79
155.5 159.5 14 9459 99.94
163.5 167.5 5 9464 99.99
171,5 175.5 1 9465 100
n=9465
Desviaciones de la normalidad
SESGO
CURTOSIS
2) ESTIMACIÓN ESTADÍSTICA.
ESTADÍSTICO PARÁMETRO
de la muestra de la población
σ𝑛𝑖=1 𝑥
𝑥= 𝜇
𝑛
σ𝑛
𝑖=1(𝑥𝑖 − 𝑥)
2
𝑠2 = 𝜎2
𝑛 −1
σ𝑛
𝑖=1(𝑥𝑖 − 𝑥) 2
𝜎
𝑠= 𝑛 −1
𝑛 − 1, grados de libertad
Intervalos de confianza
Se obtienen para obtener un determinado estadístico de la muestra dentro de límites de confianza
de la distribución teórica.
𝑥 𝑥 𝑥
Distribución t de Student
- a , probabilidad
- n-1, grados de libertad
- t a [n-1]
Valores de t
Intervalos de confianza para las medias muestrales
Hipótesis nula (Ho): hipótesis bajo prueba. Asume que no hay diferencia entre las
distribuciones (estadísticos) de las muestras aleatorias provenientes de una población.
(p + q)k
a/2
a/2
Error de tipo I, a: probabilidad de rechazar la Ho cuando es verdadera
a = 0.01 1/100 muestras al azar de la población contienen una proporción 14/3 o mayor
a = 0.05 5/100 muestras al azar de la población contienen una proporción 13/4 o mayor
(p + q)k
a/2
a/2
Rechazo de Ho Ha: las proporciones de sexos son diferentes
pH = 2qM = 0,66
para a = 0.01 bajo Ho, todas las muestras con 14/3 hembras o mayor son muy improbables.
a/2
a/2
Error de tipo II, : probabilidad de aceptar la Ho cuando es falsa
a/2
a/2
Prueba de hipótesis para las medias muestrales
pertenece una media muestral a la población..?
𝑥1 = 37 m = 45,5 𝑥2 = 54
42.08 48.92
Bajo H2:
𝑥 2 – Lsup = 54 – 48.92 = 5.08
𝑥1 = 37 m = 45,5 𝑥2 = 54
= 0.0018 = 0.0018
42.08 48.92
depende de Ha
3) ANÁLISIS DE LA VARIANZA
Analysis of variance, ANOVA
σ𝑛 (𝑥
𝑖=1 𝑖 − 𝑥) 2
𝑆𝐶
𝑠2 = 𝑛 −1
= 𝐺𝐿
i
Modelo asumido
yij = μ + αi + εij
c) Cada subpoblación sigue una distribución normal, con media μi y varianza σ²i.
H0 : μi = μ para todo i
Ha: μi ≠ μ para algún i
yij = μ + αi + εij
H0 : αi = 0 para todo i
Ha: : αi ≠ 0 para algún i
Scdentro =
Descomposición de la suma de cuadrados
La variabilidad total se debe a las diferencias de cada observación respecto a la media
general.
Scdentro =
Scentre =
Descomposición de la suma de cuadrados
Las SC divididas por sus grados de libertad (GL) son estimadores de la varianza
o CUADRADOS MEDIOS.
N - 1 = (a - 1) + (N - a)
Tabla de ANOVA
= E
= D
- Los CME son un estimador de la varianza de la media entre los grupos, S2E.
H0 : μi = μ para todo i
Ha: μi ≠ μ para algún i
H0 : αi = 0 para todo i
Ha: : αi ≠ 0 para algún i
~1 >1
Distribución de Fisher
GLentre, GLdentro
Valores de densidad de probabilidad acumulada (área)
Regla de decisión
H0 : μi = μ para todo i
Ha: μi ≠ μ para algún i
H0 : αi = 0 para todo i
Ha: : αi ≠ 0 para algún i