Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Bioestadística
Bioestadística
Coeficiente de variación:
σ
CV =
x
Coeficiente de asimetría:
As < 0 izquiersa
As = 0 simétrica
As > 0 derecha
Coeficiente de Curtosis:
G2 = 0 mesocúrtica
G2 > 0 leptocúrtica
G2 < 0 platicúrtica
Gráficos:
- histograma
- polígono de frecuencias
- gráfico de cajas
Ejemplo:
2, 1, 1, 3, 4, 3, 3, 1
Xi Fi (frecuencia FR (frecuencia
absoluta) relativa)
1 16
2 20
3 4
4 5
50 1 100
Σ xi
x= =2,06 média
n
Σ (xi−x )
θ=
√ n
=0,95 varianza
50
Med = =25 mediana
2
Med = 2
18/09/2019
D-35
Probabilidad
Definicio de probabilidad
Definicion de Laplace
Propiedades
Definiciones
Unión: A B
Cualquier elemento de una muestra que esté en A y en B
Ejemplo: A = {par}
B = {1, 2, 3}
A B = {1, 2, 3, 4, 6}
Intersección:
Ejemplo: A B = {2}
Diferencia: A - B
Los sucesos de A que no esté en B
Ejemplo: A – B = {4, 6}
Suceso contrario Ā = E - A
Suceso complementario, que no está en el otro
Ejemplo: Ā = {1, 3, 5}
Propiedades:
1. P(Ā) = 1 – P(A)
2. P() = 0
3. Si A B > P(B) = P(A) + P(B-A)
4. Si A B > P(A) <= P(B)
5. Si A1, A2, …, Ak, son incompatibles dos a dos, encontes:
P (A1 A2 … Ak) = P(A1) + P(A2) + …
6. P(AB) = P (A) + P(B) – P(A B)
Probabilidad condicionada
P(B A)
P( B/ A)=
P( A)
Probabilidad total
Teorema de Bayes
P( Ai /B)=P ( Ai ) . P ¿ ¿
19/09/2019
Distribución de Probabilidad
y = f(x)
probabilidad de x = función de x
Distribución Binomial
- B (n, p)
n = número de veces
p = probabilidad de éxito
q = probabilidad de fracaso
Ecuación
Distribución de Poisson
- X = N (, )
ˆ2
- La mitad de la población de estudios será mayor que la media
- La media y la mediana coinciden en una campana de Gauss
- Tablas de probabilidad asociadas a distribución normal (examen!)
Estimación de parámetros
Estimación de parámetros
- Sentido común
- Distribución simétrica
- Teorema central del limite (ley de los grandes números): se repite un
experimento varias veces, la distribución de las medias se aproximan mucho de
una curva de gauss
- Estimación de la media:
N >= 30 (siguen una distribución normal)
Curva media es la de la población
Desviación típica es llamado erros estándar de la media
- Estimación de la media
- Estimación de la proporción:
N >= 100 (siguen una distribución normal)
Centrada en la proporción de la muestra
Erros estándar es:
Comparación de medias
Contrastes de hipótesis
Teoría Refutación
Determinista 1 fallo
Aleatorio 1 muy improbable
Regla de decisión
- 2) dx
- 3) dx = 0
- 4) +- Z . sdx
- pareadas: cada dato de la primera serie está emparejado con uno dato de la
segunda, los datos viene por pares, hay una relación previa de un dato con el
otro
- independientes: los datos no están emparejados, no hay una relación previa de
un dato con el otro
Muestras independientes
- Muestras grandes
- Muestras pequeñas
Variable normal o de gauss: dos métodos de cálculos (varianzas homogéneas
y varianzas heterogéneas)
Variable no normal
Muestras grandes
- comparación de varianzas
F exp = S12/S22 (siempre en el numerador la S mayor)
F de snedecor: depende de los números distintos de grados de libertad
- Valor crítido habitual de la F
Para decidir si las varianzas son homogéneas
En una comparación de medias: P = 0,05
Varianzas homogéneas: “aceptar” H0
Varianzas heterogéneas: rechazar H0
Varianza heterogénea
Varianza homogénea
- Distribución: t de Student
- Con s dx = raíz de (S1ˆ2/n1 + S2ˆ2/n2)
- Con grados de libertad según la corrección de Welch
BE-S4
Seminario
Cuaderno!
07/09/2019 Clase 105
Cuaderno!
- Muestras grandes
I.C. dx = dx exp +- Z . s. Dx
- Muestras pequeñas
- Si el intervalor de confianza
Incluye la H0: no se ha demostrado la diferencia
Deja fuera la H0: se ha demostrado la diferencia
Nivel de significación
- Ventajas
Reduce la variabilidad
Reduce el n necesario
- Muestra no pareada: se maneja los incrementos
- Muestras grandes (n >=30)
Media de los incrementos
n es el número de incrementos
14/10/2019 Clase 105
Objetivo:
- De estimación
Nivel de confianza
Fijar cual alfa poner en la confianza
Amplitud del intervalo (por el error estándar)
Idea de valoración
- De comparación
Depende del nivel de significación
Mitad de la amplitud de intervalo D (precisión del intervalo)
- Estimación de medias
Cuanto menor el error, mayor el n que necesito
D es el error, la precisión máxima admisible
Siempre se arredondea el decimal para un números superior, nunca inferior
- Estimación de proporciones
Si no sabemos cual es la proporción, se puede suponer que es la mitad (p =
1-p = 0,5)
- Objetivos de comparación
Erros beta grande, probabilidad nula
Seminario – Cuaderno
16/10/2019 Clase 105
D +- Zx Sd
D >= Zx Sd
D = Zx Sd
D = Zx
2Z 2 . 2. S 2
D=
n
2 S2
D=Zx
n √
S 12 S 22
S D=
√ +
n1 n 2
S2 S2
S D=
√ +
n n
2 S2
S D=
√ n
Seminario – Cuaderno
ANOVA
- Comparar las medias a través de las varianzas (dispersiones)
Cálculo de dispersionas
- Dispersion total:
- Dispersion residual: dentro de los grupos
- Dispersión factorial: entre grupos, el factor importa
- i = 1…a
- j = 1…ni
- n = ni
Dispersión total
Dispersión factorial
Distribución de F de Snédécor
ANOVA
Condiciones de aplicación
Test de Student-Bewman-Keuls
- Propiedades
Test secuencial
Diseño equilibrado
Seminario 8
Comparación de proporciones
- Procedimiento
Se cosntruye una tabla con la distribución experimental
Esa tabla se llama tabla de contigencia
Se construye una distribución teórica (independencia de los caracteres)
Se comparan entre sí
- Criterio de bondad de ajuste
Se establece la hipótesis nula (H0)
Se busca un índice (estadístico)
- Criterio de decisión
Si x2 experimental <= x2 teorica: los caracteres no está relacionados, no se
detecta que los caracteres está relacionados, no se detecta dependencia o
asociación entre ambos caracteres
Si s2 exp > x2 teorica: las diferencias entre ambas distribuciones no se
explican por azar (se rechaza la hipótesis nula H0)
- Muestras independientes
- Muestras relacionadas
Cuaderno
- Relacionar variables
- Analisar y conocer la relación entre variables cuantitativas
- Predecir
- Relacionar y predecir son objetivos distintos, pero están mucho relacionados
entre sí
- Predecir es más importante
- Una variable permite predecir cuanto vale la otra variable cuantitativa
- Estimar lo que no se conoce
- Variable imposible: el valor queremos saber en el futuro, y no ahora
- Predicción estadística
Subjetivas: predicciones practicas pero difícil que sean siempre correctas,
pueden ser aceptadas o no, es difícil saber que probabilidad tenemos de
equivocarnos
Deterministas: completamente exactas y seguras, no puedo haber
probabilidad de error
Podemos saber cuanto de error cometido, que probabilidad tenemos de
acertar
Planteamiento similar a leyes Física clásica, pero no todos somos
exactamente iguales, entonces la probabilidad no va a ser fija, y si
aproximada
Ecuaciones deterministas: leyes exactas
No deterministas: leyes aproximadas, no encontramos una ecuación que
cumpla exactamente (cuanto más datos tenemos, más fácil aproximar real de
la ley)
- Técnicas
Correlación lineal
Regresión lineal
Regresión no lineal
Correlacción
- Variables cualitativas:
- Valores cuantitativas: hay más valores
- Tipos de relaciones:
Creciente
Decreciente
Máximo en el centro
- La relación más sencilla es la lineal (línea recta)
Corrección lineal
Correlación
Inferencias en la correlación
Variables gaussianas
Regresión
Recta de Regresión
Coeficiente de determinación
- Normalidad
- Homocedasticidad
- Independencia
Métodos
- Analíticos
- Gráficos
Valores influyentes
- Detección
Analítica: índice de influencia o “leverage”
Gráfica: comparar rectas con y sin el punto
- Tratamiento
es un error de medición?
Si: cambio de conportamiento
No: cambio de comportamiento?
No se sabe: parece más fiable sin el punto
- Precaución: n >= 20 (no ocurre si el numero de datos es igual o mayor que 20)
- Rango de validez:
Cambio de comportamiento
Pérdida de precisión
Regresión no lineal
- Función no lineal
- Criterios para eligir el tipo de función
Sencillez (es recomendable que tenga pocos coeficientes)
Observación gráfica
Maximizar R2
- Cálculo con ordenador (es complicado hacer cálculos para funciones no lineales)
Seminario S9
Cuaderno
No paramétricas
2 – Ordinales
3 – Subjetivas
Signos
N = 12
Frencuencia cardiaca
1 2 3 4 5
Antes: 90, 63, 65, 87, 72, 79, 80, 46, 68, 49, 67, 82
Después: 70, 47, 78, 65, 60, 74, 68, 50 , 43, 42, 70, 66
8+ 6+
4- 6-
1 2 3 4 5
Antes: 90, 63, 65, 87, 72, 79, 80, 46, 68, 49, 67, 82
Después: 70, 47, 78, 65, 60, 74, 68, 50 , 43, 42, 70, 66
Orden: -3, -3, -4, 5, 7, -8, 12, 16, 16, 18, 22, 25
Organizar el rango:
S+ = 3 + 5 + 7 + 8,5 +8,5 + 10 + 11 + 12 = 66
S- = 1,5, 1,5, 3, 6 = 12
N ( NA 1 ) 12 .13
SeShS= = =78
2 2
n p = 0,05 p = 0,01
12 14,64 7,71
Análisis de supervivencia
Diseño de estudio
Seminario 12
*La calidad predictiva es buena o mala predice en todo sitios o no? El modelo
predice igual en todo el rango, la validez no es simular en todos los sitios y
sabemos eso con los residuos
*Si sale menor que 0,05, el residuo predice mal por la izquierda
Si sale mayor que 0,05, el residuo predice mal por la derecha
“Funnel Plot’
(Diagrama de Embudo)