Está en la página 1de 81

CLASE DE 28-ENE-2022 DRA KAREN

- p valor: comparaciones entre las medias de dos grupos. La hipótesis que se


compara es que el valor comparado en cada grupo sea o no sea igual
- nivel de significancia: si tiene o no tiene significancia clínica, por ejemplo del 95%
quiere decir que el 5% restante es el valor por el que se comprueba/acepta la
hipótesis.
- p: es una probabilidad y se parece al error tipo I (rechazar cuando es verdadera la
hipótesis)
- error tipo II: no rechazar cuando es falsa la hipótesis
- intervalo de confianza: digo si rechazo o no (quien es mayor o no que quien)
- correlaciones positivas: a medida que aumenta una la otra también aumenta:
ejemplo a medida que aumenta el peso aumenta la talla de la ropa
- ANOVA
- Prueba de bonferroni: normalidad
- F=Fisher
- Métodos de estimación de parámetros
- Inferencia: extrapolar, generalizar, información de la muestra a la población
- intervalos de confianza, es un método (quiere decir que es preciso y exacto) si tiene
del 95% quiere decir que el verdadero valor va a esta entre “ayb” a<?<b
- parámetros: se estiman
- pruebas de hipótesis
- análisis de datos categóricos
- ANOVA
- Regresión lineal simple/múltiple
- Los parámetros son características de la población y se representan con µ(media
poblacional), σ(desviación), σ2(varianza) (letras griegas)

*Estimación por intervalos de confianza*


-estimación: buscaremos valores próximos al verdadero valor del parámetro
-intervalos: a<?<b
-confianza: grados de confianza: 90% - 95% -99%

IC: Estadístico ± Error

Cómo interpretar la parte descriptiva de los datos y el diagrama de cajas y


bigotes.
Se estudió la variable edad a la entrada del estudio para los 149 individuos que hicieron
parte del estudio. Los valores de la edad oscilaron entre los 31 y 86 años. Además, la edad
promedio fue de 52 años con una desviación de +/- 11.7 años. El 50% de los individuos
tenían a lo más 50 años con RI ( ). El diagrama de caja y bigotes muestra la presencia de
un dato atípico hacia la derecha y la media es ligeramente mayor que la mediana por lo que
es posible que exista un ligero sesgo positivo.
CLASE 29-ENE-2022 DRA KAREN

- lo más importante es saber cual es el parámetro de interés


- en el ejemplo de que estamos trabajando es el tiempo medio/promedio
(media)
- µ(tiempo medio) a partir de
- se debe conocer cual es la distribución de los datos para saber el alfa que es
la probabilidad de un error tipo I.
x - Z (α/2) x s <µ< x + Z (α/2) x s
—----- —----
√n √n
Debe cumplir unos supuestos (requisitos)
1. Población normal
- Test de normalidad
a. (K-S)Kolmogorov-Smirnov para muestras que sean >o Igual a
30
b. (S-W)Shapiro-Wilks para muestras que sean <50

2. Varianza poblacional: se responde si o no, por lo general es desconocido


- Conocido
- Desconocido

3. Tamaño de la muestra - n>o igual a 30 GRANDE


T-STUDENT - n<30 PEQUEÑA

SPSS
Ejercicio modelo
a. x: tiempo(postoperatorio rinoplastia nueva anestesia)
b. Tipo de la variable: Cuantitativa continua
c. Análisis descriptivo
d. Análisis inferencial
Con las anestesias utilizadas ahora este tiempo medio es de 6 horas. Se
considerará que la nueva anestesia es mejor si el tiempo medio no supera las 5
horas.

- Con un 95% de confianza el tiempo medio oscila entre 3.28 horas y 5.55
horas.

Para dar validez estadística al resultado debemos comprobar los


supuestos.

Supuestos ¡Comprobar la hipótesis!

1. Población normal
- Tiempos de postoperatorio tenga una distribución normal
*Hipótesis: es una afirmación que debe ser comprobada
- Ho= Hipótesis nula: significa que el factor que yo estoy imponiendo sobre la
variable respuesta no afecta, se mantiene todo igual
- H1= Hipótesis alternativa: los tiempos no se ajustan a la distribución normal o
se ajustan a una distribución diferente de la normal. (2 formas de expresarlo)
*Dos pruebas que se enfrentan “Vs” = Ho Vs H1
- para comprobar la hipótesis se usa K-S y S-W —> p- valor (p-v)
- REGLA: Si p-v es ≤ α se rechaza la Ho
- Si no se cumple lo anterior me quedaría con la H1. Si se cumple me quedo
con la Ho y no con la H1
- Elijo la S-W porque tiene menos de 50 datos
- P valor: 0.014 (es menor a alfa 0.05) entonces se rechaza la Ho

2. Varianza poblacional desconocida, pues el enunciado no la da


3. la muestra es pequeña n<30

¿Que hacer?
recordar el gráfico que da indicios de no normalidad

-Los datos muestras asimetría positiva, sesgada a la derecha, se sugiere una


transformación logarítmica (aplicar logaritmo a los datos)
- Ho: Los LOG_tiempos se distribuyen normalmente
- H1: Los LOG_tiempos NO se distribuyen normalmente
- p-valor = 0.276 > 0.05 entonces NO SE RECHAZA la Ho, los datos no se
ajustan a una distribución diferente a la normal
-Al observar esta gráfica puedo decir que los datos son normales por su distribución
sobre la línea media

NOTA IMPORTANTE: si la distribución es no normal o diferente a la normal y la


muestra es pequeña (menos de 30 datos), debo realizar una transformación
logarítmica (si hay sesgo hacia a la derecha o asociación positiva) o exponencial
(sesgo a la izquierda o asociación negativa)
*PRUEBAS DE HIPÓTESIS*
Ejemplo
- µ: tiempo medio despierto/ µ: 3.6 segundos
- Ho: µ<o Igual 3.6
- H1: µ> 3.6 (cuando es > se llama una prueba unilateral cola de la curva
derecha)

Gráfica de cola de la curva a la derecha

*Sig es igual a Pvalor y Pvalor nunca es 0 (cero).


- Sig (bilateral): .000 = 8.9x10-18 (que se representa en los articulos como p<0.0001)
- Regla: <0.0001 < 0.5 (alfa) es verdadero o sea que rechazo la Ho
- hay un 95% de confianza que el tiempo medio sea mayor a 3.6 segundos
- Sig (bilateral) alfa medio
- Sig (unilateral) alfa completo

Libro de bioestadística: a partir de la página 75 ejercicios 4.7,4.7,4.15

Sig. bilateral: mayor que→ se divide entre 2 para distribuir igual. Mayor que es cola hacia la derecha
el resultado
menor que—> Menos que es cola hacia la izquierda el resultado
Diferente→ se usa sig. bilateral

CLASE DEL 04/FEB/2022 DRA KAREN


- Error = margen de error
- calcular el margen de error

---> El valor de la prueba (valor de la


prueba =0) 0 equivale a µ

- con un intervalo de confianza del 95%, se rechaza/no se rechaza la Ho. La


tasa metabólica media es >1300 con una significancia del 5% se rechaza la
Ho, es decir la TMM supera los 1300
- para mirar si existe evidencias significativas de dos grupos en el valor de la
prueba =0
Ho: µH - µ, =0
Ho: µH = µM
H1: µH - µM diferente 0
H1: µH diferente µM
- el valor de la prueba siempre equivale a µ
- hacer gráfico (una caja de bigotes múltiple para compar)

Ejercicio de TASA METABÓLICA


Para elegir la línea correcta de resultado en SPSS
1. probar la igualdad de varianzas: hacer una prueba de hipótesis bilateral
(bilateral porque habla de igual) = una prueba de homocedasticidad
Test de levene = prueba de levene de igualdad de varianzas

Ho: σ2 h = σ2 m
H1: σ2 h ≠ σ2 m

- las pruebas de homocedasticidad son +


2. para darle validez estadística a nuestro proceso debemos probar
normalidad

- Muestra pequeña <50 se elige Shapiro-Wilk

CLASE 05/FEB/2022 DRA KAREN

Muestras variadas/emparejadas. debo tener en cuenta con el spss que si quiero


análisis un grupo debo segmentar primero los datos (esto lo realizo con la ruta de
seleccionar datos para que solo me muestre lo que quiero analizar)- este es el
segundo punto del taller de presión arterial antes y después del tratamiento.
Análisis
1. Análisis con un IC del 99% para el ejercicio 2 del taller de presión sanguínea
antes y después del tratamiento.
- Con una confianza del 99% la diferencia de los valor de la PAS antes y
después en el grupo BIO, oscilan entre 9.41 y 10.89, indicando que
μantes tto> ¿μ Recordar que los dos extremos del IC son positivos. Lo anterior
después del tto ¿

también indica que hubo un descenso en los valores de PAS en el grupo BIO.

*p-valor: sig bilateral 1,2435E-19/2 = <0.00001


2. Análisis de p-valor <0.00001 y este a su vez es <0.01. Con una significancia del
1% se rechaza la hipótesis nula, es decir la media de la PAS antes del tratamiento
es mayor que la media de la PAS después del tratamiento, indicando que hubo un
descenso del valor de PAS en el grupo BIO después del tratamiento.
3. Prueba de normalidad para las diferencias (datos emparejados)- calcular las
diferencias en el spss
Ho: los datos de la diferencia de PAS en el grupo BIO se distribuyen normalmente
H1: los datos de la diferencia de PAS en el grupo BIO NO se distribuyen
normalmente
- Con una significancia del 1% los datos de la diferencia de la PAS en el
grupo BIO se distribuyen normalmente

IMPORTANTE: Si estoy comparando 2 grupos, es comparación de


muestras independientes y si es de 1 solo comparando el antes y el
después, es comparación de muestras emparejadas.
IMPORTANTE: Cuando los límites superior e inferior tienen el mismo
signos ya sea + o sea - se considera que hay diferencias estadísticamente
significativas, por el contrario si un limite es + y el otro límite es - (o
visceversa) se considera que no hay diferencias estadísticamente
significativas.
CLASE 11-FEB-2022 DRA KAREN

Exposición Juan Jose y Manuel. 2:30-4PM


- Comparación de proporciones
- siempre el análisis de interés que estamos buscando debe llevar el
número 1 y su complemento otro número
- con una confianza del 95%, la proporción de los vacunados en la
población es de 47% a 64%
Dr Luis Ángel Anillo 4:30-6:30 pm
Si tengo variables categóricas: proporciones
Si tengo una variable categórica y una cuantitativa: medias
Los parámetros se estiman, los estadísticos se calculan.
Parámetros principales: media poblacional, proporción y varianza.
Diferencia de proporciones:
1. Con una población
Podría hacer IC o pruebas de hipótesis
Ej: efectos adversos en una vacuna
2. Con 2 poblaciones
Ej: efectos adversos en 2 vacunas.
Prueba Chi cuadrado: nos sirve para datos homogéneos o independientes
para datos categóricos.

Moderna Pfizer Total


con evento 8 3 11
sin evento 92 97 189
total 100 100 200
Si existe el IC para la diferencia de proporciones, pero no se usa con
frecuencia, tenemos el chi cuadrado.
El Chi cuadrado es una extensión que se usa para 2 funciones: pruebas de
homogeneidad (igualdad de proporciones) y de independencia.

Cómo introducir datos para tablas cruzadas y chi cuadrado en SPSS sin
tener base de datos.
Chi cuadrado: es una distribución de probabilidad, a diferencia de las
otras es asimétrica y trabaja con grados de libertad. Es una curva sesgada
hacia la derecha. Se calcula con base a: observado - esperado / esperado.
12-feb-2022 Dra. Karen
ANOVA
*análisis de la varianza
Anova de una vía: factor de efecto FIJO y tres niveles
- 3 o más poblaciones (sinovac, azt, pfizer)
- Ho: μs = μa = μp…= μj
- H1: al menos una μj es diferente
- Siempre voy a observar una variable cuantitativa junto a una cualitativa
llamada factor dividida en grupos.
- si el factor influye en Y -> las medias van a ser diferentes
- si el favor no influye en Y -> las medias van a ser iguales
- media = es el valor esperado
- HSD turkey (tabla) divide en subconjunto para alfa en 2 columnas, la columna
1 muestra los que no tienen diferencias estadísticamente significativas y en la
columna 2 muestra los que tienen diferencias estadísticamente significativas
Y: niveles de hematocrito
Factor: severidad fibrosis
niveles: ausencia, leve, moderado, importante
*Interpretación de la prueba de normalidad
- generalmente se usa *se basa en la media*
- la mediana se usa cuando hay muchos datos atípicos
- en este caso todos los Sig. el valor a α entonces se asume que las
varianzas son iguales
- poblaciones normales con varianzas iguales (homogeneas), muestras
independientes entonces es válido hacer ANOVA
Ho: el nivel medio de hematocrito en todos los grupos es igual
H1: al menos un nivel de hematocrito es diferente
Interpretación->
Se asume que el valor de hematocrito son iguales en todos los grupos/ no existe
diferencias estadísticamente significativas entre los niveles medios de hematocrito
en los diferentes grupos

CLASE DEL 18-FEB-2022 Dra. Karen


Ho: los datos tienen distribución normal
H1: los datos no tienen distribución normal

p>0.05, los datos tienen distribución normal en todas las poblaciones

p>0.05, tiene varianzas iguales

Ho: todos los fármacos son igualmente de efectivos


H1: al menos un fármaco es diferente

p<0.05 se asume al menos un fármaco es diferente


- con la tabla anterior comparo los límites superior y límites superior y pongo ojo al
signos (+/-)

- los valores que se observan en las columnas indican los niveles de triglicéridos
medios

Taller Anova

Supuestos para realizar un ANOVA:


1. Distribución de datos normal
2. Igualdad de varianzas

1)Analiza las condiciones del diseño y de las distribuciones poblacionales y elige


razonadamente la técnica estadística adecuada para comparar los fármacos.

R/ Técnica ANOVA.

2) Con la técnica estadística que hayas seleccionado en el apartado anterior


investiga si hay diferencias entre los resultados de los distintos fármacos y, en caso
de haberla, establece los grupos de fármacos homogéneos.

H0: μ placebo = en todos los grupos de tratamiento


H1: Al menos 1 grupos de tratamiento es diferente
Teniendo una muestra de 28 datos, para la prueba de normalidad se utilizó Shapiro-Wilk.
Los datos de la media de triglicéridos para todos los grupos de tratamiento tienen un p valor
de la prueba es > 0,05 por lo que no se rechaza la H0, por tanto los datos presentan una
distribución normal.

Prueba de igualdad de varianzas (Homocedasticidad)


Test de Levene
H0: Se asumen varianzas iguales
H1: No se asumen varianzas iguales

P valor = 0,361
Con una significancia de 5% no se rechaza la H0 por lo tanto, se asumen varianzas iguales.

H0: μ placebo = en todos los grupos de tratamiento


H1: Al menos 1 grupos de tratamiento es diferente

Se asume que el valor medio de triglicéridos es diferente en al menos 1 grupo de los


tratamientos ya que el p valor es <0,05.

3)Teniendo en cuenta tus conclusiones en el apartado anterior, trata de contestar


razonadamente a las siguientes preguntas: aa)) ¿Es útil administrar algún fármaco o
es indiferente dar el placebo? bb)) ¿Crees que merece la pena duplicar la dosis del
fármaco? cc)) ¿Recomendarías algún fármaco en particular?

a)Si es útil administrar algún fármaco, ya que es diferente al placebo.

b)Merece la pena únicamente duplicar la dosis de niacina ya que no se solapa con la dosis
de niacina normal. De resto, los otros fármacos con dosis normal y doble se solapan entre sí

PRUEBA KRUSKAL-WALLIS
se realiza cuando no se dan los supuestos para la realización de una prueba ANOVA. Se
deben tener en cuenta:
1. Varianzas iguales
2. La distribución no es normal, pero si debe ser simétrica hacia un lado.
PRUEBA DE WELCH
Distribución normal, pero sin igualdad de varianzas. Es todo lo contrario a
Kruskall Wallis.
- la distribución debe ser normal
- ruta en spss: analizar, comparar medias, ANOVA de un factor
- opciones se escoge la prueba de welch y homogeneidad de varianzas
- post hoc: no se asume igualdad de varianzas y marco c de dunnett (o
cualquiera de las pruebas que aparecen)

CLASE 19-FEB-2022 DRA. KAREN

PRUEBA DE U DE MANN-WHITNEY
- prueba no paramétrica para muestras independientes
- cuando comparo una variable cuantitativa continua o discreta con muchos
valores con una cualitativa dicotómica.
- no se ve afectada por valores atípicos
- si la media representa exactitud me voy con paramétrica
- si la mediana representa mejor el centro de la distribución me voy con una
prueba no paramétrica
- supuestos
1. que las dos muestras n y m se utilizan para el análisis se han extraído
independiente al azar de sus poblaciones
2. la escala de medición es por lo menos ordinal
3. si las poblaciones son diferentes, difieren en lo que respecta sus
medianas
4. Que no tengan una distribución normal, es decir que el valor p de
kolmogorov o shapiro sea menor al alfa.
Ejercicio base de datos pulmón SPSS

- en los datos así sea que un solo grupo que no tenga distribución normal,
realizo una prueba no paramétrica
Ho: mediana prolongada ≤ mediana leve
H1: mediana prolonga > mediana leve
PRUEBA DE WILCOXON
- Prueba no paramétrica análoga a la U de Mann Whitney para muestras
emparejadas.

No se incluye Kruskall Wallis en la imagen debido a que se usa para más de 2


muestras. (ANOVA)

Hipotesis para muestras pareadas


Ho: la mediana de las diferencias es igual a cero
H1: la mediana de la diferencia es diferente de cero
T= se sugiere que se use el valor T más pequeño
PRUEBA CHI CUADRADO MUESTRAS INDEPENDIENTES
Ho: glucosa independiente a dm
H1: glucosa dependiente de dm

- se comparan los porcentajes


- Ho: habla siempre de independencia
- H1: me habla de dependencia siempre
- esta no explica causalidad
- esta si explica si hay relación o no hay relación

regresión lineal simple


- Y: variable respuesta /variable dependiente
- X: variable explicativa /variable predictora/ variable independiente
- Y-X: son variables cuantitativas
1. exploratorio
- gráfico de dispersión: relaciono valor de X con los valores de Y

correlación: coeficiente de correlación de Pearson


Y = Bo + B1X + e
Y: variable respuesta
Bo: intercepto
B: pendiente
X: variable independiente
- a un ratón que se le suministró 2.5 gr de anfetamina se espera que consuma
76,6 gr de comida
- rangos de predicción: la variable independiente la maneja/define el
investigador
- es un modelo estadístico más sencillo para comparar dos
variables cuantitativas: Correlación lineal simple
ÍNDICE DE PEARSON
- Correlación: correlación lineal de pearson: sirve para mirar el grado de
relación 1 ≤ R ≤ 1 se divide en:
*leve 0 - 0.5
*moderada 0.5- 0.7
*fuerte 0.7- 0.9
*Perfecta: 1
*ausencia de correlación: 0
-1_____________o________________1
- la gráfica nos muestra que hay una posible correlación lineal positiva a
medida que aumenta la IMC aumenta el peso del paciente
para dar más soporte estadístico puedo hablar del coeficiente de correlación
- se observa en el gráfico una correlación positiva fuerte (coeficiente de
pearson=0.97) entre las variables relacionadas
- de acuerdo a la ecuación de la recta estimada
y= -8.36 + 1.22.x
- por cada kg de masa corporal magra el peso se ve aumentado en 1,22
kg aproximadamente.
- El R 2 indica que el 94.1% de la variabilidad del peso en kg, se ve
explicado por el la masa corporal magra en kg.
- El modelo de regresión lineal explica en un 94,1% la relación entre las
variables peso y masa corporal magra en kg.
- En la tabla podemos observar que el coeficiente de correlación entre IMC y
peso es de 0,97 e indica una correlación positiva fuerte

Ho: el coeficiente de correlación de pearson es = 0 (ausencia de correlación)


H1: el coeficiente de correlación de pearson es ≠ 0 (presencia de correlación)
p-valor es < que cualquier α entonce se rechaza la Ho y el modelo lineal es
adecuado
- Como p-valor < 0,05% entonces rechazo la Ho, quiero decir que el coeficiente de
correlación de pearson es ≠ 0 lo que indica presencia de correlación entre IMC y peso
y el modelo lineal simple es adecuado
- constante: pendiente = -8.357
- masa corporal magra: intercepto = 1.217

También podría gustarte