Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Bivariado con
R
STATA r
Univ. Claudio Intimayta Escalante
Estudiante de Medicina Humana - UNMSM
Correo: claudiontimayta@gmail.com
➢ Objetivos de la Sesión:
▪ Identificar los pasos en el proceso para desarrollar un
análisis estadístico bivariado en investigación.
Adaptado de Hernández R y col. Metodología de la Investigación. Cap. 1. Figura 1.3. 6ta edición. Mc Graw Hill. 2014.
Adaptado de Argimon J. Metodología de la Investigación Clínica y Epidemiológica. Figura 1.1. 4ta edición. ELSEVIER. 2013.
➢ Análisis Estadístico:
▪ “Procedimiento que permite convertir los datos recolectados en un estudio en información
relevante para abordar la pregunta de investigación planteada inicialmente”
Evaluar la Calidad y
Cantidad de Datos Limpiar de Base de Datos Original
<<Codificación de VAR/ Porcentaje de Respuesta>>
Determinar el Enfoque
del Análisis Estadístico Corroborar Enfoque de Análisis con OBJ
<<Exploración, Interrelación, Explicación o Predicción>>
Establecer el Umbral
del Valor p y el
Intervalo de Confianza.
Establecer IC, umbral del Valor p y ERROR
<<Error Tipo I/II, Nivel de Significancia y Potencia Estadística>>
Seleccionar la Prueba
Estadística y Revisar
los Supuestos
DESARROLLAR EL ANÁLISIS ESTADÍSTICO
Denis D. Univariate, Bivariate, and Multivariate Statistics Using R. Wiley. 2020. ISBN: 978-1-119-54993-2
Martinez M, Sánchez-Villegas A, Toledo E, Fajardo J. Bioestadística Amigable. Capitulo 1. 4ta Edición. ELSEVIER. 2020
➢ Análisis Estadístico:
▪ “Procedimiento que permite convertir los datos recolectados en un estudio en información
relevante para abordar la pregunta de investigación planteada inicialmente”
ANÁLISIS
MULTIVARIADO
PRUEBA PRUEBA NO
VARIABLE NUMÉRICA PARAMÉTRICA PARAMÉTRICA
<<VARIABLE CUANTITATIVA>>
VARIABLES Muestras Muestras
>Continua o Discreta< EVALUADAS independientes independientes
Tendencia Central -> Media y Mediana Dos cualitativas* Prueba Z Chi2 o Fisher
Dispersión de Variable -> DE y Rango
Correlación de Correlación de
Dos cuantitativas
Pearson Spearman
VARIABLE CATEGÓRICA Cuantitativa con
T Student U de Mann Whitney
<<VARIABLE CUALITATIVA>> dicotómica
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Comparaciones de K medias. ELSEVIER. 3era Edición. 2014.
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. ANOVA Factorial. ELSEVIER. 3era Edición. 2014.
➢ Significado del Valor p:
▪ “Probabilidad de que el valor estadístico encontrado en el estudio no se deba a la azar y
que la diferencia entre las mediciones realizadas en la muestra no difieran de la población”
(Ho)
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Intervalos de Confianza y Contraste de Hipotesis. ELSEVIER. 3ra Edición. 2014.
Molina-Arias M. ¿Qué significa realmente el valor de p?. Lectura Crítica en Pequeñas Dosis. Rev Pediatr Aten Primaria. 2017;19:377-81.
➢ Intervalo de Confianza:
▪ “Rango de valores entre los que se espera encontrar un valor del estadístico que se
aproxime al parámetro en la población objetivo del estudio”
Chilipio-Chiclia M, y col. Embarazo no planificado como factor de riesgo para inicio tardío y abandono de la atención prenatal. RISMF. 2019;4(1).
Molina-Arias M. El significado de los intervalos de confianza. Lectura Crítica en Pequeñas Dosis. Rev Pediatr Aten Primaria. 2013;15:91-4.
➢ Hipótesis en Investigación:
▪ “Teoría que intenta explicar la asociación o diferencias entre variables de investigación
mediante pruebas estadísticas con estadística inferencial”
REALIDAD
Ho verdadera Ho Falsa
RESULTADOS
MartinezM, Sánchez-Villegas A, Toledo E, Fajardo J. Bioestadística Amigable. Capitulo 4.13. 4ta Edición. ELSEVIER. 2020
Biau DJ, et al. P value and the theory of hypothesis testing: an explanation for new researchers. Clin Orthop Relat Res. 2010;468(3):885-892.
¿Quién interpreta las
pruebas estadísticas?
➢ Análisis de Varianza o ANOVA:
▪ “Prueba estadística que permite evaluar si son iguales las múltiples medias <<promedios>>
entre los grupos establecidos por una variable categórica politómica”
Abtemios
¿Consumo de Alcohol?
Exbebedores Bebedores
SC Within = Ʃ s2i (ni – 1) = 42(5-1) x 3
SC Within = 192
100 cc 96 cc 89 cc
Ʃ n (X – X
98 cc 94 cc 87 cc 2
Volumen
Cerebral [CC]
94 cc 90 cc 83 cc SC Between = i i Total )
90 cc 86 cc 79 cc
96 cc 92 cc 85 cc SC Between = 310
_
Media [X] 96 cc 92 cc 85 cc
2
gl Between = k – 1 = 2
Varianza [s ] 4 4 4
100 cc 96 cc 89 cc
98 cc 94 cc 87 cc
Volumen
94 cc 90 cc 83 cc
Cerebral [CC]
90 cc 86 cc 79 cc
96 cc 92 cc 85 cc
_
Media [X] 96 cc 92 cc 85 cc
2
Varianza [s ] 4 4 4
Nro. Participantes 5 5 5
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Comparaciones de K medias. ELSEVIER. 3era Edición. 2014.
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. ANOVA Factorial. ELSEVIER. 3era Edición. 2014.
➢ Análisis de Varianza o ANOVA:
▪ “Prueba estadística que permite evaluar si son iguales las múltiples medias <<promedios>>
entre los grupos establecidos por una variable categórica politómica”
¿Consumo de Alcohol?
SUPUESTOS PARA ANOVA
Abtemios Exbebedores Bebedores • Variable Dependiente es numérica
100 cc 96 cc 89 cc
• Variable Independiente es categórica
98 cc 94 cc 87 cc • NORMALIDAD…. de Residuos
Volumen
Cerebral [CC]
94 cc 90 cc 83 cc • Homocesteicidad [Test de Bartlett]
90 cc 86 cc 79 cc
96 cc 92 cc 85 cc
_
Media [X] 96 cc 92 cc 85 cc
2
Varianza [s ] 4 4 4
Nro. Participantes 5 5 5
La Nu Ca
¿Que evalúa la prueba estadística de ANOVA?
del DEP IND NHO
H0: La media del VC es igual en los grupos
según el grado de consumo de alcohol
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Comparaciones de K medias. ELSEVIER. 3era Edición. 2014.
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. ANOVA Factorial. ELSEVIER. 3era Edición. 2014.
El caso de los participantes
del Taller de Herramientas
para Investigación
CARACTERÍSTICAS
GENERALES
- Edad y Sexo
- Año Académico
- Experiencia en INV
Igualdad
de Medias
Igualdad de
Varianzas
➢ Prueba de Kruskal-Wallis:
▪ “Prueba estadística que permite evaluar si son iguales las múltiples posiciones de las
medianas en cada grupo establecidos por una variable categórica politómica”
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Comparaciones de K medias. ELSEVIER. 3era Edición. 2014.
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. ANOVA Factorial. ELSEVIER. 3era Edición. 2014.
➢ Prueba de Kruskal-Wallis:
▪ “Prueba estadística que permite evaluar si son iguales las múltiples posiciones de las
medianas en cada grupo establecidos por una variable categórica politómica”
La Nu Ca
¿Que evalúa la prueba estadística de KW? del DEP IND NHO
H0: La media de rangos es igual en los grupos ANOMALO
según el grado de consumo de alcohol
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Comparaciones de K medias. ELSEVIER. 3era Edición. 2014.
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. ANOVA Factorial. ELSEVIER. 3era Edición. 2014.
➢ Prueba de Kruskal-Wallis:
▪ “Prueba estadística que permite evaluar si son iguales las múltiples posiciones de las
medianas en cada grupo establecidos por una variable categórica politómica”
79
¿Consumo de Alcohol?
INCONVENIENTES DE KRUSKAL
83
85
Abtemios Exbebedores Bebedores • Requiere usar todos los datos
86 7.5 4 1 • Tiene menor potencia que el ANOVA
87 10.5 7.5 2 • No permite evaluar IC directamente
89 RANGOS 12.5 9 3
90 14 10.5 5
Ʃ (R )
_ _
90
92
SUMA
15
59.5
12.5
41.5
6
17
X =Ʃ
2
ni (Ri – RTotal)
2
RTotal = i
94 N
94 Media [X] 11.9 8.7 3.4
N(N+1)/12
96 Participantes 5 5 5
96 Evaluar Diferencia de Rangos
98 ¿Que evalúa la prueba estadística de KW? acorde a los Grados de Libertad
100 H0: La media de rangos es igual en los grupos
según el grado de consumo de alcohol
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Comparaciones de K medias. ELSEVIER. 3era Edición. 2014.
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. ANOVA Factorial. ELSEVIER. 3era Edición. 2014.
KRUSKAL WALLIS
no es una Prueba
Estadística Robusta
Comparación
de Grupos
No Diferencia No Diferencia
Significativa Significativa
No Diferencia No Diferencia
Significativa Significativa
El caso de los participantes
del Taller de Herramientas
para Investigación
CARACTERÍSTICAS
GENERALES
- Edad y Sexo
- Año Académico
- Experiencia en INV
Intervención 1
Intervención 2
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Comparaciones de K medias. ELSEVIER. 3era Edición. 2014.
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. ANOVA Factorial. ELSEVIER. 3era Edición. 2014.
➢ Variables de Investigación:
▪ La naturaleza y escala de medición de una VARIABLE son las características más importantes
para describir los hallazgos de un estudio y estructurar el análisis estadístico.
<<VARIABLE CUANTITATIVA>>
VARIABLES Muestras Muestras Muestras
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Comparaciones de K medias. ELSEVIER. 3era Edición. 2014.
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. ANOVA Factorial. ELSEVIER. 3era Edición. 2014.
➢ Correlación:
▪ “Prueba estadística que permite medir la dirección y la magnitud de la asociación entre dos
variables cuantitativas donde no existe como tal una variable dependiente e independiente”
Y
Ʃ (x – nx)–(y1 – y)
Valor
_ _
Puntual Covarianza = i i = SPxy
r=0 No Correlación
n–1
r>0 Asociación Directa [ + ]
Coeficiente de
r<0 Asociación Indirecta [ - ]
SPxy
Covarianza
Correlación de =
Positiva (+)
Pearson (SPx) x (SPy)
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Comparaciones de K medias. ELSEVIER. 3era Edición. 2014.
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Correlación y Regresión Lineal. ELSEVIER. 3era Edición. 2014.
➢ Correlación:
▪ “Prueba estadística que permite medir la dirección y la magnitud de la asociación entre dos
variables cuantitativas donde no existe como tal una variable dependiente e independiente”
Y Valor
Puntual R de Pearson = SPxy
r < 0.30 Asociación Débil
(SPx) x (SPy)
0.30 < r < 0.70 Asociación Moderada
r < 0.70 Asociación Fuerte R de Pearson = Efecto
Covarianza
Positiva (+)
Ruido o Error
r=0 No Correlación
r>0 Asociación Directa [ + ]
X r<0 Asociación Indirecta [ - ]
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Comparaciones de K medias. ELSEVIER. 3era Edición. 2014.
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Correlación y Regresión Lineal. ELSEVIER. 3era Edición. 2014.
➢ Correlación:
▪ “Prueba estadística que permite medir la dirección y la magnitud de la asociación entre dos
variables cuantitativas donde no existe como tal una variable dependiente e independiente”
Y Valor SUPUESTOS PARA PEARSON
Puntual R de Pearson = Efecto
Ruido o Error • Variable Cuantitativas
• Normalidad de Ambas Variables
• Independencia de Observaciones
Covarianza
Positiva (+)
Va Cu No
X INDEPENDIENTE
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Comparaciones de K medias. ELSEVIER. 3era Edición. 2014.
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Correlación y Regresión Lineal. ELSEVIER. 3era Edición. 2014.
El caso de la asociación
entre COVID y ALTURA
COVARIANZA
Valor P de
Correlación
COVARIANZA
Valor P de
Correlación
➢ Análisis Estadístico:
▪ “Procedimiento que permite convertir los datos recolectados en un estudio en información
relevante para abordar la pregunta de investigación planteada inicialmente”
52500
50000
47500
45000
42500
40000
37500
35000
32500
30000
27500
25000
22500
20000
17500
15000
12500
10000
7500
5000
2500
0
1 2 3 4 5 6 7 8 9 1011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859
FALLECIDOS_COVID CASOS_COVID HOSPITALIZADOS_COVID
Denis D. Univariate, Bivariate, and Multivariate Statistics Using R. Wiley. 2020. ISBN: 978-1-119-54993-2
Fuente de Datos: Plataforma Nacional de Datos Abiertos. Disponible en: https://www.datosabiertos.gob.pe/
➢ Análisis Estadístico:
▪ “Procedimiento que permite convertir los datos recolectados en un estudio en información
relevante para abordar la pregunta de investigación planteada inicialmente”
5
4.5
4
3.5
3
2.5
CASOS_COVID_LOG
2
FACELLIDOS_COVID_LOG
1.5
1
0.5
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55
Denis D. Univariate, Bivariate, and Multivariate Statistics Using R. Wiley. 2020. ISBN: 978-1-119-54993-2
Fuente de Datos: Plataforma Nacional de Datos Abiertos. Disponible en: https://www.datosabiertos.gob.pe/
➢ Análisis Estadístico:
▪ “Procedimiento que permite convertir los datos recolectados en un estudio en información
relevante para abordar la pregunta de investigación planteada inicialmente”
Denis D. Univariate, Bivariate, and Multivariate Statistics Using R. Wiley. 2020. ISBN: 978-1-119-54993-2
Rojas-Bolivar D, Intimayta-Escalante C,. COVID-19 case fatality rate and tuberculosis in a metropolitan setting. J Med Virol. 2021;93(5):3273-3276.
Sociedad Ecuatoriana de Estadística. Página de FB: https://www.facebook.com/socecuest
➢ Proceso de Investigación:
Generación de la Idea Redacción de la Búsqueda Bibliográfica
de Investigación Pregunta de Investigación Efectiva de Literatura
Adaptado de Hernández R y col. Metodología de la Investigación. Cap. 1. Figura 1.3. 6ta edición. Mc Graw Hill. 2014.
Adaptado de Argimon J. Metodología de la Investigación Clínica y Epidemiológica. Figura 1.1. 4ta edición. ELSEVIER. 2013.
Adaptado de M. Center. Peer Review by FM.
¿Qué literatura nos puede ayudar
para capacitarnos en investigación?