Está en la página 1de 35

Análisis Estadístico

Bivariado con
R

STATA r
Univ. Claudio Intimayta Escalante
Estudiante de Medicina Humana - UNMSM
Correo: claudiontimayta@gmail.com
➢ Objetivos de la Sesión:
▪ Identificar los pasos en el proceso para desarrollar un
análisis estadístico bivariado en investigación.

▪ Describir las principales características de las pruebas


estadísticas bivariadas para comparar medias.

▪ Proporcionar algunas pautas para seleccionar algunas


pruebas estadísticas de correlación.

PONENCIA: Análisis Estadístico Bivariado con STATA


➢ Proceso de Investigación:
Generación de la Idea Redacción de la Búsqueda Bibliográfica
de Investigación Pregunta de Investigación Efectiva de Literatura

Medición de Var. Diseño Metodológico del Planteamiento del


en la Población Estudio de Investigación Problema de Investigación
(Antecedentes, Justificación, Marco Teórico)

Análisis Estad. Redacción Efectiva de Publicación de Artículo


de los Datos Artículos Científicos en Revistas Científicas

Adaptado de Hernández R y col. Metodología de la Investigación. Cap. 1. Figura 1.3. 6ta edición. Mc Graw Hill. 2014.
Adaptado de Argimon J. Metodología de la Investigación Clínica y Epidemiológica. Figura 1.1. 4ta edición. ELSEVIER. 2013.
➢ Análisis Estadístico:
▪ “Procedimiento que permite convertir los datos recolectados en un estudio en información
relevante para abordar la pregunta de investigación planteada inicialmente”

Evaluar la Calidad y
Cantidad de Datos Limpiar de Base de Datos Original
<<Codificación de VAR/ Porcentaje de Respuesta>>

Determinar el Enfoque
del Análisis Estadístico Corroborar Enfoque de Análisis con OBJ
<<Exploración, Interrelación, Explicación o Predicción>>
Establecer el Umbral
del Valor p y el
Intervalo de Confianza.
Establecer IC, umbral del Valor p y ERROR
<<Error Tipo I/II, Nivel de Significancia y Potencia Estadística>>

Seleccionar la Prueba
Estadística y Revisar
los Supuestos
DESARROLLAR EL ANÁLISIS ESTADÍSTICO

Denis D. Univariate, Bivariate, and Multivariate Statistics Using R. Wiley. 2020. ISBN: 978-1-119-54993-2
Martinez M, Sánchez-Villegas A, Toledo E, Fajardo J. Bioestadística Amigable. Capitulo 1. 4ta Edición. ELSEVIER. 2020
➢ Análisis Estadístico:
▪ “Procedimiento que permite convertir los datos recolectados en un estudio en información
relevante para abordar la pregunta de investigación planteada inicialmente”

ANÁLISIS
MULTIVARIADO

SOLO VARIABLES ¿Se comprueba


ANÁLISIS ASOCIADAS?
nuestra hipótesis?
BIVARIADO
MEDICIÓN DE
ANÁLISIS NORMALIDAD? VARIABLE
DESENLACE?
¿Valor p significativo?
UNIVARIADO
HIPÓTESIS
MEDIDAS ESTADÍSTICA? CONFUSORES? ¿Amplitud de Intervalo
DE RESUMEN
MUESTRA? de Confianza (IC)?
(Describir) (Comparar) (Asociar)
Denis D. Univariate, Bivariate, and Multivariate Statistics Using R. Wiley. 2020. ISBN: 978-1-119-54993-2
March T. 4 Types of Data Analysis for Educators. 2020. Disponible en: https://bit.ly/3ka7XS0
➢ Variables de Investigación:
▪ La naturaleza y escala de medición de una VARIABLE son las características más importantes
para describir los hallazgos de un estudio y estructurar el análisis estadístico.

¿Qué prueba estadística es la mejor para


TIPOS DE VARIABLES nuestras variables de investigación?

PRUEBA PRUEBA NO
VARIABLE NUMÉRICA PARAMÉTRICA PARAMÉTRICA
<<VARIABLE CUANTITATIVA>>
VARIABLES Muestras Muestras
>Continua o Discreta< EVALUADAS independientes independientes

Tendencia Central -> Media y Mediana Dos cualitativas* Prueba Z Chi2 o Fisher
Dispersión de Variable -> DE y Rango
Correlación de Correlación de
Dos cuantitativas
Pearson Spearman
VARIABLE CATEGÓRICA Cuantitativa con
T Student U de Mann Whitney
<<VARIABLE CUALITATIVA>> dicotómica

>Nominal u Ordinal< Cuantitativa con


politómica
ANOVA H de Kruskal Wallis
Frecuencia -> Frecuencias y Proporciones
<<Expresión en Porcentaje>> *Las variables cualitativas no se rigen por la evaluación paramétrica

Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Comparaciones de K medias. ELSEVIER. 3era Edición. 2014.
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. ANOVA Factorial. ELSEVIER. 3era Edición. 2014.
➢ Significado del Valor p:
▪ “Probabilidad de que el valor estadístico encontrado en el estudio no se deba a la azar y
que la diferencia entre las mediciones realizadas en la muestra no difieran de la población”

(Ho)

No solo importa que el


(H1) valor p sea menor que 0.05
| | <<Fisher y la definición de un evento inusual>>
0.05 0

Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Intervalos de Confianza y Contraste de Hipotesis. ELSEVIER. 3ra Edición. 2014.
Molina-Arias M. ¿Qué significa realmente el valor de p?. Lectura Crítica en Pequeñas Dosis. Rev Pediatr Aten Primaria. 2017;19:377-81.
➢ Intervalo de Confianza:
▪ “Rango de valores entre los que se espera encontrar un valor del estadístico que se
aproxime al parámetro en la población objetivo del estudio”

Chilipio-Chiclia M, y col. Embarazo no planificado como factor de riesgo para inicio tardío y abandono de la atención prenatal. RISMF. 2019;4(1).
Molina-Arias M. El significado de los intervalos de confianza. Lectura Crítica en Pequeñas Dosis. Rev Pediatr Aten Primaria. 2013;15:91-4.
➢ Hipótesis en Investigación:
▪ “Teoría que intenta explicar la asociación o diferencias entre variables de investigación
mediante pruebas estadísticas con estadística inferencial”

Hipótesis ▪ H1.- Teoría que postula el investigador para explicar la


asociación o diferencias entre variables que se busca estudiar.
Estadística ▪ H0.- Negación de aquella teoría que plantea el investigador.

REALIDAD

Ho verdadera Ho Falsa
RESULTADOS

Rechaza Ho Error Tipo I (α=0.05) Poder (0.80)

No Rechazar No 1 – 0.05 = 0.95 Error Tipo II (β=0.20)

MartinezM, Sánchez-Villegas A, Toledo E, Fajardo J. Bioestadística Amigable. Capitulo 4.13. 4ta Edición. ELSEVIER. 2020
Biau DJ, et al. P value and the theory of hypothesis testing: an explanation for new researchers. Clin Orthop Relat Res. 2010;468(3):885-892.
¿Quién interpreta las
pruebas estadísticas?
➢ Análisis de Varianza o ANOVA:
▪ “Prueba estadística que permite evaluar si son iguales las múltiples medias <<promedios>>
entre los grupos establecidos por una variable categórica politómica”

Abtemios
¿Consumo de Alcohol?

Exbebedores Bebedores
SC Within = Ʃ s2i (ni – 1) = 42(5-1) x 3
SC Within = 192
100 cc 96 cc 89 cc

Ʃ n (X – X
98 cc 94 cc 87 cc 2
Volumen
Cerebral [CC]
94 cc 90 cc 83 cc SC Between = i i Total )
90 cc 86 cc 79 cc
96 cc 92 cc 85 cc SC Between = 310
_
Media [X] 96 cc 92 cc 85 cc
2
gl Between = k – 1 = 2
Varianza [s ] 4 4 4

Nro. Participantes 5 5 5 gl Within = N – k = 12


¿Que evalúa la prueba estadística de ANOVA? 2
H0: La media del VC es igual en los grupos FK – 1, N - k = S Between = 310 / 2 = 9.7
según el grado de consumo de alcohol S2Within = 192 / 12
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Comparaciones de K medias. ELSEVIER. 3era Edición. 2014.
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. ANOVA Factorial. ELSEVIER. 3era Edición. 2014.
➢ Análisis de Varianza o ANOVA:
▪ “Prueba estadística que permite evaluar si son iguales las múltiples medias <<promedios>>
entre los grupos establecidos por una variable categórica politómica”

¿Consumo de Alcohol? GRÁFICO DE CAJAS Y BIGOTES


Abtemios Exbebedores Bebedores

100 cc 96 cc 89 cc
98 cc 94 cc 87 cc
Volumen
94 cc 90 cc 83 cc
Cerebral [CC]
90 cc 86 cc 79 cc
96 cc 92 cc 85 cc
_
Media [X] 96 cc 92 cc 85 cc
2
Varianza [s ] 4 4 4

Nro. Participantes 5 5 5

¿Que evalúa la prueba estadística de ANOVA?


H0: La media del VC es igual en los grupos >> Categorías de los Grupos <<
según el grado de consumo de alcohol

Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Comparaciones de K medias. ELSEVIER. 3era Edición. 2014.
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. ANOVA Factorial. ELSEVIER. 3era Edición. 2014.
➢ Análisis de Varianza o ANOVA:
▪ “Prueba estadística que permite evaluar si son iguales las múltiples medias <<promedios>>
entre los grupos establecidos por una variable categórica politómica”

¿Consumo de Alcohol?
SUPUESTOS PARA ANOVA
Abtemios Exbebedores Bebedores • Variable Dependiente es numérica
100 cc 96 cc 89 cc
• Variable Independiente es categórica
98 cc 94 cc 87 cc • NORMALIDAD…. de Residuos
Volumen
Cerebral [CC]
94 cc 90 cc 83 cc • Homocesteicidad [Test de Bartlett]
90 cc 86 cc 79 cc
96 cc 92 cc 85 cc
_
Media [X] 96 cc 92 cc 85 cc
2
Varianza [s ] 4 4 4

Nro. Participantes 5 5 5
La Nu Ca
¿Que evalúa la prueba estadística de ANOVA?
del DEP IND NHO
H0: La media del VC es igual en los grupos
según el grado de consumo de alcohol

Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Comparaciones de K medias. ELSEVIER. 3era Edición. 2014.
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. ANOVA Factorial. ELSEVIER. 3era Edición. 2014.
El caso de los participantes
del Taller de Herramientas
para Investigación
CARACTERÍSTICAS
GENERALES
- Edad y Sexo
- Año Académico
- Experiencia en INV

Malo Regular Bueno Excelente


NOTA
10 20 30

Datos y Do File: https://cutt.ly/RnYJ0zw


ANOVA es una
Prueba de Análisis
Estadístico Robusta

Igualdad
de Medias

Igualdad de
Varianzas
➢ Prueba de Kruskal-Wallis:
▪ “Prueba estadística que permite evaluar si son iguales las múltiples posiciones de las
medianas en cada grupo establecidos por una variable categórica politómica”

SUPUESTOS PARA ANOVA


• Variable Dependiente es numérica
• Variable Independiente es categórica
• NORMALIDAD…. de Residuos
• Homocesteicidad [Test de Bartlett]

SUPUESTOS PARA KRUSKAL


• Variable Dependiente es numérica
• Variable Independiente es categórica
¿Que evalúa la prueba estadística de KW? • ANORMALIDAD…. de Residuos
H0: La media de rangos es igual en los grupos • Heterocesteicidad [Varianza Heterog.]
según el grado de consumo de alcohol

Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Comparaciones de K medias. ELSEVIER. 3era Edición. 2014.
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. ANOVA Factorial. ELSEVIER. 3era Edición. 2014.
➢ Prueba de Kruskal-Wallis:
▪ “Prueba estadística que permite evaluar si son iguales las múltiples posiciones de las
medianas en cada grupo establecidos por una variable categórica politómica”

SUPUESTOS PARA KRUSKAL


• Variable Dependiente es numérica
• Variable Independiente es categórica
• ANORMALIDAD…. de Residuos
• Heterocesteicidad [Varianza Heterog.]

La Nu Ca
¿Que evalúa la prueba estadística de KW? del DEP IND NHO
H0: La media de rangos es igual en los grupos ANOMALO
según el grado de consumo de alcohol

Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Comparaciones de K medias. ELSEVIER. 3era Edición. 2014.
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. ANOVA Factorial. ELSEVIER. 3era Edición. 2014.
➢ Prueba de Kruskal-Wallis:
▪ “Prueba estadística que permite evaluar si son iguales las múltiples posiciones de las
medianas en cada grupo establecidos por una variable categórica politómica”

79
¿Consumo de Alcohol?
INCONVENIENTES DE KRUSKAL
83
85
Abtemios Exbebedores Bebedores • Requiere usar todos los datos
86 7.5 4 1 • Tiene menor potencia que el ANOVA
87 10.5 7.5 2 • No permite evaluar IC directamente
89 RANGOS 12.5 9 3
90 14 10.5 5

Ʃ (R )
_ _
90
92
SUMA
15

59.5
12.5

41.5
6

17
X =Ʃ
2
ni (Ri – RTotal)
2
RTotal = i

94 N
94 Media [X] 11.9 8.7 3.4
N(N+1)/12
96 Participantes 5 5 5
96 Evaluar Diferencia de Rangos
98 ¿Que evalúa la prueba estadística de KW? acorde a los Grados de Libertad
100 H0: La media de rangos es igual en los grupos
según el grado de consumo de alcohol

Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Comparaciones de K medias. ELSEVIER. 3era Edición. 2014.
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. ANOVA Factorial. ELSEVIER. 3era Edición. 2014.
KRUSKAL WALLIS
no es una Prueba
Estadística Robusta

Comparación
de Grupos

No Diferencia No Diferencia
Significativa Significativa

No Diferencia No Diferencia
Significativa Significativa
El caso de los participantes
del Taller de Herramientas
para Investigación
CARACTERÍSTICAS
GENERALES
- Edad y Sexo
- Año Académico
- Experiencia en INV

Malo Regular Bueno Excelente


NOTA
10 20 30

Datos y Do File: https://cutt.ly/RnYJ0zw


➢ Prueba para comparar múltiples Medias:
▪ “Pruebas estadísticas que permite evaluar si son iguales las múltiples medias en cada grupo
establecidos por una variable categórica politómica”

Intervención 1

Intervención 2

Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Comparaciones de K medias. ELSEVIER. 3era Edición. 2014.
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. ANOVA Factorial. ELSEVIER. 3era Edición. 2014.
➢ Variables de Investigación:
▪ La naturaleza y escala de medición de una VARIABLE son las características más importantes
para describir los hallazgos de un estudio y estructurar el análisis estadístico.

¿Qué prueba estadística es la mejor para


TIPOS DE VARIABLES nuestras variables de investigación?
PRUEBA
VARIABLE NUMÉRICA PARAMÉTRICA
PRUEBA NO PARAMÉTRICA

<<VARIABLE CUANTITATIVA>>
VARIABLES Muestras Muestras Muestras

>Continua o Discreta< EVALUADAS independientes independientes dependientes

Tendencia Central -> Media y Mediana C Nemar o


Dos cualitativas* Prueba Z Chi2 o Fisher
Dispersión de Variable -> DE y Rango Q de Cochran
Correlación de Correlación de
Dos cuantitativas Tau de Kendall
Pearson Spearman

VARIABLE CATEGÓRICA Cuantitativa con


T Student
U de Mann
Wilcoxon
<<VARIABLE CUALITATIVA>> dicotómica Whitney
Cuantitativa con H de Kruskal
>Nominal u Ordinal< politómica
ANOVA
Wallis
Friedman
Frecuencia -> Frecuencias y Proporciones
*Las variables cualitativas no se rigen por la evaluación paramétrica
<<Expresión en Porcentaje>>

Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Comparaciones de K medias. ELSEVIER. 3era Edición. 2014.
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. ANOVA Factorial. ELSEVIER. 3era Edición. 2014.
➢ Correlación:
▪ “Prueba estadística que permite medir la dirección y la magnitud de la asociación entre dos
variables cuantitativas donde no existe como tal una variable dependiente e independiente”
Y
Ʃ (x – nx)–(y1 – y)
Valor
_ _
Puntual Covarianza = i i = SPxy
r=0 No Correlación
n–1
r>0 Asociación Directa [ + ]
Coeficiente de
r<0 Asociación Indirecta [ - ]
SPxy
Covarianza
Correlación de =
Positiva (+)
Pearson (SPx) x (SPy)

Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Comparaciones de K medias. ELSEVIER. 3era Edición. 2014.
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Correlación y Regresión Lineal. ELSEVIER. 3era Edición. 2014.
➢ Correlación:
▪ “Prueba estadística que permite medir la dirección y la magnitud de la asociación entre dos
variables cuantitativas donde no existe como tal una variable dependiente e independiente”
Y Valor
Puntual R de Pearson = SPxy
r < 0.30 Asociación Débil
(SPx) x (SPy)
0.30 < r < 0.70 Asociación Moderada
r < 0.70 Asociación Fuerte R de Pearson = Efecto
Covarianza
Positiva (+)
Ruido o Error

r=0 No Correlación
r>0 Asociación Directa [ + ]
X r<0 Asociación Indirecta [ - ]

Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Comparaciones de K medias. ELSEVIER. 3era Edición. 2014.
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Correlación y Regresión Lineal. ELSEVIER. 3era Edición. 2014.
➢ Correlación:
▪ “Prueba estadística que permite medir la dirección y la magnitud de la asociación entre dos
variables cuantitativas donde no existe como tal una variable dependiente e independiente”
Y Valor SUPUESTOS PARA PEARSON
Puntual R de Pearson = Efecto
Ruido o Error • Variable Cuantitativas
• Normalidad de Ambas Variables
• Independencia de Observaciones
Covarianza
Positiva (+)

Va Cu No
X INDEPENDIENTE

Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Comparaciones de K medias. ELSEVIER. 3era Edición. 2014.
Martínez M, Sánchez A, Toledo E, Faulin J. Bioestadística Amigable. Correlación y Regresión Lineal. ELSEVIER. 3era Edición. 2014.
El caso de la asociación
entre COVID y ALTURA

▪ Prevalencia: Nro. Casos en la Población = 103.50 casos x 10000 hab.


<< Frecuencia >>
Nro. de Habitantes en la
Población en General

▪ Letalidad: Nro. Muertes en Contagiados = 10.50 casos x 10000 hab.


<< Case Fatality Rate >>
Nro. de Contagiados en la
Población de Estudio

Datos y Do File: https://cutt.ly/WnYJ8l0


Análisis de Correlación Gráfica
Las variables de conteo
difícilmente tienen una
distribución normal

COVARIANZA

Valor P de
Correlación

COVARIANZA

Valor P de
Correlación
➢ Análisis Estadístico:
▪ “Procedimiento que permite convertir los datos recolectados en un estudio en información
relevante para abordar la pregunta de investigación planteada inicialmente”

52500
50000
47500
45000
42500
40000
37500
35000
32500
30000
27500
25000
22500
20000
17500
15000
12500
10000
7500
5000
2500
0
1 2 3 4 5 6 7 8 9 1011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859
FALLECIDOS_COVID CASOS_COVID HOSPITALIZADOS_COVID

Denis D. Univariate, Bivariate, and Multivariate Statistics Using R. Wiley. 2020. ISBN: 978-1-119-54993-2
Fuente de Datos: Plataforma Nacional de Datos Abiertos. Disponible en: https://www.datosabiertos.gob.pe/
➢ Análisis Estadístico:
▪ “Procedimiento que permite convertir los datos recolectados en un estudio en información
relevante para abordar la pregunta de investigación planteada inicialmente”

5
4.5
4
3.5
3
2.5
CASOS_COVID_LOG
2
FACELLIDOS_COVID_LOG
1.5
1
0.5
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55

Denis D. Univariate, Bivariate, and Multivariate Statistics Using R. Wiley. 2020. ISBN: 978-1-119-54993-2
Fuente de Datos: Plataforma Nacional de Datos Abiertos. Disponible en: https://www.datosabiertos.gob.pe/
➢ Análisis Estadístico:
▪ “Procedimiento que permite convertir los datos recolectados en un estudio en información
relevante para abordar la pregunta de investigación planteada inicialmente”

Denis D. Univariate, Bivariate, and Multivariate Statistics Using R. Wiley. 2020. ISBN: 978-1-119-54993-2
Rojas-Bolivar D, Intimayta-Escalante C,. COVID-19 case fatality rate and tuberculosis in a metropolitan setting. J Med Virol. 2021;93(5):3273-3276.
Sociedad Ecuatoriana de Estadística. Página de FB: https://www.facebook.com/socecuest
➢ Proceso de Investigación:
Generación de la Idea Redacción de la Búsqueda Bibliográfica
de Investigación Pregunta de Investigación Efectiva de Literatura

Medición de Var. Diseño Metodológico del Planteamiento del


en la Población Estudio de Investigación Problema de Investigación
(Antecedentes, Justificación, Marco Teórico)

Análisis Estad. Redacción Efectiva de Publicación de Artículo


de los Datos Artículos Científicos en Revistas Científicas

Adaptado de Hernández R y col. Metodología de la Investigación. Cap. 1. Figura 1.3. 6ta edición. Mc Graw Hill. 2014.
Adaptado de Argimon J. Metodología de la Investigación Clínica y Epidemiológica. Figura 1.1. 4ta edición. ELSEVIER. 2013.
Adaptado de M. Center. Peer Review by FM.
¿Qué literatura nos puede ayudar
para capacitarnos en investigación?

Todos los derechos reservados a la casa editorial ELSEVIER.


GRACIAS!!!
Análisis Estadístico
Bivariado con
STATAa
Univ. Claudio Intimayta Escalante
Estudiante de Medicina Humana - UNMSM
Correo: claudiontimayta@gmail.com

También podría gustarte