Está en la página 1de 54

CURSO TALLER: HERRAMIENTAS

ESTADISTICA PARA LA EVALUACION


DE INDICADORES
EPIDEMIOLÓGICOS EN SALUD

Mg. Wilmer Fuentes Neira


Data Scientist
sirwilpi@gmail.com
Esto lo que quiero decir. Vea Ud. si lo
puede probar con estadística.
Several informal definitions are offered in the book
A Career in Statistics: Beyond the Numbers by Gerald
Hahn and Necip Doganaksoy:

 The science of learning from (or making


sense out of) data
 The theory and methods of extracting
information from observational data for
solving real-world problems
 The science of uncertainty
 The quintessential interdisciplinary science
 The art of telling a story with [numerical] data

http://www.worldofstatistics.org 4
t ic a
d
r S a lu
sta d ís
• Elaboración de políticas
Sect o

• Investigación científica
E
de la

• Toma de decisiones
en el
U so s

Lic. Luis Infantes Oblitas


COESPE Nº 421
ud
Proveer información continua sobre la

l
en Sa producción de servicios de salud y la
morbimortalidad; mediante las acciones de
registro, control de calidad, procesamiento
ística

y consolidación de las actividades de


recuperación y preventivo promocionales.
Estad
Las personas mas importante del
Sistema de Información en Salud, son
los Profesionales y no Profesionales
responsables del llenado de los registros
hospitalarios.

Estos son los insumos que los


estadísticos necesitan para
transformarlos en información.

Lic. Luis Infantes Oblitas


COESPE Nº 421
de Da s
Población Estimada

tos
uente
POB

Registro Nacional Establecimientos


RENAES PERS Información de Recursos Humanos
ales F

Nacimientos
NAC DEF Defunciones

Consulta Externa
ip

Atención por Discapacidad


HIS HIS DIS EGRESO EMERG
Egresos Hospitalarios
Princ

Emergencia
Inmunizaciones
SALUD SALUD Salud Sexual y Reproductiva
INMUN METAX
SEXUAL MENTAL Salud Mental
Enfermedades Metaxénicas
11

METO
DOS
ESTA
DIST
IC

OS
 Se ada
camp ptan méto
o de dos y
 Epidem aplicación” según el
de Ca iologia, G
lidad estión
Plane , Data S , Sist
amie
nto E cience, emas
spaci
al, et
c.
Mg. W
i lmer
Fuen
te s
Métodos Estadístico en un diseño
Experimental

13
MUESTREO ESTADISTICO

Concepto:
Procedimiento para seleccionar una o más
muestras estadísticamente representativas de
la población o poblaciones.
Ejemplo de uso del muestreo:
a. Encuestas.
b. Diseño y análisis de experimentos.
c. Control de calidad

14
 Ejemplo: Control de Calidad en Investigación:
 Validación de Instrumentos (encuestas, test)
 Validación de Metodologías, etc.

HIPERTENSIÓN

Ciudad X Ciudad X tiempo Total


Tiempo 1 2
n % n % n %

No hipertensos 351 65.2 332 65.5 683 65.4

Hipertensos 187 34.8 175 34.5 362 34.6


Total 538 100.0 507 100.0 1045 100.0
p = 0.935, Chi cuadrado

15
Muestras

 La muestra debe ser representativa de la población


 Debemos evitar sesgos sistemáticos
 Controlar variables de confusión
 El tamaño muestral juega un papel fundamental
 La muestra debe contener suficiente información
para que la inferencia que realicemos sea una
generalización aceptable

16
CRITERIOS DE ACEPTACION DE UN METODO DE
MUESTREO
a. Representatividad: Significa atribuir a cada unidad de
muestreo (persona, vivienda, ...) una probabilidad,
conocida y diferente de cero, de ser elegida.
b. Precisión de las estimaciones: La precisión o
confiabilidad de las estimaciones derivadas de la
muestra debe ser suceptible de medir.
Así:  = p ± precisión
c. Viabilidad: El método de muestreo debe ser práctico.
La teoría y la práctica deben estar juntas.
d. Economia y eficiencia: Un buen método de muestreo
(muestra) debe proporcionar la mayor cantidad de
información a menor costo.
17
TERMINOS ESTADISTICOS (RECORDAR)

a. Población
b. Unidad de muestreo
c. Marco muestral
d. Muestra
e. Unidad de análisis
f. Parámetro
g. Estadígrafo o estadístico.

18
 Población.- Colección de elementos acerca
de los cuales se desea hacer inferencia.
 Unidad de muestreo.- Son la colección no
traslapada de elementos de la población
que cubren la población completa.
 Marco muestral.- Un marco es la lista de
unidades de muestreo.

19
 Muestra: Es una colección de unidades
seleccionadas de un marco o de varios
marcos.
 Unidad de análisis: es cada uno de los
elementos requeridos para hacer inferencia.

20
Población

 En población tiene una característica de


interés en particular.
 Individuos expuestos a HIV
 Individuos diabéticos
 Individuos vacunados contra la gripe
 Fumadores
Población objetivo (diana):
 Población a la que nos corresponde

extender las conclusiones del trabajo

21
TÉCNICAS DE MUESTREO

• Intencional
No probabilísticos • Sin norma
(prácticos y • Accidental (casos)
económicos • Voluntarios
METODOS
• MAS
• MS
Probabilísticos
• ME
• M de C

22
Tamaño muestral

 Es algo medio complicado, primero es necesario distinguir


entre:
 Encuesta descriptiva.- Diseñado para proporcionar
estimaciones de algunas características simples.
(prevalencia, incidencia)
 Encuesta analítica.- Para investigar asociaciones entre
variables. (asoc. fumar y riesgo de eventos cardiovasculares)

23
Para estimar una proporción poblacional

2
z  pe qe
n 2
2
Si se conoce N:
E

n
nf 
n
1
N

24
Ejemplo:
En una población grande se desea estimar la prevalencia de
DM con 95% de confianza. De la literatura se sabe que p
=10%, si se asume un error muestral de 5%, calcular n.
Solución:
Datos:
Z /2 =
1,96
pe =0,1 n= (1,96)2 (0,1)(0,9) = 138,3
qe =0,9 (0,05)2
E =  0,05

n  139
Interpretación: Si se desea estimar la
prevalencia poblacional con 95% de confianza y
con un E de 5%, se debe evaluar 139 sujetos.

25
Para estimar una media poblacional

2 2
z  se
n 2
2
Si se conoce N:
E

n
nf 
n
1
N

26
Ejemplo: En cierta población de 1200 escolares se desea estimar el
nivel promedio de Hb con 95% de confianza. Al realizar un estudio
piloto se encontró: x= 12,3 s = 1,6. Si los investigadores estan
dispuestos a asumir un E =  0,5 , calcular n.
Solución:
Datos:

n= (1,96)2 (1,6)2 = 39,33


(0,5)2
Z /2 = 1,96
N= 1200 nf = 39,33 = 38,05
Se = 1,6 1 + 39,33/1200
E =  0,5
nf  39

27
28
SPSS e INFORMACIÓN

R, MathLab

R, SPSS,
STATA

SQL, ORACLE,
MySQL
ESTADISTICA DESCRIPTIVA

31
ESTADÍSTICA DESCRIPTIVA
Ordenando la Información
Al ordenar datos muy numerosos, es
usual resumirlos o agruparlos en clases
o categorías. Al determinar cuántos
pertenecen a cada clase, establecemos
la frecuencia. Construimos así una tabla
de datos llamada tabla de frecuencias y
si es cuantitativa se pueden emplear
promedio y otras medidas

FRECUENCIA
ABSOLUTA FRECUENCIA PROMEDIOS,
RELATIVA DESVIACION
(cantidad de casos, ESTANDAR,
recuento de eventos, (%, proporciones) PERCENTILES, ETC.
etc)
Variables
 Una variable es una característica o atributo observable que varía entre los
diferentes individuos de una población.
 La información que disponemos de cada individuo es resumida en
variables.

 En los individuos del curso de bioestadistica es variable:


 El grupo sanguíneo
 {A, B, AB, O}  Var. Cualitativa
 Su nivel emocional “declarado”
 {Deprimido, Regular, Muy Feliz}  Var. Ordinal
 El número de hijos
 {0,1,2,3,...}  Var. Numérica discreta
 La altura
 {1’62 ; 1’74; ...}  Var. Numérica continua
5. ¿Está unido sentimentalmente a una pareja?
SI ( ) NO ( )

6. Usted lee el diario:


Comercio ( )
República( )
Expreso ( )
Peru21 ( )

35
6. Que diarios ha leído en al último mes:

6.1 Comercio si ( ) no ( )
6.2 República si ( ) no ( )
6.3 Expreso si ( ) no ( )
6.4 Peru21 si ( ) no ( )
6.5 Especifique: ___________________

36
Tipos de variables
 Cualitativas
Si sus valores (modalidades) no se pueden
asociar naturalmente a un número (no se
pueden hacer operaciones algebraicas con
ellos)

 Nominales: Si sus valores no se pueden ordenar


 Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)
 Ordinales: Si sus valores se pueden ordenar
 Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor

37
Presentación ordenada de datos (ej. Tesis)

6
Género n %
5

Varones 4 40.0 4

Mujeres 6 60.0 2

Total 10 100.0 0
Hombre Mujer

 Las tablas de frecuencias y las representaciones gráficas son


dos maneras equivalentes de presentar la información. Las
dos exponen ordenadamente la información recogida en una
muestra.
38
Gráficos para v. cualitativas

 Diagramas de pastel (pie)


 No usarlo con variables ordinales.
 El área de cada sector es proporcional a su frecuencia (abs. o rel.)

27.3
Note las
etiquetas de las
categorìas
72.7
Hipertensos (modalidades) y
No hipertensos etiqueta de
valores

39
Gráficos para v. cualitativas
 Diagramas de barras (tipo tesis)
 Alturas proporcionales a las frecuencias (abs. o rel.)
¿Presencia
 Se pueden aplicar también a variables discretas de
etiquetas
75
de valor?
66.7
Porcentaje (%)

60

45

30
¿Que se 16.7
mide en 15 10.0
6.7
las
0
ordenas? <1 1-4 5-9 10 - 15 ¿Se
describen
bien la
Grupo de edad (años) categorias
Prevalencia de hipertensión arterial en el Perú.
TORNASOL II
Prevalencia de la presión arterial
según VII Reporte (JNC VII)
100 5.8 6.6
90
17.9 20.7
80
HTA estadio II
70
Porcentaje(%)

60 32.4 HTA estadio I


36.9
50 Prehipertensiòn
40
No hipertenso
30
20 43.9
35.8
10
0
Tornasol I Tornasol II
(n=14256) (n=14508)
La mala salud,
comportamientos poco
saludables y características
desfavorables de trabajo
influyen en la salida del trabajo
entre los trabajadores de más
edad en Europa: Un estudio de
cuatro de seguimiento

Nota: No se emplean gràficas


en el articulo publicado
Robroek SJ, Schuring M, Croezen S, Stattin M, Burdorf A.Poor health,
unhealthy behaviors, and unfavorable work characteristics
influence pathways of exit from paid
employment among older workers in Europe: a four year
follow-up study

Scand J Work Environ Health. 2012 Sep


3.
Cuantitativas o Numéricas

Si sus valores son numéricos (tiene sentido


hacer operaciones algebraicas con ellos)
 Discretas: Si toma valores enteros
 Número de hijos, Número de cigarrillos por día, Num. de
“cumpleaños”

 Continuas: Si entre dos valores, son posibles infinitos valores


intermedios.
 Altura, Presión intraocular, Dosis de medicamento administrado,
edad, Hb

44
Tipos de variables

 Cuantitativas o Numéricas
Si sus valores son numéricos (tiene sentido hacer
operaciones algebraicas con ellos)
 Escala de intervalo
 El cero no es una cantidad absoluta.
 Escala de razón
 El cero es una cantidad absoluta.

45
Figura 2. Promedio de los marcadores de riesgo
cardiovascular según control de la HbA1c. ¥
Desarrollo psicomotor , entre pequeños para la edad gestacional: Impacto
de la suplementación con zinc, peso al nacer y las prácticas de crianza.
Cognitive and Motor Development Among Small-for-Gestational-Age
Infants: Impact of Zinc Supplementation, Birth Weight,and Caregiving
Practices

PEDIATRICS Vol. 113 No. 5 May 2004


 Diagramas de barras (tipo publicación)

Figure 1 Q-LES-Q scores

Celso Iglesias-García. Quality of life in depressed women over 40 years old.


Actas Esp Psiquiatr 2012;40(4):221-7
Densidad mineral ósea en mujeres durante campaña
de Hospital de la Solidaridad.
Gráfica de dispersión

Permite observar la
relación entre dos
variables cuantitativas.

En este caso cada


punto corresponde a un
individuo y la ubicaciòn
de cada punto depente
del valor de PAI y el
valor de Hb glicosilada

50
Salud en relación con el conocimiento y las preferencias en
jardines de niños de bajo nivel socioeconómico.

El objetivo del presente


estudio fue determinar la
actividad física (AF) y el
conocimiento de nutrición en
jardines . . .

Int J Behav Nutr Phys Act. 2012 Jan 10;9:1.


Health-related knowledge and preferences in low socio-economic kindergarteners.
Nemet D, Geva D, Meckel Y, Eliakim A.
Estadística inferencial
 Usa la teoría de la probabilidad para extraer
conclusiones acerca de una población, a
partir de los datos obtenidos en una muestra.
 Es muy difícil estudiar a toda la población,
por lo que estudiamos muestras.
 Métodos para hacer estimaciones y probar
hipótesis son fundamentales para obtener
inferencias.
Estadística inferencial-Ejemplos
 En una encuesta nacional acerca de los
peligros del tabaquismo, no se entrevista a
toda la población, sólo se hace en una
muestra de ella.
 Para medir la prevalencia de amebiasis en
una población, se estudia una muestra
aleatorizada. Con la prevalencia de la
muestra, se puede inferir la prevalencia de
amebiasis en la población.
Ejemplo
 ¿Cuántos individuos tienen Número de hijos
menos de 2 hijos?
 frec. indiv. sin hijos Porcent. Porcent.
+ Frec. (válido) acum.
frec. indiv. con 1 hijo 0 419 27,8 27,8
= 419 + 255
= 674 individuos 1 255 16,9 44,7
2 375 24,9 69,5 ≥50%
 ¿Qué porcentaje de individuos 3 215 14,2 83,8
tiene 6 hijos o menos? 4 127 8,4 92,2
 97,3%
5 54 3,6 95,8
6 24 1,6 97,3
 ¿Qué cantidad de hijos es tal 7 23 1,5 98,9
que al menos el 50% de la
población tiene una cantidad Ocho+ 17 1,1 100,0
inferior o igual? Total 1509 100,0
 2 hijos

54
Recomendaciones para un gráfico
 Si es estético, fomenta la lectura y comprensión.
 Sencillez y claridad, el uso del color debe ser
moderado y bien elegido.
 Usar líneas finas, eliminar las superfluas
 Usar grid si es necesario
 Balance entre el espacio en blanco y datos
 Idealmente no hay que acudir al texto .
 Balance entre texto, tablas e imágenes,
 Combinar texto y tablas insertas

55
Introducción de datos de las variables
¿Qué es lo correcto?
PRESION ARTERIAL
SISTOLICA
SEXO CLAS_IMC PAS_DIUR PAS_NOCT GRUPO SOBRESO GRUPO OBESOS
Varon Sobrepeso 154 156 DIURNA NOCTURNA DIURNA NOCTURNA
Varon Obeso 156 154 134 126 162 160
Mujer Obeso 154 160 146 136 132 136
Varon Sobrepeso 134 126 160 150 136 140
Mujer Obeso 146 136 146 140 140 136

Varones
Mujer Sobrepeso 160 150 154 156 156 154
Mujer Sobrepeso 146 140 156 154 134 130
154 160 120 124
Varon Sobrepeso 154 156
134 126 162 160
Mujer Obeso 154 156
146 136 132 136
Varon Obeso 156 154
160 150 136 140
Mujer Obeso 154 160 146 140 140 136
Mujer Sobrepeso 134 126
Mujeres

154 156 156 154


Varon Sobrepeso 146 136 156 154 134 130
... ... ... ... 154 160 120 124

A B
Se muestra la PAS de individuos con determinadas
56
caracteristica ¿Cuántas Variables Hay?

También podría gustarte