Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Apunte de Bioestadstica
Conceptos bsicos
Estadstica aplicada
Bioestadstica
DEFINICIN Y CLASIFICACIN
Definimos el trmino Estadstica: es una disciplina de estudio relacionada con
la recopilacin, organizacin, resumen y anlisis de datos siempre y cuando la
variabilidad sea una causa intrnseca de los mismos; as como de realizar
inferencias a partir de esos datos con el objeto de formular predicciones.
Clasificacin:
Estadstica Descriptiva: Describe, analiza y representa un grupo de datos
utilizando mtodos numricos y/o grficos que resumen y presentan la
informacin contenida en ellos. En este tipo de anlisis no se aplican test
estadsticos. Cuando un trabajo de investigacin se limita a describir los
resultados sin realizar inferencia estadstica* dicho trabajo se denomina estudio
descriptivo.
MTODO CIENTFICO
Es el mtodo de investigacin para el conocimiento de la realidad observable el
cual consiste en formularse interrogantes sobre esa realidad, con base en la
teora ya existente, tratando de hallar soluciones a los problemas planteados. El
mtodo cientfico se basa en la recopilacin de datos, su ordenamiento y su
posterior anlisis.
Cuando nos planteamos comenzar un trabajo de investigacin lo ms importante
es realizar una bsqueda bibliogrfica sobre el tema. Las citas encontradas nos
darn una idea de la vigencia del tema como as tambin de las limitaciones de la
investigacin, lo cual se ve reflejado en los criterios de inclusin y exclusin para
1
Bioestadstica
la seleccin de los pacientes y en la metodologa. Si se nos plantea una
investigacin para la cual hay escasas publicaciones o la misma no est
actualizada deberemos evaluar la conveniencia de la realizacin de la misma. Es
aconsejable realizar estudios analticos para las investigaciones que cuenten con
algn aval cientfico (publicaciones sobre el tema), de lo contrario nos
deberamos limitar a realizar estudios descriptivos.
Bioestadstica
Bioestadstica
POBLACIN Y MUESTRA
Bioestadstica
correctamente y al azar, se puede inferir o generalizar a la poblacin
objetivo o madre; este proceso de inferencia se basa en mtodos
estadsticos basados en la probabilidad. Para elegir la muestra debe
apelarse a un determinado mtodo de muestreo el cual depender del
objetivo del estudio; el mtodo habitual es el de muestreo al azar o
muestreo aleatorio, pudiendo ser: muestreo aleatorio simple, muestreo
sistemtico, muestreo estratificado y muestreo de conglomerados. Cuando
no se realiza ningn tipo de muestreo y se toma la totalidad de los
individuos, sujetos u observaciones, se denomina Muestra Conveniente
(muestra no escogida por probabilidad), la cual es factible que tenga
sesgos. Esta ltima muestra es la que normalmente obtenemos en
nuestros estudios y tiene la limitacin de que las conclusiones a las cuales
llegamos deben limitarse a la muestra estudiada.
Poblacin
Objetivo (PO)
La PM es representativa de la
PO? Esta respuesta la podemos
encontrar en la seccin
Materiales y mtodos de las
publicaciones para saber que
poblacin se muestre
Poblacin
Muestreada (PM)
Muestra
Bioestadstica
TIPOS DE ESTUDIOS CIENTFICOS
Los estudios en Investigacin Cientfica o Clnica se dividen en Estudios
Observacionales y Estudios Experimentales.
Bioestadstica
Todos los tipos de estudios tienen ventajas y desventajas
2. Estudios Experimentales o Pruebas Clnicas: el investigador interviene en
los sujetos, animales o cosas, ya sea administrando un medicamento,
realizando una dieta, modificando hbitos, etc., y el inters de la investigacin
radica en el cambio producido antes y despus de la intervencin.
2.1 Pruebas Clnicas Controladas: pueden disearse de varias formas, por
ejemplo con un grupo control, con autocontroles o con control histrico. Las
pruebas clnicas con un grupo de estudio y otro control son las ms usadas en
medicina. Bsicamente a un grupo con la enfermedad se lo somete a un
tratamiento y se lo compara con un grupo control al cual se le administra
placebo u otro tratamiento. Al grupo que recibe tratamiento se lo denomina
grupo experimental. Cuando el mdico conoce el tratamiento y el paciente no,
la prueba se llama simple ciego, cuando ninguno de los dos conoce si se
esta administrando el tratamiento o el placebo, la prueba se denomina doble
ciego y si a la ltima situacin se le agrega que el estadista que procese los
datos desconozca el grupo con tratamiento se denomina triple ciego. Los
pacientes deben asignarse a cada grupo en forma aleatoria.
2.2 Pruebas Clnicas No Controladas: son aquellas en donde no se
establece ningn grupo control. Para la investigacin de un tratamiento o
intervencin teraputica son totalmente inapropiadas.
Interviene el investigador
Observacionales
Experimentales
Toma de Datos
Retrospectivos
Prospectivos
Una medicin
Transversales
Longitudinales
Anlisis realizado
Anlisis comparativo
Descriptivos
Analticos
Bioestadstica
TIPOS DE DATOS
Existen 2 grandes tipos de datos: Datos Categricos y Datos Numricos. Es de
fundamental importancia identificar qu tipo de datos tenemos porque de ellos
depende la estadstica a aplicar.
Variable: es una caracterstica o propiedad determinada del individuo, sea
medible o no. Esta propiedad hace que las personas de un grupo puedan diferir
de las de otro grupo en la muestra o poblacin de estudio.
Las variables se clasifican en:
Variables Numricas: es la que se puede medir. Habitualmente es llamada
variable cuantitativa. Esta a su vez se divide en Continua (se pueden obtener
infinitos nmeros entre dos medidas de acuerdo a la precisin de la medicin) y
Discreta (son nmeros enteros). Estas variables son representadas por medidas
de posicin (media, mediana, modo, percentilos) y de dispersin (desviacin
estndar, error estndar, coeficiente de variacin, rango)
Variables Categricas: son variables que representan cualidades de la muestra,
tambin se las llama cualitativas. Estas variables pueden ser a su vez Nominales
(dos o ms caractersticas posibles) u Ordinales (se puede establecer un orden
lgico). Estas variables son representadas por porcentajes o proporciones.
Tipo de datos
Categricos
Numricos
Nominales
Ordinales
Discretos
Continuos
Ejemplo:
femenino/masculino
raza (blanca/negra/amarilla)
especies (animales/vegetales)
Ejemplo:
leve/moderado/severo
cra/recra/invernada/engorde
score I / II / III / IV
Ejemplo:
n de hijos
edad (aos)
n de clulas
Ejemplo:
colesterolemia, Vit. B12
edad (aos, meses, das)
contenido graso en alimentos
Bioestadstica
Variable Dependiente: es la variable motivo de nuestro inters, cuyos valores
dependen de otras variables que pueden influir en ella. Tambin se la llama
variable respuesta. Por ejemplo: concentracin plasmtica de colesterol, vitamina
A, B12, etc.
Medidas de posicin:
Medida
Definicin
Frmula
Smbolo
Media
Promedio aritmtico de
las observaciones
Mediana
Modo
Percentilos
____
Es el valor ms
frecuente
____
Indica el % de una
distribucin que es = o <
que esa cifra
___
Md
Mo
El percentilo
50th (es la
mediana)
Bioestadstica
Medidas de dispersin:
Medida
Definicin
Estndar
Es una medida de la
dispersin de los datos
alrededor de su media
Varianza
Es el cuadrado de la ds
Rango
Es la diferencia entre el
mayor menos el menor
valor de una serie de
datos
Desviacin
Rango
Intrercuartlico
Coeficiente de
Variacin
Frmula
s
(x x )
Smbolo
2
s, ds
N 1
(x x )
N 1
-----
Generalmente
se
Es la diferencia entre el
informan los extremos
percentilo 75th menos el
del rango es decir los
percentilo 25 th
percentilos 25th y 75th
Es una medida de la
s
dispersin relativa de los CV (%) * 100
x
datos
s2
-----
-----
CV
10
Bioestadstica
Poblacin
Muestra
Media
Desviacin estndar
s, ds
varianza
s2, ds2
proporcin
Coeficiente de correlacin
Distribucin sesgada o
asimtrica
11
Bioestadstica
Distribucin gaussiana
1
2
3
1,65
1,96
% de valores muestreados
68.2%
95,4%
99,8%
90,0%
95,0%
12
Bioestadstica
Los valores de z ms utilizados en medicina son 1,65 y 1,96 aunque ste ltimo
es el ms difundido.
Existen varios parmetros para definir a una distribucin como normal o
gaussiana. Hay test estadsticos especficos (Ej.: test de Kolmogorov-Smirnov,
test de la bondad de ajuste, etc.), tambin existen grficos (qq plot, pp plot); lo
cierto es que nada es concluyente y definitivo. Una alternativa prctica es realizar
una estadstica descriptiva de los datos (comparar media y mediana), graficar los
datos en un histograma y calcular el coeficiente de variacin el cual debera ser
menor al 30%.
Los datos distribuidos en forma gaussiana se analizan con Test paramtricos y
son representados por la media y desviacin estndar. Si la distribucin no es
normal se denomina distribucin sesgada (existen sesgos positivos y
negativos); debido a esto se puede realizar una transformacin de los datos (la
ms utilizada es la transformacin logartmica) y observar si se normaliza la
distribucin. De continuar el sesgo, se analizan los datos originales con Test no
paramtricos.
En las variables con distribucin gaussiana los datos se representan con la
media 1 desvo estndar (Ej.:21015 mg% de colesterol), si la variable tiene
sesgos en su distribucin la mejor forma de representarla es con la mediana y el
rango intercuartlico (percentilo 25 th percentilo 75 th) o mediana (mnimo
mximo).
La mediana a diferencia de la media es insensible a cambios en los valores
extremos, esta caracterstica se denomina robustez.
Ejemplo:
12 14 17 35 40 41 45
media= 29.1
Md= 35
media= 56.8
Md= 37.5
13
Bioestadstica
Distribucin t de student
Bioestadstica
ANLISIS ESTADSTICO
El anlisis estadstico se divide en tres grandes tipos: univariado, bivariado y
multivariado.
El anlisis de los datos tiene como fin el responder a las preguntas, hiptesis y
objetivos que se hicieron los investigadores; para llegar a ese punto primero se
deben describir la/s variables o datos que se recolectaron durante el estudio.
Cuando el planteamiento del problema no contempla realizar comparaciones
entre grupos y slo el investigador describe los datos, el anlisis estadstico se
limita a un anlisis descriptivo, este tipo de trabajos tambin se denominan
descriptivos. Cuando el investigador ha planteado comparaciones entre grupos se
requiere de test estadsticos especficos, a estos trabajos se los designa como
trabajos analticos.
Cuando se plantea la confrontacin entre grupos de sujetos, ya sea de variables
categricas o numricas, surge el concepto de Inferencia Estadstica. La
inferencia estadstica resuelve problemas tales como la comparacin de valores
medios entre 2 o ms grupos, comparacin de proporciones, buscar asociaciones
entre variables, buscar correlacin o concordancia, etc.
La inferencia estadstica nos plantea resolver el problema de dos maneras
distintas, cualquiera de las dos conlleva una incertidumbre que se reflejar en el
resultado emitido. Por un lado podemos responder a nuestras preguntas
mediante Test de hiptesis y por otro lado mediante Intervalos de Confianza.
15
Bioestadstica
Inferencia Estadstica
Test de Hiptesis
Test de Hiptesis
Hiptesis en investigacin significa literalmente lo que se supone. Est
compuesta por enunciados tericos probables, referentes a variables o relaciones
entre ellas. En el campo de la investigacin, la hiptesis, supone soluciones
probables al problema de estudio.
Los test estadsticos se basan en la comprobacin de hiptesis
previamente planteadas por el investigador
Existen dos tipos de hiptesis:
Hiptesis Alternativa: es la hiptesis que pretende comprobar el investigador
en su muestra de pacientes. Bsicamente significa que la distribucin y
frecuencia de un evento en un grupo o muestra es diferente de la de otro/s
grupo/s.
Ha: grupo 1 grupo 2
Ha: grupo 1 grupo 2 ni grupos
16
Bioestadstica
Ho: grupo 1 = grupo 2 = ni grupos
Concepto de Probabilidad
Toda estimacin de una caracterstica poblacional basada en informacin
contenida en una muestra debe ir asociada a una probabilidad del error de
estimacin.
Bioestadstica
alternativa)
3. Se fija el nivel de significacin (error tipo I). Queda entonces decidido
Bioestadstica
hiptesis nula sea cierta, por lo cual se rechazar, aceptando la hiptesis
alternativa (hiptesis de diferencia) como verdadera.
Si p < 0,05 rechazamos la hiptesis nula de igualdad y EXISTEN
DIFERENCIAS ESTADSTICAMENTE SIGNIFICATIVAS (aceptamos la
hiptesis alternativa)
Si p > 0,05 no rechazamos la hiptesis nula de igualdad y NO EXISTEN
DIFERENCIAS ESTADSTICAMENTE SIGNIFICATIVAS
Actualmente ya no se utilizan ms los clculos manuales y los valores de p
exactos o aproximados son dados por la mayora de los soft estadsticos (SPSS,
Instat, Statistic, Epi info, InfoStat, Medcalc, etc.).
En resumen, si obtenemos un valor de p<0,01 significa que cometeramos
un error menor al 1% en rechazar la hiptesis nula si esta fuera verdadera.
En otras palabras, si repitiramos el mismo estudio 100 veces la
probabilidad de no rechazar la hiptesis nula (o sea de no obtener
diferencias estadsticamente significativa) sera menor al 1%; la
probabilidad de que la hiptesis nula sea verdadera es menor al 1%.
IC para la media:
para n > 30
IC = X 1,96 . ES
para n < 30
IC = X
tcrit.(g.l. n-1)0,05 . ES X
Bioestadstica
ES= error estndar = (ds / n )
As como la desviacin estndar es una medida de la dispersin de los datos
alrededor de la media el error estndar es una medida de la dispersin entre
medias.
Ejemplo: se obtuvo el siguiente IC 95% para una muestra de n=22 en la cual se
determin colesterolemia obtenindose = 280 mg% s= 20 mg%
20
Bioestadstica
IC 95% para la media
450
400
mg%
350
300
250
200
150
A
Grupos
Bioestadstica
el error que introducimos en la medicin o cuantificacin del analito, porque
mezclamos dos poblaciones, etc.
Bioestadstica
Ha
Al igual que con el test t el ANOVA puede ser aplicado a datos de grupos
independientes o apareados.
Si un ANOVA da estadsticamente significativo (p<0,05) nos dice que existen
diferencias significativas entre los grupos pero no sabemos entre cuales. Para
23
Bioestadstica
saber entre qu grupos existen diferencias se realizan pruebas pos test. Estas
pruebas se denominan pos hoc y existen distintos test pos ANOVA (test de
Tuckey, Dunnet, Bonferroni, Newman-keuls, etc.). Si el ANOVA no da
estadsticamente significativo (p>0,05) se dice que no existen diferencias entre
los grupos y el anlisis termina ah.
Las premisas para realizar un ANOVA son:
Bioestadstica
Ha Existe una asociacin entre filas y columnas
Un valor de p<0.05, indica que existe una relacin o asociacin entre las
categoras estudiadas, o sea que las variables no son independientes.
Cuando se realiza una prueba chi cuadrado debemos tener en cuenta que:
Con el test chi cuadrado podemos averiguar si existe una asociacin, por
ejemplo entre HTA y eventos cardiovasculares (ECV):
ECV presente
Evento CV ausente
HTA presente
18
HTA ausente
10
Bioestadstica
RR puede arrojar un valor inferior a 1 con lo cual ya no hay riesgo. El lmite
inferior del IC debe ser mayor a 1 para que exista riesgo.
Para el caso de disminucin del riesgo podemos decir que la aspirina disminuye
el riesgo de eventos cardiovasculares con un RR= 0,70 (IC= 0,50 0,80), en este
caso para que la disminucin en el riesgo sea considerada verdadera el
lmite superior del IC no debe superar a 1. Podemos calcular el % de la
reduccin del riesgo (1 - 0,70)x100 con lo cual la aspirina reduce en un 30% el
riesgo de complicaciones cardiovasculares.
Ante la duda sobre el diseo del estudio se debe obtener OR; el RR slo se debe
calcular en estudios cohorte.
CORRELACIN Y REGRESIN
Otra forma de anlisis bivariado es la correlacin y regresin de variables
numricas. El concepto de correlacin y regresin se basa en el grado de
relacin lineal que poseen dos variables numricas entre si.
El coeficiente de correlacin de Pearsons (r) permite predecir si entre dos
variables existe o no una relacin lineal.
El coeficiente de correlacin r siempre oscila entre +1 y 1. Un valor igual a cero
significa que no existe correlacin lineal entre ambas variables. Un valor positivo
indica que existe una correlacin positiva y un valor negativo una correlacin
inversa entre las variables. Mientras ms cerca de +1 o -1 este el valor de r
mejor es la asociacin entre las variables.
Podemos graficar la correlacin entre las dos variables a travs de una grfica de
dos ejes cartesianos (abscisas y ordenadas). En el eje de las x se representa la
variable independiente y en el eje de las y la variable dependiente.
26
Bioestadstica
27
Bioestadstica
Bioestadstica
La significancia de r la da un valor de p< 0,05 o el IC 95% el cual no debe
contener al cero.
El coeficiente de correlacin de Pearsons es un estadstico paramtrico.
Premisas: las variables a correlacionar deben tener distribucin gaussiana y
deben ser independientes. Si la distribucin de las variables es sesgada se puede
realizar transformacin (log10); si el sesgo no se elimina se puede optar por el
coeficiente de correlacin de Spearman (rs) el cual es un test no paramtrico,
este estadstico es tambin til para correlacionar una variable numrica con una
variable categrica (Ej.: score de rinitis con niveles sricos de Ig E).
Anlisis de Regresin
Existen varios tipos de regresin y todos se basan en modificaciones de la
frmula de regresin lineal.
Regresin lineal simple (RLS)
Y = a + b . X (ecuacin matemtica de la recta)
Y es la variable dependiente (en estudio) y X la variable independiente.
a y b son factores derivados de la ecuacin matemtica de la recta:
a = ordenada al origen (la ideal es 0)
b= pendiente (la ideal es 1)
Syx= residuales
Bsicamente, por medio de la regresin se pretende predecir el valor de una
variable llamada genricamente Y, a travs de otra variable llamada X.
Para poder intrapolar se deben cumplir una seria de premisas que por lo general
se emplean en la validacin de mtodos, es decir cuando quiero reemplazar un
mtodo nuevo por uno ya existente, en este caso me interesa poder intrapolar los
valores de y (mtodo nuevo) de los valores de x (mtodo viejo). En estos casos
es en donde la regresin lineal adquiere real importancia.
Para utilizar la regresin lineal, en la comparacin de mtodos, el mtodo con el
que estoy comparando al nuevo mtodo debe ser un mtodo de referencia. Si el r
es a 0.975, el IC 95% de la ordenada al origen incluye al 0 (cero) y el IC
de la pendiente incluye al 1 puedo decir que ambos mtodos son
comparables e intercambiables. El modelo de RLS es paramtrico. Premisas:
las variables deben tener distribucin normal y deben ser independientes. El
anlisis por RLS atribuye todo el error al mtodo evaluado en las ordenadas (y) y
considera de referencia al mtodo en las abcisas (x). En caso de que el mtodo
con el que me estoy comparando no sea un mtodo de referencia debo utilizar
otro tipo de regresin lineal, como la regresin de Demming; la interpretacin de
29
Bioestadstica
r, a y b son la misma que en la RLS. La regresin de Passing-Bablok es el test no
paramtrico para realizar regresin.
Siempre que se realicen estudios de comparacin de mtodos se deben
interpretar los resultados en un contexto clnico. Nos debemos preguntar, ms
all de las significancia estadstica de cada coeficiente, si las diferencias son
clnicamente relevantes y si hemos tenido en cuenta los niveles de decisin
mdica a la hora de obtener los datos para realizar la comparacin.
ANLISIS MULTIVARIADO
El anlisis multivariado posee la propiedad de poder enfrentar a diferentes
variables o factores independientes con una o ms variables dependientes.
Existen varios tipos de mtodos multivariados, vamos a describir sintticamente
el fundamento de los ms usados:
Bioestadstica
independiente analizada y estableciendo su relacin con una variable
dependiente categrica nominal u ordinal generalmente.
31
Bioestadstica
Clculos:
Sensibilidad (%) = 100*A/(A+C)
Especificidad (%) = 100*D/(B+D)
Prevalencia (%) = 100*(A+C)/N
VPP (%) = 100*A/(A+B)
VPN (%) = 100*D/(C+D)
Prevalencia: A+C / N
32
Bioestadstica
Exactitud de la prueba es la proporcin de individuos correctamente clasificados
por la prueba: A+D / N
En las publicaciones estos ndices van acompaados de sus respectivos IC 95%.
Los VPP y VPN al estar influenciados por la prevalencia de la enfermedad son
poco extrapolables a nuestro lugar de trabajo, es decir que es difcil evaluar el
rendimiento de un test con estos ndices.
Mediante la combinacin de la sensibilidad y especificidad de un test se pueden
obtener resultados ms confiables sobre la validez de un test diagnstico. Del uso
combinado de la sensibilidad y especificidad de un test surge el concepto de la
razn de probabilidades, razn de verosimilitud o Likelihood Ratio (LR). La
razn de probabilidad puede ser positiva o negativa.
La razn de probabilidad nos indica cunto ms probable es un resultado
determinado de una prueba diagnstica en un paciente con una enfermedad
dada comparado con un paciente sin la enfermedad
LR = probabilidad de un resultado particular en pacientes con la enfermedad
dividida por la probabilidad del mismo resultado en pacientes sin la enfermedad.
Bioestadstica
34
Bioestadstica
La mxima proporcin de concordancia no debida al azar es 1-EP
La concordancia descontado el azar es: ((A+D)/N) - EP
El valor Kappa es el cociente entre la proporcin observada de concordancia
descontado el azar y la mxima proporcin de concordancia no debida al azar.
Un valor de kappa de 0.5 indica un nivel moderado de concordancia.
35
Bioestadstica
ABC
36
Bioestadstica
Un parmetro para evaluar la bondad de la prueba es el rea bajo la curva (ABC)
que tomar valores entre 1 (prueba perfecta) y 0,5 (prueba intil). Puede
demostrarse que esta rea puede interpretarse como la probabilidad de que ante
un par de individuos, uno enfermo y el otro sano, la prueba los clasifique
correctamente. Por lo tanto la significancia de un ABC debe interpretarse en el
contexto de su IC 95% en el cual su lmite inferior no debe ser menor a 0,5. Los
soft estadsticos tambin arrojan el valor de p.
Se pueden comparar varias curvas ROC a la vez y decidir cual es la prueba con
mejor rendimiento. Existen test estadstico para comparar curvas ROC entre s.
VCM
Sin Fe (n=34): 52, 58, 62, 65, 67, 68, 69, 71, 72, 72, 73, 73, 74, 75, 76, 77, 77, 78,
79, 80, 80, 81, 81, 81, 82, 83, 84, 85, 85, 86, 88, 88, 90, 92
Con Fe (n=66): 60, 66, 68, 69, 71, 71, 73, 74, 74, 74, 76, 77, 77, 77, 77, 78, 78,
79, 79, 80, 80, 81, 81, 81, 82, 82, 83, 83, 83, 83, 83, 83, 83, 84, 84, 84, 84, 85,
85, 86, 86, 86, 87, 88, 88, 88, 89, 89, 89, 90, 90, 91, 91, 92, 93, 93, 93, 94, 94,
94, 94, 96, 97, 98, 100, 103
37
Bioestadstica
Punto Corte
Sensibilidad
1-Especificidad
65
3/34=0,088
1/66=0,015
70
7/34=0,206
4/66=0,061
75
13/34=0,382
10/66=0,152
80
19/34=0,559
19/66=0,288
85
27/34=0,794
37/66=0,561
90
32/34=0,941
49/66=0,742
92
33/34=0,971
53/66=0,803
38
Bioestadstica
Se grafica S en funcin de FP o (1-E) y se obtiene la siguiente curva ROC:
cuya ABC es 0,717 (IC 95%: 0,657 0,778). El IC 95% en su lmite inferior no es
menor a 0,5 por lo cual el ABC es estadsticamente significativa. La S = 56% y la
E= 29% por lo cual el VCM no es un muy buen ndice para diferenciar ambos
grupos de sujetos debido al solapamiento de los datos.
PREVALENCIA E INCIDENCIA
Prevalencia
Es la proporcin de individuos de una poblacin que presentan el evento en un
momento, o periodo de tiempo, determinado. Por ejemplo la prevalencia de
desnutricin en el ao 2002 en Formosa es la proporcin de individuos de esa
provincia que en el ao 2002 padecan la enfermedad.
P = n de eventos (+)
n eventos totales
Caractersticas:
Es una proporcin
Es adimensional
su valor oscila entre 0 y 1, aunque generalmente se expresa
como porcentaje (0% - 100%)
Es un indicador esttico, que se refiere a un momento
temporal
39
Bioestadstica
Incidencia
La incidencia refleja el nmero de nuevos casos en un periodo de tiempo. Es un
ndice dinmico que requiere seguimiento en el tiempo de la poblacin de inters.
Cuando la enfermedad es recurrente se suele referir a la primera aparicin.
Se puede medir con dos ndices: incidencia acumulada y densidad (o tasa) de
incidencia.
Incidencia acumulada
Es la proporcin de individuos que desarrollan el evento durante el periodo de
seguimiento.
IA =
n de eventos nuevos
n de sujetos susceptible al comienzo
Caractersticas:
Es una proporcin
Es adimensional
Su valor oscila entre 0 y 1, aunque tambin se suele expresar
como porcentaje (0% - 100%)
Depende del tiempo de seguimiento
Se calcula sobre una cohorte fija, es decir no se permiten
entradas de nuevos individuos durante el seguimiento.
Prevalencia
Recuperados
Fallecidos
40
Bioestadstica
DETERMINACIN DEL TAMAO MUESTRAL
Todo estudio epidemiolgico lleva implcito en la fase de diseo la determinacin
del tamao muestral necesario para la ejecucin del mismo. El no realizar dicho
proceso, puede llevarnos a dos situaciones diferentes: primera que realicemos el
estudio sin el nmero adecuado de pacientes, con lo cual no podremos ser
precisos al estimar los parmetros y adems no encontraremos diferencias
significativas cuando en la realidad s existen. La segunda situacin es que
podramos estudiar un nmero innecesario de pacientes, lo cual lleva implcito no
solo la prdida de tiempo e incremento de recursos innecesarios sino que
adems la calidad del estudio, dado dicho incremento, puede verse afectada en
sentido negativo.
Para determinar el tamao muestral de un estudio, debemos considerar
diferentes situaciones:
41
Bioestadstica
Ejemplo: A cuantas personas tendramos que estudiar para conocer la
prevalencia de diabetes?
Seguridad = 95% Precisin = 3% Proporcin esperada = asumamos que puede
ser prxima al 5%; si no tuvisemos ninguna idea de dicha proporcin
utilizaramos el valor p = 0,5 (50%) que maximiza el tamao muestral:
donde:
donde:
N = Total de la poblacin
42
Bioestadstica
A.2. Estimar una media
Si deseamos estimar una media, debemos saber:
a. El nivel de confianza o seguridad (1- ). El nivel de confianza prefijado da
lugar a un coeficiente (Z ). Para una seguridad del 95% = 1.96; para una
seguridad del 99% = 2.58.
b. La precisin con que se desea estimar el parmetro
c. Una idea de la varianza s2 de la distribucin de la variable cuantitativa que
se supone existe en la poblacin.
43
Bioestadstica
B.1. Comparacin de dos proporciones
Donde:
Donde:
44
Bioestadstica
Valores de Z y Z ms frecuentemente utilizados
Z
Test unilateral
Test bilateral
0.200
0.150
0.100
0.050
0.025
0.010
0.842
1.036
1.282
1.645
1.960
2.326
1.282
1.440
1.645
1.960
2.240
2.576
Potencia
(1-)
0.01
0.05
0.10
0.15
0.20
0.25
0.30
0.35
0.40
0.45
0.50
0.99
0.95
0.90
0.85
0.80
0.75
0.70
0.65
0.60
0.55
0.50
2.326
1.645
1.282
1.036
0.842
0.674
0.524
0.385
0.253
0.126
0.000
45
Bioestadstica
Ejemplo de comparacin de dos proporciones
Deseamos evaluar si el Tratamiento T2 es mejor que el tratamiento T1 para el
alivio del dolor para lo que diseamos un ensayo clnico. Sabemos por datos
previos que la eficacia del frmaco habitual est alrededor del 70% y
consideramos clnicamente relevante si el nuevo frmaco alivia el dolor en un
90%. Nuestro nivel de riesgo lo fijamos en 0.05 y deseamos un poder estadstico
de un 80%.
46
Bioestadstica
BIBLIOGRAFA CONSULTADA
El presente apunte se realiz obteniendo informacin de distintas pginas Web,
ingresando palabras claves en el buscador Google, la mayora de las palabras
estn en negrita en el texto.
47