Está en la página 1de 36

BIOESTADÍSTICA

Estadística Descriptiva

Facultad de Ingeniería Ambiental - UNI


MSc. Beatriz Castañeda S.
ESTADISTICA

POBLACION

E1 E2 E3 E4 E5 . . . EN
X1 X2 X3 X4 X5 . . . XN
Estadística Descriptiva

Probabilidad
Inferencia
Muestreo

MUESTRA
E1 E2 E3 . . . E n
X1 X2 X3 . . . Xn
Estadística Descriptiva

Bioestadística Mg. Beatriz Castañeda S. 2


Población:
Es el conjunto de elementos para los cuales se tiene
interés en estudiar alguna característica (por ejemplo
los niños de un distrito)

Es el conjunto de valores asociados a cada uno de los


elementos según la característica de interés (por ejemplo, si
interesa estudiar el peso de los niños, al medirlos se tendrá la
población de pesos de los niños del distrito)

Muestra: Es una parte de la población

Unidades de observación: Son los elementos para los


cuales se va a estudiar sus características.

Variable:
Es la característica que interesa estudiar para los elementos.
Bioestadística Mg. Beatriz Castañeda S. 3
ESTADÍSTICA
Es el campo de la ciencia que se relaciona con
1) La recopilación, organización y resumen de los datos
2) La obtención de inferencias acerca de un conjunto de
datos cuando sólo se observa una parte de ellos.

BIOESTADÍSTICA
Cuando los datos que se están analizando se obtienen de
las ciencias biológicas y de la medicina, se utiliza el término
de bioestadística para diferenciar a esta aplicación
particular de herramientas y conceptos estadísticos.

Bioestadística Mg. Beatriz Castañeda S. 4


La ciencia estadística trata con:

- Diseño de experimentos
- Colección y manejo de datos
- Evaluación de medidas de resumen
- Estimación de parámetros poblacionales
- Prueba de hipótesis respecto a las
poblaciones
- Estudio de la relación entre dos o más
variables.
Bioestadística Mg. Beatriz Castañeda S. 5
SELECCIÓN DE LOS MÉTODOS
ESTADÍSTICOS

Antes de seleccionar un método estadístico debemos


tomar dos decisiones:

1) Cuál es la variable dependiente y cual es la


independiente, y
2) Qué tipo de datos constituyen cada una de esas
variables.

Bioestadística Mg. Beatriz Castañeda S. 6


Clasificación de las variables en
función de los objetivos de la
investigación
 Variable  Variables
dependiente: independientes:
Puede identificarse como Son las que determinan
la variable de interés las características que es
principal o el desenlace necesario tener en cuenta
principal del estudio. o las condiciones en que
Queremos contrastar hipó- se contrastan las hipótesis
tesis o hacer estimacio- o se realizan las estima-
nes, o efectuar ambos pro- ciones.
cedimientos, acerca de la
variable dependiente.

Bioestadística Mg. Beatriz Castañeda S. 7


Tipos de Variable y Escala
de Medición
Tipo de Descripción Escala Ejemplo
variable

Nominal -sexo
Clasifica a los
(no establece -estado civil
elementos
orden) -raza
Categórica en categorías o clases
-Dolor
Ordinal -Color (intensidad)
(orden en -Estadío de
categorías) enfermedad
-Edad
Cuando asume valores -talla
Cuantitativa cuantitativos. Numérica
-peso
- Discretos -número de hijos
- Continuos -tiempo de
enfermedad
-Cloro residual

Bioestadística Mg. Beatriz Castañeda S. 8


ORGANIZACIÓN Y
PRESENTACION DE DATOS
Arreglo ordenado según edad de mujeres
con evaluación de sobresaturación de bilis
% de % de
Sobresa Sobresa
Orden Sujeto Edad turación Orden Sujeto Edad turación
1 7 23 98 16 4 44 89
2 12 23 35 17 27 44 84
3 25 23 46 18 15 47 77
4 20 25 69 19 26 48 107
5 6 27 58 20 3 49 76
6 10 30 66 21 23 49 73
7 2 33 86 22 14 50 127
8 13 35 55 23 18 53 75
9 16 36 91 24 8 56 146
10 28 37 120 25 21 57 84
11 11 38 52 26 29 57 123
12 1 40 65 27 24 60 87
13 9 41 80 28 5 63 142
14 19 41 82 29 17 74 128
15 22 42 116
Bioestadística Mg. Beatriz Castañeda S. 9
Edad de mujeres sometidas a evaluación
de porcentaje de sobresaturación de bilis

Edad Nº de
(años) mujeres Porcentaje
20 - 29 5 17%
30 - 39 6 21%
40 - 49 10 34%
50 - 59 5 17%
60 - 69 2 7%
70 - 79 1 3%
Total 29 100%

Bioestadística Mg. Beatriz Castañeda S. 10


Histograma de frecuencias
Edad de mujeres sometidas a evaluación de
porcentaje de saturación de colesterol en bilis

12
10
Nº de mujeres

8
6
4
2
0
10 - 19 20 - 29 30 - 39 40 - 49 50 - 59 60 - 69 70 - 79 80 - 89
Edad (años)

Bioestadística Mg. Beatriz Castañeda S. 11


Agrupamiento por conteo individual

Etapa de la Número de
enfermedad pacientes Porcentaje
1 3 3%
2 28 24%
3 63 55%
4 21 18%
Total 115 100%

Etapa de la enfermedad de pacientes


con cáncer colorrectal

70
Número de pacientes

60
50
40
30
20
10
0
1 2 3 4
Etapa de la enfermedad

Bioestadística Mg. Beatriz Castañeda S. 12


Datos categóricos

Bacteriemia Nº de pacientes %
Si 4 20%
No 16 80%
Total 20 100%

Frecuencia de bacteriemia en pacientes hipotéticos


con cultivos de catéter

20%

Si
No

80%

Bioestadística Mg. Beatriz Castañeda S. 13


MEDIDAS DE RESUMEN

Llamadas también medidas


descriptivas por que tienen por objeto
describir la naturaleza de la característica
en estudio.
 MEDICIÓN DE DATOS NUMÉRICOS
- Medidas de Posición: Media aritmética o promedio, Moda,
Cuantilas: Mediana, cuartiles, deciles, percentiles

- Medidas de dispersión: Amplitud o rango, Varianza y desviación


estándar y el Coeficiente de Variación .
Bioestadística Mg. Beatriz Castañeda S. 14
Medidas de Posición
MEDIA: Indica el centro de los datos, valor alrededor
del cual tiende a tomar medida la mayoría de los datos.

x
nº de nº de
i hijos familias xi ni
x  i 1 (xi) (ni)
n 0 4 0
198
1 8 8 x  3.09
Datos sin agrupar 2 11 22 64
3 15 45
4 10 40
 3 hijos / familia
k

xn
5 13 65
i i 6 3 18
x  i 1
TOTAL 64 198
n
Datos agrupados
Bioestadística Mg. Beatriz Castañeda S. 15
Medidas de Posición
2645.5
x  35.27 años
Edad xi ni xi ni 75
5 – 14 9.5 5 47.5
15 – 24 19.5 10 195.0 Moda: Valor que ocurre
25 – 34 29.5 20 590.0 con mayor frecuencia (más
35 – 44 39.5 22 869.0
probable), se calcula para
45 – 54 49.5 13 643.5
muestras moderadamente
55 – 64 59.5 5 297.5
grandes.
TOTAL 75 2645.5

Moda = 39.5 años

Bioestadística Mg. Beatriz Castañeda S. 16


Medidas de Posición
Edad de mujeres sometidas a
Evaluación de porcentaje de
Distribución acumulada de las mujeres
Saturación de bilis 100%
según edad
Edad Nº de Nº 90%
(años) mujeres Porcentaje acumulado 80%

% de mujeres
70%
20 - 29 5 17% 5 60%
30 - 39 6 21% 11 50%
40%
40 - 49 10 34% 21 30%

50 - 59 5 17% 26 20%
10%
60 - 69 2 7% 28 0%
20 29 39 49 59 69 79 Total
70 - 79 1 3% 29
Edad (años)
Total 29 100%

Percentil: Medida que indica en que punto se acumula una


porción p de datos con valor máximo el punto indicado
Bioestadística Mg. Beatriz Castañeda S. 17
Medidas de Posición
Mediana : Me = P50 = X0.50 Mediana = 36 años

El 50% de las personas tienen máximo 36 años

Cuartiles: q1= P25 = X0.25 , q3 = P75 = X0.75

q1 = 27 años

El 25% de las personas tienen a los más 27 años y el 75% restante tienen
Mas de 27 años.

Bioestadística Mg. Beatriz Castañeda S. 18


Medidas de Posición
Obtención de cuantilas para datos agrupados
1) Datos agrupados por conteo individual

nº de nº de Nº Xp = xj si y sólo si
hijos familias acumulado
(xi) (ni) Ni
Nj  np y Nj-1  np
0 4 4
1 8 12
2 11 23 P10 = X0.10 = 1 hijo
3 15 38
4 10 48
5 13 61 P50 = X0.50 = 3 hijos
6 3 64

Total 64 P75 = X0.75 = 4 hijos

Bioestadística Mg. Beatriz Castañeda S. 19


Medidas de Posición
Se determina el intervalo que
2) Datos agrupados por contiene a la cuantila Xp como
intervalos
Edad Nº de Nº
LjI – Ljs Si y sólo si
(años) mujeres Porcentaje acumulado
20 - 29 5 17% 5
30 - 39 6 21% 11
Nj  np y Nj-1  np

np  N 
40 - 49 10 34% 21
50 - 59 5 17% 26 j 1
60 - 69 2 7% 28 X p  L jI  c
70 - 79 1 3% 29 nj
Total 29 100%

P25 = 29.5 + 10 (7.25 – 5) = 33.5 años


6
P50 = 39.5 + 10 (14.5 – 11) = 43 años
10
Bioestadística Mg. Beatriz Castañeda S. 20
Medidas de dispersión
Medidas de Dispersión o variabilidad:
Rango, Varianza y desviación estándar, coeficiente de variación

Rango: Indica la variabilidad general de los datos obteniendo la diferencia


entre los valores máximo y mínimo. Se usa con muestras pequeñas.

Varianza y Desviación estándar: Indican la variabilidad como la medida


de dispersión de los datos respecto a la media.
i n n

(x x
2
i  x) 2 2
i n x
S
S 
2 i 1
 i 1
; S S ; 2
CV  x100
n 1 n 1 x
Coeficiente de Variación: Indica la dispersión en unidades porcentuales
de la media
Bioestadística Mg. Beatriz Castañeda S. 21
MEDIDAS DE RESUMEN
Los siguientes son los niveles de hemoglobina (g/100ml) de 10
niños que reciben tratamiento para anemia hemolitica:

9,1 10,0 11,4 12,4 9,8 8,3 9,9 9,1 7,5 6,7

Los datos ordenados Son:

6,7 7,5 8,3 9,1 9,1 9,8 9,9 10,4 11,4 12,4

Medidas de resumen:
Mínimo: 6,7 Máximo: 12,4 x  9,42 g / 100 ml

S2 = 2,895 (g/100ml)2
Rango = 5,7

Mediana= 9,45 g/100ml S = 1,70 g/100ml C.V. = 18%

Bioestadística Mg. Beatriz Castañeda S. 22


Medidas de Dispersión
Cálculo de varianza para datos agrupados
k k

 ( x i  x ) ni  x i2 ni  n x
2 2

S2  i
 1
Varianza muestral
n1 n1

Edad (años) xi ni xi n i X i2 n i
2645.5
x  35.27 años
5 –14 9.5 5 47.5 451.25 75
15 – 24 19.5 10 195.0 3802.50
105538.75  75( 35.27) 2
25 – 34 29.5 20 590.0 17405.00 S 2
  165.42
74
35 – 44 39.5 22 869.0 34325.50

45 – 54 49.5 13 643.5 31853.25 S  12.86 años


55 – 64 59.5 5 297.5 17701.25
12.86
Total 75 2645.5 105538.75 C .V .  x 100  36.5%
35.27
Bioestadística Mg. Beatriz Castañeda S. 23
Asimetría

x Me Mo
Mo = x = Me Mo Me x

3 ( x  Me )
Coeficiente de asimetría de Pearson: S kP 
S

Bioestadística Mg. Beatriz Castañeda S. 24


Curtosis

Distribución
platicúrtica Distribución Mesocúrtica Dist. Leptocúrtica

Coeficiente de curtosis Distribución platicúrtica: k 0


( x0.75  x0.25 )
K Distribución Mesocúrtica: k  0.25
2 ( x0.90  x0.10 )

Distribución Leptocúrtica: k  0.5


Bioestadística Mg. Beatriz Castañeda S. 25
Medición en Epidemiología
TASA
Una tasa es una comparación por cociente entre un número de eventos
ocurridos en un tiempo y lugar dados y la población que estuvo
expuesta al riesgo de que le ocurrieran dichos eventos en la misma
época y en ese mismo lugar

a
Tasa  x base; base  10 n
ab

La tasa es la expresión numérica del riesgo al que estuvo sometida la


población.
Nos permite estimar la probabilidad de que exista ese riesgo para la
población en períodos inmediatos, particularmente si las condiciones
de dicha población se mantienen estables.

Bioestadística Mg. Beatriz Castañeda S. 26


Tasas de uso frecuente
N º de defunciones ocurridas en
una región y año dado
Tasa anual bruta de mortalidad  x 1000
Estimación de la población a mitad de año
en la misma región y el mismo año

N º de defunciones niños menores de un año


ocurridas en una región y año dado
Tasa de mortalidad inf antil  x 1000
N º total de nacimiento s vivos ocurridos en la
poblaciónen de la misma región y año dado

N º de enfermos nuevos de una afección


aparecidos en una región y año dado
Tasa de incidencia  x 1000
Estimación de la población a mitad de año
en la misma región y el mismo año

Bioestadística Mg. Beatriz Castañeda S. 27


Calcificaciones pulmonares en dos poblaciones
con fabrica de asbestos

Distancia de Población A Población B


domicilios a la
fábrica asbestos Habitantes Habitantes
(Km) Nº % Casos Nº % Casos

0 – 0,9 1 531 13,8 279 5 438 9,1 462


1,0 – 1,9 1 904 17,2 69 4 489 7,5 117
2,0 – 2,9 2 599 23,5 141 10 351 17,4 802
3,0 – 3,9 4 672 42,2 2 36 994 62,0 37
4,0 y más 368 3,3 119 2 384 4,0 665

TOTAL 11 074 100,0 610 59 656 100,0 2083

Tasas de calcificaciones Tasa A =610/11074= 55,1calcific/ 1000 h


Tasa B =2083/59,656= 34,9calcific/ 1000 h
Bioestadística Mg. Beatriz Castañeda S. 28
Ajuste de Tasas
Cuando dos poblaciones tienen diferente estructura de
población no es apropiado comparar las tasas globales ya que
está comparación podría no ser válida debido a éstas
diferencias

Método directo de ajuste de tasas

1° Definir cuál población será sometida a las condiciones de la otra


2° Con las tasas específicas de la población mayor se calculan los
casos esperados de la población menor

Casos esperados = Población x tasa


Constante

Bioestadística Mg. Beatriz Castañeda S. 29


Ajuste de Tasas
Casos esperados en población A,
bajo condiciones de población B
Casos esperados en
Distancia Estructura de A Tasas de A bajo condiciones de
(Km) B B
Habitantes

0 – 0,9 1 531 85,0 130


1,0 – 1,9 1 904 26,1 50
2,0 – 2,9 2 599 77,5 201
3,0 – 3,9 4 672 1,0 5
4,0 y más 368 278,9 103
TOTAL 11 074 489

Tasa ajustada = Suma de casos esperados x constante


Población

Tasa ajustada (A) = 489 x 1000 = 44,2


1074
Bioestadística Mg. Beatriz Castañeda S. 30
Riesgo Relativo
Estudios de Cohorte  Incidencia Acumulativ a

Personas Expuestas No Total


Expuestas
Enfermos A1 A0 A
No N1-A1 N 0- A0 N-A
enfermos
Total N1 N0 N
A1 / N1
RR 
A0 / N0
Estimación Interválica al 95% de confianza
N1  A1 N 0  A0
ln RR  1.96 
N1 A1 N 0 A0
Límites : L  e
Bioestadística Mg. Beatriz Castañeda S. 31
Riesgo Relativo
Si RR = 1, nos indica que el factor de exposición no es un factor
de riesgo para la enfermedad, pues se tiene la misma incidencia
de enfermedad para las personas expuestas que para las no
expuestas.

- Si RR  1, nos indica que el factor de exposición es un factor


de riesgo para la enfermedad, ya que para las personas
expuestas se tiene mayor incidencia de la enfermedad que para
las personas no expuestas.

Si RR  1, nos indica que el factor de exposición es un factor de


protección para la enfermedad, ya que para las personas
expuestas se tiene menor incidencia de la enfermedad que para
las no expuestas.
Bioestadística Mg. Beatriz Castañeda S. 32
Riesgo Relativo
Asuma que de 100 individuos expuestos 20 desarrollaron la
enfermedad. En un grupo de 200 individuos no expuestos, 25
desarrollaron la enfermedad. Así en un arreglo de 2x2 tenemos:

Individuos Expuesto No expuestos Total


s RR = (20/100)
Enfermos 20 25 45
(25/200)
No enfermos 80 175 255 = 1.60

Total 100 200 300

Li = 0.935
100  20 200  25
ln( 1.60 )  1.96 
100 ( 20 ) 200 ( 25 )
Le Ls = 2.74
Bioestadística Mg. Beatriz Castañeda S. 33
Odds Ratio
Estudios de Casos  Control
Personas Expuestas No Expuestas Total
Casos a b N1
Controles c d N0

a/b
OR 
c/d
Estimación Interválica al 95% de confianza
1 1 1 1
ln OR  1.96   
Límites : L  e a b c d

Bioestadística Mg. Beatriz Castañeda S. 34


Odds Ratio
Si OR = 1, nos indica que el factor de exposición no es un
factor de riesgo para la enfermedad, pues la relación de
expuestos a no expuesto es la misma para casos y controles.

Si OR  1, nos indica que el factor de exposición es un factor


de riesgo para la enfermedad, ya que la razón de casos que
han sido expuestos es mayor que la razón de controles que
han sido expuestos.

Si OR  1, nos indica que el factor de exposición es un factor


de protección para la enfermedad, ya que aquí la razón de
expuestos es mayor en los controles que en los casos.

Bioestadística Mg. Beatriz Castañeda S. 35


Odds Ratio
En un estudio de casos-control de dieta con frituras y cáncer
pancreático (Norell et al 1986), los siguientes datos fueron
obtenidos:
Dieta No dieta con
Individuos con frituras Total
frituras
Casos 53 43 96 OR = 53/43 = 1.98
53/85
Controles 53 85 138

Total 106 128 234

1 1 1 1 Li = 1.167
ln( 1.98 )  1.96   
Le 53 43 53 85
Ls = 3.359

Bioestadística Mg. Beatriz Castañeda S. 36

También podría gustarte