Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Y DEMOGRAFIA
LUIS FERNANDO VILLANUEVA GARCIA
MEDICO CIRUJANO EPIDEMIOLOGO
CMP 25521 RNE 20365
MAESTRO EN SALUD PUBLICA
MODULO I
BIOESTADISTICA
¿QUÉ ES LA ESTADÍSTICA?
Estadística es la ciencia de:
• Recolectar
• Describir
• Organizar
Datos
• Interpretar
con el fin de transformar dichos datos en
información y conseguir una toma de decisiones
más eficiente.
¿PARA QUÉ SIRVE LA ESTADÍSTICA?
• La Ciencia se ocupa en general de fenómenos observables
• “La Bioestadística [...] enseña y ayuda a investigar en todas las áreas de las
Ciencias de la Vida donde la variabilidad no es la excepción sino la regla”
Carrasco de la Peña (1982)
DEFINICIÓN
La Estadística es la Ciencia de la
•ESTADISTICA DESCRIPTIVA
•ESTADISTICA INFERENCIAL
ESTADÍSTICA DESCRIPTIVA: Conjunto de métodos
estadísticos que se relacionan con el resumen y
descripción de datos, como tablas, gráficas y el
análisis mediante algunos cálculos.
50
Nº trabajadores que 45
Nº días
X
40
se ausentaron
( X )
35 i 2
Industrial iRX
X , S
30
25 Sistemas
0-4 4 20 Civil n n 1
15 Electrónica
5-9 10 10
10-14 8 5
0
Ciclo 1 Ciclo2
ESTADÍSTICA INFERENCIAL.- Conjunto de
métodos cuya finalidad es hacer generalizaciones
o inferencia sobre una población, utilizando la
información de una parte de ella
POBLACIÓN
(‘POPULATION’) ES EL
CONJUNTO SOBRE EL QUE
ESTAMOS INTERESADOS
EN OBTENER
CONCLUSIONES (HACER
INFERENCIA).
NORMALMENTE ES
DEMASIADO GRANDE
PARA PODER ABARCARLO.
Muestra
• (‘sample’) es un subconjunto suyo Variable
al que tenemos acceso y sobre el
que realmente hacemos las Es una característica
observaciones (mediciones) definida en la población
• Debería ser “representativo” y que puede tomar dos o
• Esta formado por miembros más valores o
“seleccionados” de la población
(individuos, unidades modalidades.
experimentales).
VARIABLE
ES UNA CARACTERÍSTICA DEFINIDA EN LA
POBLACIÓN Y QUE PUEDE TOMAR DOS O MÁS
VALORES O MODALIDADES.
• Una variable es una característica observable
que varía entre los diferentes individuos de una
población. La información que disponemos de
cada individuo es resumida en variables.
El grupo sanguíneo
{A, B, AB, O} Var. Cualitativa
Su nivel de felicidad “declarado”
{Deprimido, Ni fu ni fa, Muy Feliz} Var. Ordinal
El número de hijos
{0,1,2,3,...} Var. Numérica discreta
La altura
{1’62 ; 1’74; ...} Var. Numérica continua
CLASIFICACIÓN DE VARIABLES
Cualitativa Cuantitativa
Es la característica cuyos Es la característica cuyos
valores se expresan en
valores se expresan en
escala nominal u ordinal.
escala de intervalos o de
Ej..
razón.
•Sexo
•Cursos del primer Se dividen en:
ciclo – Discretas
•Tipos de envase – Continua
CLASIFICACIÓN DE LAS VARIABLES
CUANTITATIVAS
Discreta Continua
Cuando toma sólo ciertos Es aquella variable que
valores en el intervalo puede tomar cualquier
considerado y no admite valor en el intervalo
valores intermedios entre considerado.
dos valores consecutivos. Ej.: Temperatura de
Ej.: Número de artículos ignición de un gas,
defectuosos tiempo de corte de un
torno corriente.
TIPOS DE VARIABLES
• Cualitativas
Si sus valores (modalidades) no se pueden asociar naturalmente a un número
(no se pueden hacer operaciones algebraicas con ellos)
• Cuantitativas o Numéricas
Si sus valores son numéricos (tiene sentido hacer operaciones algebraicas con
ellos)
Porcent. Porcent.
Frec. (válido) acum.
0 419 27,8 27,8
1 255 16,9 44,7
2 375 24,9 69,5
3 215 14,2 83,8
4 127 8,4 92,2
5 54 3,6 95,8
6 24 1,6 97,3
7 23 1,5 98,9
Ocho+ 17 1,1 100,0
Total 1509 100,0
Datos agrupados:
NEGATIVO 19 57.58
P. FALCIPARUM 13 39,39
P. VIVAX 1 3,03
TOTAL 33 100
DIAGNOSTICO DE MALARIA
P. VIVAX 1
P. FALCIPARUM 13
NEGATIVO 19
0 5 10 15 20
DIAGNOSTICO DE MALARIA
3,03
39,39
57,58
60
50 47
40
30 24
20
10 6
0
NUNCA ESCASAMENTE OCACIONALMENTE FRECUENTEMENTE
PORCENTAJE CON QUE SE TERMINARON EL
TRATAMIENTO PARA MALARIA
4,05
16,22
31,76
47,97
CONDICION NUMERO
Bacteriemia sin 1
crecimiento
Bacteriemia S Aureus 2
Bacteriemia S 1
epidermidis
Sin bacteriemia, sin 4
cultivo
Sin bacteriemia, sin 7
crecimiento
Sin bacteriemia S 5
epidermidis
TOTAL 20
TABLA DE CONTINGENCIA SOBRE FRECUENCIA DE BACTERIEMIA EN PACIENTES
CON CULTIVOS POSITIVOS DE CATETER
BACTERIEMIA NUMERO DE
PACIENTES
SI 4
NO 16
TABLA DE CONTINGENCIA PARA PACIENTES CON o SIN BACTERIEMIA
10 - 18 11 0,11 11 30 0,30 30
19 - 27 9 0,09 9 39 0,39 39
28 - 36 11 0,11 11 50 0,50 50
37 - 45 5 0,05 5 55 0,55 55
46 - 54 18 0,18 18 73 0,73 73
55 - 63 8 0,08 8 81 0,81 81
64 - 72 5 0,05 5 86 0,86 86
73 - 81 5 0,05 5 91 0,91 91
18
16
14
12
10
0
0.5 – 9.5 9.5 – 18.5 18.5 – 27.5 27.5 – 36.5 36.5 – 45.5 45.5 – 54.5 54.5 – 63.5 63.5 – 72.5 72.5 – 81.5 81.5 – 90.5
Distribución de frecuencias con datos
agrupados
Rango: Es la diferencia entre el mayor valor y el menor de ellos.
Ejemplo:
Si la estatura del alumno más alto de un curso es 1,92 m
y la del menor es 1,68 m, entonces el rango de estos datos es:
1,92 m – 1,68 m = 0,24 m = 24 cm.
61 76 66 77 70 83 88 63 77 67 68 72 82
78 74 84 63 76 84 78 75 72 75 83 80 73
62 83 75 67 72 83 83 84 84 67 71 87 80
77 64 77 82 83 85 79 72 83 83 87
Para ordenarlos y agruparlos, se establecen los intervalos
que se usarán, determinando el rango de los datos.
Dato mayor: 88 Dato menor: 61 Rango: 88 – 61 = 27
De acuerdo con el rango y teniendo en cuenta la cantidad de
datos, se forman los intervalos.
Si quisiéramos formar 6 intervalos, se tiene que dividir el rango
con la cantidad deseada.
27 : 6 = 4, 5 se aproxima a 5 ( amplitud aparente del intervalo)
Lri = 69 70 =
139 = 69,5 Límite real inferior
2 2
Lrs = 74 75 =
149 = 75,5 Límite real superior
2 2
Tamaño o amplitud de una clase: Corresponde a la diferencia
entre su límite real superior y el límite real inferior.
Ejemplo:
75,5 – 69,5 = 5 Su amplitud es igual a 5
NOTA: Todas las clases tienen igual tamaño.
Marca de clase: Es el punto medio de un intervalo de
clase.
Ejemplo.
Intervalo Marca de clase
60 – 64 62
65 – 69 67
70 – 74 72
a) Determina el rango
Respuesta:
182 - 150 = 32
b) Determina 8 intervalos:
Respuesta:
Intervalo M de C
e) Determinar el límite
150 – 154 152 real inferior del tercer
155 – 159 157
160 – 164 162
intervalo
165 – 169 167
Respuesta:
170 – 174 172
175 – 179 177 Lri = 159 + 160 = 159,5
180 – 184 182 2
Respuesta:
h) Determinar la frecuencia
Intervalo F. acum
150 – 154 4 relativa porcentual
155 – 159 12 Respuesta:
160 – 164 26
165 – 169 33 Intervalo F. Relat %
170 – 174 35
150 – 154 10
175 – 179 39
155 – 159 20
180 – 184 40
160 – 164 35
165 – 169 17,5
170 – 174 5
175 – 179 10
180 – 184 2,5
i) ¿Cuántos alumnos miden menos de 160 ?
X = 3 + 5 + 7 + 6 + 4 +5 + 3 +5 + 4 + 5 + 3 + 4 = 54 = 4,5
12 12
Ejemplo:
Intervalo Frecuencia Marca de clase f • x X = 3805
60 – 64 5 62 310
50
65 – 69 5 67 335
70 – 74 8 72 576
75 – 79 12 77 924 X = 76,1
80 – 84 16 82 1312
85 – 89 4 87 348
La media aritmética ponderada es otra forma de calcular el
promedio, utilizando la tabla de distribución de frecuencias.
Respuesta:
Se deben ordenar las calificaciones: 68 72 78 84 87 91
Luego, la mediana es 78 + 84 = 162 = 81
2 2
Ejercicio
Dada la tabla de distribución de edades de un grupo de padres
cuyos hijos están en primer año de universidad.
Hallar: a) media aritmética b) Mediana c) Moda
Edad frecuencia a) Media aritmética
45 – 48 2 Edad f x f•x
49 – 52 5 45 – 48 2 46,5 93
53 – 56 12 49 – 52 5 50,5 252,5
57 – 60 8 53 – 56 12 54,5 654
61 – 64 5 57 – 60 8 58,5 468
61 – 64 5 62,5 312,5
X = f • x = 1780 = 55,625
n 32
b) Mediana
Edad f F acum n / 2 = 32 / 2 = 16
45 – 48 2 2
49 – 52 5 7
L i m = 52 + 53 = 52,5
53 – 56 12 19 2
57 – 60 8 27
f (acum ant) = 7
61 – 64 5 32
n = 32 c = 56,5 - 52,5 = 4
f m = 12
Me = 52,5 + ( 16 – 7 ) • 4 = 52,5 + 9 • 4 = 55,5
12 12
c)
: Moda:
El intervalo modal es [53 - 56] . Luego. La moda es su marca
de clase: 53 + 56 = 54,5
2
* Construye una tabla de distribución de frecuencias de datos
agrupados en intervalos de clase. Considera como limite
inferior del primer intervalo = 10 y c = 10
El puntaje obtenido por 130 alumnos en una prueba de biología
es el siguiente:
12 45 53 85 23 91 34 56 65 70 72 74 86
95 32 45 56 58 33 49 55 70 66 62 64 55
83 26 34 72 60 64 72 80 58 98 50 20 35
76 68 90 99 56 48 56 68 82 40 92 38 56
84 66 78 74 25 15 48 50 66 49 53 83 91
42 64 72 54 89 92 28 34 40 56 64 68 63
35 56 66 38 82 78 74 90 85 66 70 72 58
66 80 80 95 96 99 94 40 42 58 65 67 81
90 50 48 52 62 70 80 93 45 36 49 81 73
56 38 51 23 90 84 96 75 38 28 36 83 29
Respuesta:
Respuesta: 59 alumnos
g) ¿Cuántos alumnos obtuvieron menos de 30 puntos?
Respuesta: 10 alumnos
Respuesta: 93 alumnos
Respuesta: 39
m) ¿Cuál es el límite real inferior del quinto intervalo?
Respuesta: 49,5
Respuesta: c = 10
n) Calcula la media aritmética:
Respuesta:
Intervalo M. de Clase frecuencia f • x
10 – 19 14,5 2 29 X = f•x
20 – 29 24,5 8 196 n
30 – 39 34,5 13 448,5
40 – 49 44,5 14 623
50 – 59 54,5 22 1199
X = 8095
60 – 69 64,5 20 1290 130
70 – 79 74,5 17 1266,5
80 – 89 84,5 17 1436,5
90 - 99 94,5 17 1606,5
X = 62,26
n = 130
ñ) Calcula la mediana:
Respuesta:
n / 2 = 130 / 2 = 65
Intervalo frecuencia F. acum.
10 – 19 2 2 L i m = 59,5 c = 10
20 – 29 8 10
30 – 39 13 23
f(acum. ant) = 59
40 – 49 14 37 f m = 20
50 – 59 22 59
60 – 69 20 79
Me = 59,5 + ( 65 – 59 ) • 10
70 – 79 17 96
80 – 89 17 113
20
90 - 99 17 130
Me = 59,5 + 6 • 10
n = 130 20
Me = 59,5 + 3 = 62,5
o) Calcular el intervalo modal y la moda :
Respuesta:
Luego, Mo = 50 + 59 = 54,5
2
DISPERSION
• Los estudiantes de Metodología de la Investigación obtienen diferentes calificaciones en
la asignatura (variabilidad). ¿A qué puede deberse?
• Por ejemplo supongamos que todos los alumnos poseen el mismo nivel de conocimiento.
¿Las notas serían las mismas en todos? Seguramente No.
• En alguna pregunta difícil, se duda entre varias opciones, y al azar se elige la mala
• Variabilidad por azar, aleatoriedad.
GRADOS DE LIBERTAD
• ¿Por qué calculamos la varianza dividiendo por n - 1, en
lugar de dividir por n?
• Como la suma de las desviaciones es 0, la última
desviación es una combinación lineal de las n - 1
desviaciones restantes.
• Por lo tanto, no estamos calculando el promedio de n
números independientes (los desvíos). Solo n -1 de las
desviaciones al cuadrado pueden variar libremente y por
ello, promediamos la suma de los desvíos al cuadrado
dividiendo por n -1.
• Al numero n -1 se lo denomina grados de libertad de la
varianza o de la desviación típica.
Ejercicios
Calcular la desviación típica de las siguientes notas de
Matemática: 2,0 - 3,9 - 5,0 - 5,9 - 6,2
Respuesta:
* Primero se debe obtener el promedio
x = 2,0 + 3,9 + 5,0 + 5,9 + 6,2 = 4,6
5
* Se calcula la desviación típica
S= ( 2 4,6) 2
(3,9 4,6) 2
(5 4,6) 2
(5,9 4,6) 2
( 6, 2 4,6) 2
5
6,7 0,4 0,1 1,6 2,5 11,3
S= =
5 5
= 2,2 = 1,4
Luego, la desviación típica de las notas es 1,4 con respecto
al promedio
Si de estas notas descartáramos el 2, la nota más alejada del
promedio, entonces la desviación típica sería S = 1,04 ; este
valor es menor que 1,4.
Las notas consideradas, sin la nota 2, tendrían una dispersión
menor, es decir, estarían más centradas.
Calcular la desviación típica de las siguientes notas:
5,2 - 4,9 - 5 - 5,1 - 5,2 - 5,3 - 4,9 - 5,2
Respuesta:
* Se obtiene el promedio x = 5,1
8
8 61,0
S= 0,01 0,04 0,01 0 0,01 0,04 0,04 0,01 = 8
S= 0,02 = 0,1
Este valor es considerablemente menor que el ejercicio anterior. Se
debe a que los datos son más homogéneos que en la otra distribución,
presentan escasa dispersión con respecto al promedio.
Desviación típica en datos agrupados
Calcular la S de la siguiente distribución que representa
las horas diarias dedicadas al estudio de 20 alumnos, con un
promedio de 4,7
* f •| x – x | 2
1407973
* Calcular marca de clase * determinar f • |x – x |2
* Calcular las desviaciones * Determinar la sumatoria del producto
* Determinar las desviaciones al cuadrado
Ejemplo:
A continuación se presentan las tarifas (en
unidades monetarias) de dos laboratorios de
análisis clínicos. El laboratorio I tiene sus tarifas en
soles y el laboratorio II en dólares ¿Cuál de ellos
tiene un plan tarifario más homogéneo o estable?.
40 -16.14 260.50
70 13.86 192.10
60 3.86 14.90
48 -8.14 66.26
52 -4.14 17.14
65 8.86 78.50
58 1.86 3.46
X 393 Xi x 0 Xi x
2
632,86
Si Xi x 632.86
2
n
i
( X x )
2
632.86
S i 1
10.27
n 1 7 1
S
CV 100
x
10.27
CV 100 18.29
56.14
Laboratorio II n
Xi 847
x i 1 105.87
n 8
x Xi x Xi x 2
70 -35.87 1286.6569
35 -70.87 5022.5569
150 44.13 1947.4569
140 34.13 1164.8569
82 -23.87 569.7769
110 4.13 17.0569
140 34.13 1164.8569
120 14.13 199.6569
X 847 Xi x 0,04 Xi x
2
11372,88
n
Si X i x
2
11372.88
i 1
n
(X i x )
2
11372,88
S i 1
40.30
n 1 8 1
S 40,30
CV 100 CV 100 30,06
x 105,87
• Percentil o centil
• Decil
• Cuartil
• Quintil
PERCENTIL o CENTIL
• El percentil k, al que simbolizaremos
como Pk, es el valor numérico de la
variable tal que el k por ciento de los
datos ordenados está por debajo de ese
valor. En consecuencia, el (100-k) por
ciento de los datos está por encima de
Pk.
Interpreta el texto siguiente:
n
Localización .k
100
n.k
100 Fi 1
Identificación
Pk Li A
fi
Ejemplo 1
• En la siguiente distribución,
calcule el percentil 20 y el
percentil 95.
Intervalo fi
[50 - 70[ 30
[70 - 90[ 50
[90 - 110[ 65
[110 - 130[ 30
[130 – 150] 25
Solución
Intervalo fi Fi
[50 - 70[ 30 30
P20 [70 - 90[ 50 80
[90 - 110[ 65 145
[110 - 130[ 30 175
[130 – 150] 25 200
n.k 200.20
Percentil 20: Identificación: 40
100 100
n.k
Localización: 100 Fi 1
P20 Li A 70 40 30 .20
fi 50
74
Solución
Intervalo fi Fi
[50 - 70[ 30 30
[70 - 90[ 50 80
[90 - 110[ 65 145
[110 - 130[ 30 175
P95 [130 – 150] 25 200
n.k 200.95
Percentil 95: Identificación: 190
100 100
n.k
Localización: 100 Fi 1
P95 Li A 130 190 175 .20
fi 25
142
DECIL
• Los deciles son los siguientes:
Decil 1 : D1 P10
Decil 2 : D2 P20
Decil 3 : D3 P30
…
Decil 9 : D9 P90
CUARTIL
• Los cuartiles son los siguientes:
Cuartil 1 : Q1 P25
Cuartil 2 : Q2 P50 Me
Cuartil 3 : Q3 P75
RANGO INTERCUARTIL
Q 3 – Q1
EJEMPLO 2
Los datos mostrados corresponden a los pesos
de los recién nacidos (en gramos) en un centro
médico asistencial. Rango de
Cantidad
pesos
Si aquellos del tercer percentil 1500 - 2000 15
deben ser asistidos en una 2000 - 2500 40
incubadora, ¿para qué rango de 2500 - 3000 120
pesos serán los recién nacidos
3000 - 3500 80
trasladados a una incubadora?
3500 - 4000 35
4000 - 4500 10
EJEMPLO 3
Una empresa ha aplicado un test a los
postulantes al puesto de supervisor. Los
resultados se observan en la tabla
Puntaje Cantidad
La empresa calcula el noveno
decil para decidir los que pasan 00 – 20 5
a una entrevista personal. 20 – 40 15
¿Qué puntaje mínimo requieren
40 – 60 40
los que pasen a la etapa de la
entrevista? 60 – 80 30
80 – 100 10
_________Medidas de Posición: Un número para mostrar la localización de los Datos
Medidas de Posición para datos no agrupados: Medidas de Posición para datos agrupados:
Cuando se desea calcular una medida de posición para Cuando se desea calcular una medida de posición para datos
datos no agrupados, se debe ordenar los datos y asignarle agrupados, se determina la posición del porcentil, empleado la
en forma creciente un número para determinar así la fórmula:
posición que ocupa el porcentil:
j.N
Posición del Porcentil= Posición del Porcentil=
K
Una vez determinado la posición que ocupa el porcentil j= Es el número del porcentil que se desea determinar (Ql, D3, P80 )
debemos aplicar la siguiente fórmula para determinar su Li = Límite inferior de la clase a la cual pertenece el porcentil
valor: j.N
K = Posición del Porcentil
CALCULE EL CUARTIL 1
CALCULE EL DECIL 8
PERCENTIL 60
ASIMETRIA
Si bien es fácil tener una idea de si la
distribución es simétrica o no tras ver la
representación gráfica, es importante
cuantificar la posible asimetría de una
distribución.
Recordemos que cuando la distribución de los
datos es simétrica, la media, la mediana y la
moda coinciden. (Y la distribución tiene la
misma forma a la izquierda y la derecha del
centro)
Asimetría hacia la derecha
(asimetría positiva)
5
4
3
2
1
0
Hombre Mujer
• Muestra:
10=tamañ
o
muestral
MHHMMHMMMH
• equivale a
HHHH MMMMMM
¿CUÁNTOS INDIVIDUOS
TIENEN MENOS DE 2 HIJOS? Número de hijos
frec. indiv. sin hijos
+ Porcent. Porcent.
frec. indiv. con 1 hijo Frec. (válido) acum.
= 419 + 255 0 419 27,8 27,8
= 674 individuos 1 255 16,9 44,7
¿QUÉ PORCENTAJE DE 2 375 24,9 69,5
INDIVIDUOS TIENE 6 HIJOS O 3 215 14,2 83,8
MENOS? 4 127 8,4 92,2
97,3%
5 54 3,6 95,8
¿QUÉ CANTIDAD DE HIJOS ES 6 24 1,6 97,3
TAL QUE AL MENOS EL 50% DE 7
LA POBLACIÓN TIENE UNA 23 1,5 98,9
CANTIDAD INFERIOR O IGUAL? Ocho+ 17 1,1 100,0
2 hijos Total 1509 100,0
GRÁFICOS PARA V. CUALITATIVAS
• Diagramas de barras
• Alturas proporcionales a las frecuencias (abs. o
rel.)
• Se pueden aplicar también a variables discretas
• Pictogramas
• Fáciles de entender.
• El área de cada modalidad debe ser proporcional
a la frecuencia. ¿De los dos, cuál es incorrecto?.
GRÁFICOS DIFERENCIALES PARA
VARIABLES NUMÉRICAS
• Son diferentes en función de que
419
400 375
Recuento
215
absolutas o relativas.
200
127
54
Número de hijos
posibles
250
Recu ento
entre dos puntos cualesquiera
150
frecuencia) de individuos en el
intervalo. 50
20 40 60 80
Estadísticos/ Parámetros:
CUANTITATIVAS
Miden alguna cualidad o atributo "cuantificable" de los individuos. (Valor
numérico)
DISCRETAS CONTINUAS
Las variables discretas, al ser Las variables continuas, aquellas
numerables, pueden tomar una serie de medibles que pueden tomar infinitos
valores determinados, pero no los valores dentro de un campo de
valores intermedios (Ej, número de variación (peso, altura, temperatura…)
años de escolarización, número de
hijos por familia…).
NIVELES DE MEDICIÓN DE LAS VARIABLES
DIAGRAMA
RECTANGULAR
a)Media aritrmética:
Datos sin agrupar Datos agrupados
X= ∑x X= ∑ fx
N N
b)Media Ponderada:
Xw= ∑ wx
∑w
Ejemplo
x
xf i i
N
45 5 55 10 115 3
Peso M. Clase Fr. Fr. ac. 69,3
58
40 < 50 45 5 5
50 < 60 55 10 15
60 < 70 65 21 36
70 < 80 75 11 47
80 < 90 85 5 52
90 < 100 95 3 55
58
Mediana: de un conjunto de valores ordenados en magnitud es el valor central
o la media de los dos valores centrales. Es un valor que divide a las
observaciones en dos grupos con el mismo número de individuos .
Altura mediana
Mediana de nº observaciones impar: N/2 + 0,5:
Ejemplo: 1,2,4,5,6,6,8
nº observaciones, 7; (7/2)+0,5=4 ; hay que buscar el valor que ocupa la
posición 4ª: 1,2,4,5,6,6,8 ;luego la mediana es 5
EJEMPLO
-Mediana de 3,5,6,8,9,11 es 7
-Mediana de 3,5,6,8,9,29 es 7
Ejemplo
Peso M. Clase Fr. Fr. ac.
40 < 50 45 5 5
50 < 60 55 10 15
60 < 70 65 21 36
1 / 2 * N Fi 1
70 < 80 75 11 47 Mediana L c
80 < 90 85 5 52
fi
1 / 2 * 58 15
90 < 100 95 3 55
60 10 66,6
100 < 110 115 3 58 21
58
La moda: se define como el valor que tiene una mayor frecuencia en un
conjunto de datos (es decir, aquel que más se repite).
Para datos agrupados en intervalos
Mo= Li + c. D1
D1+D2
D1: fi-fi-1
D2: fi- fi+1
40 < 50 45 5 5
50 < 60 55 10 15
80 < 90 85 5 52
11
Mo 60 10 65,24
90 < 100 95 3 55
11 10
100 < 110 115 3 58
58
Estadísticos de posición
Cuartiles: Dividen a la muestra en 4 grupos homogéneos.
Primer cuartil = Percentil 25 = Cuantil 0,25
Segundo cuartil = Percentil 50 = Cuantil 0,5 = mediana
Tercer cuartil = Percentil 75 = cuantil 0,75
40 < 50 45 5 5
50 < 60 55 10 15
60 < 70 65 21 36
70 < 80 75 11 47
80 < 90 85 5 52
90 < 100 95 3 55
58
75 / 100 N Fi 1 43,5 36
P75 Li c 70 10 76,8
f 11
Medidas de dispersión
Las medidas de dispersión indican el grado de representatividad de las
medidas de tendencia central. Miden el grado de dispersión/ concentración de
los datos en torno a las medidas de tendencia central
Mediana Rango
Rango intercuartílico
Rango entre percentiles
ABSOLUTAS Media Desviación media
Varianza
Desviación típica
0.05
Mín. P25 P50 P75 Máx.
1, 2, 3,4,4,8. El rango es 8-1=7
0.04
Es muy sensible a los valores extremos.
0.03
Rango entre percentiles (‘interquartile range’):
Es la distancia entre percentil 90 y percentil 10. 25% 25% 25% 25%
0.02
• Rango entre percentiles = P90 – P10
Rango intercuartílico
Parecida al rango, pero eliminando las
0.01
observaciones más extremas inferiores y superiores. Rango
0.00
Rango intercuartílico: 150 160 170 180 190
Es la distancia entre primer y tercer cuartil.
• Rango intercuartílico = Q3 - Q1
Parecida al rango, pero eliminando las
observaciones más extremas inferiores y superiores.
Es el menos sensible a valores extremos.
Dispersión absoluta: media
Desviación media:
•Mide el promedio de las desviaciones (absolutas) de las observaciones con respecto
a la media.
Varianza S2 :
•Mide el promedio de las desviaciones (al cuadrado) de las observaciones con
respecto a la media.
•Desviación típica
Es la raíz cuadrada de la varianza
No debe usarse cuando para variables cuyo nivel de medición es por intervalos, es decir,la
variable cuenta con un valor 0 fijado arbitrariamente.
PROBABILÍSTICOS NO PROBABILISTICOS
Aleatorio
Muestral
Sistemático
V = v± e
Valor Valor
Medido en la ERROR
Verdadero
muestra
en la
población
ERROR ALEATORIO
s
ez 1 f
n
Donde:
Z: grado de confianza de la estimación
s: desviación típica muestral de la variable analizada
n: tamaño de la muestra
1-f: Factor de corrección para poblaciones finitas. f= n/N
EL ERROR MUESTRAL ES MAYOR EN
LA MEDIDA QUE:
pq
ez 1 f
n 1
Donde:
Z: grado de confianza de la estimación
p: proporción de la muestra para la categoría a examinar
q: 1-p
n: tamaño de la muestra
1-f: Factor de corrección para poblaciones finitas. f= n/N
TAMAÑO DE LA MUESTRA VS. ERROR
MUESTRAL
MARGEN DE CONFIANZA EN LA ESTIMACIÓN
2
zs 2
z pq
n n n 1 2
e e
Es directamente
proporcional al
nivel de confianza
Z.
Es
Es directamente
inversamente proporcional a
proporcional al la variabilidad
error estimado. del fenómeno a
estudiar.
EJEMPLO DEL CÁLCULO DEL TAMAÑO
DE LA MUESTRA (POBLACIÓN
INFINITA)
Estimando qué proporción de sujetos poseen una
característica al nivel de confianza del 99.7% (Z=3) y un
error de admitido del 2%, será:
32 x50 x50
n 2
5625
2
EL TAMAÑO DE LA POBLACIÓN NO FUE TOMADO
EN CUENTA!!!
4 * 50 * 50 * 60.000
n = ---------------------------------
9 (60.000-1) + 4 * 50 * 50
n= 1091
2
NZ pq
n 2
e ( N 1) Z pq
2
TAMAÑO DE LA MUESTRA
PROBABILÍSTICOS NO PROBABILISTICOS
Por
Simple Sistemático Estratificado
Conglomerados
MUESTREOS PROBABILÍSTICOS: SIMPLE
Ventajas Desventajas
Facilidad en los cálculos Cada que cada miembro de
estadísticos la población tiene que ser
Elevada probabilidad de identificado
lograr “equivalencia” entre Complicado en poblaciones
las características de la grandes
muestra y las Alto costo
correspondientes a la
población
MUESTREOS PROBABILÍSTICOS:
MUESTREO ALEATORIO SISTEMÁTICO
Similar al muestro simple salvo que:
1. Solo la primera unidad de la muestra se elige al azar siempre
que el número seleccionado sea mayor que el coeficiente de
elevación.
Coeficiente de Elevación = N/ n
Donde
N: Tamaño de la población
n : Tamaño de la muestra
2. Los restantes elementos de la muestra se hayan sumando,
sucesivamente el coeficiente de elevación.
MUESTREOS PROBABILÍSTICOS:
MUESTREO ALEATORIO ESTRATIFICADO
Presupone el conocimiento de las características de las
unidades que forman la población para poder dividirla
en grupos ( estratos)
Se eligen los miembros de la muestra en cada estrato
creado siguiendo algún tipo de muestreo de los vistos
anteriormente.
EJ. MUESTREO PROBABILÍSTICO POR ESTRATOS
Escuelas
Estrato Primario
Escuela Escuela
Primarias Secundarias
2500
nestratos
3
EJEMPLO MUESTRO POR ESTRATOS. AFILIACIÓN
PROPORCIONAL
Paso 3: Se calcula a proporción de cada valor obtenido en el paso 1 dentro del paso 2.
Pr oporciónestrato1 85500 / 220500 0,388
Pr oporciónestrato2 101400 / 220500 0,460
Pr oporciónestrato3 33600 / 220500 0,152
Paso 4 : Se calcula el tamaño de la muestra de cada estrato multiplicando
su proporción por el tamaño de la muestra global ( 2500)
0,388 x 2500 970
0,460 x 2500 1150
0,152 x 2500 380
970,1150,380 2500
VENTAJAS Y DESVENTAJAS DEL
MUESTREO ALEATORIO ESTRATIFICADO
Ventajas Desventajas
Escuelas
Escuelas Escuelas
Primarias Secundarias
Todos los profesores de las Escuelas 2 (Primaria) y 1 (Secundaria) son parte de la muestra
EJEMPLOS DE CONGLOMERADOS
Zona Geográfica
Edificio
Una institución
…..
VENTAJAS DEL MUESTREO POR
CONGLOMERADOS
Es ventajoso, desde el punto de vista de costos, si se
pueden agrupar los miembros de la población por
conglomerados, en los cuales el criterio de agrupación
no sea la variable que se estudia.
No es preciso tener un listado de toda la población, sino
de las unidades ( conglomerados) por los que se
agruparán.
DESVENTAJAS
“ Bola de
Por Cuotas
Nieve”
Estratégicos
MUESTRO POR CUOTAS
La población debe ser dividida en estratos
definidos por variables cuya distribución dentro de
la población sea conocida.
Se procede a calcular el tamaño de cada estrato
siguiendo el mismo procedimiento que si fuese un
muestreo probabilístico estratificado.
( proporcional)
MUESTRO POR CUOTAS
A diferencia del M. Probabilístico Estratificado el
entrevistador es libre para escoger a quienes
forman parte de cada estrato. (CUOTA)
MUESTREO POR CUOTAS
Ventajas Desventajas
Pérdidas
por no
respuesta
TIPOS DE ERROR DE NO RESPUESTA
2/2/2018
Parcial
Total
275
EJEMPLOS DE ERRORES DE NO RESPUESTA
El entrevistado puede no contestar una pregunta
por falta de conocimiento sobre esa cuestión, por
considerarla muy entrometida al invadir el ámbito
de su privacidad, porque la considera irrelevante
para los objetivos del estudio, etc.
El entrevistador también contribuye a la no
respuesta parcial por el “olvido” a la hora de
recoger determinadas respuestas, o al tomarlas
equivocadamente.
Ejemplos tomados de : HEADY, P. (1995). «Calibrating Measurement Error in the 1991 Census». Survey
Methods Centre Newsletter, vol. 15, nº 2, p. 3-7.
EJEMPLOS DE ERRORES DE NO RESPUESTA
Por último, el cuestionario genera no respuestas
por problemas en la redacción de las preguntas, y
por la utilización de preguntas «filtro» para que un
grupo de preguntas no sean respondidas por
determinados entrevistados que cumplen (o no
cumplen) una serie de requisitos.
CONSECUENCIAS TIENE LA NO RESPUESTA
Error Sesgo
MÉTODOS DE REDUCCIÓN DEL IMPACTO DE LA NO
RESPUESTA
Prevención Intervención
(luego de la
( durante la recolección
recolección de los datos
de datos ) )
PONDERACIÓN
Conocimiento
Post-
de los que no
estratificación
responden
PRACTICA
2/2/2018
281
MUESTREO ALEATORIO SIMPLE
2/2/2018
PRACTICAR CON LA TABLA DE NUMEROS ALEATORIOS.
MUESTREO
Setiene interés en determinar el porcentaje de
2/2/2018
niños desnutridos menores de 5 años del distrito
FUJI, ubicado en el departamento de la Planice,
durante el mes de enero del 2018:
a. Cual es la población objetivo:
b. Cual es la variable de interés:
c. Cual es la Unidad de Análisis:
d. Cual es el marco muestral:
e. Cual es el estadístico de interés:
283
f. Cual es el parámetro de interés:
2/2/2018
284
2/2/2018
285
MAS
De una población de 20,000 universitarios se
2/2/2018
desea obtener una muestra para conocer la
estatura promedio. La estimación muestral
deberá tener un error máximo de 0.5 cm con
respecto al verdadero promedio con nivel de
confianza del 95%, esto es, que en 95 de
cada 100 intervalos el error no será mayor
de 0.5, un estudio preliminar nos indica que
la desviación estándar será de 5 cm.
286
2/2/2018
287
MAS
Unsondeo previo indica que la proporción
2/2/2018
de analfabetos de una población es de
30% ¿Qué tamaño debe tener la muestra
para estimar con una precisión del 4% y
un nivel de confianza del 95% la
proporción de analfabetos, si el tamaño
de la población mayores de 14 años de
edad es de 10,000?
288
MUESTREO SISTEMÁTICO
Se acercan las Navidades y cierta empresa de
2/2/2018
turrones cree que no va a poder entregar todos
los pedidos a tiempo, a no ser que aumente la
plantilla. La empresa dispone de un listado
ordenado alfabéticamente de 20 personas con
las mismas características para el puesto y que
actualmente están en paro. Puesto que el
tiempo apremia y no es posible hacer una
entrevista para seleccionar al personal, se
decide elegir cinco trabajadores de forma
aleatoria usando el muestreo sistemático.
289
MUESTREO SISTEMÁTICO
2/2/2018
290
2/2/2018
291
MUESTREO ESTRATIFICADO
2/2/2018
292
2/2/2018
293
2/2/2018
294
2/2/2018
295
MUESTREO ESTRATIFICADO
2/2/2018
Se tiene interés en conocer la estatura media de
estudiantes del primer año de una determinada
universidad, Se sabe que el numero total de estudiantes
del primer año es de 400. Asimismo se sabe que la
estatura esta correlacionada con el sexo de las
estudiantes, por consiguiente la estructura de la
población es heterogénea, de acuerdo a la variable
(sexo) que esta provocando la heterogeneidad, se tiene
que formar dos estratos. Tamaño de la muestra: 60
Nota: 300 varones en el estrato 1 y 100 mujeres en el
estrato 2
296
PROBABILIDADES
EVENTO
Puntos muestrales
PROBABILIDAD DE UN EVENTO
n( A) Nº de resultados favorables
P( A)
n(Ω) Nº de resultados posibles
Evento o Suceso:
Es un subconjunto del espacio muestral y se denota por letras mayúsculas. n( B ) 3
B = Obtener 2 caras P( B)
n(B) = 3 Y n() = 8 n (Ω ) 8
AXIOMAS DE PROBABILIDAD
1. P(A) 0
2. 0 < P(A) < 1
3. P() = 1
PROBABILIDAD DE UN EVENTO
A B
AXIOMAS DE PROBABILIDAD
C
Si A, B y C no son mutuamente excluyentes
NOTA.- AC A
P(A U AC) = P(A) U P(AC) = 1
FUMA
CIGARRILLOS PESO R N. TOTAL
BAJO NORMAL
SI 30 10 40
NO 20 140 160
TOTAL 50 150 200
¿Cuál es la probabilidad de que un recién nacido tenga bajo peso o sea
normal?
SOLUCION
P( B N ) = P( B ) + P( N )
P( B N ) = 50 / 200 + 150 / 200 = 1
PROBABILIDADES
Sexo M F
(Femenino
Estado (Masculino) ) Total
A (Anémico) 50 30 80
N
(Normal) 10 20 30
Total
Dado que la 60 corresponde
historia clínica 50 110 paciente
a un
anémico, ¿cuál es la probabilidad que sea mujer?
SOLUCION
n(FA) 30
P(F/A) = ----------- = ------ = 0.375
n(A) 80
Probabilidades
Muestreo
Representati
vidad (tipo
Población: N Muestra: n de muestreo)
Tamaño de
x muestra
S2
2
Estimación de
Inferencia parámetros
Pruebas de hipótesis
Inferencia
Los métodos estadísticos inferenciales
constituyen una forma de extraer conclusiones
respecto a una población, de los datos
obtenidos realmente de una muestra.
• Estimación puntual
n
(B) Estimación Puntual para la varianza poblacional.
Se halla mediante las siguientes fórmulas.
- Para datos simples - Para datos agrupados
2
s =
2 x n( x)
2 2
2
s =
2 x f n( x)
2 2
n 1 f 1
Se tiene interés en estudiar el sueldo promedio de los
auxiliares de enfermería del Hospital Base AG, para tal
efecto se recurre a una muestra aleatoria de 36
auxiliares de enfermería y se obtiene los siguientes
resultados:
Media = 160 y Desviación estándar = 32
Respuesta: La estimación por punto del sueldo medio
del parámetro población será: 160
P( - k + k ) = 1 -
Estimación por intervalos
H o : o
/2
/2
Ha : o bilateral . o
o
unilateral
o
0.05 o
Nivel de significancia:
0.01
Mg. Rosa Padilla Castro
APLICACIÓN DE LA DISTRIBUCION JI
CUADRADO X 2
COMPARACION EN
MEDICINA
En todo acto de comparación hay una intencionalidad
analítica subyacente: encontrar igualdades o,
alternativamente, encontrar diferencias.
Esta capacidad de discriminar entre las observaciones
que se hace de la realidad es un requisito para
identificar las necesidades en salud de la población,
establecer prioridades y, consecuentemente, desarrollar
acciones en salud dirigidas a modificarlas
positivamente
HIPOTESIS
Un aspecto central en este raciocinio analítico es la generación
de explicaciones tentativas, suposiciones, pronósticos o
conjeturas verosímiles respecto a una relación causa-efecto que
encierran incertidumbre; es decir, la generación de hipótesis.
Una hipótesis es una suposición que se hace de una
observación o reflexión, que lleva a predicciones refutables. Para
la aplicación de pruebas estadísticas a los datos obtenidos, se
requiere la elaboración de dos hipótesis: la hipótesis alterna o de
investigación (HA) y la hipótesis nula o de no-diferencia (HO),
sobre las cuales se enfocaran los resultados del análisis
estadístico
MEDIDAS DE ASOCIACION
Revisaremos los principios y métodos estadísticos básicos que
ayudan a los equipos locales de salud a establecer la presencia
de una asociación entre la exposición a un factor que se
considera de riesgo y la ocurrencia de enfermedad en la
población. En términos estadísticos, se dice que dos variables
están asociadas cuando existe una relación de dependencia
(usualmente de tipo matemático) entre ambas; es decir, el cambio
en una de ellas necesariamente se acompaña del cambio en la
otra (covariación).
Asociación: relación de dependencia estadística entre dos o más
eventos, características u otras variables. Una asociación está
presente si la probabilidad de ocurrencia de un evento depende
de la ocurrencia de otro u otros.
MEDIDAS DE ASOCIACION
La aplicación del término ‘asociación’ siempre
implica la intención de establecer una relación de
causa a efecto entre una exposición y una
enfermedad o evento en salud. Sin embargo, debe
tenerse presente que una asociación puede ser
fortuita o ‘espuria’ o puede ser producida por varias
circunstancias y, por tanto, la presencia de una
asociación estadística no necesariamente implica
una relación causal.
MEDIDAS DE ASOCIACION
Por otra parte, un factor de riesgo es un aspecto del
comportamiento o estilo de vida personal, constitución genética o
hereditaria o exposición ambiental que, con base en la evidencia
disponible, se sabe que está asociado a condiciones relacionadas
con la salud consideradas importantes de prevenir. Lo más
importante de un factor de riesgo es que sea identificable,
cuantificable y, en lo posible, modificable antes de la ocurrencia del
hecho que predice. Los factores de riesgo son indicadores o
marcadores del riesgo de enfermar en la población aunque, debe
tenerse presente que el hallazgo de un factor de riesgo no
necesariamente implica que sea un factor causal.
FACTOR DE RIESGO
Característica o circunstancia detectable en
individuos o grupos, asociada con una
probabilidad incrementada de experimentar un
daño o efecto adverso a la salud. En general, un
factor de riesgo es un atributo o exposición que
incrementa la probabilidad de ocurrencia de una
enfermedad u otro daño a la salud.
PRUEBAS DE
SIGNIFICANCIA
Las medidas de asociación estadística se basan en
las llamadas pruebas de significancia.
El propósito de estas pruebas es determinar si la
presencia de un factor de riesgo evaluado está
efectivamente relacionada con la frecuencia de la
enfermedad. En dichas condiciones se espera que
la prevalencia de exposición a dicho factor sea
razonablemente más alta entre los que han
enfermado o sufrido un daño a la salud que en
aquellos aparentemente sanos.
CHI CUADRADO
2 102
3 104
4 100
5 97
6 101
7 95
8 93
9 97
10 88
NUMERO DE CALIFICACION X2 Y2 XY
NIÑOS PROMEDIO CI
5 97 25 9409 485
7 95 49 9025 665
8 93 64 8649 744
9 97 81 9409 873
ETIMOLOGÍA
La demografía estudia
estadísticamente la estructura y la
dinámica de las poblaciones
humanas y las leyes que rigen
estos fenómenos.
DEMOGRAFÍA
RESEÑA HISTÓRICA
Epoca Antigua:
Epoca Prehistórica:
Siglo XIX:
Edad Moderna:
La evolución demográfica se
puede dividir en dos etapas:
Fuentes indirectas
Los censos
DEMOGRAFÍA
LA PIRAMIDE DE POBLACIÓN:
LA PIRAMIDE DE POBLACIÓN:
LA PIRAMIDE DE POBLACIÓN:
LA PIRAMIDE DE POBLACIÓN:
LA PIRAMIDE DE POBLACIÓN:
LA PIRAMIDE DE POBLACIÓN:
HOMBRES MUJERES
DEMOGRAFÍA
Tipos de pirámides:
• Expansiva o progresiva:
Es propia de los
países del Tercer
Mundo en plena
transición
demográfica con
altas tasas de
natalidad y
mortalidad, y con
un crecimiento
natural alto.
Pirámide de una población en rápido crecimiento (Angola)
DEMOGRAFÍA
Tipos de pirámides:
• Regresiva:
• Desequilibrada:
Análisis de la Población
Dinámico Estático
Mov General de la
población Estructuras
Demográfica
Mov.Natural Geográfica
Económica
Mov.Migratorio
Política
Mov.Natural Mov.Migratorio
Análisis de la Población
Dinámico Estático
Estructuras
Mov General de la población
Nativos
Urbana PEA
Extranjeros
Rural PEI
Joven (0-19)
Masculino
Adulta (20-59) Solteros
Femenino
Vieja (>60) Casados
Crecimiento Natural Saldo Migratorio Divorciados
Unidos
Separados
Métodos de la Demografía
Censos
Secundaria Anuarios