Está en la página 1de 423

BIOESTADISTICA

Y DEMOGRAFIA
LUIS FERNANDO VILLANUEVA GARCIA
MEDICO CIRUJANO EPIDEMIOLOGO
CMP 25521 RNE 20365
MAESTRO EN SALUD PUBLICA
MODULO I
BIOESTADISTICA
¿QUÉ ES LA ESTADÍSTICA?
Estadística es la ciencia de:
• Recolectar
• Describir
• Organizar
Datos
• Interpretar
con el fin de transformar dichos datos en
información y conseguir una toma de decisiones
más eficiente.
¿PARA QUÉ SIRVE LA ESTADÍSTICA?
• La Ciencia se ocupa en general de fenómenos observables

• La Ciencia se desarrolla observando hechos, formulando leyes que los


explican y realizando experimentos para validar o rechazar dichas leyes

• Los modelos que crea la ciencia son de tipo determinista o aleatorio


(estocástico)

• La Estadística se utiliza como tecnología al servicio de las ciencias donde la


variabilidad y la incertidumbre forman parte de su naturaleza

• “La Bioestadística [...] enseña y ayuda a investigar en todas las áreas de las
Ciencias de la Vida donde la variabilidad no es la excepción sino la regla”
Carrasco de la Peña (1982)
DEFINICIÓN
La Estadística es la Ciencia de la

• Sistematización, recogida, ordenación y


presentación de los datos referentes a un
fenómeno que presenta variabilidad o
incertidumbre para su estudio metódico, con
objeto de

• deducir las leyes que rigen esos fenómenos,

• y poder de esa forma hacer previsiones sobre


los mismos, tomar decisiones u obtener
conclusiones.
PASOS EN UN ESTUDIO ESTADÍSTICO
• Plantear hipótesis sobre una población
• Los fumadores tienen “más bajas” laborales que los no fumadores
• ¿En qué sentido? ¿Mayor número? ¿Tiempo medio?

• Decidir qué datos recoger (diseño de experimentos)


• Qué individuos pertenecerán al estudio (muestras)
• Fumadores y no fumadores en edad laboral.
• Criterios de exclusión ¿Cómo se eligen? ¿Descartamos los que padecen enfermedades crónicas?
• Qué datos recoger de los mismos (variables)
• Número de bajas
• Tiempo de duración de cada baja
• ¿Sexo? ¿Sector laboral? ¿Otros factores?

• Recoger los datos (muestreo)


• ¿Estratificado? ¿Sistemáticamente?

• Describir (resumir) los datos obtenidos


• tiempo medio de baja en fumadores y no (estadísticos)
• % de bajas por fumadores y sexo (frecuencias), gráficos,...

• Realizar una inferencia sobre la población


• Los fumadores están de baja al menos 10 días/año más de media que los no fumadores.

• Cuantificar la confianza en la inferencia


• Nivel de confianza del 95%
• Significación del contraste: p=2%
TIPOS DE ESTADISTICA

•ESTADISTICA DESCRIPTIVA

•ESTADISTICA INFERENCIAL
ESTADÍSTICA DESCRIPTIVA: Conjunto de métodos
estadísticos que se relacionan con el resumen y
descripción de datos, como tablas, gráficas y el
análisis mediante algunos cálculos.
50
Nº trabajadores que 45
Nº días
X
40
se ausentaron
 ( X  )
35 i 2
Industrial iRX
X , S
30
25 Sistemas
0-4 4 20 Civil n n 1
15 Electrónica
5-9 10 10
10-14 8 5
0
Ciclo 1 Ciclo2
ESTADÍSTICA INFERENCIAL.- Conjunto de
métodos cuya finalidad es hacer generalizaciones
o inferencia sobre una población, utilizando la
información de una parte de ella
POBLACIÓN
(‘POPULATION’) ES EL
CONJUNTO SOBRE EL QUE
ESTAMOS INTERESADOS
EN OBTENER
CONCLUSIONES (HACER
INFERENCIA).
NORMALMENTE ES
DEMASIADO GRANDE
PARA PODER ABARCARLO.
 
    
         
  
           
          
 

 

Muestra
• (‘sample’) es un subconjunto suyo Variable
al que tenemos acceso y sobre el
que realmente hacemos las Es una característica
observaciones (mediciones) definida en la población
• Debería ser “representativo” y que puede tomar dos o
• Esta formado por miembros más valores o
“seleccionados” de la población
(individuos, unidades modalidades.
experimentales).
VARIABLE
ES UNA CARACTERÍSTICA DEFINIDA EN LA
POBLACIÓN Y QUE PUEDE TOMAR DOS O MÁS
VALORES O MODALIDADES.
• Una variable es una característica observable
que varía entre los diferentes individuos de una
población. La información que disponemos de
cada individuo es resumida en variables.
El grupo sanguíneo
{A, B, AB, O}  Var. Cualitativa
Su nivel de felicidad “declarado”
{Deprimido, Ni fu ni fa, Muy Feliz}  Var. Ordinal
El número de hijos
{0,1,2,3,...}  Var. Numérica discreta
La altura
{1’62 ; 1’74; ...}  Var. Numérica continua
CLASIFICACIÓN DE VARIABLES
Cualitativa Cuantitativa
Es la característica cuyos Es la característica cuyos
valores se expresan en
valores se expresan en
escala nominal u ordinal.
escala de intervalos o de
Ej..
razón.
•Sexo
•Cursos del primer Se dividen en:
ciclo – Discretas
•Tipos de envase – Continua
CLASIFICACIÓN DE LAS VARIABLES
CUANTITATIVAS
Discreta Continua
Cuando toma sólo ciertos Es aquella variable que
valores en el intervalo puede tomar cualquier
considerado y no admite valor en el intervalo
valores intermedios entre considerado.
dos valores consecutivos. Ej.: Temperatura de
Ej.: Número de artículos ignición de un gas,
defectuosos tiempo de corte de un
torno corriente.
TIPOS DE VARIABLES
• Cualitativas
Si sus valores (modalidades) no se pueden asociar naturalmente a un número
(no se pueden hacer operaciones algebraicas con ellos)

• Nominales: Si sus valores no se pueden ordenar


• Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)

• Ordinales: Si sus valores se pueden ordenar


• Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor

• Cuantitativas o Numéricas
Si sus valores son numéricos (tiene sentido hacer operaciones algebraicas con
ellos)

• Discretas: Si toma valores enteros


• Número de hijos, Número de cigarrillos, Num. de “cumpleaños”

• Continuas: Si entre dos valores, son posibles infinitos valores intermedios.


• Altura, Presión intraocular, Dosis de medicamento administrado, edad
1.1. PRIMEROS PASOS
CUANDO DISPONEMOS DE UN CONJUNTO DE DATOS, DEBEMOS IDENTIFICAR:
1. LA CARACTERÍSTICA QUE REPRESENTAN DICHOS DATOS (VARIABLE).
2. LA POBLACIÓN DE LA QUE PROCEDEN LOS DATOS (CONJUNTO TOTAL DE
INDIVIDUOS DE INTERÉS).
3. LA NATURALEZA DE LOS DATOS:
3.1. VARIABLES CUALITATIVAS O ATRIBUTOS: EXPRESAN UNA CUALIDAD Y NO
UN VALOR NUMÉRICO. EJEMPLOS: SEXO, NACIONALIDAD, MARCAS DE COCHE,
GRADO DE SATISFACCIÓN CON LA UNIVERSIDAD, ETC..
3.2. VARIABLES CUANTITATIVAS: TOMA VALORES NUMÉRICOS
A) CUANTITATIVAS DISCRETAS: SÓLO PUEDEN ASUMIR CIERTOS VALORES Y NORMALMENTE HAY
HUECOS ENTRE ELLOS. SON CONTEOS NORMALMENTE. EJEMPLOS: Nº DE ASIGNATURAS
APROBADAS, CANTIDAD DE HIJOS.
B) CUANTITATIVAS CONTINUAS: PUEDE ASUMIR CUALQUIER VALOR DENTRO DE UN INTERVALO.
NORMALMENTE REPRESENTAN MAGNITUDES COMO LONGITUD, SUPERFICIE, VOLUMEN, PESO,
TIEMPO, DINERO.
FORMAS DE PRESENTAR Y RESUMIR LA INFORMACIÓN DE UN CONJUNTO DE
DATOS:
A) TABLA DE FRECUENCIAS
A.1) DATOS NO AGRUPADOS
A.2) DATOS AGRUPADOS
B) DESCRIPCIÓN GRÁFICA
B.1) GRÁFICOS PARA V. CUALITATIVAS O CUANTITATIVAS DISCRETAS
B.2) GRÁFICOS PARA V. CUANTITATIVAS CONTINUAS
B.3) DIAGRAMAS ACUMULADOS
B.4) GRÁFICO TEMPORAL
C) DESCRIPCIÓN NUMÉRICA
C.1) MEDIDAS DE LOCALIZACIÓN O CENTRALIZACIÓN
C.2) MEDIDAS DE DISPERSIÓN O VARIABILIDAD
C.3) MEDIDAS DE FORMA
A) TABLA DE FRECUENCIAS
INTENTAN RESUMIR LA INFORMACIÓN RECOGIDA EN LA MUESTRA,
DE FORMA QUE NO SE PIERDA NADA DE INFORMACIÓN (O POCA).
– Frecuencias absolutas: Contabilizan el número de individuos de
cada modalidad o clase.
– Frecuencias relativas (porcentajes): Es el cociente entre la
frecuencia absoluta y el número total de datos. Contabilizan el
porcentaje de individuos de cada modalidad.
– Frecuencias acumuladas: Contabilizan el número de individuos
que toman un valor menor o igual que el dado en una modalidad.
Sólo tienen sentido para variables cuantitativas (numéricas).
Número de hijos

Porcent. Porcent.
Frec. (válido) acum.
0 419 27,8 27,8
1 255 16,9 44,7
2 375 24,9 69,5
3 215 14,2 83,8
4 127 8,4 92,2
5 54 3,6 95,8
6 24 1,6 97,3
7 23 1,5 98,9
Ocho+ 17 1,1 100,0
Total 1509 100,0
Datos agrupados:

– Para datos cuantitativos continuos, los datos se suelen agrupar en


clases, que son intervalos que no se solapan y cuya unión cubre todo
el rango de los datos.
– Suelen elegirse de la misma longitud, de modo que basta con
seleccionar el número de clases a tomar.
– La elección del número de clases puede influir en la posterior
interpretación de los datos.
– Una regla empírica, sugiere que el número de clases sea
aproximadamente n donde n = nº total de datos.
– Ejemplos de tablas de frecuencias para datos cuantitativos
agrupados en clases.
DATOS CATEGORICOS
Para verificar la precisión con la que se efectuó el diagnostico
clínico de malaria, se investigo la presencia de parásitos de
malaria en pruebas de sangre de 33 pacientes. Los resultados
posibles eran tres: Negativo, P. falciparum, P. vivax:

RESULTADOS FRECUENCIA PORCENTAJE

NEGATIVO 19 57.58

P. FALCIPARUM 13 39,39

P. VIVAX 1 3,03

TOTAL 33 100
DIAGNOSTICO DE MALARIA

P. VIVAX 1

P. FALCIPARUM 13

NEGATIVO 19

0 5 10 15 20
DIAGNOSTICO DE MALARIA
3,03

39,39

57,58

NEGATIVO P. FALCIPARUM P. VIVAX


DATOS ORDINALES
Se dirigió al personal de salud de 148 instituciones distintas de salud
rurales la siguiente pregunta: “con que frecuencia se le terminaron
las medicinas para tratamiento de malaria en los últimos años”:

RESULTADOS FRECUENCIA PORCENTAJE


NUNCA 47 31,76
ESCASAMENTE 71 47,97
OCACIONALMENTE 24 16,22
FRECUENTEMENTE 6 4,05
TOTAL 148 100
FRECUENCIA CON QUE SE TERMINARON EL
TRATAMIENTO PARA MALARIA
80
71
70

60

50 47

40

30 24
20

10 6

0
NUNCA ESCASAMENTE OCACIONALMENTE FRECUENTEMENTE
PORCENTAJE CON QUE SE TERMINARON EL
TRATAMIENTO PARA MALARIA

4,05
16,22
31,76

47,97

NUNCA ESCASAMENTE OCACIONALMENTE FRECUENTEMENTE


CULTIVOS DE CATETER DE PACIENTES CON O SIN BACTERIEMIA

PACIENTE BACTERIEMIA CULTIVO


1 SI S. AUREUS
2 NO SIN CRECIMIENTO
3 NO NO PRACTICADO
4 NO S. EPIDERMIDIS
5 NO S. EPIDERMIDIS
6 NO SIN CRECIMIENTO
7 NO S. EPIDERMIDIS
8 NO SIN CRECIMIENTO
9 SI SIN CRECIMIENTO
10 NO NO PRACTICADO
11 NO SIN CRECIMIENTO
12 NO S. EPIDERMIDIS
13 SI S. AUREUS
14 SI S. EPIDERMIDIS
15 NO NO PRACTICADO
16 NO NO PRACTICADO
17 NO S, EPIDERMIDIS
18 NO SIN CRECIMIENTO
19 NO SIN CRECIMIENTO
20 NO SIN CRECIMIENTO
DISTRIBUCION DE BACTERIEMIA

CONDICION NUMERO
Bacteriemia sin 1
crecimiento
Bacteriemia S Aureus 2
Bacteriemia S 1
epidermidis
Sin bacteriemia, sin 4
cultivo
Sin bacteriemia, sin 7
crecimiento
Sin bacteriemia S 5
epidermidis
TOTAL 20
TABLA DE CONTINGENCIA SOBRE FRECUENCIA DE BACTERIEMIA EN PACIENTES
CON CULTIVOS POSITIVOS DE CATETER
BACTERIEMIA NUMERO DE
PACIENTES
SI 4
NO 16
TABLA DE CONTINGENCIA PARA PACIENTES CON o SIN BACTERIEMIA

CULTIVO DE CON SIN


CATETER BACTERIEMIA BACTERIEMIA
SIN CULTIVO Y 7 67
SIN CRECIMIENTO
S AUREUS 10 0
S EPIDERMIDIS 2 20
E COLI 1 0
DATOS CUANTITATIVOS

EDAD EN AÑOS DE LOS PACIENTES


ADMITIDOS A UN HOSPITAL DE
ENFERMEDADES CRONICAS DURANTE
CIERTO MES
PASO 1: ORDENAR
PASO 2: IDENTIFICAR EL DATO
MAXIMO Y MINIMO
PASO 3: DETERMINE EL RANGO (R)
RANGO = DATO MAYOR – DATO MENOR
R= 89 – 1 = 88
PASO 4: ESTIME EL NUMERO DE
INTERVALOS (k)
RECOMENDACIONES:
a. Agrupar los datos en no mas de 20 intervalos ni menos de 5.
b. Opciones para estimar k:
 REGLA DE STURGES: k: 1 + 3,322 log (n); cuando n > = 10; redondeando
al numero entero inmediato mayor
log (n) significa logaritmo decimal del numero total de datos.
 Alternativamente se puede utilizar k = raíz cuadrada (n); donde
25 <= n <= 400
 LEY DE PORTUGAL:
50 < n <= 100 k: 1,8914 + 3,991 log (n)
n <= 50 k: 1 + 3,322 log (n)
n > 100 k: 2,7560 + 5,8154 log (n)
• SEGÚN LA REGLA DE STURGES:
k = 1 + 3,322 log (100)
k = 1 + 3,322 (2)
k = 7.6
• REGLA ALTERNATIVA:
Raíz cuadrada de (100) = 10
• LEY DE PORTUGAL:
K = 1,8914 + 3,991 log (100)
k = 1,8914 + 3,991 (2)
k = 9,9
PASO 5: AMPLITUD DEL INTERVALO DE
CLASE (A)
A=R/k
Luego el producto R = (k) (A) debe ser el mínimo y que cubra el
recorrido de la variable, es decir kA > = R
A = 88 / 7 = 12.57
A = 88 / 8 = 11
A = 88 / 9 = 9.77
A = 88 / 10 = 8.8
Entonces: R = k A
R1: 7 * 13 = 91
R2: 8 * 11 = 88
R3: 9 * 10 = 90
R4: 10 * 9 = 90
k A > = R SERIA: R4 = 9 (amplitud)
ELABORACION DE LOS INTERVALOS
•1–9
• 10 – 18
• 19 – 27
• 28 – 36
• 37 – 45
• 46 – 54
• 55 – 63
• 64 – 72
• 73 – 81
• 82 - 90
EDAD fi hi hi % Fi Hi Hi%

1-9 19 0,19 19 19 0,19 19

10 - 18 11 0,11 11 30 0,30 30

19 - 27 9 0,09 9 39 0,39 39

28 - 36 11 0,11 11 50 0,50 50

37 - 45 5 0,05 5 55 0,55 55

46 - 54 18 0,18 18 73 0,73 73

55 - 63 8 0,08 8 81 0,81 81

64 - 72 5 0,05 5 86 0,86 86

73 - 81 5 0,05 5 91 0,91 91

82 - 90 9 0,09 9 100 1 100

TOTAL 100 1 100


EDAD fi hi hi % Fi Hi Hi% LR X1

1-9 19 0,19 19 19 0,19 19 0.5 – 9.5 5

10 - 18 11 0,11 11 30 0,30 30 9.5 – 18.5 14

19 - 27 9 0,09 9 39 0,39 39 18.5 – 27.5 23

28 - 36 11 0,11 11 50 0,50 50 27.5 – 36.5 32

37 - 45 5 0,05 5 55 0,55 55 36.5 – 45.5 41

46 - 54 18 0,18 18 73 0,73 73 45.5 – 54.5 50

55 - 63 8 0,08 8 81 0,81 81 54.5 – 63.5 59

64 - 72 5 0,05 5 86 0,86 86 63.5 – 72.5 68

73 - 81 5 0,05 5 91 0,91 91 72.5 – 81.5 77

82 - 90 9 0,09 9 100 1 100 81.5 – 90.5 86

TOTAL 100 1 100


20

18

16

14

12

10

0
0.5 – 9.5 9.5 – 18.5 18.5 – 27.5 27.5 – 36.5 36.5 – 45.5 45.5 – 54.5 54.5 – 63.5 63.5 – 72.5 72.5 – 81.5 81.5 – 90.5
Distribución de frecuencias con datos
agrupados
 Rango: Es la diferencia entre el mayor valor y el menor de ellos.
Ejemplo:
Si la estatura del alumno más alto de un curso es 1,92 m
y la del menor es 1,68 m, entonces el rango de estos datos es:
1,92 m – 1,68 m = 0,24 m = 24 cm.

 Clases o intervalos : En la ordenación de datos muy numerosos,


es usual presentarlos agrupados y ordenados en clases o categorías.
Ejemplo:
En un grupo de 50 alumnos se registraron los siguientes
puntajes en una prueba:

61 76 66 77 70 83 88 63 77 67 68 72 82
78 74 84 63 76 84 78 75 72 75 83 80 73
62 83 75 67 72 83 83 84 84 67 71 87 80
77 64 77 82 83 85 79 72 83 83 87
Para ordenarlos y agruparlos, se establecen los intervalos
que se usarán, determinando el rango de los datos.
Dato mayor: 88 Dato menor: 61 Rango: 88 – 61 = 27
De acuerdo con el rango y teniendo en cuenta la cantidad de
datos, se forman los intervalos.
Si quisiéramos formar 6 intervalos, se tiene que dividir el rango
con la cantidad deseada.
27 : 6 = 4, 5 se aproxima a 5 ( amplitud aparente del intervalo)

Intervalo de puntajes Frecuencias


60 – 64 5 El intervalo 60 – 64 es un
65 – 69 5 símbolo para representar
70 – 74 8 a la clase respectiva
57 – 79 12 Los valores 60 y 64 son
80 – 84 16 los límites aparentes de
85 – 89 4 la clase.
Los límites reales de una clase se obtienen calculando el
promedio entre el límite aparente superior de una clase y el
límite aparente inferior de la clase siguiente.

Ejemplo: Calcular los límites reales de la clase 70 – 74

Lri = 69  70 =
139 = 69,5 Límite real inferior
2 2
Lrs = 74  75 =
149 = 75,5 Límite real superior
2 2
 Tamaño o amplitud de una clase: Corresponde a la diferencia
entre su límite real superior y el límite real inferior.
Ejemplo:
75,5 – 69,5 = 5 Su amplitud es igual a 5
NOTA: Todas las clases tienen igual tamaño.
 Marca de clase: Es el punto medio de un intervalo de
clase.

Ejemplo.
Intervalo Marca de clase
60 – 64 62
65 – 69 67
70 – 74 72

 Frecuencia total: Es la suma de las frecuencias absolutas de


todas las clases.
Ejemplo: Frecuencia total
Intervalo Frecuencia
12 + 11 + 10 = 33
1–5 12
6 – 10 11
11 -15 10
Ejercicios
 Dado los siguientes puntajes, determinar:
61 76 66 77 70 83 88 63 77 67 68 72 82
78 74 84 63 76 84 78 75 72 75 83 80 73
62 83 75 67 72 83 83 84 84 67 71 87 80
77 64 77 82 83 85 79 72 83 83 87

a) Determinar seis intervalos


b) Determinar el límite real superior e inferior de cada clase
c) Determinar la marca de clase de cada intervalo
d) Determinar la frecuencia absoluta
Respuesta
Se debe determinar el rango: Pje mayor – Pje menor:
88 – 61 = 27
Luego, 27 : 6 = 4,5 se aproxima a 5 la amplitud del intervalo

Intervalo Lri - Lrs Marca de clase Frecuencia


60 – 64 59,5 – 64,5 62 5
65 – 69 64,5 – 69,5 67 5
70 – 74 69,5 – 74,5 72 8
75 – 79 74,5 – 79,5 77 12
80 – 84 79,5 – 84,5 82 16
85 – 89 84,5 – 89,5 87 4
Ejercicio
Después de medir las alturas de 40 alumnos de un curso,
resultaron los siguientes valores de la variable:
154 178 150 166 182 175 163 175 150 162
152 155 161 165 160 159 160 168 165 162
163 155 157 161 162 155 167 164 162 158
158 163 166 167 156 164 170 176 172 160

a) Determina el rango
Respuesta:
182 - 150 = 32
b) Determina 8 intervalos:

Respuesta: El rango es 32. Luego, 32 : 7= 4,5 (5 amplitud )

Intervalo c) Determinar la frecuencia


150 – 154
155 – 159
Respuesta:
160 – 164 Intervalo Frecuencia
165 – 169 150 – 154 4
170 – 174 155 – 159 8
175 – 179 160 – 164 14
180 – 184 165 – 169 7
170 – 174 2
175 – 179 4
180 – 184 1
d) Determinar la marca de clase de los intervalos

Respuesta:
Intervalo M de C
e) Determinar el límite
150 – 154 152 real inferior del tercer
155 – 159 157
160 – 164 162
intervalo
165 – 169 167
Respuesta:
170 – 174 172
175 – 179 177 Lri = 159 + 160 = 159,5
180 – 184 182 2

f) Determinar el límite real superior del quinto intervalo


Respuesta:
Lrs = 174 + 175 = 174,5
2
g) Determinar la frecuencia acumulada

Respuesta:
h) Determinar la frecuencia
Intervalo F. acum
150 – 154 4 relativa porcentual
155 – 159 12 Respuesta:
160 – 164 26
165 – 169 33 Intervalo F. Relat %
170 – 174 35
150 – 154 10
175 – 179 39
155 – 159 20
180 – 184 40
160 – 164 35
165 – 169 17,5
170 – 174 5
175 – 179 10
180 – 184 2,5
i) ¿Cuántos alumnos miden menos de 160 ?

Respuesta: 12 alumnos miden menos de 160


j) ¿Qué porcentaje de alumnos mide entre 170 y 174 ?
Respuesta: El 5% de los alumnos miden entre 170 y 174
k) ¿Qué porcentaje de alumnos mide entre 160 y 174 ?

Respuesta: El 57,5 % de los alumnos mide entre 160 y 174

l) ¿Cuál es la frecuencia total ?


Respuesta: n = 40
m) ¿Cuál es la amplitud del intervalo ?
Respuesta: c = Lrs – Lri = 159,5 - 154,5 = 5
Ejercicios
 Los siguientes datos son las calificaciones de un grupo de 27
alumnos en la asignatura de matemática:
5 6 5 7 4 2 3 5 4 6 7 5 4 6 5 4 5 6
4 3 4 6 7 5 4 5 6
a) Construya una tabla de distribución de frecuencias
b) ¿Cuántos alumnos tienen nota inferior a 5?
c) ¿Qué porcentaje de alumnos tiene nota 4?
d) ¿Cuántos alumnos tiene nota 6?
e) ¿Qué porcentaje de alumnos tiene nota superior o igual a 4?
Respuesta
Calificación frecuencia Frecuencia Frecuencia Frec. relat.
acumulada relativa porcentual
2 1 1 1 / 27 = 0,037 3,7
3 2 3 2 / 27 = 0,074 7,4
4 7 10 7 / 27 = 0,259 25,9
5 8 18 8 / 27 = 0,296 29,6
6 6 24 6 / 27 = 0,222 22,2
7 3 27 3 / 27 = 0,111 11,1

b) 10 alumnos tienen nota inferior a 5,0


c) El 25,9% de los alumnos tiene nota 4,0
d) 6 alumnos tienen nota 6,0
e) El 88,8% de los alumnos tiene nota igual o superior a 4,0
 En una muestra de 40 familias, el número de hijos se
distribuye según la tabla:
a) Completa la tabla con frecuencia
acumulada, relativa y relativa
Variable F. absoluta porcentual.
Nº de hijos Nº de familias b) ¿Cuántas familias tienen menos de
4 hijos?
1 2
c) ¿Cuántas familias tienen 5 hijos?
2 8
d) ¿Cuál es la frecuencia relativa de las
3 12 familias que tienen 2 hijos?
4 14 e) ¿Qué porcentaje de familias tiene 6
5 3
hijos?
f) ¿Qué fracción representan las familias
6 1
con 2 hijos?
g) ¿Qué fracción representan las familias
con 4 hijos?
Respuesta
Nº hijos Frecuencia F. acumulada F, relativa Frec. Relat. %
1 2 2 2 / 40 = 0,05 5
2 8 10 8 / 40 = 0,20 20
3 12 22 12 / 40 = 0,30 30
4 14 36 14 / 40 = 0,35 35
5 3 39 3 / 40 = 0,075 7,5
6 1 40 1 / 40 = 0,025 2,5

b) 22 familias tienen menos de 4 hijos


c) 3 familias tienen 5 hijos
d) La frecuencia relativa de familias con 2 hijos es de 0,20
e) El 2,5% de las familias tiene 6 hijos
f) 1 / 5 de las familias tienen 2 hijos
g) 7 / 20 de las familias tienen 4 hijos
DESCRIPCION NUMERICA
Objetivo: Resumir la información más relevante de la muestra o población en unos
pocos números (parámetros).

C.1) Medidas de Centralización o Localización


• Indican valores con respecto a los que los datos parecen agruparse.
• Media, mediana y moda
C.2) Medidas de Posición
• Dividen un conjunto ordenado de datos en grupos con la misma cantidad de
individuos.
• Cuantiles, percentiles, cuartiles, deciles,...
C.3) Medidas de Dispersión o Variabilidad
• Indican la mayor o menor concentración de los datos con respecto a las
medidas de centralización.
• Rango, varianza, desviación típica, rango intercuartílico, coeficiente de
variación
C.4) Medidas de Forma
• Indican la forma en que se distribuyen los datos
• Coeficientes de asimetría y de apuntamiento o curtosis
MEDIDAS DE TENDENCIA CENTRAL
Ejemplo:
Determinar el promedio de notas de un alumno, en la asignatura
de Lenguaje y comunicación.

Las notas son: 3- 5 - 7 - 6 - 4 - 5 - 3 - 5 - 4 - 5 - 3 - 4

X = 3 + 5 + 7 + 6 + 4 +5 + 3 +5 + 4 + 5 + 3 + 4 = 54 = 4,5
12 12

Luego, el promedio de notas del alumno es 4,5


Medidas de tendencia central en datos
agrupados
 Media aritmética: Se suma el producto de la marca de clase con
la frecuencia y se divide por la frecuencia total.
En forma general : X =  f • x
 f

Ejemplo:
Intervalo Frecuencia Marca de clase f • x X = 3805
60 – 64 5 62 310
50
65 – 69 5 67 335
70 – 74 8 72 576
75 – 79 12 77 924 X = 76,1
80 – 84 16 82 1312
85 – 89 4 87 348
La media aritmética ponderada es otra forma de calcular el
promedio, utilizando la tabla de distribución de frecuencias.

Ejemplo: Se debe multiplicar cada valor con su


Notas Frecuencias
frecuencia.
3 3
3 • 3 = 9 4 • 3 = 12 5 • 4 = 20
4 3
6•1=6 7•1=7
5 4 Se suman los productos:
6 1 9 + 12 + 20 + 6 + 7 = 54
7 1 La suma del producto se divide por el
total de datos:
54 : 12 = 4,5
Luego,
X = 4,5
 Las calificaciones de un estudiante de la USACH, en seis
pruebas, fueron 84, 91, 72, 68, 87 y 78. Hallar la mediana de
sus calificaciones

Respuesta:
Se deben ordenar las calificaciones: 68 72 78 84 87 91
Luego, la mediana es 78 + 84 = 162 = 81
2 2

 Hallar la moda de los siguientes números: 3, 5, 2, 6, 5, 9, 5,


2, 8.
Respuesta:
La moda es el número 5, ya que su frecuencia es mayor
Ejemplo
Hallar la mediana de los pesos de 40 estudiantes, dado en la
siguiente tabla de distribución
Intervalo Frecuencia F acum
118 – 126 3 3
n / 2 = 40 / 2 = 20
127 – 135 5 8
L i m = 144 + 145 = 144,5
136 – 144 9 17
145 – 153 12 29
2
154 – 162 5 34 f ( acum. ant ) = 17
163 – 171 4 38
172 – 180 2 40
c = 144,5 + 153,5 = 9
n = 40 f m = 12

M e = 144,5 + ( 20 – 17 ) • 9 = 144,5 + 3 • 9 = 144,5 + 27 = 146,75


12 12 12
Ejemplo 2
Las edades de los obreros que trabajan en una empresa constructora,
se distribuyen como sigue:
n / 2 = 180 / 2 = 90 c=5
Edad Frecuencia F acum
18 – 22 15 15 L i m = 32 + 33 = 32,5
23 – 27 26 41 2
28 – 32 30 71 f( acum ant) = 71 f m = 38
33 – 37 38 109
38 – 42 32 141
Me = L i m + (n/2 - f(acum ant)) • c
43 – 47 20 161
48 – 52 12 173
fm
53 – 57 7 180
= 32,5 + ( 90 - 71) • 5
38
n = 180 = 32,5 + 19 • 5 = 32,5 + 2,5
38
Me = 35
La moda
¡ Puff……!

Ejercicio
Dada la tabla de distribución de edades de un grupo de padres
cuyos hijos están en primer año de universidad.
Hallar: a) media aritmética b) Mediana c) Moda
Edad frecuencia a) Media aritmética
45 – 48 2 Edad f x f•x
49 – 52 5 45 – 48 2 46,5 93
53 – 56 12 49 – 52 5 50,5 252,5
57 – 60 8 53 – 56 12 54,5 654
61 – 64 5 57 – 60 8 58,5 468
61 – 64 5 62,5 312,5

X =  f • x = 1780 = 55,625
n 32
b) Mediana

Edad f F acum n / 2 = 32 / 2 = 16
45 – 48 2 2
49 – 52 5 7
L i m = 52 + 53 = 52,5
53 – 56 12 19 2
57 – 60 8 27
f (acum ant) = 7
61 – 64 5 32
n = 32 c = 56,5 - 52,5 = 4
f m = 12
Me = 52,5 + ( 16 – 7 ) • 4 = 52,5 + 9 • 4 = 55,5
12 12
c)
: Moda:
El intervalo modal es [53 - 56] . Luego. La moda es su marca
de clase: 53 + 56 = 54,5
2
* Construye una tabla de distribución de frecuencias de datos
agrupados en intervalos de clase. Considera como limite
inferior del primer intervalo = 10 y c = 10
El puntaje obtenido por 130 alumnos en una prueba de biología
es el siguiente:

12 45 53 85 23 91 34 56 65 70 72 74 86
95 32 45 56 58 33 49 55 70 66 62 64 55
83 26 34 72 60 64 72 80 58 98 50 20 35
76 68 90 99 56 48 56 68 82 40 92 38 56
84 66 78 74 25 15 48 50 66 49 53 83 91
42 64 72 54 89 92 28 34 40 56 64 68 63
35 56 66 38 82 78 74 90 85 66 70 72 58
66 80 80 95 96 99 94 40 42 58 65 67 81
90 50 48 52 62 70 80 93 45 36 49 81 73
56 38 51 23 90 84 96 75 38 28 36 83 29
Respuesta:

Intervalo M. de Clase frecuencia F. acum. F. Relat F. Relat.%


10 – 19 14,5 2 2 0,015 1,5
20 – 29 24,5 8 10 0,061 6,1
30 – 39 34,5 13 23 0,100 10,0
40 – 49 44,5 14 37 0,107 10,7
50 – 59 54,5 22 59 0,169 16,9
60 – 69 64,5 20 79 0,153 15,3
70 – 79 74,5 17 96 0,130 13,0
80 – 89 84,5 17 113 0,130 13,0
90 - 99 94,5 17 130 0,130 13,0
De acuerdo con la tabla anterior, responder las siguientes
preguntas:

a) ¿Cuántos alumnos obtuvieron entre 30 y 49 puntos?

Respuesta: Hay 27 alumnos

b) ¿Cuántos alumnos obtuvieron entre 60 y 89 puntos?


Respuesta: Hay 54 alumnos

c) ¿Cuántos alumnos obtuvieron entre 40 y 99 puntos?


Respuesta: Hay 107 alumnos
d) ¿Qué porcentaje de alumnos obtuvieron entre 30 y 49 puntos?

Respuesta: El 20,7 % de los alumnos

e) ¿Qué porcentaje de alumnos obtuvo entre 50 y 59 puntos?

Respuesta: el 16,9 % de alumnos

f) ¿Cuántos alumnos obtuvieron menos de 60 puntos?

Respuesta: 59 alumnos
g) ¿Cuántos alumnos obtuvieron menos de 30 puntos?

Respuesta: 10 alumnos

h) ¿Cuántos alumnos obtuvieron 50 o más puntos?

Respuesta: 93 alumnos

i) ¿Cuántos alumnos obtuvieron 70 o más puntos?


Respuesta: 51 alumnos

j) ¿Qué porcentaje de alumnos obtuvo menos de 20 puntos?

Respuesta: 1,5 % de los alumnos


k) ¿Cuál es la marca de clase que representa al intervalo de
mayor frecuencia?

Respuesta: la marca de clase de mayor frecuencia es 54,5

l) ¿Cuál es el límite aparente superior del tercer intervalo?

Respuesta: 39
m) ¿Cuál es el límite real inferior del quinto intervalo?

Respuesta: 49,5

n) ¿Cuál es la amplitud del intervalo?

Respuesta: c = 10
n) Calcula la media aritmética:

Respuesta:
Intervalo M. de Clase frecuencia f • x
10 – 19 14,5 2 29 X = f•x
20 – 29 24,5 8 196 n
30 – 39 34,5 13 448,5
40 – 49 44,5 14 623
50 – 59 54,5 22 1199
X = 8095
60 – 69 64,5 20 1290 130
70 – 79 74,5 17 1266,5
80 – 89 84,5 17 1436,5
90 - 99 94,5 17 1606,5
X = 62,26
n = 130
ñ) Calcula la mediana:

Respuesta:
n / 2 = 130 / 2 = 65
Intervalo frecuencia F. acum.
10 – 19 2 2 L i m = 59,5 c = 10
20 – 29 8 10
30 – 39 13 23
f(acum. ant) = 59
40 – 49 14 37 f m = 20
50 – 59 22 59
60 – 69 20 79
Me = 59,5 + ( 65 – 59 ) • 10
70 – 79 17 96
80 – 89 17 113
20
90 - 99 17 130
Me = 59,5 + 6 • 10
n = 130 20
Me = 59,5 + 3 = 62,5
o) Calcular el intervalo modal y la moda :

Respuesta:

El intervalo modal es [50 - 59] porque tiene la mayor


frecuencia , que es 22.

La moda corresponde a la marca de clase de ese intervalo.

Luego, Mo = 50 + 59 = 54,5
2
DISPERSION
• Los estudiantes de Metodología de la Investigación obtienen diferentes calificaciones en
la asignatura (variabilidad). ¿A qué puede deberse?

• Diferencias individuales en el conocimiento de la materia.

• ¿Podría haber otras razones (fuentes de variabilidad)?

• Por ejemplo supongamos que todos los alumnos poseen el mismo nivel de conocimiento.
¿Las notas serían las mismas en todos? Seguramente No.

• Dormir poco el día de la prueba, el café estaba con somnífero...


• Diferencias individuales en la habilidad para hacer un examen.

• El examen no es una medida perfecta del conocimiento.


• Variabilidad por error de medida.

• En alguna pregunta difícil, se duda entre varias opciones, y al azar se elige la mala
• Variabilidad por azar, aleatoriedad.
GRADOS DE LIBERTAD
• ¿Por qué calculamos la varianza dividiendo por n - 1, en
lugar de dividir por n?
• Como la suma de las desviaciones es 0, la última
desviación es una combinación lineal de las n - 1
desviaciones restantes.
• Por lo tanto, no estamos calculando el promedio de n
números independientes (los desvíos). Solo n -1 de las
desviaciones al cuadrado pueden variar libremente y por
ello, promediamos la suma de los desvíos al cuadrado
dividiendo por n -1.
• Al numero n -1 se lo denomina grados de libertad de la
varianza o de la desviación típica.
Ejercicios
 Calcular la desviación típica de las siguientes notas de
Matemática: 2,0 - 3,9 - 5,0 - 5,9 - 6,2

Respuesta:
* Primero se debe obtener el promedio
x = 2,0 + 3,9 + 5,0 + 5,9 + 6,2 = 4,6
5
* Se calcula la desviación típica

S= ( 2  4,6) 2
 (3,9  4,6) 2
 (5  4,6) 2
 (5,9  4,6) 2
 ( 6, 2  4,6) 2

5
6,7  0,4  0,1  1,6  2,5 11,3
S= =
5 5

= 2,2 = 1,4
Luego, la desviación típica de las notas es 1,4 con respecto
al promedio
Si de estas notas descartáramos el 2, la nota más alejada del
promedio, entonces la desviación típica sería S = 1,04 ; este
valor es menor que 1,4.
Las notas consideradas, sin la nota 2, tendrían una dispersión
menor, es decir, estarían más centradas.
 Calcular la desviación típica de las siguientes notas:
5,2 - 4,9 - 5 - 5,1 - 5,2 - 5,3 - 4,9 - 5,2

Respuesta:
* Se obtiene el promedio x = 5,1

*S= 0,1  0,2  0,1  0  0,1  0,2  0,2  0,1


2 2 2 2 2 2 2 2

8
8 61,0
S= 0,01  0,04  0,01  0  0,01  0,04  0,04  0,01 = 8

S= 0,02 = 0,1
Este valor es considerablemente menor que el ejercicio anterior. Se
debe a que los datos son más homogéneos que en la otra distribución,
presentan escasa dispersión con respecto al promedio.
Desviación típica en datos agrupados
Calcular la S de la siguiente distribución que representa
las horas diarias dedicadas al estudio de 20 alumnos, con un
promedio de 4,7
* f •| x – x | 2

Horas Frecuencia x |x–x| |x–x|


2 f •| x – x |
2

0–2 5 1 3,7 13,69 68,45 * Se calcula S


3–5 7 4 0,7 0,49 3,43
159,8
6–8 6 7 2,3 5,29 31,74 S=
9 - 11 2 10 5,3 28,09 56,18
20
159,8 S= 7,9
•Primero se debe sacar la marca de clase.
* Determinar las desviaciones S= 2,8
* Obtener la desviación al cuadrado
* Producto de la frecuencia con la desviación al cuadrado.
La siguiente tabla muestra los puntajes obtenidos en P.A.A.
con un promedio de 614 puntos. Calcular la desviación típica

Puntajes Frecuencia x |x–x| | x – x |2 f • | x – x |2 1407973


S=
350 – 399 4 374.5 239.5 57360.25 229441 212
400 – 449 6 424.5 189.5 35910.25 215461.5

450 – 499 9 474.5 139.5 19460.25 175142.25


= 6641.3
500 – 549 20 524.5 89.5 8010.25 160205
550 – 599 31 574.5 39.5 1560.25 48367.75
= 81,4
600 – 649 80 624.5 10.5 110.25 8820

650 – 699 42 674.5 60.5 3660.25 153730.5


Entonces,
700 – 749 10 724.5 110.5 12210.25 122102.5 S = 81,4
774.5
750 – 799 8 160.5 25760.25 206082

800 – 849 2 824.5 210.5 44310.25 88620.5

1407973
* Calcular marca de clase * determinar f • |x – x |2
* Calcular las desviaciones * Determinar la sumatoria del producto
* Determinar las desviaciones al cuadrado
Ejemplo:
A continuación se presentan las tarifas (en
unidades monetarias) de dos laboratorios de
análisis clínicos. El laboratorio I tiene sus tarifas en
soles y el laboratorio II en dólares ¿Cuál de ellos
tiene un plan tarifario más homogéneo o estable?.

Laboratorio I (soles) Laboratorio II (dólares)


40,70,60,48,52,65,58 70,35,150,140,82,110,140,120

Calculamos la media y desviación estándar por


cada una de los laboratorios
Laboratorio I
n
 Xi 393
x  i 1
  56.14
n 7
x Xi  x Xi  x  2

40 -16.14 260.50
70 13.86 192.10
60 3.86 14.90
48 -8.14 66.26
52 -4.14 17.14
65 8.86 78.50
58 1.86 3.46
 X  393  Xi  x   0  Xi  x 
2
 632,86
Si  Xi  x   632.86
2

n
 i
( X  x )
2
632.86
S i 1
  10.27
n 1 7 1

S
CV   100
x

10.27
CV  100  18.29
56.14
Laboratorio II n

 Xi 847
x  i 1   105.87
n 8
x Xi  x Xi  x  2

70 -35.87 1286.6569
35 -70.87 5022.5569
150 44.13 1947.4569
140 34.13 1164.8569
82 -23.87 569.7769
110 4.13 17.0569
140 34.13 1164.8569
120 14.13 199.6569
X  847  Xi  x   0,04  Xi  x 
2
 11372,88

n
Si  X i  x 
2
 11372.88
i 1

n
 (X i  x )
2
11372,88
S i 1
  40.30
n 1 8 1

S 40,30
CV   100 CV  100  30,06
x 105,87

El Laboratorio II presenta una mayor variabilidad


en el plan tarifario.
Cuartiles (Q): Dividen a la muestra en 4 grupos con frecuencias similares.
Primer cuartil = Percentil 25 = Cuantil 0,25
Segundo cuartil = Percentil 50 = Cuantil 0,50 = mediana
Tercer cuartil = Percentil 75 = Cuantil 0,75
Quintiles (K): Dividen a la muestra en 5 grupos con frecuencias similares.
Primer quintil = Percentil 20 = Cuantil 0,20
Segundo quintil = Percentil 40 = Cuantil 0,40
Tercer quintil = Percentil 60 = Cuantil 0,60
Cuarto quintil = Percentil 80 = Cuantil 0,80
Deciles (D): Dividen a la muestra en 10 grupos con frecuencias similares.
Tercer decil = Percentil 30 = Cuantil 0,30
Quinto decil = Percentil 50 = Cuantil 0,50 = mediana
Séptimo decil = Percentil 70 = Cuantil 0,70
Percentiles (P) : Dividen a la muestra en 100 grupos con frecuencias
similares.
La mediana es el percentil 50
El percentil de orden 15 deja por debajo al 15% de las observaciones.
Por encima queda el 85%
Principales medidas de posición

• Percentil o centil
• Decil
• Cuartil
• Quintil
PERCENTIL o CENTIL
• El percentil k, al que simbolizaremos
como Pk, es el valor numérico de la
variable tal que el k por ciento de los
datos ordenados está por debajo de ese
valor. En consecuencia, el (100-k) por
ciento de los datos está por encima de
Pk.
Interpreta el texto siguiente:

“…Los valores de presión arterial en


niños y adolescentes sanos ubicados
por encima del percentil 95 puede
considerarse anormal.”
Percentil (Datos agrupados)

n
Localización .k
100

 n.k 
 100  Fi 1 
Identificación
Pk  Li   A
 fi 
 
Ejemplo 1
• En la siguiente distribución,
calcule el percentil 20 y el
percentil 95.

Intervalo fi
[50 - 70[ 30
[70 - 90[ 50
[90 - 110[ 65
[110 - 130[ 30
[130 – 150] 25
Solución
Intervalo fi Fi
[50 - 70[ 30 30
P20 [70 - 90[ 50 80
[90 - 110[ 65 145
[110 - 130[ 30 175
[130 – 150] 25 200
n.k 200.20
Percentil 20: Identificación:   40
100 100
 n.k 
Localización:  100  Fi 1 
P20  Li    A  70   40  30  .20
 fi   50 
 
 74
Solución
Intervalo fi Fi
[50 - 70[ 30 30
[70 - 90[ 50 80
[90 - 110[ 65 145
[110 - 130[ 30 175
P95 [130 – 150] 25 200
n.k 200.95
Percentil 95: Identificación:   190
100 100
 n.k 
Localización:  100  Fi 1 
P95  Li    A  130   190  175  .20
 fi   25 
 
 142
DECIL
• Los deciles son los siguientes:

Decil 1 : D1  P10

Decil 2 : D2  P20

Decil 3 : D3  P30

Decil 9 : D9  P90
CUARTIL
• Los cuartiles son los siguientes:

Cuartil 1 : Q1  P25

Cuartil 2 : Q2  P50  Me

Cuartil 3 : Q3  P75
RANGO INTERCUARTIL

Q 3 – Q1
EJEMPLO 2
Los datos mostrados corresponden a los pesos
de los recién nacidos (en gramos) en un centro
médico asistencial. Rango de
Cantidad
pesos
Si aquellos del tercer percentil 1500 - 2000 15
deben ser asistidos en una 2000 - 2500 40
incubadora, ¿para qué rango de 2500 - 3000 120
pesos serán los recién nacidos
3000 - 3500 80
trasladados a una incubadora?
3500 - 4000 35
4000 - 4500 10
EJEMPLO 3
Una empresa ha aplicado un test a los
postulantes al puesto de supervisor. Los
resultados se observan en la tabla
Puntaje Cantidad
La empresa calcula el noveno
decil para decidir los que pasan 00 – 20 5
a una entrevista personal. 20 – 40 15
¿Qué puntaje mínimo requieren
40 – 60 40
los que pasen a la etapa de la
entrevista? 60 – 80 30
80 – 100 10
_________Medidas de Posición: Un número para mostrar la localización de los Datos

Medidas de Posición para datos no agrupados: Medidas de Posición para datos agrupados:

Cuando se desea calcular una medida de posición para Cuando se desea calcular una medida de posición para datos
datos no agrupados, se debe ordenar los datos y asignarle agrupados, se determina la posición del porcentil, empleado la
en forma creciente un número para determinar así la fórmula:
posición que ocupa el porcentil:
j.N
Posición del Porcentil= Posición del Porcentil=
K

Para el caso en que N es par Para el caso en que N es impar donde:


j= Es el número del porcentil que se desea determinar (Q l, D3, P80 )
K= Es 4, 10, ó 100 de acuerdo a la base del porcentil que se desea
N N 1 calcular
j. j.
K K N= Es el total de los datos en estudio.

Una vez determinada la posición del cuartil debemos ubicar la


frecuencia acumulada que contiene este valor para determinar
donde: la clase que contiene la información a aplicar:
j= Es el número del porcentil que se desea determinar (Q l, D3, P80 )
K= Es 4, 10, ó 100 de acuerdo a la base del porcentil que se desea j.N
 Fi 1
calcular K
N= Es el total de los datos en estudio.
Porcentil ( j )  Li  * Ic
fi

Una vez determinado la posición que ocupa el porcentil j= Es el número del porcentil que se desea determinar (Ql, D3, P80 )
debemos aplicar la siguiente fórmula para determinar su Li = Límite inferior de la clase a la cual pertenece el porcentil
valor: j.N
K = Posición del Porcentil

Fi-1= Frecuencia acumulada de la clase anterior a la cual pertenece el


Porcentil=Valor menor+Parte decimal (Valor Mayor–Valor Menor) cuartil
fi= Frecuencia absoluta de la clase a la cual pertenece el cuartil
Ic= Intervalo de clase
CALCULE A CONTINUACION

CALCULE EL CUARTIL 1
CALCULE EL DECIL 8
PERCENTIL 60
ASIMETRIA
Si bien es fácil tener una idea de si la
distribución es simétrica o no tras ver la
representación gráfica, es importante
cuantificar la posible asimetría de una
distribución.
Recordemos que cuando la distribución de los
datos es simétrica, la media, la mediana y la
moda coinciden. (Y la distribución tiene la
misma forma a la izquierda y la derecha del
centro)
Asimetría hacia la derecha
(asimetría positiva)

Al ser positiva significa que la gráfica es asimétrica por la


derecha de la media y por tanto los valores mayores que ella
están más dispersos que los menores.
Asimetría hacia la izquierda
(asimetría negativa)

Al ser negativa significa que la gráfica es asimétrica por la


izquierda de la media y por tanto los valores menores que
ella están más dispersos que los mayores.
CURTOSIS o APUNTAMIENTO
La curtosis representa la elevación o achatamiento de una
distribución, comparada con la distribución normal. Una
curtosis positiva indica una distribución relativamente
elevada, mientras que una curtosis negativa indica una
distribución relativamente plana.
El estándar es la distribución normal: distribución
mesocúrtica.
Si la distribución es más apuntada que la distribución normal
tenemos una distribución leptocúrtica.
Si la distribución es más achatada que la distribución normal
tenemos una distribución platicúrtica.
LEPTOCÚRTICA

Al ser positiva significa que la gráfica es más apuntada que la gráfica


de la distribución normal y por tanto los valores alrededor de la
media están mas concentrados que en la Distribución Normal.
PLATICÚRTICA

Al ser negativa significa que la gráfica es menos apuntada que la


gráfica de la distribución normal y por tanto los valores alrededor de
la media están menos concentrados que en la Distribución Normal.
IMPRESIONES ERRONEAS
EN LOS GRAFICOS
PRESENTACIÓN ORDENADA DE DATOS
7
6

5
4
3
2

1
0
Hombre Mujer

• Las tablas de frecuencias y las representaciones


gráficas son dos maneras equivalentes de
presentar la información. Las dos exponen
ordenadamente la información recogida en una
muestra.
TABLAS DE FRECUENCIA
• Exponen la información recogida en la muestra, de forma que no se pierda nada de información (o poca).

• Frecuencias absolutas: Contabilizan el número de individuos de cada modalidad

• Frecuencias relativas (porcentajes): Idem, pero dividido por el total

• Frecuencias acumuladas: Sólo tienen sentido para variables ordinales y numéricas


• Muy útiles para calcular cuantiles (ver más adelante)
• ¿Qué porcentaje de individuos tiene menos de 3 hijos? Sol: 83,8
• ¿Entre 4 y 6 hijos? Soluc 1ª: 8,4%+3,6%+1,6%= 13,6%. Soluc 2ª: 97,3% - 83,8% = 13,5%

Sexo del encuestado Número de hijos


Porcentaje Porcentaje Porcentaje
Frecuencia Porcentaje válido
Frecuencia Porcentaje válido acumulado
Válidos Hombre 636 41,9 41,9
Válidos 0 419 27,6 27,8 27,8
Mujer 881 58,1 58,1
1 255 16,8 16,9 44,7
Total 1517 100,0 100,0
2 375 24,7 24,9 69,5
3 215 14,2 14,2 83,8
4 127 8,4 8,4 92,2
Nivel de felicidad 5 54 3,6 3,6 95,8
6 24 1,6 1,6 97,3
Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado 7 23 1,5 1,5 98,9
Válidos Muy feliz 467 30,8 31,1 31,1 Ocho o más 17 1,1 1,1 100,0
Bas tante feliz 872 57,5 58,0 89,0 Total 1509 99,5 100,0
No demas iado feliz 165 10,9 11,0 100,0
Perdidos No contes ta 8 ,5
Total 1504 99,1 100,0
Perdidos No contes ta 13 ,9 Total 1517 100,0
Total 1517 100,0
DATOS DESORDENADOS Y ORDENADOS
EN TABLAS
• Variable: Género Género Frec. Frec. relat.
• Modalidades: porcentaje
• H = Hombre Hombre 4 4/10=0,4=40%
• M = Mujer Mujer 6 6/10=0,6=60%

• Muestra:
10=tamañ
o
muestral

MHHMMHMMMH

• equivale a
HHHH MMMMMM
¿CUÁNTOS INDIVIDUOS
TIENEN MENOS DE 2 HIJOS? Número de hijos
frec. indiv. sin hijos
+ Porcent. Porcent.
frec. indiv. con 1 hijo Frec. (válido) acum.
= 419 + 255 0 419 27,8 27,8
= 674 individuos 1 255 16,9 44,7
¿QUÉ PORCENTAJE DE 2 375 24,9 69,5
INDIVIDUOS TIENE 6 HIJOS O 3 215 14,2 83,8
MENOS? 4 127 8,4 92,2
97,3%
5 54 3,6 95,8
¿QUÉ CANTIDAD DE HIJOS ES 6 24 1,6 97,3
TAL QUE AL MENOS EL 50% DE 7
LA POBLACIÓN TIENE UNA 23 1,5 98,9
CANTIDAD INFERIOR O IGUAL? Ocho+ 17 1,1 100,0
2 hijos Total 1509 100,0
GRÁFICOS PARA V. CUALITATIVAS
• Diagramas de barras
• Alturas proporcionales a las frecuencias (abs. o
rel.)
• Se pueden aplicar también a variables discretas

• Diagramas de sectores (tartas, polares)


• No usarlo con variables ordinales.
• El área de cada sector es proporcional a su
frecuencia (abs. o rel.)

• Pictogramas
• Fáciles de entender.
• El área de cada modalidad debe ser proporcional
a la frecuencia. ¿De los dos, cuál es incorrecto?.
GRÁFICOS DIFERENCIALES PARA
VARIABLES NUMÉRICAS
• Son diferentes en función de que
419
400 375

las variables sean discretas o 300

continuas. Valen con frec.


255

Recuento
215

absolutas o relativas.
200

127

• Diagramas barras para v. discretas 100

54

• Se deja un hueco entre barras para


24 23 17

indicar los valores que no son


0 1 2 3 4 5 6 7 Ocho o más

Número de hijos

posibles
250

• Histogramas para v. continuas 200

• El área que hay bajo el histograma

Recu ento
entre dos puntos cualesquiera
150

indica la cantidad (porcentaje o 100

frecuencia) de individuos en el
intervalo. 50

20 40 60 80

Edad del encuestado


DIAGRAMAS ACUMULADOS
Algunos de los diagramas anteriores tiene su correspondiente
diagrama acumulado. Se realizan a partir de las frecuencias
acumuladas. Indican, para cada valor de la variable, la cantidad
(frecuencia) de individuos que poseen un valor inferior o igual al
mismo.
GRAFICO TEMPORAL
¿Qué hemos visto?
 Tipos de variables

 Niveles de medición de las variables

 Tabulación y representación gráfica de las variables

 Estadísticos/ Parámetros:

 Medidas de centralización: Media, mediana y moda


• Diferenciar sus propiedades.
 Posición (cuantiles, percentiles,...)
 Medidas de dispersión
• con unidades: rango, rango intercuartílico, varianza, desv. Típica…
• sin unidades: coeficiente de variación intercuartílica, coeficiente
variación Pearson
TIPOS DE VARIABLES
CUALITATIVAS
Se refieren a los aspectos no medibles o cualidades de los individuos
(estado civil, lugar de nacimiento...). Las variables cualitativas toman
valores que no pueden ser ordenados ni operados conforme a las reglas
aritméticas; a estos valores se les suele denominar modalidades

CUANTITATIVAS
Miden alguna cualidad o atributo "cuantificable" de los individuos. (Valor
numérico)

DISCRETAS CONTINUAS
Las variables discretas, al ser Las variables continuas, aquellas
numerables, pueden tomar una serie de medibles que pueden tomar infinitos
valores determinados, pero no los valores dentro de un campo de
valores intermedios (Ej, número de variación (peso, altura, temperatura…)
años de escolarización, número de
hijos por familia…).
NIVELES DE MEDICIÓN DE LAS VARIABLES

TIPOS DE NIVELES DE PROPIEDADES DE LOS NIVELES


VARIABLES MEDICIÓN DE MEDICIÓN
CUALITATIVA NOMINAL - Nivel de medición más básico
-Clasifica a los individuos u objetos en clases o
Ej: lugar de nacimiento
categorías meramente descriptivas y excluyentes

ORDINAL - Contiene las mismas propiedades del nivel de


medición nominal + una nueva: ordena según se
Ej: nivel de instrucción posea en mayor o menor grado la característica que
se pretenda medir

CUANTITATIVA INTERVALOS -Además de lo observado para las otras dos escalas,


ésta tiene la propiedad de poder medir la distancia o
(Discretas/ Ej: Temperatura, presión la diferencia numérica que aparece entre una
continuas) categoría y otra

RAZONES/ -Posee todas las propiedades de las anteriores más el


cero absoluto, es decir, se emplea un punto natural u
PROPORCIONES origen no arbitrario en la escala de medida; de esta
forma no sólo podremos establecer diferencias entre
Ej: renta per cápita, peso las categorías sino que además las cantidades en
esta escala, y por lo tanto las proporciones, tienen un
significado. Esta escala posee además la propiedad
de que la razón de dos valores cualesquiera es
independiente de la unidad de medición
TABULACIÓN Y REPRESENTACIÓN
GRÁFICA DE LAS VARIABLES

CUALITATIVA NOMINAL CUALITATIVA CUANTITATIVA CUANTITATIVA


ORDINAL DISCRETA CONTINUA

TABULACIÓN f y f% f, f%, F y F% f, f%, F y F% MC, f, f%, F y F%


REPRESENTACIÓN Diagrama de círculo; Diagrama de Diagrama de Histogramas
GRÁFICA diagrama rectangular; círculo; diagrama barras; polígono frecuencias;
diagrama triangular, rectangular; de frecuencias; polígono de
diagrama de barras (si diagrama polígono de frecuencias,
alto nº de triangular (si alto frecuencias polígono de
modalidades y/o nº de acumuladas (ojiva) frecuencias
frecuencia muy baja) modalidades y/o acumuladas
frecuencia muy (ojiva).
baja)

La correcta realización de un gráfico necesita que se incluya en el mismo:

- la fuente origen de los datos que permita consultas directas a la información,


- las unidades de medida de los datos (porcentajes, números absolutos...),
- el año o periodo de referencia de la información
- el ámbito de referencia de la información (región, país...).
- y un título en el que se indique claramente la variable a que corresponde la información
TIPOS DE GRÁFICOS
100%
90%
80%
MADRID 70%
BARCELONA UNIVERSIDAD
60%
BILBAO SECUNDARIA
SEVILLA 50%
PRIMARIA
40%
ANALFABETO
30%
20%
10%
CICLOGRAMA 0%
1

DIAGRAMA
RECTANGULAR

DIAGRAMA DE BARRAS HISTOGRAMA


Parámetros y estadísticos
 Parámetro: Es un valor calculado sobre una población

 La altura media de los individuos de un país

 La idea es resumir toda la información que hay en la población en unos pocos


números (parámetros).

 Estadístico: Ídem (cambiar población por muestra)

 La altura media de los que estamos en este aula.


• Somos una muestra (¿representativa?) de la población.
Un brevísimo resumen sobre
estadísticos
 Centralización
 Indican valores con respecto a los que los datos parecen
agruparse.
• Media, mediana y moda
 Posición
 Dividen un conjunto ordenado de datos en grupos con la misma
cantidad de individuos.
• Cuartiles, quintiles, deciles y percentiles.
 Dispersión
 Indican la mayor o menor concentración de los datos con respecto
a las medidas de centralización.
• Desviación típica, coeficiente de variación, rango, varianza, …
MEDIA
Se define como la suma de todos los valores numéricos (que adopta la variable
estudiada) divididos por el número total de valores observados

Media de 2,2,3,7 es (2+2+3+7)/4=3,5


-Conveniente cuando los datos se concentran simétricamente con respecto a
ese valor.
-Muy sensible a valores extremos. En estos casos es más conveniente calcular
la mediana
-En distribuciones a partir de intervalos de clase no se puede estimar si existen
intervalos abiertos

a)Media aritrmética:
Datos sin agrupar Datos agrupados
X= ∑x X= ∑ fx
N N
b)Media Ponderada:
Xw= ∑ wx
∑w
Ejemplo
x
 xf i i

N
45  5  55 10    115  3
Peso M. Clase Fr. Fr. ac.  69,3
58
40 < 50 45 5 5

50 < 60 55 10 15

60 < 70 65 21 36

70 < 80 75 11 47

80 < 90 85 5 52

90 < 100 95 3 55

100 < 130 115 3 58

58
Mediana: de un conjunto de valores ordenados en magnitud es el valor central
o la media de los dos valores centrales. Es un valor que divide a las
observaciones en dos grupos con el mismo número de individuos .

Altura mediana
Mediana de nº observaciones impar: N/2 + 0,5:
Ejemplo: 1,2,4,5,6,6,8
nº observaciones, 7; (7/2)+0,5=4 ; hay que buscar el valor que ocupa la
posición 4ª: 1,2,4,5,6,6,8 ;luego la mediana es 5

Mediana de nº observaciones par es el valor medio de los valores que


ocupan las posiciones N/2 y N/2 +1
Ejemplo: 1,2,4,5,6,6,8,9
Nº observaciones par, 8; hay que buscar los valores que ocupan las
posiciones 8/2 y (8/2)+1, es decir, las posiciones 4 y 5; los valores que
ocupan las posiciones 4 y 5 son el 5 y el 6; la ,mediana es la media de
esos dos valores
1,2,4,5,6,6,8,9 es (5+6)/2=5,5
MEDIANA
- No es sensible a valores extremos.
-Es conveniente cuando los datos son asimétricos.

EJEMPLO

-Mediana de 3,5,6,8,9,11 es 7
-Mediana de 3,5,6,8,9,29 es 7
Ejemplo
Peso M. Clase Fr. Fr. ac.

40 < 50 45 5 5

50 < 60 55 10 15

60 < 70 65 21 36
1 / 2 * N  Fi 1
70 < 80 75 11 47 Mediana  L  c 
80 < 90 85 5 52
fi
1 / 2 * 58  15 
90 < 100 95 3 55
60  10 66,6
100 < 110 115 3 58 21
58
La moda: se define como el valor que tiene una mayor frecuencia en un
conjunto de datos (es decir, aquel que más se repite).
Para datos agrupados en intervalos

Mo= Li + c. D1
D1+D2
D1: fi-fi-1
D2: fi- fi+1

Peso M. Clase Fr. Fr. ac.

40 < 50 45 5 5

50 < 60 55 10 15

60 < 70 65 21 36 Intervalo modal


70 < 80 75 11 47

80 < 90 85 5 52
11
Mo  60  10  65,24
90 < 100 95 3 55
11  10
100 < 110 115 3 58

58
Estadísticos de posición
 Cuartiles: Dividen a la muestra en 4 grupos homogéneos.
 Primer cuartil = Percentil 25 = Cuantil 0,25
 Segundo cuartil = Percentil 50 = Cuantil 0,5 = mediana
 Tercer cuartil = Percentil 75 = cuantil 0,75

 Quintiles: 4 valores que dividen a una muestra en 5 grupos


homogéneos
 Quintil 2= Decil 2= Percentil 20

 Deciles: 9 valores que dividen a una muestra en 10 grupos


homogéneos
 Decil 5= mediana= cuartil segundo= percentil 50

 Percentil de orden k = cuantil de orden k/100


 Percentil 50= mediana= cuartil segundo= decil quinto,
 El percentil de orden 15 deja por debajo al 15% de las
observaciones. Por encima queda el 85%
Ejemplo
Peso M. Clase Fr. Fr. ac.

40 < 50 45 5 5

50 < 60 55 10 15

60 < 70 65 21 36

70 < 80 75 11 47

80 < 90 85 5 52

90 < 100 95 3 55

100 < 130 115 3 58

58

75 / 100 N  Fi 1 43,5  36
P75  Li  c  70  10  76,8
f 11
Medidas de dispersión
Las medidas de dispersión indican el grado de representatividad de las
medidas de tendencia central. Miden el grado de dispersión/ concentración de
los datos en torno a las medidas de tendencia central

Existen dos tipos de medidas de dispersión: ABSOLUTAS Y RELATIVAS

Mediana Rango
Rango intercuartílico
Rango entre percentiles
ABSOLUTAS Media Desviación media
Varianza
Desviación típica

Mediana Coeficiente variación intercuartílica


RELATIVAS Media Coeficiente variación de Pearson
Dispersión absoluta: mediana
 Amplitud o Rango:
Diferencia entre observaciones extremas.

0.05
Mín. P25 P50 P75 Máx.
 1, 2, 3,4,4,8. El rango es 8-1=7

0.04
 Es muy sensible a los valores extremos.

0.03
 Rango entre percentiles (‘interquartile range’):
 Es la distancia entre percentil 90 y percentil 10. 25% 25% 25% 25%

0.02
• Rango entre percentiles = P90 – P10
Rango intercuartílico
 Parecida al rango, pero eliminando las

0.01
observaciones más extremas inferiores y superiores. Rango

 No es tan sensible a valores extremos

0.00
 Rango intercuartílico: 150 160 170 180 190
 Es la distancia entre primer y tercer cuartil.
• Rango intercuartílico = Q3 - Q1
 Parecida al rango, pero eliminando las
observaciones más extremas inferiores y superiores.
 Es el menos sensible a valores extremos.
Dispersión absoluta: media
Desviación media:
•Mide el promedio de las desviaciones (absolutas) de las observaciones con respecto
a la media.

•Es la menos sensible a valores extremos (alejados de la media).

•Viene expresada en las mismas unidades de la variable.

Varianza S2 :
•Mide el promedio de las desviaciones (al cuadrado) de las observaciones con
respecto a la media.

•Es sensible a valores extremos (alejados de la media).

•Sus unidades son el cuadrado de las de la variable. De interpretación difícil para


un principiante.

•Desviación típica
Es la raíz cuadrada de la varianza

•Tiene las misma dimensionalidad (unidades) que la variable. Es sensible a valores


extremos (alejados de la media).
Dispersión relativa: mediana
Q3  Q1
Vq  *100
me
Es la razón entre el rango intercuartílico y la mediana.
Mide el rango intercuartílico en forma de“qué tamaño tiene con respecto a
la mediana”

Es frecuente mostrarla en porcentajes


Si la mediana es 80 y el rango intercuartílico es de 5 entonces
Vq=5/80*100=6,25%

Es una cantidad adimensional (independiente de las unidades de medida).


Interesante para comparar la variabilidad de diferentes variables.
Si el peso tiene Vq=6,25% y la edad tiene Vq=10%, los individuos
presentan más dispersión en edad que en peso.
Dispersión relativa: media
Coeficiente de variación de PEARSON
S
Es la razón entre la desviación típica y la media.
 Mide la desviación típica en forma de
CV  *100
“qué tamaño tiene con respecto a la media” x
 También se la denomina variabilidad relativa.

 Es frecuente mostrarla en porcentajes


• Si la media es 80 y la desviación típica 20 entonces CV=20/80=0,25=25% (variabilidad relativa)

 Es una cantidad adimensional (independiente de las unidades de medida). Interesante


para comparar la variabilidad de diferentes variables.
 Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan más dispersión
en peso que en altura.

 No debe usarse cuando para variables cuyo nivel de medición es por intervalos, es decir,la
variable cuenta con un valor 0 fijado arbitrariamente.

 Por ejemplo 0ºC ≠ 0ºF

 Si la variable presenta valores negativos, al calcular el coeficiente de variación de pearson los


habrá que considerar como positivos
MUESTREO
PARTE 1:
GENERALIDADES
Una vez definido el problema a investigar,
formulados los objetivos y delimitadas las
variables se hace necesario determinar los
elementos o individuos con quienes se va a
llevar a cabo el estudio o investigación.
MUESTREO

 Procedimiento por el cual se extrae, de un conjunto


de unidades que constituyen el objeto de estudio (
población), un número de casos reducido (muestra)
elegidos con criterios tales que permitan la
generalización a toda la población de los resultados
obtenidos al estudiar la muestra.
CONCEPTOS INICIALES

 Población: Conjunto de unidades de las que se desea


obtener cierta información.
Unidades: Personas, Familias, Viviendas, Escuelas,
Organizaciones, Artículos de Prensa

 Muestra: Selección de unas unidades concretas de la


población que representen la característica que se
quiere medir.
RAZONES DE MUESTREO

 Disminución de costos ( tiempo, personal, material)


 Al disminuir el número de casos disminuyen
también los errores asociados a la manipulación de
los datos.
 Puede confiarse en la generalización de los
resultados si se ha tenido cuidado al seleccionar la
muestra.
CRITERIOS IMPORTANTES PARA LA
SELECCIÓN DE LA MUESTRA

Salvo en poblaciones muy pequeñas y accesibles nunca


se observan a todas las unidades de la población.
Se debe diseñar una muestra que constituya una
representación a pequeña escala de la población a la
que pertenece.
Cualquier diseño muestral comienza con la búsqueda de
la información que ayude a la identificación de las
características de la población bajo estudio.
CONDICIONES QUE DEBE CUMPLIR UNA
“BUENA” MUESTRA
 Que comprendan parte de la población y no la totalidad
de ésta. ( salvo en los casos antes explicados en la lámina 5)
 Aunque el sentido común pareciera indicar que
poblaciones más grandes deben producir muestras
mayores, esto no es siempre cierto ya que:
 El tamaño de la población NO es el único elemento que influye en el
tamaño de la muestra.
CONDICIONES QUE DEBE CUMPLIR
UNA “BUENA” MUESTRA
La ausencia de distorsión en la elección de los elementos
de la muestra.
Si esta elección presenta alguna anomalía, la muestra
resultará por este mismo hecho viciada.
Que sea representativa o reflejo fiel de la población, de
tal modo que reproduzca sus características básicas en
orden a la investigación.
CONDICIONES QUE DEBE CUMPLIR UNA
“BUENA” MUESTRA

Si hay sectores diferenciados en la población que se


supone ofrecen características especiales la muestra
también deberá comprenderlos en la misma
proporción.
TAMAÑO DE LA MUESTRA

Es el número de unidades a incluir en la muestra.


Existen varios factores que influyen en el:
Tiempo y recursos disponibles
Modalidad de Muestreo
Tipo de Análisis Previsto
Varianza o heterogeneidad de la población
Margen de Error máximo admisible
Nivel de confianza de la estimación muestral
MODALIDAD DE MUESTREO SELECCIONADA

La selección de las modalidades de muestreo (


probabilísticos y no probabilísticos) se halla
determinada por la confluencia de varios factores: los
objetivos, los recursos, la accesibilidad de la población y
el tiempo.
Los diseños no probabilísticos demandan un tamaño
muestral menor.
TIPOS DE MUESTREOS

PROBABILÍSTICOS NO PROBABILISTICOS

•Todas las unidades tienen igual •Cada unidad NO tiene igual


probabilidad de participar en probabilidad de participar en
la muestra. la muestra.
•La elección de cada unidad •No se puede calcular el error
muestral es independiente de las muestral
demás •Alto riesgo de invalidez
•Se puede calcular el error muestral producido por la introducción de
sesgos
USOS DE CADA TIPO DE MUESTREO

Muestreo Probabilísticos Muestreos No


Estimación de Probabilísticos
Parámetros Estudios Pilotos
Comprobación de Estudios Cualitativos
Hipótesis Investigaciones en
poblaciones de difícil
registro o localización (
Ej. Marginales,
prostitutas, enfermos de
VIH, etc…)
EJEMPLO: ¿MUESTREO PROBABILÍSTICO?

 Se realiza un muestreo entre los alumnos que van a


clases de la Materia Metodología, eligiéndolos al
azar a la entrada del salón.

Este diseño es NO probabilístico porque aquellos que


no van a clases NO PUEDEN ser elegidos
EJEMPLO: ¿MUESTREO PROBABILÍSTICO?

 Se utiliza la lista de propietarios de líneas


telefónicas para elegir a aquellos que serán
encuestados.

Este diseño es NO Probabilístico porque aquellos que


no tienen teléfono NO PUEDEN ser elegidos
EJEMPLO: ¿MUESTREO PROBABILÍSTICO?

 Un investigador toma muestras del carbón extraído


de una mina, tomando al azar trozos de carbón de la
parte superior de cada carro.

Este diseño es NO probabilístico


porque solo se toma carbón
de la parte superior
FACTORES QUE INFLUYEN EN EL TAMAÑO DE
LA MUESTRA :TIPO DE ANÁLISIS DE DATOS
PREVISTO

La técnica de análisis influye en el tamaño de la


muestra:
Comparación de Medias
Estimación de Proporciones ( parámetros)
Análisis Univariables
Análisis Multivariables
HETEROGENEIDAD POBLACIONAL

Cuanto mas heterogénea sea la población mayor será su


varianza poblacional lo que implicará mayores tamaños
muestrales.
Cuando se desconoce el valor de la varianza poblacional
se recurre al supuesto mas desfavorable, asumiendo
una varianza poblacional igual a 0,5.
0,5 significa que una unidad seleccionada tiene 50 % de
posibilidades de pertenecer o no a un grupo específico
dentro de la población
2/2/2018
2DA PARTE: ERRORES Y
CÁLCULO DEL TAMAÑO DE LA
MUESTRA
224
ERRORES, ERRORES, ERRORES

Aleatorio
Muestral
Sistemático

V = v± e

Valor Valor
Medido en la ERROR
Verdadero
muestra
en la
población
ERROR ALEATORIO

El error aleatorio no se suele ajustar a ninguna regla o


norma , varían en cada caso , en su sentido y magnitud,
y por ello tiende a anularse cuando se trata de un
número elevado de casos.
 Los errores aleatorios se comenten, por ejemplo, cuando un
encuestado elige erróneamente una casilla queriendo
hacerlo en otra, cuando un encuestador marca erróneamente
un dato, etc.
ERRORES SISTEMÁTICOS

 Un error sistemático es aquel que se produce de igual modo (


sentido y proporción) en todas las mediciones que se
realizan sobre un parámetro de la muestra

 Contrario al error aleatorio, NO se anula en muestras


grandes.
ERRORES SISTEMÁTICOS. EJEMPLOS

Las tendencias subjetivas conscientes o inconscientes


del investigador.
Sustituciones, según criterio propio del investigador, de
unidades de la muestra que habían sido elegidas al
azar.
Insuficiente observación del conjunto de la población
que influye en una deficiente definición de sus
características.
ERROR MUESTRAL

 Cuando se extrae una muestra de una población es


frecuente que los resultados obtenidos de la muestra no
sean exactamente los valores reales de la población.
 El error de muestreo ocurre al estudiar una muestra en
lugar de la población total.
 La diferencia entre el valor del parámetro de una
población y el obtenido de una muestra recibe el nombre
de error muestral. ( y que no puede ser asociado a otro tipo de
explicación, es decir no es error aleatorio o sistemático)
ERROR MUESTRAL

Por muy perfecta que sea la muestra siempre habrá


grado de divergencia entre los parámetros estimados
usándola y los de la verdadera población.
En el cálculo del error intervienen:
Tamaño de la muestra
Varianza poblacional
Nivel de confianza
Tipo de muestreo
ESTIMACIÓN DEL ERROR

 Cuando variable bajo estudio es una media. (solo


válido para variables numéricas)

s
ez 1 f
n
Donde:
Z: grado de confianza de la estimación
s: desviación típica muestral de la variable analizada
n: tamaño de la muestra
1-f: Factor de corrección para poblaciones finitas. f= n/N
EL ERROR MUESTRAL ES MAYOR EN
LA MEDIDA QUE:

 Crece el grado de confianza que el investigador


quiere dar a su estimación del parámetro medido
mediante la muestra
 Es más elevada sea la variabilidad de la variable
estudiada.
 Es menor el tamaño de la muestra.
ESTIMACIÓN DEL ERROR

 Cuando la variable bajo estudio es una proporción


(ej, variables nominales u ordinales con pocas
categorías)

pq
ez 1 f
n 1
Donde:
Z: grado de confianza de la estimación
p: proporción de la muestra para la categoría a examinar
q: 1-p
n: tamaño de la muestra
1-f: Factor de corrección para poblaciones finitas. f= n/N
TAMAÑO DE LA MUESTRA VS. ERROR
MUESTRAL
MARGEN DE CONFIANZA EN LA ESTIMACIÓN

 Expresa el grado de probabilidad que el investigador


tiene en que su estimación se ajuste a la realidad.
 Los valores comúnmente utilizados son 95, 99, 99,9%
CORRECCIONES PARA POBLACIONES FINITAS
 Cuando el tamaño de la muestra es mayor del 5 %
del tamaño de la población se debe utilizar el
factor de corrección.

 Si por el contrario N>>n, f tiene a 0 y el factor de


corrección ( 1-f) tienen a 1.
MARGEN DE ERROR ADMISIBLE

Los incrementos en el tamaño de la muestra repercuten


en una mayor precisión y por consiguiente en menor
error muestral.
El error muestral interviene en el cálculo del tamaño de
la muestra solo si el diseño es probabilístico.
En el muestreo probabilístico el investigador fija el
error máximo admisible a priori y sobre esa base realiza
el cálculo del tamaño de la muestra.
CÁLCULO DEL TAMAÑO DE LA MUESTRA *

Para comparaciones de Para estimación de


media proporciones

2
 zs  2
z pq
n  n  n 1  2
e e

* Para poblaciones infinitas (donde N>> n )


POR LO TANTO EL TAMAÑO DE LA MUESTRA

Es directamente
proporcional al
nivel de confianza
Z.

Es
Es directamente
inversamente proporcional a
proporcional al la variabilidad
error estimado. del fenómeno a
estudiar.
EJEMPLO DEL CÁLCULO DEL TAMAÑO
DE LA MUESTRA (POBLACIÓN
INFINITA)
 Estimando qué proporción de sujetos poseen una
característica al nivel de confianza del 99.7% (Z=3) y un
error de admitido del 2%, será:

32 x50 x50
n 2
 5625
2
EL TAMAÑO DE LA POBLACIÓN NO FUE TOMADO
EN CUENTA!!!

POR QUÉ P y Q valen 50 % ?


CÁLCULO DEL TAMAÑO DE LA MUESTRA
PARA POBLACIONES FINITAS. (F=N/N>0,05)
Ej. El número óptimo para un
estudio de 60.000 personas
estableciendo un nivel de
confianza de 95.5%(z=2), y el
margen de error en el 3%, sería

4 * 50 * 50 * 60.000
n = ---------------------------------
9 (60.000-1) + 4 * 50 * 50

n= 1091

2
NZ pq
n 2
e ( N  1) Z pq
2
TAMAÑO DE LA MUESTRA

Fuente: Metodología y Técnicas de Investigación Social. Piergiorgio Corbetta


3RA PARTE
TIPOS DE
MUESTREO
RECORDANDO: TIPOS DE MUESTREOS

PROBABILÍSTICOS NO PROBABILISTICOS

•Todas las unidades tienen igual •Cada unidad NO tiene igual


probabilidad de participar en probabilidad de participar en
la muestra. la muestra.
•La elección de cada unidad •No se puede calcular el error
muestral es independiente de las muestral
demás •Alto riesgo de invalidez
•Se puede calcular el error muestral producido por la introducción de
sesgos
ALGUNOS TIPOS DE MUESTREO
PROBABILÍSTICO

Por
Simple Sistemático Estratificado
Conglomerados
MUESTREOS PROBABILÍSTICOS: SIMPLE

Se realiza utilizando alguna fuente de elección


aleatoria.
Supone que cada miembro de la población tiene
elemento que lo identifica ( ej. Un número
identificador) y mediante el cual puede ser elegido si
“sale” sorteado.
La afirmación anterior implica que hay que tener un
listado completo de TODOS los miembros de la
población
MUESTREOS PROBABILÍSTICOS: SIMPLE

Ventajas Desventajas
Facilidad en los cálculos Cada que cada miembro de
estadísticos la población tiene que ser
Elevada probabilidad de identificado
lograr “equivalencia” entre Complicado en poblaciones
las características de la grandes
muestra y las Alto costo
correspondientes a la
población
MUESTREOS PROBABILÍSTICOS:
MUESTREO ALEATORIO SISTEMÁTICO
 Similar al muestro simple salvo que:
1. Solo la primera unidad de la muestra se elige al azar siempre
que el número seleccionado sea mayor que el coeficiente de
elevación.
 Coeficiente de Elevación = N/ n
 Donde
 N: Tamaño de la población
 n : Tamaño de la muestra
2. Los restantes elementos de la muestra se hayan sumando,
sucesivamente el coeficiente de elevación.
MUESTREOS PROBABILÍSTICOS:
MUESTREO ALEATORIO ESTRATIFICADO
 Presupone el conocimiento de las características de las
unidades que forman la población para poder dividirla
en grupos ( estratos)
 Se eligen los miembros de la muestra en cada estrato
creado siguiendo algún tipo de muestreo de los vistos
anteriormente.
EJ. MUESTREO PROBABILÍSTICO POR ESTRATOS
Escuelas

Estrato Primario
Escuela Escuela
Primarias Secundarias

Escuela 1 Escuela 2 Escuela 1 Escuela 2

Profesores Profesores Profesores Profesores

Se seleccionan ALEATORIAMENTE ni profesores de cada una de las escuelas seleccionadas .


Ej.
2 de la escuela primaria 1 y 2 de la escuela primaria 2.
MUESTREOS PROBABILÍSTICOS: MUESTREO
ALEATORIO ESTRATIFICADO CONT…
El objetivo de este tipo de muestreo es garantizar la
representatividad equitativa de los estratos ( que
implica representación equitativa de las características
de la población).
Se logra si:
Son máximas las diferencias entre los estratos
Son mínimas las diferencias entre los miembros de un mismo
estrato.
Los criterios de división de la población en estratos se hallen
relacionadas con los objetivos de la investigación.
MUESTREOS PROBABILÍSTICOS: MUESTREO
ALEATORIO ESTRATIFICADO CONT…

 Los tamaños de cada estrato pueden ser:


Los mismos ( Afiliación simple)
Proporcional al peso relativo ( tamaño) del estrato dentro de
la población (Proporcional)
En función de la heterogeneidad de cada estrato ( Óptima)
EJEMPLO: MUESTRO POR ESTRATOS

Ejemplo tomado del Maria Ángeles Cea


EJEMPLO MUESTRO POR ESTRATOS. AFILIACIÓN SIMPLE

2500
nestratos 
3
EJEMPLO MUESTRO POR ESTRATOS. AFILIACIÓN
PROPORCIONAL

nestrato1  0,45 x 2500  1125


nestrato2  0,39 x 2500  975
nestrato3  0,16 x 2500  400
EJEMPLO DE MUESTREO POR ESTRATOS. AFILIACIÓN
ÓPTIMA
Paso 1 : Multiplicar el porcentaje de la población correspondiente al estrato por la
varianza del estrato
45 x1900  85500
39 x 2600  101400
16 x 2100  33600
Paso 2: Se suman todos los valores obtenidos en el paso 1 (85500+101400+33600=220500)

Paso 3: Se calcula a proporción de cada valor obtenido en el paso 1 dentro del paso 2.
Pr oporciónestrato1  85500 / 220500  0,388
Pr oporciónestrato2 101400 / 220500  0,460
Pr oporciónestrato3 33600 / 220500  0,152
Paso 4 : Se calcula el tamaño de la muestra de cada estrato multiplicando
su proporción por el tamaño de la muestra global ( 2500)
0,388 x 2500  970
0,460 x 2500  1150
0,152 x 2500  380
 970,1150,380  2500
VENTAJAS Y DESVENTAJAS DEL
MUESTREO ALEATORIO ESTRATIFICADO
Ventajas Desventajas

1. No es necesario  Puede ocurrir que los


disponer de la lista de miembros de una
toda la población sino unidad superior se
de las subpoblaciones parezcan, reduciendo
de orden superior la representatividad
extraídas ( por ej. las
de otros en la muestra
escuelas primarias y
final.
secundarias)
2. Existe una
considerable
reducción de costos
MUESTREO ALEATORIO POR
CONGLOMERADOS
 La unidad muestral es un grupo de elementos de la
población que forman una unidad, a la que llamamos
conglomerado.
 A diferencia de un estrato, un conglomerado es una
unidad de elementos que contienen representantes de
toda la población
EJEMPLO: MUESTREO POR CONGLOMERADOS

Escuelas

Escuelas Escuelas
Primarias Secundarias

Escuela 1 Escuela 2 Escuela 1 Escuela 2

Todos los profesores de las Escuelas 2 (Primaria) y 1 (Secundaria) son parte de la muestra
EJEMPLOS DE CONGLOMERADOS

 Zona Geográfica
 Edificio

 Una institución

 …..
VENTAJAS DEL MUESTREO POR
CONGLOMERADOS
 Es ventajoso, desde el punto de vista de costos, si se
pueden agrupar los miembros de la población por
conglomerados, en los cuales el criterio de agrupación
no sea la variable que se estudia.
 No es preciso tener un listado de toda la población, sino
de las unidades ( conglomerados) por los que se
agruparán.
DESVENTAJAS

 El error es mayor que cuando se utilizan otras técnicas


de muestreo.
TIPOS DE MUESTREOS NO
PROBABILÍSTICOS

“ Bola de
Por Cuotas
Nieve”

Estratégicos
MUESTRO POR CUOTAS
 La población debe ser dividida en estratos
definidos por variables cuya distribución dentro de
la población sea conocida.
 Se procede a calcular el tamaño de cada estrato
siguiendo el mismo procedimiento que si fuese un
muestreo probabilístico estratificado.
( proporcional)
MUESTRO POR CUOTAS
 A diferencia del M. Probabilístico Estratificado el
entrevistador es libre para escoger a quienes
forman parte de cada estrato. (CUOTA)
MUESTREO POR CUOTAS
Ventajas Desventajas

 Resulta más  Supone mayor error muestral


que los diseños
económico que los probabilísticos.
muestreos  No existe un método válido
probabilísticos . para calcular el error.
 Fácil de ejecutar el
 Dificultas para el control del
trabajo de campo.
trabajo de campo  Limitaciones en la
 No precisa el listado representatividad de la
de la población muestra para las
características no
especificadas en los controles
de cuotas.
MUESTREO DE BOLA DE NIEVE
 Este modelo es particularmente útil cuando se
muestrean poblaciones cuyos componentes, por
motivos morales, ideológicos, legales o políticos
tienen a ocultar su identidad.
 A partir de unos pocos individuos el entrevistador,
con ayuda de los primeros, va “ conociendo” a
nuevos miembros de la muestra.
MUESTREO BOLA DE NIEVE
 El riesgo fundamental está asociado a la selección
inadecuada de los primeros miembros de la
muestra y de quienes dependerá el resto.
 También es posible que ocurran distorsiones si no
se tiene en cuenta criterios muy específicos para
la selección de la muestra.
PARTE 4
Problemas del muestreo en la Investigación
Social
ERRORES DE COBERTURA
 ¿ Como se puede hacer un muestreo probabilístico
si las unidades no son conocidas?
 ¿Cómo localizar a todos los posibles miembros de
la población?
 Si se busca investigar sobre franjas particulares
de la población el problema se hace más difícil de
manejar
ERROR DE COBERTURA
 Se produce cuando no son incluidos determinados
elementos de la población objeto de estudio en el
proceso de selección muestral .
 La falta de cobertura impide la cooperación de un
número de unidades muestrales, puesto que
determinados individuos no pueden ser
seleccionados en la muestra, dificultando con ello la
capacidad de inferencia de los hallazgos de la
investigación.
ERROR DE COBERTURA
 Este error produce una subestimación en los
resultados, cuya amplitud depende de las
características de las unidades omitidas
PROBLEMAS DE REPRESENTATIVIDAD

Si no se ha logrado representatividad en una o varias


variables, el investigador tiene 3 opciones:
a) Trabajar con la muestra no representativa y contar con
ese límite
b) Redefinir la población. Por ejemplo: no hablar de
enfermos de SIDA sino de enfermos de SIDA que son
atendidos en el HULA.
c) Modificar deliberadamente la muestra para que
represente el comportamiento de la variable bajo estudio.
ERROR DE NO RESPUESTA
Deseo
explícito de
no
responder
No
Falta de
respuesta
contacto
por no
directo
entender

Pérdidas
por no
respuesta
TIPOS DE ERROR DE NO RESPUESTA

2/2/2018
Parcial

Total
275
EJEMPLOS DE ERRORES DE NO RESPUESTA
 El entrevistado puede no contestar una pregunta
por falta de conocimiento sobre esa cuestión, por
considerarla muy entrometida al invadir el ámbito
de su privacidad, porque la considera irrelevante
para los objetivos del estudio, etc.
 El entrevistador también contribuye a la no
respuesta parcial por el “olvido” a la hora de
recoger determinadas respuestas, o al tomarlas
equivocadamente.

Ejemplos tomados de : HEADY, P. (1995). «Calibrating Measurement Error in the 1991 Census». Survey
Methods Centre Newsletter, vol. 15, nº 2, p. 3-7.
EJEMPLOS DE ERRORES DE NO RESPUESTA
 Por último, el cuestionario genera no respuestas
por problemas en la redacción de las preguntas, y
por la utilización de preguntas «filtro» para que un
grupo de preguntas no sean respondidas por
determinados entrevistados que cumplen (o no
cumplen) una serie de requisitos.
CONSECUENCIAS TIENE LA NO RESPUESTA

• Al reducirse el • Si el fenómeno está


tamaño de la concentrado en
muestra aumenta sectores específicos
el error. de la población la
muestra puede
sesgarse.

Error Sesgo
MÉTODOS DE REDUCCIÓN DEL IMPACTO DE LA NO
RESPUESTA

Prevención Intervención
(luego de la
( durante la recolección
recolección de los datos
de datos ) )
PONDERACIÓN
Conocimiento
Post-
de los que no
estratificación
responden
PRACTICA

2/2/2018
281
MUESTREO ALEATORIO SIMPLE

2/2/2018
 PRACTICAR CON LA TABLA DE NUMEROS ALEATORIOS.
MUESTREO
 Setiene interés en determinar el porcentaje de

2/2/2018
niños desnutridos menores de 5 años del distrito
FUJI, ubicado en el departamento de la Planice,
durante el mes de enero del 2018:
a. Cual es la población objetivo:
b. Cual es la variable de interés:
c. Cual es la Unidad de Análisis:
d. Cual es el marco muestral:
e. Cual es el estadístico de interés:
283
f. Cual es el parámetro de interés:
2/2/2018
284
2/2/2018
285
MAS
 De una población de 20,000 universitarios se

2/2/2018
desea obtener una muestra para conocer la
estatura promedio. La estimación muestral
deberá tener un error máximo de 0.5 cm con
respecto al verdadero promedio con nivel de
confianza del 95%, esto es, que en 95 de
cada 100 intervalos el error no será mayor
de 0.5, un estudio preliminar nos indica que
la desviación estándar será de 5 cm.
286
2/2/2018
287
MAS
 Unsondeo previo indica que la proporción

2/2/2018
de analfabetos de una población es de
30% ¿Qué tamaño debe tener la muestra
para estimar con una precisión del 4% y
un nivel de confianza del 95% la
proporción de analfabetos, si el tamaño
de la población mayores de 14 años de
edad es de 10,000?
288
MUESTREO SISTEMÁTICO
 Se acercan las Navidades y cierta empresa de

2/2/2018
turrones cree que no va a poder entregar todos
los pedidos a tiempo, a no ser que aumente la
plantilla. La empresa dispone de un listado
ordenado alfabéticamente de 20 personas con
las mismas características para el puesto y que
actualmente están en paro. Puesto que el
tiempo apremia y no es posible hacer una
entrevista para seleccionar al personal, se
decide elegir cinco trabajadores de forma
aleatoria usando el muestreo sistemático.
289
MUESTREO SISTEMÁTICO

2/2/2018
290
2/2/2018
291
MUESTREO ESTRATIFICADO

2/2/2018
292
2/2/2018
293
2/2/2018
294
2/2/2018
295
MUESTREO ESTRATIFICADO

2/2/2018
 Se tiene interés en conocer la estatura media de
estudiantes del primer año de una determinada
universidad, Se sabe que el numero total de estudiantes
del primer año es de 400. Asimismo se sabe que la
estatura esta correlacionada con el sexo de las
estudiantes, por consiguiente la estructura de la
población es heterogénea, de acuerdo a la variable
(sexo) que esta provocando la heterogeneidad, se tiene
que formar dos estratos. Tamaño de la muestra: 60
 Nota: 300 varones en el estrato 1 y 100 mujeres en el
estrato 2
296
PROBABILIDADES

DEFINICIONES BÁSICAS DE PROBABILIDAD


DETERMINÍSTICO * Suma de dos números
Bajo las mismas naturales.
condiciones los * Lanzar una piedra desde
resultados son los una determinada altura.
mismos cuantas veces
se repita.
EXPERIMENTO
Proceso que puede
repetirse y obtener un
resultado, llamado
espacio muestral:  ALEATORIO
Los resultados no se * Lanzar un dado
pueden predecir a pesar * Concebir un hijo
de repetir bajo las * Lanzar una moneda
mismas condiciones

EVENTO
Puntos muestrales

A = Sexo de un niño al ser concebido   = {H, M}  n() = 2


B = Observar el número de caras que aparece al lanzar 3 monedas
 = {sss, ccc, csc, ccs, ssc, css, scc, scs}  n() = 8

PROBABILIDAD DE UN EVENTO
n( A) Nº de resultados favorables
P( A) 
n(Ω) Nº de resultados posibles

Evento o Suceso:
Es un subconjunto del espacio muestral y se denota por letras mayúsculas. n( B ) 3
B = Obtener 2 caras P( B)  
n(B) = 3 Y n() = 8 n (Ω ) 8
AXIOMAS DE PROBABILIDAD
1. P(A)  0
2. 0 < P(A) < 1
3. P() = 1

4. Probabilidad de la Adición de Eventos A BB


• Si A y B son mutuamente excluyentes 
P(A U B) = P(A)+P(B)
En general:
P(A1 U A2 U.... U An) = P(A1)+P(A2)+....+P(An) 
• Si A y B no son mutuamente excluyentes A B
P(A U B) = P(A)+P(B) - P(A ∩ B)
PROBABILIDADES

PROBABILIDAD DE UN EVENTO

A B
AXIOMAS DE PROBABILIDAD
C
Si A, B y C no son mutuamente excluyentes

P(A U B U C) = P(A)+P(B)+P(C) - P(A ∩ B) - P(B ∩ C) - P(A ∩ C) + P(A ∩ B∩ C)

NOTA.- AC A
P(A U AC) = P(A) U P(AC) = 1

Ejemplo: Un 15% de los pacientes atendidos en un hospital son hipertensos, un


10% son obesos y un 3% son hipertensos y obesos. ¿Qué probabilidad hay de que
elegido un paciente al azar sea obeso o hipertenso?
A = {obeso} B = {hipertenso}
A ∩ B = {hipertenso y obeso}
A U B = {obeso o hipertenso}
P(A) = 0,10; P(B) = 0,15; P(A ∩ B) = 0,03
P(A U B) = 0,10 + 0,15 - 0,03 = 0,22
EJEMPLO .-
En una comunidad, se evaluó el estado de nutrición de 100 niños menores
de 5 años de edad, obteniéndose los siguientes resultados:
*********************************************************
SEXO ESTADO de NUTRICION
Normal Malnutrido TOTAL
*********************************************************
Hombres 40 15 55
Mujeres 20 25 45
********************************************************
TOTAL 60 40 100
********************************************************
Se elige un niño al azar, cuál es la probabilidad de que sea hombre o su
estado de nutrición sea normal ?
SOLUCION
H: Sea hombre
N: Tenga estado nutricional normal

P(HUN) = P(H) + P(N) - P(HN)


P(HUN) = 55/100 + 60/100 - 40/100 = 0.75
EJEMPLO.-
Se recolectó información sobre el peso del recién nacido y si la madre
fumó o no durante el embarazo. Los datos se presentan a continuación:

FUMA
CIGARRILLOS PESO R N. TOTAL
BAJO NORMAL
SI 30 10 40
NO 20 140 160
TOTAL 50 150 200
¿Cuál es la probabilidad de que un recién nacido tenga bajo peso o sea
normal?
SOLUCION

B : Tenga bajo peso al nacer


N : Tenga peso normal

P( B  N ) = P( B ) + P( N )
P( B  N ) = 50 / 200 + 150 / 200 = 1
PROBABILIDADES

• PROBABILIDAD CONDICIONAL P(A/B)


La probabilidad condicional está referida a la posibilidad de que ocurra
un evento (A) dada la condición de que otro evento (B) ya ocurrió. Es
decir, en este caso ya no nos referimos al espacio muestral total, sino al
subespacio conformado por el evento condicional. En este caso el
nuevo espacio muestra es B y la única posibilidad de que ocurra A es
que se den ambos.

Ejemplo: Se sabe que el 50% de la población fuma y que el 10% fuma y


es hipertensa. ¿Cuál es la probabilidad de que un fumador sea
hipertenso?
A = {ser hipertenso} B = {ser fumador}
A ∩ B = {ser hipertenso y fumador}
P(A|B) = 0,10/0,50 = 0,20
Tablas de contingencia

Ejemplo: La investigación de las quejas de los consumidores referentes a


productos realizada por la Federal Trade Comisión (FTC, Comisión
Federal de comercio de Estados Unidos), ha generado gran interés por
parte de los fabricantes en la calidad de sus productos. Un fabricante
de procesadores de alimentos realizó un análisis de un gran número
de quejas de los consumidores y determinó que entraban en las seis
categorías que se muestran en la tabla 2. si se recibe una queja de un
consumidor, ¿Qué probabilidad hay de que la causa de la queja sea el
aspecto del producto, dado que la queja se origino durante el periodo
de garantía?
Tabla 2: Distribución de quejas por producto
EJEMPLO: Se dispone de 110 historias clínicas,
pertenecientes a pacientes masculinos y femeninos
agrupados por su nivel de hemoglobina.

Sexo M F
(Femenino
Estado (Masculino) ) Total
A (Anémico) 50 30 80
N
(Normal) 10 20 30
Total
Dado que la 60 corresponde
historia clínica 50 110 paciente
a un
anémico, ¿cuál es la probabilidad que sea mujer?
SOLUCION
n(FA) 30
P(F/A) = ----------- = ------ = 0.375
n(A) 80
Probabilidades
Muestreo
 Representati
vidad (tipo
Población: N Muestra: n de muestreo)
 Tamaño de
 x muestra
S2
2

 Estimación de
Inferencia parámetros
 Pruebas de hipótesis
Inferencia
 Los métodos estadísticos inferenciales
constituyen una forma de extraer conclusiones
respecto a una población, de los datos
obtenidos realmente de una muestra.

 La inferencia estadística comprende dos tipos


principales de técnicas: Estimación de
parámetros y contrastación de hipótesis.
Independientemente de la técnica que se utilice,
la finalidad general es utilizar datos de una
muestra para extraer conclusiones respecto a
una población.
Estimación de parámetros

Las técnicas de estimación son utilizadas cuando el


investigador no tiene hipótesis previa respecto al valor
de una característica de la población y desea conocer
cuál podría ser tal valor.

La estimación puede asumir 2 formas:

• Estimación puntual

• Estimación por intervalos


Estimación puntual

(A) Estimación Puntual para la media poblacional.


Se halla mediante las siguientes fórmulas.
- Para datos simples - Para datos
agrupados
 xi  xi f i
 = x=  = x=
 fi
 

n
(B) Estimación Puntual para la varianza poblacional.
Se halla mediante las siguientes fórmulas.
- Para datos simples - Para datos agrupados

 2
s =
2  x  n( x)
2 2

 2
s =
2  x f  n( x)
2 2

n 1  f 1
 Se tiene interés en estudiar el sueldo promedio de los
auxiliares de enfermería del Hospital Base AG, para tal
efecto se recurre a una muestra aleatoria de 36
auxiliares de enfermería y se obtiene los siguientes
resultados:
Media = 160 y Desviación estándar = 32
Respuesta: La estimación por punto del sueldo medio
del parámetro población será: 160

Mg. Rosa Padilla Castro


Estimación de parámetros

 Estimación por intervalos


La estimación por intervalos de un parámetro nos
indica límites dentro de los cuales el parámetro
tiene la probabilidad especificada de estar. Los
estimados por intervalos se conoce como
intervalos de confianza y los límites inferior y
superior como los límites de confianza.

 
P(  - k       + k   ) = 1 - 

Estimación por intervalos

 Para una media Poblacional:


 
P( x - Z (1  )    x + Z (1  ) ) = 1 - 
2 n 2 n

 Para una proporción Poblacional:


pq pq
P(p - Z 
(1 )  P  p + Z (1 )

)= 1 - 
2 n 2 n

Mg. Rosa Padilla Castro


 Con relación al ejemplo anterior establezca un
intervalo de confianza del 95% para el sueldo
promedio de los auxiliares de enfermería del Hospital
Base AG. Use la siguiente información:
Media = 160
Desviación estándar = 32
Intervalo de confianza = 95%
Z = 1.96
n = 36
Mg. Rosa Padilla Castro
 Estimar la proporción de niños desnutridos menores de
5 años de edad en una determinada comunidad, para
tal efecto se selecciono una muestra de 100 niños
menores de 5 años y se encuentra 45 desnutridos.
Considere los siguientes datos:
Nivel de confianza = 95%
Z = 1.96
p = 0.45
n = 100
Mg. Rosa Padilla Castro
Mg. Rosa Padilla Castro
Pruebas de hipótesis

 Hipótesis: Una Hipótesis estadística es


una afirmación relativa sobre un modelo
probabilístico y una prueba de hipótesis
es un método para determinar la
posibilidad de esa afirmación relativa en
base a una muestra.
 Hipótesis establecidas en esta forma
proporcionan con frecuencia motivo para
realizar una investigación. Por esta razón
se le denomina hipótesis de investigación.
No se rechaza la Ho se rechaza la Ho

Hipótesis Decisión Error de


verdadera correcta Tipo I (

Hipótesis Error de Decisión


falsa Tipo II (b correcta

Siempre que se rechaza una Hipótesis nula se


corre el riego de cometer un error del tipo I ( )

Siempre que no se rechaza una Hipótesis nula


existe el riego de cometer al error tipo II ( b )
Pasos para las pruebas de Hipótesis

1.Formular dos hipótesis mutuamente excluyentes

Hipótesis nula (Ho): que especifica valores hipotéticos


para uno o más de los parámetros poblacionales.

Hipótesis alterna (Ha): donde se afirma que el parámetro


poblacional tiene un valor distinto al hipotético, esta se
acepta cuando se rechaza la Ho.

2.Determinar el nivel de significancia a la probabilidad de


cometer un error tipo I pueden ser:
  0.01   0.05   0.10
3. Determinar la prueba a utilizar.
Pasos para las pruebas de Hipótesis

4. Determinar la potencia de la prueba o probabilidad de


aceptar la hipótesis nula.
p-valúe ó sig.

5. Tomar la decisión de aceptar o rechazar la Ho, o nos


abstenemos de tomar la decisión de acuerdo al criterio.
La decisión de una prueba estadística está asociada al nivel de
significación ( = 0.05, 0.01)
a) Si P <  Se rechaza la hipótesis nula, es decir existe
significación en la prueba
b) Si P >=  No se puede rechazar la hipótesis nula, es decir no
existe significación en la prueba

6. Formular las conclusiones finales.


Hipótesis relativa a una media

H o :   o
 /2
 /2
Ha :    o  bilateral .  o

  o 
unilateral
  o 

  0.05  o

Nivel de significancia:
  0.01
Mg. Rosa Padilla Castro
APLICACIÓN DE LA DISTRIBUCION JI
CUADRADO X 2
COMPARACION EN
MEDICINA
En todo acto de comparación hay una intencionalidad
analítica subyacente: encontrar igualdades o,
alternativamente, encontrar diferencias.
Esta capacidad de discriminar entre las observaciones
que se hace de la realidad es un requisito para
identificar las necesidades en salud de la población,
establecer prioridades y, consecuentemente, desarrollar
acciones en salud dirigidas a modificarlas
positivamente
HIPOTESIS
Un aspecto central en este raciocinio analítico es la generación
de explicaciones tentativas, suposiciones, pronósticos o
conjeturas verosímiles respecto a una relación causa-efecto que
encierran incertidumbre; es decir, la generación de hipótesis.
Una hipótesis es una suposición que se hace de una
observación o reflexión, que lleva a predicciones refutables. Para
la aplicación de pruebas estadísticas a los datos obtenidos, se
requiere la elaboración de dos hipótesis: la hipótesis alterna o de
investigación (HA) y la hipótesis nula o de no-diferencia (HO),
sobre las cuales se enfocaran los resultados del análisis
estadístico
MEDIDAS DE ASOCIACION
Revisaremos los principios y métodos estadísticos básicos que
ayudan a los equipos locales de salud a establecer la presencia
de una asociación entre la exposición a un factor que se
considera de riesgo y la ocurrencia de enfermedad en la
población. En términos estadísticos, se dice que dos variables
están asociadas cuando existe una relación de dependencia
(usualmente de tipo matemático) entre ambas; es decir, el cambio
en una de ellas necesariamente se acompaña del cambio en la
otra (covariación).
Asociación: relación de dependencia estadística entre dos o más
eventos, características u otras variables. Una asociación está
presente si la probabilidad de ocurrencia de un evento depende
de la ocurrencia de otro u otros.
MEDIDAS DE ASOCIACION
La aplicación del término ‘asociación’ siempre
implica la intención de establecer una relación de
causa a efecto entre una exposición y una
enfermedad o evento en salud. Sin embargo, debe
tenerse presente que una asociación puede ser
fortuita o ‘espuria’ o puede ser producida por varias
circunstancias y, por tanto, la presencia de una
asociación estadística no necesariamente implica
una relación causal.
MEDIDAS DE ASOCIACION
Por otra parte, un factor de riesgo es un aspecto del
comportamiento o estilo de vida personal, constitución genética o
hereditaria o exposición ambiental que, con base en la evidencia
disponible, se sabe que está asociado a condiciones relacionadas
con la salud consideradas importantes de prevenir. Lo más
importante de un factor de riesgo es que sea identificable,
cuantificable y, en lo posible, modificable antes de la ocurrencia del
hecho que predice. Los factores de riesgo son indicadores o
marcadores del riesgo de enfermar en la población aunque, debe
tenerse presente que el hallazgo de un factor de riesgo no
necesariamente implica que sea un factor causal.
FACTOR DE RIESGO
Característica o circunstancia detectable en
individuos o grupos, asociada con una
probabilidad incrementada de experimentar un
daño o efecto adverso a la salud. En general, un
factor de riesgo es un atributo o exposición que
incrementa la probabilidad de ocurrencia de una
enfermedad u otro daño a la salud.
PRUEBAS DE
SIGNIFICANCIA
Las medidas de asociación estadística se basan en
las llamadas pruebas de significancia.
El propósito de estas pruebas es determinar si la
presencia de un factor de riesgo evaluado está
efectivamente relacionada con la frecuencia de la
enfermedad. En dichas condiciones se espera que
la prevalencia de exposición a dicho factor sea
razonablemente más alta entre los que han
enfermado o sufrido un daño a la salud que en
aquellos aparentemente sanos.
CHI CUADRADO

En una localidad rural de 760 habitantes, situada


en una zona malárica, se observó que, en el
último año, la incidencia acumulada de malaria
en campesinos fue 88,2 por mil, mientras que en
la población no campesina fue 55,8 por mil. De
acuerdo al censo local más reciente, en la
comunidad hay 204 campesinos. Interesa saber
si la ocupación campesino se asocia a la malaria.
CHI CUADRADO
Desde el punto de vista estadístico, interesa conocer si
hay diferencia significativa entre las dos medidas de
incidencia acumulada. En este caso se puede aplicar
una prueba de significación estadística llamada Chi
Cuadrado (x2), cuya formula es
En la fórmula, “O” se refiere al valor observado en una celda
y “E” a su valor esperado. La fórmula trabaja
exclusivamente con las celdas centrales de un cuadro, en
este caso una tabla 2x2, y hace referencia a las frecuencias
observadas en dichas celdas y las que se esperaría
ocurrieran (valores esperados) si efectivamente no hubiera
diferencia entre las proporciones que se comparan. Los
valores esperados para cada celda central se obtienen
multiplicando sus totales marginales correspondientes y
dividiendo este producto por el gran total. Por ejemplo, en la
primera celda central (campesino con malaria), el valor
observado es 18 y el valor esperado sería: (204 x 49) ÷ 760 =
13,2. El cuadro de resultados para cada celda quedaría así:
El valor de chi cuadrado calculado de esta manera (observado) se
compara con un valor tabulado (esperado) tomado de la
distribución de probabilidades teóricas. Este valor teórico
corresponde al que se esperaría encontrar si los resultados
observados ocurrieran puramente por azar. A este valor teórico se le
llama valor critico: si el valor observado es mayor que el valor
crítico se concluye que la diferencia observada no es debida al azar
y se dice que es estadísticamente significativa. El valor crítico
indica el nivel de significancia de la prueba, que expresa la
probabilidad de que la diferencia observada haya ocurrido por azar
(dado que, en realidad, no existan diferencias). Usualmente esta
probabilidad se fija en 5% y se denota como p<0,05. El
complemento de esta probabilidad se llama nivel de confianza, en
general, 95%.
Para un nivel de confianza de 95%, el valor crítico del Chi
Cuadrado (de acuerdo a una tabla de distribución teórica) es
3.84, que corresponde al llamado chi cuadrado con un grado de
libertad, específico para tablas 2x2. Los grados de libertad de
una tabla se refieren al número mínimo de frecuencias en las
celdas centrales que se necesita conocer para poder completar
los valores de las demás celdas, dados los valores de los
totales marginales. En la situación analizada, el valor
observado (2,56) no rebasa el valor crítico (3,84), por tanto se
concluye entonces que concluye entonces que no se puede
rechazar la hipótesis de no-diferencia (de nulidad). En
consecuencia, se puede afirmar con 95% de confianza
estadística que la ocupación campesino no está
significativamente asociada a la presencia de malaria (p>0.05).
REGLA DE DECISION
Si X2 > 3,842: RECHAZAR H0, ES DECIR QUE
LAS CARACTERISTICAS ESTAN ASOCIADAS.

Si X2 < = 3,842: NO RECHAZAR H0, ES DECIR


QUE LAS CARACTERISTICAS SON
INDEPENDIENTES.
ANALISIS DE REGRESION LINEAL SIMPLE
INTRODUCCION
• El análisis de regresión, consiste en la medición del grado de
dependencia de una variable dependiente denotada por Y
sobre una variable independiente (X) mediante una función
matemática, además, permite predecir o estimar el valor de
una variable (dependiente) correspondiente al valor dado de
la otra variable (independiente). Las variables X e Y deben
ser de naturaleza cuantitativa y de preferencia continua. Por
ejemplo, podríamos estar interesados en estudiar la relación
entre la presión arterial (Y) y la edad (X) respectiva entre los
adultos, se puede también estar interesado en evaluar la
relación entre el nivel de colesterol (Y) y el peso de las
personas adultas (X).
SUPUESTOS DEL MODELO DE
REGRESION LINEAL SIMPLE
• Intervienen dos variables cuantitativas continuas, de las
cuales a una de ellas se denota por X que se denomina
variable independiente o matemática y a la otra variable Y
se le considera como dependiente o aleatoria.
• Para cada valor de X hay una subpoblación de valores Y,
cada subpoblación de los valores de Y tiene distribución
normal.
• Las varianzas de las subpoblaciones deben ser iguales a
la varianza poblacional.
MODELO DE LA ECUACION DE
REGRESION LINEAL SIMPLE
ESTIMACION DE LA ECUACION
DE REGRESION LINEAL SIMPLE
EJEMPLO REGRESION LINEAL
SIMPLE
• Se reunieron los siguientes datos
correspondientes a 10 familias para estudiar la
relación entre la inteligencia y el numero de
niños por familia
• Y = Calificación promedio de CI
• X = Numero de niños en la familia
NUMERO DE NIÑOS EN LA FAMILIA (X) CALIFICACION PROMEDIO DE CI (Y)
1 105

2 102

3 104

4 100

5 97

6 101

7 95

8 93

9 97

10 88
NUMERO DE CALIFICACION X2 Y2 XY
NIÑOS PROMEDIO CI

1 105 1 11025 105

2 102 4 10404 204

3 104 9 10816 312

4 100 16 10000 400

5 97 25 9409 485

6 101 36 10201 606

7 95 49 9025 665

8 93 64 8649 744

9 97 81 9409 873

10 88 100 7744 880

55 982 385 96682 5274


CALCULOS PRELIMINARES
• Sumatoria de X: 55
• Sumatoria de Y: 982
• Sumatoria X2: 385
• Sumatoria Y2: 96,682
• Sumatoria XY: 5,274
• Unidad de Análisis: La familia, de dicha familia
obtenemos los datos concernientes al numero de
niños y el coeficiente de inteligencia (CI) promedio
de dichos niños.
MODELO DE LA ECUACION

• Y = Coeficiente de Inteligencia promedio de los


niños de una familia
• B0 = Intercepto
• B1 = Coeficiente de regresión
• X = Numero de niños por familia.
• E = Error aleatorio
CALCULO DE B1

5274 – (55 X 982) / 10


• B1 = -------------------------------- = - 0.3665
385 – 385 / 10

• B0 = Y/n – (B1) (X/n) = 98.2 – (- 0.3665) (5.5) = 100.21575


MODELO DE LA ECUACION

• Y = Coeficiente de Inteligencia promedio de los niños


de una familia
• B0 = Intercepto
• B1 = Coeficiente de regresión
• X = Numero de niños por familia.
• E = Error aleatorio
• Y = 100.21575 + (- 0.3665) X
INTERPRETACION
• El coeficiente de regresión estimado significa que: Por cada
incremento de un niño en la familia su respectivo coeficiente de
inteligencia promedio de dichos niños disminuirá en 0.3665 puntos.
• También puede haber interés en estimar el coeficiente de inteligencia
promedio para aquellas familias que tienen 11 niños. Para tal efecto,
se utiliza el modelo de regresión lineal simple estimado y cuyo valor
es: 96.18425
• Por lo tanto, para las familias que tienen 11 niños se espera que el
coeficiente de inteligencia promedio de dichos niños sea de 96.2
puntos.
• Se recomienda que las estimaciones de los valores de Y estén
comprendidos en el recorrido de los valores de X, porque fuera de
este recorrido no estamos seguros si la relación sigue siendo lineal.
COEFICIENTE DE DETERMINACION
• También:

(-0.3665)2 x (385 – (55)2/10)


• R2 = -------------------------------------------- x 100
96682 – (982)2/10
MODULO II
DEMOGRAFIA
Etimológicamente la palabra demografía procede del griego
“demos” que significa pueblo y “ graphein” que significa
estudio, descripción o tratado, por lo que desde el punto de
vista etimológico la demografía es el estudio o la descripción
de los pueblos en relación con su población. Dicho en otros
términos , la demografía es la ciencia que estudia
estadísticamente la población
El concepto de demografía evoluciono y como ejemplo tenemos
la definición que aparece en el Diccionario Demográfico
Plurilingüe de las naciones Unidas:

“Demografia es la ciencia que tiene por objetoel estudio del


volumen , estructura y desarrollo de las poblaciones humanas
desde un punto de vista principalmente cuantitativo”

En conclusión , la demografía , ciencia de la población humana


describe y analiza en el tiempo y en el espacio , fundamentalmente
desde un punto de vista cuantitativo los hechos sucedidos en la
población , tratando de acuerdo a las tendencias pasadas y
presentes de visualizar el futuro. De aqui el carácter prospectivo
que tiene la demografía.
Demografía es la ciencia que tiene por objeto el estudio del
volumen , estructura y desarrollo de las poblaciones
humanas desde un punto de vista principalmente
cuantitativo (Dicc. Demográfico Plurilingüe).

“La demografía es la ciencia de la población.”

“La demografia es la historia natural y social de la especie humana”

“ La demografia es el conocimiento matematico de la poblacion,


su estado físico intelectual y moral (Demografía medica, Páez Celis)

“Ciencia que estudia los fenomenos y problemas de la poblacion


ocupándose particularmente de la investigación estadística de sus
tendencias , composición, tamaño y distribución” (Enciclopedia
Salvat)
De acuerdo a las definiciones expuestas anteriormente se
distinguen dos ramas en la demografía:

Demografía cuantitativas o demografía descriptiva

Es aquella que a partir de técnicas y estadísticas demográficas


describe matemáticamente las poblaciones humanas, en espe
cial aquellos fenómenos que pueden influir en el numero
De habitantes de una región o país

Demografía cualitativa o demografía explicativa

Estudia las características , cualidades y atributos de la


población
Con especial énfasis en los factores que originan aquellos
analizando las causas y consecuencias de los diferentes
comportamientos demográficos.
Objeto de la Demografía

“Es el estudio de las poblaciones humanas a las cuales describe


estadísticamente (Pressat, R)

“ Estudio estadistico de la poblacion humana desde dos puntos de


vista:
Estático (estructuras de la población)
Dinámico (Movimientos Migratorios)
Matterlart, A)
DEMOGRAFÍA

ETIMOLOGÍA

Demografía: del griego demos=pueblo


y grafos=trazo, descripción.

CONCEPTO Y OBJETO DE ESTUDIO

La demografía estudia
estadísticamente la estructura y la
dinámica de las poblaciones
humanas y las leyes que rigen
estos fenómenos.
DEMOGRAFÍA
RESEÑA HISTÓRICA

 Ibn Jaldún (1332-1406) es el padre de la


demografía, ya que fue el primero en considerar
los datos estadísticos en sus estudios.

 Thomas Malthus (1766-1834), considerado el


padre de la demografía moderna, publicó en
1798 su obra llamada “Ensayo sobre el principio
de la población”, en la que advertía de la
tendencia constante del crecimiento de la
población humana superior al de la producción de
alimentos.
DEMOGRAFÍA
Evolución Histórica de la Demografía

 Epoca Antigua:

Los primeros conteos de población de los que se


tiene referencia fueron llevados a cabo en Grecia y
Roma en la edad antigua y tenían como propósito
obtener la información económica de los individuos
para organizar la recolección de impuestos. De
igual manera los cálculos hechos por los hebreos
(mencionados en la Biblia) parecen haberse
efectuado con el fin de calcular el poderío militar

 Epoca Prehistórica:

En América por lo época prehispánica se realizaron


contribuciones de la población Inca a sus
gobernantes y además fueron los primeros en
llevar registros de Nacimientos y defunciones
DEMOGRAFÍA
 Edad media:

En la edad media los censos fueron muy escasos,


sin embargo, se llevaron a cabo algunos registros
de población por categorías sociales por ejemplo en
Alemania y Francia se realizaron algunos conteos
por la nobleza y el clero. Durante esta época
aparecieron en Europa los primeros registros de
sucesos vitales, que contabilizaban los nacimientos
las defunciones y los matrimonios que existían en
una comunidad.

 Siglo XIX:

Hacia finales del siglo XIX se fueron generalizando


los conteos de población la mayor parte de los
países del mundo ya efectuaban censos de tal
forma que fue posible conocer cifras aproximadas
del comportamiento demográfico de la población
mundial.
DEMOGRAFÍA

 Edad Moderna:

En el período comprendido entre 1955 y 1963 más


de 185 países llevaron acabo censos de población,
experiencia que motivó a las naciones unidas a
crear en 1946 un fondo para asuntos de
estadística, con el fin de ofrecer asesoría y
préstamos a los países para que realizaran los
conteos correspondientes.
DEMOGRAFÍA

La evolución demográfica se
puede dividir en dos etapas:

Desde la aparición del hombre hasta


1750: Se caracteriza por un crecimiento
demográfico muy lento ascendente,
paralelo a la expansión de los recursos
económicos. Este período fue dominado
por el descubrimiento, desarrollo y
perfeccionamiento de las herramientas, el
desarrollo de la agricultura y la
domesticación de animales, es decir,
estuvo marcado por las primeras
innovaciones tecnológicas.
DEMOGRAFÍA
La evolución demográfica se
puede dividir en dos etapas:

Desde 1750 hasta la actualidad:


caracterizada por una gran expansión
demográfica, producto de los cambios
ocurridos a partir de la segunda mitad del
siglo XVIII a causa de las revoluciones
agraria, industrial y tecnológica. Estas
revoluciones permitieron la obtención de
excedentes alimenticios con los cuales
disminuyó el hambre y liberó mano de
obra de las actividades agrarias. Este
excedente de fuerza de trabajo en las
actividades primarias comenzó a ocuparse
en actividades industriales y terciarias
DEMOGRAFÍA
Tipos de demografía

 Demografía estática: Es la parte de la


demografía que estudia las poblaciones humanas
en un momento de tiempo determinado:
dimensión, territorio, estructura y características
estructurales.

 Demografía dinámica: Es la parte de la


demografía que estudia las poblaciones humanas
desde el punto de vista de la evolución en el
transcurso del tiempo y los mecanismos por los
que se modifica la dimensión, estructura y la
distribución geográfica de las poblaciones.
Ejemplos de tales mecanismos son la natalidad, la
nupcialidad, la familia, la fecundidad, el sexo, la
edad, la educación, los divorcios, el
envejecimiento, la mortalidad, las migraciones, las
inmigraciones, etc.
DEMOGRAFÍA

Las fuentes para el estudio de la población:

Fuentes indirectas

Los censos
DEMOGRAFÍA

Los movimientos naturales de la población:

Los movimientos naturales de una población son aquellos


que muestran el crecimiento o descenso del número de
habitantes atendiendo únicamente a los nacimientos y las
defunciones. Para ello debemos calcular la tasa de natalidad
la tasa de mortalidad y el crecimiento vegetativo.
DEMOGRAFÍA

Los movimientos naturales de la población:

La tasa de natalidad nos dice cuantas personas han nacido por


cada mil habitantes, en una población determinada.

Tasa bruta de natalidad = (Nacimientos/Población) x 1000


Se considera alta si está por encima de 30%, moderada entre
15 y 30 % y baja por debajo del 15 %.
DEMOGRAFÍA

Los movimientos naturales de la población:

La tasa de mortalidad indica el número de defunciones de


una población cada mil habitantes.

Tasa bruta de mortalidad = (Defunciones/Población) x 1000


Se considera alta si está por encima de 30%, moderada entre
15 y 30% y baja por debajo del 15%.
DEMOGRAFÍA

Los movimientos naturales de la población:

La tasa de fecundidad sólo tiene en cuenta a las mujeres en edad de


tener hijos.

Tasa de fecundidad = (Nacimientos/Mujeres entre 15 y 49 años) x 1000


Como son las mujeres las que tienen los hijos de ellas depende la
regeneración de la población. Si hay pocas mujeres la posibilidad de
reemplazo es muy pequeña. Esto se calcula con la tasa de
reproducción.

Tasa reproducción = (Niñas nacidas/ Mujeres entre 15 y 49 años) x 1000


DEMOGRAFÍA

Técnicas demográficas para el estudio de la


población:

El crecimiento natural, o vegetativo se obtiene mediante la


siguiente formula:

Crecimiento natural = Nacimientos – Defunciones

Si hay más defunciones que nacimientos obtendremos un


número negativo.
DEMOGRAFÍA

EL CRECIMIENTO Y ESTRUCTURA POR EDADES DE LA POBLACIÓN.

LA PIRAMIDE DE POBLACIÓN:

Es la representación gráfica de la estructuración de una


población determinada de acuerdo con el sexo y la edad de sus
integrantes. Algunas veces también se emplea el nombre de
pirámide de edades.
DEMOGRAFÍA

EL CRECIMIENTO Y ESTRUCTURA POR EDADES DE LA POBLACIÓN.

LA PIRAMIDE DE POBLACIÓN:

¿Por qué es importante saber cuantos hombres y cuantas mujeres


existen en un país y cuáles son sus edades?
DEMOGRAFÍA

EL CRECIMIENTO Y ESTRUCTURA POR EDADES DE LA POBLACIÓN.

LA PIRAMIDE DE POBLACIÓN:

• La población infantil, los adolescentes y los ancianos son


económicamente inactivas y por consiguiente, están a cargo de los
adultos. Del conocimiento de la composición por edades de una
población se deduce la relación entre los grupos en edad de producir
y los improductivos.
DEMOGRAFÍA
EL CRECIMIENTO Y ESTRUCTURA POR EDADES DE LA POBLACIÓN.

LA PIRAMIDE DE POBLACIÓN:

• El número de población activa es un indicador del grado de desarrollo


de un país.

• Conocer el sexo y la edad de la población es esencial para la tarea de


gobernar, pues indica que tipos de programas gubernamentales son
prioritarios. Cada grupo, según la edad tiene unas necesidades
específicas (estudio, recreación, trabajo, atención médica).
DEMOGRAFÍA

EL CRECIMIENTO Y ESTRUCTURA POR EDADES DE LA POBLACIÓN.

LA PIRAMIDE DE POBLACIÓN:

• Para la actividad productiva, comercial y recreativa, es esencial saber


la edad y el sexo de la población, pues los hábitos de consumo varían
de acuerdo con estos factores.
DEMOGRAFÍA
EL CRECIMIENTO Y ESTRUCTURA POR EDADES DE LA POBLACIÓN.

LA PIRAMIDE DE POBLACIÓN:

HOMBRES MUJERES
DEMOGRAFÍA
Tipos de pirámides:

• Expansiva o progresiva:

Es propia de los
países del Tercer
Mundo en plena
transición
demográfica con
altas tasas de
natalidad y
mortalidad, y con
un crecimiento
natural alto.
Pirámide de una población en rápido crecimiento (Angola)
DEMOGRAFÍA
Tipos de pirámides:

• Regresiva:

Es propia de los países


desarrollados que han
terminado la
transición
demográfica, pero aún
están presentes sus
últimas generaciones.
Se trata de una
población envejecida
con bajas tasas de
natalidad y de
mortalidad, y con un Pirámide de una población en fase de envejecimiento (Francia).
crecimiento natural
reducido.
DEMOGRAFÍA
Tipos de pirámides:

• Estancada: con base y centro parecidos y cima reducida.

• Desequilibrada:

Cuando existe una desproporción tanto en lo que respecta a


la composición según sexo, como en lo que respecta a las
edades y casi siempre se produce una combinación de las dos
posibilidades.
DEMOGRAFÍA

Ejemplo de pirámide desequilibrada (Emiratos Árabes)


Objeto

Análisis de la Población

Dinámico Estático

Mov General de la
población Estructuras

Demográfica
Mov.Natural Geográfica
Económica
Mov.Migratorio
Política
Mov.Natural Mov.Migratorio

Natalidad Mortalidad Inmigración Emigración

Crecimiento Natural Saldo Migratorio


Demográfica

Edad Sexo Estado Civil

Joven (0-19) Masculino Solteros


Adulta (20-59) Femenino Casados
Vieja (>60) Divorciados
Unidos
Separados
Geográfica Económica Política

Urbana PEA Nativos


Rural PEI Extranjeros
Objeto

Análisis de la Población

Dinámico Estático

Estructuras
Mov General de la población

Demográfica Geográfica Económica Política


Mov.Natural Mov.Migratorio

Nativos
Urbana PEA
Extranjeros
Rural PEI

Natalidad Mortalidad Inmigración Emigración

Edad Sexo Estado Civil

Joven (0-19)
Masculino
Adulta (20-59) Solteros
Femenino
Vieja (>60) Casados
Crecimiento Natural Saldo Migratorio Divorciados
Unidos
Separados
Métodos de la Demografía

Los métodos que utiliza la demografía para observar y estudiar


científicamente la población son los mismos que emplean las
ciencias sociales. Pero presentan dos particularidades:

•La organización de estos métodos es mucho mas difícil y


compleja que los de las ciencias naturales

•La experimentación u observación controlada, en espacios


cerrados es generalmente imposible e inaceptable en ciencias
sociales.
Una vez identificado el objeto de estudio , los objetivos
y alcances de la investigación demográfica se procede de
acuerdo a las siguientes fases
Fase I. Observación

la investigación demográfica comienza por la recopilación


de la información demográfica. Esta información puede ser :

Primaria Levantamiento de Encuestas por muestreo

Censos

Secundaria Anuarios

Publicaciones Estadísticas Diversas


Los datos demográficos , primarios y secundarios , son cifras
o brutas que deben ser procesadas para convertirlas en hechos
demográficos que son cifras evaluadas, corregidas y expresadas
en tasas , índices, razones o proporciones. esta información
debe ser mapeada y graficada para asi poder conocer la esencia
del comportamientos demograficos.

Fase II. Análisis e Interpretación

En esta fase se divide y se detalla , se compara y se clasifica. Se


efectúa la descomposición del todo en sus partes componentes.
Fase III. Síntesis

A diferencia de la fase anterior , se unifican los resultados


se verifican las hipótesis a partir de las regularidades o
irregularidades de los comportamientos demográficos y se crea
la teoría que viene a ser la comprobación de las hipótesis.

La teoría se elabora de la observación y estudio de hechos y


comportamientos aislados que deben poseer carácter genérico
, es decir, cumplen con la condición de universalidad
La demografía, para poder explicar científicamente los
comportamientos demográficos, al igual que otras ciencias
sociales, se sitúa en la intersección o encrucijada de ciencias
tanto sociales como biológicas.

La relación que establece la ciencia demográfica no es, por otra


parte, en un solo sentido, sino que la demografía auxiliándose
en otras disciplinas evoluciona y se consolida, enriqueciendo al
conjunto de las ciencias con el aporte de sus propios
descubrimientos.
Se ha comprendido que los problemas de población no
poseen una solución exclusivamente demográfica. De esta
forma, la demografía establece relaciones prácticamente con
todas las ciencias sociales, fundamentalmente con la
economía, geografía, sociología, historia, antropología,
política y con algunas ciencias biológicas tales como la
biología, genética, biometría, medicina.
Población
 Conjunto de individuos, constituido de forma estable,
ligado por vínculos de reproducción e identificado por
características territoriales, políticas, jurídicas, étnicas o
religiosas.
EJERCICIO PIRAMIDE
POBLACIONAL
Mg. Rosa Padilla Castro

También podría gustarte