Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA. ESTADÍSTICA
DESCRIPTIVA.
INTRODUCCIÓN
FASES DEL MÉTODO CIENTÍFICO
Identificación del
PROBLEMA INVESTIGACIÓN problema: pregunta
de investigación
Resolución del problema/
BASES DE CONOCIMIENTO
nuevas hipótesis
DISCUSIÓN HIPÓTESIS
OBJETIVOS
RESULTADOS
RECOGER
CLASIFICAR - No permite extraer conclusiones
DESCRIPTIVA
REPRESENTAR - Sujeta a errores
RESUMIR
- Permite generalizar de la
INFERENCIAL HACER INFERENCIAS muestra a la población general
- Toma de decisiones
ESTADISTICA DESCRIPTIVA
EJEMPLO:
De las 50 personas estudiadas 10 (20%) eran
varones, la media de edad de 30 años (DE 18), …
CONCEPTOS GENERALES
TIPOS DE EXPERIMENTOS
DETERMINISTAS
ALEATORIAS/ESTOCASTICOS
PROCESO ESTADÍSTICO
POBLACIÓN
Inferencia Parámetro
estadística:
• Estimación Muestreo
puntual / por estadístico
intervalo (probabilístico /
no
• Contraste de
probabilístico)
hipótesis
MUESTRA
Estadístico
Probabilidad /
distribuciones de
probabilidad
Estadística
descriptiva
CONCEPTOS GENERALES
• POBLACIÓN
• INDIVIDUO
Cada uno de los elementos de la población o de la muestra.
• Población
Costes
• Muestra Calidad de los datos
Representatividad
de la población
• Individuos
ESTADISTICO/ESTIMADOR muestra
PARÁMETRO población
VARIABLES
EJEMPLO:
Se quiere probar la efectividad de un nuevo fármaco para
controlar la hipertensión arterial
•Variable independiente:
Nuevo fármaco (factor de estudio)
•Variable dependiente:
Valores de hipertensión arterial
Identificar las variables dependientes e
independientes
2. Variables universales
/complementarias
– Edad
– Sexo
– Clase social
– Estado civil,...
TIPO DE VARIABLES (II)
Cuantitativas Cualitativas
CUANTITATIVAS CUALITATIVAS
Ordinales Nominales
Discretos Continuos
Politómico Dicotómico
peso sexo
endodoncias grupo sanguíneo
colesterol gravedad
nº de hijos religión
• Matriz de datos
- filas
- columnas
• Perdidos
ESCALA A ELEGIR
Consumo de tabaco:
- fumador/no fumador
- nº cigarrillos al día
CODIFICACIÓN:
CUANTITATIVAS CUALITATIVAS
al tipo de dato.
investigación.
CODIFICACIÓN (ejemplo):
NOMBRE SEXO EDAD PESO ALTURA BEBE FUMA REALIZA EJERCICIO FÍSICO
NOMBRE SEXO EDAD PESO ALTURA BEBE FUMA REALIZA EJERCICIO FÍSICO
ECB 2 39 55 157 2 2 0
Pedro 1 33 70 170 2 2 2
JPG 1 50 70 180 2 1 1
CMO 2 40 51 155 2 1 1
NOTACIÓN
Parámetros: a nivel poblacional. Se
suelen usar caracteres griegos (σ,
μ,…)
Variables: x, y, edad
CUALITATIVA D istribución de
PROPORCIÓN
frecuencias
I nteresa la RANGO
dispersión VARIANZA
DESVIACIÓN TÍPICA
COEFICIENTE DE
VARIACIÓN
SÍNTESIS de DATOS
(variables cualitativas)
Grupo sangu íneo, n º de hermanos y peso (en Kg. ) de 500
alumnos varones de una Universidad
Grupo Nº de
A lumno n.º Peso
sanguíneo hermanos
1 A 0 70,502
2 B 3 67,231
― ― ― ―
― ― ― ―
― ― ― ―
― ― ― ―
500 AB 2 71,676
TIPOS DE FRECUENCIAS
n
N i j=1
j i n i
Fi = = f j
j
N N j=1 N j=1
TIPOS DE FRECUENCIAS
… … … … … … …
Xk nk ƒk pk Nk = N Fk = 1 Pk=100
Hemos realizado una encuesta en nuestra consulta de
Atención Primaria y hemos preguntado a los pacientes…
0, 1, 2, 2, 1, 1, 3, 0, 0, 1, 2, 0, 2, 1, 2, 0, 3, 0
Ejemplo número de donuts
Valores Frecuencias Frecuencias Frecuencias Frecuencias Frecuencias Frecuencias
de la absolutas absolutas relativas relativas relativas relativas
variable simples acumuladas simples acumuladas simples acumuladas
porcentuales porcentuales
ni Ni ƒi=ni/N Fi=Ni/N
pi=ƒi*100 Pi=Fi*100
0 6 6 0,33 0,33 33 33
1 5 11 0,28 0,61 28 61
2 5 16 0,28 0,89 28 89
3 2 18 0,11 1 11 100
Total N=18 1 100
Ejercicio: Calcular las frecuencias absolutas y relativas del
sexo y del estado de salud de los siguientes datos:
1 1 0 nhombre
2 2 1 fhombre
3 1 1 nmujer
4 1 1 fmujer
5 2 2 nmalo Nmalo
6 1 0 fmalo Fmalo
7 1 2 nregular Nregular
8 1 2 fregular Fregular
9 2 1 nbueno Nbueno
10 1 2 fbueno Fbueno
Ejercicio: En un estudio de 200 pacientes se evalúa cuantas
radiografías han precisado un grupo de pacientes.
Completar la siguiente tabla de frecuencias absolutas y
relativas de la siguiente tabla:
Nº Rx Personas f i F i
0 0.2
1 84
2 0.72
3
4 24
5 0.02
TRANSFORMACIONES BÁSICAS DE
LAS FRECUENCIAS
Grupo Nº de
A lumno n.º Peso
sanguíneo hermanos
1 A 0 70,502
2 B 3 67,231
― ― ― ―
― ― ― ―
― ― ― ―
― ― ― ―
500 AB 2 71,676
TABLAS DE FRECUENCIA
Distribución del grupo sanguíneo en 500 alumnos varones de
una Universidad
Intervalo de clase ni f i %
Sexo
Masculino n (%) 26 (43.3%) 40 (47.6%)
Femenino n (%) 34 (56.7%) 44 (52.4%)
Peso en kg
media (DE) 56.3 (8.2) 52.7 (7.8)
Edad en años
moda (amplitud) 15 (12 a 18) 14 (12 a 17)
Glucosa en sangre en
130 (112 a
mg/dl 80 (75 a 92)
131)
mediana (RIQ)
REPRESENTACIONES GRÁFICAS
(variables cualitativas)
GRÁFICO DE SECTORES
5,2
19,6 7,6
Médico (n=272)
Residente (n=399)
Enfermería (n=1869)
35,7
31,9 Auxiliar (n=1674)
Celador (n=1027)
40,0
35,7
35,0
31,9
30,0
Frecuencia relativa
25,0
19,6
20,0
15,0
10,0 7,6
5,2
5,0
0,0
Médico Residente Enfermería Auxiliar Celador
(n=272) (n=399) (n=1869) (n=1674) (n=1027)
2000 1869
1800 1674
1600
1400
Frecuencia absoluta
1200
1027
1000
800
600
399
400 272
200
0
Médico Residente Enfermería Auxiliar Celador
100
88,5
90
82,1
80 73,6 72,3
70
Frecuencia relativa
60
50
40
26,4 27,7
30
17,9
20
11,5
10
0
Celadores Médico-residente Enfermería Auxiliares
(n=1027) (n=670) (n=1869) (n=1674)
Incorrecto/No HM Correcto
100
11,5
90 17,9
26,4 27,7
80
70
60
50
88,5
40 82,1
73,6 72,3
30
20
10
0
Celadores Médico-residente Enfermería Auxiliares
(n=1027) (n=670) (n=1869) (n=1674)
Incorrecto/No HM Correcto
A B
Medidas de
Cuantiles
tendencia central
cuartiles,
Media Mediana Moda tertiles,
percentiles, …
MODA
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6
No hay moda
Moda = 9
MEDIA ARITMÉTICA (I)
48 54 58 60
1 N x1 x 2 ... x N
x xi
N i 1 N
Mismas unidades de la variable
Se afecta por los valores extremos:
EJEMPLO:
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Media = 5.0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Media = 6.8
MEDIA PONDERADA
• Se emplea para cuando se quiere dar más peso a unos
valores que a otros.
xP =
(x ×p )
i i
p i
EJEMPLO:
Supongamos que en una asignatura se ha obtenido un 5 en
prácticas, 6 en participación en clase, examen teórico 8 y examen
práctico 6. La nota final es 5% las prácticas, 15% la participación
en clase, 45% el examen teórico y 35% el práctico.
5×5+6×15+8×45+6×35
xP = =6.85
5+15+45+35
MEDIA GEOMÉTRICA
EJEMPLO:
En el ejemplo anterior: μ G 5 48 54 58 60 60 55.8
48 54 58 60
MEDIANA
El valor que deja por encima el 50% de las
observaciones y por debajo el otro 50%
En una serie ordenada es el número central EJEMPLO:
• Si n es impar, la mediana
0 1 2 3 4 5 6 7 8 9 10
es el dato central
Mediana = valor central = 5
• Si n es par, la mediana
es la media de los 2 datos 0 1 2 3 4 5 6 7 8 9 10
0 1 2 3 4 5 6 7 8 9 10 11
Mediana = 5
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Mediana = 5
media = 3.2 horas
media = 448 mm mediana = 1.0 horas
mediana = 445 mm
CUANTILES
• Percentiles 100
• Deciles 10
• Cuartiles 4
CUARTILES
Separan los datos ordenados en cuatro partes iguales
1×(9+1) 12+13
Posición del cuartil 1 ( Q1 )= =2.5 Q1 = =12.5
4 2
EJEMPLO CUARTILES
i (n+1)
Q i )=
4
i (n + 1 )
Posición del percentil i ( p i )= con i = 1,..,99
100
Ejemplo: Medidas centralización para datos
tabulados
MEDIA ARITMÉTICA
xi ni xi*ni
2 2 4
3 2 6
4 5 20
5 8 40
6 2 12
8 4 32 Media = 114/23 = 4,96
Suma 23 114
MEDIANA
x
ALGUNOS EJEMPLOS…
edad = 22 años
Matrimonio 1:
20 y 24 años
Matrimonio 2:
14 y 30 años
MEDIDAS DE DISPERSIÓN
Coeficiente de variación
[CV]
AMPLITUD de RANGO
EJEMPLO:
Ampl. Rango = 12 - 7 = 5 Ampl. Rango = 12 - 7 = 5
7 8 9 10 11 12 7 8 9 10 11 12
AMPLITUD de RANGO INTERCUARTÍLICO
Q3 - Q1
• No se afecta por los valores extremos
EJEMPLO:
Q3 - Q1 = 17.5 – 12.5 = 5
X -X
2
2 i
s =
n-1
• evitas el valor 0
• unidades al cuadrado
cm cm2
EJEMPLO:
Queremos calcular la varianza en el ejemplo anterior:
48 54 58 60
X
2
-X 1
s2 =
i x = x i = 56
n-1 N
2 64 + 4 + 4 +16 +16
s = = 26
4
DESVIACIÓN ESTÁNDAR
x - x
2
i
s=
n-1
i
x x 2
s
n1
= 4.3095
Para la muestra: se usa n – 1 en el denominador
ix x 2
s
n1
x μ
2
σ i
s
CV= ×100 ...%
x
EJEMPLO:
S = 1 cm S = 2 cm
0,6 % 0,08 %
DIABÉTICOS CONTROLES
Edad en años
moda (amplitud) 15 (12 a 18) 14 (12 a 17)
Glucosa en sangre en
130 (112 a
mg/dl 80 (75 a 92)
131)
mediana (RIQ)
Ejemplo: Medidas de dispersión para datos
X - X
2
tabulados s = 2 i
n -1
Varianza y desviación estándar (previamente calculamos la
1S: 68,27%
2S: 95,45%
3S: 99,73%
DISTRIBUCIÓN NORMAL
(distintas medias, distintas DE)
COEFICIENTE DE ASIMETRÍA
(n 1)(n 2) s3
% del N de
Recuento la columna
talla al alta [300, 310) 1 ,2%
[310, 320) 0 ,0%
[320, 330) 1 ,2%
[330, 340) 1 ,2%
[340, 350) 1 ,2%
[350, 360) 1 ,2%
[360, 370) 2 ,4%
[370, 380) 0 ,0%
[380, 390) 2 ,4%
[390, 400) 5 1,1%
[400, 410) 7 1,6%
[410, 420) 24 5,4%
[420, 430) 44 9,8%
[430, 440) 60 13,4%
[440, 450) 77 17,2%
[450, 460) 66 14,8%
[460, 470) 55 12,3%
[470, 480) 45 10,1%
[480, 490) 22 4,9%
[490, 500) 14 3,1%
[500, 510) 7 1,6%
[510, 520) 3 ,7%
[520, 530) 2 ,4%
[530, 540) 2 ,4%
[540, 550) 1 ,2%
[550, 560) 2 ,4%
[560, 570) 0 ,0%
[570, 580) 0 ,0%
[580, 590) 0 ,0%
[590, 600) 0 ,0%
[600, 610) 0 ,0%
[610, 620) 0 ,0%
[620, 630) 0 ,0%
[630, 640) 2 ,4%
[640, 650) 0 ,0%
[650, 660) 0 ,0%
Total 447 100,0%
HISTOGRAMA
DESCRIPCIÓN VARIABLES
EstadísticosCUANTITATIVAS Estadísticos
Colesterol
Triglicéridos
N Válidos 331
N Válidos 330
Perdidos 27 Perdidos 28
Media 215,529 Media 104,615
Desv . típ. 39,9085 Desv . tí p. 59,5263
Asimetría ,236 Asimetrí a 1,750
Error típ. de asimetría ,134 Error típ. de asimetría ,134
Mínimo 86,0 Mínimo 28,0
Máximo 356,0 Máximo 396,0
Percentiles 25 188,000 Percentiles 25 64,000
50 214,000 50 87,000
75 242,000 75 128,250
DIAGRAMA DE CAJAS (BOX PLOT)
Valores extremos
≥p75 + 1.5 x amplitud RIC
P75 (Q3)
Mediana (Q2)
P25 (Q1)
200
g lucemia (mg/dl)
160 150
120 110
95
80 75
40
0
momento 0 3 meses 6 meses 1 año
DIAGRAMA DE LINEAS
OJO: No siempre
tiene que
representarse la
media
DIAGRAMA DE DISPERSIÓN
RESUMEN GENERAL DE REPRESENTACIONES GRÁFICAS
Diagrama de
Diagrama de barras Diagrama de Box plot Barras de error Diagrama de Diagrama de
Tipo de variable barras agrupado sectores Histrograma Box plot agrupado Barras de error agrupado líneas dispersión
Cualitativa
Ordinal Sí Cuando Sí, si añadimos Sí, si añadimos Sí, No
Sí, pero es No No No
añadimos la preferible el la información la información dependiendo
información de de barras de una var de una var del estadístico
otra var cuanti cuanti en la que que
cualitativa la media sea resumamos en
un buen el gráfico
representante
Nominal Cuando Sí, si añadimos Sí, si añadimos Sí,
Sí Sí No No No No
añadimos la la información la información dependiendo
información de de una var de una var del estadístico
otra var cuanti cuanti en la que que
cualitativa la media sea resumamos en
un buen el gráfico
representante
Cuantitativa
Continua No No No Sí Sí Sí, si añadimos Sí, si la media Sí, si la media Sí, Sí
la información es un buen es un buen dependiendo
de una var representante representante del estadístico
cuali de la variable y añadimos la que
información de resumamos en
una var cuali el gráfico
Discreta Sí, si solo Sí, si solo No Sí Sí Sí, si añadimos Sí, si la media Sí, si la media Sí, Sí, en
puede tomar puede tomar la información es un buen es un buen dependiendo especial si
pocos valores pocos valores de una var representante representante del estadístico la variable
y añadimos la cuali de la variable y añadimos la puede
que
información de tomar
información de resumamos en muchos
una var cuali una var cuali el gráfico valores