Está en la página 1de 117

TEMA 1: INTRODUCCION A LA

ESTADÍSTICA. ESTADÍSTICA
DESCRIPTIVA.
INTRODUCCIÓN
FASES DEL MÉTODO CIENTÍFICO
Identificación del
PROBLEMA INVESTIGACIÓN problema: pregunta
de investigación
Resolución del problema/
BASES DE CONOCIMIENTO
nuevas hipótesis

CONCLUSIONES PROTOCOLO DEL ESTUDIO


Interpretación

DISCUSIÓN HIPÓTESIS

OBJETIVOS
RESULTADOS

DISEÑO DEL ESTUDIO:


TRATAMIENTO
DATOS ESTRATEGIA RECOGIDA DE
ESTADÍSTICO
DATOS
¿QUÉ ES LA (BIO)ESTADÍSTICA?

Es la rama de las matemáticas


aplicadas que permite estudiar
fenómenos biológicos cuyos
resultados son en parte inciertos.

OBJETIVO  cuantificar la incertidumbre del proceso


de
medición en ciencias de la salud
¿POR QUÉ ES NECESARIA?

 Porque es capaz de controlar la


impredecible variabilidad biológica de los
individuos objeto de estudio en las
ciencias de la salud.

 Porque analiza y pone en orden los


datos para responder a la naturaleza cada
vez más cuantitativa de las ciencias de la
salud.
¿POR QUÉ ES NECESARIA?

 Porque su conocimiento permite la


lectura crítica y comprensiva de los
resultados científicos ajenos.

 Porque el trabajo clínico es


esencialmente probabilístico y estadístico,
para dar rigor al diagnóstico, pronóstico y
tratamiento.
¿POR QUÉ ES NECESARIA?

 Porque la perspectiva comunitaria de las


ciencias de la salud exige su uso para
extrapolar las conclusiones desde la
muestra a la globalidad.

 Es necesaria en todas las fases de la


investigación en ciencias de la salud:
diseño, recopilación y análisis de los
resultados.
LA ESTADÍSTICA CONSTA DE DOS
PARTES:

RECOGER
CLASIFICAR - No permite extraer conclusiones
DESCRIPTIVA
REPRESENTAR - Sujeta a errores
RESUMIR
- Permite generalizar de la
INFERENCIAL HACER INFERENCIAS muestra a la población general
- Toma de decisiones
ESTADISTICA DESCRIPTIVA

 Describe y sintetiza los datos obtenidos de


las observaciones y mediciones, resumiéndolos
en unos índices denominados estadísticos

EJEMPLO:
De las 50 personas estudiadas 10 (20%) eran
varones, la media de edad de 30 años (DE 18), …
CONCEPTOS GENERALES
TIPOS DE EXPERIMENTOS

DETERMINISTAS

ALEATORIAS/ESTOCASTICOS
PROCESO ESTADÍSTICO

POBLACIÓN
Inferencia Parámetro
estadística:
• Estimación Muestreo
puntual / por estadístico
intervalo (probabilístico /
no
• Contraste de
probabilístico)
hipótesis

MUESTRA
Estadístico
Probabilidad /
distribuciones de
probabilidad
Estadística
descriptiva
CONCEPTOS GENERALES
• POBLACIÓN

Se considera como población al conjunto de


individuos/sucesos/etc., con al menos una característica
en común sobre el que estamos interesados y del que
deseamos obtener una serie de conclusiones.

En general el tamaño de las poblaciones es demasiado


grande para poder abarcarlo en una investigación.

Se considera que el número de elementos que la


conforman pueden ser finitos o infinitos.
Las poblaciones de las que podamos desear reclutar sujetos
para tener nuestra muestra, se puede dividir en:

 Poblaciones finitas: aquellas que son “medibles”, es


decir se podrían obtener todos los datos relativos a los
sujetos que conforman esa población. Existe, por tanto, un
límite al número de medidas y observaciones que se
pueden realizar.

 Poblaciones infinitas: imposible de medir, no existe un


límite de en cuanto al número de observaciones que cada
uno puede generar.
• MUESTRA

Se puede definir como el Subconjunto de la población al


que tenemos acceso y sobre el que vamos a realizar las
observaciones asociados a nuestro estudio de
investigación.

La muestra debe tener una serie de características:


• Representativa de la población a la que pertenece
• Que esté conformada por elementos que hayan sido
seleccionado de la población de interés.

La ventaja principal es que nos permite obtener


información similar a la que obtendríamos al hacer el
estudio en la población general.

• INDIVIDUO
Cada uno de los elementos de la población o de la muestra.
• Población
Costes
• Muestra Calidad de los datos
Representatividad
de la población
• Individuos

ESTADISTICO/ESTIMADOR  muestra
PARÁMETRO  población
VARIABLES

Propiedades o cualidades que


presentan los individuos de una
población o de una muestra que se
desea estudiar que es observable y
medible
MEDICIÓN

Procedimiento de atribuir valores


cuantitativos o cualitativos a
características de objetos, personas o
hechos.
TIPOS DE VARIABLES (I)

Según su relación con lo estudiado


(objetivo del estudio)
1. Variables relevantes para los objetivos
del estudio (v.dependiente/
v.independiente)
2. Variables universales /
complementarias
1. Variables relevantes para los objetivos
del estudio

– Variables dependientes (resultado, efecto, desenlace)

– Variables independientes (exposición, explicativas)

EJEMPLO:
Se quiere probar la efectividad de un nuevo fármaco para
controlar la hipertensión arterial

•Variable independiente:
Nuevo fármaco (factor de estudio)
•Variable dependiente:
Valores de hipertensión arterial
Identificar las variables dependientes e
independientes
2. Variables universales
/complementarias

(variables que ayudan a describir la población


de estudio: sociodemográficas… o ayudan
a definir subgrupos de interés):

– Edad
– Sexo
– Clase social
– Estado civil,...
TIPO DE VARIABLES (II)

También podemos tener


distintos tipos de variables en
función de las características de
lo que midan

Cuantitativas Cualitativas
CUANTITATIVAS CUALITATIVAS

Ordinales Nominales
Discretos Continuos
Politómico Dicotómico

peso sexo
endodoncias grupo sanguíneo
colesterol gravedad
nº de hijos religión

Escala métrica Cualidad


Ejercicio 1:

Clasificar las variables del siguiente cuadro según la escala de


medida:

Variable Escala de medida


Estado civil Cualitativa (categórica policotómica)
Glucosa plasmática (mg/dl) Cuantitativa continua
Diabetes (presente/ausente) Cualitativa (categórica dicotómica)
Hipertensión (normotenso/hipertenso) Cualitativa (categórica dicotómica)
Presión arterial (mmHg) Cuantitativa continua
Valoración APGAR (normal/anormal) Cualitativa (categórica dicotómica)
Tiempo de reacción (s) Cuantitativa continua
Número de padres fumadores Cuantitativa discreta
Nivel de colesterol sérico (g/dl) Cuantitativa continua
Hábito de beber (bebedor/abstemio) Cualitativa (categórica dicotómica)
Dosis de alcohol (alta/baja/sin alcohol) Cualitativa (categórica policocotómica)
Consumo de alcohol (g) Cuantitativa continua
ORGANIZACIÓN Y CODIFICACIÓN
DE LOS DATOS
DATOS

• Matriz de datos
- filas
- columnas
• Perdidos
ESCALA A ELEGIR

Siempre elegir la más informativa

Consumo de tabaco:

- fumador/no fumador

- nº cigarrillos al día
CODIFICACIÓN:

CUANTITATIVAS CUALITATIVAS

Peso: 45, 58, 67... Sexo: H (1) M (2)


Endodoncias: 1, 8, 3... ABO: A (1), B(2), O (3)
Colesterol: 150, 200.. Religión: católico (1)..
El tipo de variable que se utilice va a influir
directamente en diferentes pasos posteriores:

 Afectará a la selección del instrumento de medida y de

recogida de datos, ya que deberá ajustarse, la herramienta,

al tipo de dato.

 En el análisis, estadístico que deba utilizarse posteriormente

cuando se analicen los datos obtenidos durante la

investigación.
CODIFICACIÓN (ejemplo):

NOMBRE SEXO EDAD PESO ALTURA BEBE FUMA REALIZA EJERCICIO FÍSICO

ECB M 39 55 kg 1.57 m No No Nunca

Pedro Hombre 33 70 kg 170 cm No No Sí, de 3 a 5 h semanales

JPG Varón 50 7000 1.80 m No Sí Menos de 3 h a la semana

CMO Mujer 40 51 1.55 No Sí Menos de 3 h a la semana

NOMBRE SEXO EDAD PESO ALTURA BEBE FUMA REALIZA EJERCICIO FÍSICO

ECB 2 39 55 157 2 2 0

Pedro 1 33 70 170 2 2 2
JPG 1 50 70 180 2 1 1
CMO 2 40 51 155 2 1 1
NOTACIÓN
Parámetros: a nivel poblacional. Se
suelen usar caracteres griegos (σ,
μ,…)

Variables: x, y, edad

Valores de las variables en los


individuos: xi, yi, edadi

Estadísticos: a nivel de muestra


ESTADÍSTICA DESCRIPTIVA
TIPO DE VARIABLE ÍNDICE ESTADÍSTICO

CUALITATIVA D istribución de
PROPORCIÓN
frecuencias

CUANTITATIVA Interesa la MEDIA, MEDIANA,


posición MODA

I nteresa la RANGO

dispersión VARIANZA
DESVIACIÓN TÍPICA
COEFICIENTE DE
VARIACIÓN
SÍNTESIS de DATOS
(variables cualitativas)
Grupo sangu íneo, n º de hermanos y peso (en Kg. ) de 500
alumnos varones de una Universidad

Grupo Nº de
A lumno n.º Peso
sanguíneo hermanos

1 A 0 70,502
2 B 3 67,231
― ― ― ―
― ― ― ―
― ― ― ―
― ― ― ―
500 AB 2 71,676
TIPOS DE FRECUENCIAS

Frecuencia absoluta (recuentos)

Frecuencia relativa (frecuencias absolutas en relación


con el total)

Frecuencia simple (nos fijamos en la ocurrencia de un


solo valor de la variable estudiada)

Frecuencia acumulada (sumatorio hasta un


determinado valor de la variable ~ variables que
guardan un orden)
TIPOS DE FRECUENCIAS

Frecuencia absoluta simple (ni): expresa el


número de veces que ocurre un determinado valor
de una variable.

Frecuencia absoluta acumulada (Ni): para el valor xi


de la variable sería la la suma de las frecuencias absolutas
de los valores inferiores o iguales a él.
i
N i =  n j =n1 +n 2 +...+n i
j=1
TIPOS DE FRECUENCIAS

Frecuencia relativa simple (fi): el cociente entre la


frecuencia absoluta simple (ni) y el número total de
observaciones realizadas (N).
n
n
fi = i
N
con 
i= 1
fi =1

Frecuencia relativa acumulada (Fi): en el punto xi


el cociente entre la frecuencia absoluta acumulada (Ni)
y el número total de observaciones realizadas (N).
i

n
N i j=1
j i n i
Fi =  =   f j
j

N N j=1 N j=1
TIPOS DE FRECUENCIAS

Porcentajes (%): se obtienen


expresando las frecuencias
relativas (simples o acumuladas)
en tanto por 100 en vez de en
tanto por 1.
pi=fi x100 (frecuencia relativa simple porcentual)
Pi=Fi x100 (frecuencia relativa acumulara porcentual)
TIPOS DE FRECUENCIAS
Valores Frecuencias Frecuencias Frecuencias Frecuencias Frecuencias Frecuencias
de la absolutas simples relativas relativas absolutas relativas relativas
variable simples simples acumuladas acumuladas acumuladas
ni
porcentuales porcentuales
Xi ƒi=ni/N Ni Fi=Ni/N
pi=ƒi*100 Pi=Fi*100
X1 n1 ƒ1 p1 Ni = ni Fi = ƒi Pi=pi

X2 n2 ƒ2 p2 N2=N1+n2 F2 = F1 +ƒ2 P2=P1+p2

… … … … … … …

Xi ni ƒi pi Ni=Ni-1+ni Fi = Fi-1 +ƒi Pi=Pi-1+pi


… … … … … … …

Xk nk ƒk pk Nk = N Fk = 1 Pk=100
Hemos realizado una encuesta en nuestra consulta de
Atención Primaria y hemos preguntado a los pacientes…

¿Cuántos donuts se comen a la semana?

Obtenemos que las siguientes respuestas de los


participantes (N=18)

0, 1, 2, 2, 1, 1, 3, 0, 0, 1, 2, 0, 2, 1, 2, 0, 3, 0
Ejemplo número de donuts
Valores Frecuencias Frecuencias Frecuencias Frecuencias Frecuencias Frecuencias
de la absolutas absolutas relativas relativas relativas relativas
variable simples acumuladas simples acumuladas simples acumuladas
porcentuales porcentuales
ni Ni ƒi=ni/N Fi=Ni/N
pi=ƒi*100 Pi=Fi*100
0 6 6 0,33 0,33 33 33

1 5 11 0,28 0,61 28 61

2 5 16 0,28 0,89 28 89

3 2 18 0,11 1 11 100
Total N=18 1 100
Ejercicio: Calcular las frecuencias absolutas y relativas del
sexo y del estado de salud de los siguientes datos:

Id Sexo Estado de salud Simples Acumuladas


0=malo; 1=regular;
2=bueno

1 1 0 nhombre
2 2 1 fhombre
3 1 1 nmujer
4 1 1 fmujer
5 2 2 nmalo Nmalo
6 1 0 fmalo Fmalo
7 1 2 nregular Nregular
8 1 2 fregular Fregular
9 2 1 nbueno Nbueno
10 1 2 fbueno Fbueno
Ejercicio: En un estudio de 200 pacientes se evalúa cuantas
radiografías han precisado un grupo de pacientes.
Completar la siguiente tabla de frecuencias absolutas y
relativas de la siguiente tabla:

Nº Rx Personas f i F i

0 0.2
1 84
2 0.72
3
4 24
5 0.02
TRANSFORMACIONES BÁSICAS DE
LAS FRECUENCIAS

Razón (Odds): es un cociente en el que el numerador no está incluido


en el denominador.

Ejemplo: Tenemos en una muestra con 4500 varones y 5000 mujeres. La


odds de ser varón es
4500/5000=0.90

Proporción: es un cociente en la que el numerador está incluido en el


denominador.

Ejemplo: En la muestra anterior la proporción de varones será:


4500/9000=0.4737
(también se puedes expresar en %: 47.37%)

Tasa: es una proporción en la que se quiere resaltar la frecuencia


relativa de la aparición de un evento en un tiempo dato.

Ejemplo: Tasa de mortalidad durante un año


TABLAS DE FRECUENCIA
Grupo sangu íneo, n º de hermanos y peso (en Kg .) de 500
alumnos varones de una Universidad

Grupo Nº de
A lumno n.º Peso
sanguíneo hermanos

1 A 0 70,502
2 B 3 67,231
― ― ― ―
― ― ― ―
― ― ― ―
― ― ― ―
500 AB 2 71,676
TABLAS DE FRECUENCIA
Distribución del grupo sanguíneo en 500 alumnos varones de
una Universidad

Grupo Frecuencia Frecuencia P orcentaje


sanguíneo absoluta (n i) relativa (f i) %

A 150 0,30 30%


B 75 0,15 15%
AB 25 0,05 5%
O 250 0,50 50%

T otal 500 1,00 100%


250
500
Dis tribución de peso (x) en kg. de una muestra de 500 alumnos
varones de una Universidad

Intervalo de clase ni f i %

x < 45 1 0,002 0,2


45  x < 50 3 0,006 0,6
50  x < 55 12 0,024 2,4
55  x < 60 75 0,150 15,0
60  x < 65 103 0,206 20,6
65  x < 70 155 0,310 31,0
........ ....... ....... ......
x  90 cajón de2 sastre 0,004 0,4

Total 500 1,000 100,0


EJEMPLOS

“Se realizó una encuesta a 50 pacientes intervenidos


quirúrgicamente (misma intervención y misma
técnica), preguntando a las 24 horas el grado de dolor,
clasificándolo como dolor intenso, moderado o leve
(según definiciones aceptadas), obteniendo que un
25% era leve, un 50% moderado y un 25% intenso”

“Se estudiaron 100 pacientes operados de cadera, de los


cuales 25 eran varones representando un 25%, siendo la
razón hombre/mujer 1/3 (25/75)”
DIABÉTICOS CONTROLES

Número de sujetos (N)


60 84

Sexo
Masculino n (%) 26 (43.3%) 40 (47.6%)
Femenino n (%) 34 (56.7%) 44 (52.4%)
Peso en kg
media (DE) 56.3 (8.2) 52.7 (7.8)

Edad en años
moda (amplitud) 15 (12 a 18) 14 (12 a 17)

Glucosa en sangre en
130 (112 a
mg/dl 80 (75 a 92)
131)
mediana (RIQ)
REPRESENTACIONES GRÁFICAS
(variables cualitativas)
GRÁFICO DE SECTORES

5,2
19,6 7,6

Médico (n=272)

Residente (n=399)

Enfermería (n=1869)
35,7
31,9 Auxiliar (n=1674)

Celador (n=1027)

Figura. Gráfico de sectores. Distribución de


frecuencias relativas de la categoría profesional
(N=5241)
DIAGRAMA DE BARRAS SIMPLE

40,0
35,7
35,0
31,9

30,0
Frecuencia relativa

25,0

19,6
20,0

15,0

10,0 7,6
5,2
5,0

0,0
Médico Residente Enfermería Auxiliar Celador
(n=272) (n=399) (n=1869) (n=1674) (n=1027)

Figura. Gráfico de barras. Distribución de


frecuencias relativas de la categoría profesional
(N=5241)
DIAGRAMA DE BARRAS SIMPLE

2000 1869
1800 1674
1600

1400
Frecuencia absoluta

1200
1027
1000

800

600
399
400 272
200

0
Médico Residente Enfermería Auxiliar Celador

Figura. Gráfico de barras. Distribución de


frecuencias relativas de la categoría profesional
(N=5241)
DIAGRAMA DE BARRAS AGRUPADO

100
88,5
90
82,1
80 73,6 72,3
70
Frecuencia relativa

60

50

40
26,4 27,7
30
17,9
20
11,5
10

0
Celadores Médico-residente Enfermería Auxiliares
(n=1027) (n=670) (n=1869) (n=1674)

Incorrecto/No HM Correcto

Figura. Distribución de frecuencias relativas de


higiene de manos (HM) en función del la
categoría profesional.
DIAGRAMA DE BARRAS AGRUPADO/APILADO

100
11,5
90 17,9
26,4 27,7
80
70
60
50
88,5
40 82,1
73,6 72,3
30
20
10
0
Celadores Médico-residente Enfermería Auxiliares
(n=1027) (n=670) (n=1869) (n=1674)

Incorrecto/No HM Correcto

Figura. Distribución de frecuencias relativas de


higiene de manos (HM) en función del la
categoría profesional.
DIAGRAMA DE BARRAS AGRUPADO
DIAGRAMA DE BARRAS AGRUPADO
SÍNTESIS de DATOS
(variables cuantitativas)
MEDIDAS DE POSICIÓN

A B
Medidas de
Cuantiles
tendencia central

cuartiles,
Media Mediana Moda tertiles,
percentiles, …
MODA

Es el valor que ocurre más a menudo

•No se afecta por valores extremos


•Puede no haber moda o haber varias modas
•Se usa para datos numéricos y categóricos
•Sólo tiene sentido cuando hay muchos datos
EJEMPLO:

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6

No hay moda
Moda = 9
MEDIA ARITMÉTICA (I)

Es el centro de gravedad de la distribución


de valores

48 54 58 60

Medida de tendencia central más usada


MEDIA ARITMÉTICA (II)

1 N x1  x 2  ...  x N
x   xi 
N i 1 N
Mismas unidades de la variable
Se afecta por los valores extremos:
EJEMPLO:

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Media = 5.0

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Media = 6.8
MEDIA PONDERADA
• Se emplea para cuando se quiere dar más peso a unos
valores que a otros.

xP =
 (x ×p )
i i

p i

EJEMPLO:
Supongamos que en una asignatura se ha obtenido un 5 en
prácticas, 6 en participación en clase, examen teórico 8 y examen
práctico 6. La nota final es 5% las prácticas, 15% la participación
en clase, 45% el examen teórico y 35% el práctico.

5×5+6×15+8×45+6×35
xP = =6.85
5+15+45+35
MEDIA GEOMÉTRICA

• Relacionada con la transformación logarítmica


• Eliminar la asimetría positiva
• Mejorar la normalidad
N
μ G  N  x i  N x1  ...  x N
i 1

EJEMPLO:
En el ejemplo anterior: μ G  5 48  54  58  60  60  55.8

48 54 58 60
MEDIANA
El valor que deja por encima el 50% de las
observaciones y por debajo el otro 50%
En una serie ordenada es el número central EJEMPLO:
• Si n es impar, la mediana
0 1 2 3 4 5 6 7 8 9 10
es el dato central
Mediana = valor central = 5

• Si n es par, la mediana
es la media de los 2 datos 0 1 2 3 4 5 6 7 8 9 10

centrales Mediana = media del valor (n/2) y (1 + n/2) =


=(3+5)/2=4

No se afecta por valores extremos


EJEMPLO:

0 1 2 3 4 5 6 7 8 9 10 11
Mediana = 5

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Mediana = 5
media = 3.2 horas
media = 448 mm mediana = 1.0 horas
mediana = 445 mm
CUANTILES

Indican cuál es la posición relativa de


una observación con respecto al resto de
la muestra

• Percentiles 100
• Deciles 10
• Cuartiles 4
CUARTILES
Separan los datos ordenados en cuatro partes iguales

25% 25% 25% 25%


Q1 Q2 Q3
Primero, calculamos las posiciones que ocuparán los cuartiles
i  (n + 1 )
Posición del cuartil i ( Q i )= con i=1,2,3
4
EJEMPLO:
Datos en orden creciente: 11 12 13 16 16 17 18 21 22
Posiciones: 1 2 3 4 5 6 7 8 9

1×(9+1) 12+13
Posición del cuartil 1 ( Q1 )= =2.5  Q1 = =12.5
4 2
EJEMPLO CUARTILES

i  (n+1)
Q i )=
4

Calcular el Q1 = P25 d= número decimal

1º Posición del Q1 = (1 (20+1))/4 = 5,25

2º Calcular el valor: (en este caso la posición es decimal y deberemos


buscar el valor exacto con la fórmula):

Valor: Q1 = 28 + 0,25*(29-28) = 28,25


EJEMPLO CUARTILES

d= número decimal i  (n+1)


Q i )=
4

Calcular el Q2= mediana = P50

1º Posición del Q2 = (2 (20+1))/4 = 10,5

2º Calcular el valor: (en este caso la posición es decimal y deberemos


buscar el valor exacto con la fórmula):

Valor: Q2 = 34 + 0,50*(37-34) = 35,5 (mismo valor que hacer la


media entre (37+34)/2 = 35,5
EJEMPLO CUARTILES

d= número decimal i  (n+1)


Q i )=
4
Calcular el Q3= P75

1º Posición del Q3 = (3 (20+1))/4 = 15,75

2º Calcular el valor: (en este caso la posición es decimal y deberemos


buscar el valor exacto con la fórmula):

Valor: Q3 = 52 + 0,75*(16-15) = 52,75.


PERCENTILES

Separan los datos ordenados en 100


partes iguales

i  (n + 1 )
Posición del percentil i ( p i )= con i = 1,..,99
100
Ejemplo: Medidas centralización para datos
tabulados

MEDIA ARITMÉTICA

xi ni xi*ni
2 2 4
3 2 6
4 5 20
5 8 40
6 2 12
8 4 32 Media = 114/23 = 4,96
Suma 23 114

MODA: el valor más repetido es el 5


Ejemplo: Medidas centralización para datos
tabulados

MEDIANA

• Primero calcular la posición: Q2


xi ni Ni Fi
2 2 = 2 (23+1) / 4 = 12
2 0,087
3 2 4 0,174 • Después revisamos la
4 5 9 0,391 columnas de las Frecuencias
5 8 17 0,739 acumuladas (Ni)y aquella que
6 2 19 0,826 supere el valor 12, en primer
8 4 23 1 lugar, es la Mediana.
Suma 23 • En nuestro ejemplo es 5.
Ejemplo: Medidas centralización para datos
tabulados

Cuartiles (cuartil 1 y cuartil 3)

• Primero calcular la posición: Q1


xi ni Ni Fi
2 2 = 1 (23+1) / 4 = 6
2 0,087
3 2 4 0,174 • Después revisamos la
4 5 9 0,391 columnas de las Frecuencias
5 8 17 0,739 acumuladas (Ni)y aquella que
6 2 19 0,826 supere el valor 6, en primer
8 4 23 1 lugar, es la Q1.
Suma 23 • En nuestro ejemplo es 4.
Ejemplo: Medidas centralización para datos
tabulados

Cuartiles (cuartil 1 y cuartil 3)

• Primero calcular la posición: Q3


xi ni Ni Fi
2 2 = 3 (23+1) / 4 = 18
2 0,087
3 2 4 0,174 • Después revisamos la
4 5 9 0,391 columnas de las Frecuencias
5 8 17 0,739 acumuladas (Ni)y aquella que
6 2 19 0,826 supere el valor 18, en primer
8 4 23 1 lugar, es la Q3.
Suma 23 • En nuestro ejemplo es 6.
MEDIDAS DE DISPERSIÓN
Indican el grado de
variabilidad de los datos
de la muestra

x
ALGUNOS EJEMPLOS…

edad = 22 años

Matrimonio 1:
20 y 24 años

Matrimonio 2:
14 y 30 años
MEDIDAS DE DISPERSIÓN

(amplitud) Rango (amplitud) Rango intercuartílico


[min;max] [RIC]

Variancia Desviación estándar


[VAR] [DE]

Coeficiente de variación
[CV]
AMPLITUD de RANGO

Diferencia entre el valor mayor y el


menor

• No tiene en cuenta cómo se distribuyen los


datos
• Ventaja: mismas unidades y fácil de calcular
• Desventaja: toma sólo 2 valores y  con n

EJEMPLO:
Ampl. Rango = 12 - 7 = 5 Ampl. Rango = 12 - 7 = 5

7 8 9 10 11 12 7 8 9 10 11 12
AMPLITUD de RANGO INTERCUARTÍLICO

Diferencia entre el tercer y el primer


cuartil: amplitud del 50% central

Q3 - Q1
• No se afecta por los valores extremos

EJEMPLO:

Datos en orden creciente: 11 12 13 16 16 17 17 18 21

Q3 - Q1 = 17.5 – 12.5 = 5

“en un rango de 5 unidades se encuentra el 50% de la


muestra”
VARIANCIA

Media de los cuadrados de las desviaciones


a la media

  X -X 
2
2 i
s =
n-1

• evitas el valor 0
• unidades al cuadrado
cm  cm2
EJEMPLO:
Queremos calcular la varianza en el ejemplo anterior:

48 54 58 60

 X 
2
-X 1
s2 =
i x =  x i = 56
n-1 N

(x -x)=(48-56)+(54-56)+(58-56)+(60-56)+(60-56) 82244 0


i
Suma de cuadrados !!

2 64 + 4 + 4 +16 +16
s = = 26
4
DESVIACIÓN ESTÁNDAR

La raíz cuadrada positiva de la varianza

x - x
2
i
s=
n-1

El más utilizado para evaluar la


dispersión de los valores en torno a la
media
EJEMPLO:
Queremos calcular la DE de la siguiente serie de datos:
Serie Xi: 10 12 14 15 17 18 18 24


 i
x  x 2

s
n1

n=8 Media =16

(1016)2 (1216)2 (1416)2 (1516)2 (1716)2  2(1816)2 (2416)2


s 
81

= 4.3095
Para la muestra: se usa n – 1 en el denominador


 ix  x 2

s
n1

Para la población: se usa N en el denominador

 x  μ 
2

σ i

El valor de la desviación estándar es


mayor para los datos si son datos de una
muestra
COEFICIENTE DE VARIACIÓN

• Medida de variación relativa

• Siempre como porcentaje

• Muestra la variación relacionada con la media

• Se utiliza para comparar 2 o más grupos

s
CV= ×100 ...%
 x
EJEMPLO:

Tenemos 2 métodos de medida de distancias


¿cuál presenta mayor variabilidad?

Estatura de un individuo Altura de un edificio


x= (1,70 m) x= (25 m)

S = 1 cm S = 2 cm

CV= 1/170 x 100 CV= 2/2500

0,6 % 0,08 %
DIABÉTICOS CONTROLES

Número de sujetos (N)


60 84

Sexo 26 M (43,3%) 40 M (47,6%)


n (%)
34 F (56,7%) 44 F (52,4%)
Peso en kg
media (DE) 56,3 (8,2) 52,7 (7,8)

Edad en años
moda (amplitud) 15 (12 a 18) 14 (12 a 17)

Glucosa en sangre en
130 (112 a
mg/dl 80 (75 a 92)
131)
mediana (RIQ)
Ejemplo: Medidas de dispersión para datos
 X - X 
2
tabulados s = 2 i

n -1
Varianza y desviación estándar (previamente calculamos la

media y salía 4,96)

xi ni xi*ni (xi - )2 ni*(xi - )2


2 2 4 8,762 17,5232
3 2 6 3,842 7,6832
4 5 20 0,922 4,608
5 8 40 0,002 0,0128
6 2 12 1,082 2,1632
8 4 32 9,242 36,9664
Suma 23 114 68,9568

Varianza = 68,9568 / 22 = 3,13


Desviación estándar = 1,77
MEDIDAS DE FORMA: ASIMETRÍA
DISTRIBUCIÓN NORMAL

1S: 68,27%

2S: 95,45%

3S: 99,73%
DISTRIBUCIÓN NORMAL
(distintas medias, distintas DE)
COEFICIENTE DE ASIMETRÍA

coeficiente asimetría (r) 


n  i
( x  x ) 3

(n  1)(n  2) s3

Describe la simetría de los datos con respecto a la


media mediana media moda

Γ<0 Γ=0 Γ>0


REPRESENTACIONES GRÁFICAS
(variables cuantitativas y otros)
HISTOGRAMA

% del N de
Recuento la columna
talla al alta [300, 310) 1 ,2%
[310, 320) 0 ,0%
[320, 330) 1 ,2%
[330, 340) 1 ,2%
[340, 350) 1 ,2%
[350, 360) 1 ,2%
[360, 370) 2 ,4%
[370, 380) 0 ,0%
[380, 390) 2 ,4%
[390, 400) 5 1,1%
[400, 410) 7 1,6%
[410, 420) 24 5,4%
[420, 430) 44 9,8%
[430, 440) 60 13,4%
[440, 450) 77 17,2%
[450, 460) 66 14,8%
[460, 470) 55 12,3%
[470, 480) 45 10,1%
[480, 490) 22 4,9%
[490, 500) 14 3,1%
[500, 510) 7 1,6%
[510, 520) 3 ,7%
[520, 530) 2 ,4%
[530, 540) 2 ,4%
[540, 550) 1 ,2%
[550, 560) 2 ,4%
[560, 570) 0 ,0%
[570, 580) 0 ,0%
[580, 590) 0 ,0%
[590, 600) 0 ,0%
[600, 610) 0 ,0%
[610, 620) 0 ,0%
[620, 630) 0 ,0%
[630, 640) 2 ,4%
[640, 650) 0 ,0%
[650, 660) 0 ,0%
Total 447 100,0%
HISTOGRAMA
DESCRIPCIÓN VARIABLES
EstadísticosCUANTITATIVAS Estadísticos
Colesterol
Triglicéridos
N Válidos 331
N Válidos 330
Perdidos 27 Perdidos 28
Media 215,529 Media 104,615
Desv . típ. 39,9085 Desv . tí p. 59,5263
Asimetría ,236 Asimetrí a 1,750
Error típ. de asimetría ,134 Error típ. de asimetría ,134
Mínimo 86,0 Mínimo 28,0
Máximo 356,0 Máximo 396,0
Percentiles 25 188,000 Percentiles 25 64,000
50 214,000 50 87,000
75 242,000 75 128,250
DIAGRAMA DE CAJAS (BOX PLOT)

≥p75 + 3 x amplitud RIC

Valores extremos
≥p75 + 1.5 x amplitud RIC

Última observación dentro de los límites

P75 (Q3)

Mediana (Q2)
P25 (Q1)

Primera observación dentro de los límites

≤p25 - 1.5 x amplitud RIC


Valores extremos

≤p25 – 3 x amplitud RIC


Ejemplo Box Plot. Dibujar el box plot de los días de estancia
en función de la presencia de complicaciones
DIAGRAMA DE CAJAS AGRUPADO (BOX PLOT AGRUPADO)
DIAGRAMA DE BARRAS DE ERROR
DIAGRAMA DE BARRAS DE ERROR AGRUPADO

200
g lucemia (mg/dl)

160 150

120 110
95

80 75

40

0
momento 0 3 meses 6 meses 1 año
DIAGRAMA DE LINEAS

OJO: No siempre
tiene que
representarse la
media
DIAGRAMA DE DISPERSIÓN
RESUMEN GENERAL DE REPRESENTACIONES GRÁFICAS

Diagrama de
Diagrama de barras Diagrama de Box plot Barras de error Diagrama de Diagrama de
Tipo de variable barras agrupado sectores Histrograma Box plot agrupado Barras de error agrupado líneas dispersión
Cualitativa
Ordinal Sí Cuando Sí, si añadimos Sí, si añadimos Sí, No
Sí, pero es No No No
añadimos la preferible el la información la información dependiendo
información de de barras de una var de una var del estadístico
otra var cuanti cuanti en la que que
cualitativa la media sea resumamos en
un buen el gráfico
representante
Nominal Cuando Sí, si añadimos Sí, si añadimos Sí,
Sí Sí No No No No
añadimos la la información la información dependiendo
información de de una var de una var del estadístico
otra var cuanti cuanti en la que que
cualitativa la media sea resumamos en
un buen el gráfico
representante
Cuantitativa
Continua No No No Sí Sí Sí, si añadimos Sí, si la media Sí, si la media Sí, Sí
la información es un buen es un buen dependiendo
de una var representante representante del estadístico
cuali de la variable y añadimos la que
información de resumamos en
una var cuali el gráfico

Discreta Sí, si solo Sí, si solo No Sí Sí Sí, si añadimos Sí, si la media Sí, si la media Sí, Sí, en
puede tomar puede tomar la información es un buen es un buen dependiendo especial si
pocos valores pocos valores de una var representante representante del estadístico la variable
y añadimos la cuali de la variable y añadimos la puede
que
información de tomar
información de resumamos en muchos
una var cuali una var cuali el gráfico valores

También podría gustarte