Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadistica Descriptiva
Estadistica Descriptiva
Estadstica Descriptiva
M. Gonzlez
Conceptos Bsicos
Estadstica Descriptiva
Bioestadstica
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
M. Gonzlez
Conceptos Bsicos
Estadstica Descriptiva
Bioestadstica
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
M. Gonzlez
Conceptos Bsicos
Estadstica Descriptiva
Coneptos Bsicos
ESTADSTICA
Ciencia que estudia el conjunto de mtodos y procedimientos
utilizados para:
1
M. Gonzlez
Conceptos Bsicos
Estadstica Descriptiva
Coneptos Bsicos
POBLACIN UNIVERSO. Conjunto de elementos o
individuos de la misma naturaleza que presentan uno o varios
caracteres comunes, susceptibles de medida o clasificacin.
Individuos, Unidades experimentales estadsticas.
M. Gonzlez
Conceptos Bsicos
Estadstica Descriptiva
Coneptos Bsicos
ESCALAS
Modos de clasificar los datos dependiendo de su naturaleza y de las
relaciones que pueden establecerse entre las modalidades.
ESCALA NOMINAL
C. Cualitativo.
Relaciones de igualdad-desigualdad.
ESCALA ORDINAL
C. Cualitativo - V. Cuantitativa.
Relaciones de orden.
ESCALA NUMRICA
V. Cuantitativa.
Relaciones de numricas (de proporcionalidad).
M. Gonzlez
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
Estadstica Descriptiva
DATOS: Valores de triglicridos sricos totales (mg/100ml) medidos
en 104 ratas de laboratorio normales:
59.7
70.7
73.3
69.2
75.3
60.5
74.2
62.1
80.2
63.0
79.8
57.9
69.6
69.5
72.9
91.5
63.0
72.1
56.6
83.0
72.2
59.0
68.9
74.8
72.5
70.6
78.6
69.1
70.6
69.0
83.5
67.1
71.7
69.9
69.2
52.7
47.7
74.8
68.9
78.5
69.8
75.2
63.5
61.4
65.4
66.5
80.4
70.4
77.3
78.2
68.7
71.4
71.8
75.6
76.1
78.6
76.6
71.0
72.9
61.7
70.2
59.9
59.6
59.8
74.3
M. Gonzlez
68.6
82.1
71.1
73.7
60.6
61.1
73.1
80.6
68.8
78.4
61.5
61.9
70.8
63.8
61.1
64.3
66.5
50.2
72.4
61.3
70.7
66.9
74.7
66.0
67.8
63.4
67.5
79.7
77.8
69.5
60.9
55.6
67.0
81.4
86.3
57.1
57.6
65.2
60.6
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
Tablas de Frecuencias
ESTRUCTURA BSICA
Carcter
Variable
Modalidades
valores posibles
de la variable
TOTAL
Frecuencia
Absoluta
..
.
Frecuencia
Relativa
..
.
Porcentaje
fi
..
.
P
n = fi
hi
..
.
..
.
%
..
.
100
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
Tablas de Frecuencias
Ejemplo 1: Carcter Cualitativo
Al examinar 158 casos de parlisis de Bell se anotaron las diferentes terapias
seguidas por estos pacientes, resultando el conjunto de datos:
DQ, C, NT, ET, C, DQ, OT, NT, ET, C, C, DQ, OT,etc.
(C: corticosteroides; DQ: descompresin quirrgica; ET: electroterapia; NT:
ningn tratamiento; OT: otras modalidades).
Tratamiento
C
DQ
ET
NT
OT
TOTAL
fi
73
36
19
21
9
158
M. Gonzlez
hi
0.462
0.228
0.120
0.133
0.057
1
%
46.2
22.8
12.0
13.3
5.7
100
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
Tablas de Frecuencias
Ejemplo 2: Variable Cuantitativa Discreta
Se ha realizado un estudio sobre el nmero de piezas dentales con
caries en una muestra de 135 nios de un determinado grupo de edad
y condiciones de higiene y alimentacin particulares. Los datos, ya
ordenados se recogen en la siguiente tabla:
No caries
0
1
2
3
4 ms
TOTAL
fi
46
39
27
15
8
135
M. Gonzlez
hi
0.341
0.289
0.200
0.111
0.059
1
%
34.1
28.9
20.0
11.1
5.9
100
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
Tablas de Frecuencias
Ejemplo 3: Variable Cuantitativa Discreta
Se han tomado los valores de la frecuencia cardiaca (pul./m) de un grupo de
56 pacientes, un minuto despus de ser sometidos a un determinado ejercicio
fsico. Los datos obtenidos, ya ordenados, se recogen en la siguiente tabla:
Frec. Cardiaca
96100
101105
106110
111115
116120
121125
TOTAL
Marca de clase: xi = (LI + LS )/2,
xi
98
103
108
113
118
123
fi
2
7
7
18
16
6
56
hi
0.036
0.125
0.125
0.321
0.286
0.107
1
%
3.6
12.5
12.5
32.1
28.6
10.7
100
M. Gonzlez
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
Tablas de Frecuencias
Ejemplo 4: Variable Cuantitativa Continua
Dentro de un estudio sobre la pacreatitis se han tomado los valores de triglicridos
sricos totales (TST) medidos en mg/100ml en 104 ratas de laboratorio normales
(trasparencia inicial). Los datos ordenados aparecen en la siguiente tabla:
TST
(45,50]
(50,55]
(55,60]
(60,65]
(65,70]
(70,75]
(75,80]
(80,85]
(85,90]
(90,95]
TOTAL
xi
47.5
52.5
57.5
62.5
67.5
72.5
77.5
82.5
87.5
92.5
M. Gonzlez
fi
1
2
10
18
24
26
14
7
1
1
104
hi
0.01
0.02
0.10
0.17
0.23
0.25
0.13
0.07
0.01
0.01
1
%
1
2
10
17
23
25
13
7
1
1
100
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
Tablas de Frecuencias
Nmero de clases o intervalos
Cuntas clases debemos formar para tabular un conjunto de datos?
Pocas clases prdidad de mucha informacin.
Muchas clases trabajar con muchos datos.
Frmula de Sturges
El nmero de clases o intervalos que debemos formar si queremos
tabular un conjunto de n datos, debe estar en torno a
1 + 3.322 log10 n
M. Gonzlez
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
Tablas de Frecuencias
Construccin de las clases o intervalos
Antes de construir la tabla de frecuencias hay que agrupar los datos de
estas variables en intervalos. La forma de hacerlo es la siguiente:
Determinar valores mximo (Vmax ) y mnimo (Vmin ) de los datos.
Determinar el nmero (k) de intervalos a construir (por ejemplo
utilizando la frmula de Sturges), que deben ser todos de la
misma amplitud (diferencia entre el lmite superior e inferior).
Vmax Vmin
Determinar la amplitud de los intervalos: c
k
A veces conviene redondear esta amplitud pero NUNCA
DEBEMOS PERDER NINGN DATO EN EL PROCESO.
M. Gonzlez
Tablas de Frecuencias
Grficos
Medidas de Sntesis
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Ejemplo 5
En la siguiente tabla se muestran los niveles de colinesterasa de 33
agricultores expuestos a insecticidas agrcolas:
10.6
11.5
14.9
12.2
10.3
11.3
Vmin = 7.8
11.8
8.6
11.1
12.5
9.9
12.5
Vmax = 16.5
c
10.8
12.4
12.3
,
12.7
8.5
10.2
11.1
11.9
12.5
16.5
9.1
9.7
11.4
10.1
12.3
9.2
11.6
12.0
15.0
7.8
12.4
16.5 7.8
= 1.45( 1.5)
6
Sin redondear:
[7.8, 9.25], (9.25, 10.7], (10.7, 12.15], (12.15, 13.6], (13.6, 15.05], (15.05, 16.5]
Redondeando:
[7.5, 9], (9, 10.5], (10.5, 12], (12, 13.5], (13.5, 15], (15, 16.5]
M. Gonzlez
Tablas de Frecuencias
Grficos
Medidas de Sntesis
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Frecuencias Acumuladas
P
P
Frecuencia relativa acumulada (H ): H =
Variables cuantitativas (discretas y continuas)
Frecuencia absoluta acumulada (Fi ): Fi =
i
TST
(45,50]
(50,55]
(55,60]
(60,65]
(65,70]
(70,75]
(75,80]
(80,85]
(85,90]
(90,95]
TOTAL
xi
47.5
52.5
57.5
62.5
67.5
72.5
77.5
82.5
87.5
92.5
fi
1
2
10
18
24
26
14
7
1
1
104
M. Gonzlez
hi
0.01
0.02
0.10
0.17
0.23
0.25
0.13
0.07
0.01
0.01
1
i
j=1 fj
i
j=1
%
1
2
10
17
23
25
13
7
1
1
100
hj = Fi /n,
Fi
1
3
13
31
55
81
95
102
103
104
Hi
0.01
0.03
0.12
0.30
0.53
0.78
0.91
0.98
0.99
1.00
n=
Pf
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
40
30
nmero de casos
%
46.2
22.8
12.0
13.3
5.7
100
20
hi
0.462
0.228
0.120
0.133
0.057
1
10
fi
73
36
19
21
9
158
Tratamiento
C
DQ
ET
NT
OT
TOTAL
50
60
70
Ejemplo 1
M. Gonzlez
DQ
ET
NT
OT
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
Ejemplo 1
Tratamiento
C
DQ
ET
NT
OT
TOTAL
fi
73
36
19
21
9
158
hi
0.462
0.228
0.120
0.133
0.057
1
%
46.2
22.8
12.0
13.3
5.7
100
M. Gonzlez
OT
DQ
NT
ET
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
M. Gonzlez
20
15
%
1
2
10
17
23
25
13
7
1
1
100
10
hi
0.01
0.02
0.10
0.17
0.23
0.25
0.13
0.07
0.01
0.01
1
nmero de casos
fi
1
2
10
18
24
26
14
7
1
1
104
xi
47.5
52.5
57.5
62.5
67.5
72.5
77.5
82.5
87.5
92.5
TST
(45,50]
(50,55]
(55,60]
(60,65]
(65,70]
(70,75]
(75,80]
(80,85]
(85,90]
(90,95]
TOTAL
25
50
60
70
80
90
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
POLGONO DE FRECUENCIAS
Consiste en el polgono resultante de unir mediante segmentos los
puntos del plano cuya primeras coordenadas son las marcas de clase y
las segunda las frecuencias (absolutas relativas, con o sin acumular)
de cada una de las clases que se pretenden representar
M. Gonzlez
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
M. Gonzlez
20
15
%
1
2
10
17
23
25
13
7
1
1
100
10
hi
0.01
0.02
0.10
0.17
0.23
0.25
0.13
0.07
0.01
0.01
1
nmero de casos
fi
1
2
10
18
24
26
14
7
1
1
104
xi
47.5
52.5
57.5
62.5
67.5
72.5
77.5
82.5
87.5
92.5
TST
(45,50]
(50,55]
(55,60]
(60,65]
(65,70]
(70,75]
(75,80]
(80,85]
(85,90]
(90,95]
TOTAL
25
50
60
70
80
90
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
Medidas de Sntesis
M. Gonzlez
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
Medidas de Centralizacin
Media Aritmtica (Muestral): x
La media (x) es el valor central en el sentido aritmtico. Viene a ser el centro de
gravedad de los datos.
x1 + + xn
x =
n
Si los datos estn agrupados en una tabla de frecuencias
x =
x1 f 1 + + xk f k
= x1 h1 + + xk hk
n
Propiedades
Utiliza toda la informacin contenida en el dato.
No es robusta: es influida por la existencia de valores extremos (outliers).
6, 7, 8, 9, 10 x = 8
6, 7, 8, 9, 30 x = 12
M. Gonzlez
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
Medidas de Centralizacin
Media Ponderada: xp
Datos: x1 , . . . , xn . Pesos: 1 , . . . , n
Pn
xi i
xp = Pi=1
n
i=1 i
Ejemplo. Datos: 5, 8, 9. Pesos: 1, 2, 2
x = 7.3
xp = 7.8
M. Gonzlez
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
Medidas de Centralizacin
Media Geomtrica: xg
Datos: x1 , . . . , xn
xg = (x1 ...xn )1/n
Se utiliza con variables que evolucionan exponencialmente
respecto al tiempo: nmero de microorganismos de un cultivo.
Media Armnica: xh
Datos: x1 , . . . , xn
n
xh = Pn
1
i=1 xi
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
Medidas de Centralizacin
Mediana: x
Es un valor de la variable (no necesariamente un dato observado) tal
que la mitad de los datos son menores que ella y la otra mitad
mayores. Ocupa la posicin central en el sentido del orden.
Clculo: ordenar los datos de menor a mayor.
Si n impar, x dato que ocupa la posicin
n+1
2
n
2
Propiedades:
Utiliza de cada dato slo la posicin que ocupa en la muestra ordenada.
Es robusta.
6, 7, 8, 9, 10 x = 8, x = 8
6, 7, 8, 9, 30 x = 12 x = 8
M. Gonzlez
Tablas de Frecuencias
Grficos
Medidas de Sntesis
Conceptos Bsicos
Estadstica Descriptiva
Medidas de Centralizacin
Mediana: x
Si los datos vienen dados por una tabla de frecuencias, entonces
calcularemos la mediana a travs de la frmula:
x = LI +
n
2
Fm1
cm
fm
M. Gonzlez
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
Medidas de Centralizacin
Moda: x
Valor del conjunto de datos que aparece con mayor frecuencia.
Si los datos estn en una tabla de frecuencias la moda ser la
marca de clase del intervalo o clase de mayor frecuencia.
M. Gonzlez
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
Medidas de Posicin
Cuartiles
Primer cuartil (Q1 ) es el valor que deja por debajo de l la cuarta parte
de los datos ordenados. Para calcularlo se ordenan los datos de menor a
mayor y se toma n+1
2 redondeado por defecto. A este nmero lo
llamamos q.
Si q es impar, Q1 es el dato que ocupa la posicin q+1
2 .
Si q es par, Q1 es el punto medio de los datos que ocupan las
posiciones q2 y q2 + 1.
Segundo cuartil (Q2 ) Es el valor que deja por debajo de l dos cuartas
partes de los datos. Por tanto se trata de la mediana, Q2 = x.
Tercer cuartil (Q3 ) Es el valor que deja por debajo de l las tres cuartas
partes de los datos.
M. Gonzlez
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
Medidas de Posicin
Deciles
El decil i-simo (Di ) deja i/10 de los datos por debajo de l,
i = 1, . . . , 9.
Percentiles
El percentil p (Pp ) deja el 100p% de los datos por debajo de l,
p = 1, . . . , 99.
M. Gonzlez
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
Medidas de Dispersin
Rango (R)
Diferencia entre el dato mximo y el dato mnimo.
i=1
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
Medidas de Dispersin
Rango Intercuartlico (RI )
Distancia entre Q1 y Q3 , RI = Q3 Q1 . En esta distancia se
concentran el 50% de los datos que ocupan posiciones centrales.
M. Gonzlez
s
100
x
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
Medidas de Forma
Coeficiente de Asimetra: g1
El coeficiente de asimetra (g1 ) se define como:
Pn
1
x)3
i=1 (xi
n
g1 =
s3
0.14
0.10
0.08
Density
0.04
0.05
0.06
0.10
Density
0.03
0.02
50
60
70
80
90
0.00
0.00
0.02
0.01
0.00
Density
0.04
0.12
0.15
0.05
g1 = 0
10
15
g1 > 0
M. Gonzlez
10
g1 < 0
15
Conceptos Bsicos
Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis
Medidas de Forma
M. Gonzlez
Tablas de Frecuencias
Grficos
Medidas de Sntesis
Conceptos Bsicos
Estadstica Descriptiva
Medidas de Sntesis
Diagrama de Caja o Box-plot
Se trata de una representacin grfica ligada a los cuartiles.
16
12
Q1
Q3
~
x
10
14
h3
h1