Está en la página 1de 37

Conceptos Bsicos

Estadstica Descriptiva

Bioestadstica: Estadstica Descriptiva


M. Gonzlez
Departamento de Matemticas. Universidad de Extremadura

M. Gonzlez

Bioestadstica: Estadstica Descriptiva

Conceptos Bsicos
Estadstica Descriptiva

Bioestadstica

Conceptos Bsicos

Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis

M. Gonzlez

Bioestadstica: Estadstica Descriptiva

Conceptos Bsicos
Estadstica Descriptiva

Bioestadstica

Conceptos Bsicos

Estadstica Descriptiva
Tablas de Frecuencias
Grficos
Medidas de Sntesis

M. Gonzlez

Bioestadstica: Estadstica Descriptiva

Conceptos Bsicos
Estadstica Descriptiva

Coneptos Bsicos

ESTADSTICA
Ciencia que estudia el conjunto de mtodos y procedimientos
utilizados para:
1

Seleccionar y recoger un conjunto de datos.

Ordenar, resumir y analizar dicho conjunto de datos.

Obtener inferencias cientficas a partir de dichos datos, es decir


sacar conclusiones vlidas para toda la poblacin de la que
proceden.

M. Gonzlez

Bioestadstica: Estadstica Descriptiva

Conceptos Bsicos
Estadstica Descriptiva

Coneptos Bsicos
POBLACIN UNIVERSO. Conjunto de elementos o
individuos de la misma naturaleza que presentan uno o varios
caracteres comunes, susceptibles de medida o clasificacin.
Individuos, Unidades experimentales estadsticas.

MUESTRA. Porcin de la poblacin adecuadamente


seleccionada.
CARACTERES VARIABLES. Caractersticas comunes,
susceptibles de medida o clasificacin, que presentan los
individuos de una poblacin.
Modalidades. Diferentes formas en que puede presentarse un
carcter o variable en cada unidad experimental.
Clasificacin.
Caracteres Cualitativos.
Variables Cuantitativas: Discretas y Continuas.

M. Gonzlez

Bioestadstica: Estadstica Descriptiva

Conceptos Bsicos
Estadstica Descriptiva

Coneptos Bsicos
ESCALAS
Modos de clasificar los datos dependiendo de su naturaleza y de las
relaciones que pueden establecerse entre las modalidades.
ESCALA NOMINAL
C. Cualitativo.
Relaciones de igualdad-desigualdad.

ESCALA ORDINAL
C. Cualitativo - V. Cuantitativa.
Relaciones de orden.

ESCALA NUMRICA
V. Cuantitativa.
Relaciones de numricas (de proporcionalidad).
M. Gonzlez

Bioestadstica: Estadstica Descriptiva

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Estadstica Descriptiva
DATOS: Valores de triglicridos sricos totales (mg/100ml) medidos
en 104 ratas de laboratorio normales:
59.7
70.7
73.3
69.2
75.3
60.5
74.2
62.1
80.2
63.0
79.8
57.9
69.6

69.5
72.9
91.5
63.0
72.1
56.6
83.0
72.2
59.0
68.9
74.8
72.5
70.6

78.6
69.1
70.6
69.0
83.5
67.1
71.7
69.9
69.2
52.7
47.7
74.8
68.9

78.5
69.8
75.2
63.5
61.4
65.4
66.5
80.4
70.4
77.3
78.2
68.7
71.4

71.8
75.6
76.1
78.6
76.6
71.0
72.9
61.7
70.2
59.9
59.6
59.8
74.3

M. Gonzlez

68.6
82.1
71.1
73.7
60.6
61.1
73.1
80.6
68.8
78.4
61.5
61.9
70.8

63.8
61.1
64.3
66.5
50.2
72.4
61.3
70.7
66.9
74.7
66.0
67.8
63.4

67.5
79.7
77.8
69.5
60.9
55.6
67.0
81.4
86.3
57.1
57.6
65.2
60.6

Bioestadstica: Estadstica Descriptiva

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Tablas de Frecuencias
ESTRUCTURA BSICA
Carcter
Variable
Modalidades
valores posibles
de la variable
TOTAL

Frecuencia
Absoluta
..
.

Frecuencia
Relativa
..
.

Porcentaje

fi
..
.
P
n = fi

hi
..
.

..
.
%
..
.

100

Frecuencia Absoluta (fi ): nmero de datos de la muestra que


corresponden a cada modalidad, valor o intervalo de valores de
la variable.
P
Freciencia relativa (hi ): hi = fi /n, n = fi
Porcentaje (%): hi 100
M. Gonzlez

Bioestadstica: Estadstica Descriptiva

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Tablas de Frecuencias
Ejemplo 1: Carcter Cualitativo
Al examinar 158 casos de parlisis de Bell se anotaron las diferentes terapias
seguidas por estos pacientes, resultando el conjunto de datos:
DQ, C, NT, ET, C, DQ, OT, NT, ET, C, C, DQ, OT,etc.
(C: corticosteroides; DQ: descompresin quirrgica; ET: electroterapia; NT:
ningn tratamiento; OT: otras modalidades).

Tratamiento
C
DQ
ET
NT
OT
TOTAL

fi
73
36
19
21
9
158

M. Gonzlez

hi
0.462
0.228
0.120
0.133
0.057
1

%
46.2
22.8
12.0
13.3
5.7
100

Bioestadstica: Estadstica Descriptiva

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Tablas de Frecuencias
Ejemplo 2: Variable Cuantitativa Discreta
Se ha realizado un estudio sobre el nmero de piezas dentales con
caries en una muestra de 135 nios de un determinado grupo de edad
y condiciones de higiene y alimentacin particulares. Los datos, ya
ordenados se recogen en la siguiente tabla:
No caries
0
1
2
3
4 ms
TOTAL

fi
46
39
27
15
8
135

M. Gonzlez

hi
0.341
0.289
0.200
0.111
0.059
1

%
34.1
28.9
20.0
11.1
5.9
100

Bioestadstica: Estadstica Descriptiva

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Tablas de Frecuencias
Ejemplo 3: Variable Cuantitativa Discreta
Se han tomado los valores de la frecuencia cardiaca (pul./m) de un grupo de
56 pacientes, un minuto despus de ser sometidos a un determinado ejercicio
fsico. Los datos obtenidos, ya ordenados, se recogen en la siguiente tabla:

Frec. Cardiaca
96100
101105
106110
111115
116120
121125
TOTAL
Marca de clase: xi = (LI + LS )/2,

xi
98
103
108
113
118
123

fi
2
7
7
18
16
6
56

hi
0.036
0.125
0.125
0.321
0.286
0.107
1

%
3.6
12.5
12.5
32.1
28.6
10.7
100

LI , LS lmites inferior y superior de la clase.

M. Gonzlez

Bioestadstica: Estadstica Descriptiva

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Tablas de Frecuencias
Ejemplo 4: Variable Cuantitativa Continua
Dentro de un estudio sobre la pacreatitis se han tomado los valores de triglicridos
sricos totales (TST) medidos en mg/100ml en 104 ratas de laboratorio normales
(trasparencia inicial). Los datos ordenados aparecen en la siguiente tabla:
TST
(45,50]
(50,55]
(55,60]
(60,65]
(65,70]
(70,75]
(75,80]
(80,85]
(85,90]
(90,95]
TOTAL

xi
47.5
52.5
57.5
62.5
67.5
72.5
77.5
82.5
87.5
92.5

M. Gonzlez

fi
1
2
10
18
24
26
14
7
1
1
104

hi
0.01
0.02
0.10
0.17
0.23
0.25
0.13
0.07
0.01
0.01
1

%
1
2
10
17
23
25
13
7
1
1
100

Bioestadstica: Estadstica Descriptiva

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Tablas de Frecuencias
Nmero de clases o intervalos
Cuntas clases debemos formar para tabular un conjunto de datos?
Pocas clases prdidad de mucha informacin.
Muchas clases trabajar con muchos datos.

Frmula de Sturges
El nmero de clases o intervalos que debemos formar si queremos
tabular un conjunto de n datos, debe estar en torno a
1 + 3.322 log10 n

M. Gonzlez

Bioestadstica: Estadstica Descriptiva

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Tablas de Frecuencias
Construccin de las clases o intervalos
Antes de construir la tabla de frecuencias hay que agrupar los datos de
estas variables en intervalos. La forma de hacerlo es la siguiente:
Determinar valores mximo (Vmax ) y mnimo (Vmin ) de los datos.
Determinar el nmero (k) de intervalos a construir (por ejemplo
utilizando la frmula de Sturges), que deben ser todos de la
misma amplitud (diferencia entre el lmite superior e inferior).
Vmax Vmin
Determinar la amplitud de los intervalos: c
k
A veces conviene redondear esta amplitud pero NUNCA
DEBEMOS PERDER NINGN DATO EN EL PROCESO.

M. Gonzlez

Bioestadstica: Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Ejemplo 5
En la siguiente tabla se muestran los niveles de colinesterasa de 33
agricultores expuestos a insecticidas agrcolas:
10.6
11.5
14.9

12.2
10.3
11.3

Vmin = 7.8

11.8
8.6
11.1

12.5
9.9
12.5

Vmax = 16.5
c

10.8
12.4
12.3
,

12.7
8.5
10.2

11.1
11.9
12.5

16.5
9.1
9.7

11.4
10.1
12.3

9.2
11.6
12.0

15.0
7.8
12.4

k 1 + 3.322 log10 33 = 6.04 6

16.5 7.8
= 1.45( 1.5)
6

Sin redondear:
[7.8, 9.25], (9.25, 10.7], (10.7, 12.15], (12.15, 13.6], (13.6, 15.05], (15.05, 16.5]
Redondeando:
[7.5, 9], (9, 10.5], (10.5, 12], (12, 13.5], (13.5, 15], (15, 16.5]
M. Gonzlez

Bioestadstica: Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Frecuencias Acumuladas

P
P
Frecuencia relativa acumulada (H ): H =
Variables cuantitativas (discretas y continuas)
Frecuencia absoluta acumulada (Fi ): Fi =
i

TST
(45,50]
(50,55]
(55,60]
(60,65]
(65,70]
(70,75]
(75,80]
(80,85]
(85,90]
(90,95]
TOTAL

xi
47.5
52.5
57.5
62.5
67.5
72.5
77.5
82.5
87.5
92.5

fi
1
2
10
18
24
26
14
7
1
1
104

M. Gonzlez

hi
0.01
0.02
0.10
0.17
0.23
0.25
0.13
0.07
0.01
0.01
1

i
j=1 fj

i
j=1

%
1
2
10
17
23
25
13
7
1
1
100

hj = Fi /n,
Fi
1
3
13
31
55
81
95
102
103
104

Hi
0.01
0.03
0.12
0.30
0.53
0.78
0.91
0.98
0.99
1.00

Bioestadstica: Estadstica Descriptiva

n=

Pf

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Grficos: Carcter Cualitativo


DIAGRAMA DE BARRAS
Esta representacin consiste en construir tantos rectngulos o barras como
modalidades presente el carcter bajo estudio. La altura que alcanza cada barra puede
ser igual a la frecuencia absoluta o bien a la frecuencia relativa de la modalidad a la
que corresponde dicha barra.
Parlisis de Bell

40
30

nmero de casos

%
46.2
22.8
12.0
13.3
5.7
100

20

hi
0.462
0.228
0.120
0.133
0.057
1

10

fi
73
36
19
21
9
158

Tratamiento
C
DQ
ET
NT
OT
TOTAL

50

60

70

Ejemplo 1

M. Gonzlez

DQ

ET

Bioestadstica: Estadstica Descriptiva

NT

OT

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Grficos: Carcter Cualitativo


DIAGRAMA DE SECTORES
Se trata de un crculo dividido en sectores, cada uno de los cuales representa una
modalidad del carcter estudiado.
A la modalidad i se le asigna un ngulo de hi 360o .
Parlisis de Bell

Ejemplo 1
Tratamiento
C
DQ
ET
NT
OT
TOTAL

fi
73
36
19
21
9
158

hi
0.462
0.228
0.120
0.133
0.057
1

%
46.2
22.8
12.0
13.3
5.7
100
M. Gonzlez

OT
DQ
NT
ET

Bioestadstica: Estadstica Descriptiva

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Grficos: Variable Cuantitativa


HISTOGRAMA
Para construir el histograma partimos de la tabla de frecuencias de los
datos.
Dividimos el eje horizontal en las clases intervalos en que hemos
agrupado los datos.
Sobre cada intervalo construiremos un rectngulo. El rea de estos
rectngulos debe ser proporcional a la frecuencia (absoluta relativa,
con sin acumular) de la clase que representan.
Por ejemplo, para una clase de amplitud ci y frecuencia absoluta
fi , la altura del rectngulo que la representa debe ser una
constante por el cociente fi /ci .
Si todas las clases tienen la misma amplitud (que es lo habitual y
deseable), bastar con que la altura de cada rectngulo sea la
frecuencia (absoluta relativa) de la clase.
M. Gonzlez

Bioestadstica: Estadstica Descriptiva

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Grficos: Variable Cuantitativa


HISTOGRAMA
Ejemplo 4

M. Gonzlez

20
15

%
1
2
10
17
23
25
13
7
1
1
100

10

hi
0.01
0.02
0.10
0.17
0.23
0.25
0.13
0.07
0.01
0.01
1

nmero de casos

fi
1
2
10
18
24
26
14
7
1
1
104

xi
47.5
52.5
57.5
62.5
67.5
72.5
77.5
82.5
87.5
92.5

TST
(45,50]
(50,55]
(55,60]
(60,65]
(65,70]
(70,75]
(75,80]
(80,85]
(85,90]
(90,95]
TOTAL

25

Triglicricos sricos totales

50

60

70

Bioestadstica: Estadstica Descriptiva

80

90

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Grficos: Variable Cuantitativa

POLGONO DE FRECUENCIAS
Consiste en el polgono resultante de unir mediante segmentos los
puntos del plano cuya primeras coordenadas son las marcas de clase y
las segunda las frecuencias (absolutas relativas, con o sin acumular)
de cada una de las clases que se pretenden representar

M. Gonzlez

Bioestadstica: Estadstica Descriptiva

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Grficos: Variable Cuantitativa


POLGONO DE FRECUENCIAS
Ejemplo 4

M. Gonzlez

20
15

%
1
2
10
17
23
25
13
7
1
1
100

10

hi
0.01
0.02
0.10
0.17
0.23
0.25
0.13
0.07
0.01
0.01
1

nmero de casos

fi
1
2
10
18
24
26
14
7
1
1
104

xi
47.5
52.5
57.5
62.5
67.5
72.5
77.5
82.5
87.5
92.5

TST
(45,50]
(50,55]
(55,60]
(60,65]
(65,70]
(70,75]
(75,80]
(80,85]
(85,90]
(90,95]
TOTAL

25

Triglicricos sricos totales

50

60

70

Bioestadstica: Estadstica Descriptiva

80

90

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Grficos: Variable Cuantitativa


DIAGRAMA TALLO-HOJA
Ejemplo 6. Se ha desarrollado una nueva vacuna contra la difteria para
aplicarla a nios. Se han obtenido estos datos del nivel de proteccin de la
nueva vacuna al transcurrir un mes: (Basado en un informe del Journal of
Family Practice, 1990,(1), 27-30)
12.5 13.8 13.0 13.5 13.2 12.2 13.4 14.0
13.6 13.3 13.3 14.1 14.6 13.1 12.1 13.7
13.4 12.8 12.6 12.7
The decimal point is at the |
12 | 12
12 | 5678
13 | 0123344
13 | 5678
14 | 01
14 | 6
M. Gonzlez

Bioestadstica: Estadstica Descriptiva

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Medidas de Sntesis

CARACTERSTICAS ESENCIALES DE UN CONJUNTO DE


DATOS:
Centralizacin Posicin.
Dispersin.
Forma.

M. Gonzlez

Bioestadstica: Estadstica Descriptiva

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Medidas de Centralizacin
Media Aritmtica (Muestral): x
La media (x) es el valor central en el sentido aritmtico. Viene a ser el centro de
gravedad de los datos.
x1 + + xn
x =
n
Si los datos estn agrupados en una tabla de frecuencias
x =

x1 f 1 + + xk f k
= x1 h1 + + xk hk
n

Propiedades
Utiliza toda la informacin contenida en el dato.
No es robusta: es influida por la existencia de valores extremos (outliers).
6, 7, 8, 9, 10 x = 8
6, 7, 8, 9, 30 x = 12
M. Gonzlez

Bioestadstica: Estadstica Descriptiva

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Medidas de Centralizacin
Media Ponderada: xp
Datos: x1 , . . . , xn . Pesos: 1 , . . . , n
Pn
xi i
xp = Pi=1
n
i=1 i
Ejemplo. Datos: 5, 8, 9. Pesos: 1, 2, 2
x = 7.3
xp = 7.8

M. Gonzlez

Bioestadstica: Estadstica Descriptiva

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Medidas de Centralizacin
Media Geomtrica: xg
Datos: x1 , . . . , xn
xg = (x1 ...xn )1/n
Se utiliza con variables que evolucionan exponencialmente
respecto al tiempo: nmero de microorganismos de un cultivo.
Media Armnica: xh
Datos: x1 , . . . , xn

n
xh = Pn

1
i=1 xi

Se utiliza para calcular velocidades medias de sedimentacin.


M. Gonzlez

Bioestadstica: Estadstica Descriptiva

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Medidas de Centralizacin
Mediana: x
Es un valor de la variable (no necesariamente un dato observado) tal
que la mitad de los datos son menores que ella y la otra mitad
mayores. Ocupa la posicin central en el sentido del orden.
Clculo: ordenar los datos de menor a mayor.
Si n impar, x dato que ocupa la posicin

n+1
2

Si n par, x punto medio de los datos que ocupan las posiciones


n
2 +1

n
2

Propiedades:
Utiliza de cada dato slo la posicin que ocupa en la muestra ordenada.
Es robusta.
6, 7, 8, 9, 10 x = 8, x = 8
6, 7, 8, 9, 30 x = 12 x = 8
M. Gonzlez

Bioestadstica: Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Conceptos Bsicos
Estadstica Descriptiva

Medidas de Centralizacin

Mediana: x
Si los datos vienen dados por una tabla de frecuencias, entonces
calcularemos la mediana a travs de la frmula:
x = LI +

n
2

Fm1
cm
fm

siendo LI el lmite inferior de la clase mediana, fm la frecuencia absoluta de


la clase mediana, Fm1 la frecuencia absoluta acumulada de la clase anterior
a la mediana y cm la amplitud de la clase mediana.

M. Gonzlez

Bioestadstica: Estadstica Descriptiva

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Medidas de Centralizacin

Moda: x
Valor del conjunto de datos que aparece con mayor frecuencia.
Si los datos estn en una tabla de frecuencias la moda ser la
marca de clase del intervalo o clase de mayor frecuencia.

M. Gonzlez

Bioestadstica: Estadstica Descriptiva

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Medidas de Posicin
Cuartiles
Primer cuartil (Q1 ) es el valor que deja por debajo de l la cuarta parte
de los datos ordenados. Para calcularlo se ordenan los datos de menor a
mayor y se toma n+1
2 redondeado por defecto. A este nmero lo
llamamos q.
Si q es impar, Q1 es el dato que ocupa la posicin q+1
2 .
Si q es par, Q1 es el punto medio de los datos que ocupan las
posiciones q2 y q2 + 1.
Segundo cuartil (Q2 ) Es el valor que deja por debajo de l dos cuartas
partes de los datos. Por tanto se trata de la mediana, Q2 = x.
Tercer cuartil (Q3 ) Es el valor que deja por debajo de l las tres cuartas
partes de los datos.

M. Gonzlez

Bioestadstica: Estadstica Descriptiva

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Medidas de Posicin

Deciles
El decil i-simo (Di ) deja i/10 de los datos por debajo de l,
i = 1, . . . , 9.

Percentiles
El percentil p (Pp ) deja el 100p% de los datos por debajo de l,
p = 1, . . . , 99.

M. Gonzlez

Bioestadstica: Estadstica Descriptiva

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Medidas de Dispersin
Rango (R)
Diferencia entre el dato mximo y el dato mnimo.

Varianza Muestral (s2 )


Mide la variabilidad de los datos respecto de la media muestral x.
!
n
n
X
1 X
1
2
2
2
2
s =
(xi x) =
xi nx
n1
n1
i=1

i=1

Si los datos estn en una tabla de frecuencias,



Pn
Pn 2
1
1
s2 = n1
x)2 fi = n1
x2
i=1 (xi
i=1 xi fi n

Desviacin Tpica (s)

Se define como s = s2 . La raz cuadrada compensa el hecho de haber


elevado los datos al cuadrado. Por tanto se mide en las mismas unidades que
los datos.
M. Gonzlez

Bioestadstica: Estadstica Descriptiva

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Medidas de Dispersin
Rango Intercuartlico (RI )
Distancia entre Q1 y Q3 , RI = Q3 Q1 . En esta distancia se
concentran el 50% de los datos que ocupan posiciones centrales.

Coeficiente de Variacin (C.V.)


Mide la dispersin de los datos en relacin a su orden de magnitud.
Se utiliza para comparar la dispersin de distintos grupos de datos.
C.V. =

M. Gonzlez

s
100
x

Bioestadstica: Estadstica Descriptiva

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Medidas de Forma
Coeficiente de Asimetra: g1
El coeficiente de asimetra (g1 ) se define como:
Pn
1
x)3
i=1 (xi
n
g1 =
s3

0.14
0.10
0.08

Density

0.04

0.05

0.06

0.10
Density

0.03
0.02

50

60

70

80

90

0.00

0.00

0.02

0.01
0.00

Density

0.04

0.12

0.15

0.05

Cuanto ms prximo est g1 a 0 ms simetra presentan los datos. Si g1 > 0


hay una asimetra hacia valores grandes de la variable y si g1 < 0 hacia
valores pequeos de la variable.

g1 = 0

10

15

g1 > 0

M. Gonzlez

Bioestadstica: Estadstica Descriptiva

10
g1 < 0

15

Conceptos Bsicos
Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Medidas de Forma

Coeficiente de Curtosis o Aplastamiento: g2


El coeficiente de curtosis o aplastamiento (g2 ) se define como:
Pn
1
x)4
i=1 (xi
n
g2 =
3
s4
Si g2 = 0 (distribucin mesocrtica) el grado de aplastamiento de los datos
ser similar al de una campana de Gauss. Si g2 > 0 (distribucin
leptocrtica) los datos presentan un menor aplastamiento que la campana de
Gauss y si g2 < 0 (distribucin platicrtica), los datos aparecen ms
aplastados que la campana de Gauss.

M. Gonzlez

Bioestadstica: Estadstica Descriptiva

Tablas de Frecuencias
Grficos
Medidas de Sntesis

Conceptos Bsicos
Estadstica Descriptiva

Medidas de Sntesis
Diagrama de Caja o Box-plot
Se trata de una representacin grfica ligada a los cuartiles.
16

12

Q1

Q3
~
x

10

14

h3

h1

h1 es el dato ms prximo a Q1 1.5RI mayor que este valor.


h3 es el dato ms prximo a Q3 + 1.5RI menor que este valor.
Los valores menores que h1 mayores que h3 son valores atpicos (outliers)
que pueden ser datos influyentes o simplemente mal tomados.
M. Gonzlez

Bioestadstica: Estadstica Descriptiva

También podría gustarte