Está en la página 1de 17

Estadstica

2 curso del Grado en Ciencias de la


Actividad Fsica y el Deporte
---o0o---

Introduccin.
Descripcin de las Muestras:
Estadstica Descriptiva

Bioestadstica - Facultad de Medicina


Universidad de Granada (Espaa)
http://www.ugr.es/~bioest

Estadstica descriptiva - 2

ESTADSTICA

Resmenes: 1

Necesidad
Necesidadde
delalaEstadstica
Estadstica

Las
LasCiencias
Cienciasde
delalaActividad
ActividadFsica
FsicayyelelDeporte
Deporteson
sonexperimentales
experimentalesyysesebasan
basanen
enelelmtodo
mtodoinductivo
inductivo
(extensin,
al
todo,
de
las
conclusiones
obtenidas
en
una
parte).
El
nico
modo
(extensin, al todo, de las conclusiones obtenidas en una parte). El nico modo de
de validar
validar tales
tales
inducciones
inducciones eses por
por elel Mtodo
Mtodo Estadstico.
Estadstico. Las
Las dems
dems razones
razones que
que siguen
siguen son
son reflejo
reflejo de
de esta
esta mayor
mayor
razn:
razn:
a)a)La
Lavariabilidad
variabilidadbiolgica
biolgicade
delos
losindividuos
individuosobjeto
objetode
deestudio
estudioen
enlas
lasCiencias
Cienciasde
delalaActividad
Actividad
Fsica
y
el
Deporte
origina
que
sus
datos
sean
impredecibles
y
que
el
modo
de
controlarlos
Fsica y el Deporte origina que sus datos sean impredecibles y que el modo de controlarlossea
seaaatravs
travs
del
delMtodo
MtodoEstadstico.
Estadstico.
b)
b)La
Lanaturaleza
naturalezacada
cadavez
vezms
mscuantitativa
cuantitativade
delas
lasCiencias
Cienciasde
delalaActividad
ActividadFsica
FsicayyelelDeporte
Deporte
requiere
del
Mtodo
Estadstico
para
analizar
y
poner
orden
en
los
datos.
requiere del Mtodo Estadstico para analizar y poner orden en los datos.
c)c)La
Lainvestigacin
investigacinen
enelelcampo
campode
delas
lasCiencias
Cienciasde
delalaActividad
ActividadFsica
FsicayyelelDeporte
Deporterequiere
requierede
delala
Estadstica
en
sus
etapas
de
diseo,
recopilacin
de
datos
y
anlisis
de
los
resultados.
Estadstica en sus etapas de diseo, recopilacin de datos y anlisis de los resultados.
d)
d)El
Elvolumen
volumende
delalainformacin
informacinque
querecibe
recibeelelprofesional
profesionaldel
deldeporte
deporterequiere
requierede
deconocimientos
conocimientos
estadsticos
que
le
permitan
leer
crtica
y
comprensivamente
los
resultados
cientficos
ajenos.
estadsticos que le permitan leer crtica y comprensivamente los resultados cientficos ajenos.
e)e)La
Lanaturaleza
naturalezadel
deltrabajo
trabajoen
enlalaActividad
ActividadFsica
FsicayyelelDeporte
Deporteesesen
enesencia
esenciade
detipo
tipoprobabilstico
probabilsticooo
estadstico,
disciplinas
que
dan
rigor
y
objetividad
a
los
clsicos
procesos
subjetivos
de
estadstico, disciplinas que dan rigor y objetividad a los clsicos procesos subjetivos dediagnstico,
diagnstico,
pronstico
pronsticoyytratamiento.
tratamiento.
f)f)La
Laperspectiva
perspectivacomunitaria
comunitaria de
delas
lasCiencias
Cienciasdel
delDeporte
Deporterequiere
requieredel
deluso
usode
delalaEstadstica
Estadsticapara
para
poder
extrapolar
las
conclusiones
desde
la
parte
estudiada
de
la
poblacin
a
su
globalidad.
poder extrapolar las conclusiones desde la parte estudiada de la poblacin a su globalidad.
Objetivo
Objetivodel
delCurso:
Curso:
- -Proporcionar
Proporcionarlos
losmnimos
mnimosconocimientos
conocimientosnecesarios
necesariospara
pararealizar
realizard)d)en
enlos
losexperimentos
experimentosms
mssimples.
simples.
- -Comprender
los
resultados
estadsticos
de
los
artculos
cientficos.
Comprender los resultados estadsticos de los artculos cientficos.

Estadstica descriptiva - 3
Resmenes: 1

ESTADSTICA
Hoy da la Estadstica no es solo una Ciencia Bsica sino que representa una tecnologa clave en el momento cientfico actual.
Las ideas estadsticas bsicas deben formar una parte imprescindible del equipo mental de la persona formada, y el Mtodo
Estadstico un instrumento de trabajo esencial para el cientfico.
Sir Ronald Fisher (adaptado)

Definicin
Definicin de
de Estadstica:
Estadstica: La
La Estadstica
Estadstica es
es elel conjunto
conjunto de
de mtodos
mtodos
necesarios
para
recoger,
clasificar,
representar
y
resumir
datos,
as
como
necesarios para recoger, clasificar, representar y resumir datos, as comopara
para
hacer
inferencias
(extraer
consecuencias)
cientficas
a
partir
de
ellos.
hacer inferencias (extraer consecuencias) cientficas a partir de ellos.
Distinguimos:

E stadstica descriptiva
(recogida, clasificacin, representacin y resum en de datos)

T eora de la E stim acin

C al es el tiem po m edio que tarda en hacer efecto un frm aco?


Inferencia E stadstica

T eora de los C ontrastes de H iptesis

E l tratam iento A es igual de efectivo que el tratam iento B ?

Estadstica descriptiva - 4

ESTADSTICA

Resmenes: 2.1

Nuestro
Nuestrointers
intersesesconocer
conocerqu
quesesloloque
queocurre
ocurreen
enuna
unapoblacin
poblacin
dada
acerca
de
alguna
cierta
caracterstica.
Por
ejemplo,
dada acerca de alguna cierta caracterstica. Por ejemplo,es
es
efectivo
el
nuevo
mtodo
de
entrenamiento
para
un
cierto
deporte?
efectivo el nuevo mtodo de entrenamiento para un cierto deporte?
Como
Comoesesde
desuponer,
suponer,no
nopodemos
podemos
observar
a
todos
los
individuos
observar a todos los individuosde
deesa
esa
poblacin,
de
manera
que
trataremos
poblacin, de manera que trataremosde
de
obtener
una
imagen
representativa
obtener una imagen representativa
de
delalamisma
mismayyestudiarla.
estudiarla.
Las
Lasobservaciones
observacionesrealizadas
realizadasconstituyen
constituyenuna
una
muestra
.
Para
poder
tratar
la
informacin
contenida
muestra. Para poder tratar la informacin contenida
en
eneste
esteconjunto
conjuntode
dedatos
datosesespreciso
precisorecurrir
recurriraalas
las

tcnicas
tcnicasestadsticas
estadsticasdescriptivas
descriptivas

12
34
23
56
12
34
23
56
12
34

91
23
45
32
91
23
45
32
91
23

23
45
56
34
23
45
56
34
23
45

23
98
34
68
23
98
34
68
23
98

12 91 23 23
34 23 45 98
23
56
12
34
23
56
12
34

45 56 34
32 34 68
91 23 23

23
45
32
91
23

45
56
34
23
13

98
34
68
23

La
Laextensin
extensinde
deloloobservado
observadoaalalapoblacin
poblacinvendr
vendrdespus,
despus,
mediante
la
inferencia
estadstica
mediante la inferencia estadstica
2

Estadstica descriptiva - 5

ESTADSTICA DESCRIPTIVA

Resmenes: 2.1

Consideraciones sobre los datos


Modalidad
Cada una de las maneras en las que se presenta un carcter.

Tipos de Datos
1.

Cualitativos: aquellos que se refieren a una cualidad, no son expresables de manera

2.

rigurosa por un nmero.


1. Nominales: las modalidades no son susceptibles de estar ordenadas (sexo, estado
civil, grupo sanguneo, etc). Si solo hay dos modalidades se habla de datos Binarios o
Dicotmicos.
2. Ordinales: cuando las modalidades son susceptibles de estar ordenadas (nivel de
satisfaccin, estado despus del tratamiento,...)
Cuantitativos: aquellos que necesariamente requieren de un nmero para ser expresados
de manera rigurosa.
1. Discretos: aquellos datos que slo pueden tomar "valores numricos aislados
(nmero de hijos, nmero de visitas,... recuentos en general)
2. Continuos: pueden tomar cualquier valor dentro de un intervalo, de modo que entre
cualesquiera dos de ellos siempre existe otro valor posible (peso, estatura, valor
hematocrito,... medidas en general)

Estadstica descriptiva - 6

ESTADSTICA DESCRIPTIVA

Resmenes: 2.2-2.4

Resumen de la informacin
3 niveles:

Tablas de frecuencias

Representaciones
grficas

Medidas descriptivas

Datos

B 1

B B 2

Estadstica descriptiva - 7

ESTADSTICA DESCRIPTIVA

Resmenes: 2.2

Datos originales (tabla de casos x variables):

B 1

B B 2

Estadstica descriptiva - 8

ESTADSTICA DESCRIPTIVA

Resmenes: 2.2

Tablas de frecuencias: variables nominales


Tabla 2.2
Distribucin
del grupo
sanguneo
de una de
Distribucin
del grupo
sanguneo
de una muestra
500 alumnos
varones
de una
Universidad
muestra
de 500
alumnos
varones
de una
Grupo
sanguneo
A
B
AB
0
Total

fi
(frecuencia
absoluta)
150
75
25
250
500

hi
(frecuencia
relativa)
0.300
0.150
0.050
0.500
1.000

%
(porcentaje)
30.00
15.00
5.00
50.00
100
k

Frecuencia absoluta (recuento): f 1 + f 2 + ....... + f k = fi n


i 1

Frecuencia relativa ( porcentaje): h i f i /n


k

h1 + h 2 + ....... + h k = h i 1
i 1

Estadstica descriptiva - 9

ESTADSTICA DESCRIPTIVA

Resmenes: 2.2

Tablas de frecuencias: variables cuantitativas discretas


Tabla 2.3
Distribucin del nmero de hermanos (excluido l mismo) de una
muestra de 500 alumnos varones de una Universidad
Nmero de
hermanos
0
1
2
3
4
5
6
ms de 6
Total

fi

hi

Fi

Hi

72
155
97
81
30
27
20
18
500

0.144
0.310
0.194
0.162
0.060
0.054
0.040
0.036
1.000

14.40
31.00
19.40
16.20
6.00
5.40
4.00
3.60
100

72
227
324
405
435
462
482
500

0.144
0.454
0.648
0.810
0.870
0.924
0.964
1.000

%
acumulado
14.4
45.40
64.80
81.00
87.00
92.40
96.40
100.00

Un
Un81%
81%de
delos
loscasos
casosobservados
observadostienen
tienen33
hermanos
hermanosoomenos,
menos,por
portanto
tantoun
un19%
19%
tienen
4
o
ms
tienen 4 o ms

B 1

B B 2

Estadstica descriptiva - 10

ESTADSTICA DESCRIPTIVA

Resmenes: 2.2

Tablas de frecuencias: variables cuantitativas continuas


Tabla 2.4
Distribucin del peso (en Kg) de una muestra de 500 alumnos
varones de una Universidad
Peso (Kg)

fi

hi

Fi

Hi

Menos de 45
[45 - 50)
[50 - 55)
[55 - 60)
[60 - 65)
[65 - 70)
[70 - 75)
[75 - 80)
[80 - 85)
[85 - 90)
90 o ms
Total

1
3
12
75
103
155
101
29
11
8
2
500

0.002
0.006
0.024
0.150
0.206
0.310
0.202
0.058
0.022
0.016
0.004
1.000

0.20
0.60
2.40
15.00
20.60
31.00
20.20
5.80
2.20
1.60
0.40
100

1
4
16
91
194
349
450
479
490
498
500

0.002
0.008
0.032
0.182
0.388
0.698
0.900
0.958
0.980
0.996
1.000

%
acumulado
0.2
0.8
3.2
18.2
38.8
69.8
90.0
95.8
98.0
99.6
100.0

Un
Un71.8%
71.8%de
delos
losalumnos
alumnosde
delalamuestra
muestra
pesan
entre
60
y
75
pesan entre 60 y 75Kg
Kg

B 1

B B 2

Estadstica descriptiva - 11

ESTADSTICA DESCRIPTIVA

Resmenes: 2.2

Tablas de frecuencias
Condiciones
Condicionesde
delas
lastablas:
tablas:
1)
1) Enunciado
Enunciadoque
quelas
lashaga
hagaautosuficientes.
autosuficientes.
2)
2) En
Enlas
lascolumnas
columnasque
quesea
seanecesario
necesariodeben
debenirirtotales
totales
3)
3) Unidades
Unidadesde
demedida.
medida.
4)
4) Igual
Igualnmero
nmerode
dedecimales.
decimales.
5)
5) Intervalos
Intervalosde
declase
clasede
deigual
igualanchura.
anchura.

B 1

B B 2

Estadstica descriptiva - 12

ESTADSTICA DESCRIPTIVA

Resmenes: 2.3

Representaciones grficas
Principio
Principiogeneral
generalde
detoda
todarepresentacin
representacingrfica:
grfica:
La
La figura
figura que
que representa
representa aa cada
cada una
una de
de las
las modalidades
modalidades de
de un
un carcter
carcter
debe
tener
el
rea
proporcional
a
la
frecuencia
de
dicha
modalidad.
debe tener el rea proporcional a la frecuencia de dicha modalidad.
Observaciones:
Observaciones:Las
Lasrepresentaciones
representacionesgrficas
grficas
--Deben
Debenindicar
indicarlas
lasescalas
escalasyyunidades
unidadesde
demedida
medida
--Deben
Debenexplicarse
explicarsepor
porsssolas
solas
--Deben
contribuir
a
clarificar
Deben contribuir a clarificarelelmaterial
materialpresentado
presentado

Estadstica descriptiva - 13

ESTADSTICA DESCRIPTIVA

Resmenes: 2.3

Representaciones grficas: variables nominales


Diagrama de sectores de la Tabla 2.2
Distribucin del grupo sanguneo de una muestra
de 500 alumnos varones de una Universidad

io 360o h i

EDAD

Vlidos

2.00
3.00
4.00
5.00
6.00
7.00
8.00
Total

Frecuencia
6
11
9
13
7
6
4
56

Porcentaje
10.7
19.6
16.1
23.2
12.5
10.7
7.1
100.0

Porcentaje
acumulado
10.7
30.4
46.4
69.6
82.1
92.9
100.0

Estadstica descriptiva - 14

ESTADSTICA DESCRIPTIVA

Resmenes: 2.3

Representaciones grficas: variables nominales y ordinales


Diagrama de barras de la Tabla 2.2
Distribucin del grupo sanguneo de una muestra
de 500 alumnos varones de una Universidad
300

Frecuencia

250

200

150

100

50

0
A

AB

Grupo sanguneo
EDAD

Vlidos

2.00
3.00
4.00
5.00
6.00
7.00
8.00
Total

Frecuencia
6
11
9
13
7
6
4
56

Porcentaje
10.7
19.6
16.1
23.2
12.5
10.7
7.1
100.0

Porcentaje
acumulado
10.7
30.4
46.4
69.6
82.1
92.9
100.0

Estadstica descriptiva - 15

ESTADSTICA DESCRIPTIVA

Resmenes: 2.3

Representaciones grficas: variables cuantitativas discretas


Diagrama de barras de la Tabla 2.3
Distribucin del nmero de hermanos de una
muestra de 500 alumnos varones de una Universidad
160

Frecuencia

140
120
100
80
60
40
20
0
0

ms de 6

Nmero de hermanos
EDAD

Vlidos

2.00
3.00
4.00
5.00
6.00
7.00
8.00
Total

Frecuencia
6
11
9
13
7
6
4
56

Porcentaje
10.7
19.6
16.1
23.2
12.5
10.7
7.1
100.0

Porcentaje
acumulado
10.7
30.4
46.4
69.6
82.1
92.9
100.0

Estadstica descriptiva - 16

ESTADSTICA DESCRIPTIVA

Resmenes: 2.3

Polgono de frecuencias de la Tabla 2.3


Distribucin del nmero de hermanos de una
muestra de 500 alumnos varones de una Universidad
160

Frecuencia

140
120
100
80
60
40
20
0
0

ms de 6

Nmero de hermanos
EDAD

Vlidos

2.00
3.00
4.00
5.00
6.00
7.00
8.00
Total

Frecuencia
6
11
9
13
7
6
4
56

Porcentaje
10.7
19.6
16.1
23.2
12.5
10.7
7.1
100.0

Porcentaje
acumulado
10.7
30.4
46.4
69.6
82.1
92.9
100.0

Estadstica descriptiva - 17

ESTADSTICA DESCRIPTIVA

Resmenes: 2.3

Representaciones grficas: variables cuantitativas continuas


Histograma de la Tabla 2.4
Distribucin del peso de una muestra
de 500 alumnos varones de una Universidad
160

140

Frecuencia

120

100

80

60

40

20

0
42.5

47.5

52.5

57.5

62.5

67.5

72.5

77.5

82.5

87.5

92.5

Peso (Kg)

EDAD

Vlidos

2.00
3.00
4.00
5.00
6.00
7.00
8.00
Total

Frecuencia
6
11
9
13
7
6
4
56

Porcentaje
10.7
19.6
16.1
23.2
12.5
10.7
7.1
100.0

Porcentaje
acumulado
10.7
30.4
46.4
69.6
82.1
92.9
100.0

Estadstica descriptiva -18

ESTADSTICA DESCRIPTIVA

Resmenes: 2.3

Polgono de frecuencias de la Tabla 2.4


Distribucin del peso de una muestra
de 500 alumnos varones de una Universidad
160

Frecuencia

140

120

100

80

60

40

20

0
42.5

47.5

52.5

57.5

62.5

67.5

72.5

77.5

82.5

87.5

92.5

Peso (Kg)
EDAD

Vlidos

2.00
3.00
4.00
5.00
6.00
7.00
8.00
Total

Frecuencia
6
11
9
13
7
6
4
56

Porcentaje
10.7
19.6
16.1
23.2
12.5
10.7
7.1
100.0

Porcentaje
acumulado
10.7
30.4
46.4
69.6
82.1
92.9
100.0

Estadstica descriptiva - 19

ESTADSTICA DESCRIPTIVA

Resmenes: 2.3

Otras representaciones grficas: pictogramas

Jovenes

Adultos

Jovenes

Mayores

Pictograma de repeticin

Adultos Mayores

Pictograma de amplificacin
Estadstica descriptiva - 20

ESTADSTICA DESCRIPTIVA

Resmenes: 2.3

Grficas comparativas: Diagramas de barras


Distribucin del grupo sanguneo en dos muestras de
universitarios de Granada (n1=510) y Madrid (n2=520)

10

Estadstica descriptiva - 21

ESTADSTICA DESCRIPTIVA

Resmenes: 2.3

Grficas comparativas: polgonos de frecuencias


Distribucin del peso en dos muestras de
universitarios de Granada (n1=500) y Madrid (n2=525)

Estadstica descriptiva - 22

ESTADSTICA DESCRIPTIVA

Resmenes: 2.3

Grficas confusas

Nmero de mdicos /10.000 H

Nmero de mdicos por 10.000 habitantes en tres dcadas


de este siglo en las 8 provincias andaluzas
20
15
10
5
0
1950

1960
Almeria
Huelva

Cadiz
Jaen

Cordoba
Malaga

1970
Granada
Sevilla

Ao

11

B 1

B B 2

Estadstica descriptiva - 23

ESTADSTICA DESCRIPTIVA

Resmenes: 2.3

Grficas tendenciosas
(a)

(b)

50%

45%

25%
39%

(a)
A

1999

2000

1.- Porcentajes de curacin de cierta enfermedad


con dos frmacos A y B
20

(a)

30

(b)
(b)

20

10
10

1999
1997

1998

1999

2000

1997

1998

1999

2000

2000

3.- Consumo de tranquilizantes en


los aos indicados

2.- Nmero de entradas (en miles) en un Servicio de Urgencias


A

B 1

B B 2

Estadstica descriptiva - 24

ESTADSTICA DESCRIPTIVA

Resmenes: 2.4

Sntesis
Sntesisde
dedatos:
datos:medidas
medidasdescriptivas
descriptivas
Medidas de posicin: describen la localizacin de la muestra
Medidas de dispersin: describen cunto de variables o dispersos son los
datos

(a)

(b)

12

B 1

B B 2

Estadstica descriptiva -25

ESTADSTICA DESCRIPTIVA

Resmenes: 2.4

Medidas
Medidasdescriptivas:
descriptivas:Medidas
Medidasde
deposicin
posicin
1.- Moda: es el valor de la variable que tiene mayor frecuencia
(puede no ser nica).
- Ejemplos: tabla 2.2, tabla 2.3
2.- Mediana: es el valor de la variable que divide a la muestra ordenada
en dos partes iguales (es decir, deja tanto por debajo como por encima
el 50% de las observaciones).

Me x n 1

- Ejemplos:

(a) 3, 6, 7, 10, 15 Me x(3) 7


(b) 3, 6,10,15 Me x 41

6 10
8
2

(c) En la tabla 2.3: Me x (5001) / 2 x(250.5) 2

Estadstica descriptiva - 26

ESTADSTICA DESCRIPTIVA

Resmenes: 2.4

Medidas
Medidasdescriptivas:
descriptivas:Medidas
Medidasde
deposicin
posicin
n
3.- Media aritmtica:

x1 ,..., xn

a) Con datos no agrupados:

b) Con datos agrupados:

x xn
x 1

x1 xk

f1 f k n

x
i 1

xi f i
x1f1 xk f k
i 1
x

n
f1 f k

Ejemplo:
xi f i

(0)(72) (1)(155) (7)(18) 1093


i 1
- con los datos de la tabla 2.3: x

2.19
n

72 155 ... 18
k

4.- Media ponderada:


x
w

x1 xk
w1 w k

x w xk wk
xp 1 1

w1 w k

xw
i 1
k

5 7 9

w 3 3 5

x p 81/11 7.36

w
i 1

Ejemplo:

500

x 7; x

13

B 1

B B 2

Estadstica descriptiva -27

ESTADSTICA DESCRIPTIVA

Resmenes: 2.4

Frecuencia

Medidas
Medidasdescriptivas:
descriptivas:Medidas
Medidasde
deposicin
posicin
5.- Percentiles: el percentil , P, es el valor de la variable que divide a la
muestra ordenada en dos partes, dejando por debajo el % de las observaciones
y por encima el (1- ) %. Se habla entonces de percentil 1 (P1), ..., percentil 99
(P99). Casos particulares:
Diagrama de barras de la tabla 2.3
- Cuartiles: Q1=P25, Q2=P50=Me, Q3=P75 160
- Deciles: D1=P10, ..., D9=P90
140

- Ejemplo:

100
80
60

Percentil 40 de la tabla 2.3


501 0.4 200.4; P40

40% inicial
60% restante

120

x(200) x( 201)

40

20
0
0

ms de 6

N de hermanos

Posicin: 1 72 73 200 200 227


Valor:
0 0 1 1
1
1

228
2

x 200 x 201 P40 200


A

B 1

B B 2

Estadstica descriptiva - 28

ESTADSTICA DESCRIPTIVA

Resmenes: 2.4

Medidas
Medidasdescriptivas:
descriptivas:medidas
medidasde
dedispersin
dispersin
1.- Rango:

R xmax xmin

Medida pobre, solo tiene en cuenta a dos observaciones de la muestra


n

2.-Varianza:
Dados n valores (no agrupados):

x1 ,..., xn

s2

(x x )
i 1

n 1

Es una medida de dispersin que tiene en cuenta a todas las observaciones


Se expresa en las unidades de la variable al cuadrado
Obsrvese que ( x x ) 0
Clculo prctico:

xi
1 n 2 i 1
2
s
xi n
n 1 i 1

14

B 1

B B 2

Estadstica descriptiva - 29

ESTADSTICA DESCRIPTIVA

Resmenes: 2.4

Medidas
Medidasdescriptivas:
descriptivas:medidas
medidasde
dedispersin
dispersin
- Caso con datos agrupados:
x

x1 xk

f1 f k n

s2

i 1

- Ejemplos:

f i ( xi x )
n 1

n

f
x
n
i i
1
2

f i x i i 1 n
n 1 i 1

(a)

4 6 8 10
1
xi : 4, 6,8,10 x 7; s 42 62 82 102
3
4

(b)

xi
fi

s2

4 6 8 10
1 4 3 2

6.667

n=10

2
(1)(4) (4)(6) (3)(8) (2)(10) 3.733
1
(1)(42 ) (4)(62 ) (3)(82 ) (2)(102 )

10 1
10

3.-Desviacin tpica:

s s2

Es una medida de dispersin que tiene en cuenta a todas las observaciones


Se expresa en las mismas unidades que la variable

B 1

B B 2

Estadstica descriptiva - 30

ESTADSTICA DESCRIPTIVA

Resmenes: 2.4

Obtencin
Obtencinde
dela
lavarianza
varianzayydesviacin
desviacintpica
tpica
[A]

xmin

A xmax xmin

xmax

xmin

A xmax xmin

xmax

[B]

En
Encul
culde
deestas
estasdos
dosdistribuciones
distribucioneshay
haymas
masdispersin?
dispersin?
La amplitud es la misma en las dos, sin embargo es obvio que en B los datos estn mas
agrupados, son mas homogneos.
El problema del rango es que solo considera a las dos observaciones mas extremas; no
tiene en cuenta al resto
Es
Esnecesario
necesarioencontrar
encontraruna
unamedida
medidaque
querefleje
reflejelalaheterogeneidad,
heterogeneidad,oo
dispersin,
de
los
datos
pero
considerndolos
a
todos,
dispersin, de los datos pero considerndolos a todos,yyno
nosolo
soloaalos
los
dos
extremos
dos extremos

15

B 1

B B 2

Estadstica descriptiva - 31

ESTADSTICA DESCRIPTIVA

x1

xi

Resmenes: 2.4

x2

d 1 x1 x

d 2 x2 x

d i xi x

Podemos tomar una medida de referencia, por ejemplo la media aritmtica, y calcular
la distancia de cada observacin a dicha referencia. Una posible medida de dispersin
es la media de estas distancias:

d x x

d
El problema es que

x x 0

siempre (por qu?)

Soluciones para evitar las distancias negativas:


1. Tomar valores absolutos problemtico! (aunque parezca lo contrario)
2. Elevar las distancias al cuadrado: da lugar a la varianza:

2
i

x x

B 1

B B 2

Estadstica descriptiva - 32

ESTADSTICA DESCRIPTIVA

xi

x1

Resmenes: 2.4

x2

d 1 x1 x

d 2 x2 x

d i xi x

Por razones que veremos despus conviene corregir este promedio tomando en el
denominador no n sino n-1. En adelante siempre lo haremos as, de forma que la
varianza resulta

x x

n 1

El problema de la varianza como medida de dispersin es que sus unidades son las de
la variable pero al cuadrado. Por ejemplo si x son centmetros (unidad de longitud)
entonces la varianza son cm2 (unidad de superficie). Para expresar la dispersin en
las mismas unidades de la variable se considera entonces su raz cuadrada, que es la
desviacin tpica o estndar

s s2
16

B 1

B B 2

Estadstica descriptiva - 33

ESTADSTICA DESCRIPTIVA

Resmenes: 2.4

Medidas
Medidasdescriptivas:
descriptivas:medidas
medidasde
dedispersin
dispersin

4.-Coeficiente de variacin:

s
CV 100%
x

Se utiliza para comparar mtodos de medida


Es una medida que tiene en cuenta a todas las observaciones
Es adimensional y no depende de las unidades de medida
Se expresa en %
Cuanto menor es el CV, mayor es la precisin del mtodo
Ejemplo: CV=10% indica que por cada 100 unidades de medida, el
mtodo comete un error, medido en desviaciones tpicas, de 10

17

También podría gustarte