Documentos de Académico
Documentos de Profesional
Documentos de Cultura
http://www.colegiovirgendegracia.org/eso/dmate.htm
ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva
1. ESTADSTICA DESCRIPTIVA.
1.1. Introduccin.
En general, cuando se va a estudiar un determinado colectivo, se suele tener un gran conjunto
de datos y nmeros que nos informan sobre el mismo y que suelen ser, por s mismos, poco
transparentes y/o nos proporcionan una informacin que no somos capaces de interpretar. Es
necesario, por tanto, poder digerirlas y procesarlas de una manera fcil y asequible. En este sentido,
la Estadstica va a ser el conjunto de procedimientos y mtodos que, entre otras cosas, nos van a
solucionar este problema.
La palabra estadstica se utiliza, principalmente, bajo dos significados distintos:
a) Como coleccin de datos numricos (se sobreentiende que estn presentados de manera
ordenada y sistemtica): Esta primera acepcin, que tiene orgenes histricos y es el significado
ms coloquial, se encuentra bastante arraigada en la sociedad actual ya que nos encontramos
inmersos en un mundo de cifras tales como datos de series sobre el PIB (producto interior bruto),
tasa de inflacin, cotizaciones burstiles,... que llenan los medios de comunicacin y, por tanto,
impregnan nuestras referencias personales.
b) Como ciencia: Adems de facilitar los mtodos precisos para la obtencin de la
informacin numrica de base, proporciona mtodos objetivos de anlisis de dicha informacin y,
en general, mtodos de investigacin aplicables al resto de las ciencias. Esta irrupcin de la
Estadstica en el mbito de las ciencias en general, es un fenmeno relativamente reciente pero de
enorme vigor.
En este sentido, la ciencia Estadstica estudia el comportamiento de los fenmenos de masa
y pretende obtener las regularidades que se dan en dichos fenmenos para, adems de describirlos,
utilizarlos con fines de prediccin. As, la Estadstica tiene como primer objetivo indicar los
mtodos de recogida y agrupamiento de datos, como segundo el anlisis de dichos datos en funcin
de los propsitos de la investigacin y, por ltimo, su utilizacin con fines de prediccin en algunas
circunstancias.
La Estadstica matemtica naci en el s. XVII y se forma al mismo tiempo que la Teora de
la Probabilidad. Su desarrollo se debe a matemticos como Gauss, Gosset, Tchebyschev, Markov,
Fisher, Kolmogorov, Pearson, Neyman y otros.
Departamento de Matemticas
http://www.colegiovirgendegracia.org/eso/dmate.htm
ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva
Departamento de Matemticas
http://www.colegiovirgendegracia.org/eso/dmate.htm
ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva
Podemos observar ahora otra distincin fundamental entre variables y atributos: si los
caracteres vienen descritos mediante variables, los elementos de la poblacin se pueden ordenar de
menor a mayor segn los valores que toma la variable, es decir, existe una jerarquizacin natural de
los elementos de la poblacin. En cambio, sta no siempre es posible en los atributos.
Ahora bien, normalmente en un estudio estadstico, no se puede trabajar con todos los
elementos de la poblacin porque es muy costoso temporal o econmicamente, por lo que se realiza
sobre un subconjunto de la misma. Este subconjunto puede ser una muestra, cuando se toma un
determinado nmero de elementos de la poblacin sin que, en principio, tengan nada en comn; o
una subpoblacin, que es el subconjunto de la poblacin formado por los elementos de la misma
que comparten una determinada caracterstica (p.e. de los alumnos del centro la subpoblacin
formada por los alumnos de 3 ESO, o la subpoblacin de los varones).
Una vez seleccionados los caracteres que van a ser objeto del estudio estadstico, se procede
a observarlos en los elementos de la poblacin, subpoblacin o muestra. Si se trata de una variable
habr que medir el valor numrico que toma en cada elemento y, si es un atributo, habr que
clasificar a cada elemento en su modalidad correspondiente.
As pues, las etapas de todo estudio estadstico son:
1. PLANIFICACIN.
a) Definicin de OBJETIVOS.
b) Definicin de la POBLACIN y/o MUESTRA.
c) Definicin de las CARACTERSTICAS que se van a estudiar.
d) Descripcin de los posibles DATOS que se pueden obtener.
2. EJECUCIN.
a) Recoleccin de los datos.
b) Organizacin de los datos.
c) Descripcin, anlisis e interpretacin de los datos.
3. CONCLUSIN.
Y, a su vez, podemos considerar dos fases:
1. Estadstica descriptiva o deductiva, que trata del recuento, ordenacin y clasificacin de
los datos obtenidos por las observaciones. Se construyen tablas y se representan grficos,
se calculan parmetros estadsticos que caracterizan la distribucin, etc.
2. Estadstica inferencial o inductiva, que establece previsiones y conclusiones sobre una
poblacin a partir de los resultados obtenidos de una muestra. Se apoya fuertemente en el
clculo de probabilidades.
Departamento de Matemticas
http://www.colegiovirgendegracia.org/eso/dmate.htm
ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva
Ejercicio.
Indica si los siguientes caracteres son cualitativos o cuantitativos, y en caso de ser
variables, si son discretas o continuas:
Nmero de nacidos en un da.
Grupo sanguneo de una persona.
Tiempo que se necesita para resolver un problema.
Nmero de preguntas de un examen.
Temperatura de una persona.
Partido poltico votado en las ltimas elecciones.
Nmero de goles marcados por un jugador en una temporada.
1.3. Distribucin de frecuencias.
Aunque hoy en da, si se realiza un estudio estadstico importante esta tarea la realiza el
ordenador, ya sea por medio de programas de estadstica especficos BMDP, SPSS,
STATGRAFICS o bien utilizando herramientas informticas de propsito general como Bases de
Datos u Hojas de Clculo. En casos sencillos podemos realizarlo manualmente, utilizando diversas
tcnicas para ir anotando puntuaciones:
(A) La frecuencia absoluta de una modalidad xi es el nmero de veces que aparece en el estudio
dicho valor. La representaremos por ni .
Propiedad.
La suma de las frecuencias absolutas de todas las modalidades es el nmero total de
elementos que tiene la poblacin o muestra.
Tiene la ventaja de que siempre ser un nmero natural, por lo que resulta muy cmoda para
realizar clculos, pero tiene el inconveniente de que no podemos utilizarla para comparar, puesto
que sus valores dependen del tamao total de la poblacin o muestra y ste no aparece en ella.
Adems, si la utilizamos para hacer clculos, debemos recordar que al final tenemos que dividir por
el nmero total de individuos.
(B) La frecuencia relativa de una modalidad xi es la proporcin o divisin entre el nmero de
veces que aparece dicho valor y el tamao de la poblacin o muestra. La representaremos por fi y
se calcula:
Propiedad.
ni
.
n
La suma de las frecuencias relativas de todas las modalidades es 1.
fi =
Departamento de Matemticas
http://www.colegiovirgendegracia.org/eso/dmate.htm
ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva
Tiene la ventaja de que, cuando realizamos los clculos, obtenemos el resultado deseado
directamente, aunque las operaciones sean menos cmodas al ser con fracciones o decimales (es
ms recomendable, por exactitud, utilizar fracciones, sobre todo cuando no son decimales exactos).
Tambin podemos hablar de frecuencias acumuladas, pero siempre y cuando estemos
trabajando con una variable estadstica o un atributo ordenable. En otro caso no tiene mucho sentido
el clculo de estas frecuencias ya que variaran en el momento en que cambiemos el orden de los
datos.
(C) La frecuencia absoluta acumulada de una modalidad
Ni
.
n
Ejemplo 1.
Departamento de Matemticas
ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva
http://www.colegiovirgendegracia.org/eso/dmate.htm
Ejemplo 2.
Las notas en un examen de Matemticas de los alumnos de 3 A ESO del Colegio
Virgen de Gracia de Granada (Espaa) han sido las siguientes:
5 3 4 1 2 8 9 8 7 6 6 7 9 8 7 7 1 0 1 5 9 9 8 0 8 8 8 9 5 7
Ejemplo 3.
Xi
ni
fi
Ni
Fi
0
1
2
3
4
5
6
7
8
9
2
3
1
1
1
3
2
5
7
5
30
2/30
3/30
1/30
1/30
1/30
3/30
2/30
5/30
7/30
5/30
1
2
5
6
7
8
11
13
18
25
30
2/30
5/30
6/30
7/30
8/30
11/30
13/30
18/30
25/30
30/30
ni
fi
Nokia
Motorola
Siemens
3
1
2
6
3/6
1/6
2/6
1
Existen diferentes tipos de grficos estadsticos. Algunos slo se pueden utilizar con un tipo
de caracter, pero otros se pueden utilizar independientemente de cmo sea el mismo. En cualquier
caso, existe un tipo de representacin que se suele utilizar ms con cada tipo de caracter.
La representacin ms tpica asociada a una variable estadstica discreta recibe el nombre de
sea su frecuencia absoluta (o relativa):
Frecuencias absolutas
diagrama de barras y consiste en levantar, para cada valor xi de la variable, una barra cuya altura
8
6
4
2
0
0
Notas
Departamento de Matemticas
ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva
http://www.colegiovirgendegracia.org/eso/dmate.htm
17%
10%
3%
3%
3%
23%
10%
7%
0
1
2
3
4
5
6
7
8
9
Nokia
33%
50%
Motorola
17%
Siemens
17%
Departamento de Matemticas
ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva
http://www.colegiovirgendegracia.org/eso/dmate.htm
hi =
ni
, que sirve para que en la representacin grfica podamos reconocer a la modalidad
ai
Ejemplo 4.
Si a un grupo de 30 alumnos les preguntamos el dinero (en pesetas) que en ese momento
llevan encima, nos encontramos con los siguientes datos:
450 1152 250 300 175
5
180
80
25
100
205
1100
985 185
125
315
425
560
Evidentemente, la variable estadstica tiene un recorrido muy grande, 4998 pesetas, por lo
que s queremos hacer una tabla con estos datos tendremos que tomar intervalos. Para decidir la
amplitud de los intervalos, necesitaremos decidir cuntos queremos. Normalmente se suele trabajar
con no ms de 10 12 (si es posible menos, mejor; aunque cuantos menos haya ms informacin se
pierde). As pues, amplitud = 4998/10 = 499,8, por lo que tomaremos intervalos de amplitud 500.
Departamento de Matemticas
ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva
http://www.colegiovirgendegracia.org/eso/dmate.htm
[ Li 1 , Li [
[0, 500[
[500, 1000[
[1000, 1500[
[1500, 2000[
[ 2000, 2500[
[ 2500, 3000[
[ 3000, 3500[
[ 3500, 4000[
[ 4000, 4500[
[ 4500, 5000[
[5000, 5500[
ai
Xi
ni
fi
Ni
Fi
500
250
16
16/30
0,53
53%
16
16/30
0,53
53%
500
750
6/30
0,2
20%
22
22/30
0,73
73%
500
1250
3/30
0,1
10%
25
25/30
0,83
83%
500
1750
2/30
0,07
7%
27
27/30
0,90
90%
500
2250
1/30
0,03
3%
28
28/30
0,93
93%
500
2750
1/30
0,03
3%
29
29/30
0,96
96%
500
3250
0/30
0%
29
29/30
0,96
96%
500
3750
0/30
0%
29
29/30
0,96
96%
500
4250
0/30
0%
29
29/30
0,96
96%
500
4750
0/30
0%
29
29/30
0,96
96%
500
5250
1/30
0,03
3%
30
30/30
0,99
99%
30
100%
18
16
14
12
10
8
6
4
2
0
250
750
1250
1750
2250
2750
3250
3750
4250
4750
5250
Departamento de Matemticas
ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva
http://www.colegiovirgendegracia.org/eso/dmate.htm
Ejercicio.
NOMBRE:
CARACTER:
NOMBRE:
CARACTER:
NOMBRE:
CARACTER:
NOMBRE:
CARACTER:
NOMBRE:
CARACTER:
NOMBRE:
CARACTER:
10
Departamento de Matemticas
http://www.colegiovirgendegracia.org/eso/dmate.htm
ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva
Por otra parte, dependiendo del criterio que utilicemos para obtener esos parmetros,
tenemos diferentes tipos de medidas:
De posicin:
Nos permiten clasificar, de alguna forma los elementos de la poblacin o muestra:
percentiles, deciles, cuartiles y mediana.
Dentro de stas se pueden considerar las medidas de posicin central, que sirven
para ver en torno a qu valores se concentra la variable: moda, mediana y media.
De dispersin:
Nos dan una idea sobre la representatividad de las medidas centrales (a mayor
dispersin, menor representatividad): recorrido, desviacin media, varianza, desviacin
tpica.
De simetra:
Sirven para ver si la distribucin tiene el mismo comportamiento por encima y por
debajo de los valores centrales.
De forma:
Comparan la forma de la distribucin con la forma de la distribucin Normal, que es
la que se toma como referencia.
En general, los parmetros slo se podrn calcular en el caso de variables, exceptuando la
moda, que tambin se puede hallar para todos los atributos, y la mediana, que se puede calcular en
los atributos ordenables.
1.5.1. MEDIDAS DE POSICIN CENTRAL.
Las medidas de posicin central resumen los datos. Segn el criterio que se utilice para
hacer dicho resumen, tenemos distintos tipos de medidas:
-Si N es par, hay dos trminos centrales X n y X n , y la mediana ser la media de los dos.
+1
2
2
11
Departamento de Matemticas
ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva
http://www.colegiovirgendegracia.org/eso/dmate.htm
Ejemplo 6.
n=12 par
n=13 Impar
1,4,6,7,8,9,12,16,20,24,25,27
1,4,6,7,8,9,12,16,20,24,25,27,30
Trminos centrales: el 6 y 7 9 y 12
Me =
Trmino central: el 7 12
9 + 12
= 10, 5
2
M e = 12
Moda: Es el valor M o de la variable que ms se repite, es decir, que tiene mayor frecuencia.
Puede haber ms de una moda: si hay dos la distribucin se dice que es bimodal y, en general,
si hay ms de dos se dice que es plurimodal.
Es la nica medida de centralizacin que tiene sentido estudiar en una variable cualitativa o
atributo, pues no precisa la realizacin de ninguna cuenta.
Ejemplo 7.
Xi
ni
Ni
55
65 10 16
n3 = 19 mayor frecuencia
75 19 35
M o = x3 = 75
85 11 46
95
4 50
50
Media: La media aritmtica de una variable es la suma de los productos de los valores de la
variable por sus frecuencias relativas correspondientes. Si la variable es continua,
consideraremos las marcas de clase como valores de la misma.
Otra vez en el mismo ejemplo anterior:
[ Li 1 , Li [
[ 45, 55[
[55, 65[
[65,75[
[75, 85[
[85, 95[
xi
ni
fi
xi f i
50
6/50
300/50
60 10 10/50
600/50
70 19 19/50 1330/50
80 11 11/50
880/50
90
4/50
360/50
50
3470/50
x=
3470
= 69 ' 4
50
12
Departamento de Matemticas
http://www.colegiovirgendegracia.org/eso/dmate.htm
ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva
La ventaja de la desviacin es que tiene las mismas unidades que la media (cosa que la varianza
no cumple al elevar las desviaciones al cuadrado). Por tanto es ms fcil de interpretar: cuanto ms
prxima a cero est, ms representativa ser la media.
Este parmetro es adimensional (no tiene unidades, ya que la desviacin tpica y la media
tienen las mismas) y es muy til para comparar dos poblaciones distintas. Adems, tambin es
mejor utilizarlo para interpretar la bondad de la media cuando los datos tienen un recorrido muy
amplio: cuanto ms prximo a cero se encuentre, mejor ser la media.
13
Departamento de Matemticas
ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva
http://www.colegiovirgendegracia.org/eso/dmate.htm
Ejemplo I:
ni
350
150
50
250
100
7/18
1/6
1/18
5/18
1/9
900
fi
0,39
0,17
0,06
0,28
0,11
39%
17%
6%
28%
11%
360 fi
140
60
20
100
40
360
Pictograma 1:
Pictograma 2:
14
Departamento de Matemticas
ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva
http://www.colegiovirgendegracia.org/eso/dmate.htm
Diagrama de sectores:
11%
Francia
38%
Alemania
Inglaterra
28%
Italia
6%
Otros
17%
Diagrama de barras:
400
350
300
250
200
150
100
50
0
Francia
Alemania
Inglaterra
Italia
Otros
Parmetros estadsticos:
Si el atributo fuera ordenable, se podran calcular tambin las medidas de posicin, aunque la
nica que tendra un significado ms concreto sera la mediana.
15
Departamento de Matemticas
ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva
http://www.colegiovirgendegracia.org/eso/dmate.htm
Ejemplo II:
CARACTER CUANTITATIVO DISCRETO o VARIABLE DISCRETA.
X = n de accidentes automovilsticos diarios registrados durante Diciembre y Enero de 1995.
Poblacin = vehculos que circulaban por el casco urbano de Granada (Espaa).
Tabla:
xi 2 fi xi x
( x x) ( x x) f
2
Ni
xi fi
xi 2
0,06
0,00
0,00
0,00
-4,16
17,31
1,12
23
1/31
0,03
0,03
1,00
0,03
-3,16
9,99
0,32
12
3/31
0,10
12
0,19
4,00
0,39
-2,16
4,67
0,45
35
10
5/31
0,16
22
0,48
9,00
1,45
-1,16
1,35
0,22
58
7/62
0,11
29
0,45
16,00
1,81
-0,16
0,03
0,00
41
16
8/31
0,26
45
1,29
25,00
6,45
0,84
0,71
0,18
93
14
7/31
0,23
59
1,35
36,00
8,13
1,84
3,39
0,77
81
1/31
0,03
61
0,23
49,00
1,58
2,84
8,07
0,26
12
1/62
0,02
62
0,13
64,00
1,03
3,84
14,75
0,24
3,56
360
xi
ni
2/31
fi
62
1,00
4,16
20,87
360 fi
Diagrama de barras:
18
16
14
12
10
8
6
4
2
0
0
16
Departamento de Matemticas
ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva
http://www.colegiovirgendegracia.org/eso/dmate.htm
Diagrama de sectores:
3%2% 6% 3%
23%
10%
16%
26%
11%
0
1
2
3
4
5
Parmetros estadsticos:
Media: x =
Recorrido = 8 0 = 8
n 62
=
= 31
2 2
258
= 4 ' 16
62
1294 258
1294 62 258 2 13664
=
=
3 ' 55
62 62
62 2
3844
2
Varianza: = 3 ' 56 2 =
2
Coeficiente de variacin: CV =
1 ' 88
0 ' 45
4 ' 16
17
Departamento de Matemticas
ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva
http://www.colegiovirgendegracia.org/eso/dmate.htm
Ii
ai
xi
ni
fi
Ni
hi
360 fi xi fi
xi 2
xi 2 f i
0,5
0,5
0,75
1/20
0,05
6,00
18,0
0,04
0,56
0,03
1,5
0,5
1,25
2/15
0,13
11
16,00
48,0
0,17
1,56
0,21
1,5
0,5
1,75
12
1/5
0,20
23
24,00
72,0
0,35
3,06
0,61
2,5
20
1/3
0,33
43
20,00
120,0
0,83
6,25
2,08
10
1/6
0,17
53
5,00
60,0
0,67 16,00
2,67
10
7,5
7/60
0,12
60
1,40
42,0
0,88 56,25
6,56
360,0
2,94
12,16
60
1,00
20
15
10
0,5
1,5
10
18
Departamento de Matemticas
ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva
http://www.colegiovirgendegracia.org/eso/dmate.htm
Parmetros estadsticos:
Intervalo modal:
Intervalo mediano:
Media: x = 2, 94
Coeficiente de variacin: CV =
n 60
=
= 30
2 2
1'9
0 ' 65
2 ' 94
1.7. EJERCICIOS.
1. Sea X la puntuacin de los alumnos de la clase de 3 B de ESO del colegio Virgen de Gracia
de Granada (Espaa) en un examen de Matemticas, que toma los valores siguientes:
0, 0, 1, 2, 2, 3, 4, 5, 5, 5, 5, 6, 6, 7, 7, 7, 7, 8, 9, 9
Indicar cul es la poblacin.
Indicar cul es el nmero de elementos de la poblacin.
Indicar qu tipo de variable estadstica es X.
Elaborar una tabla que recoja los datos anteriores junto con las frecuencias.
Completar la tabla anterior con las columnas necesarias para calcular las medidas de
posicin central y de dispersin de la variable X.
f. Elaborar todas las representaciones grficas posibles que correspondan a la
distribucin de la variable estadstica X.
a.
b.
c.
d.
e.
19
Departamento de Matemticas
ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva
http://www.colegiovirgendegracia.org/eso/dmate.htm
2. Sea X el nmero de aparatos de telfono por familia en el bloque de vecinos de la calle Pedro
Antonio de Alarcn n 40 de Granada (Espaa) a fecha marzo de 1998, que toma los siguientes
valores:
Xi
0 1 2
ni
4 2 6 15 8 15
a.
b.
c.
d.
Xi
ni
a.
b.
c.
d.
e.
4. Sea X la cantidad, en decenas de euros, gastada los fines de semana en salidas por los alumnos
del tercer curso de la Facultad de Derecho de la Universidad de Granada (Espaa):
Ii
ai
xi
ni
[ 0 , 2[
[ 2, 4 [
[ 4, 6[
11
[ 6 , 8[
[8, 10[
Ni
fi
Fi
hi = ni / ai
20
Departamento de Matemticas
ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva
http://www.colegiovirgendegracia.org/eso/dmate.htm
40
30
20
10
10
14
18
22
26
30
21
Departamento de Matemticas
http://www.colegiovirgendegracia.org/eso/dmate.htm
ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva
a.
b.
c.
d.
e.
22
Departamento de Matemticas
ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva
http://www.colegiovirgendegracia.org/eso/dmate.htm
Ii
ai
xi
ni
Ni
fi
[ 0 , 2[
7 25
[ 2, 4[
2 25
[ 4, 6[
2 5
[ 6 , 8[
1 25
[8, 10[
15
Fi
hi = ni / ai
Xi
Ni
14
20
10 35
23
Departamento de Matemticas
ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva
http://www.colegiovirgendegracia.org/eso/dmate.htm
Xi
Fi
Albino
4 30
Rubio
11 30
Castao
13 30
Negro
22 30
Otros
30 30
1.8. BIBLIOGRAFA.
24