Está en la página 1de 24

Departamento de Matemticas

http://www.colegiovirgendegracia.org/eso/dmate.htm

ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva

1. ESTADSTICA DESCRIPTIVA.

1.1. Introduccin.
En general, cuando se va a estudiar un determinado colectivo, se suele tener un gran conjunto
de datos y nmeros que nos informan sobre el mismo y que suelen ser, por s mismos, poco
transparentes y/o nos proporcionan una informacin que no somos capaces de interpretar. Es
necesario, por tanto, poder digerirlas y procesarlas de una manera fcil y asequible. En este sentido,
la Estadstica va a ser el conjunto de procedimientos y mtodos que, entre otras cosas, nos van a
solucionar este problema.
La palabra estadstica se utiliza, principalmente, bajo dos significados distintos:
a) Como coleccin de datos numricos (se sobreentiende que estn presentados de manera
ordenada y sistemtica): Esta primera acepcin, que tiene orgenes histricos y es el significado
ms coloquial, se encuentra bastante arraigada en la sociedad actual ya que nos encontramos
inmersos en un mundo de cifras tales como datos de series sobre el PIB (producto interior bruto),
tasa de inflacin, cotizaciones burstiles,... que llenan los medios de comunicacin y, por tanto,
impregnan nuestras referencias personales.
b) Como ciencia: Adems de facilitar los mtodos precisos para la obtencin de la
informacin numrica de base, proporciona mtodos objetivos de anlisis de dicha informacin y,
en general, mtodos de investigacin aplicables al resto de las ciencias. Esta irrupcin de la
Estadstica en el mbito de las ciencias en general, es un fenmeno relativamente reciente pero de
enorme vigor.
En este sentido, la ciencia Estadstica estudia el comportamiento de los fenmenos de masa
y pretende obtener las regularidades que se dan en dichos fenmenos para, adems de describirlos,
utilizarlos con fines de prediccin. As, la Estadstica tiene como primer objetivo indicar los
mtodos de recogida y agrupamiento de datos, como segundo el anlisis de dichos datos en funcin
de los propsitos de la investigacin y, por ltimo, su utilizacin con fines de prediccin en algunas
circunstancias.
La Estadstica matemtica naci en el s. XVII y se forma al mismo tiempo que la Teora de
la Probabilidad. Su desarrollo se debe a matemticos como Gauss, Gosset, Tchebyschev, Markov,
Fisher, Kolmogorov, Pearson, Neyman y otros.

Departamento de Matemticas
http://www.colegiovirgendegracia.org/eso/dmate.htm

ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva

1.2. Poblacin: elementos y caracteres.


Toda investigacin estadstica va a estar referida a un conjunto o coleccin de elementos
(personas, cosas,...) que tienen una o varias caractersticas en comn y que lo definen. Dicho
conjunto recibe el nombre de poblacin y cada uno de los elementos que la forman se llama
elemento o individuo. Hay que tener en cuenta dos cosas: la poblacin puede ser finita o infinita,
dependiendo del nmero de individuos que la formen, y dichos elementos pueden tener existencia
real (coche, casa,...) o referirse a algo ms abstracto (intervalo de tiempo, votos,...). Tambin es
muy importante tener perfectamente bien definida la poblacin, de forma que en todo momento
tengamos claro si un individuo forma parte de la misma o no.
Los elementos de la poblacin presentan ciertas propiedades o caractersticas que se
conocen con el nombre de caracteres (altura; color de pelo,...) que a su vez se subdividen o
presentan diferentes modalidades (185 cm, 205 cm; rubio, moreno,...). Los caracteres se pueden
clasificar en:
(A) Caracteres cuantitativos o variables: son aquellos cuyas modalidades son medibles, es
decir, se pueden describir numricamente (peso, nmero de hermanos,...). Las modalidades son los
distintos valores que puede tomar la variable (65 kg, 80 kg, 91 kg,...; 2, 3, 4,...).
A su vez hay dos tipos de variables estadsticas:
a.1.) Variables discretas: los valores que toma la variable son aislados, es decir, no
tienen sentido los valores intermedios a dos cualesquiera. Por ejemplo, la variable
nmero de hermanos puede tomar los valores 0,1,2,3,4, pero no tiene sentido
que haya 27 hermanos.
a.2.) Variables continuas: la variable toma valores dentro de un intervalo, por
ejemplo, la variable puede tomar los valores 1 y 2 pero tambin los valores 1'5, 1'01,
1'89874,...; en general, cualquier valor comprendido entre 1 y 2: intervalo [1,2].
(B) Caracteres cualitativos o atributos: son aquellos cuyas modalidades se refieren a
cualidades de los individuos, por lo que no son medibles, es decir, expresables numricamente
(color de ojos, marcas de coches,...). Las modalidades vienen descritas por palabras (azules,
marrones, negro,...; Opel, Seat,...).
A su vez hay dos tipos de atributos:
b.1.) Ordenables: Aquellas que tienen una ordenacin objetiva. Por ejemplo: la
graduacin militar, el nivel de estudios, los meses del ao, las calificaciones de una
asignatura (SB, NT, BI, SF, IN),
b.2.) No ordenables: Aquellas que slo admiten una ordenacin alfabtica, pero ninguna
ordenacin por su naturaleza. Por ejemplo: el color de pelo, el estado civil,

Departamento de Matemticas
http://www.colegiovirgendegracia.org/eso/dmate.htm

ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva

Podemos observar ahora otra distincin fundamental entre variables y atributos: si los
caracteres vienen descritos mediante variables, los elementos de la poblacin se pueden ordenar de
menor a mayor segn los valores que toma la variable, es decir, existe una jerarquizacin natural de
los elementos de la poblacin. En cambio, sta no siempre es posible en los atributos.
Ahora bien, normalmente en un estudio estadstico, no se puede trabajar con todos los
elementos de la poblacin porque es muy costoso temporal o econmicamente, por lo que se realiza
sobre un subconjunto de la misma. Este subconjunto puede ser una muestra, cuando se toma un
determinado nmero de elementos de la poblacin sin que, en principio, tengan nada en comn; o
una subpoblacin, que es el subconjunto de la poblacin formado por los elementos de la misma
que comparten una determinada caracterstica (p.e. de los alumnos del centro la subpoblacin
formada por los alumnos de 3 ESO, o la subpoblacin de los varones).
Una vez seleccionados los caracteres que van a ser objeto del estudio estadstico, se procede
a observarlos en los elementos de la poblacin, subpoblacin o muestra. Si se trata de una variable
habr que medir el valor numrico que toma en cada elemento y, si es un atributo, habr que
clasificar a cada elemento en su modalidad correspondiente.
As pues, las etapas de todo estudio estadstico son:
1. PLANIFICACIN.
a) Definicin de OBJETIVOS.
b) Definicin de la POBLACIN y/o MUESTRA.
c) Definicin de las CARACTERSTICAS que se van a estudiar.
d) Descripcin de los posibles DATOS que se pueden obtener.
2. EJECUCIN.
a) Recoleccin de los datos.
b) Organizacin de los datos.
c) Descripcin, anlisis e interpretacin de los datos.
3. CONCLUSIN.
Y, a su vez, podemos considerar dos fases:
1. Estadstica descriptiva o deductiva, que trata del recuento, ordenacin y clasificacin de
los datos obtenidos por las observaciones. Se construyen tablas y se representan grficos,
se calculan parmetros estadsticos que caracterizan la distribucin, etc.
2. Estadstica inferencial o inductiva, que establece previsiones y conclusiones sobre una
poblacin a partir de los resultados obtenidos de una muestra. Se apoya fuertemente en el
clculo de probabilidades.

Departamento de Matemticas
http://www.colegiovirgendegracia.org/eso/dmate.htm

ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva

Ejercicio.
Indica si los siguientes caracteres son cualitativos o cuantitativos, y en caso de ser
variables, si son discretas o continuas:
Nmero de nacidos en un da.
Grupo sanguneo de una persona.
Tiempo que se necesita para resolver un problema.
Nmero de preguntas de un examen.
Temperatura de una persona.
Partido poltico votado en las ltimas elecciones.
Nmero de goles marcados por un jugador en una temporada.
1.3. Distribucin de frecuencias.
Aunque hoy en da, si se realiza un estudio estadstico importante esta tarea la realiza el
ordenador, ya sea por medio de programas de estadstica especficos BMDP, SPSS,
STATGRAFICS o bien utilizando herramientas informticas de propsito general como Bases de
Datos u Hojas de Clculo. En casos sencillos podemos realizarlo manualmente, utilizando diversas
tcnicas para ir anotando puntuaciones:

(A) La frecuencia absoluta de una modalidad xi es el nmero de veces que aparece en el estudio
dicho valor. La representaremos por ni .
Propiedad.
La suma de las frecuencias absolutas de todas las modalidades es el nmero total de
elementos que tiene la poblacin o muestra.
Tiene la ventaja de que siempre ser un nmero natural, por lo que resulta muy cmoda para
realizar clculos, pero tiene el inconveniente de que no podemos utilizarla para comparar, puesto
que sus valores dependen del tamao total de la poblacin o muestra y ste no aparece en ella.
Adems, si la utilizamos para hacer clculos, debemos recordar que al final tenemos que dividir por
el nmero total de individuos.
(B) La frecuencia relativa de una modalidad xi es la proporcin o divisin entre el nmero de
veces que aparece dicho valor y el tamao de la poblacin o muestra. La representaremos por fi y
se calcula:

Propiedad.

ni
.
n
La suma de las frecuencias relativas de todas las modalidades es 1.

fi =

Departamento de Matemticas
http://www.colegiovirgendegracia.org/eso/dmate.htm

ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva

Tiene la ventaja de que, cuando realizamos los clculos, obtenemos el resultado deseado
directamente, aunque las operaciones sean menos cmodas al ser con fracciones o decimales (es
ms recomendable, por exactitud, utilizar fracciones, sobre todo cuando no son decimales exactos).
Tambin podemos hablar de frecuencias acumuladas, pero siempre y cuando estemos
trabajando con una variable estadstica o un atributo ordenable. En otro caso no tiene mucho sentido
el clculo de estas frecuencias ya que variaran en el momento en que cambiemos el orden de los
datos.
(C) La frecuencia absoluta acumulada de una modalidad

xi es la suma de las frecuencias

absolutas de dicha modalidad y todas las anteriores. La representaremos por N i .


(D) La frecuencia relativa de una modalidad xi es la suma de las frecuencias relativas de dicha
modalidad y todas las anteriores. La representaremos por Fi y se calcula: Fi =

Ni
.
n

1.4. Tablas estadsticas. Representaciones grficas.


Las tablas estadsticas constituyen una parte fundamental de la investigacin ya que en ellas
aparecen reflejados claramente todos los datos obtenidos en la misma y, por tanto, suministran toda
la informacin que se necesita para cubrir los objetivos perseguidos con el estudio. Ahora bien, a
veces es necesario o conveniente traducir la informacin que nos proporciona una tabla estadstica
en un grfico con el fin de hacerla ms patente. No obstante, las representaciones grficas no deben
considerarse como un medio definitivo para extraer conclusiones, sino como un medio auxiliar de la
investigacin estadstica, que es fundamentalmente numrica, y sto siempre que el impacto visual
de la grfica responda a la realidad, para lo cual debemos recurrir a sistemas geomtricos capaces
de describir los datos de manera correcta. En general, las representaciones grficas ms utilizadas se
basan en un sistema de ejes cartesianos donde se representan, en el eje de abscisas los valores que
toma la variable y en el eje de ordenadas las frecuencias con que dichos valores se toman.
1.4.1. Tablas de tipo I.
Corresponden a la situacin en que estudiamos una variable estadstica discreta que toma un
nmero pequeo de valores y, adems, dispone de pocas observaciones. En este caso no se debe
pensar en una tabulacin en sentido estricto de los datos, sino ms bien en una disposicin ordenada
de los mismos. No tiene sentido disponerlos de forma grfica.

Ejemplo 1.

Puntuaciones de los 20 alumnos de una clase en un examen de Matemticas:


0, 0, 1, 2, 2, 3, 4, 5, 5, 5, 5, 6, 6, 7, 7, 7, 7, 8, 9, 9

Departamento de Matemticas

ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva

http://www.colegiovirgendegracia.org/eso/dmate.htm

1.4.2. Tablas de tipo II. Diagramas de barras y sectores. Pictogramas.


Se utilizan en situaciones en las que estudiamos un atributo o una variable estadstica
discreta que toma pocos valores pero, sin embargo, hay muchas observaciones.

Ejemplo 2.
Las notas en un examen de Matemticas de los alumnos de 3 A ESO del Colegio
Virgen de Gracia de Granada (Espaa) han sido las siguientes:
5 3 4 1 2 8 9 8 7 6 6 7 9 8 7 7 1 0 1 5 9 9 8 0 8 8 8 9 5 7

Ejemplo 3.

Xi

ni

fi

Ni

Fi

0
1
2
3
4
5
6
7
8
9

2
3
1
1
1
3
2
5
7
5
30

2/30
3/30
1/30
1/30
1/30
3/30
2/30
5/30
7/30
5/30
1

2
5
6
7
8
11
13
18
25
30

2/30
5/30
6/30
7/30
8/30
11/30
13/30
18/30
25/30
30/30

Las marcas de los mviles de los miembros de una familia son:

Nokia, Siemens, Nokia, Motorota, Nokia, Siemens


Xi

ni

fi

Nokia
Motorola
Siemens

3
1
2
6

3/6
1/6
2/6
1

Existen diferentes tipos de grficos estadsticos. Algunos slo se pueden utilizar con un tipo
de caracter, pero otros se pueden utilizar independientemente de cmo sea el mismo. En cualquier
caso, existe un tipo de representacin que se suele utilizar ms con cada tipo de caracter.
La representacin ms tpica asociada a una variable estadstica discreta recibe el nombre de
sea su frecuencia absoluta (o relativa):

Frecuencias absolutas

diagrama de barras y consiste en levantar, para cada valor xi de la variable, una barra cuya altura
8
6
4
2
0
0

Notas

Departamento de Matemticas

ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva

http://www.colegiovirgendegracia.org/eso/dmate.htm

Las formas ms usadas para representar grficamente un atributo son:


1) Diagrama de sectores: es la representacin ms utilizada y consiste en repartir la superficie total
de un crculo en tantos sectores como modalidades tenga el atributo, de manera que cada sector
tenga rea proporcional a la frecuencia absoluta de dicha modalidad. Si repartimos los 360
proporcionalmente a las frecuencias relativas, el nmero de grados correspondiente a cada
modalidad xi es 360 fi :
7%

17%

10%
3%
3%
3%

23%
10%
7%

0
1
2
3
4
5
6
7
8
9

Nokia

33%
50%

Motorola

17%
Siemens

17%

2) Pictograma: consiste en representar la informacin mediante un dibujo alusivo a la distribucin


que se estudia. Pueden ser de dos tipos:
Pictograma de repeticin: Se asigna un valor a una figura base, y sta se repite tantas
veces como convenga segn la frecuencia de la modalidad.

Pictograma de amplificacin: A cada modalidad se le asigna una nica figura-motivo


con un rea proporcional a la frecuencia de aquella.

Departamento de Matemticas

ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva

http://www.colegiovirgendegracia.org/eso/dmate.htm

1.4.3. Tablas de tipo III. Histogramas.


Cuando el tamao de la poblacin o muestra y la diferencia entre el mayor y el menor valor
de la variable (recorrido) son grandes, es necesario agrupar en intervalos los valores de la misma.
En este tipo de tablas aparecen algunos valores importantes:
-La amplitud de clase es la diferencia entre los extremos del intervalo. No todos los
intervalos tienen que tener la misma amplitud y, caso que no la tengan, se debe aadir una
columna a la tabla, con la densidad de frecuencia (absoluta o relativa) de cada modalidad:

hi =

ni
, que sirve para que en la representacin grfica podamos reconocer a la modalidad
ai

de mayor frecuencia a travs del rea, NO de la altura.


-La marca de clase es el punto medio del intervalo, y es el dato fundamental para realizar
todos los clculos.
Asociada a este tipo de tablas tenemos la representacin grfica llamada histograma, que
consiste en levantar sobre cada intervalo un rectngulo cuya rea sea su frecuencia absoluta o
relativa. Para conseguir que el rea sea la frecuencia, se representa en el eje de ordenadas la
densidad de frecuencia de cada intervalo.
Si consideramos las marcas de cada clase con el valor que el histograma les da a cada una
(altura del rectngulo) y unimos dichos puntos, obtenemos el polgono de frecuencias.

Ejemplo 4.
Si a un grupo de 30 alumnos les preguntamos el dinero (en pesetas) que en ese momento
llevan encima, nos encontramos con los siguientes datos:
450 1152 250 300 175
5

180

80

25

200 675 500 375 1500

2680 605 785 1595 2300 5000 1200

100

205

1100

985 185

125

315

425

560

Evidentemente, la variable estadstica tiene un recorrido muy grande, 4998 pesetas, por lo
que s queremos hacer una tabla con estos datos tendremos que tomar intervalos. Para decidir la
amplitud de los intervalos, necesitaremos decidir cuntos queremos. Normalmente se suele trabajar
con no ms de 10 12 (si es posible menos, mejor; aunque cuantos menos haya ms informacin se
pierde). As pues, amplitud = 4998/10 = 499,8, por lo que tomaremos intervalos de amplitud 500.

Departamento de Matemticas

ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva

http://www.colegiovirgendegracia.org/eso/dmate.htm

[ Li 1 , Li [
[0, 500[

[500, 1000[
[1000, 1500[
[1500, 2000[
[ 2000, 2500[
[ 2500, 3000[
[ 3000, 3500[
[ 3500, 4000[
[ 4000, 4500[
[ 4500, 5000[
[5000, 5500[

ai

Xi

ni

fi

Ni

Fi

500

250

16

16/30

0,53

53%

16

16/30

0,53

53%

500

750

6/30

0,2

20%

22

22/30

0,73

73%

500

1250

3/30

0,1

10%

25

25/30

0,83

83%

500

1750

2/30

0,07

7%

27

27/30

0,90

90%

500

2250

1/30

0,03

3%

28

28/30

0,93

93%

500

2750

1/30

0,03

3%

29

29/30

0,96

96%

500

3250

0/30

0%

29

29/30

0,96

96%

500

3750

0/30

0%

29

29/30

0,96

96%

500

4250

0/30

0%

29

29/30

0,96

96%

500

4750

0/30

0%

29

29/30

0,96

96%

500

5250

1/30

0,03

3%

30

30/30

0,99

99%

30

100%

El histograma correspondiente al ejemplo anterior es:

18
16
14
12
10
8
6
4
2
0
250

750

1250

1750

2250

2750

3250

3750

4250

4750

5250

Departamento de Matemticas

ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva

http://www.colegiovirgendegracia.org/eso/dmate.htm

Ejercicio.

Observa detenidamente los siguientes grficos estadsticos.


a) Indica el nombre de cada una de las representaciones.
b) Indica el tipo de carcter que representan.

NOMBRE:

CARACTER:

NOMBRE:

CARACTER:

NOMBRE:

CARACTER:

NOMBRE:

CARACTER:

NOMBRE:

CARACTER:

NOMBRE:

CARACTER:

1.5. Parmetros estadsticos.


Ya que despus de realizar un estudio estadstico, tenemos una gran cantidad de datos,
tratamos de obtener una serie de medidas numricas que nos permitan, con objetividad y precisin,
tener una visin ms completa del fenmeno estudiado, resumir toda la informacin, comparar
distintas distribuciones, El Estadstico Yule defini algunas propiedades deseables para cualquier
medida estadstica:
1) Debe definirse de manera objetiva: dos observadores distintos deben llegar al mismo
resultado numrico.
2) Usar todas las observaciones y no algunas de ellas solamente, de manera que si vara
alguna observacin, la medida considerada debe reflejar esta variacin.
3) Tener un significado concreto: la interpretacin debe ser inmediata y sencilla
4) Ser sencilla de calcular.
5) Prestarse fcilmente al clculo algebraico, es decir, con las frmulas generales, lo que
permitir demostraciones ms elegantes.
6) Ser poco sensible a las fluctuaciones muestrales. Esta condicin es imprescindible en la
Estadstica Matemtica y en la Teora de Sondeos.

10

Departamento de Matemticas
http://www.colegiovirgendegracia.org/eso/dmate.htm

ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva

Por otra parte, dependiendo del criterio que utilicemos para obtener esos parmetros,
tenemos diferentes tipos de medidas:
De posicin:
Nos permiten clasificar, de alguna forma los elementos de la poblacin o muestra:
percentiles, deciles, cuartiles y mediana.
Dentro de stas se pueden considerar las medidas de posicin central, que sirven
para ver en torno a qu valores se concentra la variable: moda, mediana y media.
De dispersin:
Nos dan una idea sobre la representatividad de las medidas centrales (a mayor
dispersin, menor representatividad): recorrido, desviacin media, varianza, desviacin
tpica.
De simetra:
Sirven para ver si la distribucin tiene el mismo comportamiento por encima y por
debajo de los valores centrales.
De forma:
Comparan la forma de la distribucin con la forma de la distribucin Normal, que es
la que se toma como referencia.
En general, los parmetros slo se podrn calcular en el caso de variables, exceptuando la
moda, que tambin se puede hallar para todos los atributos, y la mediana, que se puede calcular en
los atributos ordenables.
1.5.1. MEDIDAS DE POSICIN CENTRAL.
Las medidas de posicin central resumen los datos. Segn el criterio que se utilice para
hacer dicho resumen, tenemos distintos tipos de medidas:

Mediana: es el valor M e central de la variable, es decir, supuesta la muestra ordenada en


orden creciente o decreciente, el valor que divide en dos partes la muestra.

(A) Clculo de la mediana en el caso discreto:


Depende del tamao N de la poblacin o muestra:

-Si N es impar, hay un trmino central X n + 1 que ser el valor de la mediana.


2

-Si N es par, hay dos trminos centrales X n y X n , y la mediana ser la media de los dos.
+1
2
2

11

Departamento de Matemticas

ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva

http://www.colegiovirgendegracia.org/eso/dmate.htm

Ejemplo 6.
n=12 par

n=13 Impar

1,4,6,7,8,9,12,16,20,24,25,27

1,4,6,7,8,9,12,16,20,24,25,27,30

Trminos centrales: el 6 y 7 9 y 12

Me =

Trmino central: el 7 12

9 + 12
= 10, 5
2

M e = 12

Moda: Es el valor M o de la variable que ms se repite, es decir, que tiene mayor frecuencia.
Puede haber ms de una moda: si hay dos la distribucin se dice que es bimodal y, en general,
si hay ms de dos se dice que es plurimodal.

Es la nica medida de centralizacin que tiene sentido estudiar en una variable cualitativa o
atributo, pues no precisa la realizacin de ninguna cuenta.
Ejemplo 7.
Xi

ni

Ni

55

65 10 16

n3 = 19 mayor frecuencia

75 19 35

M o = x3 = 75

85 11 46
95

4 50
50

Media: La media aritmtica de una variable es la suma de los productos de los valores de la
variable por sus frecuencias relativas correspondientes. Si la variable es continua,
consideraremos las marcas de clase como valores de la misma.
Otra vez en el mismo ejemplo anterior:

[ Li 1 , Li [
[ 45, 55[
[55, 65[
[65,75[
[75, 85[
[85, 95[

xi

ni

fi

xi f i

50

6/50

300/50

60 10 10/50

600/50

70 19 19/50 1330/50
80 11 11/50

880/50

90

4/50

360/50

50

3470/50

x=

3470
= 69 ' 4
50

12

Departamento de Matemticas
http://www.colegiovirgendegracia.org/eso/dmate.htm

ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva

1.5.2. MEDIDAS DE DISPERSIN.


Las medidas de dispersin miden, en general, lo distantes o dispersos que se encuentran los
datos respecto de alguna medida de posicin central. Dado que existen distintos tipos de parmetros
de centralizacin, podemos definir distintas medidas de dispersin, aunque como la medida central
ms utilizada es la media, tendrn especial importancia las medidas que midan la distancia respecto
a la misma.

El recorrido de la variable es la diferencia entre el mayor y el menor valor de la misma.

La varianza 2 es la media de las desviaciones cuadrticas respecto de la media:

o Se calculan las desviaciones o diferencias entre los valores y la media


o Se elevan al cuadrado dichas desviaciones
o Se multiplican por sus frecuencias
o Se suman
Hay que llamar la atencin sobre el hecho de que la varianza de una distribucin siempre es
positiva (suma de sumandos positivos). Esto nos permite, entre otras cosas, definir:

La desviacin tpica es la raz cuadrada de la varianza.

La ventaja de la desviacin es que tiene las mismas unidades que la media (cosa que la varianza
no cumple al elevar las desviaciones al cuadrado). Por tanto es ms fcil de interpretar: cuanto ms
prxima a cero est, ms representativa ser la media.

El coeficiente de variacin es el cociente entre la desviacin tpica y la media: CV =

Este parmetro es adimensional (no tiene unidades, ya que la desviacin tpica y la media
tienen las mismas) y es muy til para comparar dos poblaciones distintas. Adems, tambin es
mejor utilizarlo para interpretar la bondad de la media cuando los datos tienen un recorrido muy
amplio: cuanto ms prximo a cero se encuentre, mejor ser la media.

1.6. Ejemplos resueltos.


Vamos a analizar detenidamente un ejemplo de cada uno de los tipos de caracteres estadsticos
que nos podemos encontrar, y en ellos estudiaremos todo aquello que hemos comentado hasta
ahora, y nos servirn de ejemplos de clculo de las medidas de dispersin que acabamos de definir.

13

Departamento de Matemticas

ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva

http://www.colegiovirgendegracia.org/eso/dmate.htm

Ejemplo I:

CARACTER CUALITATIVO o ATRIBUTO.

X = nmero de vuelos segn nacionalidades.


Poblacin = aviones que aterrizaron en Barajas durante la Semana Santa de 1995.
Tabla:
Xi
Francia
Alemania
Inglaterra
Italia
Otros

ni
350
150
50
250
100

7/18
1/6
1/18
5/18
1/9

900

fi
0,39
0,17
0,06
0,28
0,11

39%
17%
6%
28%
11%

360 fi
140
60
20
100
40

360

Pictograma 1:

Pictograma 2:

14

Departamento de Matemticas

ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva

http://www.colegiovirgendegracia.org/eso/dmate.htm

Diagrama de sectores:

11%

Francia

38%

Alemania
Inglaterra

28%

Italia

6%

Otros

17%

Diagrama de barras:
400
350
300
250
200
150
100
50
0

Francia

Alemania

Inglaterra

Italia

Otros

Parmetros estadsticos:

Slo se puede calcular la moda M o = Francia .

Si el atributo fuera ordenable, se podran calcular tambin las medidas de posicin, aunque la
nica que tendra un significado ms concreto sera la mediana.

15

Departamento de Matemticas

ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva

http://www.colegiovirgendegracia.org/eso/dmate.htm

Ejemplo II:
CARACTER CUANTITATIVO DISCRETO o VARIABLE DISCRETA.
X = n de accidentes automovilsticos diarios registrados durante Diciembre y Enero de 1995.
Poblacin = vehculos que circulaban por el casco urbano de Granada (Espaa).
Tabla:

xi 2 fi xi x

( x x) ( x x) f
2

Ni

xi fi

xi 2

0,06

0,00

0,00

0,00

-4,16

17,31

1,12

23

1/31

0,03

0,03

1,00

0,03

-3,16

9,99

0,32

12

3/31

0,10

12

0,19

4,00

0,39

-2,16

4,67

0,45

35

10

5/31

0,16

22

0,48

9,00

1,45

-1,16

1,35

0,22

58

7/62

0,11

29

0,45

16,00

1,81

-0,16

0,03

0,00

41

16

8/31

0,26

45

1,29

25,00

6,45

0,84

0,71

0,18

93

14

7/31

0,23

59

1,35

36,00

8,13

1,84

3,39

0,77

81

1/31

0,03

61

0,23

49,00

1,58

2,84

8,07

0,26

12

1/62

0,02

62

0,13

64,00

1,03

3,84

14,75

0,24

3,56

360

xi

ni

2/31

fi

62

1,00

4,16

20,87

360 fi

Diagrama de barras:

18
16
14
12
10
8
6
4
2
0
0

16

Departamento de Matemticas

ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva

http://www.colegiovirgendegracia.org/eso/dmate.htm

Diagrama de sectores:

3%2% 6% 3%
23%

10%
16%

26%

11%

0
1
2
3
4
5

Parmetros estadsticos:

Moda: M o = x6 = 5 porque es el valor de la variable con mayor frecuencia n6 = 16

Mediana: M e = x6 = 5 porque es el primer valor de la variable con N 6 = 45 >

Media: x =

Recorrido = 8 0 = 8

n 62
=
= 31
2 2

258
= 4 ' 16
62

1294 258
1294 62 258 2 13664

=
=
 3 ' 55

62 62
62 2
3844
2

Varianza: = 3 ' 56 2 =
2

Desviacin tpica: = 2 = 3 ' 56 = 1 ' 88

Coeficiente de variacin: CV =

1 ' 88
 0 ' 45
4 ' 16

17

Departamento de Matemticas

ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva

http://www.colegiovirgendegracia.org/eso/dmate.htm

Ejemplo III: CARACTER CUANTITATIVO CONTINUO o VARIABLE CONTINUA.


X = cantidad, en cientos de euros, gastada semanalmente en alimentacin durante 1999.
Poblacin = familias que residen en el barrio del Zaidn de Granada (Espaa).
Tabla:

Ii

ai

xi

ni

fi

Ni

hi

360 fi xi fi

xi 2

xi 2 f i

0,5

0,5

0,75

1/20

0,05

6,00

18,0

0,04

0,56

0,03

1,5

0,5

1,25

2/15

0,13

11

16,00

48,0

0,17

1,56

0,21

1,5

0,5

1,75

12

1/5

0,20

23

24,00

72,0

0,35

3,06

0,61

2,5

20

1/3

0,33

43

20,00

120,0

0,83

6,25

2,08

10

1/6

0,17

53

5,00

60,0

0,67 16,00

2,67

10

7,5

7/60

0,12

60

1,40

42,0

0,88 56,25

6,56

360,0

2,94

12,16

60

1,00

Histograma y polgono de frecuencias (absolutas):


hi

20

15

10

0,5

1,5

10

18

Departamento de Matemticas

ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva

http://www.colegiovirgendegracia.org/eso/dmate.htm

Parmetros estadsticos:

Intervalo modal:

I 4 = [ 2, 3[ porque es el intervalo con mayor frecuencia n4 = 20

Intervalo mediano:

I 4 = [ 2, 3[ porque es el primer intervalo con N 4 = 43 >

Media: x = 2, 94

Recorrido = 10 0,5 = 9,5

Varianza: 2 = 12, 16 ( 2, 94 )  3 ' 60

Desviacin tpica: = 2 = 3 ' 6  1 ' 9

Coeficiente de variacin: CV =

n 60
=
= 30
2 2

1'9
 0 ' 65
2 ' 94

1.7. EJERCICIOS.

1. Sea X la puntuacin de los alumnos de la clase de 3 B de ESO del colegio Virgen de Gracia
de Granada (Espaa) en un examen de Matemticas, que toma los valores siguientes:
0, 0, 1, 2, 2, 3, 4, 5, 5, 5, 5, 6, 6, 7, 7, 7, 7, 8, 9, 9
Indicar cul es la poblacin.
Indicar cul es el nmero de elementos de la poblacin.
Indicar qu tipo de variable estadstica es X.
Elaborar una tabla que recoja los datos anteriores junto con las frecuencias.
Completar la tabla anterior con las columnas necesarias para calcular las medidas de
posicin central y de dispersin de la variable X.
f. Elaborar todas las representaciones grficas posibles que correspondan a la
distribucin de la variable estadstica X.

a.
b.
c.
d.
e.

19

Departamento de Matemticas

ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva

http://www.colegiovirgendegracia.org/eso/dmate.htm

2. Sea X el nmero de aparatos de telfono por familia en el bloque de vecinos de la calle Pedro
Antonio de Alarcn n 40 de Granada (Espaa) a fecha marzo de 1998, que toma los siguientes
valores:

Xi

0 1 2

ni

4 2 6 15 8 15

a.
b.
c.
d.

Indicar cul es la poblacin.


Cul es el nmero de elementos de la poblacin?
Razonar qu tipo de carcter estadstico es X.
Completar la tabla anterior con las columnas necesarias para calcular las
medidas de posicin central y de dispersin de la variable X.
e. Elaborar todas las representaciones grficas posibles que correspondan a la
distribucin de la variable estadstica X.
3. Sea X la marca de los automviles que poseen los vecinos del bloque del ejercicio anterior,
con fecha Abril 2008, que toma los siguientes valores:

Xi

Mercedes Citron Renault Seat Honda Peugeot Otros

ni
a.
b.
c.
d.
e.

Indicar cul es la poblacin y su nmero de elementos.


Razonar qu tipo de caracter es X.
Calcular la moda de la distribucin.
Completar la tabla de frecuencias anterior.
Elaborar todas las representaciones grficas posibles que correspondan a la
distribucin de la variable estadstica X.

4. Sea X la cantidad, en decenas de euros, gastada los fines de semana en salidas por los alumnos
del tercer curso de la Facultad de Derecho de la Universidad de Granada (Espaa):

Ii

ai

xi

ni

[ 0 , 2[

[ 2, 4 [

[ 4, 6[

11

[ 6 , 8[

[8, 10[

Ni

fi

Fi

hi = ni / ai

20

Departamento de Matemticas

ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva

http://www.colegiovirgendegracia.org/eso/dmate.htm

a. Indicar cul es la poblacin y su nmero de elementos.


b. Razonar qu tipo de caracter estadstico es X.
c. Completar la tabla anterior con las columnas necesarias para calcular las medidas
de posicin central y de dispersin de la variable X.
d. Elaborar todas las representaciones grficas posibles que correspondan a la
distribucin de la variable estadstica X.
5. Consideramos el siguiente grfico que corresponde a una variable estadstica X:
ni

40

30

20

10

10

14

18

22

26

30

a. Indicar el nombre de la representacin grfica anterior.


b. Indicar qu tipo de variable estadstica es X.
c. Qu frecuencia tiene el intervalo [ 10 , 14[ ? Y el [ 26 , 30[ ?
d.
e.
f.
g.

Deduce el nmero total de personas de la poblacin a partir del grfico.


Razona cul es la moda.
Reconstruir la tabla de la distribucin de X a partir de la representacin grfica.
Completar la tabla anterior con todas las columnas necesarias para poder calcular
las medidas de posicin central y de dispersin de X.

21

Departamento de Matemticas
http://www.colegiovirgendegracia.org/eso/dmate.htm

ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva

6. Consideramos el siguiente grfico que corresponde a un caracter estadstico X:

a.
b.
c.
d.
e.

Indicar el nombre de la representacin grfica anterior.


Indicar qu tipo de caracter es X.
Cul es la moda de la distribucin de datos?
Cuntas modalidades tiene el carcter?
Reconstruir la tabla de las frecuencias de X a partir de la representacin grfica.

7. Consideramos el siguiente grfico que corresponde a una variable estadstica X:

a. Indicar el nombre de la representacin grfica anterior.


b. Razonar que tipo de carcter estadstico es X.
c. Cules son las modalidades del carcter?
d. Qu modalidad tiene frecuencia 12 94 ? Cul tiene mayor frecuencia?
e. Cuntos elementos tiene la poblacin?
f. Reconstruir la tabla de la distribucin de X a partir de la representacin grfica.
g. Completar la tabla anterior con todas las columnas necesarias para poder calcular
las medidas de posicin central y de dispersin de X.

22

Departamento de Matemticas

ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva

http://www.colegiovirgendegracia.org/eso/dmate.htm

8. Consideramos la siguiente tabla:

Ii

ai

xi

ni

Ni

fi

[ 0 , 2[

7 25

[ 2, 4[

2 25

[ 4, 6[

2 5

[ 6 , 8[

1 25

[8, 10[

15

Fi

hi = ni / ai

a. Razonar qu tipo de variable es X.


b. Completar la tabla anterior con todas las columnas necesarias para calcular las
medidas de posicin central y de dispersin de la variable X.
c. Elaborar todas las representaciones grficas posibles que correspondan a la
distribucin de la variable estadstica X.

9. La siguiente tabla corresponde a la distribucin de una variable estadstica X:

Xi

Ni

14

20

10 35

a. Indicar cul es el nmero de elementos de la poblacin.


b. Razonar el tipo de variable que es X.
c. Completar la tabla anterior con todas las columnas necesarias para calcular las
medidas de posicin central y de dispersin de la variable X.
d. Elaborar todas las representaciones grficas posibles que correspondan a la
distribucin de la variable estadstica X.

23

Departamento de Matemticas

ESTADSTICA y PROBABILIDAD:
Estadstica descriptiva

http://www.colegiovirgendegracia.org/eso/dmate.htm

10. La siguiente tabla corresponde a la distribucin de un atributo X:

Xi

Fi

Albino

4 30

Rubio

11 30

Castao

13 30

Negro

22 30

Otros

30 30

a. Indicar cul es el nmero de elementos de la poblacin.


b. Completar la tabla de frecuencias anterior.
c. Elaborar todas las representaciones grficas posibles que correspondan a la
distribucin de la variable estadstica X.

1.8. BIBLIOGRAFA.

Para la elaboracin de estos apuntes, se ha utilizado como material:


1 Mayoritariamente, las explicaciones y ejercicios propuestos en clase por los profesores del
Departamento de Matemticas del Colegio Virgen de Gracia (Granada).
2 Como ayuda para desarrollar y completar algunos apartados:
-Apuntes del profesor Gregorio Gmez Soriano.

24

También podría gustarte