Está en la página 1de 18

Frecuencia estadstica

Para el trmino en fsica, vase Frecuencia.


En estadstica, la frecuencia (o frecuencia absoluta) de un evento i, es el nmero de veces en que
dicho evento se repite durante un experimento o muestra estadstica. 1 Comnmente, la distribucin
de la frecuencia suele visualizarse con el uso de histogramas.

ndice
[ocultar]

1Tipos de frecuencia
2Ejemplos de frecuencias
3Vase tambin
4Referencias

Tipos de frecuencia[editar]
En estadstica se pueden distinguir hasta cuatro tipos de frecuencias:

Frecuencia absoluta de un valor de la variable estadstica X, es el nmero de veces que aparece ese
valor en el estudio. Se suele denotar por Fi a la frecuencia absoluta del valor X = xi de la variable X.
Dada una muestra de N elementos, la suma de todas las frecuencias absolutas debe dar el total de
la muestra estudiada N.

Frecuencia relativa: (fi), es el cociente entre la frecuencia absoluta y el tamao de la muestra (N). Es
decir,

siendo el fi para todo el conjunto i. Se presenta en una tabla o nube de puntos en una distribucin de
frecuencias. Si multiplicamos la frecuencia relativa por 100 obtendremos el porcentaje o tanto por
ciento (pi)

Frecuencia absoluta acumulada: (Ni), se refiere al total de las frecuencias absolutas para todos los
eventos iguales o anteriores que un cierto valor, en una lista ordenada de eventos.
Frecuencia relativa acumulada: (Fi), es el cociente entre la frecuencia absoluta acumulada y el total
de la muestra.

Ejemplos de frecuencias[editar]
Supongamos que las calificaciones de un estudiante de secundaria fueran las siguientes:
18, 13, 12, 14, 11, 08, 12, 15, 05, 20, 18, 14, 15, 11, 10, 10, 11, 13. Entonces:

La frecuencia absoluta de 11 es 3, pues 11 aparece 3 veces.


La frecuencia relativa de 11 es 0.16, porque corresponde a la divisin 3/18 ( 3 de las veces que
aparece de las 18 notas que aparecen en total).
La frecuencia absoluta acumulada para el valor 11 es 7, porque hay 7 valores menores o iguales a
11.
La frecuencia relativa acumulada para el valor 11 es 0.38, porque corresponde a la divisin 7/18
(frecuencia absoluta acumulada dividida entre el nmero total de muestras).
Distribucin de frecuencias
En estadstica, se le llama distribucin de frecuencias a la agrupacin de datos en categoras
mutuamente excluyentes que indican el nmero de observaciones en cada categora. 1 Esto
proporciona un valor aadido a la agrupacin de datos. La distribucin de frecuencias presenta las
observaciones clasificadas de modo que se pueda ver el nmero existente en cada clase.

ndice
[ocultar]

1Tipos de frecuencias
o 1.1Frecuencia absoluta
o 1.2Frecuencia relativa
o 1.3Frecuencia acumulada
o 1.4Frecuencia relativa acumulada
o 1.5Distribucin de frecuencias agrupadas
2Referencias

Tipos de frecuencias[editar]
Frecuencia absoluta[editar]
La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio
estadstico. Se representa por fila. La suma de las frecuencias absolutas es igual al nmero total de
datos, que se representa por N. Para indicar resumidamente estas sumas se utiliza la letra griega
(sigma mayscula) que se lee suma o sumatoria.
Frecuencia relativa[editar]
Se dice que la frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor
y el nmero total de datos. Se puede expresar en tantos por ciento y se representa por hi. La suma
de las frecuencias relativas es igual a 1.
Frecuencia relativa (hi) es el cociente entre la frecuencia absoluta y el tamao de la muestra (N). Es
decir:

siendo el fi para todo el conjunto i. Se presenta en una tabla o nube de puntos en una distribucin de
frecuencias.
Si multiplicamos la frecuencia relativa por 100 obtendremos el porcentaje o tanto por ciento (pi).
Frecuencia acumulada[editar]
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o
iguales al valor considerado.
La frecuencia acumulada es la frecuencia estadstica F(XXr) con que el valor de un variable aleatoria
(X) es menor que o igual a un valor de referencia (Xr).
La frecuencia acumulada relativa se deja escribir como Fc(XXr), o en breveFc(Xr), y se calcula de:

Fc (Hr) = HXr / N

donde MXr es el nmero de datos X con un valor menor que o igual a Xr, y N es nmero total de los
datos. En breve se escribe:
Fc = M / N

Cuando Xr=Xmin, donde Xmin es el valor mnimo observado, se ve que Fc=1/N, porque M=1. Por
otro lado, cuando Xr=Xmax, donde Xmax es el valor mximo observado, se ve que Fc=1, porque
M=N.
En porcentaje la ecuacin es:

Fc(%) = 100 M / N

Frecuencia relativa acumulada[editar]


La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado
valor y el nmero total de datos. Se puede expresar en tantos por ciento. Ejemplo:
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas mximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27
Distribucin de frecuencias agrupadas[editar]
La distribucin de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables
toman un nmero grande de valores o la variable es continua. Se agrupan los valores en intervalos
que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia
correspondiente. Lmites de la clase. Cada clase est delimitada por el lmite inferior de la clase y el
lmite superior de la clase.
La amplitud de la clase es la diferencia entre el lmite superior e inferior de la clase. La marca de
clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el
clculo de algunos parmetros. En caso de que el primer intervalo sea de la forma (-,k], o bien
[k,+) donde k es un nmero cualquiera, en el caso de (-,k], para calcular la marca de clase se
tomar la amplitud del intervalo adyacente a el (ai+1), y la marca de clase ser ((k-ai+1) +k)/2. En el
caso del intervalo [k,+) tambin se tomar la amplitud del intervalo adyacente a el (ai-1) siendo la
marca de clase ((k+ai-1)+k)/2.
Construccin de una tabla de datos agrupados:
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27,
47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.

1. Se localizan los valores menor y mayor de la distribucin. En este caso son 3 y 48.
2. Se restan y se busca un nmero entero un poco mayor que la diferencia y que sea divisible por el
nmero de intervalos que queramos establecer.
Es conveniente que el nmero de intervalos oscile entre 6 y 15.
En este caso, 48 - 3 = 45, incrementamos el nmero hasta 50 : 5 = 10 intervalos.
Se forman los intervalos teniendo presente que el lmite inferior de una clase pertenece al intervalo,
pero el lmite superior no pertenece al intervalo, se cuenta en el siguiente intervalo.

Intervalo ci ni Ni fi Fi

[0, 5) 2.5 1 1 0.025 0.025

[5, 10) 7.5 1 2 0.025 0.050


[10, 15) 12.5 3 5 0.075 0.125

[15, 20) 17.5 3 8 0.075 0.200

[20, 25) 22.5 3 11 0.075 0.275

[25, 30) 27.5 6 17 0.150 0.425

[30, 35) 32.5 7 24 0.175 0.600

[35, 40) 37.5 10 34 0.250 0.850

[40, 45) 42.5 4 38 0.100 0.950

[45, 50) 47.5 2 40 0.050 1

Total: 40 1
DEFINICIONES
Lo primero que vamos a hacer es introducir una serie de definiciones que nos permitan hablar con
claridad y precisin.
Poblacin.-
Es el conjunto de los elementos sobre el cual realizamos nuestro estudio. Es un conjunto de
elementos con caractersticas comunes, que puede ser finito o infinito. El tamao de la poblacin se
nota con la letra N.
Ejemplo:
La poblacin en las tres actividades motivadoras es el conjunto de todos los alumnos de la clase. En
las dos primeras actividades podemos considerar aisladamente el conjunto de los alumnos como una
poblacin sobre la que realizar un estudio y el de las alumnas como otra poblacin distinta.
Muestra.-
Es un subconjunto de la poblacin. El nmero de elementos se llama tamao de la muestra.
Ejemplo:
En las dos primeras actividades podemos considerar el conjunto de alumnos de la clase como una
muestra y el conjunto de las alumnas como otra. En la primera actividad el tamao de la muestra de
los alumnos es 22 y el tamao de la muestra de las alumnas es 28.
Individuo.-
Cualquier elemento de la poblacin o de una muestra, en nuestras actividades un individuo es un
alumno.
Carcter.-
Llamaremos carcter a cada una de las propiedades comunes a cada individuo de una poblacin, en
base a las cuales esta puede ser descrita.
Ejemplo:
En la primera actividad el carcter es la nota de cada alumno. En la segunda el carcter es pelo de
los alumnos y en la tercera la altura.
Modalidad.-
Las modalidades son las distintas variantes de un carcter, que deben ser exhaustivas y
excluyentes, es decir, cada individuo de una poblacin debe expresar una y slo una modalidad.
Las modalidades se dividen en:
Caracteres cualitativos si las modalidades no pueden ser medidas.
Caracteres cuantitativos si las modalidades pueden ser expresadas mtricamente. En esta
situacin el carcter puede ser expresado por una variable que recibe el nombre de variable
estadstica.
Ejemplo:
En la primera actividad las modalidades del caracter son los nmeros naturales del 0 al 10, que son
las posibles notas que un alumno puede obtener, es por tanto una variable estadstica.
En la segunda actividad las modalidades son los distintos colores del pelo, es por tanto un carcter
cualitativo.
Clasificacin de variables.-
Variable discreta: si toma un nmero finito o infinito numerable de valores.
Variable continua: si toma un nmero infinito no numerable de valores.
Variable unidimensional: si se estudia slo un carcter cuantitativo en cada individuo.
Variable multidimensional: si se estudian varios caracteres cuantitativos a la vez.
Ejemplo:
En la primera actividad tenemos una variable estadstica discreta unidimensional.
En la tercera actividad tenemos una variable estadstica discreta unidimensional.
Frecuencia absoluta de una modalidad.-
Es el nmero de individuos de una muestra que han presentado esa modalidad. Se nota ni la
frecuencia absoluta de la modalidad i.
Ejemplo:
En la primera actividad la frecuencia absoluta de la modalidad 5 es 5, y la frecuencia absoluta de la
modalidad 4 es 3.
Frecuencia relativa de una modalidad.-
Es la proporcin de individuos que han presentado esa modalidad. Se nota fi la frecuencia relativa de
la modalidad i, y se calcula dividiendo la frecuencia absoluta por el tamao de la poblacin.

Ejemplo:
En la segunda actividad la frecuencia relativa de la modalidad pelo rubio es 6 : 33 = 0,18 y la
frecuencia relativa de la modalidad pelo moreno es 12 : 33 = 0,36.
Frecuencia absoluta acumulada de una modalidad.-
Este tipo de frecuencias solo se pueden definir en caracteres cuantitativos, o en caracteres
cualitativos que puedan ordenarse de mayor a menor. Se define la frecuencia absoluta acumulada
de una modalidad como el nmero de individuos que han presentado esta modalidad o una
modalidad menor. Se nota Ni la frecuencia absoluta de la modalidad y se verifica que:
Ni = n1 + n2 + ... + ni
Ejemplo:
En la primera actividad la frecuencia absoluta acumulada de la nota 5 es 25.
Frecuencia relativa acumulada de una modalidad.-
Se puede definir en los mismos casos que la frecuencia absoluta acumulada, y se define como el
cociente entre esta y el tamao de la muestra. Se nota Fi:

DISTRIBUCIN DE FRECUENCIAS
Llamamos distribucin de frecuencias al conjunto de valores que puede presentar una variable junto
con sus frecuencias, estas frecuencias pueden ser cualquiera de las anteriores.
Segn la naturaleza de la variable estudiada las distribuciones de frecuencias pueden ser:

NO AGRUPADAS: se presentan cuando el nmero de valores que puede presentar la variable no es


muy elevado, y en ese caso podemos observar todos los valores de esa variable. Este caso se
presenta cuando la variable es discreta y no presenta excesivos valores.
AGRUPADAS EN INTERVALOS: se presenta cuando la variable es continua o cuando es discreta
pero con elevado nmero de valores. en esta situacin se agurpan dichos valores en intervalos o
clases. Los intervalos se notan: ei-1-ei es es intervalo i-simo.

Se llama amplitud del intervalo a la distancia que existe entre los extremos, y se nota ai:
ai = ei -ei-1
Se llama marca de clase al punto medio de un intervalo. Este punto es importante porque es el
representante del intervalo. Se nota xi:
xi = (ei + ei-1)/2
Se llama densidad de frecuencia de un intervalo a la frecuencia correspondiente a cada unidad de la
variable en dicho intervalo, se nota di:
di = ni /ai
Los intervalos se suelen tomar abiertos por la izquierda y cerrados por la derecha, salvo el primero
que se toma cerrado por los dos lados.
En este tipo de distribuciones se pierde parte de la informacin al agruparlas en intervalos, ya no se
puede hablar de valores concretas sino de intervalos. Cuanto mayor sea la amplitud de los intervalos
menos intervalos habr, y por tanto menos precisin tendremos. En cambio, cuanto menor sea la
amplitud de los intervalos menos intervalos habr, y mayor ser la precisin, sin embargo la
distribucin ser mas grande y ms dificil de manejar.
Ejemplo:
Las dos primeras actividades dan lugar a distribuciones de frecuencia no agrupadas, ya que son
variables discretas y presentan pocos valores, 11 en la primera actividad y 4 la segunda.
la tercera actividad da lugar a una distribucin de frecuencia agrupada en intervalos ya que aunque
es una variable discreta, presenta muchos valores, entre el 1,58 que es el valor ms pequeo que
presenta, y el 1,85 que es el ms grande, hay 27 valores. La eleccin de los intervalos depende de
nosotros, teniendo en cuenta que siempre es preferible que los intervalos sean todos de la misma
amplitud.

TABLAS ESTADSTICAS
Ya hemos introducido la terminologa adecuada, ahora vamos a utilizarla para ordenar y agrupar la
informacin. Lo primero que vamos a hacer es construir tablas estadsticas, en las que va a aparecer
toda la informacin de forma ordenada.
Llamamos tabla estadstica a la disposicin de forma ordenada y agrupada de los valores y
frecuencias de una distribucin. Distinguiremos entre tablas estadsticas de distribuciones no
agrupadas y tablas de distribuciones agrupadas.
TABLAS DE DISTRIBUCIONES NO AGRUPADAS.
En las tablas de distribuciones no agrupadas aparecen las siguientes columnas: la primera contiene
los valores de la distribucin, ordenados de menor a mayor si son caracteres cuantitativos; la
segunda contiene las frecuencias absolutas, la tercera las frecuencias relativas. Cuando la
frecuencias acumuladas se pueden definir se aaden otras dos columnas, una para las frecuencias
absolutas acumuladas y otra para las relativas acumuladas.
Ejemplo:
TABLA ESTADSTICA DE LA ACTIVIDAD 1, TOMANDO COMO POBLACIN TODA LA CLASE:
xi ni Ni fi Fi
0 2 2 0,04 0,04
1 3 5 0,06 0,10
2 6 11 0,12 0,22
3 6 17 0,12 0,34
4 3 20 0,06 0,40
5 5 25 0,10 0,50
6 5 30 0,10 0,60
7 8 38 0,16 0,76
8 6 44 0,12 0,88
9 4 48 0,08 0,96
10 2 50 0,04 1
Una vez construida la tabla es muy fcil responder a las tres primeras preguntas:
Cuntos alumnos han sacado un tres? La respuesta es n3 que vale 6.
Cuntos alumnos han suspendido? La respuesta es N4 que vale 20.
Cuntos alumnos han aprobado? La respuesta es 50-N4 que vale 50-20 = 30.
Para responder a la ltima pregunta: Han aprobado ms alumnos o alumnas? se podrian construir
dos tablas una tomando como poblacin los alumnos y otra tomando como poblacin las alumnas y
comparar las frecuencias acumuladas de la modalidad 5.
.
TABLA ESTADSTICA DE LA 2 ACTIVIDAD TOMANDO COMO POBLACIN TODA LA CLASE

xi ni fi
Rubio 6 0,18
Pelirojo 1 0,04
Moreno 12 0,36
Castao 14 0,32
33
Con esta tabla es fcil responder a las dos primeras preguntas: El color de pelo que tiene menos
gente es el pelirojo que slo hay 1 y el que tiene ms gente es el castao que lo tienen 14 alumnos.
Para responder a las otras preguntas vamos a construir la tabla correspondiente a considerar slo
los alumnos y la tabla correspondiente a considerar slo las alumnas.

TABLA DE ALUMNOS TABLA DE ALUMNAS

xi ni fi xi ni fi
Rubio 2 0,13 Rubia 4 0,23
Pelirojo 1 0,07 Peliroja 0 0
Moreno 6 0,4 Morena 6 0,33
Castao 6 0,4 Castaa 8 0,44

Ahora es muy fcil viendo estas dos tabla responder a las dos ltimas preguntas de esta actividad:
Hay ms nias morenas, 6, que rubias, 4. Y hay ms nias rubias, 4, que nios, 2.
TABLAS DE DISTRIBUCIN AGRUPADAS EN INTERVALOS.
En las tablas estadsticas de distribuciones de frecuencia agrupadas por intervalos aparecen las
siguientes columnas: la primera con los intervalos, la segunda con las amplitudes de los intervalos, la
tercera con las marcas de clase, la cuarta con las frecuencias absolutas de cada intervalo, la cuarta
con las densidades de frecuencia y la quinta con las frecuencias relativas; adems suelen aparecer
tambien dos columnas ms con las frecuencias acumuladas. Si se toman los intervalos con la misma
amplitud no se ponen las columnas de amplitud ni de densidades, slo se seala cual es la amplitud
de todos los intervalos.
Ejemplo:
TABLA ESTADSTICA DE LA 3 ACTIVIDAD
En esta tabla vamos a considerar los intervalos de la misma amplitud, por lo que no vamos a
representar la columna de la amplitudes ni la de las densidades. Los intervalos que vamos a
considerar van a tener de amplitud 5 cm.

Aqu se pone de manifiesto la perdida de precisin, ya no podemos hablar de cual es la altura ms


frecuente sino de cual es el intervalo de alturas en el que hay ms alumnos. De esta forma, la
respuesta a la primera pregunta de la actividad -Cul es la altura ms frecuente?- es que el
intervalo 1.70-1.75 es el que contiene ms alumnos.

REPRESENTACIONES GRFICAS
El objetivo de las representaciones grficas es realizar una sntesis visual de la informacion aportada
por una distribucin de frecuencias. Segn la naturaleza del carcter estudiado tendremos diversos
tipos de representacin grfica:

Caracteres cualitativos.
Caracteres cuantitativos con distribuciones no agrupadas.
Caracteres cuantitativos con distribuciones agrupadas.
REPRESETACIONES GRFICAS DE CARCTERES CUALITATIVOS.
El principio que va a regir las representaciones grficas de caracteres cualitativos ser la
proporcionalidad de las reas de las figuras asignadas a cada modalidad respecto de su frecuencia
absoluta.
Diagrama de sectores.
Consiste en dividir un circulo en tantos sectores como modalidades presente el carcter. El rea de
cada sector deber ser proporcional a la frecuencia de la modalidad a la que representa. Esto se
consigue haciendo que el ngulo de cada sector sea proporcional a cada frecuencia.
Ejemplo:
DIAGRAMA DE SECTORES DE LA ACTIVIDAD 2.

Diagrama de barras.
Consiste en representar cada modalidad mediante un rectangulo cuya base ser siempre la misma y
cuya rea debera ser proporcional a su frecuencia absoluta. Esto se consigue poniendo la altura
proporcional a la frecuencia absoluta, ya que la base es igual para todos.
Ejemplo:
DIAGRAMA DE BARRAS DE LA ACTIVIDAD 2

REPRESENTACIONES GRFICAS DE CARACTERES CUANTITATIVOS NO AGRUPADOS.


El principio de las representaciones grficas de caracteres cuantitativos ser la proporcionalidad de
las reas o de las longitudes de las figuras representadas respecto de las frecuencias absolutas o
relativas de la modalidad a que represente.
Diagrama de barras.
Consiste en representar los valores de una variable en funcin de sus frecuencias absolutas o
relativas, por tanto dentro de un eje de coordenadas colocaremos los valores de la variable en el eje
de abcisas y la frecuencia absoluta o relativa en el eje de abcisas. La representacin consiste en
levantar alturas para cada valor de la variable iguales a su frecuencia.
Ejemplo:
DIAGRAMA DE BARRAS DE LA 1 ACTIVIDAD

Poligono de frecuencias.
Se obtiene a partir del diagrama de barras uniendo mediante una linea poligonal las diversas alturas
de las barras obtenidas.
Ejemplo:
POLIGONO DE FRECUENCIAS DE LA 1 ACTIVIDAD

Curva de distribucin.
Se llama funcin de distribucin a la funcin que asocia a cada valor real la proporcin de individuos
de la poblacin que presenta valores menores o iguales al valor considerado. Se representa F(x).
La representacin grfica de F(x) es la curva de distribucin. En el eje de abcisas se representan los
valores de la variable y en ordenadas las frecuencias.
Ejemplo:
CURVA DE DISTRIBUCIN DE LA 1 ACTIVIDAD
REPRESENTACIONES GRFICAS DE DISTRIBUCIONES AGRUPADAS.
Histograma de frecuencias.
Esta representacin consiste en una serie de rectangulos yuxtapuestos en el que las reas de cada
uno de ellos son proporcionales a la frecuencia absoluta o relativa de las modalidades a que
representa. Las bases de los rectngulos sern las amplitudes de los intervalos, pero la altura
dependiendo de si todas las amplitudes son iguales o no sern las frecuencias o las densidades de
frecuencias.
Ejemplo:
HISTOGRAMA DE FRECUENCIAS DE LA 3 ACTIVIDAD
En este caso estamos ante una distrubucin de frecuencias agrupada en la que como ya hicimos en
la construccin de la tabla estadstica vamos a considerar intervalos de la misma amplitud, por lo que
vamos a utilizar como altura de los rectngulos la frecuencias de cada intervalo.

Poligono de frecuencias.
Se obtiene a partir del histograma de frecuencias uniendo mediante una poligonal la alturas de cada
una de las marcas de clase de los intervalos considerados.
Ejemplo:
POLIGONO DE FRECUENCIAS DE LA 3 ACTIVIDAD

Curva de distribucin.
Se llama curva de distrucin a la representacin grfica de la funcin de distribucin que representa
la proporcin de individuos que han presentado valores menores o iguales que el valor considerado.
Ejemplo:
CURVA DE DISTRIBUCIN DE LA 3 ACTIVIDAD

MEDIDAS DE POSICIN
Las medidas de posicin solo podemos definirlas cuando estamos trabajando con variables
estadsticas, es decir, cuando estamos estudiando caracteres cuantitativos.
Las medidas de posicin tienen como objetivo centrar la distribucin, es decir, dar un valor nmerico
que pueda representar a toda la distribucin.
Las medidas de posicin que vamos a estudiar son:

Media aritmtica.
Mediana.
Moda.
MEDIA ARITMTICA
Se define la media aritmtica de una distribucin de frecuencias como la suma del producto de los
valores de la variable por sus frecuencias absolutas divido por el tamao de la poblacin. Se
nota :

Si la distribucin es no agrupada los xi representan a los valores de la variable, si la distribucin es


agrupada en intervalos los xi representan las marcas de clase.
Ejemplo:
En la primera actividad la media aritmtica es 5,2 que podemos considerarla como nota
representativa de toda la clase.
En la segunda actividad la media aritmtica es 1,71 que podemos considerarla como la altura
representativa de toda la clase.
MEDIANA
Se llama mediana de una variable estadstica a aquel valor de la variable tal que el nmero de
observaciones menores que l es igual que el nmero de observaciones mayores.Se nota Me y se
puede considerar como el punto de abcisas cuya ordenada en la curva vale .
El clculo de la mediana se har teniendo en cuenta si la distribucin de frecuencias es agrupada o
no agrupada.
Distribuciones no agrupadas.
Se observa la frecuencia absoluta acumulada y pueden pasar dos casos:
a) Si $ i en {1,,k} / Ni > N/2 >Ni-1 => xi=Me
b) Si $ i en {1,,k} / Ni = N/2 => xi =Me
Distribuciones agrupadas en intervalos.
Observando las frecuencias acumuladas diremos cual es el intervalo central, que recibe el nombre
de intervalo mediano. Para obtener el valor exacto de la mediana se distinguen dos casos:
a) Si(ei-1,ei)es el intervalo mediano con Ni > N/2 >Ni-1, se realiza una interpolacin lineal en la curva
de distribucin asociada a dicho intervalo:

b) Si (ei-1,ei) es el intervalo mediano y Ni = N/2 >Ni-1 entonces Me=ei.


Ejemplo:
En la actividad 1 la mediana es 5 pues estamos en una distribucin no agrupada y la frecuencia
relativa acumulada de 5 vale 0,5.
En la actividad 3 la mediana es 1,705 que se obtiene haciendo la interpolacin lineal en el intervalo
1,70-1,75, pues la frecuencia relativa acumulada de este intervalo es 0.7 y la del intervalo anterior
vale 0,433.
MODA
La moda es la nica medida que se puede definir para caracteres cualitativos. Se define la moda de
una distribucin como aquel valor que se ha presentado ms veces, es decir, es aquel que su
frecuencia absoluta es mxima.
Si la distribucin es agrupada en intervalos se habla de intervalo modal.
Una moda en una distribucin no tiene por qu ser unica, puede haber ms de una en una misma
distribucin, y entonces se habla de distribuciones bimodales, trimodales, o en general plurimodales.
Ejemplo:
En la 1 actividad la moda es 7 que se ha presentado 8 veces.
En la 2 actividad la moda es Castao que se ha presentado 14 veces.
En la 3 actividad el intervalo modal es el 1,70-1,75 que se presenta 8 veces.

MEDIDAS DE DISPERSIN
Las medidas de dispersin nos van a informar sobre el grado de esparcimiento de la distribucin, es
decir, nos van a decir si los valores que aparecen estan ms o menos concentrados. Por tanto, nos
van informar tambin sobre el grado de representatividad de la medidad de posicin, pues cuanto
ms concentrados esten los valores que toma la variable mejor representar un solo valor a toda la
distribucin.
Las medidas de dispersin que vamos a estudiar son:

Varianza.
Desviacin tpica.
Coeficiente de variacin.
VARIANZA
La varianza es una medida de dispersin que mide el grado de esparcimiento de una distribucin
alrededor de la media aritmtica. Cuanto ms grande sea la varianza ms esparcidos estarn los

valores de la variable. La varianza se suele notar y se calcula:

Al igual que en la media aritmtica los xi representan a los valores de la variable si es una
distribucin no agrupada y a las marcas de clase si es una distribucin agrupada en intervalos.
La varianza es la suma de las desviaciones de los valores de la variable sobre la media aritmetica
ponderada por las frecuencias. Por tanto, cuanto menor sea la varianza ms agrupada estar la
distribucin en torno a su media aritmtica.
La varianza viene expresada en las misma unidades que la variable pero al cuadrado.
Ejemplo:
En la 1 actividad la varianza vale 7,64.
En la 2 actividad la varianza vale 0,005197 m* o lo que es lo mismo 51,917 cm*.
DESVIACIN TPICA
La desviacin tpica se define para obtener una medida de dispersin que venga expresadda en las
misma unidades que la variable. Se define como la raiz cuadrada de la varianza.

Ejemplo:
En la 1 actividad la desviacin tpica vale 2,76.
En la 2 actividad la desviacin tpica vale 0,072 m, o lo que es lo mismo 7,2 cm.
COEFICIENTE DE VARIACIN
Tanto la varianza como la desviacin tpica son medidas de dispersin absoluta, es decir, nos hablan
de la dispersin de la variable que estamos estudiando, pero no nos permiten comparar la dispersin
de dos distribuciones distintas.
El coeficiente de variacin es una medida de dispersin relativa que nos va permitir comparar dos
distribuciones distintas, se define como el cociente entre la desviacin tpica y la media aritmtica.

El coeficiente de variacin es un coeficiente adimensional y solo se puede definir cuando la media


aritmtica es distinta de cero.
Para comparar la dispersin de dos distribuciones basta con comparar sus coeficientes de variacin,
aquella que su coeficiente de variacin sea menor es la que esta ms concentrada en torno a su
media aritmtica.
Ejemplo:
El coeficiente de variacin de la distribucin de la 1 actividad vale 0,53 y en la 2 actividad vale 0,42
por lo que la distribucin de la 3 actividad est ms agrupada que la de la 1.
1 Actividad.-
En un clase se pesan todos los alumnos y los datos obtenidos, expresados en Kg. son:

66 59 53 65 72 64 62 69 56 54 57 51
58 69 57 60 53 61 58 66 49 59 68 61
62 60 56 55 62 65
Calcula:

1. El tamao de la poblacin.
2. Construye una tabla estadstica asociada.
3. Construye el poligono de frecuencias asociado a esa tabla.
4. La media aritmtica, la mediana y la moda.
5. La varianza, la desviacin tpica y el coeficiente de variacin.
1 Actividad.-
1.- El tamao de la poblacin es 30.
2.-La tabla estadstica que se obtiene considerando la distribucin agrupada en intervalos de
amplitud 3 Kg es:

3.-El poligono de frecuencias asociado a la distribucin es:

4.-La media aritmtica vale 60,6 Kg, la median 58,9 Kg y el intervalo modal es el 58-61 Kg.
5.- La varianza vale 29,69 Kg*, la desviacin tpica 5,45 Kg y el coeficiente de variacin vale 0,090.

2 Actividad.-
En la siguiente tabla se muestran los tiempos empleados en recorrer 100 metros y 400 metros por
cuatro personas.
100 m 400 m
1 persona 10 s 48 s
2 persona 10,6 s 50 s
3 persona 11 s 49 s
4 persona 10,5 s 50 s

1. Calcula la media aritmtica, la varianza y la desviacin tipica de la serie de tiempos de cada una de
la distancias.
2. Cul de las dos series estn ms dispersos los tiempos?
2 Actividad.-
1.- En la serie de tiempos empleados en los 100 m la media aritmtica es 10,525s, la varianza es
0,126 s* y la desviacin tpica 0,356 s. En la serie de los 400 m la media aritmtica es 49,250 s, la
varianza es 0,687 y la desviacin tpica es 0,829 s.
2.-Los tiempos de los 100 m. estn ms dispersos que los de los 400 m. pues el coeficiente de
variacin de los tiempos de los 100 m. es 0,033, que es mayor que el de los 400 m. que vale 0,016.
3 Actividad.-
Se estudia la nacionalidad de 1.450.000 extranjeros residentes en Espaa. La informacin obtenida
es la siguiente:

UNIN EUROPEA 500.000


RESTO DE EUROPA 100.000
HISPANOAMRICA 450.000
FRICA 400.000
Representa la distribucin mediante un diagram de barras y un diagrama de sectores.
3 Actividad.-

4 Actividad.-
En una determinada empresa se realiza un estudio sobre la calidad de su produccin. La distribucin
siguiente informa sobre el nmero de piezas defectuosas encontradas en 100 cajas examinadas con
50 unidades cada una de ellas:

N de piezas defecuosas 0 1 2 3 4 5 6 7 8 9 10
N de cajas 6 9 10 11 14 16 16 9 4 3 2

1. Calcular el nmeros medio de piezas defectuosas por caja.


2. Cuntas piezas defectuosas se encuentran ms frecuentemente en las cajas examinadas?
3. Cul es la mediana de la distribucin?Cul es su interpretacin?
4. Construye el poligono de frecuencias.
4 Actividad.-

1. El nmero medio de piezas defecuosas es 8,5.


2. Lo que nos preguntan es la moda, esta distribucin es bimodal pues las modas son 5 y 6 piezas
defectuosas que presentan una frecuencia absoluta de 16.
3. La media es 5, y significa que de las cien cajas examinadas la mitad de ellas presentan menos de 5
piezas defectuosas.
4. El poligono de frecuencias es:
5 Actividad.-
Los alumnos de un determinado centro son sometidos a dos pruebas diferentes A y B. Las
puntuaciones obtenidas son:
Prueba A
Puntos 0 1 2 3 4 5 6 7 8
N de alum. 3 7 10 15 24 18 15 9 6
a
Pueba B
Puntos 0 1 2 3 4 5 6 7 8
N alum. 3 12 10 8 20 18 20 10 6

1. Calcula la nota media en cada prueba.


2. Calcula la nota obtenida con mayor frecuencia en cada prueba.
3. Calcula la nota mxima del 50% de las calificaciones ms bajas en ambas pruebas.
4. Qu nota media es ms representativa de la correspondiente distribucin?
5 Actividad.-

1. La nota media de la prueba A es 4,15 y la de la prueba B es 4,52.


2. Lo que nos pide son las modas que de la prueba A es el 4 y de la prueba B son el 4 y el 6.
3. Lo que nos pide son la mediana que de la prueba A es el 4 y de la B es el 5.
4. La nota media de la prueba A es ms representativa que la de la prueba B, pues el coeficiente de
variacin en la prueba A vale 0,47 que es menor que el de la prueba B que vale 0,99.

También podría gustarte