Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ndice
[ocultar]
1Tipos de frecuencia
2Ejemplos de frecuencias
3Vase tambin
4Referencias
Tipos de frecuencia[editar]
En estadstica se pueden distinguir hasta cuatro tipos de frecuencias:
Frecuencia absoluta de un valor de la variable estadstica X, es el nmero de veces que aparece ese
valor en el estudio. Se suele denotar por Fi a la frecuencia absoluta del valor X = xi de la variable X.
Dada una muestra de N elementos, la suma de todas las frecuencias absolutas debe dar el total de
la muestra estudiada N.
Frecuencia relativa: (fi), es el cociente entre la frecuencia absoluta y el tamao de la muestra (N). Es
decir,
siendo el fi para todo el conjunto i. Se presenta en una tabla o nube de puntos en una distribucin de
frecuencias. Si multiplicamos la frecuencia relativa por 100 obtendremos el porcentaje o tanto por
ciento (pi)
Frecuencia absoluta acumulada: (Ni), se refiere al total de las frecuencias absolutas para todos los
eventos iguales o anteriores que un cierto valor, en una lista ordenada de eventos.
Frecuencia relativa acumulada: (Fi), es el cociente entre la frecuencia absoluta acumulada y el total
de la muestra.
Ejemplos de frecuencias[editar]
Supongamos que las calificaciones de un estudiante de secundaria fueran las siguientes:
18, 13, 12, 14, 11, 08, 12, 15, 05, 20, 18, 14, 15, 11, 10, 10, 11, 13. Entonces:
ndice
[ocultar]
1Tipos de frecuencias
o 1.1Frecuencia absoluta
o 1.2Frecuencia relativa
o 1.3Frecuencia acumulada
o 1.4Frecuencia relativa acumulada
o 1.5Distribucin de frecuencias agrupadas
2Referencias
Tipos de frecuencias[editar]
Frecuencia absoluta[editar]
La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio
estadstico. Se representa por fila. La suma de las frecuencias absolutas es igual al nmero total de
datos, que se representa por N. Para indicar resumidamente estas sumas se utiliza la letra griega
(sigma mayscula) que se lee suma o sumatoria.
Frecuencia relativa[editar]
Se dice que la frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor
y el nmero total de datos. Se puede expresar en tantos por ciento y se representa por hi. La suma
de las frecuencias relativas es igual a 1.
Frecuencia relativa (hi) es el cociente entre la frecuencia absoluta y el tamao de la muestra (N). Es
decir:
siendo el fi para todo el conjunto i. Se presenta en una tabla o nube de puntos en una distribucin de
frecuencias.
Si multiplicamos la frecuencia relativa por 100 obtendremos el porcentaje o tanto por ciento (pi).
Frecuencia acumulada[editar]
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o
iguales al valor considerado.
La frecuencia acumulada es la frecuencia estadstica F(XXr) con que el valor de un variable aleatoria
(X) es menor que o igual a un valor de referencia (Xr).
La frecuencia acumulada relativa se deja escribir como Fc(XXr), o en breveFc(Xr), y se calcula de:
Fc (Hr) = HXr / N
donde MXr es el nmero de datos X con un valor menor que o igual a Xr, y N es nmero total de los
datos. En breve se escribe:
Fc = M / N
Cuando Xr=Xmin, donde Xmin es el valor mnimo observado, se ve que Fc=1/N, porque M=1. Por
otro lado, cuando Xr=Xmax, donde Xmax es el valor mximo observado, se ve que Fc=1, porque
M=N.
En porcentaje la ecuacin es:
Fc(%) = 100 M / N
1. Se localizan los valores menor y mayor de la distribucin. En este caso son 3 y 48.
2. Se restan y se busca un nmero entero un poco mayor que la diferencia y que sea divisible por el
nmero de intervalos que queramos establecer.
Es conveniente que el nmero de intervalos oscile entre 6 y 15.
En este caso, 48 - 3 = 45, incrementamos el nmero hasta 50 : 5 = 10 intervalos.
Se forman los intervalos teniendo presente que el lmite inferior de una clase pertenece al intervalo,
pero el lmite superior no pertenece al intervalo, se cuenta en el siguiente intervalo.
Intervalo ci ni Ni fi Fi
Total: 40 1
DEFINICIONES
Lo primero que vamos a hacer es introducir una serie de definiciones que nos permitan hablar con
claridad y precisin.
Poblacin.-
Es el conjunto de los elementos sobre el cual realizamos nuestro estudio. Es un conjunto de
elementos con caractersticas comunes, que puede ser finito o infinito. El tamao de la poblacin se
nota con la letra N.
Ejemplo:
La poblacin en las tres actividades motivadoras es el conjunto de todos los alumnos de la clase. En
las dos primeras actividades podemos considerar aisladamente el conjunto de los alumnos como una
poblacin sobre la que realizar un estudio y el de las alumnas como otra poblacin distinta.
Muestra.-
Es un subconjunto de la poblacin. El nmero de elementos se llama tamao de la muestra.
Ejemplo:
En las dos primeras actividades podemos considerar el conjunto de alumnos de la clase como una
muestra y el conjunto de las alumnas como otra. En la primera actividad el tamao de la muestra de
los alumnos es 22 y el tamao de la muestra de las alumnas es 28.
Individuo.-
Cualquier elemento de la poblacin o de una muestra, en nuestras actividades un individuo es un
alumno.
Carcter.-
Llamaremos carcter a cada una de las propiedades comunes a cada individuo de una poblacin, en
base a las cuales esta puede ser descrita.
Ejemplo:
En la primera actividad el carcter es la nota de cada alumno. En la segunda el carcter es pelo de
los alumnos y en la tercera la altura.
Modalidad.-
Las modalidades son las distintas variantes de un carcter, que deben ser exhaustivas y
excluyentes, es decir, cada individuo de una poblacin debe expresar una y slo una modalidad.
Las modalidades se dividen en:
Caracteres cualitativos si las modalidades no pueden ser medidas.
Caracteres cuantitativos si las modalidades pueden ser expresadas mtricamente. En esta
situacin el carcter puede ser expresado por una variable que recibe el nombre de variable
estadstica.
Ejemplo:
En la primera actividad las modalidades del caracter son los nmeros naturales del 0 al 10, que son
las posibles notas que un alumno puede obtener, es por tanto una variable estadstica.
En la segunda actividad las modalidades son los distintos colores del pelo, es por tanto un carcter
cualitativo.
Clasificacin de variables.-
Variable discreta: si toma un nmero finito o infinito numerable de valores.
Variable continua: si toma un nmero infinito no numerable de valores.
Variable unidimensional: si se estudia slo un carcter cuantitativo en cada individuo.
Variable multidimensional: si se estudian varios caracteres cuantitativos a la vez.
Ejemplo:
En la primera actividad tenemos una variable estadstica discreta unidimensional.
En la tercera actividad tenemos una variable estadstica discreta unidimensional.
Frecuencia absoluta de una modalidad.-
Es el nmero de individuos de una muestra que han presentado esa modalidad. Se nota ni la
frecuencia absoluta de la modalidad i.
Ejemplo:
En la primera actividad la frecuencia absoluta de la modalidad 5 es 5, y la frecuencia absoluta de la
modalidad 4 es 3.
Frecuencia relativa de una modalidad.-
Es la proporcin de individuos que han presentado esa modalidad. Se nota fi la frecuencia relativa de
la modalidad i, y se calcula dividiendo la frecuencia absoluta por el tamao de la poblacin.
Ejemplo:
En la segunda actividad la frecuencia relativa de la modalidad pelo rubio es 6 : 33 = 0,18 y la
frecuencia relativa de la modalidad pelo moreno es 12 : 33 = 0,36.
Frecuencia absoluta acumulada de una modalidad.-
Este tipo de frecuencias solo se pueden definir en caracteres cuantitativos, o en caracteres
cualitativos que puedan ordenarse de mayor a menor. Se define la frecuencia absoluta acumulada
de una modalidad como el nmero de individuos que han presentado esta modalidad o una
modalidad menor. Se nota Ni la frecuencia absoluta de la modalidad y se verifica que:
Ni = n1 + n2 + ... + ni
Ejemplo:
En la primera actividad la frecuencia absoluta acumulada de la nota 5 es 25.
Frecuencia relativa acumulada de una modalidad.-
Se puede definir en los mismos casos que la frecuencia absoluta acumulada, y se define como el
cociente entre esta y el tamao de la muestra. Se nota Fi:
DISTRIBUCIN DE FRECUENCIAS
Llamamos distribucin de frecuencias al conjunto de valores que puede presentar una variable junto
con sus frecuencias, estas frecuencias pueden ser cualquiera de las anteriores.
Segn la naturaleza de la variable estudiada las distribuciones de frecuencias pueden ser:
Se llama amplitud del intervalo a la distancia que existe entre los extremos, y se nota ai:
ai = ei -ei-1
Se llama marca de clase al punto medio de un intervalo. Este punto es importante porque es el
representante del intervalo. Se nota xi:
xi = (ei + ei-1)/2
Se llama densidad de frecuencia de un intervalo a la frecuencia correspondiente a cada unidad de la
variable en dicho intervalo, se nota di:
di = ni /ai
Los intervalos se suelen tomar abiertos por la izquierda y cerrados por la derecha, salvo el primero
que se toma cerrado por los dos lados.
En este tipo de distribuciones se pierde parte de la informacin al agruparlas en intervalos, ya no se
puede hablar de valores concretas sino de intervalos. Cuanto mayor sea la amplitud de los intervalos
menos intervalos habr, y por tanto menos precisin tendremos. En cambio, cuanto menor sea la
amplitud de los intervalos menos intervalos habr, y mayor ser la precisin, sin embargo la
distribucin ser mas grande y ms dificil de manejar.
Ejemplo:
Las dos primeras actividades dan lugar a distribuciones de frecuencia no agrupadas, ya que son
variables discretas y presentan pocos valores, 11 en la primera actividad y 4 la segunda.
la tercera actividad da lugar a una distribucin de frecuencia agrupada en intervalos ya que aunque
es una variable discreta, presenta muchos valores, entre el 1,58 que es el valor ms pequeo que
presenta, y el 1,85 que es el ms grande, hay 27 valores. La eleccin de los intervalos depende de
nosotros, teniendo en cuenta que siempre es preferible que los intervalos sean todos de la misma
amplitud.
TABLAS ESTADSTICAS
Ya hemos introducido la terminologa adecuada, ahora vamos a utilizarla para ordenar y agrupar la
informacin. Lo primero que vamos a hacer es construir tablas estadsticas, en las que va a aparecer
toda la informacin de forma ordenada.
Llamamos tabla estadstica a la disposicin de forma ordenada y agrupada de los valores y
frecuencias de una distribucin. Distinguiremos entre tablas estadsticas de distribuciones no
agrupadas y tablas de distribuciones agrupadas.
TABLAS DE DISTRIBUCIONES NO AGRUPADAS.
En las tablas de distribuciones no agrupadas aparecen las siguientes columnas: la primera contiene
los valores de la distribucin, ordenados de menor a mayor si son caracteres cuantitativos; la
segunda contiene las frecuencias absolutas, la tercera las frecuencias relativas. Cuando la
frecuencias acumuladas se pueden definir se aaden otras dos columnas, una para las frecuencias
absolutas acumuladas y otra para las relativas acumuladas.
Ejemplo:
TABLA ESTADSTICA DE LA ACTIVIDAD 1, TOMANDO COMO POBLACIN TODA LA CLASE:
xi ni Ni fi Fi
0 2 2 0,04 0,04
1 3 5 0,06 0,10
2 6 11 0,12 0,22
3 6 17 0,12 0,34
4 3 20 0,06 0,40
5 5 25 0,10 0,50
6 5 30 0,10 0,60
7 8 38 0,16 0,76
8 6 44 0,12 0,88
9 4 48 0,08 0,96
10 2 50 0,04 1
Una vez construida la tabla es muy fcil responder a las tres primeras preguntas:
Cuntos alumnos han sacado un tres? La respuesta es n3 que vale 6.
Cuntos alumnos han suspendido? La respuesta es N4 que vale 20.
Cuntos alumnos han aprobado? La respuesta es 50-N4 que vale 50-20 = 30.
Para responder a la ltima pregunta: Han aprobado ms alumnos o alumnas? se podrian construir
dos tablas una tomando como poblacin los alumnos y otra tomando como poblacin las alumnas y
comparar las frecuencias acumuladas de la modalidad 5.
.
TABLA ESTADSTICA DE LA 2 ACTIVIDAD TOMANDO COMO POBLACIN TODA LA CLASE
xi ni fi
Rubio 6 0,18
Pelirojo 1 0,04
Moreno 12 0,36
Castao 14 0,32
33
Con esta tabla es fcil responder a las dos primeras preguntas: El color de pelo que tiene menos
gente es el pelirojo que slo hay 1 y el que tiene ms gente es el castao que lo tienen 14 alumnos.
Para responder a las otras preguntas vamos a construir la tabla correspondiente a considerar slo
los alumnos y la tabla correspondiente a considerar slo las alumnas.
xi ni fi xi ni fi
Rubio 2 0,13 Rubia 4 0,23
Pelirojo 1 0,07 Peliroja 0 0
Moreno 6 0,4 Morena 6 0,33
Castao 6 0,4 Castaa 8 0,44
Ahora es muy fcil viendo estas dos tabla responder a las dos ltimas preguntas de esta actividad:
Hay ms nias morenas, 6, que rubias, 4. Y hay ms nias rubias, 4, que nios, 2.
TABLAS DE DISTRIBUCIN AGRUPADAS EN INTERVALOS.
En las tablas estadsticas de distribuciones de frecuencia agrupadas por intervalos aparecen las
siguientes columnas: la primera con los intervalos, la segunda con las amplitudes de los intervalos, la
tercera con las marcas de clase, la cuarta con las frecuencias absolutas de cada intervalo, la cuarta
con las densidades de frecuencia y la quinta con las frecuencias relativas; adems suelen aparecer
tambien dos columnas ms con las frecuencias acumuladas. Si se toman los intervalos con la misma
amplitud no se ponen las columnas de amplitud ni de densidades, slo se seala cual es la amplitud
de todos los intervalos.
Ejemplo:
TABLA ESTADSTICA DE LA 3 ACTIVIDAD
En esta tabla vamos a considerar los intervalos de la misma amplitud, por lo que no vamos a
representar la columna de la amplitudes ni la de las densidades. Los intervalos que vamos a
considerar van a tener de amplitud 5 cm.
REPRESENTACIONES GRFICAS
El objetivo de las representaciones grficas es realizar una sntesis visual de la informacion aportada
por una distribucin de frecuencias. Segn la naturaleza del carcter estudiado tendremos diversos
tipos de representacin grfica:
Caracteres cualitativos.
Caracteres cuantitativos con distribuciones no agrupadas.
Caracteres cuantitativos con distribuciones agrupadas.
REPRESETACIONES GRFICAS DE CARCTERES CUALITATIVOS.
El principio que va a regir las representaciones grficas de caracteres cualitativos ser la
proporcionalidad de las reas de las figuras asignadas a cada modalidad respecto de su frecuencia
absoluta.
Diagrama de sectores.
Consiste en dividir un circulo en tantos sectores como modalidades presente el carcter. El rea de
cada sector deber ser proporcional a la frecuencia de la modalidad a la que representa. Esto se
consigue haciendo que el ngulo de cada sector sea proporcional a cada frecuencia.
Ejemplo:
DIAGRAMA DE SECTORES DE LA ACTIVIDAD 2.
Diagrama de barras.
Consiste en representar cada modalidad mediante un rectangulo cuya base ser siempre la misma y
cuya rea debera ser proporcional a su frecuencia absoluta. Esto se consigue poniendo la altura
proporcional a la frecuencia absoluta, ya que la base es igual para todos.
Ejemplo:
DIAGRAMA DE BARRAS DE LA ACTIVIDAD 2
Poligono de frecuencias.
Se obtiene a partir del diagrama de barras uniendo mediante una linea poligonal las diversas alturas
de las barras obtenidas.
Ejemplo:
POLIGONO DE FRECUENCIAS DE LA 1 ACTIVIDAD
Curva de distribucin.
Se llama funcin de distribucin a la funcin que asocia a cada valor real la proporcin de individuos
de la poblacin que presenta valores menores o iguales al valor considerado. Se representa F(x).
La representacin grfica de F(x) es la curva de distribucin. En el eje de abcisas se representan los
valores de la variable y en ordenadas las frecuencias.
Ejemplo:
CURVA DE DISTRIBUCIN DE LA 1 ACTIVIDAD
REPRESENTACIONES GRFICAS DE DISTRIBUCIONES AGRUPADAS.
Histograma de frecuencias.
Esta representacin consiste en una serie de rectangulos yuxtapuestos en el que las reas de cada
uno de ellos son proporcionales a la frecuencia absoluta o relativa de las modalidades a que
representa. Las bases de los rectngulos sern las amplitudes de los intervalos, pero la altura
dependiendo de si todas las amplitudes son iguales o no sern las frecuencias o las densidades de
frecuencias.
Ejemplo:
HISTOGRAMA DE FRECUENCIAS DE LA 3 ACTIVIDAD
En este caso estamos ante una distrubucin de frecuencias agrupada en la que como ya hicimos en
la construccin de la tabla estadstica vamos a considerar intervalos de la misma amplitud, por lo que
vamos a utilizar como altura de los rectngulos la frecuencias de cada intervalo.
Poligono de frecuencias.
Se obtiene a partir del histograma de frecuencias uniendo mediante una poligonal la alturas de cada
una de las marcas de clase de los intervalos considerados.
Ejemplo:
POLIGONO DE FRECUENCIAS DE LA 3 ACTIVIDAD
Curva de distribucin.
Se llama curva de distrucin a la representacin grfica de la funcin de distribucin que representa
la proporcin de individuos que han presentado valores menores o iguales que el valor considerado.
Ejemplo:
CURVA DE DISTRIBUCIN DE LA 3 ACTIVIDAD
MEDIDAS DE POSICIN
Las medidas de posicin solo podemos definirlas cuando estamos trabajando con variables
estadsticas, es decir, cuando estamos estudiando caracteres cuantitativos.
Las medidas de posicin tienen como objetivo centrar la distribucin, es decir, dar un valor nmerico
que pueda representar a toda la distribucin.
Las medidas de posicin que vamos a estudiar son:
Media aritmtica.
Mediana.
Moda.
MEDIA ARITMTICA
Se define la media aritmtica de una distribucin de frecuencias como la suma del producto de los
valores de la variable por sus frecuencias absolutas divido por el tamao de la poblacin. Se
nota :
MEDIDAS DE DISPERSIN
Las medidas de dispersin nos van a informar sobre el grado de esparcimiento de la distribucin, es
decir, nos van a decir si los valores que aparecen estan ms o menos concentrados. Por tanto, nos
van informar tambin sobre el grado de representatividad de la medidad de posicin, pues cuanto
ms concentrados esten los valores que toma la variable mejor representar un solo valor a toda la
distribucin.
Las medidas de dispersin que vamos a estudiar son:
Varianza.
Desviacin tpica.
Coeficiente de variacin.
VARIANZA
La varianza es una medida de dispersin que mide el grado de esparcimiento de una distribucin
alrededor de la media aritmtica. Cuanto ms grande sea la varianza ms esparcidos estarn los
Al igual que en la media aritmtica los xi representan a los valores de la variable si es una
distribucin no agrupada y a las marcas de clase si es una distribucin agrupada en intervalos.
La varianza es la suma de las desviaciones de los valores de la variable sobre la media aritmetica
ponderada por las frecuencias. Por tanto, cuanto menor sea la varianza ms agrupada estar la
distribucin en torno a su media aritmtica.
La varianza viene expresada en las misma unidades que la variable pero al cuadrado.
Ejemplo:
En la 1 actividad la varianza vale 7,64.
En la 2 actividad la varianza vale 0,005197 m* o lo que es lo mismo 51,917 cm*.
DESVIACIN TPICA
La desviacin tpica se define para obtener una medida de dispersin que venga expresadda en las
misma unidades que la variable. Se define como la raiz cuadrada de la varianza.
Ejemplo:
En la 1 actividad la desviacin tpica vale 2,76.
En la 2 actividad la desviacin tpica vale 0,072 m, o lo que es lo mismo 7,2 cm.
COEFICIENTE DE VARIACIN
Tanto la varianza como la desviacin tpica son medidas de dispersin absoluta, es decir, nos hablan
de la dispersin de la variable que estamos estudiando, pero no nos permiten comparar la dispersin
de dos distribuciones distintas.
El coeficiente de variacin es una medida de dispersin relativa que nos va permitir comparar dos
distribuciones distintas, se define como el cociente entre la desviacin tpica y la media aritmtica.
66 59 53 65 72 64 62 69 56 54 57 51
58 69 57 60 53 61 58 66 49 59 68 61
62 60 56 55 62 65
Calcula:
1. El tamao de la poblacin.
2. Construye una tabla estadstica asociada.
3. Construye el poligono de frecuencias asociado a esa tabla.
4. La media aritmtica, la mediana y la moda.
5. La varianza, la desviacin tpica y el coeficiente de variacin.
1 Actividad.-
1.- El tamao de la poblacin es 30.
2.-La tabla estadstica que se obtiene considerando la distribucin agrupada en intervalos de
amplitud 3 Kg es:
4.-La media aritmtica vale 60,6 Kg, la median 58,9 Kg y el intervalo modal es el 58-61 Kg.
5.- La varianza vale 29,69 Kg*, la desviacin tpica 5,45 Kg y el coeficiente de variacin vale 0,090.
2 Actividad.-
En la siguiente tabla se muestran los tiempos empleados en recorrer 100 metros y 400 metros por
cuatro personas.
100 m 400 m
1 persona 10 s 48 s
2 persona 10,6 s 50 s
3 persona 11 s 49 s
4 persona 10,5 s 50 s
1. Calcula la media aritmtica, la varianza y la desviacin tipica de la serie de tiempos de cada una de
la distancias.
2. Cul de las dos series estn ms dispersos los tiempos?
2 Actividad.-
1.- En la serie de tiempos empleados en los 100 m la media aritmtica es 10,525s, la varianza es
0,126 s* y la desviacin tpica 0,356 s. En la serie de los 400 m la media aritmtica es 49,250 s, la
varianza es 0,687 y la desviacin tpica es 0,829 s.
2.-Los tiempos de los 100 m. estn ms dispersos que los de los 400 m. pues el coeficiente de
variacin de los tiempos de los 100 m. es 0,033, que es mayor que el de los 400 m. que vale 0,016.
3 Actividad.-
Se estudia la nacionalidad de 1.450.000 extranjeros residentes en Espaa. La informacin obtenida
es la siguiente:
N de piezas defecuosas 0 1 2 3 4 5 6 7 8 9 10
N de cajas 6 9 10 11 14 16 16 9 4 3 2