Está en la página 1de 10

Distribucin de frecuencias

La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de


los datos estadsticos, asignando a cada dato su frecuencia correspondiente.
Tipos de frecuencias
Frecuencia absoluta
La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un
estudio estadstico.
Se representa por fi.
La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa
por N.
Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula) que
se lee suma o sumatoria.

Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor
y el nmero total de datos.
Se puede expresar en tantos por ciento y se representa por ni.

La suma de las frecuencias relativas es igual a 1.


Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores
inferiores o iguales al valor considerado.
Se representa por Fi.
Frecuencia relativa acumulada
La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un
determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento.
Ejemplo:
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas
mximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30,
31, 34, 33, 33, 29, 29.
En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la
segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta.

xi
27
28
29
30

Recuento
I
II

fi
1
2
6

Fi
1
3
9

ni
0.032
0.065
0.194

Ni
0.032
0.097
0.290

16

0.226

0.516

31
32
33
34

8
24
0.258
0.774
III
3
27
0.097
0.871
III
3
30
0.097
0.968
I
1
31
0.032
1
31
1
Este tipo de tablas de frecuencias se utiliza con variables discretas.
Representacin grfica
Los grficos que representan de manera adecuada una distribucin de frecuencias son:

Histograma de frecuencia
Est formado por un conjunto de rectngulos, cada uno levantado para cada intervalo,
de tal manera que la base ser igual a la amplitud C y la altura est dado, ya sea por
la frecuencia absoluta o por la relativa. En el ejemplo de las ventas, (tabla anterior)
tenemos:

Polgono de frecuencia
Con la misma informacin que fue utilizada para elaborar el histograma de frecuencia se
puede dibujar el polgono de frecuencia. Se establece los puntos medios del intervalo,
denominados marca de clase, que se colocan en el eje horizontal o abscisa. Para cada
valor de la variable corresponder un valor de la frecuencia sealndose en el plano
cartesiano por un punto; luego de establecidos todos los puntos, se unen mediante lneas
rectas, las que en conjunto forman el polgono. El polgono de frecuencia para el ejemplo
anterior es:


Ojiva
Es el grfico de las frecuencias acumuladas. Para el trazado de esta grafica, en primer lugar,
se ubican los puntos en el plano cartesiano. Dichos puntos se determinan teniendo en cuenta
la marca de clase (eje x) y las frecuencias absolutas o relativas acumuladas (eje y) tal como
se presenta a continuacin:

MEDIDAS DE TENDENCIA CENTRAL O DE CENTRALIZACIN.


Las medidas de tendencia central,dan una idea de un nmero alrededor del cual tienden a
concentrarse todo un conjunto de datos.
Las medidas de tendencia central mas comnmente usadas son:
La media Aritmtica, la mediana y el modo; cada una de stas medidas es representativa de
una serie de datos en una forma particular.
La media aritmtica es la que frecuentemente se le denomina promedio, sin embargo, el
trmino es utilizado tambin para las otras medidas de tendencia central.

CALCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO


AGRUPADOS:
LA MEDIA ARITMTICA ( X )
An y cuando existen varias media, la media aritmtica es la mas frecuentemente utilizada
en Estadstica. La media aritmtica, es la suma de las puntuaciones o valores originales
dividida entre el
nmero de ellas.
EJEMPLO. Las calificaciones en una evaluacin sobre 100 puntos fueron:60,55,70,70,85 y
80. Luego, X = 420 = 70.
( La calificacin media es 70 puntos.) 6
Nota: Las puntuaciones extremas afectan o modifican la media, a saber:
En los grupos de valores 1,3,5,5,5,6 y 1,3,5,5,5,110 las medias
son 4.2 en el primer grupo y 21.5 en el segundo. Estos dos grupos no tienen la misma media,
por lo tanto,En un conjunto de valores donde existen valores muy extremos, no se debe
calcular la media
LA MEDIANA (Md)
Es el punto medio, arriba o debajo del cual caen el 50% de las puntuaciones o casos. Para
calcular la mediana, se ordenan las puntuaciones en orden creciente o decreciente. En caso
de ser el nmero de datos impar, la mediana es el valor central; en el caso de ser par, la
mediana es el promedio de los valores centrales.
EJEMPLO. (a) 6,11,9,12,13,10,20,15,17. Al ordenarlos se obtiene:
6,9,10,11,12,13,15,17,20. La mediana es 12. Md=12
(b) 9,10,12,11,3,6,20,17,13,15. Al ordenarlos se obtiene:
3,6,9,10,11,12,13,15,17,20. La mediana es el promedio entre 11 y 12, por haber dos
valorescentrales. Md= 11.5
Nota: Una caracterstica de la mediana es su insensibilidad hacia los valores extremos. As,
en el conjunto de valores: 2,3,8,11,48la Md= 8; esto es verdad an y cuando hay un valor
extremo de 48. Si cambiamos ste valor por 98 la mediana seguira siendo la misma.
Esta caracterstica de la mediana la hace muy til para la descripcin de la tendencia central
en ciertos tipos de distribuciones en las cuales la media es una medida inaceptable de
tendencia central, debido a su sensibilidad hacia las calificaciones extremas.
EL MODO (Mo). DENOMINADO TAMBIEN MODA.
Es el valor que aparece con mas frecuencia en una serie de datos.

EJEMPLO. 1,1,2,2,2,3,3,3,3,4,5,6,8. La cifra 3 aparece cuatro veces lo cual es mas frecuente


que otro valor; por lo cual el valor modal o modo es 3. ( Mo=3)
1,1,2,2,2,2,3,3,3,4,4,4,4,5,6,7,8.
Las cifras 2 y 4 aparecen cuatro veces.
Luego Mo= 2,(Bimodal)
Cuando aparecen tres o mas veces se denomina Multimodal.
CALCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL
(PARA DATOS AGRUPADOS)
MEDIA ARITMTICA.(X)
Cuando se tienen distribuciones de frecuencia y siempre que el valor del intervalo de clase
sea constante, es decir, el mismo en cada una de las clases, se puede calcular la Media a
travs del Mtodo de los desvos unitarios o Abreviado; Igualmente se puede utilizar el
Mtodo directo.
METODO ABREVIADO. Pasos para calcular la Media Aritmtica:
1.- Se elige una media aritmtica supuesta (Xa), la cual es el valor del punto medio de una de
las clases; Aunque puede tomarse el punto medio de cualquiera de las clases y obtener el
mismo resultado, por facilidad en el clculo se acostumbra a elegir el de la clase de mayor
frecuencia o el de aquella que est ubicada hacia en el centro de la escala.(En el
ejemplo,tomaremos Xa=49 ubicado en 48-50)
2.- Se anexa otra columna X, en la cual se anotan las desviaciones respecto a la media
supuesta. Como la clase 48-50 contiene a Xa, la desviacin es nula, por lo cual anotamos
cero en la columna X. El intervalo o clase 51-53 se desva una clase de la que contiene a la
media supuesta, luego, en la columna X anotamos uno (1) para dicho intervalo. Se contina
as hasta llegar a la clase mayor.
A las clases con valores inferiores, se les asigna consecutivamente Los nmeros enteros
negativos: -1,-2,-3,-4,-5,...
3.- Se anexa otra columna fiX en la cual se colocan los productos entre la frecuencias fi y la
desviacin X correspondiente.
4.- Se suman algebraicamente los valores de la columna fiX.
5.- Se reemplazan los valores obtenidos en la frmula:
X = Xa + EfiX. i
N
EJEMPLO:
CLASE fi x fix
66-68 1 6 6
63-65 2 5 10
60-62 4 4 16

57-59 4 3 12
54-56 5 2 10
51-53 7 1 7 x = 49 + 2.05
48-50 8 0 0
45-47 5 -1 -5 x = 51.05
42-44 3 -2 -6
39-41 2 -3 -6 El puntaje medio es: 51.05
36-38 1 -4 -4
33-35 2 -5 -10
METODO DIRECTO. (Mtodo largo)
Pasos para calcular la media aritmtica, usando ste mtodo:
1.- Se elabora una columna con los puntos medios xi de cada clase.
2.- En otra columna se escribe el producto entre las frecuencias y el punto medio de cada
clase (fi.xi)
3.- Se obtiene la sumatoria de los valores de la columna fi.xi
4.- Se reemplazan los valores obtenidos en la frmula siguiente:
EJEMPLO:
CLASE fi xi fixi
66-68 1 67 67
63-65 2 64 128
60-62 4 61 244
57-59 4 58 232 x= 2246
54-56 5 55 275 44
51-53 7 52 364 x = 51.05
48-50 8 49 392
45-47 5 46 230
42-44 3 43 129
39-41 2 40 80
36-38 1 37 37
33-35 2 34 68
N=44 Efixi= 2246
LA MEDIANA. (Md)
Para calcular la mediana a partir de un conjunto de datos que han sido organizados
previamente en una tabla de distribucin de frecuencias, se procede de la siguiente manera:
1.- Se anexa a la tabla dada una columna fa de frecuencias acumuladas.
2.- Se divide entre 2 el nmero total de casos, obteniendo N/2.Es decir,se determina el
nmero de casos que han de estar por debajo y por encima de la mediana.(En la tabla del
ejemplo que usaremos, N=38 por lo tanto N/2= 38/2= 19. Luego, la mediana es el valor que
deja 19 observaciones tanto por debajo como por encima de l.
3.- Se identifica en la columna fa, un valor que sea igual o inmediato superior a N/2; En sta

clase est la mediana.(En la tabla del ejemplo dado, en la columna fa, el valor 24 es
inmediato superior a 19 por lo cual, la clase 90-94 contiene a la mediana.)
4.- Se identifica la frecuencia acumulada fa de la clase anterior a la que contiene a la
mediana. ( En el ejemplo, 14 es la frecuencia acumulada de la clase 85-89 que precede a 9094 que contiene a la mediana.)
5.- Se identifica la frecuencia fi de la clase que contiene a la mediana. En el ejemplo sta es
10.
6.- Se identifica el lmite real inferior de la clase que contiene a la mediana. En el ejemplo,
ste es 89.5.
7.- Se reemplazan stos valores en la frmula
EJEMPLO:
CLASE fi fa
95-99 14 38
90-94 10 24
85-89 6 14 Md = 89.5 + 2.5
80-84 4 8
75-79 2 4 Md = 92
70-74 2 2
N=38
Interpretacin:
Por encima y por debajo de 92,se encuentra el 50% de los casos, es decir, 19.
LA MODA O EL MODO. (Mo)
Se define como el punto medio de la CLASE de mayor frecuencia.
En el primer ejemplo, Mo=49.
En el segundo ejemplo, Mo=97

MEDIDAS DE VARIABILIDAD

Las medidas de variabilidad nos informan sobre el grado de concentracin o dispersin que
presentan los datos respecto a su promedio. Llamaremos homognea, concentrada o poco

dispersa a aquella distribucin en la que todos los datos estn cercanos al centro, como 4 4 5
5 5 5 6 6 6 6 7, y heterognea o dispersa a la distribucin con datos ms separados del
centro, como 1 3 5 8 10 16 20.
Existen muchas formas de medir la variabilidad. Se Destacan las ms importantes:
RANGO
Tambin llamado Recorrido o Amplitud total, es la diferencia entre el mximo valor del
conjunto de datos y el mnimo de ellos. A mayor rango, mayor dispersin.
El rango del conjunto 4 6 4 7 8 6 5 3 4 7 7 9 6 5 es 6, la diferencia entre el mximo 9 y el
mnimo 3.
A veces se usa el Rango verdadero que consiste en considerar cada dato rodeado de una
unidad, por efecto de los redondeos, con lo que en el ejemplo anterior el mnimo sera 2,5 y
el mximo 9,5. Con ello el rango se convertira en 7.
No es una medida buena, pues ignora todo lo que ocurre dentro de ese rango.
DESVIACIN MEDIA
Es una medida de la dispersin consistente en la media aritmtica de las desviaciones
individuales respecto a la media, tomadas en valor absoluto. Tambin se usan desviaciones
respecto a la mediana.
VARIANZA
Es una medida muy sensible de la variabilidad y base de muchas tcnicas estadsticas.
Junto con la media forma el conjunto ms importante de medidas.
Es propia de las medidas de intervalo o razn. Su inconveniente es que no usa la misma
unidad que los datos, sino su cuadrado.
No se deben comparar varianzas en conjuntos de unidades muy distintas, como estatura e
inteligencia.
En teora del muestreo se sustituye por la cuasi-varianza, de idntica frmula, pero con
cociente N-1 en lugar de N. En este caso no sera vlida la segunda frmula.
DESVIACIN TPICA
Es la raz cuadrada de la anterior. Su objeto es conseguir medir la variabilidad en las mismas
unidades que los datos. As, un conjunto medido en metros, tendr la varianza medida en
metros cuadrados, pero la desviacin tpica en metros.
Como en la varianza, para datos aislados basta con suprimir las frecuencias ni.
La desviacin tpica s es base de muchas tcnicas, al igual que la media y la varianza. Su
gran ventaja es estar medida en las mismas unidades que los datos y la media, lo que
permite establecer razones y proporciones entre ellas.
La desviacin tpica cumple la llamada desigualdad de Tchebychev: segn la cual, los datos
que se alejan de la media una distancia igual o menor que s, multiplicado por un coeficiente k
suponen ms de la proporcin 1-1/k2. As, el 75% de los datos al menos, se encuentra a
menos de dos desviaciones tpicas y el 89% a menos de tres.

Coeficiente de Variacion
El coeficiente de variacin es la relacin entre la desviacin tpica de una muestra y su
media.

El coeficiente de variacin se suele expresar en porcentajes:

El coeficiente de variacin permite comparar las dispersiones de dos distribuciones


distintas, siempre que sus medias sean positivas.
Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan
entre s.
La mayor dispersin corresponder al valor del coeficiente de variacin mayor.
Ejercicio:
Una distribucin tiene x = 140 y = 28.28 y otra x = 150 y = 24. Cul de las dos presenta
mayor dispersin?

La primera distribucin presenta mayor dispersin.


Excel como una herramienta asequible en la enseanza de la Estadstica
Introduccin
Actualmente la presencia de la computadora en los programas educativos se ha vuelto una
constante. En las ltimas dcadas en los llamados pases desarrollados el coeficiente de
estudiante por computadora ha ido cambiando drsticamente, tal es el caso de Estados
Unidos donde en Dakota del Norte se informa que este es de dos estudiantes por una
computadora[1]. Ciertamente nuestros pases an estn lejos de este ndice pero, no
podemos dejar de reconocer la presencia cada vez mayor de esta herramienta en las
instituciones educativas.
De la misma forma en que ha aumentado la disponibilidad de computadores en la educacin
y en sus programas, tambin lo ha hecho su uso. En la actualidad, es comn que los
programas y asignaturas en muchas instituciones de educacin Bsica y Media incluyan la
utilizacin del procesador de texto, mientras que en el nivel medio superior les soliciten el
usar CD ROMS o bien el navegar en la Red.
La Hoja de Clculo como herramienta
La Hoja de Clculo puede convertirse en una poderosa herramienta para crear ambientes de
aprendizaje que enriquezcan la representacin (modelado), comprensin y solucin de
problemas, especialmente en el rea de matemticas. Desafortunadamente, la mayora de
docentes y estudiantes nos limitamos a utilizar slo funciones bsicas de ella, como tabular

informacin y realizar clculos mediante formulas, desconociendo que ofrece funcionalidades


que van ms all de la tabulacin, clculo de frmulas y graficacin de datos, permitiendo
crear y hacer uso de simulaciones que posibilitan a los estudiantes para realizar
representaciones que permiten construir un puente entre las ideas intuitivas y los conceptos
formales.
Excel y la Estadstica
Si nos enfocamos al uso de la hoja de clculo en la Estadstica, es importante primero,
realizar algunas consideraciones detectadas a lo largo de varios aos de guiar en el
conocimiento de esta disciplina, antes de entrar en materia.

En la actualidad se est reconociendo la importancia de la probabilidad y la estadstica


dentro de los programas educativos, como una asignatura que fortalece la toma de
decisiones.

A nivel universitario los cursos de estadstica se incluyen prcticamente en todas las


especialidades, ya sea como probabilidad y estadstica, bioestadstica, teora del muestreo o
con algn otro nombre, hoy en da la estadstica se encuentra presente en los diferentes
campos de la ciencia.

También podría gustarte