Está en la página 1de 9

UNIVERSIDAD NACIONAL DE ASUNCIÓN

FACULTAD DE FILOSOFÍA

Carrera: Psicología Módulo: Estadística

UNIDAD II: DESCRIPCION DE LOS DATOS

Distribución de frecuencias - Proceso de tabulación de la información

Luego de que mediante la observación estadística se captaran los datos y atributos del
fenómeno-objeto de estudio, se hace necesario proceder a tabular esta información con el
objetivo de conocer estadísticamente el fenómeno. A este proceso de tabulación de la
información se la llama distribución de frecuencias, y lo definiremos como un método para
organizar y resumir datos en una tabla estadística.

La representación de los datos: FRECUENCIAS.

Cuando se reúne gran cantidad de datos primarios es útil distribuirlos en clases y


categorías y determinar las frecuencias de las clases, o sea, el número de elementos que
pertenecen a una clase. El ordenamiento tabular de los datos por clases conjuntamente con
las frecuencias de clases se denomina distribución de frecuencias

El caso que se describe a continuación, variables discretas se denomina distribución por


conteo de valores individuales. Supongamos que un determinado colectivo, representado
por la variable estadística , que para mayor sencillez consideraremos como
unidimensional; sean los datos de esta variable (representativo cada uno de ellos de un
suceso) , ,… , , (supuesto que sean los valores de la variable considerada.)

Definiremos como frecuencia de un dato el número de veces que este aparece en el


colectivo; consecuentemente, si una variable estadística toma r valores, cada uno de los
cuales puede repetirse un cierto número de veces, podríamos decir que el número de datos
representado por la variable serían , siendo la suma de las respectivas frecuencias de
cada dato ( ).

Este valor será denominado como frecuencia total, mientras que la frecuencia de cada
dato recibirá el nombre de frecuencia absoluta o simplemente frecuencia ( ). La frecuencia
absoluta nos habla del número de veces que un dato aparece en un colectivo, más ello no
nos dice demasiado en orden al establecimiento de comparaciones sobre la importancia de
este dato. Para obtener una idea de la importancia que un dato posee en el seno de un
colectivo, puesto que no es suficiente concepto de frecuencia, se utiliza el concepto
frecuencia relativa, que se definirá como: el coeficiente entre la frecuencia absoluta del dato
considerado y la frecuencia total ( ).

Para efectos prácticos, asumiremos las siguientes definiciones de frecuencias:

 Frecuencias absolutas: es el número de veces que aparece en la muestra dicho


valor de la variable y se representa por .

 Frecuencias relativas: es el cociente entre la frecuencia absoluta y el tamaño de la


muestra. La denotaremos por

Profesora: Cristina Knoop de Bueno Página 1 de 9 Profesor: Luis Gómez Martínez


UNIVERSIDAD NACIONAL DE ASUNCIÓN
FACULTAD DE FILOSOFÍA

Carrera: Psicología Módulo: Estadística

 Frecuencias absoluta acumulada: para poder calcular este tipo de frecuencias hay
que tener en cuenta que la variable estadística ha de ser cuantitativa o cualitativa
ordenable. En otro caso no tiene mucho sentido el cálculo de esta frecuencia. La
frecuencia absoluta acumulada de un valor de la variable, es el número de veces que
ha aparecido en la muestra un valor menor o igual que el de la variable y lo
representaremos por , se puede acumular, en la tabla estadística en orden
ascendente ( ↑) o descendente ( ↓).

 Frecuencia relativa acumulada: al igual que en el caso anterior se calcula como el


cociente entre la frecuencia absoluta acumulada dividido por el tamaño de la muestra
( ) y la denotaremos por .

Resumiendo lo expuesto, si es un valor de la variable, podemos representar por a su


frecuencia y por a su frecuencia relativa (siendo o la frecuencia total). Para
el conjunto de los valores de la variable tendríamos, así la tabla #1, compresiva de la
información sobre dicha variable, a través de las respectivas frecuencias:

Variables Discretas
Valores de la frecuencias Frecuencias
variable Xi absolutas relativas
(datos) fi fi/N
X1 f1 f1/N
X2 f2 f2/N
… … …
… … …
Xn fn fn/N

DATOS AGRUPADOS

Otro es el caso de las clases representadas en forma de intervalos, variables continuas,


llamados intervalos de clases que poseen extremos llamados limite inferior y limite
superior, Un intervalo se dice que es abierto o no cerrado, por un extremo si no
contiene el límite correspondiente.

La longitud, tamaño o amplitud de un intervalo de clases ( ) es la diferencia entre los


limites superior e inferior ( – ). El Recorrido o Rango ( ) es la diferencia
entre el dato mayor y el menor del conjunto da datos en estudio ( – )

En el caso de variables continuas será necesario fijar intervalos de frecuencias para llegar a
un resumen efectivo de la información original. A menudo es necesario representar una
clase, o más particularmente, un intervalo por un único valor, este representará a todo el
intervalo y se denominará marca de clases. Matemáticamente el punto medio de cada
intervalo corresponde a lo que denominamos marca de clase, se denotará por , y
constituirá el valor representativo de cada intervalo. El número de observaciones que
correspondan a cada intervalo se denominará frecuencias absolutas.

Profesora: Cristina Knoop de Bueno Página 2 de 9 Profesor: Luis Gómez Martínez


UNIVERSIDAD NACIONAL DE ASUNCIÓN
FACULTAD DE FILOSOFÍA

Carrera: Psicología Módulo: Estadística

Variables Continuas
Intervalos Marcas de Clases Frecuencias Absolutas
(C) Xi fi
X1-X2 X1 f1
X2-X3 X2 f2
… … …
… … …
Xn-1-Xn Xn fn

X ` X ``
Donde Xi   marca de clase
2
N = Σfi = Número de observaciones
C = X’ – X” = Amplitud del intervalo

Por último, en el caso de variables no mensurables, dicha tabla adoptará una forma
como la siguiente:
Variable Ordinales
Variable Frecuencias
Característica A fA
Característica B fB
… …
… …
Característica Z fZ

Reglas Generales para construir las distribuciones de frecuencias por intervalos


a) Efectuar el arreglo ordenado (Ascendente o Descendente) de la población o muestra

b) Obtener la frecuencia absoluta mediante la tabulación o conteo de los datos (homogenizar los
datos)
c) Encontrar el rango o recorrido (R) de los datos:
– –
d) Encontrar el número de clases o intervalos de clases (K). El número de clases debe ser tal que se
evite el detalle innecesario, pero que no conduzca a la perdida de más información de la que puede
ser convenientemente ignorada. Para este cálculo se utiliza la formula de Sturges

e) Determinar la amplitud de la clase ( C ):


c

Nota: el resultado siempre se aproxima al siguiente entero si excede al número entero obtenido, no
importa el monto de la fracción excedida al entero

Profesora: Cristina Knoop de Bueno Página 3 de 9 Profesor: Luis Gómez Martínez


UNIVERSIDAD NACIONAL DE ASUNCIÓN
FACULTAD DE FILOSOFÍA

Carrera: Psicología Módulo: Estadística

f) El dato menor ( ) será el limite inferior de la primera clase. A él se le suma y se obtiene el


límite superior de la primera clase que también será el límite inferior de la segunda clase. Luego
se suma nuevamente y se obtiene el límite superior del segundo intervalo e inferior del tercero.
Y así sucesivamente hasta que el limite superior corresponda o supere ligeramente el valor mayor (
), la cantidad de clases obtenidas deberá corresponder con el número calculado mediante la
formula de Sturges.
g) Una vez construidos los intervalos se calculan, mediante tabulación de acuerdo a los límites
inferiores y superiores de las clases, las frecuencias absolutas, relativas, porcentuales y
acumuladas correspondientes.
h) Con los datos obtenidos se procede a construir la tabla de distribución de frecuencia.

Ejemplo 1: Tabla de distribución de frecuencias para datos simples:

Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas
máximas:

32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29,
29.

En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda


anotamos la frecuencia absoluta, en la tercera calculamos las relativas y también las frecuencias
porcentuales y las acumuladas.

Variable Frec. Abs. Frec. Relat. Frec. Porc. Frec. Acum.


xi fi fri fp Fi
“Temperaturas “Cantidad
Máximas” de días”
27 1 1/31= 0,032 0,032*100= 3,2 1
28 2 2/31= 0,064 0,064*100= 6,5 1+2= 3
29 6 6/31= 0,194 0,194*100= 19,4 1+2+6= 9
30 7 7/31= 0,226 0,226*100= 22,6 1+2+6+7=16
31 8 8/31= 0,258 0,258*100= 25,8 1+2+6+7+8= 24
32 3 3/31= 0,097 0,097*100= 9,7 1+2+6+7+8+3= 27
33 3 3/31= 0,097 0,097*100= 9,7 1+2+6+7+8+3+3=30
34 1 1/31= 0,032 0,032*100= 3,2 1+2+6+7+8+3+3+1=
31
Totales 31 1

Ejemplo 2: Tabla de frecuencias para datos agrupados

Los directivos de una empresa comercial desean realizar una investigación sobre algunas
características laborales de sus vendedores. Uno de sus propósitos específicos es entender el
patrón que sigue el tiempo de trabajo semanal de los trabajadores. Al respecto, se decide
construir una distribución de frecuencias para el número de horas que laboran en la empresa los
trabajadores, la semana anterior. Para una muestra de 80 trabajadores, se obtuvieron los
siguientes resultados:

Profesora: Cristina Knoop de Bueno Página 4 de 9 Profesor: Luis Gómez Martínez


UNIVERSIDAD NACIONAL DE ASUNCIÓN
FACULTAD DE FILOSOFÍA

Carrera: Psicología Módulo: Estadística

40 45 37 41 37 40 40 46 50 30 40 45 37 56 40 40
40 57 55 40 40 55 80 40 45 40 60 40 42 40 38 47
40 38 38 45 40 45 40 40 40 40 48 60 40 40 44 40
50 40 40 55 48 31 50 68 40 40 70 40 50 50 40 60
32 76 50 40 60 40 50 40 45 32 40 50 35 50 40 60

Se construirá una distribución de frecuencias para datos agrupados en intervalos y calcular e


interpretar los diferentes tipos de frecuencias. El procedimiento es el siguiente:

 Los valores máximo y mínimo son: Xmax = 80 horas y Xmin = 30 horas.


 Asumiendo que no se tiene establecido un determinado número de intervalos, se utilizará
la fórmula de Sturges, obteniéndose, en este caso:
K  1  3.3xLog (80)  7.28

 Calcular la amplitud del intervalo, se obtiene: C  (80  30) / 7  7.14 , entonces, un valor
adecuado para la amplitud del intervalo se obtiene redondeando hacia el entero mayor,
es decir, C=8.
 Los intervalos para K=7 y C=8 , son: [30 – 37], [38 – 45],…. [78 – 85].
 Construcción de la tabla de conteo.

Intervalos xi fi f.r. f.a. f.a.r.


(Marca de clase)

30 - 37 34 8 0.10 8 0.10
38 - 45 42 45 0.56 53 0.66
46 - 53 50 13 0.16 66 0.82
54 - 61 58 10 0.13 76 0.95
62 - 69 66 1 0.01 77 0.96
70 - 77 74 2 0.03 79 0.99
78 - 85 82 1 0.01 80 1.00
Total 80 1.00

Observación:
Debe tenerse en cuenta que la fórmula de Sturges proporciona un valor aproximado del número
de clases para la distribución, por lo tanto se puede construir otras distribuciones para otros
valores de m cercanos al valor de k y luego escoger la que se considere mejor.
Un criterio utilizado frecuentemente al construir distribuciones de frecuencias es utilizar amplitudes
de clase sean múltiplos de 5 , 10 y 100, etc., o de otros valores con los que sea fácil operar, con la
finalidad de facilitar la lectura y utilización de la tabla resultante.

Profesora: Cristina Knoop de Bueno Página 5 de 9 Profesor: Luis Gómez Martínez


UNIVERSIDAD NACIONAL DE ASUNCIÓN
FACULTAD DE FILOSOFÍA

Carrera: Psicología Módulo: Estadística

Para K=8
Para C=10
Intervalos fi
Intervalos fi
30 - 36 5
30 - 39 11
37 - 43 41
40 - 49 46
44 - 50 20
50 - 59 14
51 - 58 5
60 - 69 6
58 - 65 5
70 - 79 2
65 - 72 2
80 - 89 1
72 - 78 1
Total 80
79 - 85 1
Total 80

Representaciones Gráficas de la Distribución de Frecuencias para datos


continuos.

Los Gráficos Estadísticos:

El gráfico es quizás el auxiliar más valioso y utilizado para expresar datos estadísticos, este
elemento no le añade novedad a las tablas o cuadros estadísticos, es de fácil comprensión y
accesible a un número mayor de usuarios. El gráfico además de expresar visualmente los
hechos más importantes de la información numérica, permite una mejor y más fácil
comprensión y ahorra tiempo y esfuerzo en el análisis de datos estadísticos al facilitar su
apreciación visual en forma conjunta:

Histogramas de frecuencias:

Un histograma es un gráfico que sirve para Histograma de frecuencias del


representar una distribución de frecuencias. Este tiempo de trabajo laboral
gráfico está formado por un conjunto de rectángulos
Cantidad de empleados

(caso de variables continuas) que tienen como base


un eje horizontal (generalmente el eje de las abscisas
o de las X), y como centro los puntos medios de las
clases. Los anchos de las clases y las áreas de los
rectángulos son proporcionales a las frecuencias de
las clases. En el caso de las variables discretas el
gráfico consiste de un conjunto de barras verticales en
lugar de rectángulos, hallándose cada barra sobre la
observación respectiva y con una altura proporcional a Horas trabajadas
la frecuencia de la observación

Profesora: Cristina Knoop de Bueno Página 6 de 9 Profesor: Luis Gómez Martínez


UNIVERSIDAD NACIONAL DE ASUNCIÓN
FACULTAD DE FILOSOFÍA

Carrera: Psicología Módulo: Estadística

Polígono de frecuencias:

El polígono de frecuencias es un gráfico formado por


líneas quebradas, que tiene los centros de las clases
representadas en un eje horizontal (eje de las X) y las
frecuencias de las clases en un eje vertical (eje de las
Y). La frecuencia correspondiente a cada centro de
clase se señala mediante un punto y luego los puntos
consecutivos se unen por líneas rectas. Del
correspondiente histograma se puede lograr el
polígono de frecuencia uniendo los puntos medios de
las bases superiores de cada rectángulo mediante
líneas rectas.

Ojivas:

Las ojivas se refieren a los gráficos que se construyen


utilizando una distribución acumulativa de frecuencias,
el orden de acumulación se aplica al cuadro de
distribución de frecuencia y puede ser descendente
OJIVA OMENOS (fa↓, fra↓) o ascendente OJIVA
OMAS (fa↑, fra↑). La figura que se forma al unir los
puntos del polígono de frecuencias acumulativas es lo
contrario del orden anunciado (por ejemplo si se utilizó
el orden descendente en la acumulación de los datos
en el cuadro, la ojiva resulta ser ascendente).

Profesora: Cristina Knoop de Bueno Página 7 de 9 Profesor: Luis Gómez Martínez


UNIVERSIDAD NACIONAL DE ASUNCIÓN
FACULTAD DE FILOSOFÍA

Carrera: Psicología Módulo: Estadística

Ejercicios:

1) En el departamento de Ciencias Básicas se ha tomado una prueba de aptitud de


ingreso para acceder a una beca de iniciación a la investigación, de la
mencionada prueba tomaron parte 30 profesionales, de los cuales se conocen
sus calificaciones en base de una escala de 100 puntos.

58 64 75 83 91 59 77 84 90 67
63 69 70 85 68 83 74 73 61 68
75 83 88 87 81 74 76 70 65 69

Calcula:
a. Rango(R)
b. Tamaño o anchura (C)
c. Número de intervalos(K)
d. Define los intervalos de clases.
e. Límites reales de la 4º clase
f. Límites reales de la 3º clase
g. Marca de clase
h. Distribución de frecuencias relativas
i. Distribución de frecuencias acumulada o más
j. Distribución de frecuencias acumulada menor que

2) En la siguiente matriz de datos cuantitativos se muestran los puntajes obtenidos


por los alumnos del 4° Curso de Economía, en el examen de Administración
Financiera. UNA. Año 2010

Cuadro Nº 1: Puntajes de alumnos de Economía.


63 82 68 90 47
57 88 82 77 44
82 74 92 74 54
74 54 51 93 53
62 59 75 69 51
52 62 78 74 62
Fuente: Planillas de Puntajes de los alumnos. Secretaria Economía.
UNA

1-Formar una tabla de distribución de frecuencias por Sturges.


2-Representar con un Histograma e interpretar dicho grafico.

Profesora: Cristina Knoop de Bueno Página 8 de 9 Profesor: Luis Gómez Martínez


UNIVERSIDAD NACIONAL DE ASUNCIÓN
FACULTAD DE FILOSOFÍA

Carrera: Psicología Módulo: Estadística

3) El siguiente cuadro muestra los años de antigüedad laboral en una institución


educativa de 50 personas compuestas de docentes y personal administrativo.

5 3 6 5 6 6 5 7 7 5
8 10 8 10 8 12 12 8 9 7
3 3 2 8 12 11 11 6 5 3
5 12 12 5 10 5 11 5 12 9
10 12 11 9 8 7 12 6 10 10
FUENTE: FICHA PERSONAL. RECURSOS HUMANOS. COLEGIO XX. AÑO 2011
Se pide:
1. Confeccione una tabla de frecuencias aplicando la Fla. de Sturges.
2. Grafique mediante un histograma e interpretar dicho gráfico.
3. ¿Cuántos trabajadores tienen más o igual de 9 años de antigüedad?

4) El siguiente cuadro representa los Años de Servicio de los docentes de la


Región 1 de Concepción.
 Representar con un histograma, analizar gráficamente y sacar
conclusiones válidas para la toma de decisión.

Años de Servicio(xi) Cantidad de docentes Marca de clase (M.C)


(fa)
1-4 15
5-8 17
9-12 9
13-16 6
17-20 2
21-24 3
25-28 3
Total 55

Profesora: Cristina Knoop de Bueno Página 9 de 9 Profesor: Luis Gómez Martínez

También podría gustarte