Está en la página 1de 6

SESIÓN 7

DATOS AGRUPADOS

INTRODUCCIÓN: Cuando el rango de una serie de información es muy grande se deben agrupar los
datos para poder desarrollar cualquier análisis estadístico, por ejemplo si se desea realizar una
investigación con una muestra aleatoria con los sueldos mensuales de 800 trabajadores de Coca
Cola, el trabajador de menor sueldo podría ganar $4,000 y el que gane más de los trabajadores de
la muestra podría tener un sueldo mensual de $50,000, por lo que sería imposible trabajar sin
agrupar la información, la gráfica de barras o polígono de frecuencias podría tener en forma
horizontal hasta 800 datos.
OBJETIVO: Al finalizar la sesión el alumno será capaz de comprender en qué casos se debe agrupar
la información además elaborar tablas de frecuencia, gráficas estadísticas, calcular medidas de
tendencia central, medidas de dispersión y medidas posicionales. Pero sobre todo aplicarlos en su
área del conocimiento.
DESARROLLO: Por medio de la solución de problemas de aplicación se establecen las condiciones
para determinar en qué momento se deben utilizar datos agrupados y no agrupados.
Utilizando problemáticas reales se establecerá necesidad de agrupar información para realizar
investigaciones, análisis, metodologías.
Se definirán los conceptos básicos para la agrupación de información, se elaboraran intervalos de
confianza con medidas de tendencia central, de dispersión además con medidas posicionales.

A continuación definiremos los conceptos básicos para el desarrollo de la sesión.

Rango: Diferencia entre el dato mayor y el menor para el ejemplo de la introducción (trabajadores de Coca Cola) el
rango es igual a $50,000 - $4,000 = $46,000

Intervalo: Número de grupos en que se va a agrupar la información, se recomienda que sean no menos de 5 ni más de
10.

Límites de la clase: Cantidad mínima y máxima de cada intervalo.

Límite Inferior: Cantidad mínima del intervalo

Límite superior: Cantidad máxima del intervalo

Tamaño del intervalo: El tamaño del intervalo es la diferencia entre el límite superior e inferior de la clase.
 
Marca de clase: La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo
para el cálculo de algunos parámetros.
FORMULARIO
MEDIDAS DE TENDENCIA CENTRAL.
Media Aritmética X = ∑ fx
n
Mediana n
Md = Li + 2 - FA anterior c
f

Moda M o = Li + ∆1 c
∆1 + ∆2
x = Media aritmética
∑ = Sumatoria
f = frecuencia
n = Total de datos
x = Dato a analizar
Md = Mediana
Li = Límite inferior del intervalo de la mediana o moda
FA anterior = Frecuencia acumulada anterior al intervalo de la mediana
C = Tamaño del intervalo
∆1 = Mayor frecuencia menos frecuencia anterior
∆2 = Mayor frecuencia menos frecuencia posterior

MEDIDAS DE DISPERSIÓN
Desviación Estándar

S = ∑f(x – x )2
n
Varianza
S2 = ∑f(x – x )2
n
S = Desviación estándar
S2= Varianza
x = Media aritmética
∑ = Sumatoria
f = frecuencia
n = Total de datos
x = Dato a analizar
 EJEMPLO RESUELTO DE DATOS AGRUPADOS
I. TABLA DE FRECUENCIAS
Se desea realizar un análisis estadístico con las edades de 50 personas que habitan un edificio con 20
departamentos, las edades se distribuyen en la siguiente tabla:

3 7 10 32 15 27 23 12 15 18
33 35 38 22 33 36 23 22 25 22
46 36 27 32 35 20 33 32 15 16
18 41 43 42 44 42 15 22 23 25
33 35 44 23 15 28 28 15 48 22
Primer paso: Se ordenan de menor a mayor
3 7 10 12 15 15 15 15 15 15
16 18 18 20 22 22 22 22 22 23
23 23 23 25 25 27 27 28 28 32
32 32 33 33 33 33 35 35 35 36
36 38 41 42 42 43 44 44 46 48
Segundo paso: Se obtiene el rango con la diferencia entre las personas de mayor y menor edad.
Rango = 48 – 3 = 45
Tercer paso: Se toma la decisión para determinar el número de intervalos que tendrá la agrupación de
la información (se recomienda entre 6 y 10) para este problema vamos a utilizar 6 intervalos; por lo
tanto se divide el rango entre el número de intervalos.
Para 6 intervalos = = 7.5 Por lo tanto el tamaño de cada
45 intervalo va ser igual a 7.5
6
Cuarto paso: Se elabora la tabla de frecuencias tomando en el dato menor de la muestra (3 años) como
el límite inferior del primer intervalo y se obtiene el límite superior sumando el tamaño del intervalo y
para pasar de un intervalo a otro se aumenta una centésima
Frecuencia
Marca de Frecuencia Frecuencia
Intervalo Li Ls Frecuencia relativa Porcentaj Grados
clase acumulada relativa
acumulada e
A 3.00 10.50 3 6.75 3 0.06 0.06 6% 21.6º
B 10.51 18.01 10 14.26 13 0.20 0.26 20% 72º
C 18.02 25.52 12 21.77 25 0.24 0.50 24% 86.4º
D 25.53 33.03 11 29.28 36 0.22 0.72 22% 79.2º
E 33.04 40.54 6 36.79 42 0.12 0.84 12% 43.2º
F 40.55 48.05 8 44.30 50 0.16 1.00 16% 57.6º
50 1.00 100% 360°

Llenado de la tabla de frecuencias para datos agrupados

Límites (inferior y superior): Se coloca el límite inferior (dato menor) y se suma el tamaño del intervalo para
obtener el límite superior, para pasar al siguiente intervalo se suma una centésima y se repite el proceso hasta
llegar al último intervalo.
Frecuencia: Se cuenta el número de datos que quedan ubicados en cada intervalo.
Marca de Clase: Es el punto medio de cada intervalo, se obtiene sumando el límite inferior con el límite
superior y dividiendo el resultado entre 2.
Frecuencia acumulada: Se coloca la primer frecuencia y se le suma la segunda, al resultado se le suma la de
la tercera y así sucesivamente hasta llegar a la última frecuencia, para comprobar la sumatoria debe ser igual
a cantidad total de datos.
Frecuencia Relativa: Se obtiene dividiendo cada frecuencia entre el total de datos el primero 3/50 es igual
0.06, el segundo 9/50 es igual a 0.18 y así sucesivamente hasta llegar en este caso a la última calificación.
Frecuencia Relativa Acumulada: Se coloca la primer frecuencia relativa y se le suma la segunda, al resultado
se le suma la de la tercera y así sucesivamente hasta la última calificación (diez), para comprobar el resultado
la última frecuencia relativa acumulada debe ser igual a 1
Porcentaje: Es el resultado de multiplicar la frecuencia relativa por 100.
Grados. Se obtiene multiplicando la frecuencia relativa por 360

II. GRÁFICAS ESTADÍSTICAS


a) Histograma (gráfica de barras)

12
11
12

10 8
8

6 10
4 6
2 3
0
A B C D E F

b) Polígono de frecuencias
14
12
12 11
10
10
8
8
6
6

43

0
A B C D E F

c) Pastel
8
3 10

11 12

A B C D E F

III. Medidas de tendencia central


a) Media Aritmética

X = ∑ fx = 3(6.75)+10(14.26)+12(21.77)+11(29.28)+6(36.79)+8(44.30) = 1,321.31 = 26.42


n 50 50
b) Mediana: Primero se ubica la mediana en la frecuencia acumulada, se localiza en la posición
25 porque es la mitad de 50.
En este caso se localiza en el intervalo “C”

B 10.51 18.01 10 14.26 13 0.20 0.26 20% 72º


Posición 25 24% 86.4º
C 18.02 25.52 12 21.77 25 0.24 0.50

N 50
Md = Li + 2 - FA anterior c = 18.02 + 2 - 13 7.5 = 18.02 + 12 7.5 = 25.52
F 12 12

a) Moda: Se ubica en el intervalo de mayor frecuencia


∆1 = 12 – 10 = 2
∆2 = 12 – 11 = 1
M o = Li +
∆1 c = 18.02 + 2 7.5 = 18.02 + (2/3) 7.5 = 22.68
∆1 + ∆2 2+1
IV. Medidas de dispersión

a) Varianza S2 = ∑f(x – x )2
N
S2=3(6.75–26.42)2+10(14.26–26.42)2+12(21.77–26.42)2+11(29.28–26.42)2+6(36.79–26.42)2+8(44.30–26.42)2 =6191.6
50 50
= 123.83
b). Desviación Estándar
S = ∑f(x – x )2 = 123.83 = 11.12
N

ACTIVIDAD SESIÓN 7
La siguiente tabla representa el peso en kilogramos de 50 personas, desarrolla el análisis
estadístico para describir el comportamiento del peso de las personas, el análisis
descriptivo de la información.

33 37 40 62 45 57 53 42 45 48
63 65 68 52 63 66 53 52 55 52
76 66 57 62 65 50 63 62 45 46
48 71 73 72 74 72 45 52 53 55
63 65 74 53 45 58 58 45 78 52

Considerando la información de la tabla anterior y basándote totalmente en el ejercicio


resuelto, elabora, diseña o calcula los siguientes puntos:
1. Tabla de frecuencias

2. Gráficas estadísticas
a) Histograma (gráfica de barras)
b) Polígono de frecuencias
c) Gráfica de Pastel

3. Medidas de Tendencia Central


a) Histograma (gráfica de barras)
b) Polígono de frecuencias
c) Gráfica de Pastel

4. Medidas de Dispersión
a) Varianza
b) Desviación Estándar

5. Conclusiones

También podría gustarte