Está en la página 1de 10

SESIÓN 2

ESTADÍSTICA DESCRIPTIVA
DATOS AGRUPADOS

INTRODUCCIÓN: Cuando el rango de una serie de información es muy grande se


deben agrupar los datos para poder desarrollar cualquier análisis estadístico,
por ejemplo si se desea realizar una investigación con una muestra aleatoria
con los sueldos mensuales de 800 trabajadores de Coca Cola, el trabajador de
menor sueldo podría ganar $4,000 y el que gane más de los trabajadores de la
muestra podría tener un sueldo mensual de $50,000, por lo que sería imposible
trabajar sin agrupar la información, la gráfica de barras o polígono de
frecuencias podría tener en forma horizontal hasta 800 datos.

OBJETIVO: Al finalizar la sesión el alumno será capaz de comprender en qué casos


se debe agrupar la información además elaborar tablas de frecuencia, gráficas
estadísticas, calcular medidas de tendencia central, medidas de dispersión y
medidas posicionales. Pero sobre todo aplicarlos en su área del conocimiento.

DESARROLLO: Por medio de la solución de problemas de aplicación se establecen


las condiciones para determinar en qué momento se deben utilizar datos
agrupados y no agrupados.

Utilizando problemáticas reales se establecerá necesidad de agrupar


información para realizar investigaciones, análisis, metodologías.

Se definirán los conceptos básicos para la agrupación de información, se


elaboraran intervalos de confianza con medidas de tendencia central, de
dispersión además con medidas posicionales.

A continuación definiremos los conceptos básicos para el desarrollo de la


sesión.

Rango: Diferencia entre el dato mayor y el menor para el ejemplo de la introducción (trabajadores de Coca Cola) el
rango es igual a $50,000 - $4,000 = $46,000

Intervalo: Número de grupos en que se va a agrupar la información, se recomienda que sean no menos de 5 ni más de
10.

Límites de la clase: Cantidad mínima y máxima de cada intervalo.

Límite Inferior: Cantidad mínima del intervalo

Límite superior: Cantidad máxima del intervalo

Tamaño del intervalo: El tamaño del intervalo es la diferencia entre el límite superior e inferior de la clase.
Marca de clase: La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo
para el cálculo de algunos parámetros.

FORMULARIO
MEDIDAS DE TENDENCIA CENTRAL.
Media Aritmética X = ∑ fx
n
Mediana n
Md = Li + 2 - FA anterior c
f

Moda Mo = Li + ∆1 c
∆1 + ∆2
x = Media aritmética
∑ = Sumatoria
f = frecuencia
n = Total de datos
x = Dato a analizar
Md = Mediana
Li = Límite inferior del intervalo de la mediana o moda
FA anterior = Frecuencia acumulada anterior al intervalo de la mediana
C = Tamaño del intervalo
∆1 = Mayor frecuencia menos frecuencia anterior
∆2 = Mayor frecuencia menos frecuencia posterior
MEDIDAS DE DISPERSIÓN
Desviación Estándar

S = ∑f(x – x )2
n
Varianza
S2 = ∑f(x – x )2
n
S = Desviación estándar
S2= Varianza
x = Media aritmética
∑ = Sumatoria
f = frecuencia
n = Total de datos
x = Dato a analizar

MEDIDAS POSICIONALES. Son aquellas que como su nombre lo dice dependen de suposición, se utilizan para
seccionar la información además de establecer intervalos de confianza de forma más puntual.

CUARTILES: Medida posicional que divide en 4 partes iguales una serie de datos

n
Q1 = L i + 4 - FA anterior c
f
n
Q1 = Li + 4 - FA anterior c
f
DECILES: Medida posicional que divide en 10 partes iguales una serie de datos
n
D1 = Li + 10 - FA anterior c
f
3n
D3 = Li + 10 - FA anterior c
f

8n
D8 = Li + 10 - FA anterior c
F
PERCENTILES: Medida posicional que divide en 100 partes iguales una serie de datos

n
P1 = Li + 100 - FA anterior c
f
17n
D17 = Li + 100 - FA anterior c
f

98n
D98 = Li + 100 - FA anterior c
Qn = Cuartil
Dn = Decil
Pn = Percentil
n = Total de datos
Li = Límite inferior del intervalo de la mediana o moda
FA anterior = Frecuencia acumulada anterior al intervalo de la mediana
C = Tamaño del intervalo

EJEMPLO RESUELTO DE DATOS AGRUPADOS


I. TABLA DE FRECUENCIAS
Se desea realizar un análisis estadístico con las edades de 50 personas que habitan un edificio con 20
departamentos, las edades se distribuyen en la siguiente tabla:

3 7 10 32 15 27 23 12 15 18
33 35 38 22 33 36 23 22 25 22
46 36 27 32 35 20 33 32 15 16
18 41 43 42 44 42 15 22 23 25
33 35 44 23 15 28 28 15 48 22
Primer paso: Se ordenan de menor a mayor
3 7 10 12 15 15 15 15 15 15
16 18 18 20 22 22 22 22 22 23
23 23 23 25 25 27 27 28 28 32
32 32 33 33 33 33 35 35 35 36
36 38 41 42 42 43 44 44 46 48
Segundo paso: Se obtiene el rango con la diferencia entre las personas de mayor y menor edad.
Rango = 48 – 3 = 45
Tercer paso: Se toma la decisión para determinar el número de intervalos que tendrá la agrupación de
la información (se recomienda entre 6 y 10) para este problema vamos a utilizar 6 intervalos; por lo
tanto se divide el rango entre el número de intervalos.
Para 6 intervalos = 45 = 7.5 Por lo tanto el tamaño de cada
6 intervalo va ser igual a 7.5
Cuarto paso: Se elabora la tabla de frecuencias tomando en el dato menor de la muestra (3 años) como
el límite inferior del primer intervalo y se obtiene el límite superior sumando el tamaño del intervalo y
para pasar de un intervalo a otro se aumenta una centésima
Frecuencia
Marca de Frecuencia Frecuencia
Intervalo Li Ls Frecuencia relativa Porcentaje Grados
clase Acumulada relativa
acumulada
A 3.00 10.50 3 6.75 3 0.06 0.06 6% 21.6º
B 10.51 18.01 10 14.26 13 0.20 0.26 20% 72º
C 18.02 25.52 12 21.77 25 0.24 0.50 24% 86.4º
D 25.53 33.03 11 29.28 36 0.22 0.72 22% 79.2º
E 33.04 40.54 6 36.79 42 0.12 0.84 12% 43.2º
F 40.55 48.05 8 44.30 50 0.16 1.00 16% 57.6º
50 1.00 100% 360°
Llenado de la tabla de frecuencias para datos agrupados

Límites (inferior y superior): Se coloca el límite inferior (dato menor) y se suma el tamaño del intervalo para
obtener el límite superior, para pasar al siguiente intervalo se suma una centésima y se repite el proceso hasta
llegar al último intervalo.
Frecuencia: Se cuenta el número de datos que quedan ubicados en cada intervalo.
Marca de Clase: Es el punto medio de cada intervalo, se obtiene sumando el límite inferior con el límite
superior y dividiendo el resultado entre 2.
Frecuencia acumulada: Se coloca la primer frecuencia y se le suma la segunda, al resultado se le suma la de
la tercera y así sucesivamente hasta llegar a la última frecuencia, para comprobar la sumatoria debe ser igual
a cantidad total de datos.
Frecuencia Relativa: Se obtiene dividiendo cada frecuencia entre el total de datos el primero 3/50 es igual
0.06, el segundo 9/50 es igual a 0.18 y así sucesivamente hasta llegar en este caso a la última calificación.
Frecuencia Relativa Acumulada: Se coloca la primer frecuencia relativa y se le suma la segunda, al resultado
se le suma la de la tercera y así sucesivamente hasta la última calificación (diez), para comprobar el resultado
la última frecuencia relativa acumulada debe ser igual a 1
Porcentaje: Es el resultado de multiplicar la frecuencia relativa por 100.
Grados. Se obtiene multiplicando la frecuencia relativa por 360

II. GRÁFICAS ESTADÍSTICAS


a) Histograma (gráfica de barras)

12 12
11
10 10
8 8

6 6
4
3
2

0
A B C D E F

b) Polígono de frecuencias
14
12
12 11
10
10
8
8
6
6

4 3
2

0
A B C D E F
c) Pastel
8
3 10

11 12

A B C D E F

III. Medidas de tendencia central


a) Media Aritmética

X = ∑ fx = 3(6.75)+10(14.26)+12(21.77)+11(29.28)+6(36.79)+8(44.30) = 1,321.31 = 26.42


n 50 50

b) Mediana: Primero se ubica la mediana en la frecuencia acumulada, se localiza en la posición


25 porque es la mitad de 50.
En este caso se localiza en el intervalo “C”

B 10.51 18.01 10 14.26 13 0.20 0.26 20% 72º


Posición 25 24% 86.4º
C 18.02 25.52 12 21.77 25 0.24 0.50

N 50
Md = Li + 2 - FA anterior c = 18.02 + 2 - 13 7.5 = 18.02 + 12 7.5 = 25.52
F 12 12

a) Moda: Se ubica en el intervalo de mayor frecuencia

∆1 = 12 – 10 = 2
∆2 = 12 – 11 = 1

Mo = Li + ∆1 c = 18.02 + 2 7.5 = 18.02 + (2/3) 7.5 = 22.68


∆1 + ∆2 2+1

IV. Medidas de dispersión

a) Varianza S2 = ∑f(x – x )2
N
S2=3(6.75–26.42)2+10(14.26–26.42)2+12(21.77–26.42)2+11(29.28–26.42)2+6(36.79–26.42)2+8(44.30–26.42)2 =6191.6
50 50
= 123.83
b). Desviación Estándar
S = ∑f(x – x )2 = 123.83 = 11.12
N
V. Medidas posicionales

Cuartiles
Cuartil 1 Primero se ubica el intervalo que tiene al que pertenece el cuartil Q 1 (cuarta parte de 50 =12.5) en la
frecuencia acumulada como se indica a continuación.

A 3.00 10.50 3 6.75 3 0.06 0.06 6% 21.6º


Posición (12.5) 20% 72º
B 10.51 18.01 10 14.26 13 0.20 0.26

A partir de la ubicación se identifican los elementos de la fórmula y se sustituyen

N 50
Q1 = Li + 4 - FA anterior c = 10.51 + 4 - 3 7.5 = 10.51 + 12.5 - 3 7.5 = 15.385
F 10 10

Nota: El cuartil 2 no se calcula porque equivale a la mediana

Cuartil 3 Primero se ubica el intervalo que tiene al que pertenece el cuartil Q3 (tres cuartas parte de 50 =37.5) en
la frecuencia acumulada como se indica a continuación.

D 25.53 33.03 11 29.28 36 0.22 0.72 22% 79.2º


Posición (37.5) 12% 43.2º
E 33.04 40.54 6 36.79 42 0.12 0.84

A partir de la ubicación se identifican los elementos de la fórmula y se sustituyen


3n 150
Q3 = Li + 4 - FA anterior c = 33.04 + 4 - 36 7.5 = 33.04 + 37.5 - 36 7.5 = 14.82
f 6 6

Deciles: Dividen en 10 partes iguales a la serie de información existen 10 pero para nuestro caso
vamos a calcular sólo 4, indicando la formula correspondiente.

Decil 1 Primero se ubica el intervalo que tiene al que pertenece el cuartil D 1 (décima parte de 50 =5) en la
frecuencia acumulada como se indica a continuación.

A 3.00 10.50 3 6.75 3 0.06 0.06 6% 21.6º


Posición (5) 20% 72º
B 10.51 18.01 10 14.26 13 0.20 0.26
A partir de la ubicación se identifican los elementos de la fórmula y se sustituyen

N 50
D1 = Li + 10 - FA anterior c = 10.51 + 10 - 3 7.5 = 10.51 + 5 - 3 7.5 = 12.01
F 10 10

Decil 3 Primero se ubica el intervalo que tiene al que pertenece el decil D 3 (tres décimas partes de 50 =15) en la
frecuencia acumulada como se indica a continuación.

A partir de la ubicación se identifican los elementos de la fórmula y se sustituyen

B 10.51 18.01 10 14.26 13 0.20 0.26 20% 72º


Posición (15) 24% 86.4º
C 18.02 25.52 12 21.77 25 0.24 0.50

3N 150
D3 = Li + 10 - FA anterior c = 18.02 + 10 - 13 7.5 = 18.02 + 15 - 13 7.5 = 19.27
f 12 12

Decil 7 Primero se ubica el intervalo que tiene al que pertenece el decil D 1 (7 décimas partes de 50 =35) en la
frecuencia acumulada como se indica a continuación.

C 18.02 25.52 12 21.77 25 0.24 0.50 24% 86.4º


Posición (35) 22% 79.2º
D 25.53 33.03 11 29.28 36 0.22 0.72

A partir de la ubicación se identifican los elementos de la fórmula y se sustituyen

7N 350
D7 = Li + 10 - FA anterior c = 25.53 + 10 - 25 7.5 = 25.53 + 35 - 25 7.5 = 32.34
F 11 11

Decil 9 Primero se ubica el intervalo que tiene al que pertenece el decil D 9 (nueve décimas partes de 50 =45) en la
frecuencia acumulada como se indica a continuación.

A partir de la ubicación se identifican los elementos de la fórmula y se sustituyen

E 33.04 40.54 6 36.79 42 0.12 0.84 12% 43.2º


Posición (45) 16% 57.6º
F 40.55 48.05 8 44.30 50 0.16 1.00

9N 450
D9 = Li + 10 - FA anterior c = 40.55 + 10 - 42 7.5 = 40.55 + 45 - 42 7.5 = 43.36
f 8 8
Percentiles: Dividen en 100 partes iguales a la serie de información existen 100 pero para nuestro
caso vamos a calcular sólo 4, indicando la formula correspondiente.

Percentil 1 Primero se ubica el intervalo que tiene al que pertenece el percentil P 1 (Centésima parte de 50 =0.5)
en la frecuencia acumulada como se indica a continuación.

Posición (0.5) 6% 21.6º


A 3.00 10.50 3 6.75 3 0.06 0.06
A partir de la ubicación se identifican los elementos de la fórmula y se sustituyen

N 50
P1 = Li + 100 - FA anterior c = 3.00 + 100 - 0 7.5 = 3.00 + 0.5 - 0 7.5 = 4.25
F 3 3

Percentil Primero se ubica el intervalo que tiene al que pertenece el percentil P 18 (dieciocho centésimas
18
en la frecuencia acumulada como se indica a continuación.
partes de 50 =15)
A partir de la ubicación se identifican los elementos de la fórmula y se sustituyen

A 3.00 10.50 3 6.75 3 0.06 0.06 6% 21.6º


Posición (9) 20% 72º
B 10.51 18.01 10 14.26 13 0.20 0.26

18N 900
P18 = Li + 100 - FA anterior c = 10.51 + 100 - 3 7.5 = 10.51 + 9 - 3 7.5 = 15.01
f 10 10

Percentil 85 Primero se ubica el intervalo que tiene al que pertenece el percentil P 85 (85 centésimas partes de
50 =42.5) en la frecuencia acumulada como se indica a continuación.
A partir de la ubicación se identifican los elementos de la fórmula y se sustituyen

E 33.04 40.54 6 36.79 42 0.12 0.84 12% 43.2º


Posición (45) 16% 57.6º
F 40.55 48.05 8 44.30 50 0.16 1.00

85n 4250
P85 = Li + 100 - FA anterior c = 40.55 + 100 - 42 7.5 = 40.55 + 42.5 - 42 7.5 = 41.018
F 8 8

Percentil 98 Primero se ubica el intervalo que tiene al que pertenece el percentil P 98 (noventa y ocho partes de
50 =49) en la frecuencia acumulada como se indica a continuación.
A partir de la ubicación se identifican los elementos de la fórmula y se sustituyen

E 33.04 40.54 6 36.79 42 0.12 0.84 12% 43.2º


Posición (49) 16% 57.6º
F 40.55 48.05 8 44.30 50 0.16 1.00
98N 4900
P98 = Li + 100 - FA anterior c = 40.55 +100 - 42 7.5 = 40.55 + 49 - 42 7.5 = 47.11
f 8 8

ACTIVIDAD 2
Elabora completo el análisis estadístico de la información que se encuentra en la tabla
encontrando:
1. Tabla de Frecuencias
2. Gráficas Estadísticas
a) Histograma
b) Polígono de Frecuencias
c) Gráfica de Pastel
3. Medidas de Tendencia Central
a) Media Aritmética
b) Mediana
c) Moda
4. Medidas de Dispersión
a) Media Aritmética
b) Mediana
5. Medidas Posicionales
a) Cuartiles 1 y 3
b) Deciles 1, 3, 8 y 9
c) Percentiles 1, 27, 88 y 98

De la siguiente información

Estatura (medida en cm.) de una muestra de 200 estudiantes de una escuela que incluye
desde kínder hasta preparatoria
Frecuencia
Marca de Frecuencia Frecuencia
Intervalo Li Ls Frecuencia relativa Porcentaje
clase acumulada relativa
acumulada
A 120 130 20
B 131 141 25
C 142 152 50
D 153 163 60
E 164 174 30
F 175 185 15
200

También podría gustarte