Está en la página 1de 85

ESTADÍSTICA

UNIDAD II
Material Preparado Por:
Lic. Carlos Humberto García Álvarez CPA
carloshgarciaa@yahoo.com
DISTRIBUCIÓN DE FRECUENCIAS
CLASE 2
CONCEPTO Y OBJETO : Se denomina distribución de frecuencias a una tabla o
cuadro estadístico que se usa especialmente para presentar datos clasificados como
variables.
Cualquier manera de presentar los datos estadísticos siempre que exista un lógico
criterio de ordenación puede recibir el nombre genérico de Tabla Estadística .
Si los datos se presentan en dos columnas conteniendo una de ellas los valores de la
variable y la otra el N° de observaciones ( frecuencia absoluta o repeticiones ) que
corresponde a cada valor o grupo de valores de aquella , tiene una tabla denominada
Distribución de Frecuencias.
MEDIDAS DE:
1) Tendencia central
2) Posición
3) Dispersión
4) Asimetría o sesgo
5) Apuntamiento o kurtosis
formas o tipos de elaborar la distribución de frecuencias:

A) Distribución sin clases o intervalos escritos, también se le conoce como


distribución de frecuencias de valores sin agrupar.

B) Distribución con clases o intervalos escritos, también se denomina de


valores agrupados.
SERIE SIMPLE SIN FRECUENCIAS Y
SERIE SIMPLE CON FRECUENCIAS
SERIE SIMPLE SIN FRECUENCIAS SERIE SIMPLE CON FRECUENCIAS

X X F FX
7 7 8 56
12 12 14 168
17 17 23 391
22 22 11 242
27 27 4 108
∑ 85 ∑ 85 ∑ 60 ∑ 965
DISTRIBUCIÓN DE FRECUENCIAS DE
DATOS AGRUPADOS O CON CLASES
Ctas. Por pagar f x fx
120---124 8 122 976
125---129 10 127 1270
130---134 15 132 1980
135---139 9 137 1233
140---144 8 142 1136
∑ = 50 ///// ∑ = 6595
DISTRIBUCIÓN DE FRECUENCIAS CON
CLASES O INTERVALOS DE AMPLITUD
CONSTANTE
Se cuenta con los gastos en Q. sobre el consumo de gasolina de una
empresa durante un día, los datos son los siguientes:
55-58-60-61-61-63-63-65-65-66-66-68-68-68-69-69-70-70-70-71-71-72-72-
72-72-72-73-73-74-74-75-75-75-77-77-77-78-78-80-80-81-81-81-84-85-87-
89 .
1) Establecer el Rango = 89-55+1=35
2) Determinar la amplitud de las clases ( Pág.,11 For. 6 Prof. Herbert
Stugers )
i = r
1+3.322(log n)

i = r i = 35 = 35 = 5.34
1+3.322(log.47) 1+3.322(1.67210) 6.55472
3) Número de clases r = 35 = 6.55
i 5.34

4 ) En este paso es realizar arreglos, lo aconsejable es hacer 3 como mínimo


y determinar cual es el mejor para trabajar .
ARREGLO 1 ARREGLO 2 ARREGLO 3
Consumo en Q, f Consumo en Q. f Consumo en Q. f
55---60 3 54---58 2 55---59 2
61---66 8 59---63 5 60---64 5
67---72 15 64---68 7 65---69 9
73---78 12 69---73 14 70---74 14
79---84 6 74---78 10 75---79 8
85---90 3 79---83 5 80---84 6
∑ = 47 84---88 3 85---89 3
89---93 1 ∑ = 47
∑ = 47
De los arreglos anteriores, el mejor para trabajar es el N° 3
Criterios 1 2 3
A) Ausencia de clases con frecuencia cero si si si
B) Ausencia de frecuencias iguales para clases consecutivas si si si
C) Secuencia ascendente-descendente de las frecuencias si si si
D) Mayor apreciación de la clase dominante no si si
E) No menos de 5 clases ni más de 15 si si si
PASOS A SEGUIR: Clase N° 3
1) Los valores o datos recopilados pueden ser ordenados de acuerdo al
orden de magnitud ascendente o descendente.
2) Como hay valores repetidos , entonces se debe efectuar un arreglo
llamado “arreglo de frecuencias “, y el N° que indica las veces que un
valor esta repetido se llama frecuencia.
3) Determinación de la amplitud del intervalo.
4) Determinación del número de clases.
5) Definir los límites de clase eligiendo un criterio, para formar la
primera clase.
Ventas Ventas f fr fr F Fr
f
55---60 54.5—60.5 4 0.10 10 4 10
4
61---66 60.5---66.5 5 0.125 13 9 23
5
67---72 66.5---72.5 6 0.15 15 15 38
6
73---78 72.5---78.5 12 0.30 30 27 68
12
79---84 6 78.5---84.5 6 0.15 15 33 83
85---90 4 84.5---90.5 4 0.10 10 37 93
91---96 3 90.5---96.5 3 0.075 7 40 100
∑= ∑=40 ∑ =1.00 ∑=100 ///////
40
La frecuencia simple relativa indica que el 30% de las ventas están en
el intervalo 73-78.
La frecuencia acumulada relativa indica que el 68% de la ventas es
igual o menor en el intervalo 73-78.
REPRESENTACIÓN GRÁFICA DE LA
DISTRIBUCIÓN DE FRECUENCIAS

Histograma: Es el Diagrama de Barras, según la Distribución de


Frecuencias, los límites reales de clase se colocan en el eje horizontal y el
N° de casos (frecuencias ) en el eje vertical.
Polígono de Frecuencias: Es una gráfica que se traza sobre las marcas de
clase o bien uniendo los puntos medios del Histograma.
HISTOGRAMA Y POLÍGONO DE FRECUENCIAS
Frecuencia absoluta simple : Denota o indica cuantas veces esta repetido cada valor de
la variable.
Frecuencia relativa simple : Es la relación la frecuencia f respecto del total de casos o
tamaño de la muestra .
Frecuencia acumulada absoluta : Indica cuantos casos quedan incluidos hasta un
determinado valor.
Intervalo o clase númerica : Es un conjunto de valores definidos por un par de números
que se llaman “Límites extremos o fronteras”.
MEDIDAS DE TENDENCIA CENTRAL
Se llaman así porque tienden al centro de la distribución .
La más conocida es la Media Aritmética, Promedio o simplemente Media.
Entre otras la Moda, la Mediana, Media Geométrica, Media Armónica .
SERIE SIMPLE O DATOS SIN AGRUPAR SERIE SIMPLE CON FRECUENCIAS
X X f fx For. 8 Pág. 12

30

30 7 210

20 40 4 160

∑=140 ////// ∑=20 ∑=580


DATOS AGRUPADOS O CON CLASES

Prov. f Pto. medio fx For. 8 Pág. 12

125-129 10 127 1270

135-139 9 137 1233


140-144 8 142 1136 Q131.90
∑=50 ///// ∑= 6,595
MÉTODO INDIRECTO DE CALCULO
CLASE NO. 4 20/07/2022

Saldos en Q. f x fd
120-124 8 122 -10 -80
125-129 10 127 - 5 -50
130-134 15 132 0 0
135-139 9 137 5 45
140-144 8 142 10 80
∑ = 50 ///// 0 - 5
DISTANCIA O DESVIACIÓN

•  
PRIMERA PROPIEDAD DE LA MEDIA
ARITMÉTICA, PARA DATOS
Saldos miles f AGRUPADOS
x fx

13-22 4 17.5 70 -28.25 -113


23-32 6 27.5 165 -18.25 -109.5
33-42 7 37.5 262.5 - 8.25 - 57.75

43-52 9 47.5 427.5 1.75 15.75


53-62 7 57.5 402.5 11.75 82,25
63-72 4 67.5 270 21.75 87
73-82 3 77.5 232.5 31.75 95.25
∑ = 40 ////// ∑ =1830 //////// ∑= 0
PRIMERA PROPIEDAD DE LA MEDIA
ARITMÉTICA PARA DATOS SIMPLES
Definición Mes x
La suma algebraica Julio 2 - 2,5
de
las desviaciones Agosto 3 -1.5
respecto a la Media
es igual a cero Septiembre 6 1.5

For. 9 Pág.12 Octubre 3 -1,5


Noviembre 9 4.5
Diciembre 4 -0.5
∑=0
 

Datos en f x
miles Q.
13-22 4 17,5 -28.25 -28.35 3,214.89
3,192.25
23-32 6 27,5 -18.25 -18.35 2,020.34
1,998.38
33-42 7 37.5 -8,25 - 8.35 488.06
476.44
43-52 9 47.5 1,75 1.65 24.50
27.56
53-62 7 57,5 11.75 11.65
966.44 950.06
63-72 4 67.5 21.75 21.65
1,892.25 1,874.89
73-82 3 77.5 31,75 31.65
∑ =40 ////// //////// 3,024.11 //////// 3,005.17
PROMEDIO ARITMÉTICO DE VARIAS
MUESTRAS O MEDIA DE MEDIAS
•  
OTRO EJEMPLO DE MEDIA DE MEDIAS
La producción de carros en miles de Q. de 3 empresas, durante la primera
semana de julio del presente año es la siguiente:
Marca Empresa A Empresa B Empresa C
Cant. Costo Cant. Costo Cant. Costo
X 3 5 4
85,000.00 1,430.000.00 130,000.00
Y 2 1 2
32,000.00 120,000.00 40,000.00
Z 5 3 2
105,000.00 427.000.00 35,000.00
Total 10 9 8
222,000.00 1,977,000.00 205,000.00
 
 
PROMEDIO ARITMÉTICO DE
PORCENTAJES

1) Para igual base : Ej. 800 estudiantes de Estadística l se examinaron en un


parcial, se hacen 2 grupos de 400 c/u, obteniéndose las frecuencias
aprobadas (f) y sus respectivos porcentajes (p) .
Grupo Base f p
1 400 130 0.325
2 400 140 0.35
Total 800 270
 
2. MEDIA DE PORCENTAJES PARA
DIFERENTE BASE
Ej. La producción de sueros durante el mes de junio del presente año de la
fábrica 22 de julio, por su porcentaje de productos químicos es la siguiente:
Tipo de suero Producción % de Productos Químicos
Oral Inyectable Oral
Inyectable

Y 500 800 5 8
W 850 600 18 12
Z 970 520 20 16
X 250 715 23 22
∑=2,570
∑=2,635
 
Suero Oral %
500 5 = 25
850 18 = 153
970 20 = 194

250 23 = 57-5
∑=2,570 //// ∑= 429.5
Suero Inyectable %
800 8 64
600 12 72
520 16 83.20

715 22 157.30
∑=2,635 /// ∑= 376.50
MODA CLASE N° 6 25/07/2022
Lo que más se repite o se observa en valores de una variable se llama Moda.
X = 4,5,5,6,6,6,6,7,7 MO = 6 Unimodal porque solo hay una.
W = 1,3,4,8,10,17 No hay Moda.
T = 3,3,6,6,6,7,7,9,9,9,10 MO = 6 y 9 y se llama Bimodal.
MODA INTERPOLADA
Es la moda que se calcula en una distribución de frecuencias que tiene
intervalos, no importando si son de amplitud constante o variable.
Ctas. por cobrar Q. f x
120-124 8 122
125-129 10 127
130-134 15 132
135-139 9 137
140-144 8 142
∑ = 50 //////
 
La moda no interpolada es simplemente la marca de clase o punto
medio del intervalo modal , en este caso sería Q132.00 que se le
conoce como moda cruda.
Características de la Moda :
A) La moda es el valor con la más alta frecuencia en una distribución.
B) La moda no es afectada por valores extremos, en cambio la media
aritmética como esta basada en todos los valores si se ve afectada por
los valores extremos.
MEDIANA
•  
MEDIANA PARA DATOS AGRUPADOS O
INTERVALOS DE CLASE
Proveedores en Q. f F
120-124 8 8

125-129 10 18

130-134 15 33

135-139 9 42

140-144 8 50 Me = 131.83
∑ = 50 /////
MEDIDAS FRACTILARES

Son los valores de variable que delimitan porcentajes del total de los casos, los
más usuales se denominan: Percentiles y Deciles.
NOTA
Toda distribución tiene 99 Percentiles y 100 partes.
Toda distribución tiene 3 Quartiles y 4 partes.
Toda distribución tiene 9 Deciles y 10 partes.
Ventas en Q. f Pto. Medio x fx F
30-37 8 33.5 268 8
38-45 11 41.5 456.5 19
46-53 14 49.5 693 33
54-61 21 57.5 1,207.5 54
62-69 10 65.5 655 64
70-77 9 73.5 661.5 73
78-85 7 81.5 570.5 80
∑ = 80 ////// ∑ = 4,512 ////
Con la distribución anterior se le pide lo siguiente:
a ) El valor que deja bajo si el 60% de los casos.
b ) El valor que deja bajo si y sobre si el 50% de las ventas.
c ) El valor que más se repite.
d ) Las ventas promedio.
e ) Las ventas que dejan bajo si el 75% de los casos.
 
 
 
 
 
EJERCICIO DE REPASO
Ctas. x pagar en miles Q. f
120-124 8 Se le pide:

125-129 10 a) El valor que deja bajo sí y


sobre sí el 50% de los casos.
130-134 15 b) El valor que más se repite.

135-139 9 c) El valor que deja sobre sí


el 25% de los casos.
140-144 8 d) El valor que deja sobre sí
el 80% de los casos.
e) Media Aritmética.
EFECTO QUE CAUSA UNA CONSTANTE
EN LA MEDIA ARITMÉTICA

2022
X X+2 X-4
8 10 4
10 12 6
12 14 8
14 16 10
16 18 12
MEDIA GEOMÉTRICA
•  
EJ. DE MEDIA GEOMÉTRICA CLASE N° 8
La información sobre el valor de las importaciones por concepto de materia
prima de la empresa 30 de julio es la siguiente:
Años Importaciones Log. x Índice o Razón Log. De
Razón
2,017 Q. 6,000.00 3.77815 ------- ---------
2,018 Q. 4,000.00 3.60206 0.66667 -0.17609
2,019 Q. 6,200.00 3.79239 1.55 0.19033
2,020 Q. 7,000.00 3.84510 1.12903 0.05270
2,021 Q10,200.00 4.00860 1.45714 0.16350
∑= 19.0263 ///////////// ∑= 0.23044
Con la información anterior determine:
1) Promedio geométrico de las importaciones.
2) Índice promedio geométrico.
3) Tasa de crecimiento anual de las importaciones.
4) Cálculo de las importaciones para el año 2,022.
Trabaje con 5 decimales.
 
 
TAREA

Años Impuestos Pagados Se le pide: (Utilece 5


decimales)
2,017 Q. 17,000.00 a)Promedio geométrico de los
2,018 Q. 18,000.00 Impuestos pagados.
2,019 Q. 15,000.00 b) Índice promedio geométrico.
2,020 Q. 12,000.00 c) Tasa de crecimiento anual.
2,021 Q. 9,000.00 d) Los impuestos a pagar
p/2,022.
R. a) b) = 0.85300 c) =- 0.147 d) = Q. 7677.00
Q.13,773.68
MEDIA ARMÓNICA
•  
 
Una fábrica de juguetes ha organizado a un grupo de 4 trabajadores, para
completar una orden de 700 juguetes.

Las razones de productividad de dichos trabajadores están dadas a


continuación.
EJEMPLO DE MEDIA ARMÓNICA
Trabajador Tasa de productividad Se pide:
1 10 Min. por juguete a) Encontrar el promedio de min.
2 6 Min. por juguete por juguete, para el grupo de tra-
3 15 Min. por juguete bajadores.
4 4 Min. por juguete b) Compruebe su respuesta con
la orden de producción.
 
COMPROBACIÓN
Inciso B
Trabajador
1 1,200.50/10 = 120 Juguetes
2 1,200.50/6 = 200 Juguetes
3 1,200.50/15 = 80 Juguetes
4 1,200.50/4 = 300 Juguetes
∑ = 700
En la práctica es probable que cada trabajador de una fábrica labora la
misma cantidad de tiempo, pero produzca diferente número de juguetes. en
este caso la Media Armónica es más realista que la Media Aritmética.
RELACIÓN EMPÍRICA ENTRE LA MEDIA
ARITMÉTICA, MODA Y MEDIANA
•  
Se utilizan distintas medidas de dispersión o variación las más usadas son: El
rango, Desviación Media, El Rango Semi-intercuartílico, El Rango entre
Percentiles 10-90 y la Desviación Típica llamada también Desviación Estándar.

Recorrido, Amplitud o Rango: El rango de un conjunto de números, es la


diferencia entre el mayor y el menor de todos ellos ej. se tienen los siguientes
datos:
2,3,5,5,8,10,12 rango 12-2 = 10
DESVIACIÓN MEDIA

•  
x For.25 P16 X For.29 P
16
3 -3 3 -3 9
5 -1 5 -1 1 S= 2.55
6 0 6 0 0
10 4 10 4 16
∑=24 ∑=8 ∑=24 0 ∑=26
COEFICIENTE DE VARIACIÓN
•  
CARACTERÍSTICAS DE LA MEDIA GEOMÉTRICA

El valor de la Media Geométrica es siempre menor que el valor de la Media


Aritmética de los mismos datos, exceptuando cuando todos los valores en
una serie son iguales.
El calculo de la Media Geométrica se basa en todos los elementos de un
conjunto de datos. El valor de cada elemento afecta el valor de la Media
Geométrica , si uno de los valores es cero la Media Geométrica es cero.
CARACTERÍSTICAS DE LA MEDIA ARMÓNICA

•  
 
EJERCICIO DE MEDIDAS DE
TENDENCIA CENTRAL, DISPERSIÓN,
ASIMETRÍA Y APUNTAMIENTO CLASE
N° 10
• Una empresa preparó un resumen de ventas del mes de julio así :miles Q.
Ventas f x fx F
24-32 8 28 224 8 -23.40

33-41 12 37 444 20 -14.40


42-50 18 46 828 38 - 5.40
51-59 22 55 1,210 60 3.60
60-68 10 64 640 70 12.60
69-77 6 73 438 76 21.60
78-86 82 328 80 30.60
///// ∑=4112 ///// ////////
f
8 -23.40 -187.20 4,380.48 -102,503.23 2,398,575.63
12 -14.40 -172.80 2,488.32 - 35,831.81 515,978.03
18 - 5.40 - 97.20 524.88 - 2,834.35 15,305.50
22 3.60 79.20 285.12 1,026.43 3,695.15
10 12.60 126.00 1,587.60 20,003.76
252,047.38
6 21.60 129.60 2,799.36 60.466.18
1,306,069.40
30.60 122.40 3,745.44 114,610.46
/////// ∑=914.40 ∑=15,811.20 ∑=54,937.44 3,507,080.20

7,998,751.29
Se le pide:
a) Las ventas promedio.
b) El valor de venta que más se repite.
c) Determinar el 40% central de los casos.
d) Coeficiente de variación.
e) Compruebe si la distribución tiene sesgo negativo.
f) Determinar los límites donde esta el 68.24%, 95.46% y 99.73%
 
 
 
 
 
 
EJERCICIO DE REPASO

Los saldos de cuentas por pagar de la empresa 11 de agosto son los Sig.
Miles de Q. f Se le pide:
120—124 8 a) La Varianza.
125—129 10 b) Desviación Típica.
130—134 15 c) Desviación Media.
135—139 9 d) Coeficiente de Variación.
140—144 8 e) Coeficiente de Asimetría.
f) Coeficiente de Kurtosis.
NOTA: TRABAJE CON DOS DECIMALES.
SOLUCIÓN

Miles Q. f x fx f(x-x) f(x-x) 2


120--124 8 122 976 -9.90 -79.90
125--129 10 127 1,270 -4.90 -49.00
130--134 15 132 1,980 0.10 1.50
135--139 9 137 1,233 5.10 45.90
140--144 8 142 1,136 10.10 80.80
∑ = 50 ////// ∑=6,595 /////// ∑=256.40
CONTINUACIÓN DE LA SOLUCIÓN.

f
8 -9.90 784.08 -7,762.39 76,847.68
10 -4.90 240.10 -1,176.49 5,764.80
15 0.10 0.15 0.01 0.00
9 5.10 234.09 1,193.86 6,088.68
8 10.10 816.08 8,242.41 83,248.32
∑= 50 /////// ∑= 2,074.50 ∑= 497.40 ∑= 171,949.48
APLICACIÓN DE FORMULAS

•  
APLICACIÓN DE FORMULAS

•  

También podría gustarte