Está en la página 1de 46

DISTRIBUCIONES DE

FRECUENCIAS
EJEMPLO 1:
En un estudio en particular
estaban interesados en evaluar el
número de frutos por planta de
zapallo. Se consideró solo las
plantas de una parcela; para cada
planta se contó la cantidad de
frutos que tenían. Los datos se
presentan en forma aleatoria a
continuación :

1 5 7 4 1 2 5 4
6 2 7 5 7 6 3 2
5 4 3 6 6 3 4 4
1 4 3 5 4 4
Tabla de distribución

variable xi fi frecuencia
1 3
2 3
Hay 3
3 4 zapallos con
4 8 2 frutos
5 5
6 4
7 3 Hay 4
zapallos con
N=30
6 frutos
FRECUENCIA ACUMULADA
RELATIVA FRECUENCIA
Tabla de distribución PORCENTUAL
REALTIVA
FRECUENCIA
PORCENTUAL
FRECUENCIA
ACUMULADA
FRECUENCIA RELATIVA
RELATIVA
ACUMULADA

xi fi F fr Fr fr% Fr%

1 3 3 1/10 1/10 10 10
2 3 6 1/10 1/5 10 20
3 4 10 2/15 1/3 13.33 33.3
4 8 18 4/15 3/5 26.67 60
5 5 23 1/6 23/30 16.67 76.67
6 4 27 2/15 97/10 13.33 90
7 3 30 1/10 1 10 100
N=30 1 100
Cantidad de zapallos por planta

9
8
cantidad de plantas

7
6
5
4
3
2
1
0
1 2 3 4 5 6 7

Fuente: Datos brindados por la cátedra


cantidad de zapallos
Estadística: el concepto de distribución

¿Qué dice el diccionario sobre la palabra distribución?


Estadística: el concepto de distribución

En el curso de Estadística, vamos a entender distribución como


la acción de distribuir (repartir, aglomerar, juntar) los elementos
de la población que estamos estudiando según el criterio que
precisamente queremos estudiar.

Ejemplos:
•Queremos distribuir a los alumnos de nuestro curso según el criterio de
edad.
•Queremos distribuir a los pacientes del hospital según el nivel de su
enfermedad que puede ser leve, de cuidado, y muy grave.
•Queremos distribuir los vehículos de una empresa minera según su
capacidad de tonelaje.
Estadística: el concepto de distribución

Supongamos que tenemos 21 personas... Y estamos interesadas en su


estatura medida en metros
Estadística: el concepto de distribución

Por lo tanto a cada una de estas 21 personas medimos su estatura...

1,82 metros

1,68 metros

... Por ejemplo aquí estamos midiendo a Elvira ..y al maceteado Araya
Estadística: el concepto de distribución

Vamos a suponer que los resultados de cada una de las 21 mediciones


medidas en metros y puestas en orden creciente son los siguientes:

1,56 – 1,57 – 1,59 – 1,62 – 1,62 – 1,63 – 1,65 – 1,67 – 1,69 – 1,70
1,71 – 1,72 – 1,74 - 1,75 – 1,76 – 1,77 – 1,79 – 1,80 – 1,81 – 1,81 – 1,82

Observemos que la menor de las mediciones fue de 1,56 metros, y la


mayor de 1,82 metros. De lo que estamos seguro, entonces, que las 21
personas están entre 1,56 y 1,82 metros. Tales medidas mínima y
máxima constituyen lo que se llama rango.

Observemos que la diferencia entre este mínimo y máximo es de 1,82 –


1,56 = 0,26 metros (o si usted lo prefiere 26 centímetros)
Estadística: el concepto de distribución

Arbitrariamente podemos formar cuatro clases de alturas, y de tal


forma que cada clase de altura tenga una distancia de 0,07 metros (o 7
centímetros, si usted lo prefiere).

•La primera clase será la gente que mida desde 1,56 hasta 1,63 inclusive
•La segunda clase será la gente que mida más de 1,63 hasta 1,70 inclusive
•La tercera clase será la gente que mida más de 1,70 hasta 1,77 inclusive
•La cuarta clase será la gente que mida más de 1,77 hasta 1,84.

La pregunta es entonces, ¿cuánta gente pertenecerá a cada clase?


Estadística: el concepto de distribución

6 personas 4 personas

1,56 – 1,57 – 1,59 – 1,62 – 1,62 – 1,63 – 1,65 – 1,67 – 1,69 – 1,70
1, 71 – 1,72 – 1,74 - 1,75 – 1,76 – 1,77 – 1,79 – 1,80 – 1,81 – 1,81 – 1,82
6 personas 5 personas

Clases Frecuencias
1,56 – 1,63 (bajitas) 6
1,63 – 1,70 (medianas) 4
1,70 – 1,77 (altas) 6
1,77 – 1,84 (muy altas) 5
Estadística: el concepto de distribución
bajitas

Muy
medianas
altas

altas
Estadística: el concepto de distribución

Se divide cada frecuencia por el total

Clases Frecuencias Frec. relativa


1,56 – 1,63 (bajitas) 6 0,2857
1,63 – 1,70 (medianas) 4 0,1905
1,70 – 1,77 (altas) 6 0,2857
1,77 – 1,84 (muy altas) 5 0,2381
Total 21 1

Hay 5 personas que son El 19,05% de las personas tienen estatura


muy altas o su estatura es media o tienen estatura entre 1,63 y 1,70
mayor que 1,77 metros metros, inclusive
Estadística: el concepto de distribución
Suma parcial de las frecuencias
Suma parcial de las frecuencias, relativas, frecuencia acumulada
frecuencia acumulada relativa

Clases Frecuencias Frec. relativa Frec. acum F. A. R.


1,56 – 1,63 (bajitas) 6 0,2857 6 0,2857
1,63 – 1,70 (medianas) 4 0,1905 10 0,4762
1,70 – 1,77 (altas) 6 0,2857 16 0,7619
1,77 – 1,84 (muy altas) 5 0,2381 21 1

Total 21 1
El 47,62% de las personas
miden hasta 1,70 metros,
Hay 16 personas que miden hasta
inclusive
1,77 metros, inclusive
Distribución de Frecuencias (datos
agrupados)
 Elemplo 2:
 Siguiendo con el estudio del zapallo japonés ahora
estamos interesados en evaluar el peso de los zapallos para eso
registramos su peso en kilogramos. Tomó una muestra de 30
zapallos

Variable: peso tipo cuantitativa continua


Muestra 30 zapallos
DATOS:

1.20 1.20 1.20 1.30 1.30 1.30


1.60 1.60 1.60 1.60 1.60 1.60
1.40 1.50 1.50 1.50 1.50 1.50
1.70 1.70 1.70 1.70 1.80 1.80

1.60 1.90 1.80 1.80 2.00 1.90

1º PASO: CALCULAR EL RANGO DE LOS DATOS. QUE


ES LA DIFERENCIA ENTRE EL MAXIMO VALOR Y EL
MINIMO

R= xM-xm= R= XM-xm = 2.00-


1.20=0.80
2ºPASO: CALCULAR LA CANTIDAD DE INTERVALOS
Regla de Sturges: K=1+3.322*logN
Alternativamente se puede utilizar: K=5 log N
O sino: K= ; donde 25<N<400

Fórmula para calcular la cantidad de


intervalos Con la Ley de Portugal:

K=1+3.322*logN: N<50
K=1,8914+3,9910logN: 50<N<100
K=2,7560+5,8154logN: N>100

1+3.322log 30=5.906  6
3º PASO: CALCULAR LA AMPLITUD DEL INTERVALO

AMPLITUD= RANGO/Nº DE INTERVALOS

0.80/6=0.1333 0.15

La amplitud del intervalo es 0.15


SI COMENZAMOS CON 1.10

Clase xi MARCA DE
CLASE
(1.10-1.25] 1.18

(1.25-1.40] 1.33

(1.40-1.55] 1.48

(1.55-1.70] 1.63

(1.70-1.85] 1.78

(1.85-2.00] 1.93
Clase xi fi fr Fi Fr fr% Fr%

1 (1.10-1.25] 1.18

2 (1.25-1.40] 1.33

3 (1.40-1.55] 1.48

4 (1.55-1.70] 1.63

5 (1.70-1.85] 1.78

6 (1.85-2.00] 1.93
1.20 1.20 1.20 1.30 1.30 1.30 1.40

1.50 1.50 1.50 1.50 1.50 1.60 1.60

1.60 1.60 1.60 1.60 1.60 1.70 1.70

1.70 1.70 1.80 1.80 1.80 1.80 1.90


1.90 2.00
Clase xi fi Fr Fi Fr fr% Fr%

1 (1.10-1.25] 1.18 3 0.10 3 0.10 10 10

2 (1.25-1.40] 1.33 4 0.13 7 0.23 13 23

3 (1.40-1.55] 1.48 5 0.17 12 0.40 17 40

4 (1.55-1.70] 1.63 11 0.37 23 0.77 37 77

5 (1.70-1.85] 1.78 4 0.13 27 0.90 13 90

6 (1.85-2.00] 1.93 3 0.10 30 1.00 10 100


GRAFICOS: HISTOGRAMA

Cantidad de zapallos según peso

12

10
cantidad de zapallos

2
3
0
0.03 1.18 1.33 1.48 1.63 1.78 1.93 2.08

peso
Fuente: Datos brindados por la cátedra
POLIGONO DE FRECUENCIAS

Cantidad de zapallos según peso

12
cantidad de zapallos

10

0
0.03 1.18 1.33 1.48 1.63 1.78 1.93 2.08

Fuente: Datos brindados por la cátedra


peso
OJIVA
Ojiva o poligono de frecuencias acumuladas

33
30
27
24
21
peso

18
15
12
9
6
3
0
1.1 1.25 1.4 1.55 1.7 1.85 2
Fuente: Datos brindados por la cátedra cantidad de zapallos
ESTADIGRAFOS DE
POSICION

27
Medidas de Tendencia Central

MEDIA ARITMÉTICA

MEDIANA

centro
MODA

MEDIA ARMÓNICA.
MEDIA GEOMÉTRICA.
CUANTILES o SEPARATRICES
Estadística y Probabilidades
EAP- Ing. CIVIL – LIRCAY-UNH

-Media Aritmética (Promedio)


MEDIDAS DE TENDENCIA CENTRAL -Mediana
-Moda

Datos Cuantitativos Datos Cuantitativos ordenados de menor a mayor


x x Mediana
x1 x (1)
Media Aritmética o Promedio M E = x( k ) Si n es impar
n
x2 x( 2)

 xi ME =
x( k ) + x( k +1) Si n es par
x= i =1  2
xn n x (n ) x( k ) = dato del centro

Datos Moda
Cualitativos y Cuantitativos M o =" el dato que más se repite"

29
Estadística y Probabilidades
EAP- Ing. CIVIL – LIRCAY-UNH

MEDIA ARITMÉTICA ( X o M (X ) )

• Es la medida de tendencia central más


conocida, esta es la medida descriptiva Indi
que la mayoría de personas tienen en vidu
o 1 2 3 4 5 6 7 8 9 10 11 12 13
mente cuando se habla de “promedio”.
VEF
• La media aritmética, o simplemente (litro
media, de un conjunto de datos se s) 2.3 2.2 3.5 2.6 2.8 2.82 4.05 2.3 2.68 3 4 2.85 3.38

define como la suma de todos los


valores de la variable dividido entre el
número de datos.
• Media aritmética para datos Tabla 3.1: Volúmenes de expiración forzado en 1
originales: segundo de 13 adolescentes que padecen asma.
• Por ejemplo en la Tabla Nº 1, tenemos
13 observaciones sobre los volúmenes
de expiración forzada en 1 segundo de para hallar la media aritmética de sus notas procedemos de la siguiente manera:
13 adolescentes que padecen de asma.
2.3 + 2.15 + 3.50 + 2.60 + 2.75 + ... + 2.85 + 3.38
M (X ) = X = = 2.95
13 30
Estadística y Probabilidades
EAP- Ing. CIVIL – LIRCAY-UNH

Media aritmética para datos agrupados sin intervalos

Nº de hijos (Xi) fi Xifi


• Si los datos están agrupados en una tabla de
1 5 1x5=5
frecuencias, primero se multiplican los
2 6 2x6=12
valores de la variable por sus respectivas 3 6 3x6=18
frecuencias, luego se suman estos productos y 4 2 4x2=8
por último se divide el resultado entre el 5 5 5x5=25
número de datos. 6 2 6x2=12
7 2 7x2=14
n 8 2 8x2=16

X i fi T o t al 30 110
M (X ) = X = i =1

M (X ) = X =
110
Ejemplo: La edad promedio es: = 3.67
Considere la siguiente variables Número de hijos de 30
un grupo de familias encuestadas en un Centro de
Salud. Calcule el promedio de hijos de ese grupo de Interpretación: El promedio de hijos es aproximadamente 4,

familias . para ese grupo de familias

31
Estadística y Probabilidades
EAP- Ing. CIVIL – LIRCAY-UNH

Media aritmética para datos agrupados con intervalos

Tabla N° 3.3
Edad (Años) Marcas de
• Si los datos están agrupados en una tabla clase (Yi) fi Yi fi
de frecuencia de variable continua, se 10 – 18 14 2 28
procede de la misma forma pero utilizando 19 – 27 23 4 92
28 – 36 32 6 192
como valor de la variable el valor de la 37 – 45 41 9 369
marca de clase. 46 – 54 50 3 150
55 - 64 59.5 6 357
• Ejemplo: Considere la Tabla Nº 3.3, y
T OTAL 30 1188
considere edades de un grupo de pacientes
atendidos en la sala de urgencias de un
hospital. La fórmula que usamos en este caso es:
n

Y f i i
Y = i =1

1188
Luego el resultado es: Y = = 39.6
30
Interpretación: la edad promedio, de ese grupo de pacientes, 32
es 39.6 años.
La media aritmética ponderada ( x p )
donde:
n

wX i i wi = factor de ponderación


xp = i =1
n

 wi
i =1
Xi = datos
Ejemplo: Una empresa comercializadora de Seguros Médicos
dispone de 3 representantes para la zona de Miraflores, cada uno
de los cuales cobra diferente comisión por póliza vendida, y
realiza diferente número de contratos. Calcule e interprete el
valor medio de la comisión

Nº de polizas de Comisión
Vendedor Seguro Médico por venta $
wi Xi
Pedro 30 30
Juan 25 40
Pablo 20 50
30(30) + 25(40) + 20(50) 2900
xp = = = $38.67
30 + 25 + 20 75

Interpretación:

Si se elige al azar un representante se espera que cobre una


comisión de $38.67 por póliza vendida.
Ventajas y desventajas de la media aritmética
Ventajas:
Concepto familiar para muchas personas
Es única para cada conjunto de datos
Es posible comparar medias de diferentes muestras
Desventajas
Se ve afectada por los datos extremos
Si la muestra es grande y los datos no están agrupados, su
cálculo es tedioso
Si los datos están agrupados en clases con extremos abiertos,
no es posible calcular la media.
MEDIANA ( P50, D5,Q2)
Es el valor de la variable que divide a las observaciones en dos grupos
con el mismo número de individuos (percentil 50).
Si el número de datos es par, se elige la media de los dos datos centrales

Si el número de observaciones es IMPAR 1, 2, 4, 5, 6, 6, 8

Mn es 5

Si el número de observaciones es PAR 1, 2, 4, 4, 5, 6, 6, 8

Mn es
(4+5)/2 = 4,5
Características
Calculada para datos en escala Ordinal, Intervalo y
Proporción (razón)
 Única para un conjunto dado de datos

 Fácil de determinar en datos no agrupados

 No es influenciada por valores extremos


La mediana es 5
1, 2, 4, 5, 6, 6, 800.
La media es 117,7

 Se puede calcular con clases con extremos abiertos


CALCULO de la MEDIANA
1) Ordenar los valores de
DATOS
SIN AGRUPAR:
menor a mayor
i = (n + 1)0.5
2) Determinar la posición i

DATOS
3) Hallar el valor de x en la Mn = xi
posición i
AGRUPADOS:

1) Determinar la posición (igual que para datos sin agrupar)

2) Determinar la clase que contiene la Mediana

3) Realizar la interpolación n
para hallar el valor de la Mn
2 − Fa
Mn = Li + h
f
CALCULO de la MEDIANA para datos agrupados

sesClases
Xi fXi F f frF Frfr Fr (35 + 1)  0.5 = 18
1) Determinar la posición

345330-345
337 3337 33 0,09 3 0,09
2) clase0,09 0,09 la Mediana Li = 375
que contiene
360345-360
352 3352 63 0,096 0,18 0,09 0,18
3) Realizar la interpolación para hallar el valor de
375360-375
367 4367 104 0,11 10 0,29
0,11 0,29 la Mn
390375-390
382 12382 22
12 0,3422 0,63
0,34 0,63 n
405390-405
397 7397 297 0,20 29 0,83
0,20 0,83 2 − Fa
420405-420
412 4412 334 0,11 0,11Mn
33 0,94 = Li +
0,94 h
435420-435
427 2427 352 0,06 35 1,00
0,06 1,00 f
ALTOTAL 35 35 1,00 1,00
35 − 10
Mn = 375 + 2 15 = 375 + 9.375 = 384 .375
12
Extensión del intervalo h = 390-375
Distribución de frecuencias relativas acumuladas
de los- pesos
EJEMPLO Métodode novillos.
grafico paraFV. 2002
hallar la Mediana
Distribución de frecuencias relativas acumuladas
de los pesos de novillos. FV. 2002
1,0
0,9 1,0
0,9
0,8 0,8
0,7 0,7
0,6
0,6
Fr

0,5
0,4
Fr

0,5 0,3
0,4 0,2
0,1
0,3 0,0
330 345 360 375 390 405 420 435
0,2 Marcas de Clase Kg
0,1
0,0
330 345 360 375 390 405 420 435
Mn (P50)
Marcas de Clase Kg
MODA
Definición : Valor de la variable con mayor frecuencia

Características
• Útil para medidas nominales y ordinales
• No se afecta por valores extremos
• Se puede utilizar con clases abiertas
• Puede no existir o no ser única

Datos sin agrupar

297 314 333 350 388 412 421 455 455 455
466 466 502 502 542 587 601 621 629
Mo = 455
CALCULO de la MODA para datos agrupados

1) Determinar la clase que contiene la Moda


sesClases
Xi fXi F f frF Frfr Fr
Li = 375
345330-345
337 3337 33 0,093 0,09 0,09 0,09
360345-360
352 3352 63 0,09 2) 6 0,18
0,09la interpolación
Realizar 0,18 para hallar el valor de la
375360-375
367 4367 1014 0,1110 0,29
0,11 0,29
1
390375-390
382 12382 22
12 0,34 22 0,63
0,34 0,63 Mo = Li + h
1 +  2
397 7397 2972 0,20
405390-405 29 0,83
0,20 0,83
420405-420
412 4412 334 0,11 33 = 0,94
0,11
12 – 4 0,94
= 2 = 12 – 7 =
1
435420-435
427 2427 352 0,06 35 1,00
0,06
8 1,00 5
ALTOTAL 35 35 1,00 1,00

8
Mo = 375 + 15 = 375 + 9.23 = 384 .23
8+5
Extensión del intervalo h = 390-375
LOS CUANTILES
• Se define el cuantil de orden a como un valor de la variable por
debajo del cual se encuentra una frecuencia acumulada a.
• Casos particulares son los percentiles, cuartiles, deciles, quintiles,...
Estadísticos de posición
 Percentil de orden k = cuantil de orden k/100
◦ La mediana es el percentil 50
◦ El percentil de orden 15 deja por debajo al 15% de las observaciones. Por encima
queda el 85%

 Decil de orden k = cuantil de orden k/10


◦ La mediana es el decil 5
◦ El decil de orden 8 deja por debajo al 80% de las observaciones. Por encima
queda el 20%

 Cuartiles: Dividen a la muestra en 4 grupos con frecuencias


similares.
◦ Primer cuartil = Percentil 25 = Cuantil 0,25
◦ Segundo cuartil = Percentil 50 = Cuantil 0,5 = mediana
◦ Tercer cuartil = Percentil 75 = cuantil 0,75
Estadística y Probabilidades
EAP- Ing. CIVIL – LIRCAY-UNH

-Percentil (ejemplo: 25, 50, 75)


Percentiles, Deciles o Cuartiles -Decil (ejemplo: 4, 5, 8)
-Cualtil (ejemplo: 1, 2, 3)

Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando los n
datos están ordenados de Menor a Mayor
El Percentil va de 1 a 100
El percentil 25 (25/100): es el valor de la variable que reúne al menos el 25% de los datos
Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20.
Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22.
El Decil va de 1 a 10
El Decil 4 (4/10): es el valor de la variable que reúne al menos el 40% de los datos
Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32.
Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34.
El Cuartil va de 1 a 4
El Cuartil 3 (3/4): es el valor de la variable que reúne al menos el 75% de los datos
Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60.
Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64. 46

También podría gustarte