Está en la página 1de 30

GRUPO ISOTOPO MAT370-A

MEDIDAS ESTADISTICAS
Tabla de contenido
MEDIDAS DE TENDENCIA CENTRAL .................................................................................... 2

MEDIA .................................................................................................................................. 2

MEDIA ARITMETICA ............................................................................................ 2

MEDIA ARITMETICA PONDERADA ................................................................. 6

MEDIA GEOMETRICA ........................................................................................... 7

MEDIA ARMONICA ................................................................................................. 8

MEDIANA .......................................................................................................................... 10

MODA .................................................................................................................................15

MEDIDAS DE TENDENCIA NO CENTRAL ...........................................................................16

CUARTILES ...................................................................................................................... 16

DECILES ............................................................................................................................ 18

PERCENTILES ................................................................................................................. 20

MEDIDAS DE DISPERSION .....................................................................................................23

RANGO DE VARIAZION ..................................................................................................24

VARIANZAR ...................................................................................................................... 26

MEDIDAS DE MEDIA ........................................................................................................29

DESVIACION ESTANDAR ............................................................................................... 29

COEFICIENTE DE VARIACION ....................................................................................... 30

1 DE ABRIL DE 2024 1 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

MEDIDAS DE TENDENCIA CENTRAL


En los estudios estadísticos es importante el análisis de la información que
corresponde a variables cualitativas y cuantitativas, a partir de la tabulación y la
representación de los datos por medio de gráficas. Además de esto, es necesario
analizar los datos por medio de cálculos matemáticos que resuman el
comportamiento de las características del objeto de estudio.

En la mayoría de los casos, el conjunto de datos obtenidos, ya sea de una muestra


o de una población, tienden a reunirse alrededor de un valor central. De esta
manera, es posible obtener un valor típico o representativo de todo el conjunto de
datos, el cual se denomina medida de tendencia central (Walpole y Myers, 2012).
Las medidas de tendencia central más representativas son: Media aritmético, media
aritmética ponderado, media geométrica, media armónica, mediana, moda.

MEDIA ARITMETICA

La media aritmética de una variable se representa por y se define de la


siguiente manera:

a) Para datos no agrupados se suma todos los datos y se


divide por el tamaño de la muestra:

Ejemplo:
Sean los siguientes valores las calificaciones la asignatura de matemáticas de estudiantes
de primer año:

10 8 6 7.5 7 7.5 8 9.5 10 10

8 6 9 10 7.5 6 9.5 10 6.5 8

6 6 9 10 7 8 9.5 5 8 7.5

Sumando los valores de las 30 calificaciones y dividiéndolas entre los 30 datos


obtendremos:

240
= =8
30

1 DE ABRIL DE 2024 2 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

b) Para datos agrupados en una distribución de frecuencias, se calcula así:

Donde representa las de clase y las frecuencias observadas.

En los siguientes casos NO es recomendable utilizar el promedio

aritmético:

a) Los datos son muy heterogéneos.


b) Hay presencia de valores extremos muy altos o muy bajos.
c) Se desea conocer el promedio de una variable a través del tiempo; por
ejemplo, costo de vida, crecimiento de población, operaciones financieras.
Ejemplo: A partir de los datos tabulados en la siguiente tabla que corresponden a
las edades de un grupo de personas tomadas al azar, calcular la media aritmética

Li - Ls 𝑓𝑖 x x *fi
Li - Ls 𝒇𝒊
32 – 42 3 37 111
32 – 42 3 42 – 52 6 47 282
42 – 52 6 52 – 62 10 57 570
52 – 62 10 62 – 72 7 67 469
62 – 72 7 72 – 82 2 77 154
72 – 82 2
28 1.586

Calculamos primero la marca de clase. Luego la columna de las marcas de clase se


las multiplica con las frecuencias absolutas.

1586
𝑥̅ = 28
= 56.64

El promedio de las edades de este grupo de personas es: 56,64 años.

1 DE ABRIL DE 2024 3 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

PROPIEDADES DE LA MEDIA ARITMÉTICA

Se denominan desviaciones a las diferencias de una variable con respecto a un


valor particular de la misma, el cual se toma como referencia. En lo que sigue, se
consideran las desviaciones respecto al promedio aritmético.
1) La suma algebraica de todas las desviaciones (diferencias) respecto al promedio
aritmético es igual a cero.

a) Para datos no agrupados:

Ejemplo:
Suponga que los siguientes datos corresponden a las calificaciones de cinco
estudiantes, evaluados en una escala de 1 a 10: 2, 4, 6, 8, 10.

El promedio de las calificaciones es:

Ejemplo de desviación de datos no agrupados respecto a la media

2 -4
4 -2
6 0
8 2
10 4
Suma 0
2 − 6 = −4

b) Para datos agrupados

1 DE ABRIL DE 2024 4 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

Ejemplo de cálculo de desviación en datos agrupados respecto a la media

Grupos

1 190 210 11 200 2200 -506


2 210 230 13 220 2860 -338
3 230 250 7 240 1680 -42
4 250 270 4 260 1040 56
5 270 290 6 280 1680 204
6 290 310 2 300 600 108
7 310 330 7 320 2240 518
Total 50 12300 0
Media=246

2) El promedio aritmético de una constante es igual a la misma constante :

3) El promedio del producto de una constante por una variable, es igual al


producto de la constante por el promedio de la variable:

4) El promedio de la suma de una variable y una constante, es igual a la media


de la variable más la constante:

Si una muestra de observaciones con promedio , se divide en dos o más submuestras


De datos con promedio , datos con promedio Datos con promedio
, entonces la media de todos los datos es:

Ejemplo:

En un curso de Estadística hay 60 estudiantes, de los cuales 20 son mujeres; la nota


promedio de los hombres es 4,0 y de las mujeres 3,5. Determinar la nota promedio
de todo el grupo.
El promedio del grupo se obtiene aplicando la fórmula para el cálculo del promedio
ponderado, así:

1 DE ABRIL DE 2024 5 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

Se observa que el promedio ponderado es 3,83 puntos, un poco menos que el


promedio de los hombres, y a la vez, un poco más que el promedio de las mujeres.

PROMEDIO ARITMETICO PONDERADO

Hay casos en que los valores de una variable no tienen la misma importancia o peso,
por lo cual, es necesario asignarles un determinado factor o ponderación, que se
simboliza por

Si tiene un peso tiene un peso etc., entonces, la media aritmética


ponderada se define por:

Los pesos pueden tomar cualquier valor numérico.

Ejemplo.-
Un estudiante realiza 3 exámenes de complejidad creciente, obteniendo los
siguientes resultados: 5, 8 y 7. El primer examen lo hizo en ½ hora, el segundo
en 1 hora y el tercero en hora y media, por lo que se les atribuye una
ponderación de 1, 2 y 3 respectivamente. Se pide calcular la nota media.

𝑊𝑖 𝑋𝑖𝑊𝑖 Ahora bien, si calculamos la


𝑋𝑖 media ponderada,
5 1 5 obtendremos:
8 2 16
7 3 21
6 42

1 DE ABRIL DE 2024 6 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

Se observa que el promedio ponderado difiere del promedio aritmético no


ponderado. La aplicación de una u otra fórmula depende del enunciado del
problema y de la naturaleza del mismo.

MEDIA GEOMÉTRICA

El empleo más frecuente de la media geométrica es el de promediar variables


tales como porcentajes, tasas, números índices. etc., es decir, en los casos en
los que se supone que la variable presenta variaciones acumulativas. Además,
cuando la variable toma al menos un x i = 0 entonces G se anula, y si la variable
toma valores negativos se pueden presentar una gama de casos particulares en
los que tampoco queda determinada debido al problema de las raíces de índice
par de números negativos.

La media geométrica de n valores no negativos es la enésima raíz del


producto de los “n” valores.

Si algunos valores son muy grandes en magnitud y otros muy pequeños, la media
geométrica proporciona una mejor representación de los datos que un simple
promedio.

a) Datos no agrupados

Esta fórmula es complicada de usar cuando los valores son grandes. Por lo que es
necesario hacerle algunos arreglos
Matemáticos

Aplicamos una propiedad de raíz cuadrada

Aplicamos propiedades logarítmicas

Aplicamos propiedades logarítmicas

Obtenemos una ecuación de fácil uso.

1 DE ABRIL DE 2024 7 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

Ejemplo:

Encontrar la Media Geométrica de: 7 8 2 6 5

b) Datos agrupados

Calcular la media geométrica para la siguiente tabla:

Li - Ls 𝒇𝒊 𝒙𝒊 log 𝒙𝒊 𝑓𝑖 𝑙𝑜𝑔 𝒙𝒊

32 – 42 3 37 1,586 4,704
42 – 52 6 47 1,672 10,032
52 – 62 10 57 1,755 17,550
62 – 72 7 67 1,826 12,782
72 – 82 2 77 1,826 3,772

28
fi.log 𝒙𝒊 = 48,851

𝑙𝑜𝑔. 𝑋𝐺 = 1,744

𝑋𝐺 = 𝑎𝑛𝑡𝑖𝑙𝑜𝑔 1, 744

𝑋𝐺 = 55,46

1 DE ABRIL DE 2024 8 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

MEDIA ARMÓNICA

La inversa de la media armónica es la media aritmética de los inversos de los


valores de la variable. No es aconsejable en distribuciones de variables con
valores pequeños. Se suele utilizar para promediar variables tales como
productividades, velocidades, tiempos, rendimientos, cambios, etc.

La media armónica, el cual es útil para calcular promedios de variables


expresadas en proporciones de unidades por tiempo, tales como kilómetros por
hora, número de unidades de producción por día.

Datos no agrupados

X G = Media Armónica
X i =Valores de la variable
n =Número de observaciones

Ej.: Calcular la Media Armónica de los siguientes valores: 7 5 10 6 (n = 4)

𝑋𝐻 = 6,56
Datos Agrupados

fi = Frecuencia Absoluta
𝑛
𝑋𝐻 = 𝑓 MC = Marca de clase
∑ 𝑖
𝑀𝐶
n = Número de observaciones
Encontrar la media armónica de la siguiente tabla:

Li - Ls 𝑓𝑖 𝑀𝐶 𝑭𝒊
𝑴𝑪

32 – 42 3 37 0,081
42 – 52 6 47 0,128
52 – 62 10 57 0,175
62 – 72 7 67 0,104
72 – 82 2 77 0,025

𝑓𝑖

𝑀𝐶
= 0,513

1 DE ABRIL DE 2024 9 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

Características de la Media Armónica.

• Se toman en cuenta todos los valores de la variable


• Es afectada por valores extremos aunque en menor medida que la
media aritmética.
• La media geométrica de un número y su recíproco será siempre igual
a uno.
• No puede ser calculada en distribuciones con clase abiertas.
• Es mayormente usada para promediar tazas de cambio, razones y
valores que muestren una progresión geométrica

RELACION ENTRE LAS MEDIAS.

Entre la media aritmética la media geométrica y media armónica se da siempre la


siguiente relación:

MEDIANA

Es el valor que divide en dos partes iguales una serie ordenada de datos; es decir,
es el valor central de la serie. Se puede utilizar la mediana como un valor
representativo de un conjunto de datos cuando no sea recomendable utilizar el
promedio aritmético. Se denota por
Consideramos una variable discreta X cuyas observaciones en una tabla
estadística han sido ordenadas de menor a mayor. Llamaremos mediana al
primer valor de la variable que deja por debajo de sí al 50 %de las
observaciones. En otras palabras es el valor que se encuentra exactamente en
el centro del conjunto de datos.

Es el valor de la variable que, ordenados los datos de menor a mayor, deja a


izquierda y derecha el mismo número de observaciones. El valor de la variable
que tiene una frecuencia acumulada de 𝑛⁄2

En el caso de una distribución "no agrupada" su determinación no presenta


problemas.

En el caso de una distribución con los valores agrupados por intervalos: habrá
de detectarse primero el "intervalo mediano” (aquel intervalo en el que se
produzca una acumulación de frecuencia de 𝑛⁄2). Después obtendremos el
valor "intrapolando" gráficamente, suponiendo que la distribución de
frecuencias dentro del intervalo es "uniforme":

1 DE ABRIL DE 2024 10 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

Ej: Analizando el siguiente gráfico, el dibujo correspondiente a la posición 4 será


la mediana de este grupo

Datos no agrupados:

1 2 2 3 5 6 8 9 9 10 10 10 13 15 17

El valor central corresponde a la mediana

Para su cálculo es necesario seguir los siguientes pasos:

1) Ordenar los datos. (Es decir, hacer del conjunto de datos una serie).
2) Hallar el lugar donde cae la mediana.
3) Hallar el valor de la mediana.
Ordenada la serie se busca el lugar. Para ello se aplica la fórmula:

Siguiendo con el ejemplo anterior:

2, 2, 3, 4, 4, 5, 5, 5, 6

“5” es el lugar donde cae la mediana. Hallar el valor, en este caso en que hay un
número impar de observaciones, es fácil: es la quinta observación (contando de
izquierda a derecha o de derecha a izquierda). Esa observación tiene el valor 4.
Por lo tanto, la mediana de esta serie es de 4 años de edad.

1 DE ABRIL DE 2024 11 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

Si el número de observaciones fuera par:

2, 2, 3, 4, 4, 5, 5, 5, 6, 8

“5,5” es el lugar donde cae la mediana; es decir en la mitad entre el 5º y el 6º


lugar. Para hallar el valor deberá sacarse la media de los valores de las
observaciones que corresponden a esos lugares; ya que 5,5 representa la mitad
del espacio comprendido entre ambas. El quinto y el sexto lugar lo ocupan
observaciones que tienen valores 4 y 5, respectivamente. Por lo tanto, la
mediana será la media de 4 y 5; es decir: 4,5 años de edad.

Si existiera un valor aberrante:

2, 2, 3, 4, 4, 5, 5, 5, 24

Como puede verse el lugar de la mediana no cambia y su valor tampoco; es decir,


no se ve influido por un valor aberrante.

Datos agrupados

Donde:
𝑀𝑒 = 𝑀𝑒𝑑𝑖𝑎𝑛𝑎
𝐿𝐼 = 𝐿í𝑚𝑖𝑡𝑒 inicial de la 𝑐𝑙𝑎𝑠𝑒 𝑑𝑜𝑛𝑑𝑒 𝑠𝑒 𝑒𝑛𝑐𝑢𝑒𝑛𝑡𝑟𝑎 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
𝑛 = 𝑁u𝑚𝑒𝑟𝑜 de observaciones
𝑓𝑎𝑖−1 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 acumulada 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑝𝑟𝑒𝑐𝑒𝑑𝑒𝑛𝑡𝑒 𝑎𝑙 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
𝑓𝑖 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖a absoluta 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
𝐴𝐶 = 𝐴𝑛cho de la clase

Li - Ls MC f fa
Ejemplo:
40 – 50 45 5 5
50 – 60 55 10 15
60 – 70 65 21 36
70 - 80 75 11 47
80 - 90 85 5 52
90 - 100 95 3 55
100 – 115 3 58
130

1 DE ABRIL DE 2024 12 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

Primero debemos determinar en qué clase se encuentra la mediana, para ello:

𝑴𝒆 = 𝟔𝟔, 𝟔𝟕

Por lo tanto, el valor que se encuentra exactamente en el centro de este conjunto


de datos es: 66,67

1 DE ABRIL DE 2024 13 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

Cálculo de la Mediana para variables cuantitativas discretas. -


Ejemplos:

A) Edades de un grupo de jóvenes que han realizado un curso para aprender


a montar a caballo.

𝑋𝑖 𝑓𝑖 𝑓𝑎
20 3 3
21 4 7 (Se encuentra en la 2da. categoría
22 3 10
23 1 11 𝐸𝑑𝑎𝑑 𝑀𝑒𝑑𝑖𝑎𝑛𝑎: 𝑀𝑒 = 21 𝑎ñ𝑜𝑠
24 1 12

Características de la Mediana.-

• En su cálculo no se incluyen todos los valores de la variable.


• La Mediana no es afectada por valores extremos.
• Puede ser calculada en distribuciones de frecuencia con clases
abiertas.
• No es lógica desde el punto de vista algebraico.

REPRESENTACION GRAFICA DE LA MEDIANA. -

fa(-)

fa i
n
2
fa 1- i

Límites
Li Me Ls

1 DE ABRIL DE 2024 14 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

MODA

Se define como el valor de mayor frecuencia en un conjunto de datos; es decir,


corresponde al valor que más se repite; por ejemplo, la nota predominante en un
examen.

Cálculo en datos agrupados

: Límite inferior real de la clase de mayor frecuencia (clase modal)


: Frecuencia de la clase modal, menos la frecuencia anterior
: Frecuencia de la clase modal, menos la frecuencia posterior
: Amplitud del intervalo
Ejemplo: Calcular la moda de la siguiente distribución de datos:
Datos para ejemplo de cálculo de moda en datos agrupados

Puntaje

190-220 13
220-250 17
250-280 6
280-310 6
310-340 8
Total 50

1 DE ABRIL DE 2024 15 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

MEDIDAS DE TENDENCIA NO CENTRAL


La mediana divide una serie de datos ordenados en dos partes iguales, dejando un 50%
de información por debajo de este valor y un 50% por encima. Pero la serie puede
dividirse en cuatro, diez o cien partes iguales, dando lugar a cuartiles, deciles y
percentiles.
CUARTILES

Son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o


decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el
25% de los resultados.

• Q1, primer cuartil, al menos el 25% de los datos son menores o iguales que él y al
menos el 75% de los datos son mayores o iguales que él.

• Q2, segundo cuartil, es la mediana, Q2 = Me. Al menos el 50 % de los datos son


menores o iguales que él y al menos el 50 % de los datos son mayores o iguales
que él.

• Q3, tercer cuartil, al menos el 75% de los datos son menores o iguales que él y al
menos el 25% de los datos son mayores o iguales que él.

• Q4, cuarto cuartil, es el mayor valor que se alcanza en la muestra.

Resumiendo:

• Q1= Valor de la variable que deja a la izquierda el 25% de la


distribución.

• Q2= Valor de la variable que deja a la izquierda el 50% de la


distribución = mediana.

• Q3= Valor de la variable que deja a la izquierda el 75% de la


distribución.

1 DE ABRIL DE 2024 16 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

Ejemplo: Se tiene a 15 personas en filas ordenadas de menor a mayor estatura

Representación.-

0% 25 % 50 % 75 % 100 %

𝑄1 𝑄2 𝑄3

b) Datos tabulados

𝑖∗𝑛
− 𝑓𝑎𝑖−1
𝑄1 = 𝐿𝑖 + ( 4 ) ∗ 𝐴𝐶
𝑓𝑖

𝐿𝑖 = límite inferior de la clase donde se encuentra el cuartil i

i =indica el número del cuartil

n = la cantidad de valores u observaciones

𝑓𝑎𝑖−1 = la frecuencia acumulada “menor que” de la clase anterior ala del cuartil i

𝑓𝑖 =frecuencia absoluta de la clase donde se encuentra el cuartil i

AC= ancho de clase

1 DE ABRIL DE 2024 17 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

Ejemplo: Utilicemos la distribución de los ingresos por familia semanal en bolivianos.

Límites fi fa
65 - 75 4 4
75 - 85 11 15
85 - 95 20 35
95 - 105 9 44
105 - 115 6 50

Total 50

Calcular los cuartiles 1 y 3:

𝑖𝑛
Con la relación 4 determinamos en la columna de fa (-) en que clase está
contenido él.
Cuartil deseado, donde “i”, representa el cuartil.

PRIMER CUARTIL:

𝑖𝑛 1∗50
= = 12.5 lo que nos indica en el primer cuartil se encuentra en el
4 4
segundo intervalo

Límites fi fa
65 - 75 4 4
75 - 85 11 15
85 - 95 20 35
95 - 105 9 44
105 - 115 6 50 𝑄1
Total 50

Reemplazamos en la ecuación:
1 ∗ 50
−4
𝑄1 = 75 + ( 4 ) ∗ 10 = 82,73 𝑏𝑜𝑙𝑖𝑣𝑖𝑎𝑛𝑜𝑠
11

Interpretación.- significa que el 25% de todas las familias encuestadas


tienen un ingreso menor o igual a 82,73

1 DE ABRIL DE 2024 18 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

TERCER CUARTIL:
𝑖𝑛 3∗50
= = 37,5 lo que nos indica en el tercer cuartil se encuentra en el
4 4
cuarto intervalo o clase.

Límites fi fa
65 - 75 4 4
75 - 85 11 15
85 - 95 20 35
95 - 105 9 44 𝑄3
105 - 115 6 50

Total 50

Reemplazamos en la ecuación:
3 ∗ 50
− 35
𝑄1 = 95 + ( 4 ) ∗ 10 = 97,78 𝑏𝑜𝑙𝑖𝑣𝑖𝑎𝑛𝑜𝑠
9

Interpretación.- significa que el 75% de todas las familias encuestadas


tienen un ingreso menor o igual a 97,78 𝑏𝑜𝑙𝑖𝑣𝑖𝑎𝑛𝑜𝑠
DECILES

Son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o


decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10%
de los resultados.

0% 10% 20% 30% 40% 50 % 60% 70% 80% 90% 100 %

D1 D2 D3 D4 D5 D6 D7 D8 D9

b) Datos tabulados Donde:


Li = Límite Inferior de la clase donde se encuentra el
Decil i
𝑖∗𝑛
− 𝑓𝑎𝑖−1 i = Indica el número del decil (1,2,3,4,5,6,7,8,9)
𝐷1 = 𝐿𝑖 + ( 10 ) ∗ 𝐴𝐶 n =La cantidad de valores u observaciones
𝑓𝑖 𝑓𝑎𝑖−1 = La frecuencia acumulada “menor que” de la
clase anterior a la del Decil i
𝑓𝑖 = Frecuencia absoluta de la clase donde se encuentra
el Decil i
AC =Ancho de clase

1 DE ABRIL DE 2024 19 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

EJEMPLO:
Utilicemos la distribución de los ingresos por familia semanal en bolivianos

Calcular los Deciles 2:

𝑖𝑛
Con la relación determinamos en la columna de fa (-) en que clase está contenido
10
el

Decil deseado, donde “i”, representa el decil.

𝑖𝑛 2∗50
10
= 10
= 10

Lo que nos indica el decil 2 se


encuentra en el segundo intervalo

2∗50
−4
Reemplazando la ecuación: 𝐷2 = 75 + ( 19
11
) ∗ 10 = 80.55 𝑏𝑜𝑙𝑖𝑣𝑖𝑎𝑛𝑜𝑠

Interpretación: significa que el 20% de todas las familias encuestadas tienen


un ingreso menor o igual a 80.55bolivianos

1 DE ABRIL DE 2024 20 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

PERCENTILES

Son 99 valores que distribuyen la serie de datos, ordenada de forma creciente


o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra
el 1% de los resultados.

Los Percentiles son 99 y dividen a la muestra en cien partes iguales. Los Percentiles
se pueden calcular del siguiente modo:
b) Datos tabulados
𝑖∗𝑛
− 𝑓𝑎𝑖−1
𝑝𝑖 = 𝐿𝑖 + ( 100 ) ∗ 𝐴𝐶
𝑓𝑖

𝐿𝑖 = límite inferior de la clase donde se encuentra el percentil i

i =indica el número del percentil

n = la cantidad de valores u observaciones

𝑓𝑎𝑖−1 = la frecuencia acumulada “menor que” de la clase anterior ala del percentil i

𝑓𝑖 =frecuencia absoluta de la clase donde se encuentra el percentil i

AC= ancho de clase

EJEMPLO: utilicemos la distribución de los ingresos por familia semanal en bolivianos

Calcular el percentil 43:

𝑖𝑛
Con la relación determinamos en la columna de
100
fa (-) en que clase está contenido

El percentil deseado, donde “i”, representa el percentil.

1 DE ABRIL DE 2024 21 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

Percentil 43.- (P43)

𝒊𝒏 𝟒𝟑∗𝟓𝟎
= = 𝟐𝟏. 𝟓 Lo que nos indica que el percentil 43 se encuentra en el tercer
𝟏𝟎𝟎 𝟏𝟎𝟎
intervalo

𝑃43

Reemplazamos en la ecuación:

43∗50
100
−15
𝑃43 = 85 + ( ) ∗ 10 = 88.25 𝑏𝑜𝑙𝑖𝑣𝑖𝑎𝑛𝑜𝑠
20

Interpretación. - Significa que el 43 % de todas las familias encuestadas


tienen un ingreso menor o igual a dólares.

1 DE ABRIL DE 2024 22 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

MEDIDAS DE DISPERSIÓN
Las medidas de dispersión son un conjunto de variables que se utilizan en la estadística para
calcular de qué manera se comporta la distribución de los datos en las fórmulas de análisis y
sus grados de variabilidad en función de un valor de referencia.

DEFINICIÓN Y ALCANCE DEL TÉRMINO

Las medidas de dispersión son valores que intervienen en la calibración de variables en


estudios estadísticos. Se trata de ciertos valores que representan relaciones entre variables,
datos y otras variables. Suponen una descripción matemática de un sistema de datos
indefinidos que se organizan en variables y que buscan descubrir patrones y esquemas.

A través de diferentes fórmulas y modelos, la estadística permite conocer los valores


numéricos que representan tendencias y fluctuaciones en todo tipo de sistemas de datos. Su
cálculo se utiliza en distintas disciplinas para conocer hasta qué punto son confiables los
datos recolectados una vez volcados sobre una variable que será, a su vez, utilizada en un
modelo.

Por lo tanto, las medidas de dispersión no sirven al propósito particular del análisis
estadístico, sino que sirven para producir ensayos y calibrar la implementación de un modelo
estadístico genérico para conocer hasta qué punto la relación entre los datos ingresados en él
pueden ser considerados confiables: la llamada dispersión estadística representa un grado de
distribución de datos que oscilan en referencia a un valor absoluto que se utiliza como la
media aritmética.

La variabilidad o dispersión de los datos se configura respecto a la distancia entre los valores
de una variable y la media establecida para dicha variable; si se reconoce una diferencia muy
alta entre la media y el valor medido, se puede decir que la variable dispone de un grado de
dispersión muy alto.

ANÁLISIS ESTADÍSTICO Y MEDIDAS DE DISPERSIÓN

La fiabilidad de este tipo de procedimientos es fundamental para muchas disciplinas, ya que


permite conocer ciertos conjuntos ordenados como son la oferta o la demanda, por nombrar
solo algunos, y conocer su comportamiento. En la administración de empresas y el
marketing, el estudio estadístico brinda la capacidad de elaborar estrategias comerciales y
asistir a la toma de decisiones.

Los valores de una variable oscilarán siempre en función de la media absoluta para dicha
variable, pero también habrá una variabilidad asociada al dato individual que comportan. Por

1 DE ABRIL DE 2024 23 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

lo tanto, las medidas de dispersión son fundamentales para describir el rendimiento real de
la variable dentro del análisis estadístico particular en que se aplica.

En otras palabras, el valor de la variable no es el único dato que esta comporta: se trata de la
relación directa de ese valor con la media, por un lado, y respecto al dato individual, por el
otro. De esta manera, tras conocer la dispersión real de los valores respecto a la media, el
resultado del procesamiento de los datos mejora significativamente en relación con la
posición individual de cada variable.

Las medidas de dispersión por lo general se clasifican en cuatro categorías, pero esto puede
variar según las necesidades particulares del investigador:

Rango de variación:
Se trata de un número que indica la distancia entre un valor máximo y uno mínimo. Dicho
valor se toma de una población estadística determinada y se calcula con base en diferentes
factores.

Se define el rango R de un conjunto de datos a la diferencia entre el valor máximo xmax y el


valor mínimo xmin del conjunto:

𝑅𝑎𝑛𝑔𝑜 = 𝑉𝑎𝑙𝑜𝑟 𝑀𝑎𝑥𝑖𝑚𝑜 − 𝑉𝑎𝑙𝑜𝑟 𝑚𝑖𝑛𝑖𝑚𝑜 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛

Ejemplo de rango 1

Esta es una lista del número de huracanes ocurridos en el Atlántico durante los últimos 14
años:

8; 9; 7; 8; 15; 9; 6; 5; 8; 4; 12; 7; 8; 2

El dato de valor máximo es 15, y el valor mínimo es 2, por lo tanto:

R = Valor máximo – valor mínimo = xmax − xmin =15 – 2 = 13 huracanes

1 DE ABRIL DE 2024 24 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

Resistencia del concreto: Imagina que estás probando la resistencia a la compresión del
concreto en diferentes muestras extraídas de una construcción. El rango te indicaría cuánto
varía la resistencia entre las muestras. Si el rango es pequeño, significa que la resistencia es
uniforme; si es grande, podría haber inconsistencias en la calidad del concreto.

R = Valor máximo – valor mínimo = xmax − xmin = 336,69 - 319,56= 17,13 kg/cm2

En este caso, el rango nos dice que las compresiones variaron en 17,13 kg/cm2 durante ese
dia. Es una medida simple pero útil para comprender la dispersión de los datos. Si el rango
es pequeño, significa que los datos están más concentrados alrededor de un valor central; si
es grande, hay más variabilidad en los datos.

Altura de edificios: Si estás midiendo la altura de varios edificios en un proyecto de


construcción, el rango te mostraría cuánto varía la altura entre los diferentes edificios.

1 DE ABRIL DE 2024 25 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

VARIANZA
Esta medida representa la variación que puede sufrir un conjunto de datos respecto a la media.

Esta medida se utiliza para comparar a cada uno de los datos con la media del conjunto, y se
calcula sumando las diferencias, elevadas al cuadrado, entre cada valor con la media y
dividiendo entre el número total de valores. La fórmula para calcularla es:

• Para una población:

• Para una muestra

Sea:

• σ2 es la varianza de una población.


• s2 es la varianza de una muestra.
• N es el número total de observaciones en la población.
• n es el número total de observaciones en la muestra.
• xi es un valor cualquiera, perteneciente al conjunto de datos.
• μ es la media de la población.
• xˉ es la media de la muestra.
Ejemplo de varianza

El cálculo de la varianza requiere hallar la media. Tomando los datos del número de
huracanes, la media se calcula mediante:

(8 + 9 + 7+ 8 + 15 + 9 + 6 + 5+ 8 + 4 + 12 + 7 + 8+ 2) /14 = 7.7 huracanes. Por lo tanto,

1 DE ABRIL DE 2024 26 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

Variabilidad en la carga de puentes: Si estás diseñando un puente, la varianza en las cargas


que el puente debe soportar es crucial. Una baja varianza indica que las cargas son
predecibles y consistentes, mientras que una alta varianza podría requerir un diseño más
robusto para acomodar situaciones extremas.

Variabilidad en la resistencia del suelo: Al analizar la resistencia del suelo para


cimentaciones, la varianza en los valores de resistencia proporciona información sobre la
homogeneidad del suelo. Una alta varianza podría indicar áreas con suelos más débiles o
heterogéneos.

1 DE ABRIL DE 2024 27 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

La media seria =

(0,50+0,80+0,81+0,38+0,81)/5 =0,66

(0,50- 0,66)² +(0,80 0,66 )² +(0,81 0,66 )² +(0,38 0,66 )² +(0,81 0,66 )²
5-1

=0,04215

Interpretación: Una varianza grande significa que los datos están más dispersos alrededor
de la media, mientras que una varianza pequeña indica que los datos están más agrupados
cerca de la media.

DESVIACIÓN MEDIA. Es la media aritmética de los valores absolutos de las desviaciones, por lo
que se calcula tomando como positivas todas las desviaciones, sumándolas y dividiendo entre n.

Desviación estándar
La desviación o variación en estadísticas se refiere a la medida de la dispersión o diferencia entre los
valores individuales en un conjunto de datos, también la conocemos como desviación típica o
estándar.

Corresponde a una desviación que es “habitual” entre el valor y la media. Se trata de un evento más
probable y por lo tanto se emplea como tal en el cálculo de dispersión.

1 DE ABRIL DE 2024 28 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

Coeficiente de variación
El coeficiente de variación o coeficiente de variación de Pearson es una medida estadística que
proporciona información sobre la dispersión relativa (libre de unidades de medida) de un conjunto de
datos, que se define como el cociente de la desviación estándar entre la media aritmética o en otras
palabras es la desviación estándar como porcentaje de la media aritmética

Esta medida de dispersión se expresa como un porcentaje que es el resultado de dividir la desviación
típica sobre la media del conjunto.

𝑐𝑣 ≤ 30% , los datos de la muestra son relativamente homogéneos. Por lo tanto, la media es
representativa

𝑐𝑣 ≤ 30% ≤ 70% , los datos de la muestra son heterogéneos. por lo tanto, la media no es representativa

𝑐𝑣 ≥ 70%, los datos de la muestra son muy variables o heterogéneos. Por lo tanto. La media no es
representativa

EJEMPLO:
Supongamos que un ingeniero civil está supervisando un proyecto de construcción de un puente. Uno
de los aspectos críticos del diseño del puente es la resistencia del material utilizado en la construcción,
como el concreto.

1 DE ABRIL DE 2024 29 DOC: ING. FLAVIO CARREO HEVIAVANCA


GRUPO ISOTOPO MAT370-A

HISTOGRAMA
280 270.9465323 269.0042244 269.8358528
269.1704209
266.1596448
263.7687705
270 261.5324488 261.6015623
260 250.5368358 248.6816174
246.3792751
250
240
230
1 2 3 4 5 6 7 8 9 10 11

RESULTADO. -

El ingeniero puede utilizar esta información para evaluar la variabilidad en la resistencia del concreto
y tomar decisiones informadas sobre el diseño y la construcción del puente para garantizar su
seguridad y durabilidad.

1 DE ABRIL DE 2024 30 DOC: ING. FLAVIO CARREO HEVIAVANCA

También podría gustarte