Está en la página 1de 11

21/04/2021

PROBABILIDAD Y ESTADISTICA Introducción


(Medidas de Dispersión)
¿Por qué estudiar la dispersión?

Las medidas de tendencia central, como la media o la


mediana, buscan resumir con un solo número, un conjunto de
valores. Desde este punto de vista resultan valiosas, pero no
dicen nada sobre la dispersión de los datos, es decir, no
describen en qué medida difieren entre sí los valores.

Las medidas de dispersión son necesarias para hacer una


Veamos este ejemplo: Se analizan las calificaciones de los
mejor descripción de un grupo de datos, ya que las medidas
estudiantes de tres grupos en un examen de Probabilidad:
de tendencia central resumen todo a un valor. Asimismo,
indican que tan lejos o dispersos se encuentran los datos con
respecto a una medida de tendencia central que
generalmente es la media aritmética. De hecho la dispersión
permite conocer el grado de representatividad de la medida
de tendencia central, esto es, a mayor dispersión, menor
representatividad.
En otras palabras, las medidas de
dispersión son números que indican si
una variable se mueve mucho, poco,
más o menos que otra.

1
21/04/2021

Rango Ejemplo:

El rango es ya conocido; se utiliza como auxiliar en la


conformación de distribuciones de frecuencia. Como medida
de dispersión, el rango da un intervalo en el que se ubica el
100% de los datos. Si el valor es grande, la dispersión de los
datos es mayor, es una medida de dispersión muy simple. Para
datos no agrupados, matemáticamente se determina

𝑅 = 𝑥𝑛 − 𝑥1 Los datos mayor y menor son 41 min. Y 23 min. El


Donde: rango es: R = 41 – 23 =18 min.
𝑅 = Rango
Con esta información, el odontólogo puede organizar
𝑥𝑛 = 𝐷𝑎𝑡𝑜 𝑑𝑒 𝑚𝑎𝑦𝑜𝑟 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑜𝑠 𝑛 𝑑𝑎𝑡𝑜𝑠
mejor su agenda de citas para que las personas
𝑥1 = 𝐷𝑎𝑡𝑜 𝑑𝑒 𝑚𝑒𝑛𝑜𝑟 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑜𝑠 𝑛 𝑑𝑎𝑡𝑜𝑠
esperen el mínimo de tiempo en la antesala del
consultorio.

Rango para datos agrupados. Ejemplo:

En este caso es importante observar que el rango no se puede


determinar de manera exacta debido a que en ocasiones los
datos no se conocen y en algunas distribuciones de
frecuencias el limite inferior de la primer clase y el limite
superior de la ultima clase no coinciden con los datos de la
muestra, en este caso, el rango se determina multiplicando la
amplitud de clase (A) por el numero de clases (K).
𝑅 =𝐾∙A
Donde: Hay 6 clases con una amplitud de 5, ósea K = 6 y A = 5 por lo
𝑅 = Rango tanto:
K = 𝑁𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠
𝐴 = 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
𝑅 = 𝐾 ∙ A = 6 5 = $ 30

2
21/04/2021

Desviación Media
Desviación Media
Esta medida de dispersión representa la media aritmética del
El rango considera los valores extremos, pero sin tener en cuenta
toda la información disponible. En efecto, al considerar el valor valor absoluto de todas las deviaciones y para datos no
mayor y el valor menor, se tiene una idea de la extensión de los agrupados se determina de la siguiente manera:
datos, pero los datos intermedios no intervienen en el calculo.
La desviación media se ocupa de la totalidad de los datos para
proporcionar una mayor idea de la dispersión de estos, aunque la 𝑥1 − 𝑥ҧ + 𝑥2 − 𝑥ҧ + ⋯ + 𝑥𝑛 − 𝑥ҧ σ𝑛𝑖=1 𝑥𝑖 − 𝑥ҧ
𝐷𝑀 = =
cantidad de cálculos que se tienen que efectuar es 𝑛 𝑛
considerablemente mayor.
Donde:
Desviación: Es la diferencia de un dato con respecto a una medida 𝐷𝑀 = 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑀𝑒𝑑𝑖𝑎
de tendencia central que normalmente es la media aritmética. 𝑥ҧ = Media Aritmética
𝑛 = Numero total de datos
𝑥1 , 𝑥2 , … , 𝑥𝑛 = Son cada uno de los n valores.

Ejemplo Para el segundo grupo:


15 + 17 + 17 + 16 + 16 + 15 + 17 + 15
𝑥ҧ = = 16 𝑎ñ𝑜𝑠
8

𝑥1 − 𝑥ҧ + 𝑥2 − 𝑥ҧ + ⋯ + 𝑥𝑛 − 𝑥ҧ σ𝑛𝑖=1 𝑥𝑖 − 𝑥ҧ
𝐷𝑀 = =
𝑛 𝑛

15 − 16 + 17 − 16 + 17 − 16 + ⋯ + 15 − 16
Para el primer grupo: 𝐷𝑀 =
8
6 + 4 + 4 + 5 + 5 + 4 + 5 + 6 + 5 + 4 + 32 + 34 + 55 + 56
𝑥ҧ = = 16.0714 𝑎ñ𝑜𝑠 𝐷𝑀 = 0.75 𝑎ñ𝑜𝑠 ≈ 1 𝑎ñ𝑜
14
𝑛
σ𝑖=1 Al comparar ambas desviaciones se puede concluir que en el primer
𝑥1 − 𝑥ҧ + 𝑥2 − 𝑥ҧ + ⋯ + 𝑥𝑛 − 𝑥ҧ 𝑥𝑖 − 𝑥ҧ
𝐷𝑀 = = conjunto de datos la dispersión de los datos es muy alta en
𝑛 𝑛
promedio 16 años de separación respecto a la media geométrica,
6 − 16.0714 + 4 − 16.0714 + ⋯ + 56 − 16.0714 225.4284 caso contrario con el segundo grupo de datos cuya desviación
𝐷𝑀 = =
14 14 media es en promedio 1 año ya redondeado.
𝐷𝑀 = 16.102 𝑎ñ𝑜𝑠

3
21/04/2021

Desviación Media para datos agrupados. Ejemplo:

Para el caso de que los datos se encuentre agrupados la


formula para el calculo de la desviación media es la siguiente:

σ𝑘𝑖=1 𝑓𝑖 𝑀𝑖 − 𝑥ҧ
𝐷𝑀 =
𝑛

Donde:
𝐷𝑀 = 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑀𝑒𝑑𝑖𝑎
𝑥ҧ = Media Aritmética.
𝑛 = Numero total de datos
𝑓𝑖 = son las frecuencias de cada clase 1, 2, 3, …, k.
𝑀𝑖 = son las Marcas de clase de cada clase 1, 2, 3, …, k.

Siendo k el numero de clases.

Clases (Datos en ml) Frecuencia de clase Marca de clase M


(Asistentes)
σ𝑘𝑖=1 𝑓𝑖 𝑀𝑖 − 𝑥ҧ
𝐷𝑀 =
𝑛
586 - 590 5 588
591 – 595 15 593
(5) 588 − 599.125 + (15) 593 − 599.125 + (27) 598 − 599.125
596 - 600 27 598
+(23) 603 − 599.125 + (10) 608 − 599.125
601 - 605 23 603 𝐷𝑀 = =
80
606 - 610 10 608

𝐷𝑀 = 4.446875 𝑚𝑙 ≈ 4 𝑚𝑙
588 5 + 593 15 + 598 27 + 603 23 + 608 10
𝑥ҧ =
80
El valor de la desviación media significa que los datos se desvían un
promedio de 4.446875 ml de la media aritmética.
47930
𝑥ҧ = = 599.125 𝑚𝑙
80

4
21/04/2021

Ejemplos adicionales:

𝑥ҧ = 28.633 𝑚𝑖𝑛 𝑥ҧ = 29.943 𝑎ñ𝑜𝑠


𝐷𝑀 = 4.5067 𝑚𝑖𝑛 𝐷𝑀 = 9.249 𝑎ñ𝑜𝑠

Para eliminar los signos negativos de las desviaciones se utiliza un


procedimiento matemático simple, por lo que, se elevan al
Varianza y desviación típica o estándar cuadrado todas las desviaciones ya que toda cantidad real positiva o
negativa elevada al cuadrado es positiva. Esto da origen al concepto
El uso de desviaciones para medir el grado de dispersión de los de varianza.
datos con respecto a la media aritmética tiene la ventaja de tener
en cuenta a todos los datos. Sin embargo, en el caso de la Varianza (variancia): Es la media aritmética de la suma de todas las
desviación media se utiliza el valor absoluto para eliminar las desviaciones elevadas al cuadrado.
desviaciones negativas. No obstante, la desviación media, a pesar
de utilizar toda la información, es poco usada. Aunque la varianza es muy importante en estadística inferencial, las
unidades no resultan apropiadas como medida de dispersión, ya
La dificultad con el valor absoluto estriba en que no es fácil darle que quedan elevadas al cuadrado; es decir que, si se obtiene la
tratamiento matemático tanto en algebra como en calculo varianza de una muestra de mediciones en cm, el resultado estará
diferencial. en cm2, lo que no es conveniente. Para solventar lo anterior, se
extrae la raíz cuadrada positiva a la varianza, lo que resulta en la
desviación típica también llamada desviación estándar.

5
21/04/2021

Varianza

La varianza para datos no agrupados se determina de la En este punto es importante aclarar que en estadística
siguiente manera: inferencial el denominador de la formula para la varianza es n-1
para una muestra mientras n para la población, esto tiene que
ver con la estimación de parámetros por medio de estadísticos.
𝑥1 − 𝑥ҧ 2 + 𝑥2 − 𝑥ҧ 2 + ⋯ + 𝑥𝑛 − 𝑥ҧ 2 σ𝑛𝑖=1 𝑥𝑖 − 𝑥ҧ 2
𝑠2 = = En estadística descriptiva siempre se utiliza n en el
𝑛 𝑛
denominador para el caso del calculo de la varianza de una
Donde: muestra o de una población.
𝑠 2 = 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒 𝑢𝑛𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
𝑥ҧ = Media Aritmética
𝑛 = Numero total de datos de la muestra
𝑥1 , 𝑥2 , … , 𝑥𝑛 = Son cada uno de los n valores.

Ejemplo:

𝑥1 − 𝑥ҧ 2
+ 𝑥2 − 𝑥ҧ 2 + ⋯ + 𝑥𝑛 − 𝑥ҧ 2 σ𝑛𝑖=1 𝑥𝑖 − 𝑥ҧ 2
𝑠2 = =
𝑛 𝑛

14.2 − 13.84 2 + 14.4 − 13.84 2 + 13.4 − 13.84 2 + ⋯ + 13.6 − 13.84 2


𝑠2 =
30

3.232
𝑠2 = = 0.1077 𝑐𝑆𝑡 2
30
14.2 + 14.4 + 13.4 + 14.3 + ⋯ + 14.3 + 13.6
𝑥ҧ = = 13.84 cSt
30

6
21/04/2021

Varianza
σ𝑛𝑖=1 𝑥𝑖 2
La varianza para datos no agrupados se puede determinar de 𝑠2 = − 𝑥ҧ 2
𝑛
una forma alterna de acuerdo a la siguiente expresión:

σ𝑛𝑖=1 𝑥𝑖 2 2 2 2 2
𝑠2 = − 𝑥ҧ 2 14.2 + 14.4 + 13.4 + ⋯ + 13.6
𝑛 𝑠2 = − (13.84)2
30

Donde:
𝑠 2 = 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒 𝑢𝑛𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 5749.6
𝑥ҧ = Media Aritmética 𝑠2 = − 191.5456 = 191.6533 − 191.5456 = 0.1077 𝑐𝑆𝑡 2
30
𝑛 = Numero total de datos de la muestra
𝑥1 , 𝑥2 , … , 𝑥𝑛 = Son cada uno de los n valores.

Desviación Típica o Estándar.

Para el caso el calculo de la desviación típica o estándar se La desviación Típica o estándar es:
extrae raíz cuadrada positiva a la varianza por lo tanto:

𝑠= 𝑠 2 = 0.1077 = 0.3281 𝑐𝑆𝑡


𝑠= 𝑠2
Donde:
𝑠 = 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑇𝑖𝑝𝑖𝑐𝑎 𝑜 𝐸𝑠𝑡𝑎𝑛𝑑𝑎𝑟

7
21/04/2021

Varianza (Datos Agrupados) Varianza (Datos Agrupados)

La varianza para datos agrupados se determina de la siguiente La varianza para datos agrupados se puede determinar de una
manera: forma alterna de acuerdo a la siguiente expresión:

σ𝑘𝑖=1 𝑓𝑖 𝑀𝑖 − 𝑥ҧ 2 σ𝑘𝑖=1 𝑓𝑖 𝑀𝑖2


𝑠2 = 𝑠2 = − 𝑥ҧ 2
𝑛 𝑛

Donde: Donde:
𝑠 2 = 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑠 2 = 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎
𝑥ҧ = Media Aritmética. 𝑥ҧ = Media Aritmética.
𝑛 = Numero total de datos 𝑛 = Numero total de datos
𝑓𝑖 = son las frecuencias de cada clase 1, 2, 3, …, k. 𝑓𝑖 = son las frecuencias de cada clase 1, 2, 3, …, k.
𝑀𝑖 = son las Marcas de clase de cada clase 1, 2, 3, …, k. 𝑀𝑖 = son las Marcas de clase de cada clase 1, 2, 3, …, k.

Siendo k el numero de clases. Siendo k el numero de clases.

Ejemplo: Clases (Cantidad de Frecuencia de clase Marca de clase M


horas) (Numero de estudiantes)
A los integrantes de una muestra de 25 estudiantes de violín
18 - 19 4 18.5
en un conservatorio se les encuesto sobre el numero de horas
20 – 21 8 20.5
a la semana que practican. A continuación se muestra una
22 - 23 7 22.5
distribución: calcula la desviación estándar.
24 - 25 4 24.5
26 - 27 2 26.5

18.5 4 + 20.5 8 + 22.5 7 + 24.5 4 + 26.5 2


𝑥ҧ =
25

546.50
𝑥ҧ = = 21.86 ℎ𝑟𝑠
25

8
21/04/2021

σ𝑘𝑖=1 𝑓𝑖 𝑀𝑖 − 𝑥ҧ 2 σ𝑘𝑖=1 𝑓𝑖 𝑀𝑖2


𝑠2 = 𝑠2 = − 𝑥ҧ 2
𝑛 𝑛

(4) 18.5 − 21.86 2 +(8) 20.5 − 21.86 2 +(7) 22.5 − 21.86 2


(4) 18.5 2 +(8) 20.5 2 +(7) 22.5 2

2 +(4) 24.5 − 21.86 2 +(2) 26.5 − 21.86 2 2 +(4) 24.5 2 +(2) 26.5 2 2
𝑠 = 𝑠 = − 21.86
25 25

133.76 12080.25
𝑠2 = = 5.3504 ℎ𝑟𝑠 2 𝑠2 = − 477.8596 = 5.3504 ℎ𝑟𝑠 2
25 25

Desviación Típica o Estándar.

Para el caso el calculo de la desviación típica o estándar se La desviación Típica o estándar es:
extrae raíz cuadrada positiva a la varianza por lo tanto:

𝑠= 𝑠 2 = 5.3504 = 2.3131 ℎ𝑟𝑠


𝑠= 𝑠2
Donde:
𝑠 = 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑇𝑖𝑝𝑖𝑐𝑎 𝑜 𝐸𝑠𝑡𝑎𝑛𝑑𝑎𝑟

9
21/04/2021

Coeficiente de Variación
Coeficiente de Variación
El coeficiente de Variación se puede calcular de acuerdo a la
El coeficiente de variación es la relación entre la desviación típica de
siguiente expresión:
una muestra y su media aritmética.
𝑠
El coeficiente de variación es una medida estadística que nos 𝐶. 𝑉. =
𝑥ҧ
informa acerca de la dispersión relativa de un conjunto de datos,
además que permite comparar las dispersiones de dos Donde:
distribuciones distintas considerando que a mayor coeficiente de
𝐶. 𝑉. = Coeficiente de Variación
variación mayor es la dispersión. 𝑠 = Desviación Típica o estándar
𝑥ҧ = Media Aritmética.

Ejemplo: Ejemplo:
A los integrantes de una muestra de 25 estudiantes de violín en un
conservatorio se les encuesto sobre el numero de horas a la semana
que practican. A continuación se muestra una distribución: calcula la
desviación estándar.

𝑥ҧ = 21.86 hrs
𝑠 = 2.3131 ℎ𝑟𝑠

𝑠 2.3131
𝐶. 𝑉. = =
𝑥ҧ 21.86
𝑥ҧ = 13.84 cSt
𝑠 = 0.3281 𝑐𝑆𝑡
𝑠 0.3281
𝐶. 𝑉. = = = 0.0237 = 2.37 % 𝐶. 𝑉. = 0.1058= 10.58 %
𝑥ҧ 13.84

10
21/04/2021

Ejemplos Adicionales: 2.-

1.-

11

También podría gustarte