0% encontró este documento útil (0 votos)
100 vistas7 páginas

Medidas de Dispersión en Estadística

El documento presenta información sobre diagramas de caja y bigotes y medidas de dispersión. Explica cómo construir un diagrama de caja y bigotes a partir de un conjunto de datos sobre edades y cómo este diagrama proporciona información sobre la dispersión y simetría de los datos. También define y explica el cálculo del rango y la desviación media como medidas de dispersión. Finalmente, presenta un ejemplo del cálculo de la desviación media.

Cargado por

Sofía
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
100 vistas7 páginas

Medidas de Dispersión en Estadística

El documento presenta información sobre diagramas de caja y bigotes y medidas de dispersión. Explica cómo construir un diagrama de caja y bigotes a partir de un conjunto de datos sobre edades y cómo este diagrama proporciona información sobre la dispersión y simetría de los datos. También define y explica el cálculo del rango y la desviación media como medidas de dispersión. Finalmente, presenta un ejemplo del cálculo de la desviación media.

Cargado por

Sofía
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Institución Educativa Francisco Antonio de Ulloa

Código DANE 119001000061-01 NIT: 891.500.481-8 Secretaría de Educación - Municipio de Popayán

Grado: 10 Área: Matemáticas Asignatura: ESTADISTICA Docente:Guillermo Alberto Campo


Tema: Medidas De Dispersión.
Indicador de Realiza, identifica y analiza diferentes representaciones de un
Desempeño: conjunto de datos
Calcula las medidas de dispersión en un conjunto de datos
Fecha de entrega:

Para recordar:
Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una presentación visual que
describe varias características importantes, al mismo tiempo, tales como la dispersión y simetría.
Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los datos,
sobre un rectángulo, alineado horizontal o verticalmente.
Una gráfica de este tipo consiste en una caja rectangular, donde los lados más largos muestran el
recorrido intercuartílico. Este rectángulo está dividido por un segmento vertical que indica donde
se posiciona la mediana y por lo tanto su relación con los cuartiles primero y tercero(recordemos
que el segundo cuartil coincide con la mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y
máximo de la variable. Las líneas que sobresalen de la caja se llaman bigotes. Estos bigotes
tienen un límite de prolongación, de modo que cualquier dato o caso que no se encuentre dentro
de este rango es marcado e identificado individualmente

EJEMPLO “distribución de edades”


Utilizamos un conjunto de datos que representan la edad de un colectivo de 20 personas.
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
Para ello hay que ordenar los datos
Para calcular los parámetros estadísticos, lo primero es ordenar la distribución de menor a mayor
y marcar la posición que nos interesa así:
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45
P1 P5 P6 P10 P1 P15 P16 P20
La letra P acompañada de un número, denota la posición que ocupa el numero en el primer
renglón.
CALCULO DE CUARTILES
Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución. Como N =
20 resulta que N/4 = 5; el primer cuartil es el promedio del valor que esta e n la posición 5 y el
que está en la posición 6:
Q1= (24 + 25) / 2 = 24,5
Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el valor de la variable
que ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10 ; la mediana es la
media aritmética del valor que esta e n la posición 10 y el que está en la posición 11:
Me= Q2 = (33 + 34)/ 2 =33,5
Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribución. En
nuestro caso, como 3N / 4 = 15, dicho valor es la media aritmética del valor que esta e n la
posición 15 y el que está en la posición 16, luego resulta:
Q2=(39 + 39) / 2 = 39
DIBUJAR LA CAJA Y LOS BIGOTES
Institución Educativa Francisco Antonio de Ulloa
Código DANE 119001000061-01 NIT: 891.500.481-8 Secretaría de Educación - Municipio de Popayán

El bigote de la izquierda representa al colectivo de edades ( Xmín, Q1)


La primera parte de la caja a (Q1, Q2),
La segunda parte de la caja a (Q2, Q3)
El bigote de la derecha viene dado por (Q3, Xmáx).

INFORMACIÓN QUE NOS BRINDA EL DIAGRAMA


Podemos obtener abundante información de una distribución a partir de estas representaciones.
Veamos algunas:
La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las edades
comprendidas entre el 25% y el 50% de la población está más dispersa que entre el 50% y el
75%.
El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por ello el 25% de los
más jóvenes están más concentrados que el 25% de los mayores.
El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población está comprendido en
un recorrido de 14,5 años.

TALLER 1

Con la información de los siguientes conjuntos de edades, elabora para cada uno el respectivo
diagrama de caja y bigotes, en seguida redacta la información que arroja cada diagrama y por
último intenta comparar estos dos diagramas, ¿Qué información puedes obtener?

1. 35 38 32 28 30 29 27 19 48 40 31 39 29 35 41 48 46 45 49 52
2. 39 24 24 34 26 41 29 48 28 22 20 21 25 29 36 38 37 31 30 22

Medidas de Dispersión:
Las medidas descriptivas que indican si los datos dentro de un conjunto se encuentran
relativamente cerca o relativamente lejos entre si reciben el nombre de medidas de dispersión.
Estas medidas permiten conocer el grado de variabilidad de los datos con respecto a algún valor
central o medida de tendencia central.
El Rango, la desviación Media, la Varianza, y la Desviación estándar son medidas de
dispersión.

Rango ( R )
En un conjunto de datos, el rango o recorrido es la diferencia entre los valores extremos de dicho
conjunto. El rango indica cuántos valores recorre la variable.

El Rango es la diferencia entre el dato mayor y el dato menor.


𝑅 = 𝑑𝑎𝑡𝑜 𝑀𝑎𝑦𝑜𝑟 − 𝑑𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟
Institución Educativa Francisco Antonio de Ulloa
Código DANE 119001000061-01 NIT: 891.500.481-8 Secretaría de Educación - Municipio de Popayán

Nota:
Si el rango de un conjunto de datos es muy pequeño, entonces se dice que la concentración de los
datos es mayor.

Desviación Media (DM)


La desviación media de un conjunto permite evidenciar que tan alejados de la media se
encuentran los datos
La desviación media es el promedio de las distancias que hay entre cada dato 𝑥𝑖 y la media 𝑥̅ .
Simbólicamente:
∑𝑛𝑖=1|𝑥𝑖 − 𝑥̅ |
𝐷𝑀 =
𝑛
Donde n es el total de datos
|𝑥𝑖 − 𝑥̅ | es el valor absoluto de la diferencia entre 𝑥𝑖 𝑦 𝑥̅
𝑥𝑖 representa cada dato del conjunto
𝑥̅ representa la media aritmética del conjunto de datos.
Nota:
Cuanto mayor sea la desviación media, más dispersos serán los datos. Por lo tanto, la media
aritmética 𝑥̅ será menos representativa.

Ejemplo:
Hallar la desviación media y el rango de las series de números siguientes:

1.

2.

Solución:
2+3+6+8+11
1. Primero se debe hallar la media aritmética del conjunto de datos así: 𝑥̅ = =6
5
Luego aplicamos la formula así:
∑5𝑖=1|𝑥𝑖 − 𝑥̅ | |2 − 6| + |3 − 6| + |6 − 6| + |8 − 6| + |11 − 6|
𝐷𝑀 = =
𝑛 5
|−4| + |−3| + |0| + |2| + |5| 4 + 3 + 0 + 2 + 5 14
= = = = 2.8
5 5 5
Rango: 𝑅 = 𝐷𝑎𝑡𝑜 𝑀𝑎𝑦𝑜𝑟 − 𝐷𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟 𝑅 = 11 − 2 = 9

2. Primero se debe hallar la media aritmética del conjunto de datos así: 𝑥̅ =


12+6+7+3+15+10+18+5
= 9.5
8
Luego aplicamos la formula así:
∑8𝑖=1|𝑥𝑖 − 𝑥̅ |
𝐷𝑀 =
𝑛
Institución Educativa Francisco Antonio de Ulloa
Código DANE 119001000061-01 NIT: 891.500.481-8 Secretaría de Educación - Municipio de Popayán

|12 − 9.5| + |6 − 9.5| + |7 − 9.5| + |3 − 9.5| + |15 − 9.5| + |10 − 9.5| + |18 − 9.5| + |5 − 9.5|
=
8
|2.5| + |−3.5| + |−2.5| + |−6.5| + |5.5| + |0.5| + |8.5| + |−4.5|
=
8
2.5 + 3.5 + 2.5 + 6.5 + 5.5 + 0.5 + 8.5 + 4.5 34
= = = 4.25
8 8
Rango: 𝑅 = 𝐷𝑎𝑡𝑜 𝑀𝑎𝑦𝑜𝑟 − 𝐷𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟 𝑅 = 18 − 3 = 15

Ejemplo 2

Calcular la desviación media de una distribución estadística que viene dada por la
siguiente tabla:

fi *Mc
3 3*12.5 457.5
5 5*17.5 𝑥̅ = ≈ 21.786
21
7 7*22.5
4 4*27.5
2 2*32.5
Total 21 457.5

Incorporamos otra columna con los productos de las marcas de clase por sus frecuencias
absolutas correspondientes y hacemos la sumatoria, para luego hallar la media aritmética.

Agregamos otra columna con los productos de desviaciones respecto a la media por sus
frecuencias absolutas correspondientes |𝑥𝑖 − 𝑥̅ | ∗ 𝑓𝑖 y calculamos su sumatoria.

fi *Mc |𝑀𝑐 − 𝑥̅ | ∗ 𝑓𝑖 totales


3 3*12.5 |12.5 − 21.786| ∗ 3 27.858
5 5*17.5 |17.5 − 21.786| ∗ 5 21.43
7 7*22.5 |22.5 − 21.786| ∗ 7 4.998
4 4*27.5 |27.5 − 21.786| ∗ 4 22.856
2 2*32.5 |32.5 − 21.786| ∗ 2 21.428
Total 21 457.5 98.57

Luego aplicamos la fórmula para hallar la desviación media así:

∑21
𝑖=1|𝑀𝑐 − 𝑥̅ | ∗ 𝑓𝑖 98.57
𝐷𝑀 = = ≈ 4.694
𝑛 21
Institución Educativa Francisco Antonio de Ulloa
Código DANE 119001000061-01 NIT: 891.500.481-8 Secretaría de Educación - Municipio de Popayán

Rango: 𝑅 = 𝐷𝑎𝑡𝑜 𝑀𝑎𝑦𝑜𝑟 − 𝐷𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟 𝑅 = 35 − 10 = 25

TALLER 2

1. Calcula el rango y la desviación media de cada conjunto de datos:


a. 3, 5, 6, 4, 3, 4, 7, 10, 15
b. 4, 1, 3, 5, 12, 10, 16, 8, 3
c. 28, 56, 10, 12, 75, 9, 98, 25, 84, 40
2. Calcular la desviación media de las edades de las personas indicadas en la tabla:

Edad (años) Frecuencia fi

[0 – 10 ) 15

[10 – 20 ) 10

[20 – 30 ) 12

[30 – 40 ) 35

3. Si al preguntar por la nota que obtuvieron cinco estudiantes en un examen, todos obtuvieron la
misma, ¿es válido afirmar que la desviación media es cero? Justifica.

Varianza ( S2) y desviación estándar ( S )

La varianza y la desviación estándar al igual que la desviación media, permiten determinar que
tan lejos o que tan cerca están los datos con respecto a la media del conjunto, pero aplicando
técnicas diferentes del valor absoluto. Estas medidas son útiles para comparar dos o más
conjuntos de datos.

La varianza es el promedio de los cuadrados de las desviaciones desde cada dato 𝑥𝑖 a la media 𝑥̅
y esta dada por la siguiente expresión:
∑𝑛
𝑖=1(𝑥𝑖 −𝑥̅ )
2
Para datos no agrupados es 𝑆 2 = donde n es el total de datos.
𝑛−1

∑𝑛
𝑖=1 𝑓𝑖 ∗(𝑀𝑐 −𝑥̅ )
2
Para datos agrupados es 𝑆 2 = 𝑛−1

La desviación estándar o desviación típica es la raíz cuadrada positiva de la varianza.


Simbólicamente:

𝑆 = √𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎

Ejemplo
Institución Educativa Francisco Antonio de Ulloa
Código DANE 119001000061-01 NIT: 891.500.481-8 Secretaría de Educación - Municipio de Popayán

Los siguientes datos corresponden a las estaturas en centímetros de algunos estudiantes de dos
cursos de grado noveno en un colegio.

Noveno A 152 159 154 156 157 154 156 157

Noveno B 151 165 170 158 172 161 164 154

Calcula la varianza y la desviación estándar de cada curso y determina en cual de ellos hay una
distribución más homogénea.

Solución:

En primer lugar, se calcula la media aritmética de los datos de cada curso:


152+159+154+156+157+154+156+157
Noveno A: 𝑥̅ = = 155.625
8

151+165+170+158+172+161+164+154
Noveno B: 𝑥̅ = = 161.875
8

Luego se calculan las desviaciones a la media y los cuadrados de las desviaciones.

Noveno A Noveno B
Desviaciones Cuadrados de Desviaciones Cuadrados de
A la media Las desviaciones A la media Las desviaciones
(𝑥𝑖 − 𝑥̅ ) (𝑥𝑖 − 𝑥̅ )2 (𝑥𝑖 − 𝑥̅ ) (𝑥𝑖 − 𝑥̅ )2
(152 - 155.625)= -3.625 13.1406 (151 – 161.875)= -10.875 118.2656
(159 - 155.625)= 3.375 11.3906 (165 – 161.875)= 3.125 9.7656
(154 - 155.625)= -1.625 2.6406 (170 – 161.875)= 8.125 66.0156
(156 - 155.625)= 0.375 0.1406 (158 – 161.875)= -3.875 15.0156
(157 - 155.625)= 1.375 1.8906 (172 – 161.875)= 10.125 102.5156
(154 - 155.625)= -1.625 2.6406 (161 – 161.875)= -0.875 0.7656
(156 - 155.625)= 0.375 0.1406 (164 – 161.875)= 2.125 4.5156
(157 - 155.625)= 1.375 1.8906 (154 – 161.875)= -7.875 62.016
sumatoria 33.8748 sumatoria 378.8752

Finalmente, al aplicar la fórmula para cada conjunto de datos, se obtiene:


∑8𝑖=1(𝑥𝑖 −𝑥̅ )2 33.8748 ∑8𝑖=1(𝑥𝑖 −𝑥̅ )2 378.8752
Noveno A: 𝑆 2 = = ≈ 4.84 Noveno B: 𝑆 2 = = ≈ 54.13
𝑛−1 8−1 𝑛−1 8−1

Para calcular la desviación estándar, basta encontrar la raíz cuadrada de las varianzas:

Noveno A: 𝑆 = √𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 = √4.84 = 2.2 Noveno B: 𝑆 = √𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 = √54.13 = 7.36


Institución Educativa Francisco Antonio de Ulloa
Código DANE 119001000061-01 NIT: 891.500.481-8 Secretaría de Educación - Municipio de Popayán

Con estos resultados, se concluye que los estudiantes de noveno A, en promedio, son 2.2 cm mas
altos ó 2.2 cm más bajos que su estatura media (155.62 cm), y los estudiantes de noveno B, en
promedio, son 7.36 cm más altos ó 7.36 cm más bajos que su estatura media (161.875 cm).

En consecuencia, los estudiantes de noveno A tienen estaturas más homogéneas que los
estudiantes de noveno B.

Nota: esto se da por la diferencia que hay entre las desviaciones estándar tomando como base la
menor de ellas.

TALLER 3

1. Los siguientes datos corresponden a las deudas en miles de pesos, de algunos clientes de un
banco

77 70 65 62 53 78 41 48 79 42
74 63 64 38 69 79 76 55 84 36
59 69 78 75 34 68 56 61 56 52
41 83 54 49 68 48 64 84 72 60
74 68 73 69 31 69 78 64 65 80

a. Elabora una tabla con datos agrupados


b. Calcula la varianza
c. Calcula la desviación estándar
d. Interpreta los resultados obtenidos
2. Manuel decide averiguar entre sus compañeros de curso, el consumo de gas domiciliario en m 3
que aparece registrado en el recibo mensual que emite la empresa que suministra el servicio. Los
datos son:

52 43 30 38 30 42 21 46
39 37 34 46 32 58 41 50
23 30 21 30 22 35 52 49
20 49 53 46 51 35 36 38

a. Calcula la varianza de estos datos


b. Calcula la desviación estándar
c. Interpreta los resultados obtenidos

También podría gustarte