Está en la página 1de 11

INSTITUCIÓN EDUCATIVA LICEO PANAMERICANO CAMPESTRE

SINCELEJO ‒ SUCRE ‒ 2019


GUIA UNO DE ESTADISTICA
GRADO: ONCE
DOCENTE: ARTURO RAFAEL RICARDO ORTEGA
CONTENIDO TEMATICO: MEDIDAS DE DISPERSION

INTRODUCCION

El objetivo principal de la estadística es analizar datos y transformarlos en información útil


para la toma de decisiones.

Para ese análisis, la estadística se apoya en el cálculo de diferentes parámetros o estadísticos.


Uno de esos parámetros, son las medidas de dispersion.

Antes de estudiar las medidas de dispersion, recordemos cuales son los diferentes tipos de
medida o parámetros que existen en estadística.

Las medidas que existen en estadística las podemos resumir en el siguiente mapa
conceptual

MEDIDAS ESTADISTICAS

SE CLASIFICAN
EN

MEDIDAS MEDIDAS MEDIDAS


DE DE DE FORMA
POSICION DISPERSION
POPOSICIO
N
TENDENCIA TENDENCIA RANGO CURTOSIS O
NO CENTRAL DESVIACION ASIMETRIA APUNTAMIENTO
CENTRAL
MEDIA
VARIAZA
DESVIACION
ESTANDAR COEFICIENTE
COEFICIENTE DE KARL LEPTOCURTICA
MEDIA CUARTIL MESOCURTICA
DE PEARSON
MEDINA DECIL PLATICURTICA
PERCENTIL
VARIACION COEFICIENTE
MODA DE ARTHUR
BOWLEY

 Una medida de posición es un número que proporciona información de una determinada


posición dentro de un conjunto de datos y su propósito es resumir en un solo número la
posición o localización de la distribución de datos, además de caracterizar y representar
un conjunto de datos.

 Una medida de dispersion es un número que proporciona información sobre la


variabilidad de un conjunto de datos; es decir, si la distribución de los datos es más o
menos homogénea y por tanto nos dan una medida sobre la representatividad de los
parámetros de centralización (moda, mediana o media)

 Las medidas de forma permiten comprobar si una distribución de frecuencia tiene


características especiales como simetría, asimetría, nivel de concentración de datos y
nivel de apuntamiento que la clasifiquen en un tipo particular de distribución.
MEDIDAS DE DISPERSION

Supongamos que dos alumnos han realizado cinco exámenes cada uno. Para evaluarlos
elegimos hacer la media o promedio de las cinco notas que han obtenido.

Las notas han sido:


ALUMNO A: 4, 5, 5, 5, 6 Media = 5
ALUMNO B: 1, 2, 5, 8, 9 Media = 5

Si vemos los dos tendrían la misma nota, lo que nos haría pensar que el rendimiento de los dos
alumnos son similares, pero si observamos sus notas hay una gran diferencia entre ambos.
El alumno A tiene unas notas muy homogéneas, muy próximas a la media mientras que el
alumno B tiene unos resultados muy dispares."

Para poder analizar bien sus resultados necesitaríamos otro parámetro que nos mida esa
variabilidad. Estamos hablando de las medidas de dispersión.

Como ya sabemos, las medidas de dispersion son parámetros que proporciona información
sobre la variabilidad de un conjunto de datos; es decir, si la distribución de los datos es más o
menos homogénea.

Las medidas de dispersion son importante porque:

 Proporciona información adicional que permite juzgar la confiabilidad de la medida de


tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central
es menos representativa del conjunto de datos.

 Ya que existen problemas característicos para datos ampliamente dispersos, debemos ser
capaces de distinguir que presentan esa dispersión antes de abordar esos problemas.

 Para comparar dos o más conjuntos referentes a un mismo fenómeno. Si por ejemplo,
tanto el ingreso promedio mensual de un barrio A como el de un barrio B de una cierta
ciudad es $370.000, pero se sabe además que existe más variabilidad de los ingresos en el
barrio A que en el barrio B, entonces podemos afirmar que el promedio de los ingresos en
el barrio A es menos representativo que en el barrio B, es decir que existe peor distribución
del ingreso en el barrio A que en el B.

Del mapa conceptual sabemos que las medidas de dispersion son: Rango, Desviación Media,
Varianza, Desviación Estándar, Coeficiente de Variación

RANGO O RECORRIDO ( R )

El rango o recorrido de un conjunto de datos es una medida de dispersión posicional, que se


define como la diferencia entre el mayor y el menor valor del conjunto.
Se simboliza con la letra R
R = Xmax – Xmin

Si los datos están agrupados en una tabla de frecuencias, el rango es la diferencia entre el límite
real superior del último intervalo y el límite real inferior del primer intervalo.

R = Lmax – Lmin

A pesar de que el rango o recorrido es fácil de calcular, puede ser una deficiente estimación de
la dispersión, puesto que sólo tiene en cuenta para su cálculo el mayor y el menor valor del
conjunto, haciendo caso omiso del comportamiento de valores intermedios.
OBSERVACIONES:
 Se puede decir que el rango mide la dispersion total del conjunto de datos
 Cuanto menor es el rango mayor es el grado de representatividad de los valores
centrales.
 Cuanto mayor es, la distribución está menos concentrada o más dispersa.
 Tiene gran aplicación en procesos de control de calidad,
 Tiene el inconveniente de que sólo depende de los valores extremos. De esta forma basta
que uno de ellos se separe mucho para que el recorrido se vea sensiblemente afectado

Ejemplo1:
Para la muestra (8, 7, 6, 9, 4, 5), el dato menor es 4 y el dato mayor es 9. Sus valores se
encuentran en un rango de:
R=9–4=5
Ejemplo 2:
Si el rango del peso de un conjunto de 50 estudiantes de una universidad es 3 kilos, se sabe que
3 kilos es una diferencia muy pequeña tratándose del peso de estudiantes de una universidad; lo
cual quiere decir que los pesos de los estudiantes son muy uniformes y así el rango nos da una
buena nos da una buena idea de la dispersión de los datos.

DESVIACION MEDIA (Dm).

Acabamos de ver que el rango o recorrido solo tienen en cuenta para su cálculo dos valores del
conjunto. La desviación media (Dm) suple la deficiencia de la medida anterior, pues su cálculo
tiene en cuenta todos los valores del conjunto.
Como su nombre lo indica, la desviación respecto a la media da información de lo alejado o
cerca que está un dato de los demás datos del conjunto. Intuitivamente, ya se ve que se puede
calcular como la diferencia entre un dato y la media de los datos.

La desviación media se define como el cociente de la sumatoria del valor absoluto de las
distancias existentes entre cada dato y su media aritmética y el número total de datos.

̅, aunque a veces se utiliza las


Generalmente las desviaciones son calculadas respecto a la 𝒙
desviaciones respecto a la Me.

La fórmula de la desviación media para datos no agrupados es:

Si los datos vienen agrupados en una tabla de frecuencias, la fórmula de la desviación media es:

OBSERVACIONES:

 El signo de la desviación respecto a la media indica si el valor está por encima de la


media (signo positivo), o por debajo de la media (signo negativo).
 La suma de las desviaciones respecto a la media siempre vale CERO
 El valor absoluto de la desviación respecto a la media indica lo lejos que está el valor de
la media.
 Un valor igual a cero indica que el valor coincide con la media, mientras que un valor
elevado con respecto a las demás desviaciones informa de que el dato está alejado de los
demás datos.
Ejemplo 1:

Calcular la desviación media de la siguiente distribución, la cual muestra los resultados sobre el
número de preguntas buenas en un examen de estadística de veinte preguntas.
9, 3, 8, 8, 9, 8, 9, 18

Ejemplo 2:

Calcular la desviación media de la siguiente distribución, la cual muestra los resultados de un


estudio sobre la recolección de gramos de un oro en una mina por un grupo de trabajadores
durante una semana.

PESO (gr) xi fi x i • fi ̅|
|x - 𝒙 ̅| • fi
|x -𝒙

[10, 15) 12.5 3 37.5 9.286 27.858


[15, 20) 17.5 5 87.5 4.286 21.43
[20, 25) 22.5 7 157.5 0.714 4.998
[25, 30) 27.5 4 110 5.714 22.856
[30, 35) 32.5 2 65 10.174 21.428
TOTAL 21 457.5 98.57

LA VARIANZA ( 𝑺𝟐 )

Ya sabemos que el problema de los signos en la desviación media, es eludido tomando los
valores absolutos de las diferencias de los datos con respecto a la media aritmética. Ahora bien,
la varianza obvia los signos elevando las diferencias al cuadrado, lo cual resulta ser más
conveniente, aparte de que es supremamente útil en el ajuste de modelos estadísticos que
generalmente conllevan formas cuadráticas.

La varianza es uno de los parámetros más importantes en estadística paramétrica, se puede


decir que, teniendo conocimiento de la varianza de una población, se ha avanzado mucho en el
conocimiento de la población misma.

La varianza de un conjunto de datos, se define como un promedio de los cuadrados de las


desviaciones de los valores del conjunto, con respecto a la media aritmética.

La definición anterior la podemos escribir matemáticamente de las siguientes maneras:


OBSERVACIONES:
 La varianza, al igual que la media, es un índice muy sensible a las puntuaciones
extremas.
 En los casos que no se pueda hallar la media tampoco será posible hallar la varianza.
 La varianza no viene expresada en las mismas unidades que los datos, ya que las
desviaciones están elevadas al cuadrado.
 Comparando con el mismo tipo de datos, un varianza elevada significa que los datos
están más dispersos. Mientras que un valor de la varianza bajo indica que los valores
están por lo general más próximos a la media.
 Un valor de la varianza igual a cero implica que todos los valores son iguales, y por lo
tanto también coinciden con la media aritmética.

Ejemplo 1:

Calcular la varianza de la siguiente distribución, la cual muestra los resultados sobre el número
de preguntas buenas en un examen de estadística de veinte preguntas.
9, 3, 8, 8, 9, 8, 9, 18

Ejemplo 2:

Calcular la varianza de la siguiente distribución, la cual muestra los resultados de un estudio


sobre la recolección de gramos de un oro en una mina por un grupo de trabajadores durante una
semana.

PESO (gr) xi fi xi• fi (xi – 𝒙


̅ )2 (xi – 𝒙
̅ )2 f i

[10, 20) 15 1 15 802,58 802,58


1820
[20, 30) 25 8 200 335,98 2697,84 ̅=
𝒙 42
= 43,33

[30,40) 35 10 350 69,38 693.8 9192,96


𝑺𝟐 = = 218,88
42
[40, 50) 45 9 405 2,78 25.02
[50, 60 55 8 440 136,18 1089,44
[60,70) 65 4 260 469,58 1878,32
[70, 80) 75 2 150 1002,98 2005,96
– 42 1820 – 9192,96

Propiedades de la varianza

1) La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean
iguales.
2) La varianza de una constante es igual a cero (ejemplo: si todos los estudiantes de este curso
obtienen la misma nota).
3) Si a todos los valores de la variable se les suma (o resta) un número la varianza no varía.
4) Si todos los valores de la variable se multiplican por un número la varianza queda
multiplicada por el cuadrado de dicho número.
Ejemplo: De un grupo de contribuyentes se determinó que el promedio de impuestos es de
$42.200, con una varianza de $8.600.

Determinar en cada uno de los siguientes casos, la nueva varianza:


a) Los impuestos aumentan en un 2 %
b) A los impuestos se les disminuye la cantidad de $3.300
c) A cada contribuyente, se le disminuye un 3 % y además se le condona (se le perdona) $3.550

SOLUCION
2
a) 𝑠𝑥 = 8600 • (1,02) = 8947, La nueva varianza es $8947 → Propiedad 4
2

b) 𝑠𝑥2 = 8600, la nueva varianza es $8600, → Propiedad 3

c) 𝑠𝑥2 = 8600 • (0,97)2 = 8091, la nueva varianza es $8091, → Propiedad 4 y 3

DESVIACION ESTANDAR O TIPICA ( S )

Según la fórmula de la desviación media, las desviaciones de los valores del conjunto respecto
a la media aritmética, se tomaron en su valor absoluto con el fin de evitar las compensaciones
entre desviaciones positivas y negativas, que nos llevaría a formarnos una falsa idea de la
variabilidad de los datos.
Si observamos la fórmula para la varianza, con el fin de evitar las referidas compensaciones, se
elevaron al cuadrado dichas desviaciones volviéndolas positivas.
Tomar los cuadrados de las desviaciones para el cálculo de la varianza, puede carecer de
sentido y además las diferencias entre los valores reales y la media se vuelven muy grandes.
Este hecho, condujo a que se le hiciera una modificación a la fórmula de la varianza, sacándole
la raíz cuadrada a la misma y obteniendo así la fórmula para la desviación típica o estándar.

Esta medida nos permite determinar el promedio aritmético de variación de los datos respecto a
su punto central o media. La desviación estándar nos da como resultado un valor numérico que
representa el promedio de diferencia que hay entre los datos y la media.

Para calcular la desviación estándar basta con hallar la raíz cuadrada de la varianza, por lo
tanto sus fórmulas son:

Ejemplo1:
Para el conjunto de datos: 25, 12, 23, 28, 17, 15 donde se obtuvo que su varianza era
𝒔𝟐 = 39,2; tendremos entonces que su desviación estándar es S = √39,2 = 6,26 (unidades)

Ejemplo 2:
Para el ejemplo de los datos tabulados sobre las edades de 26 personas se obtuvo como
varianza 𝒔𝟐 = 51,618; luego su desviación estándar será S = √51,618 = 6,18 (años)
OBSERVACIONES:

 La desviación estándar, al igual que la media y la varianza, es un índice muy sensible a las
puntuaciones extremas.
 En los casos que no se pueda hallar la media tampoco será posible hallar la desviación estándar.
 Cuanta más pequeña sea la desviación estándar mayor será la concentración de datos alrededor
de la media.

Por ejemplo, la distribución azul en la parte de abajo tiene una desviación estándar mayor que
la distribución verde de arriba:

Es interesante que la desviación estándar no puede ser negativa. Una desviación


estándar cercana a 0 indica que los datos tienden a estar más cerca a la media (se
muestra por la línea punteada). Entre más lejos estén los datos de la media, más grande
es la desviación estándar.

Propiedades de la Desviación Estándar

1) La desviación típica será siempre un valor positivo o cero, en el caso de que las
puntuaciones sean iguales.
2) Si a todos los valores de la variable se les suma un número la desviación típica no varía.
3) Si todos los valores de la variable se multiplican por un número la desviación típica queda
multiplicada por dicho número.
Criterio de Homogeneidad

COEFICIENTE DE VARIACION ( 𝑪𝒗 )

Las medidas de dispersión que hemos visto hasta ahora, son “absolutas” y son útiles para
describir la dispersión de un solo conjunto de datos. Si dos conjuntos van a ser comparados, los
valores absolutos son convenientes para éste fin, únicamente si los promedios de dichos
conjuntos son más o menos iguales y si por otra parte se refieren a un mismo fenómeno. Por
ejemplo, no tiene sentido comparar cual entre dos compañías A y B presenta mayor dispersión
en los salarios, si la primera paga en dólares y la segunda paga en pesos colombianos. Tampoco
tiene sentido comparar por ejemplo, cual de dos productos de la competencia presenta mayor
dispersión en su contenido, si uno de ellos tiene una presentación en onzas, mientras que el otro
tiene una presentación en gramos.

Es necesario por lo tanto, disponer de una medida que nos permita comparar qué tan pequeña o
qué tan grande es una medida de dispersión absoluta como la desviación estándar. El
coeficiente de variación (también llamado coeficiente de variación de Pearson), que
simbolizamos por 𝑪𝒗 , es una medida de dispersión relativa que resulta de comparar la S con la
̅ del conjunto, así:
𝒙 𝒔
𝑪𝒗 = • 100
̅
𝒙

Su fórmula expresa la Desviación Estándar como porcentaje de la Media, mostrando una mejor
interpretación porcentual del grado de variabilidad de la desviación estándar.
A mayor valor del 𝑪𝒗 mayor heterogeneidad del conjunto de datos y a menor 𝑪𝒗 , mayor
homogeneidad en el conjunto de datos.

Ejemplo 1:

Si tenemos dos conjuntos de estudiantes A y B, cuyo peso presenta la misma dispersión: S = 12


kilos, pero el conjunto A tiene un peso promedio de 72 kilos, mientras que
el conjunto B tiene un peso promedio de 61 kilos; es claro, que desde el punto de vista de la
dispersión absoluta, la variabilidad en ambos conjuntos es idéntica. No obstante, también es
claro, que relativamente, el conjunto A presenta mayor homogeneidad en sus pesos, ya que 12
respecto a 72, es relativamente menor que 12 respecto a 61, puesto que como observamos a
continuación, 𝑪𝒗𝑨 < 𝑪𝒗𝑩

12 12
𝑪𝒗𝑨 = • 100 = 16,67% 𝑪𝒗𝑩 = • 100 = 19,67%
72 61

Ejemplo 2.

Después de haber registrado los datos correspondientes al peso y la estatura de 40 varones, se


asentaron en la siguiente tabla los resultados del cálculo de la media y la desviación estándar.
Media (X ) Desviación estándar (S )
Estatura 68.34 pulgadas 3.02 pulgadas
Peso 172.55 libras 26.33 libras

Calcula el coeficiente de variación de las estaturas, después el coeficiente de variación de los


pesos; finalmente, compara ambos resultados.

Solución.
Debido a que tenemos estadísticos muestrales, los dos coeficientes de variación se obtienen de
la siguiente manera:
3.02 pul 26.33libras
Estatura CV  (100%)  4.42% Pesos CV  (100%)  15.26%
68.34 pul 172.55libras

Aún cuando la diferencia en unidades de medida (pulgadas y libras) imposibilita la


comparación de la desviación estándar de 3.02 pulgadas, con la desviación estándar de 26.33
libras, es posible comparar los coeficientes de variación, que carecen de unidades.
Se observa que las estaturas (con CV = 4.42%) tienen una variación considerablemente menor
que los pesos con (CV = 15.26%). Lo anterior tiene sentido, ya que, por lo general, vemos que
los pesos de los hombres varían mucho más que sus estaturas.

Por ejemplo, es muy raro encontrar un adulto que mida el doble que otro, pero es mucho más
común ver a uno que pese el doble que otro.

OBSERVACIONES:
 Puesto que tanto la desviación estándar como la media se miden en las unidades
originales, el 𝑪𝒗 es una medida independiente de las unidades de medición.
 Debido a la propiedad anterior el 𝑪𝒗 es la cantidad más adecuada para comparar la
variabilidad de dos conjuntos de datos.
 En áreas de investigación donde se tienen datos de experimentos previos, el 𝑪𝒗 es muy
usado para evaluar la precisión de un experimento, comparando en 𝑪𝒗 del experimento
en cuestión con los valores del mismo en experiencias anteriores.
 El 𝑪𝒗 no se altera cuando los datos son multiplicados por una constante, pues en virtud
de las propiedades de 𝒙̅ y S ambos quedan multiplicados por esa constante, sin alterar el
cociente.
INSTITUCIÓN EDUCATIVA LICEO PANAMERICANO CAMPESTRE
SINCELEJO − SUCRE – 2019
ACTIVIDAD EVALUATIVA Y DE AFIANZAMIENTO DEL PRIMER PERIODO
ASIGNATURA: ESTADÍSTICA DOCENTE: ARTURO RAFAEL RICARDO ORTEGA
GRADO: ONCE GRUPOS: 1, 2, 3 Y 4

EJES TEMATICOS: MEDIDAS DE DISPERSION

1) Para cada uno de los siguientes conjuntos de datos; calcula: el Rango, la Desviación Media,
La Varianza, la Desviación estándar y el Coeficiente de Variación

a)
b)
Peso Numero de recién
b) ( Kg ) nacidos (fi)
b)
2,0 – 2,5 15
2,5 – 3,0 22
3,0 – 3,5 30
3,5 – 4,0 15
4,0 – 4,5 10

c) Resultado de un estudio acerca del tiempo que le dedican semanalmente a la lectura un


grupo de 80 estudiantes de un colegio de Sincelejo.
Tiempo (min) 40 – 50 50 – 60 60 – 70 70 – 80 80 – 90 90 – 100 100 – 110
Porcentaje de 25% 2,5% 20% 12,5% 17,5% 7,5% 15%
estudiantes

2) Tenemos una variable x de la que sabemos que: 𝑪𝒗 = 0,5% y que Sx = 3. ¿Cuál es el valor
de la media de x ?

3) Una empresa de fabricación de productos cerámicos dispone de tres centros de producción.


En el centro A, el más grande y moderno, se hace un estudio de los m² de azulejos producido
al mes durante el año pasado, obteniéndose una media de producción mensual x A  250.000 m²,
con una desviación típica SA = 15.000 m². Se sabe que el centro B, por tener maquinaria más
anticuada que A, produce cada mes un tercio de la producción de A, y que el centro C, por
tener un horno menos que B, produce cada mes 25.000 m² menos que B ¿Cuál es la media y
la varianza de la producción mensual de C?

4) La distribución de edades del Censo Electoral de Residentes a 1 de enero de 1.999 para las
comunidades autónomas de Aragón y Canarias, en tantos por ciento es la siguiente:
autónomas de Aragón y Canarias, en tantos por ciento es la siguiente:
Edades Aragón Canarias
16 – 20 3.54 4.35
20 – 24 21.56 29.99
24 – 28 31.63 35.21
38 – 48 28.14 21.97
48 – 58 15.12 8.48

¿Qué comunidad tiene mayor variabilidad en la distribución de su edad?


5) Sumando 5 a cada número del conjunto 3, 6, 2, 1, 7, 5, obtenemos 8, 11, 7, 6, 12, 10.
Probar que ambos conjuntos de números tienen la misma desviación típica pero diferente
medias ¿cómo están relacionadas las medias?

6) Se sabe que de 50 instalaciones generadoras de electricidad mediante energía solar, en 20 de


ellas se reducen los gastos de servicio en un promedio de un 30% y en los 30 restantes se
reducen dichos gastos en un promedio del 25%. Se pide calcular la desviación estándar de
las 50 instalaciones, si el coeficiente de variación es del 25%.

7) Se toman las medidas de 80 personas las que tienen estatura media de 1.70 m y desviación
estándar de 3.4 cm. Posteriormente se verificó que la media usada tenía 4 cm de menos.
Rectifique los estadígrafos mencionados.

8) El salario promedio en una ciudad es de 11000€ con una variancia de 2000€ ¿Cuáles serán
la nueva media y la nueva variancia si se efectúan los siguientes cambios:
a) Se aumenta 810€ a todos
b) Se aumenta el 15 % de su salario a cada trabajador
c) Si se duplican los sueldos

9) ¿Podría en algún caso, la varianza ser menor que la desviación estándar?


Argumente su respuesta

10) Explique el significado de un coeficiente de variación negativo

Si ya sabes lo que tienes que hacer y no lo haces, estas peor que antes

También podría gustarte