Está en la página 1de 14

República Bolivariana de Venezuela

Ministerio del Poder Popular para la Educación Superior


Universidad Nacional Experimental Simón Rodríguez
Núcleo Ciudad Bolívar

Tema Introducción

III
Medida
s de
Disper
sión y
variabil
idad
Profesor: Participante:
Juan Gutiérrez Patricia Astudillo
V-30.249.004

Ciudad Bolívar Junio del 2.021.


Introducción

Vivimos en un mundo que cambia de forma acelerada. Todos formamos


parte de una monumental gran base de datos a la que continuamente acceden
y utilizan desde los estados y grandes multinacionales hasta el negocio más
pequeño o el individuo más alejado de la última aldea de cualquier país. Ya
nada es ajeno a nadie. Lo que ocurre en cualquier lugar del mundo es
presentado por los medios de comunicación prácticamente en directo en los
salones de las casas o en los teléfonos inteligentes de cada individuo,
estableciéndose así multitud de interrelaciones que avivan la interdependencia
de todos y todo termina por influir de un modo u otro en el resto. Esta nueva
situación de aldea global proporciona a la estadística un nuevo y mayor
protagonismo en prácticamente todos los aspectos de la vida.

Las medidas de dispersión tratan, a través del cálculo de diferentes


fórmulas, de arrojar un valor numérico que ofrezca información sobre el grado
de variabilidad de una variable. Indican si una variable se mueve mucho, poco,
más o menos que otra.

Son recomendadas para inferir el comportamiento de variables en


poblaciones y muestras. Complementan a estas medidas de tendencia central.
Además, son esenciales en una distribución de datos.

Pretenden resumir en un solo valor la dispersión que tiene un conjunto


de datos. Las medidas de dispersión más utilizadas son: Rango de variación,
Varianza, Desviación estándar, Coeficiente de variación

Las medidas relativas de dispersión son valores abstractos, es decir,


medidas adimensionales y por lo tanto no expresadas en ninguna unidad
específica, obviando así el inconveniente señalado para las medidas absolutas.
La principal medida es el coeficiente de variación.
MEDIDAS DE DISPERSIÓN O DE VARIABILIDAD

Una medida de dispersión o variabilidad nos determina el grado de


acercamiento o distanciamiento de los valores de una distribución frente a su
promedio de localización, sobre la base de que entre más grande sea el grado
de variación menor uniformidad tendrán los datos (sinónimo de
heterogeneidad) y por lo tanto menor representatividad o confiabilidad del
promedio de tendencia central o localización por haber sido obtenido de datos
dispersos. Por el contrario, si este valor es pequeño (respecto a la unidad de
medida) entonces hay una gran uniformidad entre los datos. Cuando es cero
quiere decir que todos los datos son iguales.

La dispersión o variación es una característica importante de un conjunto


de datos porque intenta dar una idea de cuán esparcidos se encuentran éstos. 
Indican  la intensidad con que se dispersan o concentran las observaciones
respecto de una Medida de Tendencia Central.

Las medidas de dispersión se dividen en dos grandes grupos:

 Las medidas de dispersión absolutas: estas medidas de dispersión


vienen expresadas en la misma medida en que se expresa la variable
que genera la serie de datos y su valor se limita a la serie misma.

 Las medidas de dispersión relativas: Estas medidas de dispersión son


relaciones entre medidas de dispersión absoluta y medidas de tendencia
central, las cuales vienen expresadas en valores proporcionales o
porcentuales y tienen como función determinar entre varias
distribuciones la de mayor o menor dispersión. Heterogeneidad u
homogeneidad entre dos serie de datos

Son valores que permitirán tener una idea de cuál es la separación,


variación o dispersión de un conjunto de datos estadísticos con respecto a
una medida de tendencia central específica o un valor constante determinado,
por lo general la media aritmética. La medida de dispersión más utilizada es
la Desviación Típica también llamada Desviación Estándar. Existen diversas
medidas de dispersión, algunas de ellas son:

Rango

Se define el rango de los datos como el intervalo u oscilación total de la


variable en los datos recogidos y se calcula por medio de la fórmula Rang(X) =
Máx(X) – Mín(X)

Dónde:
 Max(X): es el máximo valor que toma la variable X en los datos
recogidos, en pocas palabras, el valor mayor que toman los dados.
 Mín(X): es el mínimo  valor que toma la variable X en los datos
recogidos, en pocas palabras, el valor menor que toman los dados.

Esta medida se calcula fácilmente, sin embargo presenta la desventaja


en que no expresa realmente la concentración de los datos, presentándose
casos en los cuales se obtienen intervalos exagerados cuando en realidad la
serie tiene una gran concentración pero sus valores extremos difieren mucho
del resto de valores de la serie. Por ejemplo, se tiene la edad de un grupo de
personas, las cuales es la siguiente: 17, 18, 18, 18, 23, 15, 25, 18, 19, 17, 35.
El rango será igual a (35 – 15) = 19 el cual es exagerado y no da una idea real
de la concentración de los datos.

Su fórmula es:

R = Máxx – Mínx
Dónde:

 R → Es el rango.
 Máx → Es el valor máximo de la muestra o población.
 Mín → Es el valor mínimo de la muestra o población estadística.
 x → Es la variable sobre la que se pretende calcular esta medida.

Propiedades del Rango o Recorrido:

 El recorrido es la medida de dispersión más sencilla de calcular e


interpretar puesto que simplemente es la distancia entre los
valores extremos (máximo y mínimo) en una distribución
 Puesto que el recorrido se basa en los valores extremos éste tiende s ser
errático. No es extraño que en una distribución de datos económicos o
comerciales incluya a unos pocos valores en extremo pequeños o
grandes. Cuando tal cosa sucede, entonces el recorrido solamente mide
la dispersión con respecto a esos valores anormales, ignorando a los
demás valores de la variable.
 La principal desventaja del recorrido es que sólo está influenciado por los
valores extremos,, puesto que no cuenta con los demás valores de la
variable. Por tal razón, siempre existe el peligro de que el recorrido
ofrezca una descripción distorsionada de la dispersión.
 En el control de la calidad se hace un uso extenso del recorrido cuando
la distribución a utilizarse no la distorsionan y cuando
el ahorro del tiempo al hacer los cálculos es un factor de importancia.
Ejemplo
 Durante un mes de verano, los ocho vendedores de una empresa de
equipos de calefacción y aire acondicionado vendieron los siguientes
números de unidades centrales de aire acondicionado: 8,11, 5, 14, 8,11,
16, 11. El rango del número de unidades vendidas es R =My - Mn = 16 -
5 = 11.0 unidades

 Se tienen las edades de cinco estudiantes universitarios de Ier año, a


saber: 18,23, 27,34 y 25., para calcular la media aritmética (promedio de
las edades, se tiene que:

R = Xn-X1 ) = 34-18 = 16 años

Con datos agrupados no se saben los valores máximos y mínimos. Si no


hay intervalos de clases abiertos podemos aproximar el rango mediante el uso
de los límites de clases. Se aproxima el rango tomando el límite superior de la
última clase menos el límite inferior de la primera clase.

Desviación media

Entendiendo como desvío a la diferencia que hay entre una medida de


tendencia central con cada uno de sus valores se define la desviación
media como el valor promedio de los desvíos tomados en valor absoluto, de los
datos con respecto a un término central. El término central en la práctica es la
media aritmética, pero también puede usarse la mediana, la moda o un valor
arbitrario, dependiendo de los datos estudiados. Para el cálculo de la
desviación media se utilizará la siguiente fórmula:
Esta medida es de fácil comprensión, los desvíos son tomados en valor
absoluto porque de no ser así, la suma de éstos resultaría cero.

Propiedades

 Guarda las mismas dimensiones que las observaciones. La suma


de valores absolutos es relativamente sencilla de calcular, pero esta
simplicidad tiene un inconveniente: Desde el punto de vista geométrico,
la distancia que induce la desviación media en el espacio de
observaciones no es la natural (no permite definir ángulos entre
dos conjuntos de observaciones). Esto hace que sea muy engorroso
trabajar con ella a la hora de hacer inferencia a la población.
 Cuando mayor sea el valor de la desviación media, mayor es la
dispersión de los datos. Sin embargo, no proporciona una
relación matemática precisa entre su magnitud y la posición de un dato
dentro de una distribución.
 La desviación media al tomar los valores absolutos mide
una observación sin mostrar si la misma está por encima o por debajo
de la media aritmética.

Ejemplo:

Calcular la desviación media de la distribución: 3, 8, 8, 8, 9, 9, 9, 18

Solución:

Se calcula la media aritmética.


Se calcula la desviación media.

Desviación estándar

Se define como la raíz cuadrada positiva de la media aritmética de los


cuadrados de los desvíos de los valores con respecto a su media aritmética; su
símbolo es la letra griega sigma minúscula σ y en estadística inductiva se utiliza
la letra S, y la fórmula general de la desviación típica viene dada por:

Es la que mejor proporciona la variación de los datos con respecto a la


media aritmética, su valor se encuentra en relación directa con la dispersión de
los datos, a mayor dispersión de ellos, mayor desviación típica y a menor
dispersión menor desviación típica.

La desviación estándar es un promedio de las desviaciones individuales


de cada observación con respecto a la media de una distribución. Así, la
desviación estándar mide el grado de dispersión o variabilidad. En primer lugar,
midiendo la diferencia entre cada valor del conjunto de datos y la media del
conjunto de datos. Luego, sumando todas estas diferencias individuales para
dar el total de todas las diferencias

Existen dos fórmulas para calcular la desviación típica.


 La raíz cuadrada de la varianza: en este caso, hemos de realizar la raíz
cuadrada de la fórmula de la varianza para poder calcular la desviación
típica, es decir, la raíz cuadrada de la media de los cuadrados de las
puntuaciones de la desviación.
 La suma de las desviaciones y dividir entre el total de observaciones:
esta segunda fórmula es más intuitiva, de forma que se ha de realizar la
suma de todas las desviaciones en valor absoluto y, a continuación,
dividir entre el total de observaciones.

Propiedades:
 La desviación típica siempre adquiere valores iguales o mayores que
cero, adquiriendo un valor igual a 0 cuando las variables o datos
utilizados son iguales.
 Cuando a todos los valores de la variable se le suma un número, la
desviación típica permanece igual y no varía absolutamente nada.
 Cuando todos los valores de la variable son multiplicados por un mismo
número, la desviación típica también quedará multiplicada por ese
mismo número.
 Si existieran varias distribuciones con la misma media aritmética y
fuésemos conocedores de sus respectivas desviaciones típicas, se
podría calcular a partir de estos datos la desviación típica total.

Ejemplo:

Calcular la desviación estándar de la distribución: 9, 3, 8, 8, 9, 8, 9, 18

Calcular la desviación típica de la distribución de la tabla:


  xi fi xi · fi xi2 · fi
[10, 20) 15 1 15 225
[20, 30) 25 8 200 5000
[30,40) 35 10 350 12 250
[40, 50) 45 9 405 18 225
[50, 60) 55 8 440 24 200
[60,70) 65 4 260 16 900
[70, 80) 75 2 150 11 250
    42 1 820 88 050

Varianza

Se trata de una palabra impulsada por el matemático y científico


inglés Ronald Fisher (1890-1962) y sirve para identificar a la media de las
desviaciones cuadráticas de una Variable de carácter Aleatorio, considerando
el valor medio de ésta. Se obtiene de sumar todos los desvíos respecto a la
media aritmética elevados al cuadrado, dividiéndose entre el total de datos de
la serie.

Es necesario indicar que la unidad de medida de la varianza es la misma


unidad de medida de los datos utilizados para calcularla. Así, si los datos
introducidos en la fórmula utilizan los metros como unidad de medida, la
varianza se expresará también en metros. En cualquier caso, se ha de tener en
cuenta que la varianza adquiere siempre valores iguales o mayores a 0, siendo
matemáticamente imposible que adquiera valores inferiores a 0, pues los datos
introducidos se elevan al cuadrado.

Fórmula  utilizada para calcular la varianza:


Var (X) = (x1 – x’)2 + (x2 – x’)2 + … + (xn – x’) / N

Dónde:

 N representa el número total de observaciones o de datos utilizados


para el cálculo de la varianza.
 x representa los datos utilizados para el cálculo de la varianza.
 x’ representa la media aritmética calculada con los datos utilizados para
el cálculo de la varianza.

Propiedades:

 Siempre adquiere un valor positivo o igual a 0. Cuando el resultado es


igual a 0 significa que las puntuaciones son todas iguales.
 Cuando tenemos varias distribuciones con la misma media aritmética y
tenemos el dato de sus respectivas varianzas es posible calcular la
varianza total.
 Cuando todos los valores de la variable se multiplican por un número
cualquier, la varianza quedará multiplicada por el cuadrado de ese
mismo número.

Ejemplo

Supongamos que tenemos 5 personas diferentes con distintos sueldos:

 Santiago: 1.500 euros.


 Miguel: 1.200 euros.
 Sara: 1.700 euros.
 Laura: 1.300 euros.
 María: 1.800 euros.
En primer lugar, debemos calcular la media aritmética de todos estos datos.
Vamos a ello:
(1.500 + 1.200 + 1.700 + 1.300 + 1.800) / 5 = 1.500 euros

Una vez calculada la media aritmética, hemos de aplicar la fórmula de la


varianza. Vamos a ello:

Var (X) = (1500 – 1500)2 + (1200 – 1500)2 + (1700 – 1500)2 + (1300 – 1500)2
+ (1800 – 1500)2 / 5

Una vez desarrollada la ecuación, el resultado es de 52.000 euros al


cuadrado. Debemos recordar que, al calcular la varianza, obtenemos la unidad
de medida de los datos utilizados elevada al cuadrado. Así, para pasar este
resultado a euros, tendríamos que realizar el cálculo de la desviación típica, la
cual, en este caso, adquiere un valor de 228 euros. ¿Qué quiere decir este
resultado? Este resultado se debe interpretar como que, de media, la diferencia
entre los salarios de las 5 personas cuyos salarios se han utilizado para
calcular la varianza es de 228 euros.

Conclusión
Los valores de las medidas de dispersión, nos permiten saber si los
datos se encuentran estrechamente agrupados, si se encuentran ampliamente
dispersos o si son iguales. Pretenden evaluar en qué medida los datos difieren
entre sí. De esta forma, ambos tipos de medidas usadas en conjunto permiten
describir un conjunto de datos entregando información acerca de su posición y
su dispersión.

Los procedimientos para obtener las medidas estadísticas difieren


levemente dependiendo de la forma en que se encuentren los datos. Si los
datos se encuentran ordenados en una tabla estadística diremos que se
encuentran “agrupados” y si los datos no están en una tabla hablaremos de
datos “no agrupados”.

Las medidas de dispersión entregan información sobre la variación de la


variable. Pretenden resumir en un solo valor la dispersión que tiene un conjunto
de datos. Las medidas de dispersión más utilizadas son: Rango de variación,
Varianza, Desviación estándar, Coeficiente de variación.

Bibliografía
Colectivo de autores. Estadística, probabilidad y precálculo, Manual esencia,
Editorial Santillana, Santiago de Chile, 2008

Estadística Básica con R y R-Commander, capítulo 2 sobre "Análisis


Exploratorio de Datos Unidimensional, Distribución de frecuencias, medidas de
posición, medidas de dispersión, diagramas"

José Francisco López (15 de febrero, 2019). Medidas de dispersión.


Economipedia.com

Spiegel, M. R. (1991). Estadística (2da edición.). D. F, México. Editorial


McGraw Hill.

También podría gustarte