Materia:
ESTADISTICA DESCRIPTIVA
ESATDISTICA DESCRIPTIVA
Medidas de Dispersión
Docente orientador
Ordoñez López, Steven Yesid
Recordemos que las medidas de
tendencia central localizan
generalmente a un valor que se halla
ubicado en el centro de la
distribución, pero No informa sobre el
grado de dispersión o variabilidad
del conjunto de datos.
La variabilidad es la dispersión de los valores de una variable en una distribución
teórica o en una muestra
Datos NO agrupados
¿Por qué estudiar la dispersión?
Nos informan sobre el grado de esparcimiento de la
distribución, es decir, nos van a decir si los valores
que aparecen están más o menos concentrados.
también nos informan sobre el grado de
representatividad de la medidas de posición, pues
cuanto más concentrados estén los valores que toma
la variable mejor representará un solo valor a toda la
distribución.
Ahora, Las principales medidas de
variabilidad que estudiaremos son:
.
• Rango o amplitud de variación
• Desviación media
• Varianza
• Desviación estándar (típica)
• Coeficiente de variación
Rango o Amplitud de variación
Rango o Amplitud de variación
Desviación Media
Es la medida de dispersión que mide más exactamente
el grado de dispersión de un conjunto de datos con
relación a la media aritmética.
En otras palabras es la medida que nos determina en
cuantas unidades en promedio los datos se hallan
desviados o alejados de la media aritmética.
Ejemplo con datos NO agrupados
Sean los siguientes datos: 4, 5, 3, 5, 3, 2, 2, 2, 2, 3, 5, 1, 4, 1, 4.
Obtener su desviación media:
Solución. Se calcula la media aritmética:
El primer dato (4), se aleja de la media en 0,9334 hacia la derecha.
Para el segundo dato (5), se aleja de la media 1,9333 también hacia la
derecha.
Para el tercer dato (3), se aleja de la media en 0,0667 pero hacia la
izquierda.
La suma de las distancias absolutas es 17.2, así que los datos se separan de
la media en:
Ejercicio en clases
Calcule:
a) el rango;
b) la media aritmética;
c) la desviación media;
d) interpretelos valores que obtenga.
Datos NO agrupados
Imagina que un grupo de personas está lanzando dardos a un tablero.
La varianza sería como medir el área total cubierta por todos los
dardos, mientras que la desviación estándar sería como medir la
distancia promedio entre cada dardo y el centro del tablero.
Ejemplo grafico para correcta interpretación
VARIANZA
La varianza es una medida de dispersión que mide el grado de
esparcimiento de una distribución alrededor de la media
aritmética.
Cuanto más grande sea la varianza más esparcidos estarán los
valores de la variable.
ENCONTRAR LA
VARIANZA
SOLUCION
Desviación Estándar (típica)
La desviación típica se define para obtener
una medida de dispersión o grado de
separación de los datos con respecto al valor
promedio.
Se define como la raíz cuadrada de la
varianza.
Ejemplo:
Hallar la desviación media, la varianza y la
desviación típica de la series de números siguientes:
a) b)
Solución:
La varianza es una medida estadística que se utiliza
para cuantificar la dispersión o variabilidad de un
conjunto de datos. En otras palabras, te dice qué tan
dispersos o extendidos están los valores individuales en
relación con la media aritmética.
• Si es alta, significa que los datos están más
dispersos lejos de la media;
• Si es baja, significa que los datos están
más concentrados cerca de la media.
Heterogeneidad:
• Definición: Se refiere a la cualidad de ser diverso
o variado en composición, estructura o
características. En un contexto estadístico, un
conjunto de datos es heterogéneo si sus valores
son muy diferentes o tienen una alta variabilidad.
• Características:
• Alta variabilidad o dispersión de los datos.
• Diversidad en las características de los elementos de
un conjunto.
• Mayor complejidad en el análisis y la predicción,
debido a la variabilidad de los datos.
Homogeneidad:
• Definición: Se refiere a la cualidad de ser
uniforme o similar en composición, estructura o
características. En un contexto estadístico, un
conjunto de datos es homogéneo si sus valores
son similares o tienen una baja variabilidad.
• Características:
• Baja variabilidad o dispersión de los datos.
• Similitud en las características de los elementos de un
conjunto.
• Facilidad para realizar predicciones y análisis, ya que
los datos siguen patrones consistentes.
Ejemplo comparativo:
• Imaginemos dos grupos de estudiantes que
realizan un examen de matemáticas:
Grupo Homogéneo:
• Todos los estudiantes del grupo han estudiado con
el mismo método y tienen niveles de
conocimiento similares.
• Las calificaciones obtenidas en el examen varían
poco, con la mayoría de los estudiantes
obteniendo calificaciones cercanas al promedio.
• En este caso, las calificaciones del grupo muestran
homogeneidad.
Grupo Heterogéneo: Los estudiantes del grupo
han estudiado con diferentes métodos y tienen
niveles de conocimiento variados.
• Las calificaciones obtenidas en el examen
varían mucho, con algunos estudiantes
obteniendo calificaciones muy altas y otros
muy bajas.
• En este caso, las calificaciones del grupo
muestran heterogeneidad.
En resumen:
• La homogeneidad implica uniformidad y baja
variabilidad.
• La heterogeneidad implica diversidad y alta
variabilidad.
Estos conceptos son fundamentales en
estadística para comprender la distribución de
los datos y elegir las técnicas de análisis
adecuadas.
En estadística, cuando se desea
hacer referencia a la relación entre
el tamaño de la media y la
variabilidad de la variable, se utiliza
el coeficiente de variación (“ C.V. ")
A Mayor valor del coeficiente de variación
C.V, mayor heterogeneidad (poblaciones /
datos / resultados: distintos) de los valores
de la variable;
y a Menor coeficiente de variación C.V.,
mayor homogeneidad (poblaciones / datos /
resultados: iguales) en los valores de la
variable.
Por ejemplo, si el C.V es menor o igual al 30%,
significa que la media aritmética es
representativa del conjunto de datos, por ende el
conjunto de datos es "Homogéneo".
Por el contrario, si el C.V supera al 30%, el
promedio no será representativo del conjunto de
datos (por lo que resultará “Heterogéneo"). Se
calcula
DATOS AGRUPADOS
DATOS AGRUPADOS
ENCONTRAR LA VARIANZA, DESVIACION ESTANDAR Y EL COEFICIENTE DE
VARIACION DE DATOS EN PORCENTAJE
DATOS AGRUPADOS M – marca de clase
F - Frecuencia
Un matemático ruso quien afirma que todo
conjunto de datos establece que, por lo menos un
porcentaje de las observación estén a cierta
cantidad de k desviaciones estándares de la media.
Ejercicios:
• Una aerolínea revela que tiene un promedio de 78.7 pasajeros
por día, con una desviación estándar de 12,14. ¿ con que
frecuencia los pasajeros están dentro de k=2 desviaciones
estándar de la media y cual es dicho intervalo?
• Se tiene una colección de 70 datos con una media de 65,42 y
una desviación estándar de 4,86 . Determine :
A)El porcentaje de mediciones contenido entre 58,42 y 72,42
b) El numero de datos entre 56,12 y 74,42
c) los limites entre los cuales se encuentra el 79% de los datos
Ejemplo 2 – visual demostrativo
REGLA EMPIRICA
Si se desea ser más precisos en la explicación
de la dispersión central, de acuerdo a las
relaciones que implican la desviación estándar
y la media, se encuentran descritas en la regla
empírica, a veces denominada regla normal.
REGLA EMPIRICA
EJEMPLO: REGLA EMPIRICA
Pitney Pipe Company es uno de los fabricantes
nacionales de tubos PVC. El departamento de control
de calidad tomó una muestra de 600 tubos de 10 pies
de longitud. A una distancia de 1 pie del extremo del
tubo, se midió el diámetro externo. La media fue de
14.0 pulgadas y la desviación estándar de 0.1 pulgadas.
• a) Si no conoce la forma de la distribución, ¿por lo
menos qué porcentaje de las observaciones se
encontrará entre 13.85 y 14.15 pulgadas?
• b) Si supone que la distribución de los diámetros es
simétrica y tiene forma de campana, ¿entre qué dos
valores se encontrará aproximadamente 95% de las
observaciones?