Está en la página 1de 29

ESTADÍSTICA

Medidas de Dispersión y Forma


Semana

03
• MSc. Fiorella Vanessa Li Vega
Objetivos
• Calcula e interpreta las medidas de
dispersión para datos no agrupados y
datos agrupados.
• Calcula e interpreta las medidas de de
forma.
• Calcula e interpreta las medidas de
concentración.
Contenido
• Cálculo e interpretación de las medidas de dispersión para
datos agrupados y no agrupados.
• Cálculo e interpretación de las medidas de forma.
• Cálculo e interpretación de las medias concentración.
¿A qué se refiere la Dispersión de un conjunto de datos o de su
distribución?
• La dispersión de los datos correspondientes a una variable cuantitativa hace referencia a qué
tanto se encuentran separados entre si.
• La dispersión o variabilidad de los datos o de su distribución es la característica más
importante.
• Ejemplo para captar la idea de dispersión o variabilidad de datos estadísticos. Tenemos las
calificaciones de dos grupos de estudiantes del curso de Estadística y Probabilidades
 Grupo A: 15, 18, 14, 14, 16, 16, 17, 14, 15, 14, 16, 17, 14, 15.
 Grupo B: 02, 16, 18, 15, 13, 11, 18, 12, 17, 18, 16, 16, 14,11.
Las calificaciones de los estudiantes del grupo A presentan menor dispersión o variabilidad con
relación a las calificaciones de los estudiantes del grupo B, pues no hay mucha separación entre
sus valores.

Menor dispersión Datos más homogéneos

Mayor dispersión Datos más heterogéneos


Distribución normal
Es un modelo teórico de distribución de variable cuantitativa continua

• Es una distribución simétrica respecto a la media


• Es mesocúrtica: ni muy levantada ni aplanada
• El área bajo la curva y el eje X es igual a 1
• Tiene una joroba
• Muchas variables del mundo real tienen una
distribución normal o aproximadamente normal

• Distribuciones normales con la misma media y diferentes valores de


dispersión. A mayor dispersión, más abierta la curva

• Distribuciones normales con la misma con medias diferentes y dispersiones


diferentes
¿A qué se refiere la Forma de la distribución de un conjunto de datos?

*Hace referencia a la deformación que puede tener la


distribución de un conjunto de datos en comparación con la
distribución ideal, la Distribución Normal.
*La deformación podría ser:
- Con relación a la simetría

- Con relación a su apuntamiento o concentración


Medidas de Dispersión
Medidas deDispersión
Son valores expresados en las mismas unidades de la variable en estudio y, por tanto no
permiten comparaciones o análisis respecto de la mayor o menor dispersión de series
expresadas en diferentes unidades. Las principales medidas son:

 Rango o amplitud total


 Rango Intercuartil
 Varianza
 Desviación Estándar
 Coeficiente de Variación
Rango o Amplitud(R)
Llamado también Recorrido, se obtiene como la diferencia entre el valor máximo y el
valor mínimo:

𝑹 = 𝒙 𝒎á𝒙 −𝒙 𝒎í𝒏
Propiedades:

Es fácil de calcular y se expresa en las mismas unidades que la variable, aunque


presenta las sgtes desventajas:

• No utiliza todas las observaciones


• Puede verse afectada por alguna observación extrema.
Ejemplo 1
• El gerente de un centro comercial de venta de partes de computadora desea conocer el
promedio que ganó cada agente en la semana anterior, para tal fin seleccionó una muestra
de 25 agentes, a quienes se les preguntó por el monto (x). Los datos recolectados en soles
son:
Rango Intercuartil (𝑅 𝑄 )
Es la diferencia entre el tercer cuartil 𝑄3 y el primer cuartil 𝑄1. En otras palabras , el
rango intercuartil es la amplitud o rango del 50% central de los datos. Se calcula:

𝑹 𝑸 = 𝑸𝟑- 𝑸𝟏

Rango Semiintercuaartil o Desviación Rango Percentil 90 - 10


Cuartil
𝑄3 −𝑄 1 𝑅𝑃 = 𝑃90 −𝑃10
𝑄=
2
Ejemplo 2
Los sueldos mensuales iniciales (en dólares) de una muestra aleatoria de 12 egresados
de Ingeniería de una Universidad privada son los siguientes:
Egresado Sueldo Mensual Inicial

1 3450
2 3550
3 3650
4 3480
5 3355
6 3310
7 3490
8 3730
9 3540
10 3925
11 3520
12 3480
Desviación Estándar y Varianza
La desviación estándar es una medida de dispersión absoluta de un conjunto de datos, es un índice
que cuantifica la desviación promedio de los datos con respecto a su media aritmética. El valor de la
desviación estándar está expresado en las mismas unidades en que están expresados los datos.

La varianza es también una medida de dispersión de un conjunto de datos, al igual que la desviación estándar
mide el grado de dispersión de los datos con respecto a la media aritmética, a diferencia de la desviación
estándar, la varianza se expresa en unidades cuadradas. La varianza es el cuadrado de la desviación

estándar.
Para datos agrupados:

Para datos no agrupados:


σ𝑛𝑖=1 (𝑥 𝑖−𝑋ത)2 𝑖
𝑆=
𝑛−1
σ𝒏𝒊=𝟏 (𝒙𝒊−𝑿ഥ)𝟐
𝑺=
𝒏 −𝟏
σ𝒏𝒊=𝟏 𝒙𝟐𝒊 𝒇𝒊 − 𝒏𝒙ഥ𝟐
𝑺=
𝒏 −𝟏
Varianza (𝑆2)

Para datos no agrupados: Para datos agrupados:

σ 𝒏 (𝒙
𝒊= 𝟏 𝒊
σ𝑛𝑖=1 (𝑥𝑖 −𝑋ത)2𝑓𝑖
𝟐
𝑺 = −𝑿ഥ)𝟐 𝑆2 =
𝒏 −𝟏 𝑛 −1

σ𝒏𝒊=𝟏 𝒙𝟐𝒊 𝒇𝒊 −
𝑺𝟐 = 𝒏𝒙ഥ 𝟐
𝒏 −𝟏
Ejemplo 3

A continuación , presenta los tiempos de espera (en minutos) de 11 clientes para ser
atendidos en la ventanilla de un banco:

𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6 𝑥7 𝑥8 𝑥9 𝑥10 𝑥11
15 10 20 13 8 15 9 12 18 11 14
Ejemplo 4

Se ha tomado una muestra de 30 alumnos de la 𝒙𝒊 𝒇𝒊


0 1
Escuela de Ingeniería y se les ha preguntado por
1 2
el número de asignaturas desaprobadas (X) en el 2 4
semestre anterior. Los datos recolectados se 3 12
4 9
resumieron en la siguientes tabla. Calcular la 5 2
varianza. Total 30
Ejemplo 5
Con la finalidad de conocer la desviación Gasto 𝒇𝒊
estándar de los gastos semanales (en soles) del [200 – 400> 0
personal administrativo de una empresa [400 – 600> 1
[600 – 800> 4
constructora en Lima, en enero del 2019 se
[800 – 1000> 9
seleccionó una muestra de 30 personas. Los
[1000 – 1200> 16
datos resumidos se presentan en la siguiente
Total 30
tabla:
Ejemplo 6

• El gerente de un centro comercial de venta de partes de computadora desea conocer el


promedio que ganó cada agente en la semana anterior, para tal fin seleccionó una muestra
de 25 agentes, a quienes se les preguntó por el monto (x). Los datos recolectados en soles
son:
Coeficiente de Variación(CV)
𝑺
• El Coeficiente de variación es una medida de
𝑪𝑽 = ∗𝟏𝟎𝟎
dispersión relativa. 𝒙
• Expresa el grado de dispersión o variabilidad de ഥ
un conjunto de datos en términos relativos
A mayor valor del CV, mayor dispersión de los datos
El coeficiente de variación se usa para comparar
las variabilidades de dos conjuntos de datos de
una misma variable o variables diferentes.
Ejemplo 7

Con la finalidad de conocer la dispersión de los


Gasto 𝒇𝒊
gastos semanales (en soles) del personal [200 – 400> 0
administrativo de una empresa constructora en [400 – 600> 1
[600 – 800> 4
Lima, en enero del 2019 se seleccionó una
[800 – 1000> 9
muestra de 30 personas. Los datos resumidos se
[1000 – 1200> 16
presentan en la siguiente tabla:
Total 30
Medidas de Forma
EL COEFICIENTE DE ASIMETRÍA,𝑨𝒔.

Es una medida estadística o coeficiente que permite determinar si un conjunto de datos o su


distribución es simétrica o asimétrica.

Existen varios coeficientes para evaluar a simetría de una distribución, siendo el más importante el
que se calcula con la siguiente fórmula:
El valor del CA puede ser negativo, positivo o cero.

3(𝑥ҧ − 𝑚𝑒)
𝐴𝑠 =
𝑠
Interpretación del CA

Si 𝑨𝒔 = 𝟎, entonces la distribución es simétrica. En la práctica casi nunca se


obtiene un CAque sea igual a cero, por lo que valores cercanos a cero, sean
positivos o negativos nos permitirán concluir que la distribuciónes simétrica
Si 𝑨𝒔 > 𝟎, entonces la distribución presenta una asimetríapositiva.
Si 𝑨𝒔 < 𝟎, entonces la distribución presenta una asimetríanegativa.

Determinar si la distribución de la variable es simétrica o no.

As = 0,14, la distribución presenta una ligera asimetría positiva


Medida de concentración
EL COEFICIENTE DE CURTOSIS, K.

Esuna medida estadística o coeficiente que permite determinar el gradode


concentración o apuntamiento de un conjunto de datos o sudistribución.
Existen varios coeficientes para evaluar a simetría de una distribución, siendo el más
importante el que se calcula con la siguiente fórmula:

𝑄3 − 𝑄1
𝐾=
2(𝑃90 −𝑃10)

El valor del CCpuede ser negativo, positivo ocero.

Cálculo del Coeficiente de Curtosis con la función deEXCEL


Interpretación del CC
 Si 𝑲 = 𝟎, entonces la distribución es Mesocúrtica.
 En la práctica casi nunca se obtiene un CCque sea igual a cero, por lo que valores cercanos a cero, sean positivos o negativosnos
permitirán concluir que la distribución esMesocúrtica
 Si 𝑲 > 𝟎, entonces la distribución es leptocúrtica, (elevada concentración).
 Si K<0, entonces la distribución es platicúrtica, (baja concentración)

Ejemplo. Analizar el grado de concentración o apuntamiento de la distribución de la variable Edad de los estudiantes de Ingeniería.

K = -1,02, este valor negativo indica que la distribución de las edades esplaticúrtica.
Diagrama Caja
Existe Una gran variedad de gráficas estadísticas para extraer información acerca de las
propiedades de un conjunto de datos.
Una gráfica útil para reflejar propiedades de los datos es la gráfica de caja (“box plots”) que
se basa en la mediana (o en la media), los cuartiles y valores extremos. La caja representa
el rango intercuartil que encierra el 50% de los valores y tiene la mediana (Me) dibujada
dentro. El rango intercuartil tiene como extremos el percentil 75, (cuartil superior) y el
percentil 25, (cuartil inferior).
Además de la caja se incluye la extensión de los datos mediante segmentos que se
extienden de la caja hacia el valor máximo (U) y hacia el valor mínimo (L) de los datos.
Este recuadro se dibuja con el eje de la variable en forma horizontal o vertical como se
indica en la figura que sigue.
Deungráficodecajas, seobtieneinformacióndelosdatosacercade:
Lacentralización (Observandola ubicacióndelamediana)
Ladispersiónovariabilidad(medianteel rangointercuartil: RIP75P25)
Laasimetría (comparando: MeP25 con P75Me)
Lascolas(porla longituddelossegmentosquesalendelosladosdelacaja)
Referencias Bibliográficas
• AFONSOP.(2002) Probabilidad y Estadística: conceptos, modelos, aplicaciones
en Excel. Bogotá D.F. PearsonEducación.
• DEVORE,J. (1998). Probabilidad y estadística para ingeniería y ciencias.
México. International Thomson Editores.
• MENDENHALLW., TERRYS. (1997). Probabilidad y estadística para ingeniería y
ciencias. México. Prentice Hall Hispanoamericana.
• WALPOLER., MYERSR., MYERS.S. (1999). Probabilidad y estadística para
ingenieros. México. Prentice Hall Hispanoamericana.
• DOUGLASMONTGOMERY: “Probabilidad y Estadística y Probabilidades a la
Ingeniería" Ed. McGraw-Hill Interamericana Editores S.A. Impreso en México
1996
• ROSS,SHELDON.(2001) Probabilidad y Estadística para Ingeniería. México,
D.F.: McGraw-Hill.

También podría gustarte