Está en la página 1de 20

ITESM - Campus San Luis

Estadística I: Medidas de dispersión


Dr. Rigoberto Chavira Quintero
Febrero de 2020
Dispersión
● La media, la mediana y la moda sólo nos revelan una parte de
la información que debemos conocer acerca de las
características de los datos, para aumentar nuestro
entendimiento del patrón de los datos, debemos medir también
su dispersión, separación o variabilidad.

ITESM - Dr. Rigoberto Chavira 2


Importancia de la dispersión
● Las ganancias ampliamente dispersas —que van
desde extremadamente altas a extremadamente
bajas e incluso a niveles negativos— son indicativas
de un riesgo mayor para los accionistas y para los
acreedores que las ganancias que permanecen
relativamente estables.
● Los expertos en el control de la calidad analizan la
dispersión de los niveles de calidad de un producto.
● Una medicina cuya pureza promedio es buena, pero
que oscila desde muy pura hasta muy impura puede
ser peligrosa para la vida humana.
ITESM - Dr. Rigoberto Chavira 3
Medidas de desviación
promedio
● Son aquellas que manejan la desviación
promedio respecto a alguna medida de
tendencia central.
● La varianza de una población, es la suma de
los cuadrados de las distancias entre la media
y cada elemento de la población, dividida entre
el número total de observaciones en población.

ITESM - Dr. Rigoberto Chavira 4


Desviación estándar
● La desviación estándar es la raíz cuadrada del
promedio de los cuadrados de las distancias
entre las observaciones y la media.

● La desviación estándar nos permite determinar,


con un buen grado de precisión, dónde están
localizados los valores de una distribución de
frecuencias con relación a la media.

ITESM - Dr. Rigoberto Chavira 5


Por ejemplo:
Si tenemos una población de 15 frascos de compuesto
producido en un día y probamos cada frasco para
determinar la pureza del compuesto:
● Determinar la media para la población.
● Determinar la varianza.
● Determinar la desviación estándar.

ITESM - Dr. Rigoberto Chavira 6


Para datos agrupados
● Las fórmulas previas requieren conocer los
datos sin procesar, pero si la información está
en una tabla.

ITESM - Dr. Rigoberto Chavira 7


Y para una muestra:
● Para calcular la varianza y la desviación
estándar de una muestra, utilizamos las
mismas fórmulas

ITESM - Dr. Rigoberto Chavira 8


Ejemplo:
● Los siguientes datos son una muestra de la tasa de
producción diaria de botes de fibra de vidrio de la
Hydrosport, Ltd., un fabricante de Miami:

17 21 18 27 17 21 20 22 18 23

El gerente de producción de la compañía siente que


una desviación estándar de más de tres botes por día
indica variaciones de tasas de producción
inaceptables. ¿Deberá preocuparse por las tasas de
producción de la planta?
ITESM - Dr. Rigoberto Chavira 9
Ejemplo:
El administrador de un hospital de Georgia investigó el número
de días que 200 pacientes, elegidos al azar, se quedan en el
hospital después de una operación. Los datos son:

● a) Calcule la desviación estándar y la media.


● b) De acuerdo con el teorema de Chebyshev, ¿cuántas
estancias habrá entre 0 y 17 días? ¿Cuántas hayrealmente en
ese intervalo?
● c) Debido a que la distribución tiene aproximadamente forma
de campana, ¿cuántas estancias entre 0 y
17 días pueden esperarse?
ITESM - Dr. Rigoberto Chavira 10
Coeficiente de variación
● La desviación estándar no puede ser la única
base para la comparación de dos
distribuciones.
● Lo que necesitamos es una medida relativa
que nos proporcione una estimación de la
magnitud de la desviación respecto a la
magnitud de la media. Una de ella es el
coeficiente de variación.

ITESM - Dr. Rigoberto Chavira 11


Ejemplo:

Existe cierto número de medidas posibles del desempeño de
ventas, incluyendo qué tan coherente es un vendedor en el logro de
los objetivos de ventas establecidos. Los datos que presentamos a
continuación son un registro del porcentaje de los objetivos
logrados por tres vendedores durante los 5 años pasados.


a) ¿Cuál vendedor es más coherente?

b) Comente sobre lo adecuado de utilizar una medida coherente
junto con porcentajes de objetivos de ventas logrados para evaluar
el desempeño de ventas.
● c) ¿Puede usted sugerir una medida alternativa más apropiada de
consistencia?

ITESM - Dr. Rigoberto Chavira 12


El teorema de Chebyshev
● Aproximadamente 68% de los valores de la
población cae dentro de ±1 desviación estándar
a partir de la media.
● Aproximadamente 95% de los valores estará
dentro de ±2 desviaciones estándar a partir de
la media.
● Aproximadamente 99% de los valores estará en
el intervalo que va desde 3 desviaciones
estándar a la izquierda de la media hasta 3
desviaciones estándar a la derecha de la media.
ITESM - Dr. Rigoberto Chavira 13
El teorema de Chebyshev
● Independientemente de la forma de la distribución

ITESM - Dr. Rigoberto Chavira 14


Problema 1 – Actividad 1
● Calcular media, moda y mediana para los
siguientes datos agrupados.
● Calcular s² y s (varianza muestral y desviación
estándar muestral).

ITESM - Dr. Rigoberto Chavira 15


Representación gráfica
● Histograma de la distribuación de
frecuencias anterios.

Distrbción de frecuencias Problema 1


edades
16

14

12

10

0
41.9 50.7 59.5 68.3 77.1 85.9 94.7

ITESM - Dr. Rigoberto Chavira 16


Problema 2-Actividad 3
● Las edades de los 20 hombres que se entrevistaron primero
son:
50 54 56 55 55 61 49 60 52 51
57 59 56 62 57 52 56 54 59 49

ITESM - Dr. Rigoberto Chavira 17


Gráfica de caja
Se grafica el Vmín, Q1, Q2=mediana, Q3, Vmáx.


49 49 50 51 52 52 54 54 55 55 56 56 56 57 57 59 59 60 61 62

ITESM - Dr. Rigoberto Chavira 18


Pulsos
● Valores atípico: valores que se encuentran a
mas de 1.5fs del cuarto mas cercano.

fs=6.5

ITESM - Dr. Rigoberto Chavira 19


Medidas de Posición
● Cuartiles:
Q1, Q2, Q3.

● Deciles:
P1, P2, P3, P4, P5, P6, P7, P8, P9.

● Percentiles:
P1, P2, P3, . . . , P98, P99.
ITESM - Dr. Rigoberto Chavira 20

También podría gustarte