Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ejemplo:
El gerente de una empresa de alimentos desea saber que tanto varan los pesos de
los empaques (en gramos), de uno de sus productos; por lo que opta por
seleccionar al azar cinco unidades de ellos para pesarlos. Los productos tienen los
siguientes pesos (490, 500, 510, 515 y 520) gramos respectivamente.
Por lo que su media es:
Utilidad:
* Estimar ndices de consumo,
* Controlar la variabilidad en presupuestos, comercializaciones, productos,
en las ventas, etc.
* Estimar si un estudiante alcance o no, la nota de promocin
* Controlar que los productos no estn fuera de la fecha de vencimiento
* Dar proyecciones sobre quin asumir el prximo gobierno
No hay una regla para identificar a los outliers. Pero algunos libros refieren un
valor como un outlier si este es mayor que 1.5 veces el valor del
rango intercuartil ms alla de los cuartiles.
Tambin graficando los datos en una recta numrica como una grfica de
puntos, nos ayuda a identificar a los outliers.
Ejemplo 1:
Encuentre los outliers del conjunto de datos. Tambin encuentre la media del
conjunto de datos incluyendo los outliers y excluyendo los outliers.
15, 75, 20, 35, 25, 85, 30, 30, 15, 25, 30
15, 15, 20, 25, 25, 30, 30, 30, 35, 75, 85
Grafique los datos en una recta numrica como una grfica de puntos.
Los valores 75 y 85 estn muy lejos del centro. As, estos dos valores son
outliers para el conjunto de datos dado.
Prueba de Dixon: Utiliza relaciones de las diferencias entre datos que parecen
atpicos comparados con los valores del grupo de datos.
Ejemplo 2:
Rechazo de datos:
Este valor se compara con un valor crtico de una tabla, y el valor se declara valor
atpico si supera ese valor crtico.
Si Dcalculado>Dtabulado se rechaza el dato
El valor tabulado depende del tamao de la muestra, n, y de un nivel de confianza
elegido, que es el riesgo de rechazar una observacin vlida. La tabla por lo general
utiliza niveles de baja confianza tal como 1% o 5%.
Para un n = 10 y un riesgo del 5%, el valor en la tabla es 0.50. El ndice de Dixon 0.68
excede este valor crtico, indicando que el valor 200 es un valor atpico.
4. INTER-CUARTILES
Se define como la diferencia entre el tercer cuartil (Q3) y el primer cuartil (Q1), es
decir: IQR = Q3 - Q1. A la mitad del rango inter-cuartil se le conoce como desviacin
cuartil (DQ), es afectada muy poco por cuentas extremas. Esto lo hace una buena
medida de dispersin para distribuciones sesgadas: DQ = IQR/2= (Q3 - Q1)/2.
UTILIDAD
Sirve para ubicar datos particulares dentro de ciertas porciones de una distribucin de
datos.
Importancia
El rango inter-cuartil es un mtodo estadstico para incrementar el grado de confianza
en un anlisis especfico.
5.