Está en la página 1de 8

DATOS ATIPICOS EN EXCEL

Un valor atípico es una observación que se encuentra anormalmente


alejada de otros valores en un conjunto de datos. Los valores atípicos
pueden ser problemáticos porque pueden afectar los resultados de un
análisis.
Usaremos el siguiente conjunto de datos en Excel para ilustrar dos métodos
para encontrar valores atípicos:
Método 1: utilice el rango intercuartílico
El rango Inter cuartil (IQR) es la diferencia entre el percentil 75 (Q3) y el
percentil 25 (Q1) en un conjunto de datos. Mide la propagación del 50%
medio de los valores.
Podemos definir una observación como un valor atípico si es 1,5 veces el
rango Inter cuartil mayor que el tercer cuartil (Q3) o 1,5 veces el rango Inter
cuartil menor que el primer cuartil (Q1).
A continuación, podemos usar la fórmula mencionada anteriormente para
asignar un «1» a cualquier valor que sea un valor atípico en el conjunto de
datos:
Método 2: utilizar puntuaciones z
Un puntaje z le dice cuántas desviaciones estándar tiene un valor dado de
la media. Usamos la siguiente fórmula para calcular una puntuación z:
z = (X – μ) / σ
dónde:

• X es un único valor de datos sin procesar


• μ es la media de la población
• σ es la desviación estándar de la población

Podemos definir una observación como un valor atípico si tiene una


puntuación z menor que -3 o mayor que 3.

La siguiente imagen muestra cómo calcular la desviación estándar y media


de un conjunto de datos en Excel:
Luego, podemos usar la media y la desviación estándar para encontrar el
puntaje z para cada valor individual en el conjunto de datos:
Luego, podemos asignar un «1» a cualquier valor que tenga una
puntuación z menor que -3 o mayor que 3:
Con este método, vemos que no hay valores atípicos en el conjunto de
datos.

Nota: A veces se usa una puntuación z de 2.5 en lugar de 3. En este caso,


el valor individual de 164 se consideraría un valor atípico ya que tiene una
puntuación z mayor que 2.5. Cuando utilice el método de puntuación z,
utilice su mejor criterio para determinar qué valor de puntuación z
considera que es un valor atípico.
Cómo manejar valores atípicos
Si hay un valor atípico en sus datos, tiene algunas opciones:

1. Asegúrese de que el valor atípico no sea el resultado de un error de


entrada de datos.
A veces, una persona simplemente ingresa el valor de datos incorrecto al
registrar datos. Si hay un valor atípico, primero verifique que el valor se
ingresó correctamente y que no fue un error.

2. Elimine el valor atípico.


Si el valor es un valor atípico verdadero, puede optar por eliminarlo si
tendrá un impacto significativo en su análisis general. Solo asegúrese de
mencionar en su informe o análisis final que eliminó un valor atípico.

3. Asigne un nuevo valor al valor atípico.


Si el valor atípico es el resultado de un error de entrada de datos, puede
decidir asignarle un nuevo valor, como la media o la mediana del conjunto
de datos.

También podría gustarte