Está en la página 1de 21

2022- II

FUNDAMENTOS DE ESTADÍSTICA
Docente: C.P.C. Jhon Andre Quicaña Mamani
ANALISIS EXPLORATORIO DE DATOS
Sesión 11
OBJETIVOS • Identificar y diferenciar los conceptos y
metodologías relacionadas al análisis
Sesión 11 exploratorio de datos.
• Aplicar técnicas asociadas al análisis
exploratorio de datos.
CONTENIDOS
Sesión 11

1. Resumen de 5 números
2. Diagrama de caja
3. Aplicación en SPSS
01
Resumen de 5 números
Resumen de 5 números

Valor menor

Primer Cuartil (𝑄1 )

Mediana (𝑄2 )

Tercer Cuartil (𝑄3 )

Valor mayor

6
Resumen de 5 números
Ejemplo:
Los sueldos mensuales para la muestra de 12 licenciados en
administración de empresas recién egresados se representan aquí
en orden ascendente.

3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3730 3925

𝑉𝑚 = Q1 = Q2 = Q3 = 𝑉𝑀 =

Mediana

4
02
Diagrama de caja
Diagrama de caja

Un diagrama de caja es un resumen


gráfico de los datos basado en un
resumen de cinco números.

Nos permiten identificar la distribución y


la dispersión de los datos de una
variable de escala.

Diagrama de caja

5
Diagrama de caja
Ejemplo:
Para comparar los sueldos mensuales iniciales de los licenciados en
administración de empresas por área de especialización, se seleccionó una
muestra de 111 licenciados recién graduados.

6
Diagrama de caja
¿Qué observaciones puede hacer acerca de los sueldos iniciales por área de
especialización usando los diagramas de caja?
En específico se observa lo siguiente:

Los sueldos más altos corresponden a contabilidad y sistemas de información; los sueldos más bajos
corresponden a administración y marketing.

Con base en las medianas, la de los sueldos de contabilidad y sistemas de información es similar y
mayor. Le sigue finanzas, marketing y administración que muestran sueldos con una mediana inferior.

Existen observaciones atípicas de sueldos altos para las áreas de contabilidad, finanzas y marketing.

Los sueldos en el área de finanzas parecen tener menos variación, mientras que en contabilidad parecen
tener la mayor variación.

7
03
Aplicación en SPSS
Crear una variable:
- Colocar un nombre a la
variable
- Tipo de dato
- Ancho y numero de
decimales
- Etiqueta
- Medida
Crear el diagrama de caja
Se debe ingresar los
datos en la columna de la
variable.
Para crear el diagrama de
caja realizar lo siguiente:
- Analizar/Estadísticos
descriptivos/Explorar
Crear el diagrama de caja
- Seleccionar la variable y colocarlo en
la lista de dependientes

- En Estadísticos, seleccionar los


siguientes opciones (Figura 2)
Crear el diagrama de caja
- En Gráficos, seleccionar los siguientes opciones
- Hacer clic en “Aceptar”
Diagrama de caja
- Existe un valor atípico que se
encuentra en la observación 1
- El 50% de los datos son
homogéneos
- No existe mucha dispersión
en el 50% de los datos.
Crear un diagrama de caja conjunta
Colocar una segunda variable en la
Lista de factores.

Con los mismas configuraciones


hacer clic en aceptar.
Diagrama de caja conjunta
- Existen observaciones atípicas
de los años estudiados para
los dos géneros.

- Con base en las medianas, los


años estudiados en los dos
géneros son similares.

- La variabilidad en el genero
Masculino es mayor con
respecto al Femenino.
Resumen
• El resumen de los 5 números sirven para realizar el diagrama de
caja que describe la distribución y dispersión de los datos.
Muchas Gracias

Docente: C.P.C. Jhon Andre Quicaña M.


Jquicana@neumann.edu.pe

También podría gustarte