Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Guia Practica 4 Statgraphics
Guia Practica 4 Statgraphics
PRÁCTICA 4. ANÁLISIS
EXPLORATORIO DE DATOS
pág. 2
Representación gráfica y numérica de distribuciones multivariantes
pág. 3
Representación gráfica y numérica de distribuciones multivariantes
pág. 4
Representación gráfica y numérica de distribuciones multivariantes
pág. 5
Representación gráfica y numérica de distribuciones multivariantes
ya podemos contestar a la pregunta 1. a), basta con mirar en las dos tablas de
las salidas. En la tabla: “Resumen Estadístico para Población” podemos ver que
la media es: 2.450.470 habitantes. Para calcular el valor de los cuartiles , =
y , que corresponden con el , y , respectivamente, basta con mirar
los valores que nos proporciona la tabla: “Percentiles para Población”, en ella
podemos ver: = 983.131, = 1.615.230 y = 2.762.200 habitantes.
Para contestar a la pregunta 2. b), tenemos que observar el diagrama de cajas y
bigotes y ver los valores que exceden tanto por encima, como por debajo del
límite de los bigotes, en nuestra variable “Población” tenemos tres valores
anómalos (atípicos), que serían los valores: 5.964.143 (Madrid), 6.995.206
(Cataluña) y 7.849.799 (Andalucía). Estos valores los obtenemos haciendo clic
sobre el punto del diagrama de cajas y bigotes en las mismas salidas del
Statgraphics.
Para comprobar si alguno de esos valores atípicos, es extremo tenemos que
proceder de la forma: Describir/Datos Numéricos/Identificación de Valores
Atípicos…
pág. 6
Representación gráfica y numérica de distribuciones multivariantes
pág. 7
Representación gráfica y numérica de distribuciones multivariantes
los valores que estén fuera del intervalo (-3, 3), que corresponden con las líneas
de color amarillas de ese gráfico son valores extremos. Por lo tanto, en nuestro
caso, no tenemos ningún valor extremo, los tres valores atípicos que muestra el
diagrama de cajas y bigotes son anómalos.
Para contestar al apartado 1. c), basta con volver a las salidas y ver que el
diagrama de cajas y bigotes está más concentrado en la parte izquierda de la
caja, alargándose el bigote superior mucho más que el inferior, además la
mediana = 1.615.230, es mucho menor que la media = 2.450.470, esto nos indica
asimetría a la derecha o positiva. Esto también podemos comprobarlo en la tabla
de Resumen Estadístico para Población, en la opción Sesgo = 1,32956, nos
muestra el valor del coeficiente de asimetría, si este coeficiente es mayor que 1
(como es nuestro caso) esto nos indica asimetría a la derecha.
pág. 8
Representación gráfica y numérica de distribuciones multivariantes
pág. 9
Representación gráfica y numérica de distribuciones multivariantes
Para contestar a la pregunta 2. a), basta con observar los rangos intercuartílicos
(diferencias entre los − ) de las cajas en cada caso, y ver que para la
codificación “bajo” tenemos un rango intercuartílico mucho más grande que para
las demás, por lo tanto, para el nivel bajo hay una mayor dispersión en la variable.
Para contestar a la pregunta 2. b), basta con ver cual de las tres cajas es la que
presenta unos menores valores de Población, que en este caso es el nivel medio.
pág. 10
Representación gráfica y numérica de distribuciones multivariantes
pág. 11
Representación gráfica y numérica de distribuciones multivariantes
Para contestar a la pregunta 3. a), sólo con la información que obtenemos del
diagrama de tallos y hojas, no podemos probar la existencia de valores atípicos,
tanto anómalos como extremos.
Para contestar a la pregunta 3. b), podemos ver claramente que la distribución
es asimétrica a la derecha, ya que la mayoría de las frecuencias se concentran
en los valores más bajos de las modalidades. La columna de la izquierda del todo
contiene los recuentos acumulados desde el inicio y desde el final de la tabla,
deteniéndose en el renglón que contiene a la mediana que es el 2.
pág. 12
Representación gráfica y numérica de distribuciones multivariantes
pág. 13
Representación gráfica y numérica de distribuciones multivariantes
pág. 14
Representación gráfica y numérica de distribuciones multivariantes
Sobre la tabla Resumen anterior, clic botón derecho del ratón, en Opciones de
Ventana y marcamos Sigma Winsorizada…
pág. 15
Representación gráfica y numérica de distribuciones multivariantes
pág. 16
Representación gráfica y numérica de distribuciones multivariantes
pág. 17
Representación gráfica y numérica de distribuciones multivariantes
nos vamos sobre el gráfico y hacemos clic con el botón derecho del ratón, se nos
abre el cuadro y en Opciones de Análisis:
pág. 18
Representación gráfica y numérica de distribuciones multivariantes
pág. 19
Representación gráfica y numérica de distribuciones multivariantes
pág. 20
Representación gráfica y numérica de distribuciones multivariantes
Y la de Tukey:
pág. 21