Documentos de Académico
Documentos de Profesional
Documentos de Cultura
SEMESTRE 2015-II
PARCIAL 1
JUEVES, 20 DE AGOSTO DE 2015
Nombre:___________________________________________________________________________
Sección:___________________
No se puede consultar ningún tipo de documentación. Sin calculadora
1. (3 puntos) ¿Cuáles de las siguientes afirmaciones sobre el box-plot de la figura son ciertas y cuáles
son falsas? Justifica la respuesta. (Nota: el símbolo + en el interior de la caja es la media muestral).
SOLUCIÓN:
a. FALSO. La asimetría que sugiere es positiva, pues la distancia entre los cuartiles Q2 y Q3, y el
máximo son mayores que entre el mínimo, Q1 y Q2. Por tanto, los valores más altos están
más distantes. Un histograma, por tanto, tendrá rectángulos cada vez más bajos a medida
que aumenta el valor de la variable, lo que formará una cola a la derecha.
c. FALSO. Los datos atípicos, según el criterio empleado en la construcción del box-plot son los
que están a más de 1.5 rangos intercuartílicos (ancho de la caja) de Q1 o Q3. En este box-
plot no hay datos tan alejados. Los puntos aislados de la izquierda no están tan alejados.
Han sido marcados como atípicos erróneamente.
d. CIERTA. El box-plot está mal construido. Los puntos aislados de la izquierda están
erróneamente separados del ‘bigote’ de la caja. Para estar separados del bigote deberían
estar al menos a 1.5 rangos intercuartílicos de Q1, y eso no es cierto como puede
desprenderse del ancho de la caja. Además, la distribución que sugiere el box-plot es de una
distribución con asimetría positiva. En ese caso, la media debería estar a la izquierda de la
mediana. Sin embargo, el dibujo muestra lo contrario, lo que sugiere que la media está
también mal posicionada.
1
2. (3 puntos) ¿Cuáles de las siguientes afirmaciones sobre el box-plot de la figura son ciertas y cuáles
son falsas? Justifica la respuesta. (Nota: el símbolo + en el interior de la caja es la media muestral).
a. La mediana es 43.
b. El máximo dato es 10 unidades mayor que el mínimo.
c. El rango intercuartílico es 5.
d. Sólo el 25% de los datos es mayor que 44.
e. El Coeficiente de Asimetría de Pearson es 0.
SOLUCIÓN:
3. (2 puntos) Cuando en los datos hay valores muy extremos, ¿cuál de los siguientes pares de medidas
descriptivas de localización y dispersión, respectivamente, no se verán afectadas? Justifica la
respuesta.
a. La media y la desviación típica.
b. La mediana y el rango intercuartílico.
c. Moda y CV.
SOLUCIÓN:
a. FALSO. Tanto la media como la desviación típica se basan en sumas, por lo que valores muy
anómalos tendrán mucha influencia en estas cantidades.
b. CIERTO. Ambas cantidades se basan en el orden de los datos, y no en sus valores. Los valores
de los datos en los extremos no alterará estas cantidades. La mediana será una medida de
localización ‘robusta’ y el rango intercuartílico’ será una medida de dispersión también
‘robusta’.
c. FALSO. La moda (intervalo modal) no se verá alterada por valores extremos, pero el CV sí,
por estar basado en la desviación típica y en la media (ver respuesta a.)
2
4. (3 puntos) La siguiente figura muestra un conjunto desordenado de histogramas y box-plots. Asocia
cada histograma a su respectivo box-plot. No necesitas justificar. Contesta en el cuadernillo.
SOLUCIÓN:
3
5. (3 puntos) Justifica brevemente si son ciertas o falsas cada una de las siguientes cuestiones: Si a un
conjunto de datos le quitamos los datos correspondientes al máximo y al mínimo…
a. La media no cambia.
b. La mediana no cambia.
c. El rango no cambia.
d. La varianza disminuye.
e. El rango intercuartílico disminuye.
SOLUCIÓN:
a. FALSO. Si eliminamos datos la media tenderá a cambiar, pues será el centro de gravedad de
los datos restantes. Sólo en algún caso muy particular de distribución perfectamente
simétrica la media no cambiaría.
b. CIERTO. La mediana no cambiará, pues es el valor que deja el 50% de los datos a cada lado.
Se basa en la posición de los datos. Si quitamos el dato más bajo y el más alto, el valor en la
posición central será el mismo.
c. FALSO. El rango es la distancia entre los valores mínimo y máximo. Si se eliminan, los nuevos
mínimo y máximo estarán más cercanos (salvo el caso muy particular de que haya
observaciones repetidas), por lo que el rango tenderá a disminuir.
d. CIERTO. Si quitamos los valores más alejados del resto de los datos, éstos estarán más
concentrados alrededor de su propia media muestral, por lo que la desviación típica tenderá
a disminuir.
e. CIERTO. En general, y salvo el caso particular de que haya muchas observaciones repetidas,
el RI disminuirá. Al basarse en la posición de los datos, los nuevos valores Q1 y Q3 que
resulten al eliminar el mínimo y el máximo cambiarán, tenderán a acercarse a la mediana
haciendo disminuir el RI.
4
6. (3 puntos) A partir de los siguientes resultados proporcionados por Minitab, haz un resumen
estadístico de la variable VAR destacando los aspectos más importantes.
Histograma de VAR
40
30
Frecuencia
20
10
0
4 6 8 10 12
VAR
SOLUCIÓN:
El histograma muestra una distribución unimodal, con moda en torno a 10, con valores entre,
aproximadamente, 7 y 12.7, bastante simétrica y con un valor atípico en 4.1. Este valor es
claramente atípico, al alejarse del patrón que forma el resto de los datos. Este dato está muy
distante por lo que va a distorsionar el valor de muchas medidas características que aparecen en el
enunciado. Por ejemplo, el coeficiente de asimetría resulta ser -0.71, lo que sugeriría asimetría
negativa. Esta concusión sería errónea, pues los datos son claramente simétricos alrededor del 10.
Los valores de media, varianza y kurtosis tampoco son fiables. Habría que eliminar ese dato y
recalcular las medidas características.
(NOTA: Habría que investigar cómo se ha obtenido ese dato, si es un error de transcripción o que el
proceso genera de forma ocasional este tipo de valor distante. En este caso, habría que analizar las
causas)
5
7. (3 puntos) La siguiente figura se ha construido con las calificaciones de un examen para dos grupos
de alumnos diferentes. ¿En qué grupo te gustaría haber realizado el examen? Justifica tu respuesta.
Calificaciones examen
Grupo
100 A
B
80
Porcentaje acumulado
60
40
20
0
6 8 10 12 14 16 18
Calificaciones
SOLUCIÓN: