Está en la página 1de 6

ESTADÍSTICA BÁSICA

SEMESTRE 2015-II
PARCIAL 1
JUEVES, 20 DE AGOSTO DE 2015

Nombre:___________________________________________________________________________
Sección:___________________
No se puede consultar ningún tipo de documentación. Sin calculadora

1. (3 puntos) ¿Cuáles de las siguientes afirmaciones sobre el box-plot de la figura son ciertas y cuáles
son falsas? Justifica la respuesta. (Nota: el símbolo + en el interior de la caja es la media muestral).

a. Los datos sugieren tener asimetría negativa.


b. Hay más datos a la derecha de la mediana que a la izquierda.
c. Hay claramente datos atípicos.
d. Como la media no es igual a la mediana, la distribución tendrá kurtosis elevada.
e. El box-plot está mal calculado.

SOLUCIÓN:

a. FALSO. La asimetría que sugiere es positiva, pues la distancia entre los cuartiles Q2 y Q3, y el
máximo son mayores que entre el mínimo, Q1 y Q2. Por tanto, los valores más altos están
más distantes. Un histograma, por tanto, tendrá rectángulos cada vez más bajos a medida
que aumenta el valor de la variable, lo que formará una cola a la derecha.

b. FALSO. A cada lado de la mediana siempre estará el 50% de los datos.

c. FALSO. Los datos atípicos, según el criterio empleado en la construcción del box-plot son los
que están a más de 1.5 rangos intercuartílicos (ancho de la caja) de Q1 o Q3. En este box-
plot no hay datos tan alejados. Los puntos aislados de la izquierda no están tan alejados.
Han sido marcados como atípicos erróneamente.

d. CIERTA. El box-plot está mal construido. Los puntos aislados de la izquierda están
erróneamente separados del ‘bigote’ de la caja. Para estar separados del bigote deberían
estar al menos a 1.5 rangos intercuartílicos de Q1, y eso no es cierto como puede
desprenderse del ancho de la caja. Además, la distribución que sugiere el box-plot es de una
distribución con asimetría positiva. En ese caso, la media debería estar a la izquierda de la
mediana. Sin embargo, el dibujo muestra lo contrario, lo que sugiere que la media está
también mal posicionada.

1
2. (3 puntos) ¿Cuáles de las siguientes afirmaciones sobre el box-plot de la figura son ciertas y cuáles
son falsas? Justifica la respuesta. (Nota: el símbolo + en el interior de la caja es la media muestral).

a. La mediana es 43.
b. El máximo dato es 10 unidades mayor que el mínimo.
c. El rango intercuartílico es 5.
d. Sólo el 25% de los datos es mayor que 44.
e. El Coeficiente de Asimetría de Pearson es 0.

SOLUCIÓN:

a. FALSO. La mediana es 42.


b. CIERTO. El rango es distancia entre ambos extremos de este box-plot.
c. CIERTO. Es RI el ancho de la caja.
d. FALSO. El 25% de datos de valor más alto vienen delimitados por Q3, que es 43.
e. FALSO. El coeficiente de asimetría de Pearson se basa en la distancia entre la media y la
mediana. Será cero si ambas coinciden, lo que no sucede en estos datos.

3. (2 puntos) Cuando en los datos hay valores muy extremos, ¿cuál de los siguientes pares de medidas
descriptivas de localización y dispersión, respectivamente, no se verán afectadas? Justifica la
respuesta.
a. La media y la desviación típica.
b. La mediana y el rango intercuartílico.
c. Moda y CV.

SOLUCIÓN:

a. FALSO. Tanto la media como la desviación típica se basan en sumas, por lo que valores muy
anómalos tendrán mucha influencia en estas cantidades.
b. CIERTO. Ambas cantidades se basan en el orden de los datos, y no en sus valores. Los valores
de los datos en los extremos no alterará estas cantidades. La mediana será una medida de
localización ‘robusta’ y el rango intercuartílico’ será una medida de dispersión también
‘robusta’.
c. FALSO. La moda (intervalo modal) no se verá alterada por valores extremos, pero el CV sí,
por estar basado en la desviación típica y en la media (ver respuesta a.)

2
4. (3 puntos) La siguiente figura muestra un conjunto desordenado de histogramas y box-plots. Asocia
cada histograma a su respectivo box-plot. No necesitas justificar. Contesta en el cuadernillo.

SOLUCIÓN:

(1)--(e); (2)-(d); (3)-(b); (4)-(a); (5) -(c)

3
5. (3 puntos) Justifica brevemente si son ciertas o falsas cada una de las siguientes cuestiones: Si a un
conjunto de datos le quitamos los datos correspondientes al máximo y al mínimo…
a. La media no cambia.
b. La mediana no cambia.
c. El rango no cambia.
d. La varianza disminuye.
e. El rango intercuartílico disminuye.

SOLUCIÓN:

a. FALSO. Si eliminamos datos la media tenderá a cambiar, pues será el centro de gravedad de
los datos restantes. Sólo en algún caso muy particular de distribución perfectamente
simétrica la media no cambiaría.

b. CIERTO. La mediana no cambiará, pues es el valor que deja el 50% de los datos a cada lado.
Se basa en la posición de los datos. Si quitamos el dato más bajo y el más alto, el valor en la
posición central será el mismo.

c. FALSO. El rango es la distancia entre los valores mínimo y máximo. Si se eliminan, los nuevos
mínimo y máximo estarán más cercanos (salvo el caso muy particular de que haya
observaciones repetidas), por lo que el rango tenderá a disminuir.

d. CIERTO. Si quitamos los valores más alejados del resto de los datos, éstos estarán más
concentrados alrededor de su propia media muestral, por lo que la desviación típica tenderá
a disminuir.

e. CIERTO. En general, y salvo el caso particular de que haya muchas observaciones repetidas,
el RI disminuirá. Al basarse en la posición de los datos, los nuevos valores Q1 y Q3 que
resulten al eliminar el mínimo y el máximo cambiarán, tenderán a acercarse a la mediana
haciendo disminuir el RI.

4
6. (3 puntos) A partir de los siguientes resultados proporcionados por Minitab, haz un resumen
estadístico de la variable VAR destacando los aspectos más importantes.

Histograma de VAR
40

30
Frecuencia

20

10

0
4 6 8 10 12
VAR

SOLUCIÓN:

El histograma muestra una distribución unimodal, con moda en torno a 10, con valores entre,
aproximadamente, 7 y 12.7, bastante simétrica y con un valor atípico en 4.1. Este valor es
claramente atípico, al alejarse del patrón que forma el resto de los datos. Este dato está muy
distante por lo que va a distorsionar el valor de muchas medidas características que aparecen en el
enunciado. Por ejemplo, el coeficiente de asimetría resulta ser -0.71, lo que sugeriría asimetría
negativa. Esta concusión sería errónea, pues los datos son claramente simétricos alrededor del 10.
Los valores de media, varianza y kurtosis tampoco son fiables. Habría que eliminar ese dato y
recalcular las medidas características.

(NOTA: Habría que investigar cómo se ha obtenido ese dato, si es un error de transcripción o que el
proceso genera de forma ocasional este tipo de valor distante. En este caso, habría que analizar las
causas)

5
7. (3 puntos) La siguiente figura se ha construido con las calificaciones de un examen para dos grupos
de alumnos diferentes. ¿En qué grupo te gustaría haber realizado el examen? Justifica tu respuesta.

Calificaciones examen
Grupo
100 A
B

80
Porcentaje acumulado

60

40

20

0
6 8 10 12 14 16 18
Calificaciones

SOLUCIÓN:

La figura corresponde a un polígono de frecuencias relativas acumuladas (ojiva). Es preferible el


Grupo B, pues es el que tiene una mayor probabilidad de obtener valores superiores al 10 (la ojiva
señala menores probabilidades de obtener valores menores o iguales a 10). A partir de la
calificación 10, el grupo B es también preferible. Su polígono de frecuencias relativas acumuladas es
consistentemente más baja que en el grupo A. Por tanto, para una misma calificación, el Grupo A
tiene una mayor proporción de estudiantes por debajo de esa nota y, por tanto, una menor
proporción de estudiantes con notas más elevadas.

Por ejemplo, el valor de la ojiva para la calificación 12 es aproximadamente 35 para el grupo B y 55


para el grupo A. Por tanto, en el grupo B, aproximadamente 65% tiene notas superiores a 12, siendo
esta proporción de sólo el 45% para el grupo A.

También podría gustarte