Con el fin de evaluar la implementación de una nueva campaña publicitaria para
promover la asistencia odontológica preventiva en niños en edad escolar, se registró el número de visitas realizadas durante los últimos 5 años de un grupo de 19 niños, de entre 6 y 12 años de edad.
Los valores que se obtuvieron fueron: 0, 3, 5, 6, 7, 10, 11, 2, 1, 5, 4, 8, 7, 13, 3, 2,
1, 9, 4.
Obtenga los cuartiles, el mínimo, el máximo y el rango intercuartil.
Los valores de los cuartiles son: 𝑄 = 2, 𝑄 = 5 y 𝑄 = 8. Calcule el valor de los límites. Para el cálculo de los límites se calcula el 𝑅𝐼 = 6 y a continuación los “candidatos” a límites, obteniéndose los valores 𝐿𝑆 = 17 y 𝐿𝐼 = −1. En última instancia, al comparar estos valores con los valores extremos de la muestra (mínimo y máximo) se obtiene que los valores de los límites son 𝐿𝑆 = 13 y 𝐿𝐼 = 0. Realice un gráfico de caja que le permita interpretar la distribución del número de visitas e interprételo. Nota: no olvide nombrar los ejes y añadir un título al gráfico.
Se observa cierta asimetría en el número de visitas. Existió al menos un niño sin
visitas en los últimos 5 años y al menos uno con 13 visitas. El 50% de los niños tuvo más de 5 visitas. El 25% de los niños con más visitas presentó al menos 8 visitas mientras que se pueden observar que le 25% de los niños menos adeptos a visitar el odontólogo presentó 2 visitas o menos.
Ejercicio 2
A continuación se presenta la distribución de las calificaciones finales del curso
de Iniciación a la Investigación del año 2015.
A partir de estos valores determine el cuartil que le permita contestar las
siguientes interrogantes.
Teniendo en cuenta que la nota mínima para aprobar es 6, el porcentaje
de aprobación del curso fue de 50%. La nota mínima fue de 3. El 25% de los alumnos con mejores calificaciones obtuvieron al menos una nota de 8. ¿Cuántos alumnos obtuvieron una calificación de 12 puntos? Al menos uno.
Ejercicio 3
Como parte de la evaluación de dos técnicas de aprendizaje, un grupo de
investigadores se propuso comparar el tiempo que tomó a dos grupos de alumnos para completar la prueba final de un curso de Facultad de Odontología. En el siguiente gráfico de caja se presenta la distribución de la variable “tiempo hasta completar la prueba” para los dos grupos de alumnos. En base a este gráfico comente las siguientes afirmaciones.
¿Qué grupo fue más lento?
El grupo más lento (el que necesitó tiempos más “altos”) fue el grupo B. ¿Qué grupo presentó tiempos más homogéneos? Comparando los grupos mediante el 𝑅𝐼 se podría afirmar que la dispersión es similar en ambos grupos. Por otro lado, si se emplea el rango, se podría afirmar que el grupo B presenta mayor dispersión que el A. ¿Podría comentar algo respecto a la simetría o asimetría de los tiempos? En el grupo A se puede observar cierto nivel de asimetría, mientras que en el grupo B, los tiempos son relativamente simétricos.
Ejercicio 4
Indique si las siguientes afirmaciones son verdaderas o falsas justificando sus
respuestas.
El gráfico de caja solo puede representarse de forma horizontal. FALSO.
Es posible representarlo tanto horizontal como verticalmente. Cuando ocurren valores atípicos, solo ocurren sobre el límite superior. FALSO. Pueden ocurrir en cualquiera de los dos extremos del gráfico de caja. El gráfico de caja no permite obtener información sobre la variabilidad de la distribución de la variable en cuestión. FALSO. Si bien, no permite obtener el valor de la varianza o el desvío, sí es posible obtener el valor del rango o del rango intercuartil. El grosor de la caja representa la cantidad de datos disponibles. FALSO. El grosor de la caja es irrelevante. Los límites superior e inferior siempre coinciden con los valores máximo y mínimo respectivamente. FALSO. Esto sólo sucede cuando los valores “candidatos” a límites exceden al mínimo y al máximo, lo cual no necesariamente sucede en la práctica. Las líneas del gráfico de caja tienen una longitud máxima de 1,5 veces el rango intercuartil. VERDADERO.
Ejercicio 5
Complete las siguientes afirmaciones.
Para construir el gráfico de caja, además de los cuartiles, también es
necesario conocer el mínimo y el máximo de los datos. La línea que atraviesa la caja indica el valor de la mediana. Los atípicos son aquellos valores que exceden los límites del gráfico de caja. La representación gráfica más conveniente a la hora de comparar distribuciones es el gráfico de caja. La caja del gráfico representa el 50% de los datos.