Está en la página 1de 11

Profesor: Ileana Picado Fernández Estadística

Situación problema 1 3. ¿Qué diferencias observa entre las


calificaciones de ambos cursos?
Diana y Esteban son hermanos y cursan
carreras diferentes en la misma universidad,
Diana Estudia Diseño Publicitario y Esteban
Ingeniería Ambiental. El papá de Diana y
Esteban quiere premiar al que tenga mejor 4. ¿En cuál de los dos grupos hay mayor
rendimiento académico en cada cuatrimestre y variabilidad de las notas?
para ello elije un curso al azar de cada carrera
de sus hijos y la calificación final obtenida por
cada uno. Para el primer cuatrimestre elije el
curso “Dibujo Publicitario I” de la carrera de
Diana en el cual ella obtuvo una calificación de
92. De la carrera de Esteban elije “Biología MEDIDAS DE VARIABILIDAD
General” y en este curso Esteban obtuvo una
calificación de 88. Por lo cual Su padre decide La variabilidad de los datos es la razón de existir
premiar a Diana. Sin embargo, Esteban cree de la estadística, ya que la gran mayoría de los
que no es justo que premien a su hermana y fenómenos se repiten con mayor o menor
para ello le muestra a su padre las calificaciones intensidad lo crea patrones que permiten
de todos los alumnos de ambos cursos. predecir acontecimientos futuros.

Calificaciones del curso: Dibujo Publicitario I: Las medidas de tendencia central (moda, media
y mediana) en muchas ocasiones no son
82 82 83 84 85 suficientes para el análisis inferencial de un
86 89 92 93 94 grupo de datos, ya que la variabilidad de estos
94 95 96 97 99 datos también debe ser tomados en cuenta en
dicho análisis. Ya que los datos por naturaleza
Calificaciones del curso: Biología General: tienden a agruparse alrededor de los valores
centrales y entre más centralizados estén más
65 68 70 72 73 representativos son del conjunto y más
75 78 79 81 82 confiable son las conclusiones que se puedan
85 88 89 90 91 generar usando los valores centrales.

1. ¿Tiene razón Esteban? Las medidas de variabilidad o dispersión de los


datos más comunes son: recorrido, recorrido
intercuartilico, la variancia y desviación
estándar o desviación típica.

2. ¿Las calificaciones de los demás


compañeros pueden ayudar a visualizar Recorrido(𝐑)
quien tuvo mejor rendimiento? ¿Por qué?
Es la diferencia entre mayor y el menor de los
datos. Permite visualizar la amplitud de los
datos, se suele representar con la letra 𝑅. Por
ejemplo, en las notas del curso Dibujo
Publicitario I del problema inicial podemos ver
que el recorrido es 𝑅 = 99 − 82 = 17 y en el
curso Biología General 𝑅 = 91 − 65 = 26

1
Profesor: Ileana Picado Fernández Estadística

Recorrido intercuartilico(𝐑𝐐) dato de la posición 3 y la posición 4. O sea


%'$%*
𝑄% = ) = 14,5.
Es la diferencia entre el tercer y el primer cuartil
de una distribución de datos. Es además un ((%)$%)
intervalo en el cual se acumula el 50% de los Para 𝑄( ⇒ 𝑃( = ' = 9,75, es decir, el
datos. cuartil 3 corresponde al dato promedio entre el
dato de la posición 9 y la posición 10. O sea
%+$)%
Recordemos que para un grupo de “𝑛" datos los 𝑄% = ) = 20.
cuartiles se pueden calcular de la siguiente
forma:
Por lo tanto, 𝑅𝑄 = 20 − 14,5 = 5,5.
!(#$%)
• La posición 𝑃! del cuartil 𝑄! es 𝑃! = '
.
Variancia o varianza(𝜎 ) ó 𝑠 ) )

Es una medida de dispersión que permite


Ejemplo: calcular el promedio de la diferencia al
cuadrado entre el valor de cada dato y la media
En los datos: 6, 6, 7, 8, 9, 9, 12, 13, 14, 15, 16, el aritmética.
primer y tercer cuartil se calculan así:
Se utiliza la letra griega 𝜎 ) para denotar la
%(%%$%)
Para 𝑄% ⇒ 𝑃% = ' = 3, es decir, el cuartil 1 variancia poblacional y la letra 𝑠 ) para denotar
la variancia muestral y se calculan así para
corresponde al dato que está en la posición 3.
datos sin agrupar:
O sea 𝑄% = 7.

((%%$%) Varianza poblacional: Varianza muestral:


Para 𝑄( ⇒ 𝑃( = ' = 9, es decir, el cuartil 3
corresponde al dato que está en la posición 9. ∑#,-%(𝑥, − 𝑥̅ )) ∑#,-%(𝑥, − 𝑥̅ ))
O sea 𝑄( = 14. 𝜎) = 𝑠) =
𝑛 𝑛−1
Por lo tanto, 𝑅𝑄 = 14 − 7 = 7.
Donde:
• Si 𝑃! es un número con decimales, entonces
el cuartil 𝑄! se calcula el promedio entre el • 𝑛: número de datos.
valor anterior y posterior al correspondiente • 𝑥, : cada uno de los datos.
de la posición 𝑃! : • 𝑥̅ : la media aritmética.

Ejemplo
Desviación estándar o típica
Si se tienen las siguientes edades de un grupo
de personas: Es la medida de variabilidad más utilizada,
representa el promedio de la dispersión de los
12 13 14 15 15 16 datos con respecto a la media aritmética. Se
obtiene al calcular la raíz cuadrada de la
17 18 19 21 21 22 variancia, es decir:

%(%)$%)
Para 𝑄% ⇒ 𝑃% = ' = 3,25, es decir, el 𝜎 = √𝜎 ) 𝑠 = √𝑠 )
cuartil 1 corresponde al dato promedio entre el
En muchas ocasiones es conveniente utilizar la
desviación estándar en lugar de la variancia.

2
Profesor: Ileana Picado Fernández Estadística

Nota: Para efectos de los ejercicios en clase se Paso 5:


utilizará la calculadora para obtener estas
medidas de variación.

Ejemplo:

Considere las estaturas, en centímetros, de los Paso 6:


jugadores titulares del Real Madrid en la final de
la Champions 2018:

185 173 191 184 174 185


183 172 176 185 187

Seguidamente se explica cómo calcular la


desviación estándar y la varianza usando la De esta forma obtenemos ambas medidas de
calculadora variabilidad, es decir:

Paso 1: La varianza es 𝑠 ) = 41,45

La desviación estándar es 𝑠 = 6,44

Paso 2:

Práctica

1. De acuerdo con los datos del problema


Paso 3: inicial de Esteban y diana determine el
recorrido, el recorrido intercuartilico y la
desviación estándar de los siguientes
grupos de datos:

Calificaciones del curso: Dibujo Publicitario I:

Paso 4: 82 82 83 84 85
86 89 92 93 94
94 95 96 97 99

3
Profesor: Ileana Picado Fernández Estadística

Calificaciones del curso: Biología General:

65 68 70 72 73
75 78 79 81 82 3. Con base en los datos de las tablas
85 88 89 90 91 anteriores y sus respectivas medidas de
dispersión, conteste las siguientes
preguntas

a) ¿Cuál de los grupos presenta mayor


variabilidad?

2. Determine el recorrido, el recorrido


intercuartilico y la desviación estándar de los b) ¿Cuál presenta menor variabilidad?
siguientes grupos de datos:

Pesos en kilogramos de 12 estudiantes de la c) ¿En cuál de los tres grupos la media


sección 11-1 aritmética es la mejor medida de
70,5 65,8 56,3 43 48,2 85,8 tendencia central ¿
82,4 73,9 76,6 57,4 55 61,6

4. Determine el recorrido intercuartilico y la


desviación estándar de los siguientes
/8Pesos en kilogramos de 12 estudiantes de la grupos de datos:
sección 11-2
55 62,5 60,5 48 59,2 67 Cantidad de estudiantes por sección
71 73,5 64 58,4 70 66,8 26 32 22 36 30 28 23 31 27 26

Pesos en kilogramos de 12 estudiantes de la Talla de zapatos de 14 personas


sección 11-3 38,5 40 36 41,5 35,5 39 43
43,5 69 72,4 79 63,2 55
42,5 35 38 37,5 44 41 36,5
64,7 71,7 68,2 77,3 44 48,9

4
Profesor: Ileana Picado Fernández Estadística

5. En la página http://www.meteored.com/se • 48 86 87 103 112 121 123


proyecta la temperatura máxima y mínima
en diferentes ciudades del mundo. Para 12
días del mes de marzo del 2010, R: ______________

En la ciudad de Nicoya se proyectaron las RI: ______________


siguientes temperaturas máximas en grados
centígrados:

• 30, 28, 32, 31, 30, 31, 28

R: ______________
mientras que en San José para los mismos
días las temperaturas máximas proyectadas RI: ______________
fueron:

Considere las siguientes proposiciones


referidas a la información anterior:
Realice un análisis estadístico con la
información anterior, para comparar las
temperaturas de las dos ciudades de I. El recorrido de los datos es de 8°C.
acuerdo con esas muestras. ¿En cuál de las II. El recorrido intercuartílico de los datos
ciudades la temperatura es más variable? es 4.

2.¿Cuál o cuáles de ellas son verdaderas?


A) Ambas
B) Ninguna
C) Solo la I
D) Solo la II

1. De los siguientes grupos de datos 79.2 70.9 78.6 86.2 74.0 83.7
determine el recorrido y recorrido
intercuartílico: 3.¿Cuál es el recorrido de la anterior lista de
datos?
• 105 115 124 168 174 269 169
A) 78. 7
R: ______________ B) 157.4
C) 14.4
RI: ______________ D) 15.3

• 11 9 16 27 14 19 26 18

R: ______________ 4. Observe la siguiente tabla


Niveles ordenados de nicotina de 40
RI: ______________ fumadores
0 1 1 3 17 32 35 44 48 86 87 103

5
Profesor: Ileana Picado Fernández Estadística

• 48 86 87 103 112 121 123


¿Cuál es el valor del recorrido intercuartílico?

A) 103 S: ______________
B) 67
C) 65 S2: ______________
D) 25

5. De la siguiente lista de datos:


• 30, 28, 32, 31, 30, 31, 28
10, 13, 4, 7, 8, 11 10, 16, 18, 12, 3
• S: ______________
¿Cuál es el valor del recorrido intercuartílico?
• S2: ______________
A) 6
B) 7
C) 10
D) 15

6. En 20 pruebas de evaporación, de la 12 9 56 87 4 69 36 8
sustancia MW008, se registran las siguientes
variaciones de temperaturas a presión 1. ¿Cuál es la desviación estándar de la
atmosférica: anterior lista de datos?

41°, 50°, 29°, 33°, 43°, 34°, 31°, 44°, 57°

De la anterior lista de temperaturas ¿Cuál es el 100 125 154 258 135 162 173. 230
valor del recorrido intercuartílico?
2. ¿Cuál es la varianza de la anterior lista
A) 33° de datos?
B) 40°
C) 15°
D) 28° A continuación se muestran las temperaturas
De los siguientes grupos de datos máximas en grados Celsius, para doce días del
determine la varianza y desviación estandar mes de enero del año 2019 en la ciudad de San
José:
• 105 115 124 168 174 269 169
Temperatura
S: ______________ 25 27 28 28 29 30 30 31 32 33
máxima.
S2: ______________
3. Considere las siguientes proposiciones
• 11 9 16 27 14 19 26 18 referidas a la información anterior:

S: ______________
I. Al determinar la varianza nos da 2,40
2
S : ______________ II. Al determinar la desviación estándar nos da
5,78
¿Cuál o cuáles de ellas son verdaderas?

6
Profesor: Ileana Picado Fernández Estadística

A) Ambas ¿Cuál o cuáles de ellas son verdaderas?


B) Ninguna
C) Solo la I A) Ambas
D) Solo la II B) Ninguna
C) Solo la I
D) Solo la II

7. De la siguiente lista de datos

73 38 27 30 22 11 45

¿Cuál es la desviación estándar de la lista


4. De la siguiente lista de datos anterior?

287 128 92 267 176 118 A) 61,5


B) 51,92
Observe las siguientes proposiciones: C) 19,94
D) 397,80
I. La desviación estandar es 81,61
II. El recorrido es 198.

¿Cuál o cuáles de ellas son verdaderas?

A) Ambas
B) Ninguna
C) Solo la I
D) Solo la II

5. De la siguiente lista de datos


2, 4, 7, 9, 12.

¿Cuál es la varianza de los siguientes datos?

A) 3,96
B) 6
C) 15.7
D) 46.8

6. Considere las siguientes proposiciones en


relación a los datos de una población

10, 6, 2, 12, 15, 11, 16, 7.

I. Su varianza es 22,12.

II. Su desviación estándar aproximada es de


4.70

7
Profesor: Ileana Picado Fernández Estadística

DIAGRAMAS DE CAJA
Ejemplo:
El diagrama de cajas y bigotes es un resumen
gráfico, sobre la recta numérica, en el cual se Construya un diagrama de cajas con los
describe el comportamiento de los datos para siguientes datos:
determinar su dispersión a través de los
cuartiles. Edades de un equipo de futbol
Por medio de este tipo de gráficos se puede
analizar con más facilidad la variabilidad de un 20 22 22 22 22 22 23 23 23 24
grupo de datos que utilizando gráficos de 24 24 24 25 25 25 26 26 29 32
barras, circulares, histogramas u otros
similares.

Las que se deben tener en cuenta para construir Cuartil1: _______


estos son:

• Recorrido Intercuartilico es 𝑅𝑄 = 𝑄( − 𝑄% Cuartil 2: _______


• Límite Inferior 𝑄% − 1,5𝑅𝑄
• Límite Superior 𝑄( + 1,5𝑅𝑄
Cuartil 3: _______
Estas gráficas se componen de una caja
rectangular, en la que el largo del rectángulo
representa el recorrido intercuartílico Este Recorrido intercuartílico: _________
rectángulo es dividido por un segmento vertical.
el cual indica la posición de la mediana y su
relación con los cuartiles 𝑄% y 𝑄( (recuerde que Límite inferior: ______________________
el cuartil 𝑄) coincide con la mediana).

Límite superior: _____________________

Ese rectángulo se ubica sobre una recta


numérica, A las líneas que salen a lados del
rectángulo se llaman “bigotes” y sus valores son
definidos por los datos mínimo y máximo que no
excedan los límites inferior y superior Observaciones:
respectivamente. En caso de que se encuentre
algún dato fuera del límite del bigote recibe el
nombre de dato atípico o no común e influye en
la dispersión de datos. Estos datos atípicos se
representan con puntos fuera de los bigotes.

8
Profesor: Ileana Picado Fernández Estadística

Practica 1

Responda las preguntas de acuerdo a los


diagramas de cajas en cada caso:

5. ¿Cuál es el valor de la mediana?

6. ¿Qué porcentaje aproximado de personas


se puede decir que trabaja entre 5 y 8
1. ¿Cuál es la mediana en las notas obtenidas horas?
en el examen de Biología?

7. ¿Qué porcentaje de personas se puede


decir que trabaja entre 8 y 10 horas?
2. ¿Cuáles son los valores del primer y del
tercer cuartil, respectivamente?

8. ¿Existe algún dato atípico? Si la respuesta


es afirmativa, ¿cuál es ese dato?

3. Tomando como referencia la mediana,


¿hacia qué lado se encuentran más
dispersos los datos? 9. ¿Es la mediana una medida de resumen
apropiada para analizar los datos?; ¿por
qué?

4. ¿Entre qué datos se encuentra ubicado el


50% de las calificaciones centrales? 10. Los diagramas
muestran la
distribución de
las notas en un
mismo curso
(de 0 a 10) que
obtuvieron 2
grupos de
estudiantes
universitarios. El profesor desea hacer un
análisis y para eso se plantea las siguientes
preguntas:

a. ¿Cuál grupo es más homogéneo?

9
Profesor: Ileana Picado Fernández Estadística

b) Determine los valores de A, B, C, D y E.


b. En el grupo A, ¿entre cuáles cuartiles
consecutivos hay menor dispersión
de datos?

c) ¿Qué porcentaje de los datos está entre


18 y 31?

c. ¿Cuál es el grupo con mejores notas?

d) Encuentre el recorrido y el recorrido


intercuartílico.

d. Si la nota mínima para aprobar el


curso es 7, ¿en cuál grupo hay un 12. Para el conjunto de datos:
mayor porcentaje de estudiantes 15,15,16,16,17,17,17,17,18,18,18,22,22,25,
aprobados? 26 el diagrama de caja es:

e. ¿En cuál de los grupos se puede


afirmar que el 50% de los estudiantes a) Determine la moda.
obtuvieron una nota menor o igual a
5?

b) Determine los valores de A, B, C, D y E.

c) ¿Qué porcentaje de los datos está entre


11. Para el conjunto de datos: 20 y 26?
18,18,19,19,20,22,22,23,27,28,28,31,34,34,
36, el diagrama de caja es:

d) Determine el recorrido y el recorrido


intercuartílico.

a) Determine la media aritmética de los


datos.

10
Profesor: Ileana Picado Fernández Estadística

11

También podría gustarte