Está en la página 1de 25

Matemática y su

Didáctica III
MISAEL PÉREZ GONZÁLEZ
Actividad 1
DESCRIPCIÓN DE LA UNIDAD DE APRENDIZAJE 1 Y 2

Con los datos de la tabla situada al final resolver los siguientes apartados:

A. Clasificar cada una de las variables de la tabla de datos proporcionada, indicando si es una variable
cualitativa o cuantitativa. En caso de ser cuantitativa, indica si es discreta o continua. Justificar la
respuesta.
Las variables cualitativas son aquellas que no aparecen en forma numérica, es decir, sus diversas
modalidades no son medibles y se describen mediante palabras.

En la tabla de datos podemos encontrar tres indicadores que corresponden a una variable cualitativa,
estos son el sexo, el grupo sanguíneo y el deporte.

Las variables cuantitativas estas si que son medibles y se describen mediante números. Pueden ser
discretas o continuas.

En la tabla de datos encontramos seis variables continuas, que son las que pueden tomar todos los
valores de un intervalo, puede ser infinito el conjunto de valores. Las que aparecen en la tabla son: la
altura (altura padre-altura madre), el peso, la cintura, la cadera. También se observa una variable
discreta que son las que sólo pueden tomar determinados valores dentro de un intervalo y en la tabla
está relacionada con las horas de estudio al día.

Variables de la Tabla
Cuantitativa
Sexo Cualitativa Cintura
continua
Cuantitativa Cuantitativa
Altura Cadera
continua continua
Cuantitativa Grupo sanguíneo
Altura del padre Cualitativa
continua (G.S.)
Altura de la Cuantitativa
Deporte Cualitativa
madre continua
Cuantitativa Horas de estudio Cuantitativa
Peso
continua al día (HED) continua

B. Construir una tabla de frecuencias absolutas y relativas para la variable Grupo sanguíneo (GS) y
Horas de Estudio Diario (HED). Realizar para cada variable el correspondiente diagrama de barras.
Hallar el valor modal para GS y HED.

Para hallar la frecuencia relativa se utiliza la siguiente fórmula:

𝑓1
ℎ1 =
𝑁

2
• Tabla de frecuencias absolutas y relativas para la variable del Grupo sanguíneo (GS).

Grupo sanguíneo Frecuencia absoluta (fi) Frecuencia relativa (hi)


O 32 0,5333
A 21 0,35
B 1 0,01666667
AB 6 0,1
n 60 1

• Diagrama de barras correspondiente al Grupo sanguíneo.

Grupo Sanguineo
35 32
30
25 21
20
15
10 6
5 1
0
O A B AB

• Hallar el valor modal para la tabla del Grupo Sanguíneo (GS).

La modalidad con mayor frecuencia es 32, por lo que seria GS: 0

• Tabla de frecuencias absolutas y relativas para la variable de Horas de Estudio Diario (HED).

Horas de estudio diario Frecuencia absoluta (fi) Frecuencia relativa (hi)


1 6 0,1
2 27 0,45
3 15 0,25
4 8 0,1333
5 3 0,065
6 1 0,1
n 60 1
3
• Diagrama de barras correspondiente a las Horas de Estudio Diario (HED).

Horas de Estudio Diarias


30
27

25

20
15
15

10 8
6
5 3
1
0
1 2 3 4 5 6

• Hallar el valor modal para la tabla de Horas de Estudio Diarias (HED).

En este caso el carácter de la distribución es cuantitativo discreta, la moda queda perfectamente definida, ya que
es el valor de la variable que presenta mayor frecuencia. La modalidad con mayor frecuencia es 27, por lo que
seria el HED: 2

C. Agrupando las observaciones en intervalos de amplitud 8 y tomando la parte entera de la menor


observación como extremo inferior del primer intervalo de la tabla; construir una tabla de frecuencias
absolutas, relativas y acumuladas para la variable Altura. Representar gráficamente el histograma de
frecuencias absolutas, acumuladas y la ojiva. Hallar media, mediana, desviación típica y coeficiente
de variación con los datos agrupados y sin agrupar. Interpreta los gráficos y las medidas de síntesis
obtenidas. Compara las diferencias entre las medidas de síntesis con los datos agrupados y sin agrupar.

Frecuencias Frecuencias
Intervalo Frecuencia Frecuencias
Absolutas Relativas (Hi)
(Altura) Absolutas (fi) Relativas (hi)
acumuladas (Fi) acumuladas
[160 / 168) 27 0,45 27 0,45
[168 / 176) 16 0,266666667 43 0,716666667
[176 / 184) 15 0,25 58 0,966666667
[184 / 192) 2 0,0333 60 1

4
• Representar gráficamente el histograma de las frecuencias absolutas.

Grupo Sanguíneo
30

25

20

15

10

0
[160 / 168) [168 / 176) [176 / 184) [184 / 192)

Horas de Estudio al Día


70
60
50
40
30
20
10
0
[160 / 168) [168 / 176) [176 / 184) [184 / 192)

5
• Representar gráficamente el histograma de las frecuencias acumuladas y la ojiva.

Histograma Frecuencia Absolura y Ojiva


70

60

50

40

30

20

10

0
[160 / 168) [168 / 176) [176 / 184) [184 / 192)

Frecuencia Absolutas (fi) Frecuencias Absolutas acumuladas (Fi)

Histograma Frecuencia Absoluta Acumulada y Ojiba


70

60

50

40

30

20

10

0
[160 / 168) [168 / 176) [176 / 184) [184 / 192)

Frecuencias Absolutas acumuladas (Fi) Frecuencias Relativas (Hi) acumuladas

Media
Hallando la MEDIA se consigue el centro de gravedad de la distribución. Se calcula sumando
los datos y dividiendo entre el tamaño de la muestra, es decir, entre el número total de datos.
Supuestos los datos agrupados en n clases, la media se obtiene de la misma forma sin más que tener en
cuenta que los valores (xi) corresponderán ahora a las marcas de clase y los valores (fi) a las frecuencias
de cada una de ellas.

xi será la marca de clase, que será el valor medio de la clase, es decir, la semisuma de sus límites.

fi Es la frecuencia absoluta de cada intervalo.


6
n Número total de la muestra

Frecuencia
Intervalo (Altura) Marca de Clase (xi) (xi*fi)
Absolutas (fi)
[160 / 168) 27 164 4.428
[168 / 176) 16 172 2.752
[176 / 184) 15 180 2.700
[184 / 192) 2 188 376
n 60 10.256

N= 60.

(xi*fi*) = 10.256

∑𝑛𝑖=1 𝑥𝑖 𝑓𝑖 10.256
𝑥= = = 170,933
𝑛 60

Mediana

La MEDIANA es un concepto que se refiere a todo el conjunto de datos, y no a ninguno de los


individuos en particular.

Si suponemos ordenados todos lo valores de una variable estadística, se llama mediana al valor de la
variable tal que existen tantos datos con valores de la variable superiores o iguales a él como inferiores
o iguales a él.

Intervalo (Altura) Marca de clase Frecuencia Frecuencia Absoluta


Inferior Superior (xi) Absoluta acumulada (Fi)
(fi)
[160 168) 164 27 27
[168 176) 172 16 43
[176 184) 180 15 58
[184 192) 188 2 60
60

𝑛
[2 − 𝐹(𝑀𝑒)]
𝑀𝑒 = 𝐿𝑖 + 𝐼
𝑓(𝑀𝑒)

• Li (168) Límite inferior de la clase mediana (clase que contiene a la mediana).


• n (60) Tamaño total de muestra (frecuencia total).
• N/2 (30) posición donde queda la mediana (punto medio).
• Fi -1 (27) Frecuencia acumulada de la clase inmediatamente anterior a la mediana.

7
• f i (16) Frecuencia absoluta de la clase de la mediana
• A (8) Ancho del intervalo
𝑛
[2 − 𝐹𝑖 − 1] 30 − 27
𝑀𝑒 = 𝐿𝑖 + · 𝐴 = 168 [ ] · 8 = 169.5 𝑐𝑚
𝑓𝑖 16

𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 169.5 𝑐𝑚

Desviación Típica

Se simboliza por s (a veces también por s (sigma)) a la raíz cuadrada de la varianza, es decir, al valor:

Intervalo (Altura) Marca de Frecuencia


clase Absoluta 𝑥𝑖 2 𝑓𝑖 · 𝑥𝑖 2
Inferior Superior (xi) (fi)
[160 168) 164 27 26.896 726.192
[168 176) 172 16 29.584 473.344
[176 184) 180 15 32.400 486.000
[184 192) 188 2 35.344 70.688
60 1.756.224

1 𝑛
𝑠 =√ ·∑ 𝑓𝑖 · 𝑥𝑖 2 − 𝑥̅ 2
𝑛 𝑖=1

1
𝑠=√ · 1.756.224 − 170,9332
60

1
𝑠=√ · 1.756.224 − 170,9332
60

𝑠 = √52,3095

Desviación típica 𝑠 = 7,2325306

8
Coeficiente de Variación
COEFICIENTE DE VARIACIÓN cociente entre la desviación típica y el valor absoluto de la media
aritmética, multiplicado por 100. Se expresa en tanto por ciento, y representa el porcentaje que la desviación
típica representa respecto del valor absoluto de la media aritmética.

𝑆
CV(%)= · 100
[𝑋]

7,2325306
CV(%)= · 100 = 4,231207900171412
170,933

Coeficiente de Variación = 4,231207900171412 %

Media sin agrupar

Para hallar la media sin agrupar sumaremos todos los valores sin agrupar y lo

dividiremos por el número total de la muestra, que en este caso son 60.

𝑎𝑙𝑡𝑢𝑟𝑎𝑠 sin 𝑎𝑔𝑟𝑢𝑝𝑎𝑟


𝑥̅ =
𝑁

Alturas sin agrupar= 10.252,01

N=60

10.252,01
𝑥̅ = = 170,866833
60

𝑀𝑒𝑑𝑖𝑎 𝑠𝑖𝑛 𝑎𝑔𝑟𝑢𝑝𝑎𝑟 = 170,866833

Mediana sin agrupar


Para hallar la media sin agrupar debemos ordenar los datos de menor a mayor. A
continuación, ya que la cantidad de datos es par, hay que promediar los números que se
𝑛 𝑛+1
encuentran en las posiciones 2 𝑦 2

9
Orden Datos
26 166,25 𝑛 𝑛+1
Mediana= 2 𝑦
27 167,64 2

28 168,11
29 168,31
168,98+169,41
30 168,98 Mediana= 2
= 169,195
31 169,41
32 170,39
33 172,76
34 173,26

Desviación típica sin agrupar


En este caso, hallaré la desviación típica a través de la varianza, de manera que:

̅ )𝟐
∑ 𝒇𝒊(𝒙𝒊 − 𝒙
𝒔𝟐 =
𝑵

𝟏𝟎. 𝟐𝟓𝟐, 𝟎𝟏
̅
𝒙= = 𝟏𝟕𝟎, 𝟖𝟔𝟖𝟑𝟑𝟑
𝟔𝟎

̅ )𝟐
∑ 𝒇𝒊(𝒙𝒊 − 𝒙
𝒔𝟐 = = 𝟕, 𝟒𝟔𝟓𝟑𝟓𝟎𝟏𝟐𝟕
𝑵

Coeficiente de variación sin agrupar

𝒔
𝑪𝑽(%) = · 𝟏𝟎𝟎
|𝒙
̅|

𝒔 = 𝟕, 𝟒𝟔𝟓𝟑𝟓𝟎𝟏𝟐𝟕

̅ = 𝟏𝟕𝟎, 𝟖𝟔𝟖𝟑𝟑𝟑
𝒙

𝟕, 𝟒𝟔𝟓𝟑𝟓𝟎𝟏𝟐𝟕
𝑪𝑽(%) = · 𝟏𝟎𝟎
𝟏𝟕𝟎, 𝟖𝟔𝟖𝟑𝟑𝟑

𝑪𝑽(%) = 𝟒, 𝟑𝟔𝟗𝟎𝟔𝟓𝟗𝟑𝟐𝟕𝟕𝟐𝟗𝟐𝟔%

10
Interpreta los gráficos y las medidas de síntesis obtenidas.
Medidas Datos agrupados Datos sin agrupar
Media 𝟏𝟕𝟎, 𝟗𝟑𝟑 𝟏𝟕𝟎, 𝟗
Mediana 𝟏𝟔𝟗. 𝟓 𝟏𝟔𝟗, 𝟐
Desviación Típica 𝟕, 𝟐𝟐𝟓 𝟕, 𝟒𝟎𝟑
Coeficiente de varianza 𝟒, 𝟐𝟐𝟕 𝟒, 𝟑𝟑𝟑

En la tabla de datos agrupados y sin agrupar vemos como en la media y la mediana los resultados
son superiores en los datos agrupados mientras que en la desviación típica y el coeficiente de
varianza los datos sin agrupar son superiores a los agrupados.

D. ¿Qué variable tiene mayor dispersión, el Peso o la Altura?

En este caso, tendremos que hallar el coeficiente de variación que es especialmente útil para
comparar la dispersión de dos distribuciones, aun cuando las unidades a que estén referidos los
datos de cada una de ellas correspondan a distintas magnitudes. Permite comparar el nivel de
dispersión de dos muestras.

𝒔
𝑪𝑽(%) = · 𝟏𝟎𝟎
|𝒙
̅|

𝑪𝑽(%) = 𝟒, 𝟑𝟔𝟗𝟎𝟔𝟓𝟗𝟑𝟐𝟕𝟕𝟐𝟗𝟐𝟔%

A continuación, se procede a agrupar las observaciones en intervalos de amplitud 8, tomando la


parte entera de la menor observación como extremo inferior del primer intervalo de la tabla para
la variable peso.

Peso Mc fi Fi hi % Hi
[37-45) 41 5 5 0,08333 8,333% 0,08333
[45-53) 49 5 10 0,08333 8,333% 0,1667
[53-61) 57 8 18 0,1333 13,333% 0,3
[61-69) 65 11 29 0,18333 18,333% 0,48333
[69-77) 73 17 46 0,28333 28,333% 0,767
[77-85) 81 9 55 0,15 15% 0,9167
[85-93) 89 5 60 0,08333 8,333% 1,00
60

11
∑𝒏𝒊=𝟏 𝒇𝒊 · 𝒙𝒊
̅=
𝒙
𝑵

Procedemos a calcular fi · xi =

Peso Mc fi fi· xi
[37-45) 41 5 205,00
[45-53) 49 5 245,00
[53-61) 57 8 456,00
[61-69) 65 11 715,00
[69-77) 73 17 1.241,00
[77-85) 81 9 729,00
[85-93) 89 5 445,00
60 4.036,00

𝟒. 𝟎𝟑𝟔
̅=
𝒙 = 𝟔𝟕, 𝟐𝟔𝟕
𝟔𝟎

A continuación, hallamos la desviación típica.

1 𝑛
𝑠 =√ ·∑ 𝑓𝑖 · 𝑥𝑖 2 − 𝑥̅ 2
𝑛 𝑖 = 1

Para poder calcularla deberemos tener los siguientes datos:

Peso Mc fi 𝑥𝑖 2 fi· 𝑥𝑖 2
[37-45) 41 5 1.681,00 8.405,00
[45-53) 49 5 2.401,00 12.005,00
[53-61) 57 8 3.249,00 25.992,00
[61-69) 65 11 4.225,00 46.475,00
[69-77) 73 17 5.329,00 90.593,00
[77-85) 81 9 6.561,00 59.049,00
[85-93) 89 5 7.925,00 39.625,00
60 282.144,00

̅𝟐 = (𝟔𝟕, 𝟐𝟔𝟕)𝟐 = 𝟒. 𝟓𝟐𝟒, 𝟖𝟒𝟗𝟐𝟗


𝒙

12
𝑛
∑ 𝑓𝑖 · 𝑥𝑖 2 = 𝟐𝟖𝟐. 𝟏𝟒𝟒
𝑖=1

N= 60

1
𝑠=√ · 𝟐𝟖𝟐. 𝟏𝟒𝟒 − 𝟒. 𝟓𝟐𝟒, 𝟖𝟒𝟗𝟐𝟗
60

1
𝑠=√ · 𝟐𝟖𝟐. 𝟏𝟒𝟒 − 𝟒. 𝟓𝟐𝟒, 𝟖𝟒𝟗𝟐𝟗
60

𝑠 = √176,55071
𝑠 = 13,287238

Con todos estos datos podemos calcular el coeficiente de varianza:


𝒔
𝑪𝑽(%) = · 𝟏𝟎𝟎
|𝒙
̅|

𝟏𝟑, 𝟐𝟖𝟕𝟐𝟑𝟖
𝑪𝑽 𝒑𝒆𝒔𝒐 = · 𝟏𝟎𝟎
𝟔𝟕, 𝟐𝟔𝟕

𝑪𝑽 𝒑𝒆𝒔𝒐 = 𝟏𝟗, 𝟕𝟓𝟐𝟗%

Medidas Peso Altura


Media ̅
𝒙 𝟔𝟕, 𝟐𝟔𝟕 𝟏𝟕𝟎, 𝟗𝟑𝟑
Desviación típica 𝟏𝟑, 𝟐𝟖𝟕𝟐𝟑𝟖 𝟕, 𝟐𝟑𝟐𝟓𝟑𝟎𝟔
Coeficiente de variación 𝟏𝟗, 𝟕𝟓𝟐𝟗% 𝟒, 𝟐𝟑𝟏𝟑

Observando la variable peso y altura, podemos afirmar que la variable con mayor dispersión es el
peso con un Coeficiente de variación 𝟏𝟗, 𝟕𝟓𝟐𝟗 ya que es mayor que el de la altura.

E. Usando cada uno de los procedimientos de la página 48-51 del manual, hallar los
percentiles 20, 30, 70 y 80 para la variable Cadera. No repetir procedimiento. Interpretar
el percentil hallado. Nota: Construir el histograma con intervalos de amplitud 8 y siendo
la parte entera de la menor observación el extremo inferior del primer intervalo de la
tabla.

13
Calculamos la siguiente tabla con las frecuencias que son necesarias:

Peso Mc fi Fi hi % Hi
[30-38) 34 1 1 0,01667 1,667% 0,01667
[38-46) 42 0 1 0 0% 0,01667
[46-54) 50 0 1 0 0% 0,01667
[54-62) 58 1 2 0,1667 1,667% 0,0333
[62-70) 66 6 8 0,1 10% 0,1333
[70-78) 74 5 13 0,08333 8,33% 0,218
[78-86) 82 4 17 0,0667 6,67% 0,283
[86-94) 90 14 31 0,2333 23,3% 0,517
[94-102) 98 15 46 0,25 25% 0,77
[102-110) 106 8 54 0,1333 13,3% 0,9
[110-118) 114 2 56 0,0333 3,3% 0,9333
[118-126) 122 4 60 0,0667 6,67% 1,00
60

Percentil 20
𝐾𝑛
𝑐 ( 100 − 𝑓1 −1)
𝑃𝑥 = 𝐿𝑖 +
𝑓𝑖

𝐾 = 20

𝑛 = 60

𝐾𝑛 20.60
= = 12
100 100

[70-78) 74 5 13 0,08333 8,33% 0,218

𝐿𝑖 = 70

𝐹𝑖 = 13

𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 [𝑎 − 𝑏) 𝑒𝑠 𝐶 = 𝟕𝟎 − 𝟕𝟖 = 𝟖

𝐹𝑖 − 1 = 𝑎 𝑙𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟.

14
𝐹𝑖 − 1 = 8

𝐹𝑖 = 5

8 ( 12 − 8 )
𝑃20 = 70 + = 70,8
5

𝑃20 = 70,8

Percentil 30
𝐾𝑛
𝑐( 100 − 𝑓1 −1)
𝑃30 = 𝐿𝑖 +
𝑓𝑖

𝐾 = 30

𝑛 = 60

𝐾𝑛 30.60
= = 18
100 100

[78-86) 82 4 17 0,0667 6,67% 0,283

𝐿𝑖 = 78

𝐹𝑖 = 17

𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 [𝑎 − 𝑏) 𝑒𝑠 𝐶 = 𝟕𝟖 − 𝟖𝟔 = 𝟖

𝐹𝑖 − 1 = 𝑎 𝑙𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟.

𝐹𝑖 − 1 = 13

𝐹𝑖 = 4

8 ( 18 − 13 )
𝑃20 = 78 + = 70,8
4

𝑃30 = 88

15
Percentil 70
𝐾𝑛
𝑐( − 𝑓1 −1)
𝑃70 = 𝐿𝑖 + 100
𝑓𝑖

𝐾 = 70

𝑛 = 60

𝐾𝑛 70.60
= = 42
100 100

[94-102) 98 15 46 0,25 25% 0,77

𝐿𝑖 = 94

𝐹𝑖 = 46

𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 [𝑎 − 𝑏) 𝑒𝑠 𝐶 = 𝟗𝟒 − 𝟏𝟎𝟐 = 𝟖

𝐹𝑖 − 1 = 𝑎 𝑙𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟.

𝐹𝑖 − 1 = 31

𝐹𝑖 = 15

8 ( 42 − 31 )
𝑃70 = 94 + = 99,87
15

𝑃70 = 99,87

Percentil 80
𝐾𝑛
𝑐( − 𝑓1 −1)
𝑃80 = 𝐿𝑖 + 100
𝑓𝑖

𝐾 = 80

𝑛 = 60

𝐾𝑛 80.60
= = 48
100 100

16
[102-110) 106 8 54 0,1333 13,3% 0,9

𝐿𝑖 = 102

𝐹𝑖 = 54

𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 [𝑎 − 𝑏) 𝑒𝑠 𝐶 = 𝟏𝟎𝟐 − 𝟏𝟏𝟎 = 𝟖

𝐹𝑖 − 1 = 𝑎 𝑙𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟.

𝐹𝑖 − 1 = 46

𝐹𝑖 = 8

8 ( 48 − 46 )
𝑃80 = 102 + = 104
8

𝑃80 = 104

Percentil 20 70,8
Percentil 30 88
Percentil 70 99,87
Percentil 80 104

17
Histograma

Histograma Variable Cadera


140

120

100

80

60

40

20

0
[30-38) [38-46) [46-54) [54-62) [62-70) [70-78) [78-86) [86-94) [94-102) [102-110)[110-118)[118-126)

Mc fi Fi hi % Hi

F. Compara la distribución de la variable Peso en hombres y mujeres. Para ello realiza en un mismo
gráfico diagramas de cajas y bigotes para esta variable, uno para los hombres y otro para las mujeres.
Analiza e interpreta el gráfico resultante.

Lo primero para realizar esta actividad es ordenar los datos de las observaciones, se parando los
valores de las mujeres y los hombres.

Mujer Hombre
37,51 54,28 72,08 54,59 66,98 76,44
39,19 57,63 72,83 55,87 69,06 77,02
42,86 59,08 74,05 58,61 69,51 77,34
44,05 60,11 74,57 58,97 70,26 77,49
44,71 60,42 75,66 61,47 72,69 77,56
45,3 61,36 76,32 62,42 73,29 78,1
48,2 61,43 77,7 63,01 73,76 79,47
49,52 62,4 79,81 63,62 74,33 92,56
49,59 67,26 83,12 65,56 74,37 96,29
51,48 70,39 92,49 66,67 74,71 96,79

18
CÁLCULO DE CUARTILES

Utilizamos el Excel para la realización de las operaciones.

Mínimo Q1 Mediana Q3 Máximo


Mujeres 37,51 49,52 60,89 74,05 92,49
Hombres 54,59 63,62 72,99 77,34 96,79

Por lo tanto, el dibujo de la Caja y los Bigotes quedaría de la siguiente manera:

Mujer Hombre
Bigote de la izquierda 37,5 - 49,5 54,59 - 63,62
1ªparte de la caja 49,5 - 60,89 63,62 – 72,99
2º parte de la caja 60,89 – 74,05 72,99 – 77,34
Bigote de la derecha 74,05 – 92,49 77,34 – 96,79

Gráfico de caja y bigote para dos variables


9
63,62 77.34
8
54,59 96,79
7

6
72,99
5

4
49.5 74,05
3
37.5 92,49
2

1
60,89

0
0 20 40 60 80 100 120

19
G. Sabiendo que el cuartil 1 puede estimarse como la mediana de las observaciones por debajo de la
mediana y el cuartil 3 como la mediana de las observaciones por encima de la mediana, diseña una
experiencia dinámica para comprender los cuartiles 1 y 3 al estilo de la propuesta en la página 52 del
Manual.

Explicamos en clase que los CUARTILES (Q) tienen la función de informar del valor de la variable
que ocupará la posición (en tanto por cien) que nos interese respecto de todo el conjunto de
variables. Podemos decir que los Cuartiles son unas medidas de posición que dividen a la
distribución en un cierto número de partes de manera que en cada una de ellas hay el mismo de
valores de la variable.

Las más importantes son:

Los cuartiles dividen en cuatro partes las observaciones.

El primer cuartil Q1 es un valor que deje por debajo de él 25% de las y por encima 75% de las
observaciones.
El Q2 que es la mediana (50%).
El cuartil Q3 deja por debajo 75% y por encima 25% de las observaciones.

Les colocamos un ejemplo en la pizarra para apoyarnos en la explicación de forma gráfica.

Cuartil 1 Cuartil 2 Cuartil 3 Cuartil 4


25 % 25 % 25 % 25 %

Cuartil 1

25% 50% 75% 100%

25% de los valores están


incluidos en el cuartil 1.

Q1 Q2 Q3 Q4

Cuartil 2

25% 50% 75% 100%

EL 50 % de los valores están incluidos en el cuartil 2.

Q1 Q2 Q3 Q4

20
Cuartil 3

25% 50% 75% 100%

El 75 % valores están incluidos en el cuartil 3.

Q1 Q2 Q3 Q4

Cuartil 4

25% 50% 75% 100%

EL 100% de los valores están incluidos en el cuartil 4.

Q1 Q2 Q3 Q4

Después de esta explicación realizaremos una actividad que les permitirá adquirir y practicar estos
conceptos. La actividad cuenta con una recogida de datos que ya se hace en la clase desde hace
tiempo. Dichos datos son recogidos por el alumnado todos los meses y el número de alumnado de
clase que trae fruta para desayunar ese día. Esos datos que tenemos recopilados en una tabla.
Vamos a utilizar una aplicación que nos permitirá saber cuáles son los cuartiles Q1 Q2 y Q3 de
esos datos.

http://geogebra.es/gauss/materiales_didacticos/eso/actividades/estadistica_y_probabilidad/medid
as/cuartiles/actividad.html

A través de esta aplicación y por medio de la caja de bigotes el alumnado introducirá los datos
tendrá que averiguar cuáles son los Cuartiles.

Ejemplos de ejercicios

21
También podemos hacer un ejercicio mas visual y manipulativo utilizando una tira de papel con
las medidas hasta el 30 y que esté dividida. Luego colocamos un gomet en el número que se
repite en la tabla de días permita colocar el número de alumnos que traen fruta en los días del
mes. Puse una regla de 30 que son el alumnado.

Alumnado que desayuna fruta


Lunes Martes Miércoles Jueves Viernes
1º semana 10 16 17 16 22
2º semana 25 21 21 22 16
3º semana 28 22 25 28 21
4º semana 19 30 24 26 24

Colocar los gomet en los puntos sabiendo que el mínimo es 10 y el máximo de alumnado que trae
fruta es 30. Entre esos rangos 10-30 tenemos que buscar los cuartiles Q1 25% Q2 50% y Q3 75%
Ellas intentarán con las operaciones que conocen llegar la conclusión de dónde están los cuartiles.

Q1 Q2 Q3

Ejemplo Q2 es la media que la encontramos entre la mitad de 10 y 30 que es 20.


La mitad entre 10 y 20 es 15 (Q1) y la mitad entre 20 y 30 es 25 (Q3)

22
A. Representa gráficamente el diagrama de dispersión de la Altura de la Madre (X)
frente a la variable Altura (Y). Halla el coeficiente de correlación lineal de Pearson e
indica el tipo de correlación (ver al respecto la sección 4.2 del manual). Halla la recta
de regresión de Y dado X. ¿Cuál es la altura de un hijo/a cuya madre tiene una altura
de 1.65 cm?

MEDIA DE ALTURA HIJO 170,8668333


MEDIA DE ALTURA MADRE 164,73
COVARIANZA 13,8
DESVIACIÓN TÍPICA ALTURA HIJO 7,402877479
DESVIACIÓN TIPICA ALTURA MADRE 3,713
COEFFICIENTE DE CORRELACIÓN 0,5019

X = Altura de la madre
Y= Altura del Hijo

La recta de regresión es Y dado por X

Y= 6,0900214+1,0005676 = 7,090589

Y sabiendo que el promedio de la altura de la madre es 165 la altura promedia del hijo es
171,79058

LINEAL POSITIVA FUNCIONAL

DIAGRAMA DE DISPERCIÓN ALTURA Y ALTURA MADRE


250

y = 1.8874x - 140.04
R² = 0.8922
200

150

100

50

0
155 160 165 170 175 180

23
B. Representa gráficamente el diagrama de dispersión de la variable Cintura frente a la
variable Cadera. Halla la recta de regresión de la variable Cintura dado Cadera.
Halla la predicción de la variable Cadera para los valores de Cintura 80 y 90 cm.,
respectivamente. ¿Cuál de las dos predicciones es más fiable? Justifica la respuesta.

MEDIA DE CINTURA 79,02


MEDIA DE CADERA 91,05
COVARIANZA 217,6
DESVIACIÓN TÍPICA CINTURA 15,63047227
DESVIACIÓN TIPICA CADERA 16,75269169
COEFFICIENTE DE CORRELACIÓN 0,8308

X= Cadera
Y= Cintura
La recta de regresión es Y dado X
Y= 8,4364255+ 0,7751894
Y= 9,2116149
Y= 9,2116149+80=91,93
Y= 9,2116149+90=100,8

Cintura Cadera
80 91,93
90 100,8

Diagrama Cintura Cadera Recta de Regresión


140

120

100

80

60

40

y = 1,0621x + 7,1281
20
R² = 0,9819

0
0 20 40 60 80 100 120

24

También podría gustarte