Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Didáctica III
MISAEL PÉREZ GONZÁLEZ
Actividad 1
DESCRIPCIÓN DE LA UNIDAD DE APRENDIZAJE 1 Y 2
Con los datos de la tabla situada al final resolver los siguientes apartados:
A. Clasificar cada una de las variables de la tabla de datos proporcionada, indicando si es una variable
cualitativa o cuantitativa. En caso de ser cuantitativa, indica si es discreta o continua. Justificar la
respuesta.
Las variables cualitativas son aquellas que no aparecen en forma numérica, es decir, sus diversas
modalidades no son medibles y se describen mediante palabras.
En la tabla de datos podemos encontrar tres indicadores que corresponden a una variable cualitativa,
estos son el sexo, el grupo sanguíneo y el deporte.
Las variables cuantitativas estas si que son medibles y se describen mediante números. Pueden ser
discretas o continuas.
En la tabla de datos encontramos seis variables continuas, que son las que pueden tomar todos los
valores de un intervalo, puede ser infinito el conjunto de valores. Las que aparecen en la tabla son: la
altura (altura padre-altura madre), el peso, la cintura, la cadera. También se observa una variable
discreta que son las que sólo pueden tomar determinados valores dentro de un intervalo y en la tabla
está relacionada con las horas de estudio al día.
Variables de la Tabla
Cuantitativa
Sexo Cualitativa Cintura
continua
Cuantitativa Cuantitativa
Altura Cadera
continua continua
Cuantitativa Grupo sanguíneo
Altura del padre Cualitativa
continua (G.S.)
Altura de la Cuantitativa
Deporte Cualitativa
madre continua
Cuantitativa Horas de estudio Cuantitativa
Peso
continua al día (HED) continua
B. Construir una tabla de frecuencias absolutas y relativas para la variable Grupo sanguíneo (GS) y
Horas de Estudio Diario (HED). Realizar para cada variable el correspondiente diagrama de barras.
Hallar el valor modal para GS y HED.
𝑓1
ℎ1 =
𝑁
2
• Tabla de frecuencias absolutas y relativas para la variable del Grupo sanguíneo (GS).
Grupo Sanguineo
35 32
30
25 21
20
15
10 6
5 1
0
O A B AB
• Tabla de frecuencias absolutas y relativas para la variable de Horas de Estudio Diario (HED).
25
20
15
15
10 8
6
5 3
1
0
1 2 3 4 5 6
En este caso el carácter de la distribución es cuantitativo discreta, la moda queda perfectamente definida, ya que
es el valor de la variable que presenta mayor frecuencia. La modalidad con mayor frecuencia es 27, por lo que
seria el HED: 2
Frecuencias Frecuencias
Intervalo Frecuencia Frecuencias
Absolutas Relativas (Hi)
(Altura) Absolutas (fi) Relativas (hi)
acumuladas (Fi) acumuladas
[160 / 168) 27 0,45 27 0,45
[168 / 176) 16 0,266666667 43 0,716666667
[176 / 184) 15 0,25 58 0,966666667
[184 / 192) 2 0,0333 60 1
4
• Representar gráficamente el histograma de las frecuencias absolutas.
Grupo Sanguíneo
30
25
20
15
10
0
[160 / 168) [168 / 176) [176 / 184) [184 / 192)
5
• Representar gráficamente el histograma de las frecuencias acumuladas y la ojiva.
60
50
40
30
20
10
0
[160 / 168) [168 / 176) [176 / 184) [184 / 192)
60
50
40
30
20
10
0
[160 / 168) [168 / 176) [176 / 184) [184 / 192)
Media
Hallando la MEDIA se consigue el centro de gravedad de la distribución. Se calcula sumando
los datos y dividiendo entre el tamaño de la muestra, es decir, entre el número total de datos.
Supuestos los datos agrupados en n clases, la media se obtiene de la misma forma sin más que tener en
cuenta que los valores (xi) corresponderán ahora a las marcas de clase y los valores (fi) a las frecuencias
de cada una de ellas.
xi será la marca de clase, que será el valor medio de la clase, es decir, la semisuma de sus límites.
Frecuencia
Intervalo (Altura) Marca de Clase (xi) (xi*fi)
Absolutas (fi)
[160 / 168) 27 164 4.428
[168 / 176) 16 172 2.752
[176 / 184) 15 180 2.700
[184 / 192) 2 188 376
n 60 10.256
N= 60.
(xi*fi*) = 10.256
∑𝑛𝑖=1 𝑥𝑖 𝑓𝑖 10.256
𝑥= = = 170,933
𝑛 60
Mediana
Si suponemos ordenados todos lo valores de una variable estadística, se llama mediana al valor de la
variable tal que existen tantos datos con valores de la variable superiores o iguales a él como inferiores
o iguales a él.
𝑛
[2 − 𝐹(𝑀𝑒)]
𝑀𝑒 = 𝐿𝑖 + 𝐼
𝑓(𝑀𝑒)
7
• f i (16) Frecuencia absoluta de la clase de la mediana
• A (8) Ancho del intervalo
𝑛
[2 − 𝐹𝑖 − 1] 30 − 27
𝑀𝑒 = 𝐿𝑖 + · 𝐴 = 168 [ ] · 8 = 169.5 𝑐𝑚
𝑓𝑖 16
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 169.5 𝑐𝑚
Desviación Típica
Se simboliza por s (a veces también por s (sigma)) a la raíz cuadrada de la varianza, es decir, al valor:
1 𝑛
𝑠 =√ ·∑ 𝑓𝑖 · 𝑥𝑖 2 − 𝑥̅ 2
𝑛 𝑖=1
1
𝑠=√ · 1.756.224 − 170,9332
60
1
𝑠=√ · 1.756.224 − 170,9332
60
𝑠 = √52,3095
8
Coeficiente de Variación
COEFICIENTE DE VARIACIÓN cociente entre la desviación típica y el valor absoluto de la media
aritmética, multiplicado por 100. Se expresa en tanto por ciento, y representa el porcentaje que la desviación
típica representa respecto del valor absoluto de la media aritmética.
𝑆
CV(%)= · 100
[𝑋]
7,2325306
CV(%)= · 100 = 4,231207900171412
170,933
Para hallar la media sin agrupar sumaremos todos los valores sin agrupar y lo
dividiremos por el número total de la muestra, que en este caso son 60.
N=60
10.252,01
𝑥̅ = = 170,866833
60
9
Orden Datos
26 166,25 𝑛 𝑛+1
Mediana= 2 𝑦
27 167,64 2
28 168,11
29 168,31
168,98+169,41
30 168,98 Mediana= 2
= 169,195
31 169,41
32 170,39
33 172,76
34 173,26
̅ )𝟐
∑ 𝒇𝒊(𝒙𝒊 − 𝒙
𝒔𝟐 =
𝑵
𝟏𝟎. 𝟐𝟓𝟐, 𝟎𝟏
̅
𝒙= = 𝟏𝟕𝟎, 𝟖𝟔𝟖𝟑𝟑𝟑
𝟔𝟎
̅ )𝟐
∑ 𝒇𝒊(𝒙𝒊 − 𝒙
𝒔𝟐 = = 𝟕, 𝟒𝟔𝟓𝟑𝟓𝟎𝟏𝟐𝟕
𝑵
𝒔
𝑪𝑽(%) = · 𝟏𝟎𝟎
|𝒙
̅|
𝒔 = 𝟕, 𝟒𝟔𝟓𝟑𝟓𝟎𝟏𝟐𝟕
̅ = 𝟏𝟕𝟎, 𝟖𝟔𝟖𝟑𝟑𝟑
𝒙
𝟕, 𝟒𝟔𝟓𝟑𝟓𝟎𝟏𝟐𝟕
𝑪𝑽(%) = · 𝟏𝟎𝟎
𝟏𝟕𝟎, 𝟖𝟔𝟖𝟑𝟑𝟑
𝑪𝑽(%) = 𝟒, 𝟑𝟔𝟗𝟎𝟔𝟓𝟗𝟑𝟐𝟕𝟕𝟐𝟗𝟐𝟔%
10
Interpreta los gráficos y las medidas de síntesis obtenidas.
Medidas Datos agrupados Datos sin agrupar
Media 𝟏𝟕𝟎, 𝟗𝟑𝟑 𝟏𝟕𝟎, 𝟗
Mediana 𝟏𝟔𝟗. 𝟓 𝟏𝟔𝟗, 𝟐
Desviación Típica 𝟕, 𝟐𝟐𝟓 𝟕, 𝟒𝟎𝟑
Coeficiente de varianza 𝟒, 𝟐𝟐𝟕 𝟒, 𝟑𝟑𝟑
En la tabla de datos agrupados y sin agrupar vemos como en la media y la mediana los resultados
son superiores en los datos agrupados mientras que en la desviación típica y el coeficiente de
varianza los datos sin agrupar son superiores a los agrupados.
En este caso, tendremos que hallar el coeficiente de variación que es especialmente útil para
comparar la dispersión de dos distribuciones, aun cuando las unidades a que estén referidos los
datos de cada una de ellas correspondan a distintas magnitudes. Permite comparar el nivel de
dispersión de dos muestras.
𝒔
𝑪𝑽(%) = · 𝟏𝟎𝟎
|𝒙
̅|
𝑪𝑽(%) = 𝟒, 𝟑𝟔𝟗𝟎𝟔𝟓𝟗𝟑𝟐𝟕𝟕𝟐𝟗𝟐𝟔%
Peso Mc fi Fi hi % Hi
[37-45) 41 5 5 0,08333 8,333% 0,08333
[45-53) 49 5 10 0,08333 8,333% 0,1667
[53-61) 57 8 18 0,1333 13,333% 0,3
[61-69) 65 11 29 0,18333 18,333% 0,48333
[69-77) 73 17 46 0,28333 28,333% 0,767
[77-85) 81 9 55 0,15 15% 0,9167
[85-93) 89 5 60 0,08333 8,333% 1,00
60
11
∑𝒏𝒊=𝟏 𝒇𝒊 · 𝒙𝒊
̅=
𝒙
𝑵
Procedemos a calcular fi · xi =
Peso Mc fi fi· xi
[37-45) 41 5 205,00
[45-53) 49 5 245,00
[53-61) 57 8 456,00
[61-69) 65 11 715,00
[69-77) 73 17 1.241,00
[77-85) 81 9 729,00
[85-93) 89 5 445,00
60 4.036,00
𝟒. 𝟎𝟑𝟔
̅=
𝒙 = 𝟔𝟕, 𝟐𝟔𝟕
𝟔𝟎
1 𝑛
𝑠 =√ ·∑ 𝑓𝑖 · 𝑥𝑖 2 − 𝑥̅ 2
𝑛 𝑖 = 1
Peso Mc fi 𝑥𝑖 2 fi· 𝑥𝑖 2
[37-45) 41 5 1.681,00 8.405,00
[45-53) 49 5 2.401,00 12.005,00
[53-61) 57 8 3.249,00 25.992,00
[61-69) 65 11 4.225,00 46.475,00
[69-77) 73 17 5.329,00 90.593,00
[77-85) 81 9 6.561,00 59.049,00
[85-93) 89 5 7.925,00 39.625,00
60 282.144,00
12
𝑛
∑ 𝑓𝑖 · 𝑥𝑖 2 = 𝟐𝟖𝟐. 𝟏𝟒𝟒
𝑖=1
N= 60
1
𝑠=√ · 𝟐𝟖𝟐. 𝟏𝟒𝟒 − 𝟒. 𝟓𝟐𝟒, 𝟖𝟒𝟗𝟐𝟗
60
1
𝑠=√ · 𝟐𝟖𝟐. 𝟏𝟒𝟒 − 𝟒. 𝟓𝟐𝟒, 𝟖𝟒𝟗𝟐𝟗
60
𝑠 = √176,55071
𝑠 = 13,287238
𝟏𝟑, 𝟐𝟖𝟕𝟐𝟑𝟖
𝑪𝑽 𝒑𝒆𝒔𝒐 = · 𝟏𝟎𝟎
𝟔𝟕, 𝟐𝟔𝟕
Observando la variable peso y altura, podemos afirmar que la variable con mayor dispersión es el
peso con un Coeficiente de variación 𝟏𝟗, 𝟕𝟓𝟐𝟗 ya que es mayor que el de la altura.
E. Usando cada uno de los procedimientos de la página 48-51 del manual, hallar los
percentiles 20, 30, 70 y 80 para la variable Cadera. No repetir procedimiento. Interpretar
el percentil hallado. Nota: Construir el histograma con intervalos de amplitud 8 y siendo
la parte entera de la menor observación el extremo inferior del primer intervalo de la
tabla.
13
Calculamos la siguiente tabla con las frecuencias que son necesarias:
Peso Mc fi Fi hi % Hi
[30-38) 34 1 1 0,01667 1,667% 0,01667
[38-46) 42 0 1 0 0% 0,01667
[46-54) 50 0 1 0 0% 0,01667
[54-62) 58 1 2 0,1667 1,667% 0,0333
[62-70) 66 6 8 0,1 10% 0,1333
[70-78) 74 5 13 0,08333 8,33% 0,218
[78-86) 82 4 17 0,0667 6,67% 0,283
[86-94) 90 14 31 0,2333 23,3% 0,517
[94-102) 98 15 46 0,25 25% 0,77
[102-110) 106 8 54 0,1333 13,3% 0,9
[110-118) 114 2 56 0,0333 3,3% 0,9333
[118-126) 122 4 60 0,0667 6,67% 1,00
60
Percentil 20
𝐾𝑛
𝑐 ( 100 − 𝑓1 −1)
𝑃𝑥 = 𝐿𝑖 +
𝑓𝑖
𝐾 = 20
𝑛 = 60
𝐾𝑛 20.60
= = 12
100 100
𝐿𝑖 = 70
𝐹𝑖 = 13
𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 [𝑎 − 𝑏) 𝑒𝑠 𝐶 = 𝟕𝟎 − 𝟕𝟖 = 𝟖
14
𝐹𝑖 − 1 = 8
𝐹𝑖 = 5
8 ( 12 − 8 )
𝑃20 = 70 + = 70,8
5
𝑃20 = 70,8
Percentil 30
𝐾𝑛
𝑐( 100 − 𝑓1 −1)
𝑃30 = 𝐿𝑖 +
𝑓𝑖
𝐾 = 30
𝑛 = 60
𝐾𝑛 30.60
= = 18
100 100
𝐿𝑖 = 78
𝐹𝑖 = 17
𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 [𝑎 − 𝑏) 𝑒𝑠 𝐶 = 𝟕𝟖 − 𝟖𝟔 = 𝟖
𝐹𝑖 − 1 = 13
𝐹𝑖 = 4
8 ( 18 − 13 )
𝑃20 = 78 + = 70,8
4
𝑃30 = 88
15
Percentil 70
𝐾𝑛
𝑐( − 𝑓1 −1)
𝑃70 = 𝐿𝑖 + 100
𝑓𝑖
𝐾 = 70
𝑛 = 60
𝐾𝑛 70.60
= = 42
100 100
𝐿𝑖 = 94
𝐹𝑖 = 46
𝐹𝑖 − 1 = 31
𝐹𝑖 = 15
8 ( 42 − 31 )
𝑃70 = 94 + = 99,87
15
𝑃70 = 99,87
Percentil 80
𝐾𝑛
𝑐( − 𝑓1 −1)
𝑃80 = 𝐿𝑖 + 100
𝑓𝑖
𝐾 = 80
𝑛 = 60
𝐾𝑛 80.60
= = 48
100 100
16
[102-110) 106 8 54 0,1333 13,3% 0,9
𝐿𝑖 = 102
𝐹𝑖 = 54
𝐹𝑖 − 1 = 46
𝐹𝑖 = 8
8 ( 48 − 46 )
𝑃80 = 102 + = 104
8
𝑃80 = 104
Percentil 20 70,8
Percentil 30 88
Percentil 70 99,87
Percentil 80 104
17
Histograma
120
100
80
60
40
20
0
[30-38) [38-46) [46-54) [54-62) [62-70) [70-78) [78-86) [86-94) [94-102) [102-110)[110-118)[118-126)
Mc fi Fi hi % Hi
F. Compara la distribución de la variable Peso en hombres y mujeres. Para ello realiza en un mismo
gráfico diagramas de cajas y bigotes para esta variable, uno para los hombres y otro para las mujeres.
Analiza e interpreta el gráfico resultante.
Lo primero para realizar esta actividad es ordenar los datos de las observaciones, se parando los
valores de las mujeres y los hombres.
Mujer Hombre
37,51 54,28 72,08 54,59 66,98 76,44
39,19 57,63 72,83 55,87 69,06 77,02
42,86 59,08 74,05 58,61 69,51 77,34
44,05 60,11 74,57 58,97 70,26 77,49
44,71 60,42 75,66 61,47 72,69 77,56
45,3 61,36 76,32 62,42 73,29 78,1
48,2 61,43 77,7 63,01 73,76 79,47
49,52 62,4 79,81 63,62 74,33 92,56
49,59 67,26 83,12 65,56 74,37 96,29
51,48 70,39 92,49 66,67 74,71 96,79
18
CÁLCULO DE CUARTILES
Mujer Hombre
Bigote de la izquierda 37,5 - 49,5 54,59 - 63,62
1ªparte de la caja 49,5 - 60,89 63,62 – 72,99
2º parte de la caja 60,89 – 74,05 72,99 – 77,34
Bigote de la derecha 74,05 – 92,49 77,34 – 96,79
6
72,99
5
4
49.5 74,05
3
37.5 92,49
2
1
60,89
0
0 20 40 60 80 100 120
19
G. Sabiendo que el cuartil 1 puede estimarse como la mediana de las observaciones por debajo de la
mediana y el cuartil 3 como la mediana de las observaciones por encima de la mediana, diseña una
experiencia dinámica para comprender los cuartiles 1 y 3 al estilo de la propuesta en la página 52 del
Manual.
Explicamos en clase que los CUARTILES (Q) tienen la función de informar del valor de la variable
que ocupará la posición (en tanto por cien) que nos interese respecto de todo el conjunto de
variables. Podemos decir que los Cuartiles son unas medidas de posición que dividen a la
distribución en un cierto número de partes de manera que en cada una de ellas hay el mismo de
valores de la variable.
El primer cuartil Q1 es un valor que deje por debajo de él 25% de las y por encima 75% de las
observaciones.
El Q2 que es la mediana (50%).
El cuartil Q3 deja por debajo 75% y por encima 25% de las observaciones.
Cuartil 1
Q1 Q2 Q3 Q4
Cuartil 2
Q1 Q2 Q3 Q4
20
Cuartil 3
Q1 Q2 Q3 Q4
Cuartil 4
Q1 Q2 Q3 Q4
Después de esta explicación realizaremos una actividad que les permitirá adquirir y practicar estos
conceptos. La actividad cuenta con una recogida de datos que ya se hace en la clase desde hace
tiempo. Dichos datos son recogidos por el alumnado todos los meses y el número de alumnado de
clase que trae fruta para desayunar ese día. Esos datos que tenemos recopilados en una tabla.
Vamos a utilizar una aplicación que nos permitirá saber cuáles son los cuartiles Q1 Q2 y Q3 de
esos datos.
http://geogebra.es/gauss/materiales_didacticos/eso/actividades/estadistica_y_probabilidad/medid
as/cuartiles/actividad.html
A través de esta aplicación y por medio de la caja de bigotes el alumnado introducirá los datos
tendrá que averiguar cuáles son los Cuartiles.
Ejemplos de ejercicios
21
También podemos hacer un ejercicio mas visual y manipulativo utilizando una tira de papel con
las medidas hasta el 30 y que esté dividida. Luego colocamos un gomet en el número que se
repite en la tabla de días permita colocar el número de alumnos que traen fruta en los días del
mes. Puse una regla de 30 que son el alumnado.
Colocar los gomet en los puntos sabiendo que el mínimo es 10 y el máximo de alumnado que trae
fruta es 30. Entre esos rangos 10-30 tenemos que buscar los cuartiles Q1 25% Q2 50% y Q3 75%
Ellas intentarán con las operaciones que conocen llegar la conclusión de dónde están los cuartiles.
Q1 Q2 Q3
22
A. Representa gráficamente el diagrama de dispersión de la Altura de la Madre (X)
frente a la variable Altura (Y). Halla el coeficiente de correlación lineal de Pearson e
indica el tipo de correlación (ver al respecto la sección 4.2 del manual). Halla la recta
de regresión de Y dado X. ¿Cuál es la altura de un hijo/a cuya madre tiene una altura
de 1.65 cm?
X = Altura de la madre
Y= Altura del Hijo
Y= 6,0900214+1,0005676 = 7,090589
Y sabiendo que el promedio de la altura de la madre es 165 la altura promedia del hijo es
171,79058
y = 1.8874x - 140.04
R² = 0.8922
200
150
100
50
0
155 160 165 170 175 180
23
B. Representa gráficamente el diagrama de dispersión de la variable Cintura frente a la
variable Cadera. Halla la recta de regresión de la variable Cintura dado Cadera.
Halla la predicción de la variable Cadera para los valores de Cintura 80 y 90 cm.,
respectivamente. ¿Cuál de las dos predicciones es más fiable? Justifica la respuesta.
X= Cadera
Y= Cintura
La recta de regresión es Y dado X
Y= 8,4364255+ 0,7751894
Y= 9,2116149
Y= 9,2116149+80=91,93
Y= 9,2116149+90=100,8
Cintura Cadera
80 91,93
90 100,8
120
100
80
60
40
y = 1,0621x + 7,1281
20
R² = 0,9819
0
0 20 40 60 80 100 120
24