Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Unidad No. 02 MDTC y MDD
Unidad No. 02 MDTC y MDD
1.1.1 Media
La Media es una de las medidas estadísticas más utilizada, también es conocida
bajo el nombre de Promedio o Promedio Aritmético. Se obtiene sumando todos
los datos y dividiendo el resultado dentro de la cantidad de datos. Se representa
con:
• 𝑥̅ ó M cuando se trate de datos tomados de una muestra.
• µ cuando se trate de datos tomados de una población.
80, 90, 60, 70, 75, 50, 60, 55, 40, 80, 70, 65, 60, 55, 70
∑ 𝑛𝑜𝑡𝑎𝑠 980
M = 𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑛𝑜𝑡𝑎𝑠 = 15
= 65.33
200,000
𝑀= = 𝑄16,666.67
12
Entonces si alguien le pregunta a un empleado incauto que cuánto ganan en esa
empresa, este diría: “Mirá, en promedio ganamos casi Q17,000.00”, siendo su
realidad Q14,000.00 diferente si es de los que ganan Q3,000.00.
2 | e-Learning
Es necesario ver el cuadro completo y para ello nos apoyaremos en las otras
medidas de tendencia central que veremos más adelante.
Ahora bien cuando contamos con muchos datos y estos han sido tratados con una
Tabla de Distribución de Frecuencias nos apoyaremos en Excel para su cálculo, pero
tal y como se señaló en la introducción de esta unidad en este curso no estaremos
haciendo cálculos sino que comprendiendo lo que es la Media o Promedio así como
las demás medidas a estudiar.
CLASES
f F fr xi
Límite inferior Límite superior
1 38 50 4 4 0.08 44
2 51 63 12 16 0.24 57
3 64 76 19 35 0.38 70
4 77 89 11 46 0.22 83
5 90 102 4 50 0.08 96
n= 50 1
Observaciones:
• Podemos ver que el resultado 69 cae dentro de la clase número 3 y está a
una sola unidad de la marca de clase que es 70, recordemos que la marca
de clase es el dato que mejor representa la clase y la clase 3 es la clase con
mayor frecuencia o sea que este valor de Media si está representando
adecuadamente al conjunto de datos.
20
18
16
14
12
10
8
6
4
2
1.1.2. Mediana
La Mediana es una Medida de Tendencia Central que nos da el valor del
dato que está a la mitad de los datos cuando estos están ordenados y se
simboliza con Me.
Les recuerdo que en este curso estaremos dando los valores de las medidas
para analizarlas y así alcanzar conclusiones del conjunto de datos.
1.1.3. Moda
La Moda es una Medida de Tendencia Central que nos da el valor del dato
que más se repite y se simboliza con Mo.
4 | e-Learning
• Moda = 68 años
Como se puede ver prácticamente comparten el mismo valor y esto salta a
la vista en el Polígono de Frecuencia.
5 | e-Learning
Ahora bien, cuando las Medidas de Tendencia Central NO son iguales y la
diferencia es significativa el Polígono se deforma y toma un sesgo, ya sea a
la izquierda o hacia la derecha tal y como se muestra en el gráfico siguiente:
Observaciones importantes:
• La Mediana siempre está “en medio” de la Media y la Moda tanto
para el polígono con sesgo a la izquierda como para el que tiene
sesgo a la derecha.
• La Moda siempre está bajo la parte alta del polígono, esto es así
para los tres casos.
• La Media siempre está del lado de la cola tanto para el polígono con
sesgo a la izquierda como para el que tiene sesgo a la derecha.
Conclusiones:
6 | e-Learning
• Debido a que los valores difieren por bastantes años, el polígono de
frecuencias es sesgado.
• Debido a que la Media es el valor menor entonces es sesgada a la
izquierda. (En el eje de las x el cero está a la izquierda y por lo tanto
los números menores están hacia ese lado y los mayores hacia la
derecha).
• Debido a que la Moda es el valor mayor nos confirma el sesgo a la
izquierda y en el valor de la Moda encontraremos la parte más alta
del polígono.
• Podemos dibujar un polígono “aproximado” sin necesidad de la
Tabla de Distribución de Frecuencias, como el siguiente:
Se nos dan las siguientes Medidas de Tendencia Central sobre los salarios
de cierta empresa:
• Media = Q14,000
• Mediana = Q8,000
• Moda = Q3,000
7 | e-Learning
La mayoría de los empleados están casi en el sueldo mínimo, pero hay unos
pocos empleados que ganan más de Q14,000 mensuales.
Las Medidas de Dispersión nos indican que tan dispersos son los datos de un conjunto
de datos es decir nos indica que tan alejados están los valores de los datos del valor de
la Media, la Medida de Dispersión más utilizada es la Desviación Estándar.
La Desviación Estándar nos indica que tan separados se encuentran todos los
datos de su Media. La desviación estándar suele ser positiva y solamente puede
8 | e-Learning
ser cero si el valor de todos los datos son el mismo, es decir no hay variación
entre un dato y otro. Entre más variación hay entre los datos, más grande es la
desviación estándar. El valor de la desviación estándar tiene las mismas
dimensionales que los datos y se representa con la letra S ó SD para muestras y
con la letra griega σ para poblaciones.
Observaciones:
• Cada polígono de frecuencia representa un conjunto diferente de
datos, lo que tienen en común es su media y que son simétricos.
• El valor de cero en la gráfica ocupa la posición de la media de un
polígono de frecuencias simétrico, el valor de la media puede ser cero
como en la gráfica o cualquier otro valor.
• La diferencia entre polígonos es su valor de Desviación Estándar.
• Como se puede ver el polígono más alto (SD = 0.5) es el más estrecho
por lo tanto no existen datos ni muy a la izquierda de la media ni muy a
la derecha de esta, la mayoría de los datos de ese conjunto de datos se
encuentran amontonados alrededor de la media. Por lo tanto su
desviación estándar es pequeña, tal y como lo señala el gráfico.
• El polígono de frecuencia más bajo (SD = 2) es el más ancho de los tres
implicando que hay datos lejanos de la media tanto a la izquierda como
a la derecha y por eso su deviación estándar es la más alta.
9 | e-Learning
• El polígono con SD = 1 tiene una desviación estándar intermedia, ese
conjunto de datos no tiene tan amontonados su datos alrededor de la
media y tampoco los tiene muy dispersos.
• Por cierto, la altura de los polígonos es indiferente, se les ha dado
diferente altura solo para poder diferenciarlos y porque ya indicamos
que son conjuntos de datos diferentes.
Un hijo presenta a sus padres las notas mensuales de tres de sus cursos, ¿en
cuál curso tuvo mayor éxito sobre sus compañeros? (los tres conjuntos de datos
presentan polígonos simétricos)
A pesar de que estadística es su nota más baja es en la que tuvo mayor éxito
“en comparación” a sus compañeros pues supera a la media por 20 puntos y la
desviación estándar es de 10 puntos lo cual nos indica que hay bastantes
reprobados, pues la media es de 60 puntos y él está en el extremo derecho
probablemente con la nota más alta. Ahora bien en Física también supera a la
media por 20 puntos pero la desviación estándar es de 20 puntos, esto nos
indica que hay más estudiantes que les fue mejor en física y por último su nota
más alta es de 92 puntos en matemática, pero es la de menor éxito en
comparación con los demás, pues la desviación estándar tan baja indica que
casi todos sacaron la misma nota alrededor de los 90 puntos.
La regla indica:
• Aproximadamente el 68% de todos los valores de los datos están dentro
de UNA desviación estándar hacia cada lado de la media.
• Aproximadamente el 95% de todos los valores de los datos están dentro
de DOS desviaciones estándar hacia cada lado de la media.
• Aproximadamente el 99.7% de todos los valores de los datos están
dentro de TRES desviaciones estándar hacia cada lado de la media.
10 | e-Learning
Esto nos permite clasificar un dato dentro de ciertos límites, estos límites
establecen un grupo él cual cumple con ciertas características.
La Media del Coeficiente Intelectual para adultos es 100 punto con un polígono
de frecuencias simétrico, su desviación estándar es de 15 puntos. Utilizando la
Regla Empírica que indica que el 68% de cualquier conjunto de datos está
dentro de una Desviación Estándar hacia cada lado de la Media podemos
calcular los valores de CI que determinan las fronteras de la “normalidad”.
Sustituimos valores:
100 − 15 = 85
100 + 15 = 115
Entonces:
𝑙í𝑚𝑖𝑡𝑒 𝑖𝑧𝑞𝑢𝑖𝑒𝑟𝑑𝑜 = 85
Por lo tanto una persona “normal” tiene un CI entre 85 y 115 puntos y forma
parte del 68% de la población tal y como se muestra en el gráfico siguiente:
11 | e-Learning
La Asociación Internacional de Superdotados MENSA, exige que para poder
formar parte de la asociación es necesario tener un coeficiente intelectual
mayor a las tres desviaciones estándar a partir de la media, ¿qué valor de CI
necesitamos tener para poder formar parte de MENSA?
Se necesita tener como mínimo un CI de 145 puntos para poder formar parte
de MENSA, ¿clasifica usted?, solamente un 0.15% de la población mundial
clasifica, es decir la pequeña cola de la derecha del gráfico mostrado abajo
(señalada con la flecha roja), esto implica que el 99.85% de la población
quedamos fuera.
100 − 15 = 85 − 15 = 70
12 | e-Learning
Entonces vemos que el puntaje de la persona está a la izquierda de la media
entre la primera desviación estándar y la segunda desviación estándar, lo cual
coloca a la persona entre el 13.5% inferior a lo normal, tal y como se muestra:
Los recién nacidos varones en Guatemala tienen una media de peso de 6 libras con
una desviación estándar de 1.3 libras, para que un recién nacido reciba tratamiento
especial en un hospital por falta de peso, su peso debe estar entre el 2.35% inferior
de la gráfica. ¿Cuál es el peso que determina si un bebe recibe tratamiento especial
o no?
Vemos que el área 2.35% a la izquierda de la media tiene una frontera a la derecha
que está determinada por dos desviaciones estándar, por lo tanto:
13 | e-Learning
1.2.2 Coeficiente de Variación
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝐸𝑠𝑡á𝑛𝑑𝑎𝑟
𝐶𝑉 = × 100
𝑀𝑒𝑑𝑖𝑎
0.06
𝐶𝑉 𝑒𝑠𝑡𝑎𝑡𝑢𝑟𝑎 = × 100 = 3.75%
1.6
26
𝐶𝑉 𝑝𝑒𝑠𝑜 = × 100 = 15.72%
172
Observaciones:
• Podemos concluir que hay una mayor variación en los pesos de los hombres
que en sus estaturas puesto que 15.72% es mucho mayor que 3.75%, lo cual
es lógico pues en lo que respecta a pesos podemos encontrar con facilidad
hombres que pesan hasta el doble que otros hombres, pero este no es el
caso en las estaturas, no es común encontrar a un hombre con el doble de
estatura que otro.
14 | e-Learning