Documentos de Académico
Documentos de Profesional
Documentos de Cultura
AVILA/
ESCUELA DE MATEMATICAS /UNAH
OBJETIVOS DE LA UNIDAD
INTRODUCCION
Los investigadores, en muchos campos, han utilizado la palabra “promedio” para plantearse
preguntas tales como: ¿Cuál es el ingreso promedio de un grupo de personas?; ¿Cuál es su
edad promedio? ¿Cuál es el promedio de calificaciones de un grupo de alumnos en un
examen?, etc.
Para un análisis estadístico no vasta simplemente con conocer las medidas de tendencia
central, otras veces se necesita saber cómo varían cada uno de los elementos del conjunto de
datos con respecto a un valor central, por ejemplo, un alumno de Matemáticas obtuvo una
nota de 70 en Matemática I, donde el puntaje medio es 50, de la misma manera otro alumno
de Sociales obtuvo la misma nota con el mismo puntaje medio en la asignatura de Sociología
I, podemos ver con estos datos no se puede predecir cuál alumno anduvo con mejor puntaje
en su respectiva clase, es necesario conocer el comportamiento de los datos restantes o bien
otra medida que los relacione. Así también dos ciudadanos pueden tener la misma
temperatura promedio anual y sin embargo no necesariamente tienen el mismo clima, para el
caso una podría ser bien cálida en una temporada del año y bien fría en otra, haciendo una
temperatura promedio anual igual a la otra ciudad que es más bien estable. Esto obliga a
considerar otras medidas que llamaremos medidas de tendencia central de dispersión, puesto
que sirven para medir el grado de disparidad de los datos con respecto a un valor de tendencia
central, siendo las más importantes: el rango, la desviación media y la desviación típica.
El rango no da mayor información con respecto a los datos ya que mide únicamente la
variabilidad entre los valores extremos, sin embargo, en combinación con las otras medidas
de dispersión puede ser de utilidad. De las tres medidas de dispersión, la desviación típica se
considera como la más importante puesto que puede emplearse en otros análisis estadísticos
posteriores.
Ejemplo 2.1.1.1.
N
(Xi + Yi) = (X1 + Y1 ) + (X2 + Y2 ) + …….(Xn + Yn )
i=1
= (X1 + X2 +…. + Xn) + (Y1 + Y2 +…. + Yn)
= N N
Xi + Yi
i=1 I=1
Ejemplo 2.1.1.2.
N
aXj = aX1 + aY2 + …….aXn
j=1 = a(X1 + X2 +…. + Xn)
N
= a Xj
j=1
Ejemplo 2.1.1.3.
N
a = a + a + ….. + a = Na
j=1
N Sumas
De acuerdo con los ejemplos anteriores, podemos enunciar las siguientes propiedades:
1) N N
(AXi + BYi) = A Xi + B + Yi =
2) N
a = Na
i=1
10
a) (3Xj + 2)
j=1
10
b) (Xj - 3)2
j=1
Solución:
10 10 10
a) (3Xj + 2) = 3 Xj + 2
j=1 j=1 j=1
= 3(-3) + 2 (10)
= -9 + 20
= 11
10 10
b) (Xj - 3) = (Xj² – 6Xj + 9)
2
j=1 j=1
10 10 10
= Xj² + 6 Xj + 9
J=1 j=1 j=1
= 7 + 18 + 90
= 115
10
Si se desea, se puede omitir el subíndice y utilizar en lugar de en tanto que
j=1
estas abreviaturas no conduzcan a confusión
Se pueden definir varios tipos de medidas de centralización, las más comunes son la medida
aritmética o brevemente media, la mediana, la moda, la media geométrica y la media
armónica. En nuestro estudio trataremos únicamente las tres primeras; la media geométrica
y la media armónica tienen un uso más limitado y por tanto no serán consideradas aquí.
Cada uno de los promedios antes mencionados se calcula de manera diferente y esto hace
que para un problema dado uno de ellos dé una mejor representación de la variante promedio
que las otras dos.
2.1.2.1 Medidas de Centralización para datos no agrupados
Media Aritmética
X = X1+, X2 + X3,+…+..Xn = X
N N
F.1
Ejemplo 2.1.2.1
Encontrar la media aritmética de los pesos en Kg. de cinco estudiantes dados por:
Solución: 𝑋̅ = X1 + X2 + X3 + X4 + X5
𝑋̅ = 60 + 60 + 61 + 62 + 60
5
𝑋̅ = 303
5
= 60.6 Luego x = 60.6 Kg.
Si los números X1 , X2……., X se representan F1, F2, …….Fk), veces, respetivamente (es decir,
se presentan con frecuencia F1, F2, …….Fk), la media aritmética es:
K
Fj Xj
x = j=1 = fX = fX
F
F.2
donde N = f es la frecuencia total, es decir, el número total de casos.
Ejercicio 2.1.2.2.
En una compañía con 60 empleados, 30 ganan L.8.00 por hora, 20 ganan L.10.00 por hora y
10 ganan L.6,00 por hora. Determinar la media del salario por hora.
Solución:
F1 = 30, x1 = L. 8
F2 = 20, x2 = L. 10
F3 = 10, x3 = L. 6, f = 60
Ejemplo 2.1.2.4
Los números 2, 2, 4, 5 y 2, representan las edades en años de cinco niños, comprobar que la
suma de las desviaciones con respecto a la media es cero.
Solución:
X1 = 2 años, X2 = 2 años
X3 = 4 años, X4 = 5 años
X5 = 2 años,
𝑥̅ = X1 + X2 + X3 + X4 + X5
N
𝑥̅ = 2 + 2 + 4 + 5 + 2 = 15 = 3
5 5
MEDIA ARITMÉTICA PONDERADA
A veces se asocia a los números X1, X2, ….Xk ciertos factores o pesos P1, P2, ….Pk que
dependen de la significación o importancia de cada uno de los números.
En este caso:
𝑥̅ = P1 X1 + P2 X2 +.....+ Pk Yk = px
P1 + P2 + ….. + Pk p
Ejemplo 2.1.2.5
Tabla 2.2
Código de
NOMBRE Créditos Calificación
Asignatura
EFD – 291 SEM.EDUC. FISICA 2 82
MM –100 ESTADÍSTICA I 3 68
EDF – 210 SEM.EDUCACIÓN 3 83
EFD – 470 PRACT.PEDAG. 6 91
TOTAL CRÉDITOS 14
Solución:
El índice académico es la media aritmética ponderada donde los pesos o factores son los
créditos de cada asignatura.
P1 = 2, X1 = 82
P2 = 3, X2 = 68
P3 = 3, X3 = 83
P4 = 6, X4 = 91
X = px
p
= 1163
14
𝑥̅ = 83.07
LA MEDIANA ̃“
“𝑿
Los salarios por hora de cinco empleados de una fábrica son L.4.50, L.7.00, L. 6.50, L.19.00,
L. 8.00. Hallar la mediana del salario por hora.
Solución:
Ejemplo 2.1.2.7
Las calificaciones de un estudiante en seis exámenes fueron 84, 91, 72, 68, 87, y 78. Hallar
la mediana de las calificaciones
Solución:
Puestas en orden, las calificaciones son: 68, 72, 73, 84, 87, 91.
Al haber un número para de datos hay dos valores centrales, 78 y 84, cuya media aritmética
1
(78 + 84) = 81 es la media pedida.
2
Observe que el salario medio por hora del ejemplo 2.1.2.6 es L. 9.00, el cual se ve afectado
por el valor extremo L. 19.00, mientras que la mediana no viene afectada por tal valor. En
este caso la mediana da una mejor información que la media sobre los salarios por hora.
LA MODA
Al igual que la media aritmética y la mediana, la moda es otro parámetro que describe la
variante típica. Se define como la variante o atributo que aparece con la mayor frecuencia en
un conjunto de datos.
Ejemplo 2.1.2.8
Estudiante A 60 75 75 80 90
Estudiante B 60 74 82 85 90
Estudiante C 50 50 80 70 70
Solución:
La moda para las calificaciones del alumno A es 75 puesto que es el valor que aparece con
más frecuencia.
Para las calificaciones del estudiante B no existe valor modal ya que todas aparecen con igual
frecuencia.
NOTACIÓN
Por brevedad, de ahora en adelante, representaremos a la mediana de los datos X1, X2,….. Xk
mediante el símbolo X (léase “X colocha”), mientras que la moda de esos mismos datos la
denotaremos por X (léase “X gancho”). En conclusión, si X1, X2,…. Xk representan los
valores de un conjunto de datos u observaciones, entonces:
1.60, 1.65, 1.65, 1.65, 1.65, 1.65, 1.70, 1.70, 1.70, 1.75, 1.75, 1.80, 1.85, 1.85, 1.90
Calcular:
X 𝑥̃ y 𝑋̂
Solución:
7 Mediana 7
Media
Moda aritmética
1.60 1.65 1.70 1.75 1.80 1.85 1.90
1.72
Fig. 2.2
Tres promedios, tres valores distintos. El valor más frecuente (LA MODA), es 1.65, esto
significa que son las personas de esta estatura las que están en mayor número. El valor central
(LA MEDIANA) está representado por aquel individuo que tiene por debajo 7 individuos
más bajos y 7 más altos por encima. “La Media aritmética”, el valor más importante y
práctico, se calcula sumando todas las alturas y dividiendo el resultado por 15. resultado
1.723 metros.
MEDIA ARITMÉTICA
Cuando los datos se presentan mediante una distribución de frecuencias el cálculo de la media
aritmética se puede efectuar aplicando la fórmula: F.2
K
fj Xj
𝑋̅ = j =1 = fx F.2
N N
Ejemplo 2.1.2.10
Los 100 empleados de una fábrica se clasificaron de acuerdo al tiempo durante el cual han
trabajado para la empresa. La distribución es la siguiente:
Tabla 2.4
x f
1 10
4 20
7 28
10 8
13 13
16 12
19 9
N = 100
Una vez hecho esto podemos aplicar cualquiera de los métodos expuestos a continuación:
Método 1
Basándose en la tabla 2.4 se `puede construir una nueva tabla con las mismas columnas de la
tabla 2.4 y una adicional que se encabezará como fX y significará el producto de la frecuencia
por la marca de clase correspondiente, tal como se muestra a continuación:
Tabla 2.5
x f fX
1 10 10
4 20 80
7 28 196
10 8 80
13 13 169
16 12 192
19 9 171
N = 100 fX = 898
Para calcular la mediana para datos agrupados desarrollaremos una fórmula, pero antes
adoptaremos las siguientes convenciones:
( f) am: Suma de las frecuencias de todas las clases por debajo de la clase mediana.
(anterior a la frecuencia de la mediana
f med = ( f) m - ( f) am
Ahora, supongamos que a partir de los datos se construye una ojiva “menor que”, la cual se
muestra en la figura 2.2, en la misma se han representado los puntos más importantes para el
propósito que nos ocupa.
N
𝑋̃ = Li + 2 - ( f) am (c)
fmed
F.4
La cual es una fórmula apropiada para calcular la mediana de la distribución. Observe que al
valor de 𝑋̃ se le asignó N/2. puesto que geométricamente, la mediana es el valor de 𝑋̃
(abscisa) que corresponde a la vertical que divide un histograma en partes de igual área y en
nuestra ojiva “menor que” representa el valor asignado a la mitad de los datos.
Ejemplo 2.1.2.11
Tabla 2.7
Solución:
𝑁 50
= = 25 (mitad del número de datos)
2 2
Puesto que la suma de las frecuencias de las tres y cuatro primeras clases son;
respectivamente 7 + 7 + 10 = 24 y 7 + 7 + 10 + 12 = 36, está claro que la mediana se encuentra
en la cuarta clase, que será, por tanto, la clase mediana. Entonces:
Li = Límite real inferior de la clase mediana = 65.5
N
𝑋̃ = Li + 2 - ( f) am (c)
fmed
LA MODA
Seguidamente desarrollaremos una fórmula para determinar la moda 𝑋̂ de los datos dados
por una distribución de frecuencias, con este objetivo emplearemos las siguientes notaciones:
Li = Límite real inferior de la clase modal (es decir, de la clase donde se encuentra la
moda).
Ls Límite real superior de la clase modal
⏞
𝑋 Moda (como antes)
Ejemplo 2.1.2.12
Hallar la moda correspondiente a los datos de la tabla 2.3, la cual se reproduce a continuación
Tabla 2.3
Solución:
Li = 5.5
1 = 28 – 20 = 8
2 = 28 – 8 = 20
C = 8.5 – 5.5 = 3
∆1
𝑥⏞ = 𝐿𝑟𝑖 + ⌈ ⌉𝑐
∆1 +∆2
( 8 + 20)
⏞ = 6.36 años
Luego, 𝑋
Ejemplo 2.1.2.13
Encontrar la mediana correspondiente a los datos de la tabla 2.3, por dos métodos:
Tabla 2.3
( f)am = 30
Fmed = 28
C = 3
{ N
𝑋̃ = Li + 2 - ( f) am (c )
𝑓𝑚𝑒𝑑
𝑋̃ = 7.643
̃
𝑋 = 7.64 años
a) Basándonos en los resultados de los ejercicios anteriores, tenemos que 𝑥̅ = 8.98 y ⏞
𝑥
= 6.36, media y moda respectivamente luego:
𝑋̅ - 𝑋̂ = 3(𝑋̅ – 𝑋̃)
8.98 – 6.36 = 3(8.98) – 𝑥̃)
2.62 = 26.94 – 3X
3X = 26.94 – 2.62
2X = 24.32
𝑥̃ = 8.11 años
OBS: 𝑋̅ = MEDIA, 𝑋 ⏞ = MODA, 𝑋̃ = MEDIANA.
MEDIA CUADRÁTICA
La media cuadrática de una serie de números X1, X2, ……, Xn se representan a veces por:
𝑵 𝟐
MC = √∑𝟏 𝑿
𝑵
Ejemplo 2.1.2.14
La media cuadrática de los números 1, 3, 4, 5 y 7 es:
Solucion
𝟏𝟐 +𝟑𝟐 +𝟒𝟐 +𝟓𝟐 +𝟕𝟐 𝟏𝟎𝟎
MC = √ = √ = √𝟐𝟎 = 𝟒. 𝟒𝟕
𝟓 𝟓
EDAD(AÑOS): 22 24 25 26 27 28
28 29 30 31 33 34
La edad promedio queda bien representado por la media aritmética. Si bien podrían haberse
utilizado la mediana y la moda, elegimos la media aritmética por dos razones:
Primero, la mayoría de las personas están más familiarizadas con la media que con la mediana
o la moda, y segundo, no hay ninguna ventaja en elegir la mediana o la moda cuando los
valores de las tres medidas son casi iguales (media = 28.1, mediana = 28, moda = 28).
Examinando los ingresos anuales, vemos que dos personas del grupo tienen ingresos
extremadamente altos, lo cual afecta más a la media que a la mediana; la media es L.48750
y la mediana L.24300. La mediana representa a la mayoría de las variantes en tanto que la
media a ninguna de ellas. La mediana da el mejor promedio en caso de ingresos.
En cuanto al número de zapato, tanto la media como la mediana dan resultados que en cierto
modo carecen de sentido (media = 9.92, mediana = 9.75), ninguna de las cuales representa
un número efectivo de zapato. La moda, por otra parte, representa un número efectivo de
zapato de cuatro miembros del grupo, por lo cual es un promedio mejor en este caso.
Es evidente que las ilustraciones anteriores constituyen una simplificación ya que en cada
caso la elección del promedio adecuado resulta obvia. Sin embargo, destaca el hecho de que
la elección de los tres parámetros depende del propósito para el cual se recolectó la
información, así como también la naturaleza de ésta.
En muchos problemas estadísticos la elección entre media, mediana y moda puede no ser
obvia; por tanto, pueden ser de utilidad algunos comentarios generales acerca de las ventajas
y desventajas de cada una de estas medidas.
Primero, debe destacarse que la media aritmética es la más conocida y mejor comprendida
por el público general.
Segundo, la media aritmética permite en general en forma mucho más expedita, el análisis
estadístico posterior.
Por estas razones, la mayoría de los estudios estadísticos consideran la media aritmética como
promedio.
Sin embargo, la media aritmética tiene la desventaja de ser muy afectada por los valores
extremos, lo cual no ocurre con la mediana y la moda. Por tanto, cada vez que existan
variantes extremas (altas o bajas, la mediana y la moda son preferidas a la media aritmética.
EJERCICIOS 2.1
2.1.1. Halle las sumas siguientes:
6
a) ( 3j – 2)
j=1
7
b) ( j + 2)2
j=1
5
𝑗
c)
𝑗−1
j=2
3
d) K
k = -2 k+3
3
e) ( Xj + Yj)
j=1
n
f) ( 4 + 5Xj )
j=1
n
g) Xj Yj
j=1
a) 3 + 4 + 5 + 6
b) X1 Y1 + X2 Y2+ X3 Y3
c) 2 + 4 + 6 + 8 + 10
d) X1 + Y1 + 3 + X2 Y2+ 3 + X3 Y3 + 3
f) X1 Y1 + Z1 + X2 Y2+ Z2 + X3 Y3 + Z3
j XJ YJ ZJ
1 10 5 3
2 12 10 6
3 14 15 9
4 16 20 12
) 4
( 2Xj - 3Yj)
j=1
4
b) ( Xj - Yj + Zj)
j=1
3
c) ( Xj Yj - Zj)
j=1
4
d) ( Xj + 2Yj - Zj)
j=1
a) 2,3,3,4,4,4,5,5,5,5,6,6,7
b) 1,3,4,5,5,5,5,7,7,8,9,10
Encuentre: 𝑋̅, 𝑋̂ y 𝑋̃
Encuentre:
a) 𝑋̅ b) 𝑋̃ c) 𝑋̂
2.1.8 Los 10 miembros del Club “Los Madrugadores” tienen las siguientes características.
Cociente intelectual:
96, 97, 102, 102, 103, 105, 107, 108, 111, 137
Peso (Kilogramos)
Número de sombrero
1Sea una distribución estadística que viene dada por la siguiente tabla:
Calcular:
Sea una distribución estadística que viene dada por la siguiente tabla:
Calcular:
b)El rango.
•
• La frecuencia acumulada ( ) para calcular la mediana
•
• El producto de la variable por su frecuencia absoluta ( ) para calcular la
media
Moda
Mediana
Media
•
• Los valores de la variable ( ).
•
• Las frecuencias absolutas ( ).
Moda
Mediana
.
Media
.
4Hallar la media, mediana y moda de la siguiente serie de números:
Solución
Moda
Mediana
La serie tiene un número par de puntuaciones, la mediana será la media entre las dos
puntuaciones centrales.
Media
De
Hallar la Media
Media
.
a)
b)
Calcular
•
• La moda, la mediana y la media.
Moda
Mediana
Media
8 Una distribución estadística viene dada por la siguiente tabla:
10 - 14
15 - 19
20 - 24
25 - 29
30 - 34
Hallar:
Fa
10 - 14
15 - 19
20 - 24
25 - 29
30 - 34
• Moda
• . ∆1 = 7 - 5 = 2
• . ∆2 = 7 - 4 = 3
• ∆1 + ∆2 = 2+3=5
• Mediana
• .
• Lri = 19.5.
• .
• .
• .
• Media
0-4
5-9
10-14
15-19
20-24
25- ∞
Hallar:
0 - 4
5 - 9
10 - 14
15 - 19
20 - 24
25 - ∞
Moda
En primer lugar, buscamos el intervalo donde se encuentra la moda, que será el intervalo
que tenga la mayor frecuencia absoluta ( )
Mediana
Clase de la mediana: 15 - 19
Aplicaremos la fórmula para el cálculo de la mediana para datos agrupados, extrayendo los
siguientes datos:
Lri = 14.5
No se puede calcular la media, porque no se puede hallar la marca de clase del último
intervalo
xi fi
[10, 20) 15 1
[20, 30) 25 8
[30,40) 35 10
[40, 50) 45 9
[50, 60 55 8
[60,70) 65 4
[70, 80) 75 2
xi fi xi · fi
[10, 20) 15 1 15
[20, 30) 25 8 200
[30,40) 35 10 350
[40, 50) 45 9 405
[50, 60 55 8 440
[60,70) 65 4 260
[70, 80) 75 2 150
42 1820
xi fi
[60, 63) 61.5 5
[63, 66) 64.5 18
[66, 69) 67.5 42
[69, 72) 70.5 27
[72, ∞ ) 8
100
En este caso no es posible hallar la media porque no podemos calcular la marca de clase
de último intervalo.
¿Qué es la mediana?
La mediana es el valor que ocupa el lugar central de todos los datos cuando éstos están
ordenados de menor a mayor.
3Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos
puntuaciones centrales.
es la amplitud de la clase o C
La mediana es independiente de las amplitudes de los intervalos
NOTA
Respecto a las preguntas 7 y 10 a todos les sumare los puntos que corresponden
al examen n ° 1