Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Probabilidad y Estadistica Medida Central PDF
Probabilidad y Estadistica Medida Central PDF
En estadística a la palabra promedio se le conoce como media aritmética. Calcular la media aritmética
para pocos datos es cosa sencilla, pero se complica cuando el número de datos se incrementa de manera
considerable.
Antes de iniciar con la descripción de las fórmulas que se utilizan para el cálculo de las medidas de
tendencia central (media, mediana y moda), es conveniente recordar que en estadística se trabaja con dos
conjuntos: población y muestra.
Si el cálculo se realiza sobre datos muestrales, a los resultados se les conoce como estadísticos; mientras
que si los cálculos se realizan sobre toda la población, se les conoce como parámetros.
Calculando
promedios
Juan es un productor de cerdos y piensa vender seis de ellos a un comprador que le ofrece $10,000 por los
seis cerdos, pero el comprador no está dispuesto a pesarlos; dice que si los pesan, seguramente le pagará
más dinero a Juan porque el kilo de cerdo está en 22 pesos. Juan le pide que lo espere dos días mientras
se decide.
Juan piensa que criar seis cerdos no es tan sencillo y no quiere entregarlos sin obtener una ganancia. Tan
pronto se fue el comprador de cerdos, Juan pesó a los seis animales, obteniendo los siguientes registros:
87, 96, 102, 81, 93 y 105 kilos.
©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.
Revisor: Emilio González
• ¿Cuál es el promedio del peso de los seis cerdos que tiene Juan?
El promedio del peso de los seis cerdos es 564/6 = 94, es decir, 94 kilogramos.
Media
aritmética
Imagina que un panadero quiere saber si sus conchas tienen el tamaño adecuado de acuerdo al precio que
cobra por ellas. Para saberlo, tomó ocho conchas de un lote de 50 y pesó cada una por separado.
El peso en gramos de cada una de las conchas fue: 50, 52, 58, 56,48, 62, 39 y 42 gramos.
Dado un conjunto de datos 𝑥! , 𝑥! , . . . , 𝑥! , se define la media aritmética muestral 𝒙 de ese conjunto de datos
como:
Σ 𝑥!
𝑥=
𝑛
El símbolo ∑ se lee como ‘sumatoria de’ y significa que lo que esté enfrente se debe de sumar.
De la misma manera, se define la media aritmética poblacional µ como:
Σ 𝑥!
µμ =
𝑁
Los valores para nuestro conjunto de datos son el peso de cada concha:
! !! !"!!"!!"!!"!!"!!"!!"!!" !"#
𝑥= = = = 50.87
! ! !
Es decir, el peso promedio de las conchas es 50.87 gramos. ¿Notaste que hubo una pieza de pan que pesó
más de 60 gramos y otra que pesó menos de 40?, ¿qué piensas?
En los ejemplos anteriores, calculamos la media aritmética de pocos datos que, además, no estaban
organizados. Cuando los datos están organizados en una distribución de frecuencias simple o de intervalos,
la media aritmética se calcula con la expresión:
2
©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.
Revisor: Emilio González
Σ 𝑓! ∙ 𝑥!
𝑥=
𝑛
Ejemplo
Calificación Frecuencia 𝒇𝒊 𝒙𝒊
𝒙𝒊 𝒇𝒊
2 0 0
3 2 6
4 5 20
5 7 35
6 8 48
7 10 70
8 8 64
9 6 54
10 4 40
50 337
Figura 1. Tabla de frecuencia.
En la figura 1 se observa que Σ 𝑓! 𝑥! = 337 y que n = 50. Por lo tanto, la media aritmética del conjunto de
observaciones es:
Σ𝑓! ∙ 𝑥! 337
𝑥= = = 6.74
𝑛 50
Cuando los datos están agrupados en clases, como en la tabla 1, la media aritmética se calcula con la
misma expresión, sólo que ahora x representa la marca de clase.
Σ𝑓! ∙ 𝑥!
𝑥=
𝑛
©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.
Revisor: Emilio González
En la tabla 1 se observa que Σ 𝑓! . 𝑥! = 11005 y que 𝑛 = 180. Por tanto, la media aritmética de los datos
de la tabla 1 es:
Σ 𝑓! 𝑥! 11005
𝑥= = = 61.14
𝑛 180
Ahora que ya has estudiado la media aritmética, que es uno de los parámetros más útiles de la estadística,
revisarás la moda.
La
moda
¿A qué te suena la palabra moda?
Ésta se usa normalmente para referirnos a lo que la gente usa: vestidos, pantalones, bolsos, gorras, lentes
o cualquier otro accesorio. Entonces, ¿qué es la moda?, ¿es una forma de vestir?, ¿cuándo se considera
que algo está de moda o que ya pasó de moda?
Una respuesta puede ser que lo que está de moda es lo que más prefiere la gente. Lo que ya pasó de
moda puede ser algo que se usó pero que actualmente ya no. ¿Se te ocurre algo más?
El número que más se repite es el 7, ya que aparece 5 veces. En este caso decimos que la moda de este
conjunto de datos es Mo = 7.
©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.
Revisor: Emilio González
Marca de
Frecuencia
Clases clase 𝒇𝒊 𝒙𝒊
𝒇𝒊
𝒙𝒊
42-46 44 2 88
47-51 49 9 441
52-56 54 31 1674
57-61 59 50 2950
62-66 64 51 3264
67-71 69 30 2070
72-76 74 7 518
180 11005
Tabla 2. Tabla de distribución de frecuencias.
La clase con la frecuencia mayor es 62-66 con f = 51. Sin embargo, nota que la clase 57 – 61 tiene una
frecuencia f = 50, por lo que son las dos clases de mayor frecuencia (f), pero en este caso sólo la clase 62-
66 tiene el mayor número y, por lo tanto, esa es la moda.
En distribuciones de frecuencias con intervalos, la moda es la marca de clase con la mayor frecuencia por
lo que, si consideramos las dos modas:
Mo1 = 59 y Mo2 = 64
Es importante notar que una distribución puede tener más de una moda o puede no tener moda. Cuando un
conjunto de datos no tiene moda significa que ningún dato u observación se está presentando más que los
demás de manera significativa.
Si recordamos el peso de las conchas del panadero: 50, 52, 58, 56, 48, 62, 39 y 42, ningún dato aparece
más que los demás. Por lo tanto, este conjunto de datos no tiene moda. Sencillo, ¿no?
A diferencia de la moda, el cálculo de la tercera medida de tendencia central, la mediana, es un poco más
complicado... pero sólo un poco, así que no hay de qué preocuparse.
La
mediana
La mediana (𝑥) es la última de las medidas de tendencia central que analizaremos. ¿Alguna idea del
significado de la mediana? Suena a que es algo que está en medio, ¿o no?
©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.
Revisor: Emilio González
Una consideración importante para la determinación de la mediana es que los datos deben estar ordenados
por magnitud, es decir, de menor a mayor. Después de esto se debe encontrar la posición en la que se
ubica la mediana, a través de la fórmula:
2(𝑛 − 1)
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑜𝑛𝑑𝑒 𝑠𝑒 𝑢𝑏𝑖𝑐𝑎 𝑙𝑎 𝑥 = +1
4
Ejemplo
40 50 52 60 62 70 90
2 7−1 2 6 12
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑜𝑛𝑑𝑒 𝑠𝑒 𝑢𝑏𝑖𝑐𝑎 𝑙𝑎 𝑥 = +1= +1= +1=3+1=4
4 4 4
40 50 52 60 62 70 90
Posición 1 Posición 2 Posición 3 Posición 4
↑
Valor central
En caso de que el valor de la posición tenga un decimal de 0.5 (por ejemplo: 5.5, 9.5 o 10.5) se sacará el
promedio del número que ocupe la posición inmediata anterior y la del número que ocupe la posición
inmediata superior.
Ejemplo
Para el conjunto
27 30 31 34 40 41 44 54
6
©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.
Revisor: Emilio González
2 8−1 2 7 14
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑜𝑛𝑑𝑒 𝑠𝑒 𝑢𝑏𝑖𝑐𝑎 𝑙𝑎 𝑥 = +1= +1= + 1 = 3.5 + 1 = 4.5
4 4 4
27 30 31 34 40 41 44 54
↑ ↑
Valores centrales
34 + 40 74
𝑥= = = 37
2 2
Calificación Frecuencia
X f
2 0
3 2
4 5
5 7
6 8
7 10
8 8
9 6
10 4
50
Tabla 3. Tabla de distribución de frecuencias.
!"!!
Como 𝑛 = 50, la mediana será el valor que ocupa el lugar = 25.5
!
7
©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.
Revisor: Emilio González
Con el propósito de visualizar el dato que ocupa la posición 25.5 en nuestra distribución de frecuencias
simple, a continuación se muestra nuevamente la tabla 3, ahora como tabla 4, agregando la columna de
la frecuencia acumulada:
¿Por qué si hay un número par de datos no se calculó la media aritmética de los valores centrales?
Porque en este caso, los dos valores centrales son ambos el número 7 y, al calcular, la media aritmética
sigue siendo 7.
Mediana
de
un
conjunto
de
datos
en
una
distribución
de
frecuencia
con
intervalos
El cálculo de la mediana en una distribución de frecuencias con intervalos implica la serie de pasos que se
describen a continuación:
1. Determina la clase que contiene a la mediana. Esta clase se llama clase de la mediana y es la
!
que contiene el valor que ocupa el lugar , en donde n es el número total de datos.
!
2. Calcula la frecuencia acumulada que corresponde a la clase inmediata inferior a la clase de la
mediana.
3. Determina la frecuencia de la clase de la mediana.
4. Determina el ancho de la clase.
5. Determina el límite inferior de la clase de la mediana.
6. Aplica la fórmula:
©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.
Revisor: Emilio González
𝑛
− 𝑓𝑎
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑥 = 𝐿 + 2 ×𝑖
𝑓
En donde:
Como la clase de la mediana es la clase que contiene el dato que ocupa la posición 90, en este caso
la clase de la mediana es 57 – 61 porque en esa clase se encuentra el dato que ocupa la posición
90. En la última columna de la tabla se indica que los datos de esta clase van desde el dato en la
posición 43 hasta el dato en la posición 92.
©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.
Revisor: Emilio González
2. Luego se necesita determinar la frecuencia acumulada (fa) de la clase inmediata inferior a la clase
de la mediana. Esto se puede determinar inspeccionando la tabla 6 (la cual ya incluye la frecuencia
acumulada).
𝑛
− 𝑓𝑎
𝑀𝑑𝑛 = 𝐿 + 2 × 𝑖
𝑓
180
− 42
𝑀𝑑𝑛 = 57 + 2 × 5
50
𝑀𝑑𝑛 = 61.8
10
©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.
Revisor: Emilio González
Además de la media aritmética, existen la media ponderada y la media geométrica, las cuales son muy
útiles en situaciones específicas. La tabla 7 muestra la fórmula que se utiliza para calcularlas. Se incluye
también la media aritmética para tenerla de referencia.
Fórmula
Media aritmética 𝑥!
𝑥=
𝑛
Media ponderada 𝑥! 𝑊!
𝑥! =
𝑊!
Media geométrica MG = n X 1 X 2 X 3 ! X n
La media ponderada es utilizada cuando, al calcular un promedio, algunos de los datos a considerar
tienen un peso mayor que los demás. Vamos a ver de qué se trata.
Rubro Ponderación
Promedios 40 %
parciales
Examen final 50 %
Trabajo final 10 %
Tabla 8. Ponderaciones.
Si Raúl obtuvo un promedio parcial de 83, 75 en su examen final y 92 en el trabajo final, ¿cuál es la
calificación que aparecerá en su boleta?
Para resolver el problema, debemos tomar en cuenta que las calificaciones no tienen el mismo peso, es
decir, el examen final es la calificación con el mayor peso en la calificación (50 %) mientras que el trabajo
final es la de menor peso (10 %). Por ello, para calcular la media ponderada es necesario incluir dos
columnas más: la columna peso (𝑊! ) y la columna del producto 𝑥! 𝑊! .
11
©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.
Revisor: Emilio González
Σ !! ! !
𝑥! =
Σ !!
799
𝑥! = = 79.9
10
Σ !! ! !
𝑥! =
Σ !!
Sin embargo, la media ponderada no se utiliza sólo para obtener promedios. Veamos el siguiente ejemplo.
12
©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.
Revisor: Emilio González
127.4
𝑥! =
29
𝑥! = 4.393
Esto significa que la utilidad promedio de La Veracruzana en la venta de sus escobas es de $4.393.
13
©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.
Revisor: Emilio González
Año Ingreso
(en pesos)
2002 142,000
2003 152,000
2004 168,000
2005 223,000
2006 262,000
Tabla 11. Ingresos del empresario Negrete.
Para determinar la media geométrica, primero es necesario calcular el porcentaje de aumento de los
ingresos por cada año. En otras palabras, ¿qué incremento tuvieron los ingresos de 2002 a 2003? Este
incremento se calcula dividiendo el ingreso del año 2003 entre el ingreso del año 2002, es decir:
152,000
= 1.07
142,000
Lo anterior significa que el incremento fue de 0.07 o del 7 %. De la misma manera se calculan los demás
incrementos. Los resultados de los cálculos se muestran en la tabla 12.
La media geométrica (MG) se determina calculando la enésima raíz del producto de n números mediante
la fórmula:
MG = n X 1 X 2 X 3 ! X n
Sustituyendo tenemos:
MG = 4 (1.070)(1.105)(1.327)(1.174) = 1.1649
14
©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.
Revisor: Emilio González
Lo anterior significa que el incremento promedio porcentual de los ingresos de Eduardo es 0.1649 (o 16.49
%).
El error o diferencia entre los resultados parece no ser significativo. Antes de llegar a una conclusión al
respecto, analiza la tabla 13 que compara ambos resultados.
Usando X Usando X M
142000x1.169=165998 142000x1.1649=165415
165998x1.169=194051 1655415x1.1649=192691
164862x1.169=226845 192691x1.1649=224465
226845x1.169=265181 224465x1.1649=261479≈262000
265181 es mayor que 262000 261479 es prácticamente igual que 262000
Tabla 13. Comparación de ambos métodos.
En este ejemplo viste la forma de calcular la media geométrica. Queda de manifiesto que, en ocasiones, es
más apropiado utilizarla que la media aritmética. Por último, debido a que el incremento promedio
porcentual de los ingresos de Eduardo es de 16.49 % y es superior al promedio estatal (13 %), él ha
decidido no cambiar de compañía de publicidad.
MG = n X 1 X 2 X 3 ! X n
15
©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.
Revisor: Emilio González
Por otro lado, el inconveniente de la moda es que en ocasiones no existe y cuando hay más de una moda
su existencia puede no ser de gran ayuda.
El anterior análisis no significa que una medida de tendencia central sea mejor que la otra, sólo te invita a
utilizar la más adecuada para un conjunto de datos en específico.
16
©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.
Revisor: Emilio González
Referencias
Bibliografía
17
©UVEG. Derechos reservados. Esta obra no puede ser reproducida, modificada, distribuida, ni transmitida, parcial o totalmente, mediante cualquier medio, método o
sistema impreso, electrónico, magnético, incluyendo el fotocopiado, la fotografía, la grabación o un sistema de recuperación de la información, sin la autorización por
escrito de la Universidad Virtual del Estado de Guanajuato.