Está en la página 1de 15

6.

Media Aritmética 

MEDIA ARITMETICA PARA DATOS NO AGRUPADOS. La media aritmética, o


simplemente media de un conjunto N de números X1, X2, X3,…, Xn se denota por
X, (léase X testada) se define por:

X = X1+X2+X3+...Xn / N
donde N es el número de datos.

Ejemplo 1.La media aritmética de los números 8,3,5,12 y 10 es :

X = 8+3+5+12+10 / 5 = 38 / 5 = 7.6

CÁLCULO DE LA MEDIA PARA DATOS AGRUPADOS

1. Obtención de la media por las Marcas de Clase.

Ejemplo 2. Utilice la distribución de frecuencias mostrado en la siguiente tabla para


determinar la estatura promedio de los 100 estudiantes de una universidad estatal (Ver
tabla 3).

Estatura en pulgadas Número de estudiantes


60-62 5
63-65 18
66-68 42
69-71 27
72-74 8
TOTAL 100
Estatura (plg) Marcas de Clase Frecuencia fx
60-62 61 5 305
63-65 64 18 1152
66-68 67 42 2814
69-71 70 27 1890
72-74 73 8 584
Total   N = 100 Suma de fx = 6745
Tabla 3. Obtención de la media por las marcas de clase
Las marcas de clase se obtienen promediando los límites de cada intervalo. Por
ejemplo, para obtener la marca de clase del intervalo 60-62 se obtiene como
60+62/2= 61, la de 63-65 se obtiene como 63+65/2 = 64, etc. La cuarta columna ( f
x ) se obtiene multiplicando cada frecuencia por su respectiva marca de clase, por
ejemplo, (61) (5) = 305, (70) (27) = 1890, etc.

Por lo que la media aritmética se obtiene como se indica enseguida:

Media Aritmètica = Suma de fx / N = 6745/100 = 67.45 pul


Este último valor es, entonces, la estaura promedio de los estudiantes de esa
universidad.

2. Obtención de la media por el método de Codificación.

Para calcular la media por éste método utilizaremos la fórmula:

X = Xo + W*[SUMA DE (U*F)] / N

El asterísco (*) de la fórmula indica multiplicación.

Donde:

X: Media de la muestra.
Xo: Marca de clase a la cual se le asigna el código 0.
w : Amplitud del intervalo de clase.
u : Código asignado a cada clase.
f : Frecuencia de cada clase.
n :Total de datos.

Este método se caracteriza por colocar códigos enteros positivos y negativos a todos los
intervalos. Los negativos se colocan arriba de la marca de clase asignada por el código cero
(Xo) El código 0 se puede colocar en cualquier intervalo pero por lo regular se asigna en la
clase que esté mas al centro. Para este caso se colocará en el intervalo 66-68. Todo lo
anterior se muestra como sigue:

Estatura (plg) Marcas de Clase Frecuencia Código (U) U*F


60-62 61 5 -2 -10
63-65 64 18 -1 -18
66-68 67 42 0 0
69-71 70 27 1 27
72-74 73 8 2 16
Total   N =100   Suma de U*F =+15
Por lo tanto, aplicando la fórmula anterior, se obtiene sustituyendo valores:

X = 67 + 3*[15] / 100 = 67.45 plg

El resultado es idéntico al anterior. En otros problemas de este mismo tipo podría


presentarse una diferencia entre éste método y el anterior pero no muy
significativo: (solo en los decimales)

La mediana 

La mediana es una medida de tendencia central diferente de la media que hemos


venido explicando hasta ahora. La mediana es solo un valor del conjunto de datos
que mide el elemento central de los datos. El elemento es el mas central en el
conjunto de números. La mitad de los elementos se encuentran por arriba de este
punto y la otra mitad cae debajo de él.

1. Cálculo de la mediana a partir de datos no agrupados.

Ejemplo 1. NÚMERO DE DATOS IMPAR. La siguiente serie de números tiene 7


elementos (número impar) 3, 5, 9, 11, 14, 21, 23 por lo que el valor central
(mediana) es 11. Nótese también que la serie ya está ordenada en forma
ascendente.

Ejemplo 2. NÚMERO DE DATOS PAR. Examinemos los datos que aparecen en


la siguiente tabla concernientes al número de pacientes atendidos diariamente
durante ocho días en la sala de urgencias de un hospital. Los datos se disponen
en orden descendente:

No. de pacientes: 86, 52, 49, 43, 35, 31, 30, 11

La mediana será el valor promedio de los dos valores centrales, que en este caso
son 43 y 35:

Me = 43+35/2 = 39 pacientes

2. Cálculo de la Mediana a partir de datos agrupados.


Para calcular la mediana, los estadísticos aplican una ecuación que les permita
calcular la mediana de los datos agrupados. En el caso de una muestra, dicha
ecuación será:

Me = {W[(n+1)/2 - (F + 1)]/Fm} + Lm

Me = Mediana de la muestra.

n = Número total de elementos de la distribución.

F = Suma de todas las frecuencias de clase hasta un intervalo antes de la


mediana de clase.

Fm = Frecuencia de la mediana de clase.

W = Amplitud de intervalo de las clases.

Lm = Límite inferior del intervalo de mediana de clase.

Ejemplo. Determinar la mediana de los saldos mensuales en dólares por 600


clientes de una ciudad.

Los datos se muestran en la siguiente tabla:

Clases en dólares Frecuencia (f)


0-49.99 78
50-59.99 123
100-149.99 187
150-199.99 82
200-249.99 51
250-299.99 47
300-349.99 13
350-399.99 9
400-449.99 6
450-499.99 4
TOTAL 600

Localización de la mediana de clase. Primeramente de esos 600 clientes se


debe determinar cuál de los 10 intervalos contiene la mediana. Para hacerlo es
preciso sumar las frecuencias en la columna correspondiente a ellas en la tabla
anterior. Para esto, se suma el total de los elementos mas 1 y se divide entre dos
como sigue: puesto que hay 600 cuentas, el valor (n+1)/2 = (600+1)/2 = 300.5 (o
sea, la mediana se encuentra entre los elementos 300 y 301). El problema reside
en encontrar los intervalos de clase que contienen a esos elementos. La
frecuencia acumulativa de las dos primeras clases es apenas 78+123=201. Pero
cuando llegamos al tercer intervalo, se suman 187 elementos al 201 dándonos un
total de 388. Por tanto, las observaciones 300 y 301 deben situarse en esta
tercera clase (el intervalo entre $100.00 y $149.00).

Al aplicar la ecuación anterior para calcular la mediana de los saldos de las


cuentas de cheques, entonces n = 600, F=201, Fm = 187, w = $50 y Lm=$100.

Me = {W[(n+1)/2 - (F + 1)]/Fm} + Lm

Me = {50[(600+1)/2 - (201 + 1)]/187} + 100

Simplificando primeramente las cantidades contenidas en los signos de


agrupaciòn mas internos (paréntesis) se obtiene:

Me = {50[601/2 - 202]/187} + 100

Efectuando la división:

Me = {50[300.5 - 202]/187} + 100

Efectuando la sustracción:

Me = {50[98.5]/187} + 100

Multiplicando 50 por 98.5:

Me = {4925/187} + 100

Dividiendo por 187:

Me = 26.33 + 100

Por lo tanto, el valor buscado es:

Me = $126.33
La moda

La moda es una medida de tendencia central que difiere de la media, pero que se parece un
poco a ella porque realmente no se calcula por medio de los procesos ordinarios de la
aritmética. La moda es el valor que mas se repite dentro del conjunto de datos. Como en
cualquier otro aspecto de la vida, el azar interviene de manera importante en la ordenación
de los datos. Algunas veces hace que algún elemento no representativo se repita bastante a
menudo y sea el valor mas frecuente del conjunto de datos. Por tal razón, rara vez
utilizamos como una medida de tendencia central la moda de datos agrupados. Por ejemplo,
la tabla siguiente muestra el número de viajes de reparto que diariamente hizo una planta de
concreto. El valor modal es 15 por ocurrir mas a menudo que los demás (3 veces). Una
moda de 15 implica que la actividad de la planta es mayor a 6.7 (esta es la respuesta que
obtendríamos si calculáramos la media). La moda nos indica que 15 es el número mas
frecuente de viajes, pero no nos permite conocer que la mayor parte de los valores son
menores que 10.

Viajes dispuestos en orden ascendente


0 2 5 7 15
0 2 5 7 15
1 4 6 8 15
1 4 6 12 19

Cálculo de la Moda a partir de datos agrupados. Cuando los datos ya están agrupados
en una distribución de frecuencia, debemos suponer que la moda se halla en la clase que
tenga mas elementos, es decir, que posea la frecuencia mas elevada. ¿Pero como podemos
determinar un solo valor de la moda con esta clase modal? El método de calcular la moda
cuando contamos con datos agrupados consiste en aplicar la siguiente ecuación:

Mo = LMo + [D1*(W)]/(D1 + D2)

Donde:

 Mo= Moda para datos agrupados.


 LMo = Límite inferior de la clase modal.
 D1 = Frecuencia de la clase modal menos la frecuencia de la clase que
se encuentra inmediatamente arriba de ella.
 D2 = Frecuencia de la clase modal menos la frecuencia de la clase que
se encuentra inmediatamente debajo de ella.
 W = Amplitud del intervalo de la clase modal.
Ejemplo. Calcular la moda de los saldos de las cuentas de cheques de la tabla donde se
obtuvo la mediana.

Clases en dólares Frecuencia (f)


0-49.99 78
50-59.99 123
100-149.99 187
150-199.99 82
200-249.99 51
250-299.99 47
300-349.99 13
350-399.99 9
400-449.99 6
450-499.99 4
TOTAL 600

Se tiene que: LMo = $100, D1 = 187-123 = 64, D2 = 187-82 = 105 y W = 50.

Mo = LMo + [D1*(W)]/(D1 + D2)

Mo = 100 + [64(50)]/(64 + 105)

Resolviendo las cantidades entre paréntesis, se obtiene:

Mo = 100 + [3200]/(169)

Efectuando la división:

Mo = 100 + 18.93 = 118.93

Redondeando el valor de la moda es:

Mo = $119

Varianza y Desviación Estándar 


Varianza de la Población. En las siguientes secciones, vamos a centrarnos mas
en la población que en la muestra. Comenzaremos con el hecho de que cada
población tiene una varianza, la cual se representa por 2 (sigma al cuadrado). La
varianza de la población se parece a una desviación absoluta promedio calculada
para una población entera. Solo que en este caso se eleva al cuadrado, lo que
origina que automáticamente todos los números se vuelvan positivos. No
necesitamos tener en cuenta el valor absoluto de la desviación. La expresión con
que se calcula la varianza es la siguiente:
 

 2
=

f( X - µ )2 / N
Donde:

2 = Varianza de la población.
 Desviación estándar de la población = raíz cuadrada de la varianza.
f = Frecuencia de cada una de las clases.

X = Marcas de clase.
μ = Media de la población.
N = Tamaño de la población

∑ =Letra griega "sigma" que indica suma.


 
Ejemplo
1                                                                                                                                     
     MERCADOTECNIA 
 

    El vicepresidente de mercadotecnia de una cadena de locales de comida de preparación rápida está estudiando las ventas
de 100 locales situados en el Distrito Federal y ha preparado la siguiente distribución de frecuencia de las ventas anuales.

    Determinar la varianza y la desviación estándar de dichos locales.


 
 
CLASE          M.C. (X)       FREC. (f)       f x       MEDIA ( µ )     X- µ     ( X-µ )2    f
( X-µ )2      
700-799          750                   4              3000       1250              -500        250,000    

1,000,000      

800-899          850                   7              5950       1250              -400        160,000    

1,120,000

900-999          950                   8              7600       1250              -300          

90,000       720,000
1000-1099    1050                10            10500       1250              -200          

40,000       400,000

1100-1199    1150                12            13800       1250              -100          

10,000       120,000

1200-1299    1250                17            21250       1250                    0                   

0                    0

1300-1399    1350                13            17550       1250                100          

10,000       130,000

1400-1499    1450                10            14500       1250                200          

40,000       400,000

1500-1599    1550                  9            13950       1250                300          

90,000       810,000

1600-1699    1650                  7            11550       1250                400         160,000   

1,120,000

1700-1799    1750                  2              3500       1250                500        

250,000       500,000

1800-1899    1850                  1              1850       1250                600        

360,000       360,000

                                  Total   100       ∑fx = 125,000                                   ∑f ( X-µ )

2
 = 6,680,000

 
 

 
    Resolución. Las clases y las frecuencias son los datos que deben conocerse
de la tabla. Los cálculos son todos los datos en azul marino.
 
    Para calcular la varianza y la desviación estándar primeramente debemos
calcular la media poblacional. Analizando se observa que: ∑fx = 125,000.
 
    Por lo que el valor de  la media aritmética es:
 
    µ =∑( f x ) / n = 125,000 / 100 = $1250 US.
 
   En la última columna de la tabla, se observa que:  ∑f ( X-µ )2 = 6,680,000
 
    Por lo que los valores buscados son:
 

 2 =
Σ f ( X - µ )2 / N = 6,680,000/100 = $66,800 dólares al cuadrado
( Varianza ).
 
y:
 = raíz cuadrada de $66,800 = $258.5 (Desviación estándar).

Tipos de variables
    A) ALEATORIAS. Una variable aleatoria es una regla bien definida para asignar
valores numéricos a todos los resultados posibles de un experimento. Esto
significa que los símbolos utilizados por ejemplo como en una moneda, “cara” o
“cruz”, “defectuosos”, etc., serán sustituídos aquí por números. Los resultados de
algunos experimentos satisfacen fácilmente esta definición de variable aleatoria,
ya que originalmente son números bien definidos. Por ejemplo, la duración de una
lámpara (en horas), el número de piezas defectuosas en un lote de transistores y
la ganancia que se espera obtener con una inversión de $1000 son números bien
definidos. En otros casos, los resultados pueden ser de naturaleza cualitativa. Por
ejemplo, e resultado del lanzamiento de una moneda puede ser cara o cruz, y la
calificación obtenida en un curso podría ser A, B, C, D ó F. Esto es lo que se hace
con los registros de muchas universidades, cuando se asigan valores numéricos a
las calificaciones, de modo que A=4, B=3, C=2, D=1 y F=0. Cuando se lanza una
moneda, una forma común de definir una variable aleatoria es la de hacer cara=1
y cruz=0.

    B) CONTINUAS. Si un experimento puede dar lugar a un número infinito y no


enumerable de resultados, entonces la variable aleatoria correspondiente debe ser
continua. Cuando el valor de la variable aleatoria se mide y no se cuenta, queda
definida como una variable aleatoria continua. Como ejemplos de resultados que
se miden y que no se cuentan, mencionamos el nivel de agua de un lago, la
presión en una caldera, la distancia entre dos puntos y aún el número de onzas de
una caja de cereales. Las variables continuas pueden ser tambien los resultados
de hacer mediciones, por ejemplo: la edad, peso, tamaño del piso, altura de una
persona, etc y cuentan con parte entera y parte decimal.

    C)  DISCRETAS. Son aquellas que se expresan por medio de valores enteros
(sin parte decimal).

    D) CUANTITATIVAS. Son aquellas cuya categoría puede expresarse


numéricamente. La naturaleza numérica de las variables cuantitativas permite un
tratamiento estadístico mas elaborado debido a las operaciones matemáticas que
permiten. Por ello facilitan una descripción mas precisa y detallada de la variable.
Las variables cuantitativas pueden ser (según los valores que pueda tomar la
variable) discretas o continuas.

    E)  CUALITATIVAS. Todas las cualitativas (región, ciudad, partido al que vota,
sentimiento religioso, ve o no ve la tele...) Las de escala ordinal cuando no las
“transformamos” en cuantitativas: opinión sobre algo (muy buena, buena, regular, mala,
muy mala) Algunas variables cuantitativas: las que tienen pocos valores (número de
personas en el hogar, número de partidos políticos en el ayuntamiento...).

9. Gráficas

    Una gráfica es una relación pictórica de la relación entre dos variables. En estadística se
emplean muchos tipos de gráficas, de acuerdo a la naturaleza de los datos y el propósito
que se tenga. Entre ellas están las gráficas de barras, las gráficas de pastel, etc.

Ejemplo 1                                                                      Estaturas de estudiantes


de una universidad

La siguiente tabla muestra el número de una muestra de 100 estudiantes y sus


intervalos de estatura de cierta universidad. Realizar:

a)Una gráfica de barras horizontal.   

b)Un diagrama de barras vertical.          

 A continuación de muestra la tabla con sus respectivos diagramas de barras verticales y


horizontales:                                        

Estatura (plg) No. de estudiantes


60-62 5
63-65 18
66-68 42
69-71 27
72-74 8
Total 100

     

      Fuente: National Center for Health Statics, Vital and Health Statics
Ejemplo 2                                                                                                                    
Los Grandes Lagos

    La siguiente tabla muestra el área de los cinco grandes lagos bajo jurisdicción
de los Estados Unidos. Graficar los datos utilizando un diagrama de pastel.

                                                          

Gran Lago Área (en millas cuadradas)


Michigan 22342
Superior 20557
Hurón 8800
Erie 5033
Ontario 3446
Total 60178

A la figura
mostrada se le
llama gráfica
de pastel,
gráfica circular
ó diagrama
circular. Para
construirla, se
hace
corresponder
el área total,
60178 millas
cuadradas,
equivalente a los 360o del círculo. De este modo, una milla cuadrada corresponde
a 360o/60178. Se deduce que el Lago Superior, con 20557 millas cuadradas,
ocupa un arco de 20557(360o/ 60178 = 123o), mientras que los lagos Michigan,
Hurón, Erie y Ontario ocupan arcos de 134o, 53o, 30o y 20o respectivamente. Las
líneas divisorias se pueden trazar usando un transportador o bien graficando en
papel polar. Este se último se puede bajar desde la página:      

 www.printfreegraphpaper.com

Ejemplo
3                                                                                                                                     
      Aviación

La siguiente tabla se basa en los valores proporcionados por el Annual Report de la Boeing
Company en 1974. Construir un diagrama de pastel para la acumulación de pedidos
pendientes, de acuerdo con la categoría del pedido.

Categoría Cantidad($)
Aviación Comercial 2732
Misiles y naves espaciales 408
Aviación Militar 639
Otros 45

La gráfica de dicha distribución de frecuencia se muestra enseguida:

Ejemplo
4                                                                                                                                     
               VIH

  La siguiente tabla muestra el número de pacientes en miles, dados de alta en


hospitales, con el virus de inmunodeficiencia humana (VIH), desde 1990 hasta
1994. Grafique estos datos utilizando una grafica de líneas.

Año 1990 1991 1992 1993 1994


Altas de pacientes con VIH 146 165 194 225 234

En esta gráfica, el número


de pacientes dados de alta
con el diagnóstico de VIH
es la variable dependiente
y el tiempo la variable
independiente. Los puntos
se localizan, como siempre, mediante las coordenadas tomadas en la tabla. Por
ejemplo: (1990,146). Despuès se unen los puntos sucesivos con una línea recta. A
esta gráfica se le llama gráfica de línea

También podría gustarte