Está en la página 1de 16

m2

m2 microobjetivos

• Proporcionar datos resumidos de las características de una población, indi-


cando sus valores centrales, tales como la media, la moda, la mediana para
indicar el comportamiento de la misma.
• Indicar las medidas de posición más usuales: los cuantiles que permitirán
clasificar los datos en porcentajes por debajo de un cuantil correspondiente,
estos pueden ser cuartiles, deciles y percentiles.
• Identificar el modo de cálculo de las medidas de dispersión alrededor de los
valores centrales, a fin de analizar el comportamiento de las variables en
estudio.

m2 contenidos

Medidas de Resumen
El gerente general de una cadena de comida rápida
está interesado en el comportamiento de las ventas
de las 55 sucursales que se encuentran en el depar-
tamento central y ha construido la siguiente distribu-
ción de frecuencia para las ventas mensuales
A continuación le presento la siguiente tabla con
datos referentes al tema introductorio:

Ventas (miles Gs.) Frecuencia


700 – 799 14
800 – 899 7
900 – 999 28
1.000 – 1.099 2
1.100 – 1.199 4
Total 55

Al gerente le gustaría comparar las ventas del departamento central, con las
ventas de las ciudades de Encarnación y Ciudad del Este. Para llevar a cabo esto,
podemos ayudar al gerente elaborando un resumen de la distribución, poniendo
especial cuidado en el acopio de información sobre la tendencia central de los
datos, pero también es importante medir la variabilidad de la distribución, para
sacar una conclusión mucho mejor a partir de los datos.
Para ayudar a la gerencia del ejemplo anterior y para muchas otras situaciones
que se presentan a menudo en los negocios u otras actividades que requieren
toma de decisiones, las medidas de tendencia central sirven como soporte, pues
éstas tienen como objetivo, sintetizar los datos en un valor representativo com-
plementándose con las medidas de dispersión que indican hasta qué punto estas
medidas de tendencia central son representativas como síntesis de la informa-

UCP | INGENIERÍA COMERCIAL | estadística administrativa - pag.22


ción. Para variables numéricas o cuantitativas, en las que puede haber un gran
número de valores observados distintos, se ha de optar por un método de análisis
distinto, respondiendo a las siguientes preguntas:
• ¿Alrededor de qué valor se agrupan los datos?
• Supuesto que se agrupan alrededor de un número, ¿cómo lo hacen? ¿muy
concentrados? ¿muy dispersos?

Las medidas de centralización vienen a responder a la primera pregunta. Es


decir que estas medidas de centralización, sirven para describir un aspecto de
los datos, un promedio como la Media o la Mediana sólo localizan el centro de
los datos. Eso es valioso desde ese punto de vista, pero un promedio no nos dice
nada acerca de la dispersión de los datos, para esto utilizaremos las medidas de
dispersión o variabilidad. Si el valor de estas medidas de dispersión es pequeño,
nos indica que los datos están estrechamente agrupados alrededor de la Media,
entonces la media se considera representativa de los datos, es decir, la Media es
un promedio confiable. Inversamente, una medida de dispersión grande indica
que la Media no es confiable, no es representativa de los datos.
En este Módulo vamos a abordar el tema de las medidas de resumen: las de
tendencia central más usuales y a mencionar las no centrales (unas y otras
también se conocen como medidas de posición centrales y no centrales) y vamos
a complementarlas con las medidas de Dispersión o Variación y Asimetría.
El siguiente esquema muestra la clasificación de las medidas de resumen más
utilizadas:

Medidas de Tendencia Central


Uno de los principales objetivos del análisis estadístico, es obtener cifras concisas,
que describan numéricamente gran cantidad de datos, difíciles de manejar. Un
tipo importante de medición numérica es el promedio. Los promedios son valores
numéricos que tienden a localizar, en algún sentido, la parte central de un conjunto
de datos; se les conoce también como medidas de posición, las más usuales son:

UCP | INGENIERÍA COMERCIAL | estadística administrativa - pag. 23


la media aritmética, la mediana y la moda.
()
♦ La Media aritmética o Promedio x : por su facilidad de cálculo y sus
propiedades matemáticas, es el promedio más conocido y de mayor utilización
en el análisis estadístico tanto en el campo administrativo, financiero, como
en el vasto campo de la investigación científica, indica el valor central de los
datos se calcula aplicando la siguiente fórmula:
x1 + x 2 + x3 + .... + x n
Para datos sueltos: x = o bien utilizando el símbolo de
n
n
xi
sumatoria x =∑
i =1 n
Ejemplo:
a. Los salarios semanales en miles guaraníes de 5 empleados de una pequeña
empresa familiar son: 200; 120; 300; 350 y 150, hallar el salario promedio
semanal e interpretar su resultado

200 + 120 + 300 + 350 + 150 1.120


x= = = 224 , esto implica que el salario
5 5
promedio semanal de los 5 empleados de esa empresa es Gs. 224.000 semanal

Si en el ejemplo anterior se incorpora el salario semanal del gerente general que


es de 5.000 (que además es el propietario de la empresa), entonces el salario
promedio sería:

200 + 120 + 300 + 350 + 150 + 5000 6.120


x= = = 1.020
6 6

En ese caso el salario promedio semanal es de Gs. 1.020.000!!! Este es un ejem-


plo en el cual el promedio no es un buen indicador como valor central pues, ana-
lizando los datos, vemos que ninguno de los empleado llega a percibir ni la mitad
del salario promedio (excepto el propietario).
Esta es una desventaja del promedio como medida de tendencia central (como ya
lo hemos mencionado anteriormente): cuando los datos no son homogéneos el
resultado se ve afectado por los valores extremos y proporciona una información
distorsionada de la realidad. De aquí la importancia de complementar las medi-
das de centralización con las de dispersión (que veremos más adelante), pues
éstas nos indican el grado de confiabilidad del promedio.
f1 X 1 + f 2 X 2 + f 3 X 3 + ..... + f n X n
Para datos agrupados x= , o bien,
f1 + f 2 + f 3 + ..... + f n
n
f X 
x = ∑  i i 
i =1  fi 

Donde:
f i : es la frecuencia de la i-ésima clase
Xi.: es la marca de clase

Ejemplo1: La Tabla Nº 1, contiene datos de los puntajes de 55 alumnos obtenidos


en un examen parcial de Estadística; utilizaremos los datos de la tabla para
obtener el puntaje promedio correspondiente.

UCP | INGENIERÍA COMERCIAL | estadística administrativa - pag.24


(limites de Clase) Cantidad de Alumnos
Puntaje (fi)
21 – 30 3
31 – 40 5
41 – 50 15
51 – 60 8
61 – 70 11
71 – 80 6
81 – 90 5
91 – 100 2
Total 55

Tabla Nº 1

(limites de Clase) Cantidad de Alumnos Marca de clase fi X i


Puntaje (fi) (Xi)
21 – 30 3 25,5 76,5
31 – 40 5 35,5 177,5
41 – 50 15 45,5 682,5
51 – 60 8 55,5 444
61 – 70 11 65,5 720,5
71 – 80 6 75,5 453
81 – 90 5 85,5 427,5
91 – 100 2 95,5 191
Total 55 3.172,5

Para obtener el puntaje promedio, primero hay que hallar la marca de clase de
cada intervalo, posteriormente multiplicar este resultado por las frecuencias y
hallar la suma de la misma.
Recordemos que la marca de clase se obtiene por medio de la semisuma de los

límites de clase, es decir, para la 1ra. clase tenemos:

, para la 2da. clase: y así sucesivamente.

La tercera columna se obtiene multiplicando los datos de la 2da columna con los
de la 3ra. columna de la tabla, luego se suman estos valores para obtener
n
f X 
∑fX i i = 3.172,5, luego aplicando la fórmula x = ∑  i i
fi
 se obtiene
i =1  
que es puntaje promedio o la calificación media del

grupo.

♦ La Media Aritmética Ponderada: es cuando se asocia con los valores x1, x2,
... , xn, ciertos factores o pesos n1, n2, . . . , nn, dependientes de la relevancia
asignada a cada número, en este caso se tiene:

UCP | INGENIERÍA COMERCIAL | estadística administrativa - pag. 25


n1 x1 + n2 x 2 + n3 x3 + ... + n n x n n
ni xi
x= x=∑
n1 + n2 + n3 + ... + nn i =1 ni
Ejemplo 1: Si el examen final de un curso cuenta tres veces más que una evalua-
ción parcial, y un estudiante tiene calificación 85 en el examen final y 70 y 90 en
los dos parciales, la calificación media es:

Ejemplo 2: La siguiente tabla, resume los datos de accidentes de motos diarios


que el Centro de Emergencias Médicas registró durante 60 días, en los meses de
noviembre – diciembre de 2009:

Nº de accid. Frecuencia (ni)


Por día (xi) xi n i
1 9 9
2 8 16
3 12 36
4 10 40
5 7 35
6 6 36
7 5 35
8 3 24
Total 60 231

Hallar la media aritmética e interpretar su valor


n
ni xi
x=∑ = = 3,85 ≅4 en promedio se registraron 4 accidentes
i =1 ni
diarios en motos en los meses noviembre-diciembre de 2009.

♦ La Moda (Mo): es el valor que ocurre con mayor frecuencia, la moda puede
no existir, e incluso no ser única en caso de existir. Las series que no tienen
modas se denominan “amodales”, las que tienen una moda se denominan
“unimodales”, las que tienen dos modas “bimodales” y las que tienen más de
dos modas “multimodales”

Ej. La moda entre: 4, 5, 6, 5, 5, 6, 6, 3, 3 y 6 es: 6 (unimodal)

La moda para datos agrupados está dada por la fórmula:


 ∆1 
M o = li +  c
 ∆1 + ∆ 2 

UCP | INGENIERÍA COMERCIAL | estadística administrativa - pag.26


Donde:
li = limite inferior de la clase modal.
∆1 = frecuencia de la clase modal menos la frecuencia de la clase anterior a la
modal.
∆2 = frecuencia de la clase modal menos la frecuencia de la clase posterior a la
modal.
c = tamaño del intervalo de la clase modal.

Ejemplo 2: hallar la calificación modal del ejercicio 1:

(limites de Clase) Cantidad de Alumnos


Puntaje (fi)
21 – 30 3
31 – 40 5
41 – 50 15
51 – 60 8
61 – 70 11
71 – 80 6
81 – 90 5
91 – 100 2
Total 55

Analizando los datos de la tabla, vemos que la 3ra clase es la que tiene mayor
frecuencia (ésa se elige como la clase modal), por tanto: el limite inferior de la
clase modal es: 41, ∆1 = 15 – 5 = 10 y ∆2 = 15 - 8 = 7 luego, aplicando la fórmula
 ∆1 
M o = li +  c , tenemos
 ∆1 + ∆ 2 

♦ La Mediana (Me): Es el valor de la variable que separa la serie de datos


objeto de análisis, una vez ordenados, en dos partes iguales (total que un
50% de los datos quedan por encima de la mediana y el otro 50% por debajo
de dicho valor). Como la mediana está determinada por el número y orden
de los datos y no por sus valores particulares, tiene la gran ventaja de que no
está afectada por valores extremos. Para el cálculo, si el número de datos de
una serie es impar, la mediana es el valor de la variable que corresponde a la
frecuencia central (la que alcanza el 50%). Si el número de datos de la serie
es par, la mediana es el valor de la variable que corresponde al promedio de
los dos valores centrales

Ejemplo: la mediana de 10, 11, 14, 16, 17 es: 14; en cambio la mediana de: 10, 11,

14, 16, 17 y 20 es: 15, que se obtiene de la siguiente forma:

La mediana para datos agrupados está dada por la fórmula:


n
 − (∑ f )1 

M e = li +  2 .c
 f Me 
 
 
Donde:
li = Límite inferior de la clase mediana

UCP | INGENIERÍA COMERCIAL | estadística administrativa - pag. 27


n = nro. de datos (frecuencia total).
(f)1 = suma de frecuencias de las clases inferiores a la de la mediana.
ƒMe = frecuencia de la clase de la mediana.
c = tamaño del intervalo de la clase mediana.

Ejemplo 3: continuando con el ejemplo 1, hallar la calificación mediana del curso


e interpretar su resultado:

(limites de Cantidad Frecuencia


Clase) de Alumnos acumulada
Puntaje (fi) Fc
21 – 30 3 3
31 – 40 5 8
41 – 50 15 23
51 – 60 8 31
61 – 70 11 42
71 – 80 6 48
81 – 90 5 53
91 – 100 2 55
Total 55

Para el cálculo de la mediana necesitamos la frecuencia acumulativa creciente:


(calculamos en la 3ra columna de la tabla anterior) y para determinar la clase
n
mediana, lo primero que debemos es calcular , en nuestro ejemplo es
2
con este valor nos vamos a la tabla de frecuencias acumuladas y

buscamos la 1ra clase cuya frecuencia acumulada sea mayor que 27,5, en este
caso es la 4ta clase (cuya frec acum.. es 31 > 27,5) por tanto el limite inferior de
la clase mediana es: li 51, y la suma de frecuencias inferiores a la clase mediana
es: (Σf)1 = 23, la frecuencia de la clase mediana es: ƒMe = 8, luego se aplica la
fórmula:
n
 − (∑ f )1 

M e = li +  2 .c = ≈ 57
 f Me 
 
 
Este resultado nos indica que aproximadamente el 50% de los alumnos obtuvieron
una calificación inferior a 57 puntos.
• Medidas de Posición: conocidas también como cuantiles son valores de
la distribución que la dividen en partes iguales, es decir, en intervalos, que
comprenden el mismo número de valores. Los más usados son los cuartiles,
los deciles y los percentiles, estas medidas se parecen mucho a la mediana,
porque también, subdividen a una distribución de mediciones de acuerdo con
la proporción de frecuencias.
• Cuartiles: son los tres valores que dividen al conjunto de datos ordenados en
cuatro partes iguales, son un caso particular de los percentiles:
- El primer cuartil Q1 es el menor valor que es mayor que una cuarta parte
de los datos
- El segundo cuartil Q2 (la mediana), es el menor valor que es mayor que
la mitad de los datos
- El tercer cuartil Q3 es el menor valor que es mayor que tres cuartas partes

UCP | INGENIERÍA COMERCIAL | estadística administrativa - pag.28


de los datos
• Deciles: son los nueve valores que dividen al conjunto de datos ordenados
en diez partes iguales, son también un caso particular de los percentiles
• Percentiles: son los 99 valores que dividen en cien partes iguales el conjunto
de datos ordenados. Ejemplo, el percentil de orden 15 (P15) deja por debajo
al 15% de las observaciones, y por encima queda el 85%

Ejemplo: Dada la siguiente distribución en el número de hijos (xi) de cien familias,


calcular sus cuartiles.
xi fi Fi
0 14 14
1 10 24
2 15 39
3 26 65
4 20 85
5 15 100
  100  

Solución:
n
Primer cuartil Q1: , buscar la primera Fi > = 39 luego Q1= 2
4
2n
Segundo cuartil Q2: , buscar la primera Fi > = 65 luego Q2= 3
4
3n
Tercer cuartil Q3: , buscar la primera Fi > = 85 luego Q3= 4
4

• Fórmula para datos agrupados:

Cuartiles Deciles Percentiles


 kn
− (∑ f )1 


Qk = li +  4 c
 fQ 
 
 

(limites de Clase) Cantidad de Alumnos Frecuencia acumulada


Puntaje (fi) Fc
21 – 30 3 3
31 – 40 5 8
41 – 50 15 23
51 – 60 8 31
61 – 70 11 42
71 – 80 6 48
81 – 90 5 53
91 – 100 2 55
Total 55

UCP | INGENIERÍA COMERCIAL | estadística administrativa - pag. 29


Ejemplo 4: continuando con el ejemplo 1, hallar el tercer cuartil (Q3), el sexto decil
(D6) y el percentil 42 (P42) del curso e interpretar su resultado:
El cálculo de los cuartiles, deciles y percentiles son semejantes a la mediana, o
sea necesitamos la frecuencia acumulativa creciente: y para determinar la clase

cuartil, lo primero que debemos es calcular , (como queremos el 3er cuartil k

= 3) nuestro ejemplo es con este valor nos vamos a la tabla de

frecuencias acumuladas y buscamos la 1ra clase cuya frecuencia acumulada sea


mayor que 41,25, en este caso es la 5ta clase (cuya frec acumulada es 42 >
41,25) por tanto el limite inferior de la clase cuartil es: li = 61, y la suma de
frecuencias inferiores a la clase cuartil es: (Σf)1 = 31, la frecuencia de la clase
cuartil es: ƒQ = 11, luego se aplica la fórmula:
 3n
− (∑ f )1 


Q3 = li +  4 c = ≈ 70
 fQ 
 
 
Este resultado nos indica que aproximadamente el 75% de los alumnos obtuvieron
una calificación inferior a 70 puntos.
Siguiendo el mismo procedimiento, para determinar la clase decil, lo primero que

debemos es calcular , (como queremos el 6to decil k = 6) nuestro ejemplo es

con este valor nos vamos a la tabla de frecuencias acumuladas y

buscamos la 1ra clase cuya frecuencia acumulada sea mayor que 33, en este
caso es la 5ta clase (cuya frec acum.. es 42 > 33) por tanto el limite inferior de la
clase decil es: li = 61, y la suma de frecuencias inferiores a la clase cuartil es: (Σf)1
= 31, la frecuencia de la clase cuartil es: ƒD = 11, luego se aplica la fórmula:

= ≈ 63

Este resultado nos indica que aproximadamente el 60% de los alumnos obtuvieron
una calificación inferior a 63 puntos.

Para el percentil, primero debemos calcular , (k = 42) es decir:

con este valor nos vamos a la tabla de frecuencias acumuladas

y buscamos la 1ra clase cuya frecuencia acumulada sea mayor que 23,1 en este
caso es la 4ta clase (cuya frec acum.. es 31 > 23,1) por tanto el limite inferior de
la clase percentil es: li = 51, y la suma de frecuencias inferiores a la clase percentil
es: (Σf)1 = 23, la frecuencia de la clase percentil es: ƒMe = 8, luego se aplica la
fórmula:

= ≈ 51

Este resultado nos indica que aproximadamente el 42% de los alumnos obtuvieron
una calificación inferior a 5 puntos.

UCP | INGENIERÍA COMERCIAL | estadística administrativa - pag.30


Siguiendo los procedimientos anteriores, se pueden calcular cualquier medida de
posición, los pasos a seguir son:
• Reemplazar k, por el número de cuartil, decil o percentil a calcular
k .n
• Hallar el valor de (para cuartil); o (para decil) o bien (para
percentil) 4
• El valor hallado en el paso anterior, se utiliza para buscar en la tabla de
frecuencia acumulada, la primera que sea mayor que ese valor, que se
tomará como la clase del cuartil, decil o percentil a considerar para aplicar
en la fórmula. (Ver ejemplos anteriores)

Para mayor información ver Página 66 – libro de estadística Murray Speigel.

Ventajas y Desventajas de:

a. LA MEDIA ARITMÉTICA

VENTAJAS DESVENTAJAS
Concepto familiar Se afecta por valores extremos
Todo conjunto de datos tiene una Cálculo podría ser tedioso
media
Considera todas las observaciones No se puede calcular con “clases
abiertas”
Muy utilizada en inferencia

b. MODA

VENTAJAS DESVENTAJAS
No se afecta por valores extremos No siempre existe
Se calcula para todo tipo de datos Puede encontrarse más de una
Se usa aún con clases abiertas.

c. MEDIANA

VENTAJAS DESVENTAJAS
No se afecta por valores extremos Complica procesos estadísticos
Se calcula para todo tipo de datos Es necesario ordenar los datos

Las diferencias entre los valores de la media, la mediana y la moda permiten


saber la forma de la curva de frecuencias en términos de asimetría. Se dice
que una distribución es simétrica o insesgada cuando su mediana, su moda y su
media aritmética coinciden.
Una distribución es asimétrica a la derecha o tiene sesgo positivo, si las frecuen-
cias descienden más lentamente por la derecha que por la izquierda. En este
caso, la media es el mayor valor de los tres y la mediana es mayor que la moda.
En cambio, si las frecuencias descienden más lentamente por la izquierda que
por la derecha, diremos que la distribución es asimétrica a la izquierda o tiene
sesgo negativo y la media es el menor valor de los tres y la mediana es inferior
a la moda.

UCP | INGENIERÍA COMERCIAL | estadística administrativa - pag. 31


Existen varias medidas de la asimetría de una distribución de frecuencias. Una de
x− Mo
ellas es el Coeficiente de Asimetría de Pearson: As =
s
Su valor es cero cuando la distribución es simétrica, positivo cuando existe
asimetría a la derecha y negativo cuando existe asimetría a la izquierda.

Al término de esta unidad le recomiendo realizar la Actividad 1.

Medidas de Dispersión
Como hemos dicho anteriormente, las medidas de tendencia central tienen como
objetivo sintetizar los datos en un valor representativo y las medidas de disper-
sión nos dicen hasta qué punto estas medidas de tendencia central son represen-
tativas como síntesis de la información. Las medidas de dispersión cuantifican la
separación, la dispersión, la variabilidad de los valores de la distribución respecto
al valor central.
Si el valor de estas medidas de dispersión es pequeño, nos indica que los datos
están estrechamente agrupados alrededor de la Media, entonces la media se
considera representativa de los datos, es decir, la Media es un promedio confia-
ble. Inversamente, una medida de dispersión grande indica que la Media no es
confiable, no es representativa de los datos.
Para entender mejor esto, supongamos que tenemos tres muestras A, B y C
A: 3, 3, 3, 3 → x = 3 (no existe dispersión)
B: 2, 3, 3, 4 → x = 3 (existe cierto grado de variabilidad)
C: 1, 5, 0, 6 → x = 3 (existe mayor dispersión)

La media aritmética de las tres muestras es 3, sin embargo, existe una diferencia
esencial entre ellas, puesto que los valores de la muestra C se encuentran más
separados que los de la muestra B, en cambio en la muestra A los datos no se
encuentran separados.
El grado de dispersión hacia un valor central, se puede obtener mediante medi-
das designadas como medidas de dispersión, distinguiremos entre medidas de
dispersión absolutas, que no son comparables entre diferentes muestras y las
relativas que nos permitirán comparar varias muestras.
Las medidas de dispersión más utilizadas son:
• El Alcance o Rango (R ): es la diferencia entre el más alto y el más pequeño
de los valores observados: R = x M – x m
Ej.: el rango entre: 2, 3, 3, 5, 5, 5, 8, 10, 12, es:
R = x M – x m =12 – 2 == R = 10
El rango es fácil de entender y encontrar, pero su utilidad como medida de
dispersión es limitada, pues sólo toma en cuenta los valores más altos y más
bajos de una distribución y no considera ninguna otra observación más del
conjunto de datos, como consecuencia de ésto se ve muy influenciado por

UCP | INGENIERÍA COMERCIAL | estadística administrativa - pag.32


los valores extremos.
• El Alcance interfractil: es una medida de la dispersión entre dos fractiles de
una distribución de frecuencias, es decir la diferencia entre dos fractiles
o Fractiles: en una distribución de frecuencias una fracción o proporción
dada de los datos cae en un fractil o por debajo de éste. La mediana por
ej., es el fractil 0,5 puesto que la mitad del conjunto de datos es menor
o igual que este valor, el Q1 es el fractil 0,25 ya que el 25% del conjunto
de datos es menor o igual que este valor, el D3 es el fractil 0,30 ya que el
30 % del conjunto de datos es menor o igual que este valor y asì sucesi-
vamente.
• Alcance intercuartil: mide aproximadamente qué tan lejos de la mediana
tenemos que ir en cualquiera de las dos direcciones antes de que podamos
recorrer una mitad de los valores del conjunto de datos. Alcance intercuartil
= Q3 - Q1
• La Desviación Típica o Estándar: Es una medida de la cantidad típica en
la que los valores del conjunto de datos difieren de la media, más específica-
mente, mide la distancia promedio de cualquier observación del conjunto de
datos con respecto a la media de la distribución. Es la medida de dispersión
más utilizada, se le llama también desviación típica o desvío tipo. La desvia-
ción estándar siempre se calcula con respecto a la media y es un mínimo
cuando se estima con respecto a este valor. Se designa con s, para datos
muestrales y con σ para datos poblacionales.

o Desviación Tìpica
muestral

o Desviación Tìpica
poblacional

• La Variancia o varianza: es una medida de dispersión relativa a algún punto


de referencia (la media aritmética de la distribución). Más específicamente, la
varianza es una medida sobre qué tan cerca, o cuán lejos están los diferentes
valores de su propia media aritmética. Cuando más lejos están las Xi de su
propia media aritmética, mayor es la varianza; cuando más cerca estén las
Xi a su media, menor es la varianza. Se define y expresa matemáticamente
como: el cuadrado de la desviación típica o estándar y está dada por la fór-
mula:

UCP | INGENIERÍA COMERCIAL | estadística administrativa - pag. 33


o Varianza muestral

o Varianza poblacional

Relación entre las medidas de Dispersión: Para una distribución normal, se


observa que:
a) El 68,27% de los datos se hallan comprendidos entre: µ ± 1σ
b) El 95,45% de los datos se hallan comprendidos entre: µ ± 2σ
c) El 99,73% de los datos se hallan comprendidos entre: µ ± 3σ

Ejemplo1: Los salarios semanales en miles guaraníes de 5 empleados de una


pequeña empresa familiar son: 200; 120; 300; 350 y 150, hallar la desviación
típica y la varianza del salario e interpretar su resultado
Desarrollo:
x1 = 200; x2 = 120; x3 = 300; x4 = 350 y x5 = 150, n = 5 y x = 224 (ver cálculo de
media)

xi
(x i −x ) (x i −x )
2

200 -24 576


120 -104 10.816
300 76 5.776
350 126 15.876
150 374 5.476
38.520

UCP | INGENIERÍA COMERCIAL | estadística administrativa - pag.34


Para hallar la desviación típica, vamos a construir una tabla en la cual se debe
restar cada variable de la media (columna 2), luego elevar al cuadrado ese resul-
tado, (columna 3) y sumar todos los valores de la columna 3, así tenemos:

∑ (x )
n
2
 i −x

s =
i =1
= = 7.704 = 87.77 que el desvío promedio de
 n

cada salario con respecto al salario medio de Gs. 224.000 semanales es de Gs.
87.77.-
La varianza es el cuadrado de la desviación típica, es decir: s2 = 7.704 Gs2
semanales.

Ejemplo 2: Con relación los datos de la tabla Nº 1, obtener la desviación típica y


la varianza de los puntajes de 55 alumnos:
(limites de Clase)
Puntaje
Cantidad de
Alumnos (fi)
Marca
De clase Xi (X i −x )
2
(
fi X i − x )2

21 – 30 3 25,5 1.035,55 3.106,66


31 – 40 5 35,5 491,95 2.459,76
41 – 50 15 45,5 148,35 2.225,29
51 – 60 8 55,5 4,7524 38,019
61 – 70 11 65,5 61,15 672,68
71 – 80 6 75,5 317,55 1.905,31
81 – 90 5 85,5 773,95 3.869,76
91 – 100 2 95,5 1.430,35 2.860,70
Total 55 17.138,1838

Solución: vamos a completar nuestra tabla, agregando la columna 3, donde cal-


cularemos los valores de ( (X i ) 2
− x , siendo Xi las marcas de clase, y el valor de
x = 57,68 (previamente calculado), luego:

( )
n
2


∑ fi X i − X
s =
i =1
= = 17,65 valor de
 n la desviación
 típica

La varianza es el cuadrado de la desviación típica, es decir s2 = 311,60

Coeficiente de Variación de Pearson (CV): Cuando se quiere comparar el grado


de dispersión de dos distribuciones que no vienen dadas en las mismas unidades
o que las medias no son iguales, se utiliza el coeficiente de variación de Pearson
que se define como el cociente entre la desviación típica y el valor absoluto de la
s
media aritmética CV = , el CV representa el número de veces que la desviación
x
típica contiene a la media aritmética y por lo tanto cuanto mayor es CV mayor es
la dispersión y menor la representatividad de la media.

Ejemplo 3: Un fabricante de tubos fluorescente produce dos tipos de tubos: A y


B, que tienen vidas medias x A = 1.495 hs. y x B = 1.875 hs., con desviaciones

UCP | INGENIERÍA COMERCIAL | estadística administrativa - pag. 35


típicas de s A = 280 hs. y s B = 310 hs., ¿cuál de los tubos tiene:
a. Mayor dispersión absoluta?
b. Mayor dispersión relativa?

Solución
La dispersión absoluta del tubo B es: s B = 310 hs., mayor que la dispersión
absoluta del tubo A , s A = 280 hs.
Para la dispersión relativa calculamos el coeficiente de variación para ambos
tubos:
sA 280 sB 310
CVA= = = 0,1872 x 100 = 18,7%, CVB= = = 0,1653 x 100 =
xA 1.495 x B 1.875
16,5% la dispersión relativa del tubo tipo A, tuvo mayor dispersión relativa.

Al término de esta unidad le recomiendo realizar la Actividad 2.

En este módulo estudiamos las medidas resumen para datos simples y agrupa-
dos. Vimos cómo éstos pueden tener varios tipos de promedio y, excepto algunas
situaciones específicas, estos promedios tienen valores diferentes para el mismo
grupo de datos y cada uno tiene su significado único y propio. A causa de estas
consideraciones se plantea un problema muy importante y a menudo difícil ¿Qué
promedio debe usarse para representar los datos en estudio? Recordemos, por
ejemplo, que la media es una medida de tendencia central y, a menos que los
datos muestren una concentración clara de las observaciones, un promedio
puede ser no significativo para ese estudio particular. Posteriormente, abordamos
el tema de la variación de los datos y formas de medirla para conocer cuán repre-
sentativo de la distribución de los datos es, por ejemplo, el promedio. En general,
el término “variación” significa alejamiento de una norma y, por tanto, una medida
de variabilidad es la que mide el alcance de las diferencias entre observaciones
individuales y algún valor central o medio.

En conclusión, puede señalarse que una descripción completa de un colectivo de


datos requiere de todas estas miradas para analizar el problema desde diferentes
ángulos y tomar decisiones lo más informadas y documentadas posible.
En el siguiente módulo usted se iniciará en el fascinante mundo de las probabi-
lidades, operando con una de las distribuciones de probabilidad más usual: la
Distribución Normal de Probabilidades.

m2 material

Material Básico:
• SIEGEL, M. y STEPHENS, L.: Estadística. México, Editorial MacGraw Hill,
(2002).

Material Complementario:
• LEVÍN, R.: Estadística para Administradores. México, Editorial Prentice Hall
Hispanoamericana, (1996).
• DIAZ MATA, K.: Estadística aplicada a la Administración y a la Economía.
México, Editorial MacGraw Hill, (1993).

UCP | INGENIERÍA COMERCIAL | estadística administrativa - pag.36


m2 glosario

A
Alcance o Rango: es la diferencia entre el más alto y el más pequeño de los
valores observados

C
Cuantiles: son los valores de la distribución que la dividen en partes iguales.
Cuartiles: son los tres valores que dividen al conjunto de datos ordenados en
cuatro partes iguales.
Coeficiente de Asimetría de Pearson: indica la forma de la distribución, su valor
es cero cuando la distribución es simétrica.
Coeficiente de Variación de Pearson: representa el número de veces que la
desviación típica contiene a la media aritmética, y mide la dispersión relativa de
un colectivo de datos.

D
Deciles: son los nueve valores que dividen al conjunto de datos ordenados en
diez partes iguales.
Desviación Típica o Estándar: mide la distancia promedio de cualquier observa-
ción del conjunto de datos con respecto a la media de la distribución.

F
Fractiles: es una fracción o proporción dada de los datos cae en un fractil o por
debajo de éste.

M
Mediana: es el valor de la variable que separa la serie de datos objeto de análisis,
una vez ordenados, en dos partes iguales.
Medidas de centralización: sirven para describir un aspecto de los datos, e
indican su valor central
Media aritmética o Promedio: indica el valor central de los datos
Medidas de dispersión: indican el grado de alejamiento de los datos con res-
pecto a un valor central.
Moda: es el valor que ocurre con mayor frecuencia.

P
Percentiles: son los 99 valores que dividen en cien partes iguales el conjunto de
datos ordenados.

V
Variancia o varianza: es una medida de que tan cerca, o que tan lejos están los
diferentes valores de su propia media aritmética.

UCP | INGENIERÍA COMERCIAL | estadística administrativa - pag. 37

También podría gustarte