Documentos de Académico
Documentos de Profesional
Documentos de Cultura
UNIDAD 7
7. MEDIDAS RESUMENES DE LA INFORMACION
En esta unidad comenzaremos a resumir y organizar nuestros datos por medio de un solo
número para obtener la información a través de ellos. A tal fin se estudiarán las medidas de
posición: promedio, mediana y modo.
Otro aspecto en la serie de datos es la dispersión en los valores. ¿Cuan dispersos están los
valores? ¿Están juntos o tienen un amplio margen de variación? A tal fin se estudiarán medidas
tales como: Rango, variancia, desvío estándar, coeficiente de variación.
Si los datos provienen de una muestra, las medidas de resumen de la información se llaman
estadísticas, si los datos constituyen una población, estas medidas se llamarán parámetros.
1 MEDIDAS DE POSICION
Ellas son:
− n
xi
x=∑ (1)
i =1 n
La media aritmética de un conjunto de n observaciones es simplemente la suma de las
observaciones dividida por el número de observaciones (n).
Es sensible a los valores extremos y no puede ser mayor que el mayor valor. Ni menor que el
menor valor.
N n
xi xi
La media poblacional es: µ = ∑N
i =1
La media muestral es: x = ∑n
i =1
Características:
Toma en consideración toda la información por lo tanto es muy sensible a la influencia
de los valores extremos, lo que puede ser una ventaja o desventaja, según la situación.
Es una medida de posición útil para comparar dos o más distribuciones, sólo si éstas
tienen forma semejante.
PROPIEDADES:
1. Es única para un conjunto de datos. Es un valor que está comprendido en el campo de
variación de la variable. Se encuentra siempre entre: xi mínimo ≤ X ≤ xi máximo.
2. Cada observación en el conjunto de datos es tomada en cuenta cuando se calcula la media
aritmética.
3. Se mide en la misma unidad que la variable que le dio origen (metros, toneladas, $, etc.)
4. La media aritmética de una constante es igual a la constante misma.
5. La media aritmética del producto de una constante por una variable es igual al producto
de la constante por la media aritmética de la variable.
Desventajas
Puede verse afectada por valores extremos que no son representativos del resto de los
datos.
No se puede calcular la media aritmética para un conjunto de datos que tienen clases
abiertas en los extremos ya sea en la parte de arriba o de abajo de la escala.
Características de la moda:
Algunos conjuntos de observaciones no poseen moda.
Algunos conjuntos de observaciones tienen más de una moda (bimodal o polimodal)
1.3 Mediana
Es una medida de posición que aparece en el medio de una sucesión ordenada de valores. Es
decir, la mitad de las observaciones en un conjunto de datos ordenados son menores que ella
y la otra mitad son mayores. Divide a la distribución en dos partes iguales.
Es el mínimo valor de la variable que acumula, por lo menos, el 50 % de las observaciones
ordenadas en forma creciente, por tal razón es uno de los llamados estadísticos de orden.
~
x / F (~
x ) ≥ 0.50
Cálculo:
1. Organizar los datos en orden ascendente o descendente de magnitud.
2. Si el conjunto de datos contiene un nº impar de elementos, el elemento de la mitad
del arreglo es la mediana. La mediana es el valor ubicado en el lugar (n+1)/2.
3. Si hay un nº par de elementos, la mediana es el promedio de los dos valores centrales.
Es decir, será el promedio entre los valores ubicados a la izquierda y a la derecha del
lugar (n+1)/2 en el arreglo de datos, donde n es el nº de elementos en el arreglo.
n n
+ + 1
~ 2 2
x=
2
Característica de la mediana:
Al no tomar en cuenta toda la información pues depende de la cantidad de
observaciones y no de la magnitud de ningún valor extremo, no es sensible a dichos
valores extremos.
La mediana tiene con respecto a la media aritmética, la ventaja de estar determinada
por el orden de los términos de la serie, no por sus valores particulares. Esa
característica resulta muy significativa cuando existen valores extremos, por cuanto la
mediana no resulta afectada por ellos. Además, en caso de intervalos abiertos en los
en los cuales no es posible calcular la media aritmética, la mediana puede sustituirla.
• Distribución Simétrica
3 MEDIDAS DE DISPERSIÓN
3.1 Rango
Es la diferencia entre el máximo valor de las observaciones (xmax) y el mínimo valor de las
mismas (xmin)
r = x( max ) − x ( min )
Proporciona una primera información sobre la dispersión de los valores pero basta que al
menos uno de los dos valores que intervienen en su cálculo esté excesivamente alejado para
que pierda importancia la información que brinda (presencia de valores extremos).
Mide la dispersión total en un conjunto de datos.
S2 =
∑ (x i − x)2
n
La varianza está expresada en unidades al cuadrado, lo que representa una desventaja para
su interpretación.
Como la variancia se mide en unidades al cuadrado, para volver a las unidades originales, se
calcula el desvío estándar que es la raíz cuadrada positiva de la variancia muestral.
S = S n2−1
Este estadístico tiene la ventaja de estar expresado en la misma unidad de las observaciones
El desvío estándar, comúnmente llamado dispersión, mide en promedio, como las obs se
acercan o se alejan de la media aritmética.
En gran parte de los conjuntos de datos, la mayoría de los valores obs caen dentro de un
intervalo que corresponde a la media aritmética +/- una desviación estándar.
Es importante conocer la dispersión porque ofrece información adicional que nos permite
juzgar la confiabilidad de la medida de tendencia central, si la dispersión es muy grande, la
medida de tendencia central deja de ser significativa.
∑ ( xi − µ ) 2 2
=
∑ (x i − x)2
σ =
2 S
N n
4 COEFICIENTE DE VARIACION
Si la unidad de medida de los dos conjuntos de datos es la misma y sus promedios son
aproximadamente iguales, es correcto una comparación directa entre las dispersiones de cada
grupo.
Pero tal comparación no tiene sentido si las unidades de medidas son distintas o cuando
siendo las unidades las mismas, los promedios son significativamente distintos.
Para estos casos es necesaria una medida de dispersión relativa. En general, una medida de
dispersión relativa es el cociente entre una medida de dispersión y el promedio con respecto al
cual las desviaciones fueron consideradas. La más usada es el coeficiente de variación.
S σ
c.v. = * 100 (para datos muestrales) c.v. = * 100 (para datos poblacionales)
x µ
Es una razón independiente de las unidades de medida y da el porcentaje de la media
representado por el desvío.
Ejemplo:
En febrero del año pasado, los datos de préstamos personales de una mutual mostraron un
promedio de $650 y una desviación estándar de $300. Recientemente se calculó la media y la
desviación estándar correspondiente a los préstamos personales de febrero del presente año
resultando las mismas $ 900 y $ 350 respectivamente.
¿En cuál de los dos años los préstamos personales presentaron menor dispersión relativa?
La menor dispersión relativa se presenta en los préstamos personales otorgados este año por la
mutual.
7 EJERCITACION N°4
3. Cada una de 1000 personas debió pagar cierta suma de dinero debido a un recargo,
resultando la siguiente distribución: 120 personas pagaron $100 cada una, 160 pagaron
$ 200 cada una, 480 pagaron $300 cada una y 240 pagaron $400 cada una.
a. Definir la variable en estudio e indicar su tipo.
b. Determinar la media aritmética e interpretar su resultado en términos del problema.
c. Calcular las medidas de dispersión que conoce.
Altura en cms.: 150- 176- 145- 155- 160- 160- 158- 178- 148- 162.
Gastos en vestimenta por mes: $50- $10- $800- $70- $100- $15- $30- $8- $60- $80.
Talle: 46- 44- 48- 48- 46- 44- 46- 46- 46- 44.
a) ¿Cuál es la medida de posición central más apropiada para cada una de estas
características? Interpretar los resultados de cada una de ellas.
0.04 0.14 0.17 0.21 0.22 0.06 0.14 0.17 0.21 0.24 0.12 0.17 0.17 0.21 0.25.