Está en la página 1de 7

UNIDAD 7 Medidas resúmenes de la información 1

UNIDAD 7
7. MEDIDAS RESUMENES DE LA INFORMACION

MEDIDAS CARACTERISTICAS DE UNA DISTRIBUCION DE FRECUENCIAS.

En esta unidad comenzaremos a resumir y organizar nuestros datos por medio de un solo
número para obtener la información a través de ellos. A tal fin se estudiarán las medidas de
posición: promedio, mediana y modo.
Otro aspecto en la serie de datos es la dispersión en los valores. ¿Cuan dispersos están los
valores? ¿Están juntos o tienen un amplio margen de variación? A tal fin se estudiarán medidas
tales como: Rango, variancia, desvío estándar, coeficiente de variación.
Si los datos provienen de una muestra, las medidas de resumen de la información se llaman
estadísticas, si los datos constituyen una población, estas medidas se llamarán parámetros.

MATEMATICA Y ESTADISTICA Lic. Est. Analía Pogliano


UNIDAD 7 Medidas resúmenes de la información 2

1 MEDIDAS DE POSICION

Se llaman también de tendencia central y están referidas a la posición de la distribución de


frecuencias sobre el eje de las abscisas.

Ellas son:

1.1 Media aritmética o promedio muestral


Es la más conocida y utilizada de las medidas de posición. No coincide necesariamente con un
valor de la variable.
Para el cálculo del promedio de n observaciones de la variable X (xi con i = 1, 2,.......n ),
resulta:

− n
xi
x=∑ (1)
i =1 n
La media aritmética de un conjunto de n observaciones es simplemente la suma de las
observaciones dividida por el número de observaciones (n).
Es sensible a los valores extremos y no puede ser mayor que el mayor valor. Ni menor que el
menor valor.

N n
xi xi
La media poblacional es: µ = ∑N
i =1
La media muestral es: x = ∑n
i =1

Características:
Toma en consideración toda la información por lo tanto es muy sensible a la influencia
de los valores extremos, lo que puede ser una ventaja o desventaja, según la situación.
Es una medida de posición útil para comparar dos o más distribuciones, sólo si éstas
tienen forma semejante.

PROPIEDADES:
1. Es única para un conjunto de datos. Es un valor que está comprendido en el campo de
variación de la variable. Se encuentra siempre entre: xi mínimo ≤ X ≤ xi máximo.
2. Cada observación en el conjunto de datos es tomada en cuenta cuando se calcula la media
aritmética.
3. Se mide en la misma unidad que la variable que le dio origen (metros, toneladas, $, etc.)
4. La media aritmética de una constante es igual a la constante misma.
5. La media aritmética del producto de una constante por una variable es igual al producto
de la constante por la media aritmética de la variable.

MATEMATICA Y ESTADISTICA Lic. Est. Analía Pogliano


UNIDAD 7 Medidas resúmenes de la información 3

Desventajas
Puede verse afectada por valores extremos que no son representativos del resto de los
datos.
No se puede calcular la media aritmética para un conjunto de datos que tienen clases
abiertas en los extremos ya sea en la parte de arriba o de abajo de la escala.

1.2 Moda o Modo

Es el valor de la variable con mayor frecuencia. No depende de todos los términos, no se


presta a cálculos algebraicos. Sólo tiene sentido para distribuciones que comprenden un gran
número de valores. Interesa determinarlo en las distribuciones asimétricas y es la única
medida de tendencia central que puede utilizarse para datos categóricos.

Características de la moda:
Algunos conjuntos de observaciones no poseen moda.
Algunos conjuntos de observaciones tienen más de una moda (bimodal o polimodal)

1.3 Mediana

Es una medida de posición que aparece en el medio de una sucesión ordenada de valores. Es
decir, la mitad de las observaciones en un conjunto de datos ordenados son menores que ella
y la otra mitad son mayores. Divide a la distribución en dos partes iguales.
Es el mínimo valor de la variable que acumula, por lo menos, el 50 % de las observaciones
ordenadas en forma creciente, por tal razón es uno de los llamados estadísticos de orden.

~
x / F (~
x ) ≥ 0.50

Cálculo:
1. Organizar los datos en orden ascendente o descendente de magnitud.
2. Si el conjunto de datos contiene un nº impar de elementos, el elemento de la mitad
del arreglo es la mediana. La mediana es el valor ubicado en el lugar (n+1)/2.
3. Si hay un nº par de elementos, la mediana es el promedio de los dos valores centrales.
Es decir, será el promedio entre los valores ubicados a la izquierda y a la derecha del
lugar (n+1)/2 en el arreglo de datos, donde n es el nº de elementos en el arreglo.
n n 
+  + 1
~ 2 2 
x=
2

Característica de la mediana:
Al no tomar en cuenta toda la información pues depende de la cantidad de
observaciones y no de la magnitud de ningún valor extremo, no es sensible a dichos
valores extremos.
La mediana tiene con respecto a la media aritmética, la ventaja de estar determinada
por el orden de los términos de la serie, no por sus valores particulares. Esa
característica resulta muy significativa cuando existen valores extremos, por cuanto la
mediana no resulta afectada por ellos. Además, en caso de intervalos abiertos en los
en los cuales no es posible calcular la media aritmética, la mediana puede sustituirla.

MATEMATICA Y ESTADISTICA Lic. Est. Analía Pogliano


UNIDAD 7 Medidas resúmenes de la información 4

2 COMPARACION DE MEDIA ARITMETICA, MEDIANA Y MODA

• Distribución Simétrica

• Distribuciones Asimétricas o Sesgadas

Distribución asimétrica a la derecha

Distribución asimétrica a la izquierda

3 MEDIDAS DE DISPERSIÓN

Analizando comparativamente las siguientes distribuciones se observa que a pesar de que


están igualmente centradas, los valores de la variable de cada una de ellas están alejados del
promedio de manera distinta. Esta situación hace ver la necesidad del estudio de otro tipo de
medida característica de las distribuciones de frecuencias que son llamadas de dispersión.

La dispersión es la cantidad de variación o diseminación en los datos. Dos conjuntos de datos


pueden diferir tanto en tendencia central como en dispersión, o pueden tener las mismas
medidas de tendencia central, pero grandes diferencias en términos de dispersión.
En consecuencia, al manejar datos numéricos, se deben caracterizar también en términos de
su dispersión o variabilidad.

MATEMATICA Y ESTADISTICA Lic. Est. Analía Pogliano


UNIDAD 7 Medidas resúmenes de la información 5

Dicha información se obtiene a través de los siguientes estadísticos de dispersión:

3.1 Rango

Es la diferencia entre el máximo valor de las observaciones (xmax) y el mínimo valor de las
mismas (xmin)
r = x( max ) − x ( min )

Proporciona una primera información sobre la dispersión de los valores pero basta que al
menos uno de los dos valores que intervienen en su cálculo esté excesivamente alejado para
que pierda importancia la información que brinda (presencia de valores extremos).
Mide la dispersión total en un conjunto de datos.

3.2 Variancia muestral

Es una medida de variabilidad con respecto a la media aritmética.


Es el promedio, aproximado, de los cuadrados de los desvíos de las observaciones con
respecto a su media aritmética.

S2 =
∑ (x i − x)2
n

La varianza está expresada en unidades al cuadrado, lo que representa una desventaja para
su interpretación.

3.3 Desvío estándar muestral

Como la variancia se mide en unidades al cuadrado, para volver a las unidades originales, se
calcula el desvío estándar que es la raíz cuadrada positiva de la variancia muestral.

S = S n2−1

Este estadístico tiene la ventaja de estar expresado en la misma unidad de las observaciones
El desvío estándar, comúnmente llamado dispersión, mide en promedio, como las obs se
acercan o se alejan de la media aritmética.

MATEMATICA Y ESTADISTICA Lic. Est. Analía Pogliano


UNIDAD 7 Medidas resúmenes de la información 6

En gran parte de los conjuntos de datos, la mayoría de los valores obs caen dentro de un
intervalo que corresponde a la media aritmética +/- una desviación estándar.

Es importante conocer la dispersión porque ofrece información adicional que nos permite
juzgar la confiabilidad de la medida de tendencia central, si la dispersión es muy grande, la
medida de tendencia central deja de ser significativa.

σ 2 Variancia Poblacional S2 Variancia Muestral

∑ ( xi − µ ) 2 2
=
∑ (x i − x)2
σ =
2 S
N n

4 COEFICIENTE DE VARIACION

Es una medida de variación o dispersión relativa.


Cuando deseamos comparar la variabilidad de dos conjuntos de datos hay que tener en
cuenta:
- Las medias aritméticas de ambos conjuntos
- Las unidades en que están expresadas

Si la unidad de medida de los dos conjuntos de datos es la misma y sus promedios son
aproximadamente iguales, es correcto una comparación directa entre las dispersiones de cada
grupo.
Pero tal comparación no tiene sentido si las unidades de medidas son distintas o cuando
siendo las unidades las mismas, los promedios son significativamente distintos.
Para estos casos es necesaria una medida de dispersión relativa. En general, una medida de
dispersión relativa es el cociente entre una medida de dispersión y el promedio con respecto al
cual las desviaciones fueron consideradas. La más usada es el coeficiente de variación.

Se simboliza c.v. y es igual a:

S σ
c.v. = * 100 (para datos muestrales) c.v. = * 100 (para datos poblacionales)
x µ
Es una razón independiente de las unidades de medida y da el porcentaje de la media
representado por el desvío.

Ejemplo:
En febrero del año pasado, los datos de préstamos personales de una mutual mostraron un
promedio de $650 y una desviación estándar de $300. Recientemente se calculó la media y la
desviación estándar correspondiente a los préstamos personales de febrero del presente año
resultando las mismas $ 900 y $ 350 respectivamente.
¿En cuál de los dos años los préstamos personales presentaron menor dispersión relativa?

c.v. año pasado = ( 300 / 650 ) . 100 = 45%


c.v. presente año = ( 350 / 900 ) . 100 = 39%

La menor dispersión relativa se presenta en los préstamos personales otorgados este año por la
mutual.

MATEMATICA Y ESTADISTICA Lic. Est. Analía Pogliano


UNIDAD 7 Medidas resúmenes de la información 7

7 EJERCITACION N°4

1. Los siguientes datos corresponden a las edades de 20 pacientes sometidos a un


tratamiento en una clínica privada. Los datos están ordenados en forma creciente:
32 37 39 40 41 41 41 42 42 43 44 45 45 45 46 47 47 49 50 51
a) Comprobar que la distribución de edades es aproximadamente simétrica.

2. Las temperaturas registradas en dos ciudades A y B, los días 15 de cada mes de un


determinado año a las 12 hs., son en grados centígrados:
E F M A M J J A S O N D
A 11 13 15 14 19 24 26 25 19 16 14 12
B -2 5 13 13 19 29 37 38 23 15 10 6

a) Comprobar que las temperaturas medias son muy parecidas.


b) A pesar de que las temperaturas medias son muy parecidas, en la ciudad B las
temperaturas son mucho más extremas que en la ciudad A. Calcular en cada ciudad el
parámetro que refleje esas diferencias.

3. Cada una de 1000 personas debió pagar cierta suma de dinero debido a un recargo,
resultando la siguiente distribución: 120 personas pagaron $100 cada una, 160 pagaron
$ 200 cada una, 480 pagaron $300 cada una y 240 pagaron $400 cada una.
a. Definir la variable en estudio e indicar su tipo.
b. Determinar la media aritmética e interpretar su resultado en términos del problema.
c. Calcular las medidas de dispersión que conoce.

4. Considerando las siguientes características de un grupo de 10 personas:

Altura en cms.: 150- 176- 145- 155- 160- 160- 158- 178- 148- 162.
Gastos en vestimenta por mes: $50- $10- $800- $70- $100- $15- $30- $8- $60- $80.
Talle: 46- 44- 48- 48- 46- 44- 46- 46- 46- 44.

a) ¿Cuál es la medida de posición central más apropiada para cada una de estas
características? Interpretar los resultados de cada una de ellas.

5. Si se tiene una población de 15 frascos de un compuesto producido en un día y se prueba


cada frasco para determinar su pureza, los datos son los siguientes:
Porcentaje de impureza observado:

0.04 0.14 0.17 0.21 0.22 0.06 0.14 0.17 0.21 0.24 0.12 0.17 0.17 0.21 0.25.

a) ¿Cuál es el porcentaje medio de impurezas?


b) Determinar las medidas de dispersión absolutas que conoce e interpretarlas.

MATEMATICA Y ESTADISTICA Lic. Est. Analía Pogliano

También podría gustarte