Está en la página 1de 37

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS

Existen dos medidas de inters para cualquier conjunto de datos: la localizacin de su centro y su variabilidad. La tendencia central de un conjunto de datos es la disposicin de stos para agruparse ya sea alrededor del centro o de ciertos valores numricos. La variabilidad de un conjunto de datos es la dispersin de las observaciones en el conjunto. Las medidas de posicin facilitan informacin sobre la serie de datos que se esta analizando. Estas medidas permiten conocer diversas caractersticas de esta serie de datos. Son aquellas medidas que ayudan a saber donde estn los datos pero sin indicar como se distribuyen. Las medidas de posicin se clasifican en dos tipos: a) Medidas de posicin central: informan sobre los valores medios de la serie de datos. b) Medidas de posicin no centrales: informan de como se distribuye el resto de los valores de la serie.

Prof. Lic.Mara E. de Fernndez

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS

a ) Medidas de posicin central

Las principales medidas de posicin central son las siguientes:

1. Media: es el valor medio ponderado de la serie de datos. Se pueden calcular diversos tipos de medias, siendo las ms utilizadas: 1.1 Media aritmtica: se calcula multiplicando cada valor por el nmero de veces que se repite. La suma de todos estos productos se divide por el total de datos de la muestra: x Se denota por , la frmula est dada por n i

x x i n

Prof. Lic.Mara E. de Fernndez

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS

Ventajas e inconvenientes de la Media Aritmtica:

La media aritmtica viene expresada en las mismas unidades que la variable. En su clculo intervienen todos los valores de la distribucin. Es el centro de gravedad de toda la distribucin, representando a todos los valores observados. Es nica. Su principal inconveniente es que se ve afectada por los valores extremadamente grandes o pequeos de la distribucin. Su clculo es sencillo,resulta fcil de entender y es un buen valor central que se usa para resumir un conjunto de datos, independientemente del nmero de valores que tengan.

Prof. Lic.Mara E. de Fernndez

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS


Propiedades de la Media Aritmtica

La suma algebraica de las desviaciones de un conjunto de nmeros de su media aritmtica es cero. La suma de los cuadrados de las desviaciones de un conjunto de nmeros xj de cualquier numero a es mnima solamente a si x
Si f1 nmeros tienen de media m1 , f2 medias m2....... , fk nmeros tienen de media mk , entonces la media de todos los nmeros es
x f1 m1 f 2 m2 ...... f k mk f1 f 2 ....... f k

es decir una media aritmtica ponderada de todas las medias

Si A es cualquier supuesta media aritmtica (que puede ser cualquier nmero) d j x j y Asi son las desviaciones de de A, entonces xj Media Aritmtica calculada a partir de datos agrupados

x A
i 1

dj n

A
i 1

f jd j n
4

Prof. Lic.Mara E. de Fernndez

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS

Si todos los intervalos de clase tienen igual tamao c, las d x A desviaciones pueden expresarse como cu j , donde puede ser un n positivo, negativo o cero. Entonces
j j

x A
j 1

f ju j n

c A
j 1

f ju j n

c A cu

A este mtodo se llama mtodo clave. Las unidades de x pasan a u donde

x A cu

Prof. Lic.Mara E. de Fernndez

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS

Media aritmtica ponderada


Es una media aritmtica que se emplea en distribuciones de tipo unitario, en las que se introducen unos coeficientes de ponderacin, que son valores positivos, que representan el nmero de veces que un valor de la variable es ms importante que otra. Se asocian a los nmeros X , X ,.....X ciertos factores o pesos w, w ,.....w que dependen de la importancia de cada uno de los nmeros. En este caso
1 2 k 2 k

X = w X + w X +.......w X = w X w +w +..+ w w
1 1 2 2 k k k 1 2 k k

Se llama media aritmtica ponderada.

Prof. Lic.Mara E. de Fernndez

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS

1.2

Media geomtrica:

La media geomtrica G de una serie de N nmeros X1 , X2 , X3 ,.....XN es la raiz ensima del producto de los nmeros, se eleva cada valor al nmero de veces que se ha repetido. Se multiplican todos estos resultados y al producto final se le calcula la raz "n" (siendo "n" el total de datos de la muestra).

Segn el tipo de datos que se analice ser ms apropiado utilizar la media aritmtica o la media geomtrica. La media geomtrica se suele utilizar en series de datos como tipos de inters anuales, inflacin, etc., donde el valor de cada ao tiene un efecto multiplicativo sobre el de los aos anteriores.
Prof. Lic.Mara E. de Fernndez 7

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Media Geomtrica


Ventajas e inconvenientes:

En su clculo intervienen todos los valores de la distribucin. Los valores extremos tienen menor influencia que en la media aritmtica. Es nica. Su clculo es ms complicado que el de la media aritmtica. Adems, cuando la variable toma al menos un x = 0 entonces la media geomtrica se anula, y si la variable toma valores negativos se pueden presentar una gama de casos particulares en los que tampoco queda determinada debido al problema de las races de ndice par de nmeros negativos. El empleo ms frecuente de la media geomtrica es el de promediar variables tales como porcentajes, tasas, nmeros ndices. etc., es decir, en los casos en los que se supone que la variable presenta variaciones acumulativas

Prof. Lic.Mara E. de Fernndez

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS

Media armnica
La media armnica, que representaremos por H, se define como sigue:
1 1 X 1 1 H N N X
H N

Obsrvese que la inversa de la media armnica es la media aritmtica de los inversos de los valores de la variable. No es aconsejable en distribuciones de variables con valores pequeos. Se suele utilizar para promediar variables tales como productividades, velocidades, tiempos, rendimientos, cambios, etc. Ventajas e inconvenientes: En su clculo intervienen todos los valores de la distribucin. Su clculo no tiene sentido cuando algn valor de la variable toma valor

cero.

Es nica.

Prof. Lic.Mara E. de Fernndez

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS

2.- Mediana: es el valor de la serie de datos que se sita justamente en el centro de la muestra (un 50% de valores son inferiores y otro 50% son superiores). Dada una distribucin de frecuencias con los valores ordenados de menor a mayor, llamamos mediana y la representamos por Me, al valor de la variable, que deja a su izquierda el mismo nmero de frecuencias que a su derecha. No presentan el problema de estar influido por los valores extremos, pero en cambio no utiliza en su clculo toda la informacin de la serie de datos (no pondera cada valor por el nmero de veces que se ha repetido).
Prof. Lic.Mara E. de Fernndez 10

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Mediana La Mediana se define de la siguiente forma: Mediana= Donde: Li= lmite inferior de la clase de la mediana. N= nmero de datos (frecuencia total). = suma de frecuencia de las clases inferiores a la mediana fmediana= frecuencia de la clase mediana c= anchura del intervalo de la clase mediana

Prof. Lic.Mara E. de Fernndez

11

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Moda

Moda

es el valor que ms se repite en la muestra, que se presenta con la mayor frecuencia, es decir es el valor ms comn. La moda puede no existir, incluso si existe puede no ser nica. Aquellas distribuciones que tienen una sola moda se llaman unimodales; cuando hay dos modas se dice que la distribucin es bimodal y si hay ms de dos modas la distribucin se llama multimodal.

Prof. Lic.Mara E. de Fernndez

12

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Moda

Para obtener la moda en datos agrupados se usa la siguiente frmula:


Donde:

L1 = Lmite inferior de la clase modal. D1 = Exceso de la frecuencia modal sobre la clase contigua inferior. D2 = Exceso de la frecuencia modal sobre la clase contigua superior. C = Tamao del intervalo de la clase modal.

Prof. Lic.Mara E. de Fernndez

13

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS


Medidas de posicin no centrales
Medidas de posicin no centrales Las medidas de posicin no centrales permiten conocer otros puntos caractersticos de la distribucin que no son los valores centrales. Entre otros indicadores, se suelen utilizar una serie de valores que dividen la muestra en tramos iguales: Cuartiles: son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados ellos son: (Q1, Q2, Q3) Primer cuartil (Q1): Aquel valor de una serie que supera al 25% de los datos y es superado por el 75% restante. Segundo cuartil (Q2): Coincide, es idntico o similar al valor de la Mediana (Q2 = Md). Es decir, supera y es superado por el 50% de los valores de una Serie.

Prof. Lic.Mara E. de Fernndez

14

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS


Medidas de posicin no centrales

Frmula de Q1 para series de Datos Agrupados en Clases.

Donde:

posicin de Q1, la cual se localiza en la primera frecuencia acumulada que la contenga, siendo la clase de Q1, la correspondiente a tal frecuencia acumulada. Li, faa, fi, Ic : idntico a los conceptos vistos para Mediana pero referidos a la medida de la posicin correspondiente.

Prof. Lic.Mara E. de Fernndez

15

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS


Medidas de posicin no centrales
Segundo cuartil (Q2): Coincide, es idntico o similar al valor de la Mediana (Q2 = Md). Es decir, supera y es superado por el 50% de los valores de una Serie. c) Tercer cuartil (Q3): Aquel valor, trmino o dato que supera al 75% y es superado por el 25% de los datos restantes de la Serie. Frmula de Q3 para series de Datos Agrupados en Clase.

Donde: : posicin de Q3, todo idntico al clculo de la Mediana.

Prof. Lic.Mara E. de Fernndez

16

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS


Medidas de posicin no centrales Deciles: son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados. Deciles (D1, D2, D9) Primer Decil (D1), Quinto Decil (D5) y Noveno Decil (D9). El primer decil es aquel valor de una serie que supera a 1/10 parte de los datos y es superado por las 9/10 partes restantes (respectivamente, hablando en porcentajes, supera al 10% y es superado por el 90% restante),

Prof. Lic.Mara E. de Fernndez

17

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS


Medidas de posicin no centrales

Percentiles: son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados. Percentiles (P1, P2, P99) Primer Percentil (P1), Percentil 50 (P50) y Percentil 99 (P99). El primer percentil supera al uno por ciento de los valores y es superado por el noventa y nueve por ciento restante. Frmulas de P1, P50, P99 para series de Datos Agrupados en Clases.

Prof. Lic.Mara E. de Fernndez

18

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS


Medidas de posicin no centrales El P99 (noventa y nueve percentil) supera al 99% de los datos y es superado a su vez por el 1% restante. Idnticas frmulas al clculo de la Mediana, cambiando obviamente las correspondientes posiciones de cada medida. Para determinar estas medidas se aplicara el principio de la mediana; as, el primer cuartil ser el valor por debajo del cual se encuentra el 25 por ciento de los datos; bajo el tercer cuartil se encuentra el 75 por ciento; el 80 decil ser el valor por encima del cual estar el 20 por ciento de los datos, etc. Como se observa, todas estas medidas no son sino casos particulares del percentil ya que el primer cuartil no es sino el 25 percentil, el tercer cuartil el 75 percentil, el cuarto decil el 40 percentil.

Prof. Lic.Mara E. de Fernndez

19

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS

Medidas de posicin no centrales


Datos no agrupados:
Se hace difcil calcular estas medidas, sin embargo, siguiendo los mismos principios mencionados para la Mediana, se pueden localizar en la forma siguiente: Si tenemos una serie de valores X1, X2, X3 Xn, se localiza el primer cuartil como el valor cuando n es par,
y (n par); cuando n es impar. Para el tercer cuartil ser (n impar).

Prof. Lic.Mara E. de Fernndez

20

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS


Medidas de posicin no centrales En caso de los textiles ser representa el nmero del textil. o donde A

Para los deciles ser del decil; y para los percentiles

siendo A el nmero

Prof. Lic.Mara E. de Fernndez

21

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersin


No solo basta con determinar las medidas de tendencia central para comprender el comportamiento de una serie de datos, es importante adems, conocer que tan alejados estn esos datos respecto a ese punto de concentracin. Las medidas de dispersin nos indican la distancia promedio de los datos respecto a las medidas de tendencia central. As podremos diferenciar dos conjuntos de datos que poseen iguales medias, siendo los datos de uno ms dispersos del otro. Los indicadores bsicos de dispersin son: Desviacin media Varianza Desviacin estndar Coeficiente de variacin o Coeficiente de variacin de Pearson Rango, Amplitud o Recorrido Cuasivarianza Cuasidesviacin tpica

Prof. Lic.Mara E. de Fernndez

22

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersin

Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor ms elevado y el valor ms bajo. Realmente no es una medida muy significativa en la mayora de los casos, pero indudablemente es muy fcil de calcular. Algunos inconvenientes No utiliza todas las observaciones (slo dos de ellas); Se puede ver muy afectada por alguna observacin extrema; Omitir el valor extremo e indicarlo como una excepcin es una forma razonable de ajustar esta limitacin del rango. El rango aumenta con el nmero de observaciones, o bien se queda igual. En cualquier caso nunca disminuye. Hemos estudiado varias medidas de centralizacin, por lo que podemos hablar de desviacin con respecto a cualquiera de ellas, sin embargo, la mas utilizada es con respecto a la media.

Prof. Lic.Mara E. de Fernndez

23

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersin


Desviacin: Es la diferencia que se observa entre el valor de la variable y la media aritmtica. La denotaremos por di. No es una medida, son muchas medidas, pues cada valor de la variable lleva asociada su correspondiente desviacin, por lo que precisaremos una medida que resuma dicha informacin. La primera solucin puede ser calcular la media de todas las desviaciones, es decir, si consideramos como muestra la de todas las desviaciones y calculamos su media. Pero esta solucin es mala pues como veremos siempre va a ser 0. Luego por lo tanto esta primera idea no es valida, pues las desviaciones positivas se contrarrestan con las negativas. Para resolver este problema, tenemos dos caminos: Tomar el valor absoluto de las desviaciones. Desviacin media Elevar al cuadrado las desviaciones. Varianza.

Prof. Lic.Mara E. de Fernndez

24

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersin

Desviacin media: Ocasionalmente, la desviacin media se define como desviaciones absolutas de la mediana u otro promedio en lugar de la media. Una propiedad interesante de la suma xj a es que es mnima cuando a es la mediana, es decir, la desviacin media respecto de la mediana es mnima. Resulta ms apropiado utilizar el trmino desviacin media absoluta que el de desviacin media. Es la media de los valores absolutos desviaciones, y la denotaremos por d de las

Prof. Lic.Mara E. de Fernndez

25

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersin

Varianza:
Mide la distancia existente entre los valores de la serie y la media. Se calcula como la sumatoria de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el nmero de veces que se ha repetido cada valor. La sumatoria obtenida se divide por el tamao de la muestra. Es la media de los cuadrados de las desviaciones, y la denotaremos por o .

Prof. Lic.Mara E. de Fernndez

26

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersin

Varianza
que sigue

Tambin es posible calcular usando la frmula

Este estadstico tiene el inconveniente de ser poco significativo, pues se mide en el cuadrado de la unidad de la variable, por ejemplo, si la variable viene dada en cm. La varianza vendr en cm2 . La varianza siempre ser mayor que cero. Mientras ms se aproxima a cero, ms concentrados estn los valores de la serie alrededor de la media.

Prof. Lic.Mara E. de Fernndez

27

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersin

Varianza: Por el contrario, mientras mayor sea la varianza,

ms dispersos estn. La varianza es un nmero que nos permite comparar poblaciones, es la variacin promedio de las puntuaciones en una distribucin (es decir, la media de la suma de los cuadrados). Cuando la dispersin de las observaciones es grande (Datos que se alejan mucho por encima y por debajo del promedio), el valor de las puntuaciones de desviacin, (distancia entre cada dato y el promedio) ser grande. Entonces aumenta la suma de cuadrados de las puntuaciones de desviacin, y por lo tanto la varianza.

Prof. Lic.Mara E. de Fernndez

28

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersin

Desviacin tpica:. La desviacin estndar (o desviacin tpica) es una medida de dispersin para variables de razn (ratio o cociente) y de intervalo, de gran utilidad en la estadstica descriptiva. Este estadstico se mide en la misma unidad que la variable por lo que se puede interpretar mejor. Si la media aritmtica es la ms importante, la desviacin tpica o estndar es una de las ms importantes entre las medidas de dispersin. Se calcula como la raz cuadrada de la varianza. La desviacin estndar o desviacin tpica tiene las mismas unidades que la variable en estudio. Tanto la varianza como la desviacin estndar nos permiten comparar el grado de dispersin de distintas observaciones.

Prof. Lic.Mara E. de Fernndez

29

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersin

Todas estas medidas de dispersin vienen influidas por la unidad en la que se mide la variable, esto implica que si cambiamos de unidad de medida, los valores de estos estadsticos se vean a su vez modificados. Adems, no permite comparar por ejemplo, en un grupo de alumnos si los pesos o las alturas presentan mas dispersin. Pues no es posible comparar unidades de distinto tipo. Es la raz cuadrada de la varianza, se denota por Sx o sx Expresin de la varianza muestral:
Prof. Lic.Mara E. de Fernndez 30

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersin

Expresin de la varianza poblacional: Una vez entendida la formulacin de la varianza podemos pasar a obtener la desviacin estndar, tomando la raz cuadrada positiva de la varianza. As, si efectuamos la raz de la varianza muestral, obtenemos la desviacin tpica muestral; y si por el contrario, efectuamos la raz sobre la varianza poblacional, obtendremos la desviacin tpica poblacional. Expresin de la desviacin estndar muestral: Expresin de la desviacin estndar poblacional

Prof. Lic.Mara E. de Fernndez

31

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS

Medidas de Dispersin

El trmino desviacin estndar fue incorporado a la estadstica por Karl Pearson en 1894. (1857-1936) fue un matemtico britnico. Otros dos estadsticos importantes son la cuasivarianza y la cuasidesviacin tpica, son los estimadores de la varianza y desviacin tpica poblacionales respectivamente. Cuasivarianza: Es una medida de dispersin, cuya nica diferencia con la varianza es que dividimos por N- 1 la representaremos por o y la calcularemos de la siguiente forma:

Prof. Lic.Mara E. de Fernndez

32

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersin

Cuasidesviacin tpica:
La raz cuadrada de la cuasivarianza y la denotaremos por

Tambin se puede expresar la varianza muestral o cuasivarianza de esta forma :

Prof. Lic.Mara E. de Fernndez

33

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersin

Medidas de dispersin relativas Se precisa de una medida "escalar", es decir, que no lleve asociado ninguna unidad de medida es el coeficiente de variacin. Coeficiente de Variacin de Pearson: Es un estadstico de dispersin que tiene la ventaja de que no lleva asociada ninguna unidad, por lo que nos permitir decir entre dos muestras, cual es la que presenta mayor dispersin. La denotaremos por C.V. Para comparar la dispersin de variables que aparecen en unidades diferentes (metros, kilos, etc.) o que corresponden a poblaciones extremadamente desiguales, es necesario disponer de una medida de variabilidad que no dependa de las unidades o del tamao de los datos. Este coeficiente nicamente sirve para comparar las dispersiones de variables correspondientes a escalas de razn. Una manera de construir una medida de variabilidad que cumpla los requisitos anteriores es el llamado coeficiente de variacin
Prof. Lic.Mara E. de Fernndez 34

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersin Relativas

Coeficiente de Variacin

Cuando se quiere comparar el grado de dispersin de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el coeficiente de variacin de Pearson que se define como el cociente entre la desviacin tpica y el valor absoluto de la media aritmtica. CV representa el nmero de veces que la desviacin tpica contiene a la media aritmtica y por lo tanto cuanto mayor es CV mayor es la dispersin y menor la representatividad de la media.

Prof. Lic.Mara E. de Fernndez

35

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersin Relativas


Coeficiente de Variacin: (las barras del denominador representan el valor absoluto, es decir, indican que debe prescindirse de la unidad de medida de la media). A menor coeficiente de variacin consideraremos que la distribucin de la variable medida es ms homognea. Al dividir la desviacin tpica por la media se convierte en un valor exento de unidad de medida. Si comparamos la dispersin en varios conjuntos de observaciones tendr menor dispersin aquella que tenga menor coeficiente de variacin. Esto no ocurre con la desviacin tpica, ya que viene expresada en las mismas unidades que los datos de la serie El principal inconveniente, es que al ser un coeficiente inversamente proporcional a la media aritmtica, cuando sta tome valores cercanos a cero, el coeficiente tender a infinito
Prof. Lic.Mara E. de Fernndez 36

CARACTERISTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS Medidas de Dispersin Relativas


Dispersin Absoluta y Relativa. La dispersin o variacin real determinada por la desviacin tpica u otra medida de dispersin se llama dispersin absoluta. La dispersin relativa est definida como: Dispersin relativa = Dispersin absoluta/ Promedio Si la dispersin absoluta es la desviacin tpica s y el promedio es la media x, la dispersin relativa se conoce como coeficiente de variacin o coeficiente de dispersin, CV .

Prof. Lic.Mara E. de Fernndez

37

También podría gustarte