Está en la página 1de 10

Se le llama distribucin de frecuencias a la agrupacin de datos en categoras mutuamente excluyentes que indican el nmero de observaciones en cada categora.

Esto proporciona un valor aadido a la agrupacin de datos. La distribucin de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el nmero existente en cada clase. Estas agrupaciones de datos suelen estar agrupadas en forma de tablas. Una distribucin de frecuencias es un formato tabular en la que se organizan los datos en clases, es decir, en grupos de valores que describen una caracterstica de los [datos] y muestra el nmero de observaciones del conjunto de datos que caen en cada una de las clases. La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numrico. En principio, en la tabla de frecuencias se detalla cada uno de los valores diferentes en el conjunto de datos junto con el nmero de veces que aparece, es decir, su frecuencia. Se puede complementar la frecuencia absoluta con la denominada frecuencia relativa, que indica la frecuencia en porcentaje sobre el total de datos. En variables cuantitativas se distinguen por otra parte la frecuencia simple y la frecuencia acumulada. La tabla de frecuencias puede representar grficamente en un histograma (diagrama de barras). Normalmente en el eje vertical se coloca las frecuencias y en el horizontal los intervalos de valores. La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente.

Los intervalos de clase.

Los intervalos son los lmites a los extremos a los que llega una funcin. Son utilizados a modo de resumen cuando la cantidad de datos es muy grande. Los lmites extremos de cada clase se les llaman lmite inferior y superior de clase respectivamente. Los intervalos de clase se emplean si las variables toman un nmero grande de valores o la variable es continua, es el rango utilizado para dividir el conjunto de posibles valores numricos al trabajar con grandes cantidades de datos. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.

Lmites de la clase: cada clase est delimitada por el lmite inferior de la clase y el lmite superior de la clase. Amplitud de la clase: la amplitud de la clase es la diferencia entre el lmite superior e inferior de la clase. Marca de clase: la marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el clculo de algunos parmetros.

Existen 3 clases de intervalos: Abiertos: se colocan entre parntesis (por ejemplo (-3; 5)). Esto quiere decir que la funcin no toca los puntos -3 y 5 sino que llega a -2.99999 y a 4.9999. Cerrados: se expresan entre corchetes (por ejemplo [-3; 5]). Esto significa que la funcin empieza en -3 y termina en 5). Semiabiertos: se expresan con un parntesis de un lado y un corchete del otro (por ejemplo (-3; 5); esto quiere decir que la funcin empieza en - 2.99999 y termina en 5).

Frecuencia Se llama frecuencia a la cantidad de veces que se repite un determinado valor de la variable.Se suelen representar con histogramas y con diagramas de pareto.

Tipos de frecuencia En estadstica se pueden distinguir hasta cuatro tipos de frecuencias:

Frecuencia absoluta es el promedio de una suma predeterminada y adems consiste en saber cual es el nmero o smbolo de mayor equivalencia. (ni) de una variable estadstica xi, es el nmero de veces que este valor aparece en el estudio. A mayor tamao de la muestra aumentar el tamao de la frecuencia absoluta; es decir, la suma total de todas las frecuencias absolutas debe dar el total de la muestra estudiada (n). Frecuencia relativa (fi), es el cociente entre la frecuencia absoluta y el tamao de la muestra (n). Es decir,

Siendo el fi para todo el conjunto i. Se presenta en una tabla o nube de puntos en una distribucin de frecuencias. Si multiplicamos la frecuencia relativa por 100 obtendremos el porcentaje o tanto por ciento (pi)

Frecuencia absoluta acumulada (ni), es el nmero de veces ni en la muestra n. Frecuencia relativa acumulada (fi), es el cociente entre la frecuencia absoluta acumulada

Media aritmtica simple La media aritmtica o promedio simple ( x ) muestra el valor central de los datos constituyendo ser la medida de ubicacin que ms se utiliza. En general, es calculada sumando los valores de inters y dividiendo entre el nmero de valores sumados. Ventajas y desventajas del uso de la media aritmtica La media aritmtica viene expresada en las mismas unidades que la variable. En su clculo intervienen todos los valores de la distribucin. Es el centro de gravedad de toda la distribucin, representando a todos los valores observados. Es nica. Su principal inconveniente es que se ve afectada por los valores extremadamente grandes o pequeos de la distribucin.

Tipos de media Media ponderada Una media ponderada ( xw) es una media o promedio de cantidades a las que se ha asignado una serie de coeficientes, llamados pesos, para tener en cuenta adecuadamente su importancia relativa. Media geomtrica La media geomtrica (mg) de un conjunto de n nmeros positivos se define como la ensima raz del producto de n nmeros. Media armnica La media armnica (mh) se define como la recproca de la media aritmtica de los recprocos de un conjunto de datos. Media cuadrtica Una media cuadrtica (mc) se define como la raz cuadrada de la media aritmtica de los cuadrados de los valores de la variable. Histograma En estadstica, un histograma es una representacin grfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. Sirven para obtener una "primera vista" general, o panorama, de la distribucin de la poblacin, o la muestra, respecto a una caracterstica, cuantitativa y continua, de la misma y que es de inters para el observador (como la longitud o la masa). De esta manera ofrece una visin en grupo permitiendo observar una preferencia, o tendencia, por parte de la muestra o poblacin por ubicarse hacia una determinada regin de valores dentro del espectro de valores posibles (sean infinitos o no) que pueda

adquirir la caracterstica. As pues, podemos evidenciar comportamientos, observar el grado de homogeneidad, acuerdo o concisin entre los valores de todas las partes que componen la poblacin o la muestra, o, en contraposicin, poder observar el grado de variabilidad, y por ende, la dispersin de todos los valores que toman las partes, tambin es posible no evidenciar ninguna tendencia y obtener que cada miembro de la poblacin toma por su lado y adquiere un valor de la caracterstica aleatoriamente sin mostrar ninguna preferencia o tendencia, entre otras cosas. En el eje vertical se representan las frecuencias, es decir, la cantidad de poblacin o la muestra, segn sea el caso, que se ubica en un determinado valor o subrango de valores de la caracterstica conocido como intervalo de clase. En el eje horizontal se representa el espectro de valores posibles que toma la caracterstica de inters, evidentemente, cuando ste espectro de valores es infinito o muy grande el mismo es reducido a slo una parte que muestre la tendencia o comportamiento de la poblacin, en otras ocasiones ste espectro es extendido para mostrar el alejamiento o ubicacin de la poblacin o la muestra analizada respecto de un valor de inters. En general se utilizan para relacionar variables cuantitativas continuas, pero tambin se lo suele usar para variables cuantitativas discretas, en cuyo caso es comn llamarlo diagrama de frecuencias y sus barras estn separadas, esto por que en el x ya no se representa un espectro continuo de valores, sino valores cuantitativos especficos como ocurre en un diagrama de barras cuando la caracterstica que se representa es cualitativa o categrica. Su utilidad se hace ms evidente cuando se cuenta con un gran nmero de datos cuantitativos y que se han agrupado en intervalos de clase. Ejemplos de su uso es cuando se representan franjas de edades o altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos. En los casos en los que los datos son cualitativos (no-numricos), como sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores. Los histogramas son ms frecuentes en ciencias sociales, humanas y econmicas que en ciencias naturales y exactas. Y permite la comparacin de los resultados de un proceso. Ejemplo:

Diagrama de barras Un diagrama de barras, tambin conocido como diagrama de columnas, es una forma de representar grficamente un conjunto de datos o valores y est conformado por barras rectangulares de longitudes proporcionales a los valores representados. Los grficos de barras son usados para comparar dos o ms valores. Las barras pueden orientarse vertical u horizontalmente. Ejemplo: Este diagrama de ejemplo est basado en los resultados de la eleccin del parlamento europeo en el 2004 y en el de 1999. La tabla siguiente lista el nmero de asientos asignadas a cada partido. Los resultados de 1999 han sido multiplicados por 1.16933, para compensar el cambio en el nmero de asientos entre estos aos.

Grupo Asientos (2004) Asientos (1999) a escala Euro Efa Edd Eldr Epp Uen 66 42 15 67 276 27 49 56 19 60 272 36 29 200 210

Otros 66

Un grfico de barras que represente los resultados anteriores de la eleccin del 2004 se vera as: (Si todos los datos fuesen ordenados en orden descendiente, este tipo de grfico de barras sera llamado un diagrama de pareto.)

Polgono de frecuencia Un polgono de frecuencias se forma uniendo los extremos de las barras de un diagrama de barras mediante segmentos. Tambin se puede realizar trazando los puntos que representan las frecuencias y unindolos mediante segmentos. Ejemplo:

Ojivas Una distribucin de frecuencia acumulativa nos permite ver cuantas observaciones se hallan por arriba o por debajo de ciertos valores, en lugar de limitarnos a anotar los nmeros de elementos dentro de los intervalos. Por ejemplo, si queremos saber cuntos galones contienen menos de 17.0 ppm, podemos servirnos de una tabla que incluya frecuencias acumulativas menores que.

Distribucin de frecuencia acumulativa menor que de las concentraciones de cloro en ppm

Se llama ojiva a la grfica de una distribucin de frecuencia acumulativa. La ojiva de una distribucin de este tipo se muestra en la figura 4. Los puntos graficados representan la cantidad de galones que tienen menos cloro que las partes por milln indicadas sobre el eje horizontal. Ojiva menor que de la distribucin de las concentraciones de cloro en ppm para 30 galones de agua tratada.

En ocasiones la informacin que se utiliza se presenta a partir de frecuencias mayores que. La ojiva apropiada para tal informacin tendr una pendiente hacia abajo y hacia la derecha. Tambin es posible construir una ojiva de una distribucin de frecuencia relativa, de la misma manera que una absoluta.

Media aritmtica En matemticas y estadstica, la media aritmtica (tambin llamada promedio o simplemente media) de un conjunto finito de nmeros es el valor caracterstico de una serie de datos cuantitativos objeto de estudio que parte del principio de la esperanza matemtica o valor esperado, se obtiene a partir de la suma de todos sus valores dividida entre el nmero de sumandos. Cuando el conjunto es una muestra aleatoria recibe el nombre de media muestral siendo uno de los principales estadsticos muestrales. Expresada de forma ms intuitiva, podemos decir que la media (aritmtica) es la cantidad total de la variable distribuida a partes iguales entre cada observacin. Ejemplo: Si en una habitacin hay tres personas, la media de dinero que tienen en sus bolsillos sera el resultado de tomar todo el dinero de los tres y dividirlo a partes iguales entre cada uno de ellos. Es decir, la media es una forma de resumir la informacin de una distribucin (dinero en el bolsillo) suponiendo que cada observacin (persona) tuviera la misma cantidad de la variable. Mediana (estadstica) En el mbito de la estadstica, la mediana representa el valor de la variable de posicin central en un conjunto de datos ordenados. De acuerdo con esta definicin el conjunto de datos menores o iguales que la mediana representarn el 50% de los datos, y los que sean mayores que la mediana representarn el otro 50% del total de datos de la muestra. La mediana coincide con el percentil 50, con el segundo cuartil y con el quinto decil. Su clculo no se ve afectado por valores extremos. Ejemplo:

Moda La moda es la medida que se relaciona con la frecuencia con que se presenta el dato o los datos con mayor incidencia, con lo que se considera la posibilidad de que exista ms de una moda para un conjunto de datos. La notacin mas frecuente es la siguiente: mo y . Esta medida se puede aparecer tanto para datos cualitativos como cuantitativos. Se dice que cuando un conjunto de datos tiene una moda la muestra es unimodal, cuando tiene dos modas bimodal, cuando la muestra contiene mas de un dato repetido se dice que es multimodal y un ltimo caso es cuando ningn dato tiene una frecuencia, en dicho caso se dice que la muestra es amodal. Ejemplo:

Desviacin estndar La desviacin estndar o desviacin tpica (denotada con el smbolo o s, dependiendo de la procedencia del conjunto de datos) es una medida de dispersin para variables de razn (variables cuantitativas o cantidades racionales) y de intervalo se define como la raz cuadrada de la varianza. Junto con este valor, la desviacin tpica es una medida (cuadrtica) que informa de la media de distancias que tienen los datos respecto de su media aritmtica, expresada en las mismas unidades que la variable. Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer tambin la desviacin que presentan los datos en su distribucin respecto de la media aritmtica de dicha distribucin, con objeto de tener una visin de los mismos ms acorde con la realidad al momento de describirlos e interpretarlos para la toma de decisiones.

Desviacin media: corresponde a la diferencia numrica entre una medida individual o nmero y la media aritmtica de una serie completa de tales medidas o nmeros. Por ejemplo, si la media de alturas de todos los alumnos de un curso es 1,51 m y uno de ellos mide 1,63m, la desviacin media de su altura con respecto a la media es de +0.12 metros. Desviacin estndar: es un dato que representa la variabilidad existente en un conjunto de datos, ya que por ejemplo dos conjuntos de datos pueden presentar la misma media aritmtica, pero poseer distinta variabilidad, por eso este estadgrafo nos permite saber acerca de la variabilidad o dispersin de los datos. Matemticamente se define como "la raz cuadrada del promedio de los cuadrados de las desviaciones medias de cada valor de la variable con respecto de la media aritmtica" Varianza En teora de probabilidad, la varianza (que suele representarse como ) de una variable aleatoria es una medida de dispersin definida como la esperanza del cuadrado de la desviacin de dicha variable respecto a su media. Est medida en unidades distintas de las de la variable. Por ejemplo, si la variable mide una distancia en metros, la varianza se expresa en metros al cuadrado. La desviacin estndar es la raz cuadrada de la varianza, es una medida de dispersin alternativa expresada en las mismas unidades de los datos de la variable objeto de estudio. La varianza tiene como valor mnimo 0. Hay que tener en cuenta que la varianza puede verse muy influida por los valores atpicos y no se aconseja su uso cuando las distribuciones de las variables aleatorias tienen colas pesadas. En tales casos se recomienda el uso de otras medidas de dispersin ms robustas. Amplitud Se obtiene restando el valor ms bajo del ms alto en un conjunto de observaciones. La amplitud tiene la ventaja de que es fcil de calcular y sus unidades son las mismas que las de la variable que se mide. La amplitud no toma en consideracin el nmero de observaciones de la muestra estadstica, sino solamente la observacin del valor mximo y la del valor mnimo. Sera deseable utilizar tambin los valores intermedios del conjunto de observaciones.