Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Se ha sugerido que este artculo o seccin sea fusionado con Frecuencia estadstica (discusin).
Una vez que hayas realizado la fusin de artculos, pide la fusin de historiales aqu.
En estadstica, se le llama distribucin de frecuencias a la agrupacin de datos en categoras mutuamente excluyentes que indican el nmero de observaciones en cada categora.1 Esto proporciona un valor aadido a la agrupacin de datos. La distribucin de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el nmero existente en cada clase. Estas agrupaciones de datos suelen estar agrupadas en forma de tablas.
ndice
[ocultar]
o o o o o
2.1 Frecuencia absoluta 2.2 Frecuencia relativa 2.3 Frecuencia acumulada 2.4 Frecuencia relativa acumulada 2.5 Distribucin de frecuencias agrupadas
3 Referencias
[editar]Caractersticas
Una distribucin de frecuencias es un formato tabular en la que se organizan los datos en clases, es decir, en grupos de valores que describen una caracterstica de los [datos] y muestra el nmero de observaciones del conjunto de datos que caen en cada una de las clases. La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numrico. En principio, en la tabla de frecuencias se detalla cada uno de los valores diferentes en el conjunto de datos junto con el nmero de veces que aparece, es decir, su Frecuencia. Se puede complementar la frecuencia absoluta con la denominada frecuencia relativa, que indica la frecuencia en porcentaje sobre el total de datos. En variables cuantitativas se distinguen por otra parte la frecuencia simple y la frecuencia acumulada. La tabla de frecuencias puede representarse grficamente en un histograma(Diagrama De Barras). Normalmente en el eje vertical se coloca las frecuencias y en el horizontal los intervalos devalores. La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente.
[editar]Tipos
de frecuencias
[editar]Frecuencia
absoluta
La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio estadstico. Se representa por ni. La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por N. Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula) que se lee suma o sumatoria. puesto que es mentira se hace el intercambio en la nterfaz de la frecuencia absoluta.
[editar]Frecuencia
relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento y se representa por fi. La suma de las frecuencias relativas es igual a 1.
[editar]Frecuencia
acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Se representa por Fa.
[editar]Frecuencia
relativa acumulada
La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento. Ejemplo: Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas mximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27
[editar]Distribucin
de frecuencias agrupadas
La distribucin de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un nmero grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. Lmites de la clase. Cada clase est delimitada por el lmite inferior de la clase y el lmite superior de la clase. La amplitud de la clase es la diferencia entre el lmite superior e inferior de la clase. La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el clculo de algunos parmetros. Construccin de una tabla de datos agrupados:
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. 1. Se localizan los valores menor y mayor de la distribucin. En este caso son 3 y 48. 2. Se restan y se busca un nmero entero un poco mayor que la diferencia y que sea divisible por el nmero de intervalos queramos establecer. Es conveniente que el nmero de intervalos oscile entre 6 y 15. En este caso, 48 - 3 = 45, incrementamos el nmero hasta 50 : 5 = 10 intervalos. Se forman los intervalos teniendo presente que el lmite inferior de una clase pertenece al intervalo, pero el lmite superior no no pertenece intervalo, se cuenta en el siguiente intervalo.
ci [0, 5) [5, 10) [10, 15) [15, 20) [20, 25) [25, 30) [30, 35) [35, 40) [40, 45) [45, 50) Total: 2.5 1 7.5
fi 1 1 3 3 3 6 7 10 4 2
Fi 2 5 8 11 17 24 34 38 40
ni 0.025
Ni 0.025 0.025 0.075 0.075 0.075 0.150 0.175 0.250 0.100 0.050 1 0.050 0.125 0.200 0.2775 0.425 0.600 0.850 0.950 1
de
de
frecuencias es asignando a
de tab la de
estadsticos ,
Tipos de frecuencia
Frecuencia absoluta
La frecuencia
absolu ta es
el nmero
de
veces que
aparece
un
Se representa por f i .
La suma de las frecuencias abso lutas es igual al nmero tota l de datos, que se representa por N .
Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula) que se lee suma o sumatoria.
Frecuencia relativa
La frecuencia relativa es el coc iente entre la f recuencia absolu ta de un determinado valor y el nmero to tal de datos .
Frecuencia acumulada
La frecuencia acumulada es la suma d e las frecuencias absolu tas de todos los valores inferiores o iguales a l valo r considerado.
Se representa por F i .
La frecuencia
relativa
acumulad a es
el co ciente entre
la frecuencia
acumulad a de un determina do valo r y el nmero total de datos . Se puede expresar en tantos por ciento.
Ejemplo
Durante el mes de julio, en una ciuda d se han registra do las siguientes temperaturas mximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta.
xi
Recuento
fi
Fi
ni
Ni
27
0.032
0.032
28
II
0.065
0.097
29
0.194
0.290
30
16
0.226
0.516
31
24
0.258
0.774
32
III
27
0.097
0.871
33
III
30
0.097
0.968
34
31
0.032
31
agrupados se emplea si las variables toman un nmero grande de valo res o la variable es continua .
Se agrupan los valores en in tervalos que amplitud denominados clases . correspondiente . A cada clase se le
tengan asigna
la misma su frecuencia
Lmites de la clase
Cada clase est delimitada por el lmite inferior de la clase y el lmite superior de la clase .
Amplitud de la clase
La amplitud
de
la
clase es
la d iferencia entre
el lmite
superio r
inferior de la clase .
Marca de clase
La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo pa ra el c lculo de algunos parmetro s .
1 se loca lizan los va lores menor y mayor de la distribucin. En este caso son 3 y 48.
2 Se restan y se busca un nmero entero un poco mayor que la diferencia y que sea divisible por el nmero de intervalos de queramos poner.
Se forman los intervalos teniendo presente que el lmite inferior de una clase pertenece a l intervalo, pero el lm ite superior no pertenece interva lo, se cuenta en el siguiente interva lo.
ci
fi
Fi
ni
Ni
[0, 5)
2.5
0.025
0.025
[5, 10)
7.5
0.025
0.050
[10, 15)
12. 5
0.075
0.125
[15, 20)
17. 5
0.075
0.200
[20, 25)
22. 5
11
0.075
0.2775
[25, 30)
27. 5
17
0.150
0.425
[30, 35)
32. 5
24
0.175
0.600
[35, 40)
37. 5
10
34
0.250
0.850
[40, 45)
42. 5
38
0.100
0.950
[45, 50)
47. 5
40
0.050
40
Distribuciones de frecuencia
Cuando se dispone de gran nmero de datos, es til el distribuirlos en clases o categoras y determinar el nmero de individuos pertenecientes a cada clase, que es la frecuencia de clase. Una ordenacin tabular de los datos en clases, reunidas las clases y con as frecuencias correspondientes a cada una, se conoce como
una distribucin de frecuencias o tabla de frecuencias. La Tabla 1 es una distribucin de frecuencias de alturas (registradas con aproximacin de pulgada) de 100 estudiantes de la Universidad XYZ.
La primera clase o categora, por ejemplo, comprende las alturas de 60 a 62 pulgadas y viene indicada por el smbolo 60 - 62. Puesto que 5 estudiantes tienen una altura perteneciente a esta clase, la correspondiente frecuencia de clase es 5. Los datos ordenados y resumidos como en la distribucin de frecuencia anterior, se suelen llamar datos agrupados. Aunque con el proceso de agrupamiento generalmente se pierde parte del detalle original de los datos, tiene la importante ventaja de presentarlos todos en un sencillo cuadro que facilita el hallazgo de las relaciones que pueda haber entre ellos, puestas as de manifiesto.
caso, c es igual a la diferencia entre dos sucesivos lmites de clase inferiores o superiores. Para los datos de la Tabla 1, por ejemplo, el intervalo de clase es c = 62,5 - 59,5 = 65,5 - 62,5 = 3.
Marca de clase
Leer ms: http://www.monografias.com/trabajos72/distribucion-frecuencias/distribucionfrecuencias.shtml#distribuca#ixzz2NB3LnIPj
DISTRIBUCIONES DE FRECUENCIAS
Las distribuciones o tablas de frecuencias permiten resumir los datos en una tabla que recoge:
valores de la variable o modalidades del atributo,
frecuencia absoluta o nmero de veces que aparece cada valor o modalidad en la muestra,
porcentaje de veces que aparece cada valor de la variable o modalidad del atributo sobre el total de observaciones,
porcentaje vlido calculado sobre el total de observaciones excluidos los valores missing,
porcentaje acumulado hasta cada uno de los valores de la variable ordenados de menor a mayor. Este porcentaje tiene interpretacin slo en los casos en que la variable sea susceptible de medida por lo menos en una escala ordinal.
En el cuadro de dilogo Frecuencias se seleccionan las variables para las que se quiere obtener sus correspondientes tablas de frecuencias unidimensional y se trasladan al cuadro Variables con el botn . Para obtener la distribucin de frecuencias debe estar activada la opcin Mostrar tablas
de frecuencias. La tabla que aparece en el visor de resultados no agrupa en intervalos o clases los valores de la variable; si se desea agruparlos es necesario recodificar previamente la variable (en otra variable) definiendo los lmites de los intervalos* Adems, el cuadro de dilogo Frecuencias permite activar otras opciones con los botones:
Estadsticos
Grficos
Formato
Estas opciones pueden utilizarse teniendo o no activada la opcin Mostrar tablas de frecuencias.
ESTADSTICOS La opcin Estadsticos abre un cuadro de dilogo que permite la obtencin de las principales medidas de sntesis o estadsticos de una distribucin unidimensional de frecuencias. stos se presentan agrupados en cuatro clases: Valores percentiles, Tendencia central, Dispersin y Distribucin.
Valores percentiles son aquellos valores de la variable que dividen a la distribucin de frecuencias en partes con igual nmero de observaciones: as, los cuartiles la dividen en cuatro partes guales y se obtienen directamente activando la opcin Cuartiles. Si interesan los valores que dividen la distribucin en k partes iguales se activa la opcin Puntos de corte para (por defecto 10) grupos iguales, lo que proporciona los deciles de la distribucin. En la opcin Percentiles es necesario indicar cuales de ellos se desean, incluyndolos de uno en uno con el botn Aadir.
Tendencia central permite seleccionar Media, Mediana y Moda de la distribucin, as como la Suma de todos los valores de la distribucin.
Dispersin permite seleccionar las siguientes medidas: Varianza, como resultado del clculo de la
expresin,
Por ltimo, en Distribucin pueden obtenerse las siguientes medidas relativas a la forma de la distribucin: coeficiente de Asimetra, error tpico de asimetra, coeficiente de Curtosis y error tpico de curtosis, calculadas mediantelas siguientes expresiones:
Asimetra
Error
tp.
de
asimetra
Curtosis
GRFICOS Los grficos asociados a la tabla de frecuencias que recoge del cuadro de
dilogo Frecuencias son: Grficos de barras,Grficos de sectores o Histogramas. Para seleccionar el que interesa se activa la opcin Grficos que abre el siguiente cuadro de dilogo:
Si la caracterstica objeto de anlisis es un atributo los grficos adecuados son el grfico de barras o de sectores; en ambos casos pueden realizarse con frecuencias absolutas o con relativas seleccionando Frecuencias o Porcentajes, respectivamente. Si la caracterstica es cuantitativa el grfico adecuado es el histograma que, a su vez, puede obtenerse superponindole la Curva de la distribucin normal activando la opcin correspondiente.
FORMATO Para modificar el aspecto de los resultados, ya sean, tablas o estadsticos, se activa la opcin Formato que abre el cuadro de dilogo siguiente:
Mltiples variables: se puede seleccionar el tipo de presentacin de los cuadros de estadsticos cuando se realiza simultneamente el anlisis unidimensional de dos o ms variables. Por defecto, est activada la opcin Comparar variables que proporciona un nico cuadro que contiene los estadsticos seleccionados correspondientes a todas las variables. Si se selecciona la opcin Organizar resultados segn variables se obtiene un cuadro de estadsticos para cada variable por separado.
El cuadro Frecuencias: Formato tambin ofrece la posibilidad de limitar la elaboracin de tablas de frecuencias slo para Aquellas variables que presentan un nmero reducido de valores o categoras. Para ello se debe indicar en el recuadroSuprimir tablas con ms de (por defecto 10) categoras el nmero de categoras a partir del cual no se desea la elaboracin de la tabla.
EJEMPLOS
Ejemplo 1. Con la base de datos Enctran.sav obtener la tabla de frecuencias, el diagrama de barras y los estadsticos media, mediana, moda, desviacin tipo, varianza y las medidas de forma (asimetra y curtosis) de las variables: Como, Rapi e Inde.
Vamos a realizar la descripcin de la variable Como, dejando al lector la descripcin de las variables Rapi e Inde. Con la secuencia Analizar > Estadsticos Descriptivos > Frecuencias se abre un cuadro de dilogo donde se selecciona la variable Como; con el botn Estadsticos se activan las medidas que se desean obtener y con el botn Grficos se activa la opcin Grficos de barras. Se obtienen los siguientes cuadros:
- Las medidas de posicin (media, mediana y moda) indican el valor central de la distribucin, y en este caso aproximadamente coinciden los tres estadsticos en el valor 5. Esto significa que la distribucin es bastante simtrica y que la valoracin media de la comodidad del medio de transporte no es ni buena ni mala.
- La desviacin tpica es 2,52 que sobre una media de 5,1 indica que la dispersin de los datos con respecto a la media es moderada.
- El coeficiente de asimetra toma el valor 0,182 que no es significativo ya que presenta un error estndar 0,226 y, por lo tanto, puede considerarse que la distribucin es simtrica. La curtosis de esta variable es 0,126 con un error estndar de 0,449 lo que indica que la distribucin es mesocrtica.
Ejemplo 2. Con la misma base de datos Enctran.sav obtener la tabla de frecuencias y el diagrama de barras de la variable Trans.
Entre otros resultados se observa que los porcentajes correspondientes a las tres modalidades de transporte pblico acumulan el 83,3% de los estudiantes y, nicamente, el 12,2% utiliza transporte
privado. Al ser una variable cualitativa el nico estadstico representativo de la distribucin es la moda que, en este caso, es la modalidad Metro que representa un 46,5% del total.
Ejemplo 3. Con la base de datos Enctran.sav obtener la tabla de frecuencias y la representacin grfica adecuada para la variable Coste, agrupando los valores en los siguientes intervalos: [0,5000) [5000,10000) [10000,15000) [15000, 20000).
Para obtener la tabla con los valores agrupados en intervalos es necesario, en primer lugar, recodificar los valores en una nueva variable. Para ello, se activa la opcin Recodificar > En distintas variables del men Transformar. En el cuadro de dilogo que aparece:
Se selecciona la variable Coste.
En Variable de Resultado se indica el nombre elegido para la nueva variable, por ejemplo, 'Coste1'. Se etiqueta la nueva variable, 'Coste recodificado'. Se definen los intervalos activando Valores antiguos y nuevos. Para definir el primer intervalo se activa enValor antiguo la opcin Rango: Del menor hasta 5000 y se le asigna como Valor nuevo 1; los siguientes intervalos se definen activando Rango lmite inferior hasta lmite superior, asignndoles los valores 2 y 3. El ltimo intervalo se define mediante Rango 15000 hasta el mayor y se le asigna Valor nuevo 4.
Se etiquetan los valores de la variable Coste1. En la ventana Vista de variable o bien con doble clic sobre la variable Coste1, introducimos las etiquetas de los valores. En Valores se indica:
Valor 1 2 3 4 Etiqueta de valor 0-5000 5000-10000 10000-15000 15000-20000
Por ltimo, con Analizar > Estadsticos Descriptivos > Frecuencias se obtiene la tabla de frecuencias y el histograma, que es el adecuado dada la naturaleza continua de la variable.
1. Probabilidad y Estadstica Distribucin de frecuencias Ing. Gerardo Valds Bermdes CBTis 224
2. Distribuciones de frecuencias Cuando se trabaja con conjunto grandes de datos, con frecuencia es til organizarlos y resumirlos por medio de construccin de una tabla que liste los distintos valores posibles de los datos (de forma individual o por grupos), junto con las frecuencias correspondientes, es decir, el numero de veces que ocurren dichos valores.
3. Ejemplo Niveles de Cotinina en un grupo de fumadores. 1 0 131 173 265 210 44 277 32 3 35 112 477 289 227 103 222 149 313 491 130 234 164 198 17 253 87 121 266 290 123 167 250 245 48 86 284 1 208 173 11 12 14 1 2 0-99 100-199 200-299 300-399 400-499 Frecuencia Cotinina Distribucin de frecuencias de los niveles de cotinina de los fumadores
4. Distribucin de frecuencias Definicin: Lista de valores de datos (ya sea de manera individual o por grupos de intervalos), junto con sus frecuencias (o conteos) correspondientes. 11 12 14 1 2 0-99 100-199 200-299 300-399 400-499 Frecuencia Cotinina Distribucin de frecuencias de los niveles de cotinina de los fumadores
5. Elementos de una distribucin de frecuencias La frecuencia de una clase particular es el numero de valores originales que caen dentro de esa clase. Ejemplo: La primera clase de la tabla tiene una frecuencia de 11, lo que significa que 11 de los valores de los datos estn entre 0 y 99 11 12 14 1 2 0-99 100-199 200-299 300-399 400499 Frecuencia Cotinina Distribucin de frecuencias de los niveles de cotinina de los fumadores
6. Elementos de una distribucin de frecuencias Los Lmites de clases inferiores son las cifras mas pequeas que pueden pertenecer a las diferentes clases. Ejemplo: Los limites de clase inferiores de la tabla son: 0, 100, 200, 300 y 400. 0 -99 100 -199 200 -299 300 -399 400 -499 11 12 14 1 2 0-99 100-199 200-299 300-399 400-499 Frecuencia Cotinina Distribucin de frecuencias de los niveles de cotinina de los fumadores
7. Elementos de una distribucin de frecuencias Los Lmites de clases superiores son las cifras mas grandes que pueden pertenecer a las diferentes clases. Ejemplo: Los limites de clase superiores de la tabla son: 99, 199, 299, 399 y 499. 0- 99 100- 199 200- 299 300399 400- 499 11 12 14 1 2 0-99 100-199 200-299 300-399 400-499 Frecuencia Cotinina Distribucin de frecuencias de los niveles de cotinina de los fumadores
8. Elementos de una distribucin de frecuencias Las fronteras de clase son las cifras para separar las clases, aunque sin los espacios creados por los limites de clases. Se calculan de la siguiente manera: 1. Se determina el tamao del espacio entre el limite de clase superior de una clase y el limite de clase inferior de la siguiente Para ste caso el espacio es de una unidad 11 12 14 1 2 0-99 100199 200-299 300-399 400-499 Frecuencia Cotinina Distribucin de frecuencias de los niveles de cotinina de los fumadores
9. Elementos de una distribucin de frecuencias Las fronteras de clase son las cifras para separar las clases, aunque sin los espacios creados por los limites de clases. 2. Se suma la mitad de esa cantidad a cada limite de clase superior , para obtener las fronteras de clases superiores y se resta la mitad de esa cantidad a cada limite de clase inferior, para obtener las fronteras de clases inferiores. +0.5 +0.5 +0.5 +0.5 +0.5 -0.5 -0.5 -0.5 -0.5 -0.5 -0.5-99.5 99.5-199.5 199.5-299.5 299.5-399.5 399.5-499.5 11 12 14 1 2 0-99 100-199 200-299 300-399 400-499 Frecuencia Cotinina Distribucin de frecuencias de los niveles de cotinina de los fumadores
10. Elementos de una distribucin de frecuencias Las marcas de clases son los puntos medios de las clases. Se calculan sumando el limite de clase inferior con el limite de clase superior y dividiendo la suma entre dos. 49.5 149.5 249.5 349.5 449.5 11 12 14 1 2 0-99 100-199 200-299 300-399 400-499 Frecuencia Cotinina Distribucin de frecuencias de los niveles de cotinina de los fumadores
11. Elementos de una distribucin de frecuencias La anchura de clase es la diferencia entre dos limites de clase inferiores consecutivos o dos fronteras de clase consecutivas. En sta tabla, la achura de clase es igual a 100 11 12 14 1 2 0-99 100-199 200-299 300-399 400-499 Frecuencia Cotinina Distribucin de frecuencias de los niveles de cotinina de los fumadores
1. Escalas de medicin:
Corresponde a la Situacin 1, es decir, es una escala en que se establece un nmero determinado de clases o categoras de tal modo que cada elemento de la poblacin pertenece a una y slo una clase. Matemticamente se dice que se ha establecido una relacin de equivalencia entre los elementos de la poblacin. Si slo existen dos clases se denomina escala dicotmica. La nica operacin matemtica que se puede realizar con las clases de cualquier escala nominal es determinar las cantidades de elementos que les corresponden determinar sus frecuencias. Por ejemplo:
Sexo: las clases son masculino o femenino. Especialidad: las diferentes especialidades (carreras) del CRUSAM. Nmero de cedula de identidad personal. Temperatura de una persona: sanguneo, flemtico, melanclico, colrico. Nmero de placa de automviles del pas. a. Escala Nominal:
Corresponde a la Situacin 1, es decir, es una escala en que se establece un nmero determinado de clases o categoras de tal modo que cada elemento de la poblacin pertenece a una y slo una clase. Matemticamente se dice que se ha establecido una relacin de equivalencia entre los elementos de la poblacin. Si slo existen dos clases se denomina escala dicotmica. La nica operacin matemtica que se puede realizar con las clases de cualquier escala nominal es determinar las cantidades de elementos que les corresponden determinar sus frecuencias.
Por ejemplo:
Sexo: las clases son masculino o femenino. Especialidad: las diferentes especialidades (carreras) del CRUSAM. Nmero de cedula de identidad personal. Temperatura de una persona: sanguneo, flemtico, melanclico, colrico. Nmero de placa de automviles del pas. a. Escala Ordinal:
Corresponde a la Situacin 2. Es una escala nominal entre cuyas clases est definido un orden, de modo que cualquiera que sean dos de ellas, una ser mayor o superior, en algn sentido, que la otra. Por ejemplo:
Evaluaciones en un examen: 5, 4, 3 y 2. Grado de satisfaccin de una necesidad: alto, medio, bajo Conocimiento de un idioma: excelente, bien, regular, mal a. Escala de Intervalos:
Corresponde a la situacin 3 y no es ms que una escala ordinal con una distancia, una unidad de medida entre sus clases de modo tal que dado dos puntajes cualesquiera se puede saber cuan distante est uno del otro. La unidad de medida es arbitraria, pero comn y el punto de inicio (cero) es tambin arbitrario. Cuando se tiene una escala de intervalo se pueden realizar las operaciones de adicin y sustraccin, pero no necesariamente la multiplicacin y divisin dentro de la escala. Por ejemplo:
Corresponde a la situacin 4 y es una escala de intervalos donde existe un cero absoluto que marca la ausencia total del atributo en estudio.La proporcin entre los atributos de dos individuos cualesquiera es independiente de la escala de medida utilizada. En ella la razn entre dos clases (puntajes) cualesquiera permanece invariable ante toda la transformacin de la escala de razn, o sea ante toda transformacin del tipo y=(x). De aqu que siempre el cero de la escala transformada coincide con el cero de la escala original. En las escalas de razones es posible realizar todas las operaciones aritmticas con los puntajes. Por ejemplo:
Estatura de los alumnos: la estatura en metros es proporcional a la estatura en pulgadas. Peso de los alumnos: (en libras o kilogramos) El tiempo invertido en una prueba de velocidad en educacin fsica (en minutos o segundos). 1.
Definiremos como frecuencia de un dato el nmero de veces que este aparece en el colectivo; consecuentemente, si una variable estadstica toma r valores, cada uno de los cuales puede repetirse un cierto nmero de veces, podramos decir que el nmero de datos representado por la variable seran N, siendo N la suma de las respectivas frecuencias de cada dato ( N=Xi). Este valor N ser denominado como frecuencia total, mientras que la frecuencia de cada dato recibir el nombre de frecuencia absoluta o simplemente frecuencia (fi). La frecuencia absoluta nos habla del nmero de veces que un dato aparece en un colectivo, ms ello no nos dice demasiado en orden al establecimiento de comparaciones sobre la importancia de este dato. Para obtener una idea de la importancia que un dato posee en el seno de un colectivo, puesto que no es suficiente concepto de frecuencia, se utiliza el concepto frecuencia relativa, que se definir como: el coeficiente entre la frecuencia absoluta del dato considerado y la frecuencia total (fr=fi/Xi). Para efectos prcticos, asumiremos las siguientes definiciones de frecuencias:
frecuencias absolutas : es el nmero de veces que aparece en la muestra dicho valor de la variable y se representa por fi. frecuencias relativas: es el cociente entre la frecuencia absoluta y el tamao de la muestra. La denotaremos por fri frecuencias absoluta acumulada: para poder calcular este tipo de frecuencias hay que tener en cuenta que la variable estadstica ha de ser cuantitativa o cualitativa ordenable. En otro caso no tiene mucho sentido el clculo de esta frecuencia. La frecuencia absoluta acumulada de un valor de la variable, es el nmero de veces que ha aparecido en la muestra un valor menor o igual que el de la variable y lo representaremos por fa, se puede acumular, en la tabla estadstica) en orden ascendente (fa) o descendente (fa). frecuencia relativa acumulada: al igual que en el caso anterior se calcula como el cociente entre la frecuencia absoluta acumulada dividido por el tamao de la muestra (N) y la denotaremos por fra. Resumiendo lo expuesto, si Xi es un valor de la variable, podemos representar por fi a su frecuencia y por fi/Xi a su frecuencia relativa (siendo Xi=N o la frecuencia total). Para el conjunto de los valores de la variable Xi tendramos, as la tabla #1, compresiva de la informacin sobre dicha variable, a travs de las respectivas frecuencias: Tabla #1: Variables Discretas Valores de la variable Xi (datos) X1 X2 Xn Donde: N=fi y fi/N=1 Otro es el caso de las clases representadas en forma de intervalos, variables continuas, llamados intervalos de clases que poseen extremos llamados limite inferior y limite superior, Un intervalo se dice que es abierto o no cerrado, por un extremo si no contiene el lmite correspondiente. La longitud, tamao o amplitud de un intervalo de clases (C) es la diferencia entre los limites superior e inferior (C=lim sup lim inf). El Recorrido (R) es la diferencia entre el dato mayor y el menor del conjunto da datos en estudio (R=Xn X1) En el caso de variables continuas ser necesario fijar intervalos de frecuencias para llegar a un resumen efectivo de la informacin original. A menudo es necesario representar una clase, o ms particularmente, un intervalo por un nico valor, este representar a todo el intervalo y se denominar marca de clases. Matemticamente el punto medio de cada intervalo corresponde a lo que denominamos marca de clase, se frecuencias absolutas fi f1 f2 fn frecuencias relativas fi/N f1/N f2/N fn/N
denotar por Xi, y constituir el valor representativo de cada intervalo. El nmero de observaciones que correspondan a cada intervalo se denominar frecuencias absolutas. Tabla #2: Variables Continuas Intervalos (C) X1-X2 X2-X3 Xn-1-Xn Donde Marcas de Clases Xi X1 X2 Xn Frecuencias Absolutas fi f1 f2 fn
N = fi = Nmero de observaciones C = X X" = Amplitud del intervalo Por ltimo, en el caso de variables no mensurables, dicha tabla adoptar una forma como la siguiente: Tabla #3: Variable Ordinales Variable Caracterstica A Caracterstica B Caracterstica Z 1. 1. Frecuencias fA fB fZ
5.
Encontrar el nmero de clases o intervalos de clases (K). El nmero de clases debe ser tal que se evite el detalle innecesario, pero que no conduzca a la perdida de ms informacin de la que puede ser convenientemente ignorada. Para este clculo se utiliza la formula de Sturges K = 1 + 3.322(log. N)
5- Determinar la amplitud de la clase ( C ): R C = -------K Nota: el resultado siempre se aproxima al siguiente entero si excede al nmero entero obtenido, no importa el monto de la fraccin excedida al entero C = se lee "se aproxima a" 6. El dato menor (X1) ser el limite inferior de la primera clase. A l se le suma C y se obtiene el limite superior de la primera clase que tambin ser el limite inferior de la segunda clase. Luego se suma nuevamente C y se obtiene el limite superior del segundo intervalo e inferior del tercero. Y as sucesivamente hasta que el limite superior corresponda o supere ligeramente el valor mayor ( Xn ), la cantidad de clases obtenidas deber corresponder con el nmero K calculado mediante la formula de Sturges. Una vez construidos los intervalos se calculan, mediante tabulacin de acuerdo a los limites inferiores y superiores de las clases, las frecuencias absolutas, relativas, porcentuales y acumuladas correspondientes. Con los datos obtenidos se procede a construir la tabla de distribucin de frecuencia.
7.
8. 1.
3.
Encontrar el rengo o recorrido de los datos: "R" K=1+3.322(log N) Nota: en el ejemplo en estudio N=30 por cuanto que son 30 clientes en la muestra: K = 1 + 3.322 (log 30) = 1 + 3.322 (1.477) el log fue obtenido segn calculadora = 1+ 4.9069 = 5.9069 ~6 aproximado al siguiente entero
4. 5.
Encontrar en nmero de clases "K" , segn la frmula de Sturges: Determinar la amplitud de la clase: "C"
Nota: obsrvese que se va a trabajar con una cifra significativa ms cmoda, o sea como los datos estn dados en centsimos, se calculo C hasta los milsimos para evitar que algn dato coincida con el lmite de clases Clases P.M. Xi 7.420 21.835 14.628 10 0.33 21.835 36.250 29.043 36.250 50.665 43.458 50.665 65.080 57.873 65.080 79.495 72.288 79.495 93.910 86.703 Total XXX 4 5 3 3 5 0.13 0.17 0.10 0.10 0.17 10 14 19 22 25 30 30 20 16 11 8 5 0.33 1.00 0.46 0.67 0.63 0.54 0.73 0.37 0.83 0.27 1.00 0.17 fi fr fa fa fra fra
Simbologa utilizada: XI = Punto medio o marca de clases fi = frecuencia absoluta fr = frecuencia relativa fa = frecuencia absoluta acumulada descendente fa = frecuencia absoluta acumulada ascendente fra = frecuencia relativa acumulada descendente fra = frecuencia relativa acumulada ascendente Nota: i. ii. iii. 1. Obsrvese que el lmite inferior de la primera clase es el valor mnimo ( X1=7.42 ) y el lmite superior es el resultado de X1+C = 7.42+14.415 = 21.835. El lmite inferior de la siguiente clase es igual al lmite superior de la clase anterior y el lmite superior es el resultado de adicionarle nuevamente la amplitud de la clase ( C ). Obsrvese que el lmite superior de la ltima clase es igual al valor mayor ( Xn=93.91 )
3.
4.
5. 6.
Ttulo: es la descripcin que precede al cuadro, la cul deber estar redactada en forma breve y clara, de tal manera que exprese su contenido, siguiendo el ordenamiento del mismo. Es necesario abarcar las caractersticas: Qu, Dnde, Cmo y Cundo Encabezamiento: se refiere al nmero de atributos o variables que se quieren representar en el cuadro y se anotan como denominaciones de las columnas y subcolumnas; puede ser unidimensional, bidimensonial o multidimensional. Los ttulos de las columnas van en maysculas y los subttulos en minsculas Cuerpo: es el conjunto de columnas y lneas que contiene el cuadro en orden vertical y horizontal, donde se colocan los datos sobre los hechos observados Pie: se refiere a la informacin adicional necesaria a saber: notas, llamadas, fuentes de informacin y otras. Se anotan en el espacio debajo de la lnea inferior que limita el cuerpo del cuadro. Los Grficos Estadsticos:
a.
El grfico es quizs el auxiliar ms valioso y utilizado para expresar datos estadsticos, este elemento no le aade novedad a las tablas o cuadros estadsticos, es de fcil comprensin y accesible a un nmero mayor de usuarios. El grfico adems de expresar visualmente los hechos ms importantes de la informacin numrica, permite una mejor y ms fcil comprensin y ahorra tiempo y esfuerzo en el anlisis de datos estadsticos al facilitar su apreciacin visual en forma conjunta: -Histogramas de frecuencias: Un histograma es un grfico que sirve para representar una distribucin de frecuencias. Este grfico est formado por un conjunto de rectngulos (caso de variables continuas) que tienen como base un eje horizontal (generalmente el eje de las abscisas o de las X), y como centro los puntos medios de las clases. Los anchos de las clases y las reas de los rectngulos son proporcionales a las frecuencias de las clases. En el caso de las variables discretas el grfico consiste de un conjunto de barras verticales en lugar de rectngulos, hallndose cada barra sobre la observacin respectiva y con una altura proporcional a la frecuencia de la observacin
- Polgono de frecuencias: El polgono de frecuencias es un grfico formado por lneas quebradas, que tiene los centros de las clases representadas en un eje horizontal (eje de las X) y las frecuencias de las clases en un eje vertical (eje de las Y). La frecuencia correspondiente a cada centro de clase se seala mediante un punto y luego los puntos consecutivos se unen por lneas rectas. Del correspondiente histograma se puede lograr el polgono de frecuencia uniendo los puntos medios de las bases superiores de cada rectngulos mediante lneas rectas.
-Ojivas: Las ojivas se refieren a los grficos que se construyen utilizando una distribucin acumulativa de frecuencias, el orden de acumulacin se aplica al cuadro de distribucin de frecuencia y puede ser descendente (fa, fra) o ascendente (fa, fra). La figura que se forma al unir los puntos del polgono de frecuencias acumulativas es lo contrario del orden anunciado (por ejemplo si se utiliz el orden descendente en la acumulacin de los datos en el cuadro, la ojiva resulta ser ascendente).
LABORATORIO
(Resolver y entregar en grupos de tres estudiantes, equivalen a nota de un parcial) Problema #1: Variable Continua En la siguiente tabla se presentan los pesos de 40 estudiantes de la Universidad de Panam, con una aproximacin de una libra. 138 164 150 132 144 125 149 157 146 164 140 147 136 148 152 144 168 126 138 176 163 118 154 165 146 173 142 147 135 153 140 135 161 145 135 142 150 156 145 126 a. b. Construya una tabla de distribucin de frecuencias, indicando las frecuencias absolutas, relativas, absolutas acumuladas y relativas acumuladas. Construya un histograma, un polgono de frecuencias y una ojiva de la distribucin.
Problema #2: Variable Discreta: Una encuesta entre un grupo de madres-solteras, para analizar los problemas econmicos que enfrentan, en determinada comunidad; arroj los siguientes resultados acerca del nmero de nios en el hogar. 1 4 2 3 5 3 5 3 3 5 1 1 2 1 4 1 2 1 4 1
Problema #3: Una compaa de transmisiones electrnicas registro como sigue el nmero de recibos de servicios prestados por cada una de sus 20 sucursales en el ltimo mes: 808 641 628 731 641 446 342 545 910 568 335 459 727 848 229 347 309 649 575 757 La compaa piensa que una tienda realmente no puede esperar alcanzar financieramente el punto de equilibrio con menos de 456 servicios prestados mensualmente. Adems su poltica es dar un bono financiero al gerente que genere ms de 683 servicios al mes. Disponga los datos en una arreglo e indique cuntas sucursales no estn consiguiendo el punto de equilibrio y cuntas ganan el bono. Problema #4: Una agencia de viajes ofrece precios especiales en ciertas travesas por el Caribe. Planea ofrecer varios de estos paseos durante la prxima temporada invernal en el hemisferio norte y desea enviar folletos a posibles clientes. A fin de obtener el mayor provecho por cada unidad monetaria gastada en publicidad, necesita la distribucin de las edades de los pasajeros de travesas anteriores. Se consider que si participaban pocas personas de un grupo de edad en los paseos no sera econmico enviar un gran nmero de folletos a personas de ese grupo de edad. La agencia seleccion una muestra de 40 clientes anteriores de sus archivos y se registr sus edades, como sigue: 77 18 63 84 38 54 50 59 54 56 36 50 50 34 44 41 58 58 53 62 62 43 52 53 63 62 62 61 61 52 60 60 45 66 83 63 63 58 61 71 a. b. c. Organice los datos en una tabla de distribucin de frecuencias de las edades de los clientes en la muestra Cul grupo de edad presenta la mayor frecuencia relativa? Cul la menor frecuencia relativa?. Saque conclusiones que puedan ayudar a la agencia a planear una campaa de publicidad para los paseos invernales.