Está en la página 1de 7

Toma de datos

La toma de datos es la obtencin de una coleccin de los mismos que no han sido ordenados numricamente. Un ejemplo es el conjunto de alturas de 100 estudiantes, sacados de una lista alfabtica de una universidad ORDENACIN Una ordenacin es una colocacin de los datos numricos tomados, en orden creciente o decreciente de magnitud. La diferencia entre el mayor y el menor de los nmeros se llama recorrido o rango de los datos. Por ejemplo, si la altura mayor de los 100 estudiantes es 74 pulgadas y la menor es de 60 pulgadas, el rango es 74 - 60 = 14 pulgadas

Distribuciones de frecuencia
Cuando se dispone de gran nmero de datos, es til el distribuirlos en clases o categoras y determinar el nmero de individuos pertenecientes a cada clase, que es la frecuencia de clase. Una ordenacin tabular de los datos en clases, reunidas las clases y con as frecuencias correspondientes a cada una, se conoce como una distribucin de frecuencias o tabla de frecuencias. La Tabla 1 es una distribucin de frecuencias de alturas (registradas con aproximacin de pulgada) de 100 estudiantes de la Universidad XYZ.

La primera clase o categora, por ejemplo, comprende las alturas de 60 a 62 pulgadas y viene indicada por el smbolo 60 - 62. Puesto que 5 estudiantes tienen una altura perteneciente a esta clase, la correspondiente frecuencia de clase es 5. Los datos ordenados y resumidos como en la distribucin de frecuencia anterior, se suelen llamar datos agrupados. Aunque con el proceso de agrupamiento generalmente se pierde parte del detalle original de los datos, tiene la importante ventaja de presentarlos todos en un sencillo cuadro que facilita el hallazgo de las relaciones que pueda haber entre ellos, puestas as de manifiesto.

Intervalos de clase y lmites de clase


Un smbolo que define una clase, tal como 60 - 62 de la tabla anterior, se conoce como intervalo de clase. Los nmeros extremos, 60 y 62, son los lmites de clase; el nmero menor 60 es el lmite inferior de la clase y el mayor 62 es el lmite superior. Los trminos clase e intervalo de clase se utilizan a menudo indistintamente, aunque el intervalo de clase es realmente un smbolo para la clase. Un intervalo de clase que, al menos tericamente, no tiene lmite superior o inferior, se conoce como intervalo de clase abierto. Por ejemplo, al referirse a la edad de grupos de individuos el intervalo de clase, mayores de 65 aos es un intervalo de clase abierto

Lmites reales de clases


Si las alturas se registran con aproximacin de pulgada, el intervalo de clase 60 - 62 tericamente incluye todas las medidas desde 59,5000... a 62,5000 pulgadas. Estos nmeros, representados brevemente por los nmeros exactos 59,5 y 62,5, se conocen como lmites reales de clase o lmites verdaderos de clase; el menor de ellos, 59,5, es el lmite real inferior y el mayor de ellos, 62,5, es el lmite real superior. Prcticamente, los lmites reales de clase se obtienen sumando al lmite superior de un intervalo de clase el lmite inferior del intervalo de clase contiguo superior y dividiendo por 2. A veces, los lmites reales de clase se utilizan para simbolizar las clases. Por ejemplo, las diferentes clases de la primera columna de la Tabla 1 podran indicarse por 59,5 - 62,5, 62,5 - 65,5, etc. Sin embargo, con tal notacin aparece una ambigedad, pues los lmites reales de clase no coincidiran con las observaciones reales. As si una observacin fuese 62,5 no sera posible discernir si pertenece al intervalo de clase 59,5 62,5 o al 62,5 - 65,5 . FRONTERAS DE CLASE

Es otro nombre que se le da a los lmites menor y mayor de cada intervalo; el lmite menor se incluye como parte del intervalo, pero el mayor no forma parte de l porque se determina que son los menore que el lmite superior o mayor. En el ejemplo anterior, la distribucin de frecuencias est formada por 8 intervalos que empiezan en US$14.00 y terminan en US$70.00 y se calcularn las fronteras reales de la siguiente manera:

FRONTERA REAL DE CLASE Es un intervalo definido de la manera ms exacta con el dato mayor que ste puede ostentar, se presentan varias caracteersticas:

Nmericamente, "antes de A" no es un nmero para un computador Se establece el lmite superior de acuerdo a la frmula de los datos. Si los datos de los intervalos son enteros, se busca el nmero ms cercano al lmite superior. Si el intervalo es "De 10 a menos de 20" y los datos de la encuesta tienen dos decimales, entonces al lmite superior se le resta 0.01 y se obtiene la frontera real superior. Si el intervalo es "De 100 a menos de 200" y los datos tienen 1 decimal, entonces al la frontera superior se le resta 0.1 y se obtiene 19.9 como frontera superior La frontera inferior siempre es la misma.

En el ejemplo anterior, la distribucin de frecuencias est formada por 8 intervalos que empiezan en US$14.00 y terminan en US$70.00; se calcularn las fronteras reales a una distancia de 0.1 del lmite superior, de la siguiente manera:

TAMAO O ANCHURA DE UN INTERVALO DE CLASE El tamao o anchura de un intervalo de clase es la diferencia entre los lmites reales de clase que lo forman y se conoce como anchura de clase, tamao de clase o longitud de clase. Si todos los intervalos de clase de una distribucin de frecuencias tienen igual anchura, esta anchura comn se representa por c. En tal caso, c es igual a la diferencia entre dos sucesivos lmites de clase inferiores o superiores. Para los datos de la Tabla 1, por ejemplo, el intervalo de clase es c = 62,5 - 59,5 = 65,5 - 62,5 = 3.

MARCA DE CLASE Es el punto medio de un intervalo de clase, se calcula sumando sus fronteras y dividiendo el resultado entre 2. Es decir, el intervalo es dividio a la mitad.

Es una marca de clase por cada intervalo Ejemplo

Siempre con la muestra de los precios de los platos de 50 restaurantes citadinos, se calcular la marca de clase de cada intervalo.

Reglas generales para formar las distribuciones de frecuencia


l. Determinar el mayor y el menor entre los datos registrados y as encontrar el rango (diferencia entre el mayor y el menor de los datos). 2. Dividir el rango en un nmero conveniente de intervalos de clase del mismo tamao. Si esto no es posible, utilizar intervalos de clase de diferente tamao o intervalos de clase abiertos. El nmero de intervalos de clase se toma generalmente entre 5 y 20 dependiendo de los datos. Los intervalos de clase se eligen tambin de forma que las marcas de clase o puntos medios coincidan con datos realmente observados. Esto tiende a aminorar el llamado error de agrupamiento, en los anlisis matemticos posteriores. Sin embargo, los lmites reales de clase no coincidirn con los datos observados. 3. Determinar el nmero de observaciones que caen dentro de cada intervalo de clase, es decir, encontrar las frecuencias de clase. Lo mejor para esto es utilizar una hoja de conteo.

Reglas generales para formar las distribuciones de frecuencia


l. Determinar el mayor y el menor entre los datos registrados y as encontrar el rango (diferencia entre el mayor y el menor de los datos). 2. Dividir el rango en un nmero conveniente de intervalos de clase del mismo tamao. Si esto no es posible, utilizar intervalos de clase de diferente tamao o intervalos de clase abiertos. El nmero de intervalos de clase se toma generalmente entre 5 y 20 dependiendo de los datos. Los intervalos de clase se eligen tambin de forma que las marcas de clase o puntos medios coincidan con datos realmente observados. Esto tiende a aminorar el llamado error de agrupamiento, en los anlisis matemticos posteriores. Sin embargo, los lmites reales de clase no coincidirn con los datos observados. 3. Determinar el nmero de observaciones que caen dentro de cada intervalo de clase, es decir, encontrar las frecuencias de clase. Lo mejor para esto es utilizar una hoja de conteo.

CURVAS DE FRECUENCIAS. OJIVAS SUAVIZADAS El conjunto de datos puede considerarse normalmente como perteneciente a una muestra extrada de una poblacin grande. A causa de las muchas observaciones que podemos realizar en la poblacin es posible tericamente (para datos continuos) elegir los intervalos de clase muy pequeos y todava tener un nmero adecuado de observaciones dentro de cada clase. As se tiene que el polgono de frecuencias o el de frecuencias relativas para una poblacin grande puede estar formado por muchos pequeos segmentos rectos que aproximan el conjunto a una curva, las curvas de este tipo pueden llamarse curvas de frecuencias o curvas de frecuencias relativas, respectivamente. Es razonable esperar que tales curvas tericas provengan de la suavizacin de los polgonos de frecuencias o de los polgonos de frecuencias relativas de la muestra, la aproximacin es tanto ms exacta conforme aumenta el tamao de la muestra. Por esta razn una curva de frecuencias se conoce como un polgono de frecuencias suavizado. De una forma anloga las ojivas suavizadas provienen de la suavizacin de los polgonos de frecuencias acumuladas u ojivas. Normalmente es ms sencillo suavizar una ojiva que un polgono de frecuencias.

Tipos de curvas de frecuencia

Las curvas de frecuencia presentan determinadas formas caractersticas que les distinguen como se indica en la Figura 3. (a) Las curvas de frecuencia simtricas o bien formadas se caracterizan por el hecho de que las observaciones que equidistan del mximo central tienen la misma frecuencia. Un ejemplo importante es la curva normal. (b) En las curvas de frecuencia moderadamente asimtricas o sesgadas la cola de la curva a un lado del mximo central es mayor que al otro lado. Si la cola mayor se presenta a la derecha de la curva se dice que sta est sesgada a la derecha o que tiene sesgo positivo, mientras que si ocurre lo contrario se dice que la curva est sesgada a la izquierda o que tiene un sesgo negativo. (c) En las curvas en forma de J o de J invertida, el mximo se presenta en un extremo. (d) Las curvas de frecuencias en forma de U tienen el mximo en ambos extremos. (e) Una curva de frecuencias bimodal tiene dos mximos. (f) Una curva de frecuencias multimodal tiene ms de dos mximos

También podría gustarte