Está en la página 1de 14

ESTADSTICA I APUNTES DE CLASE No.

3 UNIDAD 1: ARREGLO Y PRESENTACIN DE DATOS TEMA: ARREGLO Y PRESENTACIN DE DATOS DOCENTE: GERMN ERNESTO RINCN REY
ARREGLO DE DATOS DE VARIABLE CONTINUA
INTRODUCCIN Para visualizar las caractersticas de una situacin representada por un conjunto de datos o establecer el patrn de comportamiento de esta situacin, los datos se deben organizar de alguna manera.La Estadstica propone una metodologa que consiste en agrupar los datos recolectados en conjuntos de categoras o clases estadsticas y con este conjunto construir una tabla que se llama Distribucin de Frecuencias

CONCEPTO DE CLASE O CATEGORA En general, una clase o categora es un conjunto de elementos que tienen una o varias caractersticas en comn, por ejemplo, las personas que compiten en algn deporte pertenecen a la clase de los deportistas, las personas mayores de 60 aos pertenecen a la clase de la tercera edad CLASE ESTADSTICA O CATEGORA ESTADSTICA En estadstica se llama clase, nicamente, a un conjunto de datos que estn dentro de un intervalo determinado de valores. Por ejemplo, para datos correspondientes a ingresos de personas podemos crear una clase de las personas que tienen ingresos entre $500.000 y $800.000. Toda clase estadstica tiene, por lo tanto, un lmite inferior ( $500.000 ), y un lmite superior ( $800.000 ) AMPLITUD DE CLASE Es la distancia o diferencia que hay entre los lmites de una clase. En el ejemplo anterior la amplitud de la clase de ingresos es de $300.000. Es decir, que para calcular la amplitud de clase se resta del lmite superior de la clase el lmite inferior. Para expresar estas ideas en smbolos, llamamos A a la amplitud de la clase, LS al lmite superior de la clase y LI al lmite inferior de la clase, expresando aritmticamente la amplitud de la clase as: A = LS LI Para el ejemplo: A = LS - LI = $800.000 - $500.000 = $300.000 Entonces, para visualizar las caractersticas de un conjunto de datos, la Estadstica propone que se agrupen estos datos en intervalos de valores o clases CARACTERSTICAS DE LOS CONJUNTOS DE CLASES ESTADSTICAS Un conjunto de clases o categoras es considerado como un conjunto de clases estadstico s todas las clases, del conjunto, tienen, simultneamente, las siguientes tres caractersticas: Amplitud constante Mutuamente excluyentes Exhaustivas Amplitud constante se refiere a que la amplitud de todas las clases de un conjunto de clases en que se agrupa un determinado grupo de datos debe ser la misma para todo el conjunto. Conjunto de clases mutuamente excluyentes se refiere a que cualquier dato, de un grupo de datos en estudio, debe corresponder nicamente a una sola clase Conjunto de clases exhaustivascuando el conjunto de clases puede contener a todos los datos de una muestra.

NMERO DE CLASES Una de las primeras inquietudes que surge cuando se van a agrupar un conjunto de datos en clases estadsticas es en cuantas clases es conveniente o adecuado agrupar estos datos. Hay varios criterios para resolver este problema: El nmero de clases es determinado por una circunstancia deseable u obligante Determinar el nmero de clases de clases orientndose por una norma emprica de la estadstica Determinar el nmero de clases utilizando la expresin emprica: No.C = 2 K Determinar el nmero de clases utilizando la expresin emprica: No.C = 1 + 3,3 log( n ) Otros criterios El primer caso se presenta, por ejemplo, cuando el estudio actual se va a comparar con un estudio anterior o un estudio realizado por otro investigador. Entonces, para facilitar las comparaciones entre los dos estudios, es deseable que los datos del estudio actual se agrupen con el mismo nmero de clases del estudio anterior La norma emprica de la estadstica indica que el nmero de clases en que se deben agrupar cualquier conjunto de datos debe ser como mnimo 5 6 clases y como mximo alrededor de 20 clases En la expresin No.C = 2K, No.C es abreviatura de nmero de clases y K indica las clases en que, segn esta expresin, se deben agrupar los datos. Por ejemplo, para un estudio contiene 155 datos esta expresin funciona as: S K = 6 clases, entonces, No.C = 26 = 64 como 64 < 155 el nmero de clases igual a 6 no es conveniente S K = 7 clases, entonces, No.C = 27 = 128 como 128< 155 el nmero de clases igual a 7 no es conveniente S K = 8 clases, entonces, No.C = 28 = 256 como 256> 155 el nmero de clases igual a 8, segn este procedimiento, es al ms adecuado para agrupar los 155 datos del estudio. En la expresin No.C = 1 + 3,3 log( n ), No,C es tambin, abreviatura de nmero de clases, log se refiere a logaritmo con base 10 y n es la cantidad de datos que se desean agrupar Por ejemplo, para el estudio de 155 datos se tiene: No.C = 1 + 3,3 log(155) = 8,23, quiere decir que el nmero conveniente de clases, para agrupar estos 155 datos es de 8 clases Otros criterios pueden ser, por ejemplo, nmeros de clases que hacen que los lmites de las clases sean muy fciles de establecer o que las clases automticamente queden mutuamente excluyentes. EJEMPLO PRCTICO La siguiente tabla se refiere a los galones de gasolina corriente que tanquearon la semana pasada, en un autoservicio, una muestra de vehculos escogidos al azar
3,8 2,8 4,8 6,1 1,7 4,7 5,3 3,0 2,8 3,3 4,9 1,9 2,0 6,9 3,0 6,4 2,5 5,0 3,9 2,6 1,8 2,6 2,0 2,0 2,9 4,0 5,6 2,0 3,6 2,7 2,3 2,6 2,2 4,1 4,5 3,1 3,0 3,4 2,9

Este ejemplo es til para fines de aprendizaje, porque en situaciones reales, se suelen manejar volmenes de datos muy superiores al del presente ejemplo
MTODO ESTADSTICO Como se dijo al comienzo de este tema, para describir una situacin representada por un conjunto de datos, como el anterior, la estadstica propone agrupar los datos en un conjunto de clases o categoras y con este conjunto construir una tabla que se llama Tabla de Frecuencias o Distribucin de Frecuencias. Para realizar este proceso se deben resolver, en primera instancia, las siguientes preguntas: En cuntas clases o categoras es ms conveniente o se desea agrupar las datos recolectados? Cul es el tipo de variable relacionada con la situacin o fenmeno en estudio? Cmo se construyen estas clases o categoras? Cmo se construye una Distribucin de Frecuencias?

Para resolver estas preguntas se propone el siguiente procedimiento:

PROCEDIMIENTO PARA PRINCIPIANTES 1. Para establecer el nmero de clases: Por conveniencia Norma emprica Frmulas exponencial o logartmica 2. Tipo de variable relacionada con la situacin en estudio (Revisar el tema en el mdulo CONCEPTOS BSICOS) 3. Construccin de las clases o categoras Existen muchas formas para realizar este paso. A continuacin se propone una de ellas: Determinar los valores mximo y mnimo del conjunto de datos: Xmax y Xmin Calcular el Rango, R = Xmax Xmin Calcular la amplitud de las clases A = R/ No.C Modificar la amplitud teniendo en cuenta los decimales de los datos ( Amod ) Ajustar el rango ( Rmod ), para que coincida con la nueva amplitud modificada Ajustar Xmin o Xmax o ambos para que coincidanconel rango modificado Fijarel limite inferior para laprimeraclase Construir los lmites de las clases Verificar que las clases cumplan con las tres caractersticas de las clases estadsticas 4. Construccin de la Distribucin de frecuencias Establecer el nmero de observaciones dentro de cada clase ( FA ) ( tabla de conteo ) Calcular la frecuencia relativa ( FR ) Ajustar la frecuencia relativa para que la suma de igual a 1 Calcular la frecuencia relativa acumulada ( FRA)

DESARROLLO DEL EJEMPLO


1. Determinar el nmero de clases El nmero de clases se puede determinar de acuerdo a los siguientes criterios. Por conveniencia: Cuando exista alguna circunstancia que haga conveniente o deseable un determinado nmero de clases Norma emprica: Se puede escoger cualquier nmero de clases entre 6 y 20 dependiendo del criterio o preferencia personal del analista y se hacen varios tanteos hasta encontrar un nmero de clases satisfactorio Aplicando las frmulas exponencial o logartmica

Aplicando la frmula No.C = 2k Para K = 5 entonces 25 = 32 < 39 quiere decir que 5 no es un nmero conveniente de clases Para K = 6 entonces 26 = 64 > 39 quiere decir que 6 es el nmero conveniente de clases Aplicando la frmula No.C = 1 + 3,3log(n) = 1 + 3,3log (39) = 6,25 quiere decir que el nmero de clases conveniente es de 6 2. Tipo de variable: En este caso es una variable continua 3. Construccin de las clases o categoras: Los pasos se presentan encuentran en la siguiente tabla y son especficos para variable continua TABLA No.1 ARREGLO DE DATOS CONTINUOS EN 6 CLASES Xmax Xmin R No.C = 6,9 = 1,7 = 5,2 = 6 A = 0,86667 Xmin = 1,5 Amod = 0,9 Rmod = 5,4 Rmod-R = 0,2

Xmin se refiere al lmite inferior de la primera clase 4. Construccin de la Distribucin de Frecuencias: El resultado de este proceso se presenta en la tabla No.2:

TABLA No.2 DISTRIBUCIN DE FRECUENCIAS


No. 1 2 3 4 5 6 CLASES 1,5 2,4 2,4 3,3 3,3 4,2 4,2 5,1 5,1 6,0 6,0 6,9 FA 9 14 6 5 2 3 39 FAA 9 23 29 34 36 39 FR 0,23 0,36 0,15 0,13 0,05 0,08 1,00 FRA 0,23 0,59 0,74 0,87 0,92 1,00

TABLA No.3
Menor Que 1,5 2,4 3,3 4,2 5,1 6,0 6,9

FRA 0 0,23 0,59 0,74 0,87 0,92 1,00

La tabla No.2 recibe el nombre de DISTRIBUCIN DE FRECUENCIAS o TABLA DE FRECUENCIAS y los detalles de su construccin sern explicados por el docente en la exposicin que haga sobre este tema y el significado de las columnas FA, FR y FRA se expone a continuacin LA TIPOS DE FRECUENCIAS Los tipos de frecuencias que se presentan en la tabla No.2 son los siguientes: Frecuencia Absoluta FA: Es la cantidad de datos de la muestra que corresponden a cada clase. Se obtiene por conteo Frecuencia Absoluta Acumulada FAA: Se obtiene, para cada clase, sumando la frecuencia absoluta de la clase, FA, con la frecuencia absoluta de la clase anterior Frecuencia Relativa FR: Se calcula, para cada clase, dividiendo la frecuencia absoluta de la clase, FA, entre el total de datos de la muestra. Es prctico que los valores de la frecuencia relativa se tomen con dos decimales y su suma se ajuste para que d exactamente uno Frecuencia Relativa Acumulada FRA: Se calcula, para cualquier clase, sumando la frecuencia relativa de la clase, FR, con la frecuencia relativa de la clase anterior

LECTURA DE LA DISTRIBUCIN DE FRECUENCIAS Esta tabla permite describir la situacin histrica de la venta de gasolina en esta estacin de servicio, por ejemplo, la mayora de los vehculos de la muestra, un 36%, tanquearon entre 2,4 y 3,3 galones de gasolina, el 5% de los vehculos de la muestra tanquearon entre 5,1 y 6,0 galones de gasolina y fue la clase con menor frecuencia de tanqueo. Solamente tres vehculos de la muestra tanquearon mas de 6,0 galones. LA TABLA MENOR QUE Es una tabla auxiliar que se construye a partir de las distribuciones de frecuencias acumuladas, FAA y FRA, con el fin de facilitar la descripcin de la situacin utilizando estas frecuencias. Esta tabla se presenta al lado de la tabla de distribucin de frecuencias, la tabla No.3 y se utiliz, en este caso, la columna de frecuencia relativa acumulada. Observando esta tabla se puede ver que el 59% de los vehculos de la muestra tanquearon menos de 3,3 galones de gasolina o que el 13% de los vehculos de la muestra tanquearon mas de 5,1 galones REPRESENTACIN GRFICA DE LA SITUACIN EN ESTUDIO La Estadstica Descriptiva utiliza tres tipos de grficos para representar cualquier situacin o fenmeno en estudio: El histograma El polgono de frecuencias La ojiva Estos grficos permiten visualizar de manera fcil y rpida los resultados que se presentan en la distribucin de frecuencias EL HISTOGRAMA Es un grfico de frecuencia absoluta, FA o la frecuencia relativa, FR, donde las clases se representan mediante rectngulos. El siguiente histograma se refiere al ejemplo prctico y se utiliz la frecuencia relativa

HISTOGRAMA
0,4 0,35 FRECUENCIA RELATIVA 0,3 0,25 0,2 0,15 0,1 0,05 0 0,23 0,15 0,36

0,13 0,08 0,05

1.5

2.4

3.3

4.2

5.1

6.0

6.9

GALONES
EL POLGONO DE FRECUENCIAS Se hace a partir del histograma uniendo las marcas de clase proyectadas sobre el lado superior de los rectngulos y agregando, para cerrar la figura, dos clases adicionales, una, por encima del lmite superior de la clase ms alta y la otra, por debajo del lmite inferior de la clase ms baja Para construir el polgono de frecuencias necesitamos introducir el concepto de Marca de Clase MARCA DE CLASE Es el punto medio de una clase. Se calcula sumando los lmites de cada clase y dividiendo este total por 2. El smbolo que usualmente se utiliza para representar la marca de clase es Xi La expresin matemtica de la marca de clase es:

Xi =

Donde LS es el lmite superior de la clase y LI es el lmite inferior de la clase. Por ejemplo, para construir la marca de clase de la primera clase se procede as:

+ 2

Xi =

1,5 + 2,4 2

1,95

Las marcas de clase se utilizan, tambin, cuando se requiere representar todos los valores de una clase por un solo nmero. Por ejemplo, 1,95 galones representa todos los valores de la muestra que se encuentran entre 1,5 galones y 2,4 galones Se puede construir, entonces, con las marcas de clase, una tabla auxiliar de clculos que permita elaborar fcilmente el polgono de frecuencias, como se presenta a continuacin: TABLA AUXILIAR DE CLCULOS Marca de No. CLASES clase FR 0 0,6 1,5 1,05 0,00 1 1,5 2,4 1,95 0,23 2 2,4 3,3 2,85 0,36 3 3,3 4,2 3,75 0,15 4 4,2 5,1 4,65 0,13 5 5,1 6,0 5,55 0,05 6 6,0 6,9 6,45 0,08 7 6,9 7,8 7,35 0,00

Obsrvese que la tabla tiene ahora 8 clases porque se han agregado dos clases, la nmero cero y la nmero 7. A estas clases se les llama clases falsas porque no hay observaciones para ellas; su finalidad es presentar el polgono de frecuencias como una figura cerrada POLGONO DE FRECUENCIAS 0,40 0,35 FRECUENCIA RELATIVA 0,30 0,25 0,20 0,15 0,10 0,05 0,00 1,05 1,95 2,85 3,75 4,65 GALONES Tanto el histograma como el polgono de frecuencias permiten visualizar algunas de las caractersticas de la situacin o fenmeno que se est estudiando, tales como: El rango de los datos Alrededor de qu valores tienden a agruparse los datos Valores de la muestra que se presentan con ms o menos frecuencia A qu lado de la grfica parecen agruparse ms los datos Los dems detalles de la construccin del polgono de frecuencias sern explicados por el docente en la exposicin que haga sobre este tema COMO INTERPRETAR UN HISTOGRAMA O UN POLGONO DE FRECUENCIAS Los histogramas y los polgonos de frecuencias facilitan a las personas que tienen que tomar decisiones sobre una determinada situacin una visin rpida del comportamiento y caractersticas de la situacin que se estudia. Algunas de las preguntas que se pueden responder observando estas grficas son: Cul es el rango de los datos? En qu clases se concentran el mayor nmero de datos? Cul clase contiene menos datos? Qu valores de la muestra se presentan con ms o menos frecuencia? A qu lado de la grfica parecen concentrarse ms los datos? Se presentan huecos o clases vacas? Se presentan valores aislados de los dems? La grfica presenta subidas o bajadas bruscas o suaves? Cuntos picos tiene la grfica? Es simtrica la grfica? 5,55 6,45 7,35 0,00 0,23 0,15 0,36

0,13 0,08 0,05 0,00

LA OJIVA La ojiva es un grfico de frecuencias acumuladas que describe que cuantas unidades o qu porcentaje de unidades se encuentran por encima o por debajo de un determinado valor de la variable. Este grfico se construye a partir de la tabla MENOR QUE, utilizando la frecuencia absoluta acumulada, FAA o la frecuencia relativa acumulada, FRA. En el grfico que se presenta a continuacin se utiliz la frecuencia relativa acumulada.

OJIVA
1,2 FRECUENCIA RELATIVA ACUMULADA 1,00 1 0,8 0,59 0,6 0,4 0,23 0,2 0 0 1,5 2,4 3,3 4,2 GALONES Los detalles sobre la construccin de estos grficos sern explicados por el docente en la exposicin que haga sobre este tema 5,1 6,0 6,9 0,74 0,87 0,92

LA INTERPOLACIN En general, la interpolacin, es un mtodo de clculo para establecer el valor de la ordenada de un valor de la variable que se encuentra dentro de otros valores ya calculados en una tabla. En el caso de la Estadstica Descriptiva, se utiliza para calcular valores de la frecuencia absoluta acumulada, FAA o de la frecuencia relativa acumulada, FRA, correspondientes a valores de la variable que no se encuentran en la tabla MENOR QUE, pero que estn dentro de los valores mnimo y mximo recolectados en el estudio. Por ejemplo, si se quiere saber qu porcentaje de los vehculos tanquearon mas de 4,8 galones de gasolina, al buscar este valor en la tabla MENOR QUE se detecta que aunque no est tabulado, se encuentra entre los valores de la variable 4,2 y 5,1 galones. Con esta informacin se pueden disponer los datos existentes y los buscados de la siguiente manera:

X0 =4,2 X1 = 4,8 X2 = 5,1

Y0 = 0,74 Y1= ? Y2 = 0,87

La expresin matemtica que permite realizar el clculo de interpolacin es la siguiente:

Y1= Y0 +

(1 0 ) (2 0 )

(Y2 - Y0)

Reemplazando los smbolos por los valores se tiene:

Y1= 0,74 +

( 4,8 4,2 ) ( 0,87 - 0,74 ) = 0,827 0,83 ( 5,1 4,2 )

Esto quiere decir que el 83% de los vehculos de la muestra tanquearon menos de 4,8 galones, pero, como se quiere saber es que porcentaje tanque mas de 4,8 galones, se debe restar el resultado anterior de 1 1 - 0,83 = 0,17 = 17% = porcentaje de vehculos de la muestra que tanquearon mas de 4,8 galones

ARREGLO DE DATOS DE VARIABLE DISCRETA


PROCEDIMIENTO PARA PRINCIPIANTES 1. Para establecer el nmero de clases: Por conveniencia Norma emprica Frmulas exponencial o logartmica 2. Tipo de variable relacionada con la situacin en estudio (Revisar el tema en el mdulo CONCEPTOS BSICOS) 3. Construccin de las clases o categoras Este procedimiento es especfico para variable discreta como se muestra a continuacin: Determinar los valores mximo y mnimo del conjunto de datos: Xmax y Xmin Calcular el Rango, R = Xmax Xmin Calcular la amplitud de las clases A = R/ No.C Modificar la amplitud eliminando la parte decimal del nmero calculado en el paso anterior ( Amod ) Utilizar Xmin como el lmite inferior de la primera clase Construir los lmites de las clases Al construir las clases con este procedimiento automticamente quedan con las tres condiciones de las clases estadsticas, es decir, de amplitudes constantes, mutuamente excluyentes y exhaustivas. 4. Construccin de la Distribucin de frecuencias Establecer el nmero de observaciones dentro de cada clase ( FA ) ( tabla de conteo ) Calcular la frecuencia relativa ( FR ) Ajustar la frecuencia relativa para que la suma de igual a 1 Calcular la frecuencia relativa acumulada ( FRA) EJEMPLO PRCTICO Una muestra de 41 das del nmero de transacciones que se realizan por da un cajero automtico se presenta en la siguiente tabla: 73 83 87 47 80 68 56 91 81 84 76 79 78 54 36 71 62 49 90 67 60 64 91 77 51 41 87 72 63 45 91 66 63 52 61 67 74 68 75 57 85

DESARROLLO DEL EJEMPLO 1. Establecer el nmero de clases Por conveniencia: No existe, en este caso, ninguna circunstancia que haga conveniente o deseable un determinado nmero de clases Norma emprica: Se puede escoger cualquier nmero de clases entre 5 y 20 dependiendo del criterio o preferencia personal del analista y se hacen varios tanteos hasta encontrar un nmero de clases satisfactorio Aplicando las frmulas exponencial o logartmica: Utilizando la expresin logartmica se tiene:

No.C = 1 + 3,3 log (41) = 6,3 que indica que un nmero conveniente de clases para esta cantidad de datos es de 6 clases. 2. Tipo de variable: En este caso es una variable discreta 3. Construccin de las clases o categoras: Los pasos se presentan encuentran en la siguiente tabla y son especficos para variable discreta

Xmax = Xmin = R = No.C = A = Amod =

91 36 55 6 9,16667 9

En el clculo anterior se puede observar que para construir la amplitud modificada, se borra toda la parte decimal de la amplitud, A, calculada

Cuando la amplitud modificada es un nmero impar, las marcas de clase, que se utilizan para representar a las clases, son valores fraccionarios, como ocurre en este ejemplo; esta situacin es incmoda porque no refleja la realidad en los casos de variable discreta, por lo que se prefiere agrupar los datos en clases que sean de amplitud par, como se presenta a continuacin, para el mismo ejemplo, donde la amplitud se cambi de 9 transacciones por da a 8 transacciones por da, esto hace que el nmero de clases pase de 6 a7 Amod = 8 4. Construccin de la Distribucin de Frecuencias: El resultado de este proceso se presenta en la tabla No.4: TABLA No.4 TABLA No.5 Menor No. CLASES FA FR FRA Que FRA 1 36 44 2 0,05 0,05 36 0 2 45 53 5 0,12 0,17 45 0,05 3 54 62 6 0,14 0,31 54 0,17 4 63 71 9 0,22 0,53 63 0,31 5 72 80 9 0,22 0,75 72 0,53 6 81 89 6 0,15 0,90 81 0,75 7 90 98 4 0,10 1,00 90 0,90 41 1,00 99 1,00 Se observa, tambin, que el lmite inferior de cada clase es igual al lmite inferior de la clase anterior ms uno. Tambin se puede ver que el lmite superior de la ltima clase, (98), no coincide con el Xmax, (91), de los datos y el lmite inferior de la primera clase es el Xmin (36), de los datos. Las clases construidas de esta manera se llaman CLASES CERRADAS, porque en cada clase se contabilizan todos los datos incluidos entre los dos lmites de la clase. Sin embargo, estas clases, como se puede observar, son de amplitudes constantes, mutuamente excluyentes y exhaustivas. Tambin se observa que la tabla MENOR QUE, se construye de manera un poco distinta a como se hizo para el caso de variable continua, ntese que el ltimo valor de la columna Menor Que, no es igual al lmite superior de la ltima clase, sino a se valor ms uno . . REPRESENTACIN GRFICA HISTOGRAMA Para el caso de variable discreta el histograma, recibe tambin el nombre de DIAGRAMA DE FRECUENCIAS y
en l las clases se encuentran separadas, como se ve en el siguiente grfico:

DIAGRAMA DE FRECUENCIAS
0,25 0,2 0,15 0,14 0,12 0,1 0,15 0,22 0,22

Frecuencia Relativa

0,1 0,05
0,05 0 36 44 45 53 54 62 63 71 72 80 81 89 90 98

Nmero de transacciones

Con frecuencia, en lugar de identificar cada clase con sus lmites de clase, es ms prctico utilizar la marca de clase, como se muestra en este grfico, a continuacin

Diagrama de Frecuencias
0,25 Frecuencia relativa 0,20 0,15 0,10 0,05 0,14 0,12 0,10 0,15

0,22

0,22

0,05
0,00 40 49 58 67 76 85 94

Nmero de transacciones

Ahora es mucho ms fcil leer el diagrama de frecuencias, por ejemplo, en el 14% de los das de la muestra se realizaron 58 transacciones, el nmero de transacciones por da menos frecuente, en la muestra, fue de 40 transacciones por da POLGONO DE FRECUENCIAS Se construye de la misma manera, a partir del diagrama de frecuencias y las marcas de clase, como se hizo en el caso de variable continua. Ntese que en esta grfica se presenta una distorsin debido a que las clases no son adyacentes

Polgono de Frecuencias
0,25 0,2 0,15 0,1 0,05 0,05 0 0 31 40 49 58 67 76 85 94 103 0,00 0,14 0,12 0,10 0,15 0,22 0,22

Frecuencia Relativa

Nmero de Transacciones

OJIVA Cuando la variable es discreta, como en este caso, la ojiva se construye de forma diferente, porque la variable slo toma valores enteros, aunque, aqu tambin, este grfico se construye a partir de la tabla MENOR QUE OJIVA Frecuencia Relativa Acumulada 1,2

1,00
1 0,8 0,6 0,4 0,2 0 0,17 0,05 0,31 0,53 0,75 0,9

36

45

54

63

72

81

90

99

Nmero de transacciones

Los detalles sobre la construccin de este grfico sern explicados por el docente en la exposicin que haga sobre este tema

ARREGLO DE DATOS PARA VARIABLE DISCRETA EN CLASES DE AMPLITUD CERO


Cuando el intervalo de valores que toma la variable es reducido y la variable es discreta, es ms prctico agrupar los datos en clases de amplitud cero, como se muestra en el siguiente caso. Aqu X simboliza los valores que toma la variable que son al mismo tiempo las clases estadsticas. Estas clases cumplen con las tres caractersticas de una clase estadstica: son de amplitud constante, son mutuamente excluyentes y son exhaustivas EJEMPLO Se tom una muestra de 60 facturas registrando el nmero de errores por factura. Los resultados se presentan en la siguiente tabla: 1 2 0 4 2 0 0 1 3 1 2 0 1 1 0 1 0 3 2 1 0 0 3 1 0 0 1 0 3 2 0 1 0 0 1 2 1 4 1 1 0 0 0 0 2 0 2 1 0 0 2 0 2 1 1 0 0 1 0 1

X 0 1 2 3 4

FA 25 19 10 4 2 60

FR 0,42 0,31 0,17 0,07 0,03 1,00

FAA 25 44 54 58 60

FRA 0,42 0,73 0,90 0,97 1,00

MENOR QUE 0 1 2 3 4 5

FRA 0 0,42 0,73 0,90 0,97 1,00

Diagrama de Frecuencias 30 25 25 No. de facturas 20 15 19

10
10 5 4 2 4

0
0 1 2 No. de errores 3

ARREGLO DE DATOS CUALITATIVOS


Cuando la variable es cualitativa, el arreglo y presentacin de datos estadstico es limitado. Slo se pueden construir distribuciones de frecuencias con las frecuencias absolutas y relativas y diagramas de frecuencias. Adicionalmente, se utilizan en estos casos otros tipos de grficos como se presenta en el siguiente ejemplo: EJEMPLO Se interrog a una muestra de clientes de una cafetera sobre el tipo de bebida gaseosa que prefieren obtenindose los siguientes resultados:
Cocacola Postobn Quatro Sprite Cocacola Quatro Pepsicola Link Cocacola Quatro Pepsicola Seven Up Cocacola Postobn Pepsicola Cocacola Pepsicola Postobn Cocacola Link Postobn Cocacola Pepsicola Postobn Cocacola Link Cocacola Sprite Cocacola Postobn Postobn Quatro Pepsicola Postobn Sprite

No. 1 2 3 4 5 6 7

CLASES Cocacola Link Pepsicola Postobn Quatro Seven Up Sprite

FA 10 3 6 8 4 1 3 35

FR 0,29 0,09 0,17 0,23 0,11 0,03 0,08 1,00

Diagrama de Frecuencias 0,35 Frecuencia Relativa 0,3 0,25 0,29 0,23 0,17 0,09 0,11 0,08 0,03

0,2
0,15 0,1 0,05 0 Cocacola Link

Pepsicola Postobn Quatro Seven Up Tipo de bebida

Sprite

Diagrama Circular Seven Up 3% Sprite 8% Quatro 11% Postobn 23% Pepsicola 17% Cocacola 29%

Link 9%

También podría gustarte