3 Presentacin A l analizar una muestra, es necesario someterla a un conjunto de pasos siste- matizados para su organizacin en una tabla de datos agrupados, tambin conocida como tabla de distribucin de frecuencias. Esta tabla es de gran utili- dad en el clculo de los estadgrafos que describen una muestra, as como en la construccin de sus correspondientes representaciones grfcas. En esta semana, estudiars los pasos para la conformacin de una tabla de datos agrupados. II Estadstica descriptiva Tema y subtemas Objetivos especcos El alumno ser capaz de ordenar datos, calcular su rango y determinar el nmero y longitud de clases en una tabla de datos agrupados. II.2 Distribucin de frecuencias 32 Estad sti ca descri pti va II.2 Distribucin de frecuencias La poblacin o universo es el conjunto total de elementos de los cuales se desea conocer, por medio de un tratamiento cuantitativo, sus principales caractersti- cas. En este contexto, una muestra es un subconjunto de la poblacin; es decir, una porcin de elementos con caractersticas generales semejantes a la poblacin objetivo. Para que una muestra sea representativa de una poblacin, debe cumplir las siguientes condiciones: Debe obtenerse mediante un procedimiento aleatorio, es decir, la selec- 1. cin de sus elementos ser al azar. Debe ser lo sufcientemente grande. 2. Las condiciones anteriores corresponden a la rama de la estadstica inferen- cial denominada muestreo. Al analizar una muestra, el primer paso es organizar los datos en una tabla conocida como tabla de datos agrupados. Esta tabla permitir el clculo de cier- tas medidas orientadas a la descripcin de la muestra. Las principales medidas para la descripcin de una muestra son: Medidas de tendencia central. Medidas de dispersin o variabilidad. Las medidas anteriores reciben el nombre de estadgrafos o estadsticos. Si la muestra se ha obtenido mediante un procedimiento correcto (muestra aleatoria y de tamao lo sufcientemente grande), los estadgrafos sern razonablemente cercanos a los verdaderos valores numricos que caracterizan a una poblacin, a los cuales se les denomina parmetros. Una vez que se ha obtenido una muestra aleatoria para estudiarla y genera- lizar sus propiedades al total de la poblacin, se procede a organizar sus datos mediante los siguientes pasos:
Ordenar los datos de la muestra en forma creciente. 1. Determinar el rango de los datos, es decir, calcular la resta o diferencia 2. entre el mayor y el menor de los datos de la muestra. El rango se denota con la literal r y su clculo se representa con la siguiente expresin: r x x n = 1 donde x n corresponde al mayor de los datos de la muestra y x l al menor. Asimismo, n denota el nmero total de elementos de la muestra . Contexto general de un estudio estadstico Caractersticas de una muestra Distribucin de frecuencias Pasos para ordenar los datos de una muestra Por qu es ms fcil estudiar el comportamiento de un grupo de personas que el de una sola? Uni dad I I . Estad sti ca descri pti va Determinar el nmero 3. k de clases en las que se organizarn los datos; esto es, establecer el nmero k de subconjuntos en los que se distribuirn los elementos de la muestra. Defnir la longitud de las clases de manera tal que todos los datos de la 4. muestra se puedan distribuir en ellas, vigilando que cada uno de los da- tos se ubique en una sola clase. Esto signifca establecer adecuadamente los lmites de cada clase de forma que ningn dato (elemento de la mues- tra) pertenezca a ms de una clase o quede fuera de stas. La longitud de cada clase se denota con la literal c, y se calcula mediante la siguiente expresin: c r k = Donde r corresponde al rango de la muestra y k es igual al nmero de clases deseadas. En la terminologa formal, a las clases se les denomina intervalos de clase. Una vez defnidas las clases, se contabiliza cuntos elementos de la mues- 5. tra caen dentro de cada intervalo de clase, es decir, se determinan las fre- cuencias de clase, las cuales se denotan con la literal f. Con estos datos se construye una tabla que se conoce como tabla de datos agrupados. Con los datos de la tabla anterior se construyen las representaciones gr- 6. fcas correspondientes al histograma, polgono de frecuencias, ojiva y ojiva porcentual. Finalmente, para efectos del anlisis de los datos de la muestra, se calcu- 7. lan los estadgrafos: medidas de tendencia central y de variacin. Los pasos anteriormente descritos permiten la construccin de una tabla de datos agrupados o tabla de distribucin de frecuencias. Por lo general, la tabla asume una estructura matricial de seis columnas y de ordinario entre cinco y veinte renglones, que permite la presentacin de n datos de la muestra organi- zados en grupos o clases. La construccin de una tabla de datos agrupados se mostrar mediante el siguiente caso prctico. Deseamos introducir en el mercado una nueva bebida refrescante para su venta en cines. Antes de disear la campaa y la estrategia de mercadotecnia, es necesario determinar las caractersticas de los consumidores potenciales para defnir un grupo focal en funcin de su edad al cual dirigir la campaa con ma- yor nfasis. Para iniciar el estudio estadstico, se selecciona al azar una muestra de cien personas y se les pregunta su edad. La siguiente tabla muestra las edades ordenadas en forma creciente: 5 6 6 9 9 10 10 10 11 13 13 14 14 14 14 15 15 15 16 16 16 17 17 17 17 18 18 18 18 18 18 18 18 18 18 18 19 19 19 19 19 19 19 19 19 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 21 21 21 21 22 22 22 23 23 23 23 23 23 23 23 23 23 24 24 24 24 24 24 24 25 25 25 26 26 27 28 28 28 28 28 28 29 30 31 Construccin de una tabla de datos agrupados 33 34 Estad sti ca descri pti va Supongamos que decidimos distribuir las edades en cinco clases. Antes de hacerlo, debemos determinar la longitud de cada clase y establecer sus respecti- vos lmites. De las caractersticas de nuestro caso prctico, tenemos los siguien- tes datos: n k x x x n l = = = = = 100 5 30 5 100 Entonces, primero calculamos el rango: r x x r r n l = = = 30 5 25 Una vez calculado el rango, procedemos al clculo de la longitud de cada clase: c r k c c = = = 25 5 5 Determinacin de la longitud de clase Reactivos de autoevaluacin 35 Uni dad I I . Estad sti ca descri pti va Instrucciones: Selecciona la respuesta correcta. 1. A la poblacin tambin se le conoce como: a) Muestra b) Universo c) Elementos 2. A una tabla de datos agrupados tambin se le co- noce como: a) Tabla de clases agrupadas b) Tabla de distribucin de frecuencias c) Tabla de distribucin de clases 3. Para que una muestra sea representativa de la poblacin, una de sus caractersticas es que sus elementos deben seleccionarse: a) Cuidadosamente b) Secuencialmente c) Aleatoriamente 4. El muestreo es una rama que pertenece a la esta- dstica: a) Inferencial b) Descriptiva c) Muestral 5. El rango se calcula mediante la frmula: a) r x x n = 1 b) x r x n l = c) r x x n l = 6. La literal n denota el nmero total de elementos de: a) La muestra b) La poblacin c) La clase 7. La literal k denota el nmero de: a) Muestras b) Elementos c) Clases 8. La literal f representa: a) La frecuencia de clase b) La frecuencia de la muestra c) La frecuencia de la poblacin 9. Si x l =10 y x n =60 , el rango es igual a: a) 70 b) 50 c) 60 10. Si x l =10 , x n =60 , k =5 el valor de c es igual a: a) 5 b) 50 c) 10 36 Estad sti ca descri pti va Glosario Fuentes de informacin Aleatorio: Que depende del azar. Distribucin: Reparticin de los elementos de una muestra en diferentes cate- goras o clases. Frecuencia: Nmero de elementos de una muestra que cae en cada clase o categora. Longitud: Tamao o amplitud de una clase. Representatividad: Propiedad de una muestra bien diseada y que consiste en que las caractersticas de sta son muy semejantes a las de la poblacin. Hernndez, R., C. Fernndez y P. Baptista (2003). Metodologa de la investigacin. Mxico: McGraw Hill. Mendenhall, W. y T. Sincich (1997). Probabilidad y estadstica para ingeniera y ciencias. Cuarta edicin. Mxico: Prentice Hall. Padua, J. (2002). Tcnicas de investigacin aplicadas a las ciencias sociales. Mxico: Fondo de Cultura Econmica. Rojas, A., J. Fernndez y C. Prez (1998). Investigar mediante encuestas. Madrid: Sntesis. Santesmases, M. (2001). Diseo y anlisis de encuestas en investigacin social y de mercados. Madrid: Pirmide. Spiegel, M. y L. Stephens (2001). Estadstica. Mxico: McGraw Hill. Ulloa, V. y V. Quijada (2006). Estadstica aplicada a la comunicacin. Mxico: unam. Panel de vericacin Instrucciones: Selecciona la respuesta correcta. 1. A la poblacin tambin se le conoce como: a) Muestra b) Universo c) Elementos 2. A una tabla de datos agrupados tambin se le co- noce como: a) Tabla de clases agrupadas b) Tabla de distribucin de frecuencias c) Tabla de distribucin de clases 3. Para que una muestra sea representativa de la poblacin, una de sus caractersticas es que sus elementos deben seleccionarse: a) Cuidadosamente b) Secuencialmente c) Aleatoriamente 4. El muestreo es una rama que pertenece a la esta- dstica: a) Inferencial b) Descriptiva c) Muestral 5. El rango se calcula mediante la frmula: a) r x x n = 1 b) x r x n l = c) r = x n x l 6. La literal n denota el nmero total de elementos de: a) La muestra b) La poblacin c) La clase 7. La literal k denota el nmero de: a) Muestras b) Elementos c) Clases 8. La literal f representa: a) La frecuencia de clase b) La frecuencia de la muestra c) La frecuencia de la poblacin 9. Si x l =10 y x n =60 , el rango es igual a: a) 70 b) 50 c) 60 10. Si x l =10 , x n =60 , k =5 el valor de c es igual a: a) 5 b) 50 c) 10 37 Uni dad I I . Estad sti ca descri pti va