Datos No Agrupados y Datos Agrupados

Unidad 2.

: ESTADISTICA BASICA
ACTIVIDAD 1. DATOS AGRUPADOS Y NO AGRUPADOS PRESENTACIÓN.
Con este tema se inicia el estudio de la parte de la estadística que se ocupa de la recolección, organización, resumen y presentación de la información; cuestión esencial para cualquier investigación. El buen uso de los métodos descriptivos ahorra tiempo y esfuerzo, facilita la interpretación de resultados y sirve de base incuestionable para el desarrollo de métodos de inferencia y predicción: La información recogida durante el proceso de observación, medición, entrevista, etc., suele ser dispersa, y no es hasta que la misma se organiza, procesa y presenta adecuadamente que cobra real dimensión la misma y puede considerarse, más allá de un conjunto de datos, verdadera información. Una de las ramas de la Estadística más accesible a la mayoría de la población es la Descriptiva. Esta parte se dedica única y exclusivamente al ordenamiento y tratamiento mecánico de la información para su presentación por medio de tablas y de representaciones gráficas, así como de la obtención de algunos parámetros útiles para la explicación de la información. La Estadística Descriptiva es la parte que conocemos desde los cursos de educación primaria, que se enseña en los siguientes niveles y que, por lo general, no pasa a ser un análisis más profundo de la información. Es un primer acercamiento a la información y, por esa misma razón, es la manera de presentar la información ante cualquier lector, ya sea especialista o no. Sin embargo, lo anterior no quiere decir que carezca de metodología o algo similar, sino que, al contrario, por ser un medio accesible a la mayoría de la población humana, resulta de suma importancia considerar para así evitar malentendidos, tergiversaciones o errores. Las características de los elementos de una población pueden ser de tipo cualitativo o de tipo cuantitativo. En el primero caso se trata de cualidades que distinguen un elemento de otro y lo ubican en clases independientes y separadas. Las propiedades de tipo cuantitativo son aquellas que pueden medirse o contarse. Una característica cuantitativa que toma datos aislados de modo que no acepta valores intermedios entre dos consecutivos, se llama Cuantitativa Discreta. Si se trata de una característica que puede tomar valores consecutivos, se dice que es una variable Cuantitativa Continua. Las diferentes características de los elementos de una población pueden representarse de diversas maneras: tablas, diagramas de barras o diagramas circulares.

Descripción de Datos:
Los datos agrupados y no agrupados se refieren al hecho de que estén ordenados, clasificados y contados.

DATOS NO AGRUPADOS
Recolección simple o no organizada (datos no organizados): Es el listado de los datos presentados en su forma primaria, es decir, tal como fueron obtenidos durante el proceso observación o medición en la muestra o población. Se dice que los datos están organizados, pero no agrupados, cuando en las tablas de frecuencias se ponen, organizados, todos y cada uno de los valores que toma la variable; esto es,

donde N1 = n1. es llamado marca de clase. de manera que se leen directamente los valores observados. no es la altura de las barras o rectángulos la que debe ser proporcional a las frecuencias representadas. es decir. es decir. : ESTADISTICA BASICA se colocan los datos en columnas que recogen los distintos valores de la variable y las frecuencias (las veces) con que han aparecido tales valores. que muchas veces se toma como el valor representativo de la clase. sino en agrupaciones parciales del recorrido de la variable. y así sucesivamente hasta Nk = n. DATOS AGRUPADOS Recolección organizada o tabulación (datos organizados): Es el ordenamiento de la información en tablas. como: fi ( frecuencia relativa ): proporción de veces que se repite el i-ésimo valor de la variable (si se multiplica por cien constituye un porciento). se cumple que: fi = ni/n y donde Σ fi = 1 Ni ( frecuencia absoluta acumulada ): Es el número de observaciones menores o iguales al iésimo valor de la variable.L2 … Xi X1 X2 … ni n1 n2 … fi f1 f2 … (1) Ni N1 N2 … Fi F1 F2 … Fk ↑ Lk-1 . denominadas “clases” o “intervalos de clases”. se interpreta como el número de observaciones menores o iguales al i-ésimo valor de la variable.Li L0 . N3 = n1 + n2 + n3. denominadas tablas de frecuencias o distribuciones de frecuencias.)(1) La forma general de una tabla de frecuencias es la siguiente: Li-1 . se construyen intervalos para resumir la información observada. se dice que los datos están organizados y agrupados cuando en la tabla se presentan éstos no con sus valores individuales. donde Σ ni = n n ( tamaño de la muestra ): cantidad de observaciones efectuadas.Unidad 2. Cuando los datos se tabulan. Y a la diferencia o distancia entre los límites de la clase se le llama ancho de clase: aunque no es obligatorio. número de elementos contenidos en la muestra k: representa el número de valores diferentes observados (datos no agrupados) o la cantidad de clases creadas (datos agrupados) También pueden incorporarse a la tabla otras frecuencias.Lk ↑ sólo si hay clases (datos agrupados) Xk nk fk ↑ ↑ frecuencias complementarias Nk Los símbolos y definiciones correspondientes son: Xi : representa los valores individuales de la variable (en datos no agrupados) o las marcas de clase (en datos agrupados en clases) Li-1 . es usual utilizar clases del mismo ancho siempre que es posible. N2 = n1 + n2. Por su parte. pueden estar no agrupados.Li : representan las clases (si los datos se agruparon). Una clase se caracteriza por un valor que es su límite inferior y otro que es su límite superior.L1 L1 . a partir de los datos primarios. o se organizan en las tablas de frecuencias. El promedio de los dos límites. Así. esto es. el inferior (Li-1) y el superior (Li) ni ( frecuencia absoluta ): número de veces que se repite el i-ésimo valor de la variable. . sino su área. delimitadas por los límites de clase. (Si las clases no tienen el mismo ancho. o agrupados.

.no es necesario clasificar ni generar una tabla de frecuentas.elementos que menor tamaño (generalmente menor a 20 elementos). Son el conjunto de observaciones que se presentan en su forma original tal y como fueron recolectados.su fin es resumir la información.Unidad 2. EJEMPLOS DE DATOS NO AGRUPADOS Y AGRUPADOS Datos no agrupados Cuando la muestra que se ha tomado de la población o proceso que se desea analizar.. 3. La fórmula de la variancia para datos agrupados usada como estimador de la variancia poblacional es: Donde f es la frecuencia de clase y X es el punto medio de la clase. para obtener información directamente de ellos. clasificar y expresar los en una tabla de frecuencias.Esto no sucede así siempre. : ESTADISTICA BASICA Fi ( frecuencia relativa acumulada ): es la proporción (o porciento) de observaciones menores o iguales al i-ésimo valor de la variable. DATOS AGRUPADOS 1.. debe de verificarse que los datos n sean significativos.la agrupación de los datos puede ser simple o mediante intervalos de clase. no se presentan clasificados) 2. Aunque contemos con más de 20 elementos. F2 = f1 + f2.los datos son en brutos (es decir. EJEMPLO 1 (Datos no agrupados): .se agrupa a los datos. 1. les dejo mi aportación. moda de datos agrupados y no agrupados. y no adentrarnos en cuestiones que aun no vemos en la asignatura. DIFERENCIAS ENTRE DATOS NO AGRUPADOS Y AGRUPADOS DATOS NO AGRUPADOS. también debemos de verificar que los datos puedan clasificarse. 3. Les comento que al momento de buscar información encuentro solo datos referentes a media. siendo F1 = f1. mediana . presentaremos la información obtenida mediante una ”tabla de frecuencias ” 4. y así sucesivamente hasta Fk = 1. los elementos son de mayor tamaño.generalmente.. esto implica: ordenar.Una vez que ya hemos ordenado y clasificado. es decir. tenemos menos de 20 elementos en la muestra. para que la lean y me den su opinión. Y que dicha clasificación tiene coherencia y lógica (de acuerdo a lo que se nos esta pidiendo) . que son?. F3 = f1 + f2 + f3. Esto es: que la información sea “repetitiva”. ya que no tiene “mucho sentido”. por lo cual requieren ser agrupados. si se cuenta con 20 o más elementos.. me parece que solo debemos tratar sobre el concepto de datos agrupados y no agrupados... entonces estos datos son analizados sin necesidad de formar clases con ellos y a esto es a lo que se le llama tratamiento de datos no agrupados. 2.

90 1.20 0.70 indica que el 70% de los estudiantes tienen hasta 2 ausencias. EJEMPLO 2 Se pretende saber cuántas sillas de una oficina se encuentran en mal estado para sustituirlas de inmediato. así: f4 = 0. así: F2 = 0.20 indica que el 20% de los estudiantes tienen 3 ausencias f5= 0. n3 = 7 indica que hay 7 estudiantes del grupo que tienen 2 ausencias. así: n1 = 4 indica que hay 4 alumnos del grupo que no tienen ausencias. F3 = 0.20 0. 01221 32142 43200 22303 Datos en su forma primaria (sin organizar) ¿Qué tipo de variable es esta?: Variable cuantitativa discreta. de silla | Estado | 1 | Bueno | 2 | Malo | 3 | Malo | 4 | Malo | 5 | Bueno | 6 | Bueno | 7 | Bueno | 8 | Bueno | .35 indica que el 35% de los estudiantes tienen hasta 1 ausencia.Unidad 2. La oficina tiene 8 escritorios y cada escritorio cuenta con 3 sillas. 2.15 0. Construcción de la tabla o distribución de frecuencias: Al tratarse de una variable discreta (un conteo siempre tomará valores enteros) y con pocos valores diferentes.35 0. no parece necesario crear clases para agrupar los datos. 3 y 4). así: N2 = 7 indica que hay 7 estudiantes que tienen hasta (o como máximo) 1 ausencia N3 = 18 indica que hay 18 estudiantes que tienen hasta 3 ausencias • Fi indica el porciento de observaciones menores o iguales al valor de la variable.70 0. La población es de 24 sillas en total y se procede a anotar los resultados en una lista como la siguiente: No.0 Interpretación de las distintas frecuencias: • ni indica las veces que se repite el valor de la variable.35 0. número ausencias Xi 0 1 2 3 4 //// /// /////// //// // de tarjado cantidad estudiantes ni 4 3 7 4 2 n= 20 de proporción estudiantes fi 0. En este caso k = 5 (son cinco los valores distintos de X: 0.10 de Ni 4 7 14 18 20 Fi 0. : ESTADISTICA BASICA Se tiene los datos recopilados acerca de la variable X: número de ausencias a clase que tienen los estudiantes de un grupo. a lo cual se le llama tarjado.10 indica que el 10% de los estudiantes tienen 4 ausencias • Ni indica el número de observaciones menores o iguales al valor de la variable. 1. • fi indica el porciento de veces que se repite el valor de la variable.20 0. Para facilitar el conteo de las observaciones se suele hacer algún tipo de marcas.

• Determinación del ancho de clases: c ≈ R/k R/k = 27/6 = 4. • Determinación de las marcas de clases (Xi): Siendo el promedio de los límites de clase se tiene que: Xi = (Li – Li-1)/2 . por su propia naturaleza (de hecho. en vez de facilitar. por exceso. nótese que esta aproximación fue a un valor superior al verdadero cociente. o sea. sin incluir el 25 (límite inferior y extremo abierto) e incluyendo el 30 (límite superior y extremo cerrado). pero resulta más cómodo comenzar ligeramente por debajo de él. un día dado: 46 39 34 33 32 36 41 26 32 36 43 28 30 27 32 42 30 31 34 41 28 30 26 21 37 39 25 33 47 28 26 23 30 43 40 36 21 38 31 38 29 30 48 47 23 31 24 38 35 36 ¿Qué tipo de variable es ésta? Aunque los datos observados son todos enteros la variable es continua. en litros.Unidad 2. Sea en este caso k = 6. la interpretación y el trabajo con la información. 6. ya que complicaría. de 20 a 25. • Se tiene n = 50 taxis (tamaño de la muestra). según decisión de quien va a organizar los datos. en 20. la segunda de 25 a 30.75 litros de gasolina). es decir.5 se redondea a 5 porque no tendría sentido en este caso hacer los intervalos de amplitud decimal.) • Creación de las clases: Se podría partir del valor Xmin = 21.5 ≈ 5 c=5 (El valor R/k = 4.Xmin = 48 . : ESTADISTICA BASICA 9 | Malo | 10 | Malo | 11 | Malo | 12 | Malo | 13 | Bueno | 14 | Bueno | 15 | Malo | 16 | Bueno | 17 | Bueno | 18 | Bueno | 19 | Bueno | 20 | Bueno | 21 | Bueno | 22 | Bueno | 23 | Malo | 24 | Bueno | EJEMPLO 1 (Datos agrupados): Los siguientes valores corresponden al registro del consumo de gasolina de una flota de 50 taxis. de manera que la primera clase sea desde 20 a 20 + c (ya se tiene c = 5). • Determinación del recorrido: R = Xmax . 7 u 8 clases. un taxi podría haber consumido 24. y así sucesivamente hasta la sexta clase (k = 6). que sería desde 45 (extremo abierto) a 50 (extremo cerrado).21 = 27 • Definición del número de clases a usar: Para 50 observaciones podrían usarse 5.

00 Ni 6 19 30 41 46 50 Fi 0. • N4 = 41: indica que 41 taxis consumieron HASTA 40 litros de gasolina.Unidad 2. o que consumieron como promedio 27. n= 50 fi 0.92 1.5 27.foros.5 ó X2 = X1 + c Y así sucesivamente… • Clasificación de la variable y cálculo de las distintas frecuencias: Para ello se puede hacer previamente un tarjado… Se debe tener en cuenta.00 Interpretación de las distintas frecuencias: • n2 = 13: indica que hay 13 taxis que consumieron entre 25 y 30 litros de gasolina.5 A5462 Ej.uh.22 0. nunca con la marca de clases. o que consumieron 32. 4.5 litros (utilizando la marca de clases) • f3 = 0.5 X2 = (25 +30)/2 = 55/2 = 25.12 0.5 47.22: indica que el 22% de los taxis consumieron entre 30 y 35 litros de gasolina.pdf http://analisisydecision.5 tarjado ni ///// / ///// ///// /// ///// ///// / ///// ///// / ///// //// 6 13 11 11 5.es/monografico-datos-agrupados-en-sas/ http://www. el convenio de que si una observación coincide con un límite de clase.38 0. se incluye en la clase donde dicho límite está como límite superior.net/viewtopic.08 1. : ESTADISTICA BASICA Así: X1 = (20 + 25)/2 = 45/2 = 22.fec.82 0.10 0. Tarjado clases (Li-1. Thomson 519. además. no en la que va de 30 a 35.22 0. http://www. (Las frecuencias acumuladas se interpretan utilizando el límite superior del intervalo.php?p=10&mforum=esadestadistica • • . 13 todos los taxis que consumieron 30 litros de gasolina se incluyen en la clase de 25 a 30. INTERNET.5 42.cu/CUGIO/1%20acciones/Contenidos/Asignaturas %20Maestria/Estadistica/Curso%20breve%20de%20Estad%C3%ADstica. Li] 20-25 25-30 30-35 35-40 40-45 45-50 22.92: indica que el 92% de los taxis consumió HASTA 45 litros de gasolina BIBLIOGRAFIA: • Estadística para Administración y economía. o un máximo de 40 litros.26 0.60 0. 5 Biblioteca UNITEC campus Ecatepec. así.) • F5 = 0.5 32.5 litros como promedio.5 37.12 0.

Sign up to vote on this title
UsefulNot useful