Está en la página 1de 10

ASUNTO: INFORME METODOS DE AGRUPACION DE DATOS

CATEDRATICA: BIANCA VALLE

INTEGRANTES: NAZARETH JUDITH SANTOS ALVARADO (123270038)


DARIELA OLINDA PEREZ CATELLANOS (123270039)
YENY MARLEN PINTO VILLEDA (322270004)
JORGE LUIS ARITA CASTELLANOS (121270023)

ASIGNATURA: ESTADISTICA

SEDE: OCOTEPEQUE, OCOTEPEQUE

FECHA: 11 NOVIEMBRE 2023


INDICE
¿QUÉ SON LOS MÉTODOS DE AGRUPACIÓN DE DATOS? .............................................. 1
AGRUPACION ............................................................................................................................. 1
VALORES QUE PUEDE USAR PARA LA AGRUPACIÓN ..................................................... 2
CARACTERÍSTICAS DE LOS CONJUNTOS DE DATOS ....................................................... 2
TIPOS DE DATOS ........................................................................................................................... 3
MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS ............................. 3
AGRUPACIÓN DE DATOS ............................................................................................................ 4
PRESENTACION DE DATOS ................................................................................................... 5
CONCLUSIONES............................................................................................................................. 8
¿QUÉ SON LOS MÉTODOS DE AGRUPACIÓN DE DATOS?
Los datos agrupados son datos formados agregando observaciones individuales de
una variable en grupos, de modo que una distribución de frecuencia de estos grupos
sirva como un medio conveniente para resumir o analizar los datos. Hay dos tipos
principales de agrupación: agrupación de datos de una variable unidimensional,
reemplazando números individuales por recuentos en contenedores; y agrupar
variables multidimensionales por algunas de las dimensiones (especialmente por
variables independientes), obteniendo la distribución de dimensiones desagrupadas
(especialmente las variables dependientes).

La estadística puede ser descriptiva o inferencial, la estadística descriptiva tabula,


representa y describe una serie de datos que pueden ser cuantitativos o cualitativos
sin sacar conclusiones. La estadística inferencial infiere propiedades de gran
número de datos recogidos de una muestra tomada de la población.

AGRUPACION
Procedimiento de unión de una serie de elementos con un criterio de cercanía parte
de la información de datos no agrupados y se expresa el valor de cada dato, y
cuantas veces se repite. La ordenación de datos ofrece varias ventajas con respeto
a los datos sin procesar:

➢ Podemos identificar los valores de mayor a menor rápidamente.


➢ Es fácil dividir los datos en secciones.
➢ Podemos ver si algunos valores aparecen más de una vez en el arreglo.
➢ Podemos observar la distancia entre valores sucesivos de los datos.

A pesar de las ventajas, en algunas ocasiones un ordenamiento de datos no resulta


útil. La agrupación de datos crea una visión general que puede ayudar a identificar
patrones, tendencias, irregularidades o valores atípicos. Usted agrupa datos según
los valores de un campo o combinaciones de valores en más de un campo.

El agrupamiento le permite determinar cuántos registros, y cuánto valor o cantidad,


están concentrados por las medidas o identificadores que usted escoge.

1
VALORES QUE PUEDE USAR PARA LA AGRUPACIÓN
Un aspecto potente de la agrupación es que los grupos se pueden basar en una
amplia variedad de diferentes tipos de valores:

➢ Intervalo de valores o numérico


➢ Número específico
➢ Números similares
➢ Período de tiempo
➢ Fecha específica
➢ Identificador del registro
➢ Número de proveedor o cliente
➢ Código de transacción
➢ Identificador del producto
➢ Código de ubicación

CARACTERÍSTICAS DE LOS CONJUNTOS DE DATOS


➢ Unidad de análisis o de observación: al objeto bajo estudio, el mismo puede
ser una persona, una familia, un país, una región una institución o en general,
cualquier objeto.
➢ Variable: a cualquier característica de la unidad de observación que interese
registrar, la que en el momento de ser registrada puede ser transformada en
un número.
➢ Valor: de una variable
➢ Observación o medición: al número que describe a la característica de interés
en una unidad de observación particular.
➢ Caso o Registro: al conjunto de mediciones realizadas sobre una unidad de
observación. Sexo, lugar nacimiento, edad, presión arterial sistólica son
variables que describen a una persona, su sexo, su lugar de nacimiento, su
edad, etc. Son los valores que estas variables toman para estas personas.

2
TIPOS DE DATOS
Las variables categóricas resultan de registrar la presencia de un atributo.

Los datos categóricos se clasifican en dicotómicos, nominales y ordinales.

➢ Dos categorías (DICOTÓMICOS)

El individuo o la unidad de observación puede ser asignada a solo a solo una de


dos categorías. En general se trata de presencia o ausencia de atributo y es
ventajoso asignar el código 0 a la ausencia y 1 a la presencia.

Ejemplo:

1) varón – mujer
2) embarazada – no embarazada
3) fumador – no fumador
4) más de dos categorías

➢ CATEGORÍAS NOMINALES

No existe orden obvio entre las categorías. Ejemplo: país de origen, estado civil,
diagnóstico.

➢ CATEGORÍAS ORDINALES

Existe un orden obvio natural entre las categorías. Ejemplo:

1) Tabaquismo: no fuma / ex fumador


2) Severidad de la patología: ausente / leve / moderado / severo

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS


o MEDIDA ARITMETRICA

Cuando los datos se presentan mediante una distribución de frecuencia, todos los
valores caen dentro de unos intervalos de clase dados que se consideran
coincidentes con las marcas de las clases o puntos medios de cada intervalo.

3
o MEDIANA

Es una colección de datos ordenados de magnitud es decir el valor medio o la


mediana aritmética de los dos valores medios.

Ejemplo:

Sean lo números 5,6,6,6,7,8,8,8,8 en este ejemplo su mediana es 7.

o MODA

La moda es una serie de números, es aquel valor que se presenta con mayor
frecuencia, es decir, es el valor más común. La moda puede no existir, incluso si
existe o puede ser única.

Ejemplo:

El sistema 2,2,5,7,9,9,9,10,10,11,1,18 tiene de moda 9.

El sistema 3,5,8,10,12,15,16 no tiene moda.

El sistema 2,3,4,4,4,5,5,7,7,7,9 tiene dos modas 4,7 y se llama bimodal.

Una distribución que tiene una sola moda se llama unimodal.

AGRUPACIÓN DE DATOS
PARA ELABORR LAS TABLAS ESTADÍSTICAS, SE DEBE SEGUIR UN
PROCEDIMIENTO PRECISO:

1) Estos son algunos métodos para obtener datos:


a) Censo: Se entiende por censo aquella numeración que se efectúa a todos y
cada uno de los caracteres componentes de una población.
b) Encuesta: Según Antonio Napolitano “La encuesta, es un método mediante
el cual se quiere averiguar. Se efectúa a través de cuestionarios verbales o
escritos que son aplicados a un gran número de personas”.
2) Toma de datos

4
Es la obtención de una colección de datos por medio de encuestas, preguntas,
sondeos, etc.

3) Ordenación de datos

Es una colección de los datos numéricos tomados en orden creciente a decreciente


de magnitud. La diferencia entre el mayor y el menor de los números se llama rango
o recorrido de datos.

4) Cálculo de tamaño de clase

Para calcular el tamaño de clase es necesario calcular primeramente el número de


clases utilizando la regla de Sturges y después se obtiene el tamaño de clase
dividiendo el rango entre el número de clases.

5) Límites de clase

Representan el tamaño de cada clase.

6) Límites reales de cada clase

Se obtienen sumando al LS de la clase el LI de la clase continua superior y


dividiendo entre dos.

7) Marca de clase

Es el punto medio de la clase y se obtiene sumando los LI y LS de la clase y


dividiendo entre 2. La marca de la clase también se llama punto medio de la clase

PRESENTACION DE DATOS
L presentación de datos estadísticos constituye en sus diferentes modalidades uno
de los aspectos de más uso en la estadística descriptiva. A partir podemos visualizar
a través de los diferentes medios escritos y televisivos de comunicación masiva la
presentación de los datos estadísticos sobre el comportamiento de las principales
variables económicas y sociales, nacionales e internacionales.

1) Presentación Escrita:

5
Esta forma de presentación de informaciones se usa cuando una serie de datos
incluye pocos valores, por lo cual resulta más apropiada la palabra escrita como
forma de escribir el comportamiento de los datos; mediante la forma escrita, se
resalta la importancia de las informaciones principales.

2) Presentación Tabular:

Cuando los datos estadísticos se presenta a través de un conjunto de filas y


columnas que respondan a un ordenamiento lógico; es de gran importancia para el
uso e importancia para el usuario ya que constituye la forma más exacta de
presentar las informaciones. Una tabla consta de varias partes, las principales son
las siguientes:

• Título: Es las parte más importante del cuadro y sirve para describir todo el
contenido de este.
• Encabezados: Son los diferentes subtítulos que se colocan en la parte
superior de cada columna.
• Columna Matriz: Es la columna principal del cuadro.
• Cuerpo: El cuerpo contiene todas las informaciones numéricas que se
aparecen en la tabla.
• Fuente: La fuente de los datos contenidos en la tabla indica la procedencia
de estos.
• Notas al Pie: Son usadas para hacer algunas aclaraciones sobre aspectos
que aparecen en la tabla o cuadro y que no han sido explicados en otras
partes.
3) Presentación Gráfica:

Proporciona el lector o usuario mayor rapidez en la compresión de los datos, una


gráfica es una expresión artística usada para representar un conjunto de datos.

De acuerdo al tipo de variable que vamos a representar, las principales gráficas


son las siguientes:

➢ HISTOGRAMA: Es un conjunto de barras o rectángulos unidos uno de


otro, en razón de que lo utilizamos para representar variables continuas.

6
Para realizarla, se toma en cuenta para el eje X, los límites reales, y para
el eje Y, las frecuencias absolutas.
➢ POLÍGONO DE FRECUENCIAS: Esta gráfica se usa para representar los
puntos medios de clase en una distribución de frecuencias. Para su
elaboración, se consideran las marcas de clase en el eje X y las
frecuencias absolutas en el eje Y.
➢ GRÁFICA DE BARRAS: La gráfica de barras es una forma de gráfica que
utiliza barras para indicar la frecuencia de ocurrencia de las
observaciones. Para construirla se constituye el eje y por las frecuencias
absolutas y el eje X por los límites inferior y superior de cada clase,
dejando un espacio entre barra y barra.
➢ GRÁFICA LINEAL: Son usadas principalmente para representar datos
clasificados por cantidad o tiempo; ósea, se usan para representar
tiempos cronológicos.
➢ GRÁFICA DE BARRA 100% Y GRÁFICA CIRCULAR: Se usan
especialmente para representar las partes em que se divide una cantidad
total.
➢ LA OJIVA: Esta gráfica consiste en la representación de las frecuencias
acumuladas de una distribución de frecuencias. Puede construirse de dos
maneras diferentes; sobre la base “menor que” o sobre la base “o más”.
Puede determinar el valor de la mediana de la distribución.

7
CONCLUSIONES

✓ Cuando los datos se ordenan de manera compacta y útil, los responsables


de tomar decisiones pueden obtener información confiable sobre el entorno
y usarla para tomar decisiones inteligentes, y una presentación adecuada y
clara de los resultados de un trabajo de investigación además de ser
fundamental para para contribuir a la difusión de los mismos, puede incluso
ser imprescindible para lograr que se acepte su publicación.
✓ La elección del método de agrupación depende de la naturaleza de los
datos y los objetivos del análisis. Es aconsejable probar varios métodos y
ajustar sus parámetros para encontrar la solución más adecuada para un
conjunto de datos específico. Además, es importante considerar la
interpretación de los resultados y cómo se alinean con los objetivos
analíticos.
✓ En el análisis estadístico, los métodos de agrupación desempeñan un papel
crucial al permitir la identificación de patrones y la simplificación de
conjuntos de datos complejos. Tras examinar diversos métodos de
agrupación.
✓ Existe una amplia variedad de métodos de agrupación, cada uno con sus
propias fortalezas y debilidades. Desde el clásico método de k-medias
hasta técnicas más avanzadas como el clustering jerárquico y el DBSCAN,
la elección del método adecuado depende de la naturaleza específica del
conjunto de datos y los objetivos del análisis.

También podría gustarte