Documentos de Académico
Documentos de Profesional
Documentos de Cultura
aprendizaje automático
reconocimiento de patrones
análisis de imágenes
búsqueda y recuperación de información
bioinformática
compresión de datos
computación gráfica.
El análisis de grupos es un problema, es un planteo general, y existen miles
de algoritmos que lo resuelven, cada uno con sus propias características.
Muchos algoritmos difieren significativamente en su idea de qué constituye
un grupo y cómo encontrarlos eficientemente.
El agrupamiento, por tanto, puede ser formulado como un problema multi-
objetivo de optimización. El algoritmo apropiado y sus parámetros
dependen del conjunto de datos que se analiza y el uso que se le dará a los
resultados.
El agrupamiento como tal no es una tarea con solución directa, sino un
proceso iterativo o interactivo que implica ensayo y error. Este proceso de
prueba y error es iterativo en la medida que sea automático, e interactivo en
la medida que requiera intervención humana. Es una práctica usual ejecutar
un algoritmo de agrupamiento (un proceso iterativo), y a partir de los
resultados ajustar los parámetros y repetir la operación (resultando en un
proceso interactivo).
Las aplicaciones del agrupamiento se dividen en dos tipos principalesː
ALGORITMOS
Los algoritmos de agrupamiento pueden ser categorizados de varias
maneras, por ejemplo, por suː
modelo de grupo
eficiencia computacional o velocidad de cómputo
eficacia en el problema específico
En adelante se listan solamente los algoritmos más prominentes, ya que
existen más de 100 publicados. No todos proporcionan modelos para sus
grupos y por esto pueden no ser fácil categorizarlos. No existe un algoritmo
de agrupamiento "correcto", como se pudo haber notado, "el agrupamiento
está en el ojo del observador". El algoritmo más apropiado para un
problema particular a menudo necesita ser escogido experimentalmente, a
no ser que haya una razón matemática para preferir un modelo de grupo
sobre otro.
APLICACIONES
EJEMPLOS
ESTATURAS
155 166 168 173
156 165 169 173
157 165 169 173
156 165 169 173
157 165 169 174
159 165 169 174
160 165 169 174
161 165 169 174
161 165 169 174
162 165 169 174
162 167 169 174
162 167 170 175
162 167 170 175
163 167 170 176
164 167 170 176
163 167 170 179
161 167 170
162 167 171
163 167 171
162 167 171
165 168 171
166 168 171
166 168 172
166 168 172
166 168 172
166 168 172
166 168 172
166 168 173
Los datos agrupados son aquellos que se han clasificado en categorías o
clases, tomando como criterio su frecuencia. Esto se hace con la finalidad
de simplificar el manejo de grandes cantidades de datos y establecer sus
tendencias.
Una vez organizados en estas clases por sus frecuencias, los datos
conforman una distribución de frecuencias, de la cual se extrae
información de utilidad a través de sus características.
ESATURAS (CM) NUMERO DE ESTUDIANTES
155-159 6
160-164 14
165-169 47
170-174 28
175-179 5
n=100
Frecuencia
Límites
Los valores extremos de cada clase o intervalo se llaman límites de
clase. Como podemos ver, cada clase tiene un límite menor y uno mayor.
Por ejemplo, la primera clase del estudio acerca de las estaturas tiene un
límite menor de 155 cm y uno mayor de 159 cm.
Este ejemplo tiene límites que están claramente definidos, sin embargo, es
posible definir límites abiertos: si en vez de definir los valores exactos, se
dijese “estatura menor a 160 cm”, “estatura menor a 165 cm” y así
sucesivamente.