Está en la página 1de 11

Tabla de ilustraciones

Ilustración i Funcionamiento de Minería de datos...............................................5

Contenido
INTRODUCCION................................................................................................... 3
CONTENIDO......................................................................................................... 4
Definición......................................................................................................... 4
Características................................................................................................. 5
Precursores...................................................................................................... 6
Trabajos realizados.......................................................................................... 6
CONCLUSION..................................................................................................... 10
BIBLIOGRAFÍA.................................................................................................... 11

Más aún. si estos involucran operaciones matemáticas complejas y/o repetitivas. Computadora: Es un dispositivo electrónico utilizado para procesar información y obtener resultados. bueno primero conseguimos los ingredientes. de cada algoritmo. A las soluciones creadas por computadora se les conoce como programas y no son más que una serie de operaciones que realiza la computadora para llegar a un resultado. Para poder realizar programas. etc. con un grupo de datos específicos. ordenar. el tiempo que demora y revisando el código. Nos centraremos en los métodos más populares. también debemos de conocer. Los datos y la información se pueden introducir en la computadora como entrada (input) y a continuación se procesan para producir una salida (output). de manera específica las funciones que pueden realizar la computadora y las formas en que se pueden manejar los elementos que hay en la misma. 02/02/2004 .1 El diseño de soluciones a la medida de nuestros problemas. alcance. desde uno simple hasta el más complejo. escrito en Java.INTRODUCCION ¿Algoritmo? Es una secuencia de pasos ordenados para lograr una tarea específica. luego hacemos paso a paso lo demás para lograr la meta. En este caso. Lo anterior nos lleva al razonamiento de que un programa nos sirve para solucionar un problema específico. además de conocer la metodología mencionada. Cuando nosotros queremos hace un postre. La computadora no solamente es una máquina que puede realizar procesos para darnos resultados. la forma de llegar a estas soluciones. sin que tengamos la noción exacta de las operaciones que realiza para llegar a esos resultados. de problemas específicos que se nos presenten. pastel o comida ¿Qué hacemos?. nos servirán para ordenar vectores o matrices con valores asignados aleatoriamente. requiere como en otras disciplinas una metodología que nos enseñe de manera gradual. Los algoritmos de ordenamiento nos permiten. Este informe nos permitirá conocer más a fondo cada método distinto de ordenamiento. prerequisitos de cada algoritmo. Con la computadora además de lo anterior también podemos diseñar soluciones a la medida.89 páginas 2 . como su nombre lo dice. analizando la cantidad de comparaciones que suceden. o requieren del manejo de un volumen muy grande de datos. Se realizaran comparaciones en tiempo de ejecución. funcionalidad. 1 Alexander Oviedo Fadul.

Existe desde el método más simple. Dentro de los algoritmos recursivos encontramos: – Ordenamiento por Mezclas (merge) – Ordenamiento Rápido (quick)  METODO DE LA BURBUJA El método de la burbuja es uno de los más simples. que al estar optimizado usando recursión. entonces los intercambia de posición. es tan fácil como comparar todos los elementos de una lista contra todos. Mediante llamadas recursivas a sí mismos. hasta el Quicksort (Método Rápido). con el 6. a derecha. imaginemos que tenemos los siguientes valores: 5 6 1 0 3 Lo que haría una burbuja simple. requieren de mayor atención y conocimiento para ser entendidos.CONTENIDO Definición Para poder ordenar una cantidad determinada de números almacenadas en un vector o matriz. que son simples iteraciones. su tiempo de ejecución es menor y es más efectivo. con el 1. es posible que el tiempo de ejecución y de ordenación sea más óptimo. Así. comenzando por el 5. Lo compara con el 6. Son rápidos y efectivos. que consiste en dividir un problema grande en varios pequeños para que sea más fácil resolverlos. Luego continua con el siguiente. utilizan generalmente la técnica Divide y vencerás. si se cumple que uno es mayor o menor a otro.  METODOS RECURSIVOS Estos métodos son aún más complejos. si es mayor o menor (dependiendo si el orden es ascendiente o descendente) se intercambian de posición. seria comenzar recorriendo los valores de izq. sucesivamente. hasta el último elemento de la lista  MINERIA DE DATOS Convertir datos en conocimiento para tomar decisiones Es importante la inteligibilidad del conocimiento obtenido (los modelos estadísticos no son siempre sencillos de entender) MD = BBDD + estadística + aprendizaje automático 3 . esperando ver si se cumple o no la misma condición que con el primer elemento. y lo compara con todos los elementos de la lista. como el Bubblesort (o Método Burbuja). con el 0 y con el 3. existen distintos métodos (algoritmos) con distintas características y complejidad. Por ejemplo.

• 1960’s y antes • Indexado y técnicas de organización (Btrees. etc.Análisis de datos y patrones .Extracción de conocimiento . Hashing) • Creación de las BD en archivos primitivos Evolución de la Tecnología BD • Lenguajes de queries SQL. control concurrencia) • Herramientas de modelado de datos (Entidad-Relación) • OLTP (On Line Transaction Processing) Sinónimos: .Minería de conocimiento de bases de datos .Características Evolución de la Tecnología BD aplicado a minería y extracción de datos.Descubrimiento de Conocimiento en Bases de Datos .Arqueología de datos Ilustración i Funcionamiento de Minería de datos 4 . •1970’s hasta principios de los 1980’s • Interfaces de usuario y reportes • BD Jerárquicas y de Red • Procesamiento queries 2 y p • BD Relacionales y optimización de • Manejo transacciones (recuperación.

5 entre Otros. cuyo objetivo es averiguar dicha clase para casos nuevos. modelos de datos avanzados: Extended-Relational. Simplemente. Para comprender la información de la que disponemos. éstas deben podarse ya que sólo agregan niveles en el árbol y contribuyen a la ganancia de información Por último. Existen varias razones para la poda de los árboles: la evaluación de variables pero importantes o significativas y el gran tamaño del obtenido. Entran dentro de los métodos de clasificación (supervisada. Su rapidez a la hora de la clasificación. multimedia. Deductivo. data warehouse u otro repositorio de información (Jiawei Han. Con IO cual algunas ramas del árbol pueden engañosas. la "poda (preprunning) y la post-poda (postprunning) En el primer caso detiene el crecimiento del árbol cuando la ganancia de información producida al dividir un conjunto no un umbral determinado: en la pos-poda se podan algunas ramas una vez que se ha terminado en el árbol Precursores  ¿Qué es la minería de datos? La tarea no trivial de extraer información implícita. El modelo así obtenido puede servir para clasificar casos cuyas clases que desconozcan. 1992). Otro algoritmo es el C4. espaciales. temporales. En el primer un árbol puede haber sido construido a partir de ejemplos con ruido. son factores que influyen en su propagación.5 que es los sucesos del IDE3. El J4. Todos estos algoritmos nos han ayudado al proceso de clasificación según han ido apareciendo y nos siguen ayudan gracias a las nuevas versiones de los mismos. OO. Su implementación.8 que es una implementación del C4. Micheline Kamber 2001). 5 . previamente desconocida y potencialmente útil de bases de datos (Frawley et. Object-Relational. Existen dos enfoques para podar los árboles. etc. si el árbol Obtenido es profundo o demasiado frondoso se dificulta la interpretación panel del usuario. realmente es la base de su funcionamiento. en cuanto a la evaluación de variables no relevantes. activos. bases de conocimiento.I Funcionamiento Minería de datos Los árboles de clasificación son de los más en el tema de aprendizaje autonómico –tiene mucha relación con los arboles de decisiones. Se abarca un el tema los algoritmos conocidos que aplican en el tema como son el algoritmo CART que basa su criterio por defecto en el Gini índex para la clasificación. formados una variable dependiente (clase).  Trabajos realizados 1980’s (Mediados al presente) Evolución de la Tecnología BD.  El proceso de descubrir conocimiento interesante de grandes cantidades de datos almacenadas en bases de datos. Con IO cual hubiera sido IO mismo utilizar un de caja negra. científicos. al. el que realiza divisiones sobre los posibles valores de la clase productora y usa un criterio de ganancia en información como función de división. orientados a aplicaciones. sistemas de BD Avanzados.

una técnica muy habitual es tratar de utilizar el algoritmo de Naive Bayes tratando de predecir el valor de todos los atributos en función de todos los atributos (un "todos contra todos"). validaciones. yo lo usaría para:  Exploración inicial de los datos  Tareas de clasificación. Cuando no tenemos muy claro qué atributo se puede predecir en función de otros. Básicamente.. Se me ocurre. menos de 20 años y estas en paro.. Otra ventaja de este algoritmo es que se entrena muy rápido. Podemos detectar elementos anómalos en función de si encajan o no con las reglas surgidas del árbol (por ejemplo. son probablemente el mejor algoritmo que podemos utilizar para clasificar. por ejemplo. El resultado de esta orgía de correlaciones suele ser un modelo en el que tenemos más o menos claro qué vamos a poder predecir en esos datos. del estilo "Si eres hombre.... Nos pueden servir para tareas como:  Clasificación en general  Validaciones.. en las que el rendimiento sea crítico. Vamos. entornos en tiempo real en los que queramos detectar entradas anómalas.. Básicamente. este algoritmo busca correlaciones entre atributos. pero su desventaja es que no es muy preciso.•1980’s (Finales al presente) Data warehouse y OLAP (On Line Analytical Processing) Evolución de la Tecnología BD Data warehouse y OLAP (On Line Analytical Processing). minería de datos y descubrimiento de conocimiento • 1990’s (la presente) sistemas basados en XML web mining • 2000 (a la fecha) Nueva generación de sistemas de 4 nueva generación de sistemas de información integrados Algoritmos conocidos empleados en la minería de datos Algoritmo Naive Bayes2 Empezamos por este porque es el algoritmo que primero se suele utilizar para explorar datos...php 6 ..com/2008/053003-data-mining. de hecho. la probabilidad de que tengas coche es del 90%". clasificaciones y filtrados de mensajes. etc. probablemente mientas")  Predecir el valor de un atributo con precisión Clustering 2 http://gacaxa. y eres comprador de revistas de coches. construyen un árbol del que se pueden extraer reglas. Decisión Trees (Árboles de decisión) Los árboles de decisión son clarísimamente una herramienta potentísima de clasificación. "si tienes coche. tienes unos ingresos superiores a 'X'.blogia.

¿subirá o bajará el IBEX mañana?  Predicción de una magnitud analógica.. este algoritmo también resuelve problemas de clasificación y regresión. Puede ser adecuado para detectar patrones no lineales.Sirve sobre todo para buscar elementos afines dentro de un conjunto. Por ejemplo.. Sequence clustering También es bastante específico para detectar secuencias típicas dentro de un conjunto de eventos.  Validaciones (las entradas que no pertenecen a un clúster. hombres y mujeres mayores casados.. pero no mujeres mayores solteras. saber en qué orden hace clic la gente en las noticias de una web. podemos usarlo para saber que en una población hay hombres y mujeres jóvenes solteros. puede ayudarnos a ordenar los titulares de arriba a abajo y de derecha a izquierda. Detecta asociaciones comunes entre elementos (por ejemplo. seguro que no quieres palitos salados? Neural Network (Redes neuronales) Al igual que los árboles de decisión. 7 . pueden ser "outliners" o elementos anómalos). hombres mayores solteros. Usos típicos:  Estudio de secuencias de eventos  Detección de algunas anomalías de comportamiento (eventos que llegan fuera de secuencia) Association rules (Reglas de asociación) Este se suele usar casi exclusivamente para análisis de cesta de la compra. Por ejemplo:  Análisis bursátiles. Se usa como alternativa al algoritmo de árboles de decisión: lo mejor es probar ambos sobre un mismo problema y utilizar el que mayor acierto nos dé en sus predicciones. Nos puede servir para:  Segmentar un mercado. difícilmente descriptibles por medio de reglas. en general. Time Series (Series temporales) Este algoritmo es específico para predecir el valor de una magnitud en función del tiempo. Por ejemplo. Usos típicos:  Análisis de la cesta de la compra  Ofrecer recomendaciones al comprador: ¿has comprado cerveza... quien compra cerveza suele comprar también palitos salados)..

pero cuando se trata de predecir una magnitud continúa). puede también ser aplicada a datos de texto. esta aplicación también puede considerarse como perteneciente al área del reconocimiento de patrones de imágenes (Pattern Recognition).. - Dirigir correo a clientes específicos. el mismo tratará de categorizar aquellas que sean ilegítimas mediante la identificación de ciertas características que estas últimas tengan en común.. - Buscar secuencias en el orden en que los clientes agregan productos a una cesta de compra. clasificar y detectar particulares patrones en la información disponible. - Detección de fraudes: Esta es una aplicación que puede ser considerada como una técnica de clasificación. - Clasificación de cuerpos celestes: Debido a la gran contribución a estas tareas por parte del reconocimiento de imágenes y los pre-procesamientos involucrados. El clásico procedimiento de asignación de puntos puede ser complementado y mejorado con la ayuda de la minería de datos. 8 . Si no sabes a qué me refiero. Aplicaciones de la Minería de Datos Los modelos de minería de datos se pueden aplicar a situaciones empresariales como las siguientes: - Predecir ventas. La esencia de los métodos de la minería de datos aplicados a los datos numéricos. pero con la ventaja de la existencia de maneras tradicionales para realizarlo. - Determinar los productos que se pueden vender juntos. En efecto. - Minería de texto: Con billones de páginas en la red. imagina la tarea de clasificar puntos en un espacio. Esto puede ser usado en las corporaciones para prevenir que se culmine un proceso que muestre pertenecer a una "clase" peligrosa - Análisis de riesgos en créditos: Esta es una aplicación similar a la anterior. se requieren de nuevas tecnologías para encontrar. el problema no es lineal. cuando el algoritmo analiza una gran cantidad de transacciones. cuando los grupos en los que se divide la población no son lineales. cuando no se pueden clasificar fácilmente trazando líneas.  Regresiones (es similar a la clasificación.Nos pueden servir para tareas como:  Las mismas tareas que los árboles de decisión.

9 .

Lo tratado en este documento es como se constituye la minería de datos. ampliar la información sobre cómo se desarrolla cada proceso sería demasiado extenso por eso es que aquí se concentró todo lo básico. con esto en todo su proceso puede determinar las mejores salidas. 10 . iniciando con el apoyo de decisiones pero no de manera eficiente pero. así como obtener su propia propuesta de solución todo lo que lo plantea da buen camino a usarlo. en los temas de Arboles de decisiones se muestran y mencionan los protocolos usados para desempeñar de la mejor manera sus actividades y acercando más a una inteligencia independiente. La tecnología avanza así mismo los algoritmos cada vez más desarrollados capaces de lograr inimaginables cosas. asi es como debería funcionar la IA. ya daba inicios de propuestas y eso es avance… Se hace mención de árboles de decisiones pues es una base principal de la minería de datos. fueron mejorando poco a poco su estructura.CONCLUSION Luego de la toda la información leída e incluida en este documento llego a la conclusión sobre la minería de datos que la funciona que realiza es sorprendente ya que dada su estructura es capaz de aprender a como apoyar en las decisiones para las personas. Desde su aparición o lo que se puede decir su nacimiento en. y es muy interesante ya que tiene un algoritmo que podemos comparar con la inteligencia humana (claro no tan desarrollada y nada compleja) pero cada vez más se acerca a razonamiento.

O. Fernández. a. Fadul. (2008). técnicas y áreas de aplicación.Gerard Escudero. Editorial Paraninfo. L. Diseño estructurado de algoritmos. Inteligencia Artificial. Colombia: Editorial Sincelejo. M. Editorial UOC.BIBLIOGRAFÍA avanzada. (2014).Samir Kanaan. Maria Isabel Alfonso Galipienso. I. 11 . A. Aplicación de los sistemas neurodifusos a la interpretación automática de imágenes de satélite. Inteligencia artificial: modelos. Almeria. A. Ceccaroni. A.David Masip Rodó. Raúl Benítez. (Marzo 2004). J. (2003). (2009).