Está en la página 1de 7

UNIVERSIDAD TECNICA DE COTOPAXI

CIYA
TPICOS ESPECIALES
INTEGRANTES:
AYALA PAL
CAIZA LUIS
CAYO LUIS
ORTIZ JONATHAN
CURSO: Noveno A Sistemas
FECHA: 31-07-2014
TEMA: DATAMING
OBJETIVO GENERAL
Desarrollar una investigacin acerca del DATAMING a travs de diferentes fuentes de
investigacin tecnolgico acerca del tema para conocer cmo se inici como funciona cual
ha sido la evolucin del DATAMING.
OBJETIVOS ESPECIFICOS
Analizar la informacin acerca del tema de investigacin la cual servir como ayuda
y fundamentacin para establecer conceptos propios y claros acerca del tema.
Recopilar toda la informacin que se utilizara en el proceso de investigacin para
obtener conocimientos claros del tema.
Generar un documento el cual contenga la informacin investigada con el propsito
de fundamentar la investigacin realizada por el grupo de investigacin.
DESARROLLO
MINERA DE DATOS O DATA MINING
Es considerada una tcnica que permite obtener datos a partir de ms datos, es decir que por
medio de la minera de datos los datos que normal mente son inmensos, son clasificados,
por patrones, perfiles y tendencias con el fin de convertir datos crudos en informacin til.
Segn: http://www.iiia.csic.es/udt/files/DataMining.pdf, menciona que: La minera de
datos es el proceso automtico para el descubrimiento de informacin til en grandes
cantidades de datos. Este proceso es un campo multidisciplinario, en el que se pretende
predecir resultados y/o descubrir relaciones entre los diferentes datos. Las diferentes tareas
que puede realizar la DM son:
Clasificacin: Mediante la clasificacin se busca encontrar un modelo que pueda predecir
el comportamiento de una variable a partir de sus caractersticas.
Anlisis de Asociaciones: Estas tcnicas pretenden sacar patrones de las relaciones que
hay entre diferentes rasgos de los datos.
Deteccin de Anomalas: El objetivo de la deteccin de anomalas es encontrar aquellos
elementos o caractersticas que son significativamente diferentes del resto de los datos.

Las tcnicas normales de recoleccin de datos dejaron de ser tiles por la gran cantidad de
datos que existen, y su poca adaptabilidad a cambios considerables, es por ellos que surge
la minera de datos.

SU ESTRUCTURA FUNCIONA DE LA SIGUIENTE MANERA.

Datos + Estadstica Informacin

Segn algunos autores, el Data Mining es aquella parte de la estadstica (principal-mente
estadstica no paramtrica) que se usa para problemas que se presentan actualmente en
Anlisis de Datos. Los problemas actuales se diferencian de los clsicos en que el nmero
de datos a analizar es mucho mayor y, como consecuencia, las tcnicas estadsticas clsicas
no pueden ser aplicadas
Adems el DM permite trabajar con grandes cantidades de observaciones (varios millones)
sin ningn inconveniente. Tambin permite tratar una gran cantidad de variables predictivas
(hasta varios millares). Esto ltimo es de gran utilidad para seleccionar variables
(determinar las ms tiles dentro de una gran masa).


TIPOS DE RELACIONES FUNDAMENTALES CON EL DATA MINING
Segn: http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/DM/introduccion-
DM.pdf menciona que Clases: El proceso de clasificacin consiste en asignar un conjunto
de datos a grupos fijados de manera que se minimice la probabilidad de una clasificacin
errnea. Por ejemplo, un problema tpico de clasificacin es el de dividir una base de datos
de bancos en grupos que sean lo ms homogneos posibles con respecto a variables como
posibilidades de crdito en trminos de valores tales como bueno o malo
Segn: http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/DM/introduccion-
DM.pdf menciona que: Clusters: se construyen grupos de observaciones similares segn
un criterio prefijado. El proceso de clustering (agrupamiento) consiste en subdividir un
conjunto de datos en grupos mutuamente excluyentes de tal manera que cada miembro de
un grupo est lo ms cercano posible a otro elemento, y grupos diferentes estn lo ms lejos
posible entre s, Por ejemplo, una empresa quiere introducirse en el mercado de bebidas
alcohlicas, pero antes hace una encuesta de mercado para averiguar si existen grupos de
clientes con costumbres particulares en el consumo de bebidas. La empresa quiere
introducirse en el grupo (si existe) que est menos servido por la competencia.
Segn: http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/DM/introduccion-
DM.pdf menciona que: asociaciones: las observaciones son usadas para identificar
asociaciones entre variables. La bsqueda de asociaciones es diferente a la bsqueda de
relaciones causales. Las relaciones causales son mucho ms difciles de encontrar que las
asociaciones, debido a la presencia de variables no observadas. Las relaciones causales y
asociaciones, no son equivalentes: si hay asociaciones no tiene por qu haber causalidad.
Segn: http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/DM/introduccion-
DM.pdf menciona que: Patrones secuenciales: se trata de identificar patrones de
comportamiento y tendencias. Un ejemplo sera intensidades de expresin en micro arrays
que permiten distinguir entre diferentes expresiones de genes para individuos con cncer o
sin l..

QUIENES LOS UTILIZAN?
Segn : http://sleepwalkings.wordpress.com/2012/06/25/mineria-de-datos-las-grandes-
empresas-estan-reuniendo-cada-fragmento-de-informacion-que-pueden-acerca-de-usted-y-
la-venden-a-cambio-de-dinero/ menciona que: Cuando la mayora de la gente piensa en el
Gran Hermano, piensan en el FBI, la CIA, la NSA, el Departamento de Seguridad
Nacional y otras agencias del gobierno entre las sombras. S, definitivamente estn
mirando, pero tambin lo hacen muchas de las grandes corporaciones. De hecho, hay
algunas empresas que estn haciendo decenas de millones de dlares mediante la
recopilacin de cada fragmento de informacin que pueden acerca de todos nosotros y lo
venden con fines de lucro a cualquier persona dispuesta a pagar el precio.

FACEBOOK, GOOGLE, YOUTUBE, MICROSOFT
Son las grandes empresas que en su mayor parte recolectan informacin privada de sus
clientes, la cantidad de informacin manejada por estas empresas es tal que organismos
internacionales y Americanos han intentado realizar tratos con ellos para poder comprar su
informacin, esto es ms conocido por parte de Microsoft ya que declararon pblicamente
que el FBI y la CIA intentaron comprar la informacin que ellos tenan de sus clientes, a lo
que se opusieron, sin embargo esto no quiera decir que la informacin no se venda, existen
negocios por debajo de la mesa que hace que la informacin que creemos confidencial est
en manos de compaas que jams escuchamos, lo que hace que hoy en da el negocio de la
informacin sea uno de los ms rentables y mejor pagados.

ACXIOM
La escala de la recopilacin de informacin que hace Acxiom es absolutamente
alucinante. Si usted no lo cree, Acxiom hecho un seguimiento de ms de 190 millones de
personas dentro de Estados Unidos.
La compaa se inscribe en una categora denominada marketing de base de
datos. Comenz en 1969 como una empresa llamada Demographics Inc., utilizando guas
telefnicas y otros instrumentos de baja tecnologa en particular, as como una
computadora, para reunir informacin sobre los votantes y los consumidores para el
marketing directo. Casi 40 aos despus, Acxiom ha detallado entradas por ms de 190
millones de personas y 126 millones de hogares en EE.UU. Y, en todo el mundo, unos 500
millones de consumidores activos. Ms de 23.000 servidores en Conway, al norte de Little
Rock, recopilan y analizan ms de 50 billones de datos de cada ao de las transacciones.
te asoma ms en la vida estadounidense que el FBI o el IRS, o que las miradas indiscretas
digitales de Facebook y Google. Si usted es un adulto de Amrica, lo ms probable es que
probable que sepa cosas como su edad, raza, sexo, peso, talla, estado civil, nivel de
educacin, poltica, hbitos de compra, las preocupaciones de salud de los hogares, sueos
de vacaciones y as sucesivamente.

UTILIDADES DE LA MINERA DE DATOS
Algunas de las reas que ms se pueden beneficiar de la minera de datos son los siguientes:

1. Comercio/Marketing

a) Identificacin de patrones de compra de los clientes.
b) Bsqueda de asociaciones entre clientes y caractersticas demogrficas.
c) Prediccin de respuesta a campaas de correo.
d) Anlisis de cestas de la compra

2. Banca

a) Deteccin de patrones de uso fraudulento de tarjetas de crdito.
b) Identificacin de clientes leales.
c) Prediccin de clientes con probabilidad de cambiar su afiliacin.
d) Determinacin del gasto de tarjeta de crdito por grupos.
e) Bsqueda de correlaciones entre indicadores financieros.
f) Identificacin de reglas de mercado de valores a partir de histricos

3. Seguros y Salud Privada

a) Anlisis de procedimientos mdicos solicitados.
b) Prediccin de qu clientes compran nuevas plizas.
c) Identificacin patrones de comportamiento para clientes con riesgo.
d) Identificacin de comportamiento fraudulento.

4. Transportes

a) Determinacin de la planificacin de la distribucin entre tiendas.
b) Anlisis de patrones de carga

5. Medicina

a) Identificacin de terapias mdicas adecuadas para diferentes enfermedades.
b) Asociacin de sntomas y clasificacin diferencial de patologas
c) Estudio de factores (genticos, precedentes, hbitos, alimenticios, etc.) de riesgo en
distintas patologas.
d) Segmentacin de pacientes para una atencin ms adecuada segn su grupo.
e) Predicciones temporales de los centros asistenciales para el mejor uso de recursos,
consultas, salas y habitaciones.
f) Estudios epidemiolgicos, anlisis de rendimientos de campaas de informacin,
prevencin, sustitucin de frmacos, etc.
CONCLUSIONES
En conclusin el DATAMINIG consiste en obtener datos y a la ves aprovecharlos al
mximo de forma estadsticas es decir que se puede obtener datos de otros datos que
en el peor de los casos son datos que ya no se utilizan y poder sacar provecho de
estos as conseguir un beneficio.
En conclusin el DATAMINIG se base en un proceso de tres etapas las cuales son
clasificar, analizar y detectar ya que de esta forma se contiene informacin de una
gran cantidad de datos que son de un ambiente multidisciplinario
Tambin el DATAMINIG es un proceso de recoleccin de informacin basado en
estadsticas que dan como resultado informacin ya que el DATAMINIG surge por
la gran cantidad de datos adems que se basa en estadsticas predictivas.
Tambin el DATAMINIG se base en buffers, asociaciones y casualidades ya que
estos procesos ayudan a relacionar la informacin para dividirlas por grupos y
minimizar errores en la obtencin de la informacin.
El DATAMINIG es una forma de realizar comercio con fin de lucro es porque
muchas empresas disponen de este mecanismo ya que les permite tener informacin
de sus clientes en lo mas confiable.
RECOMENDACIONES
Es recomendable hacer buen uso de este tipo de mecanismos para obtener
informacin ya que en muchos de los casos la informacin que se obtiene de los
usuarios es confidencial y en muchos de los casos esta informacin es utilizada con
propsitos de lucro.
Se recomienda ser muy cautelosos con la informacin que se est enviando o
proporcionando a las entidades que brindan sus servicio ya que pueden utilizar esta
para un uso no adecuado.
BIBLIOGRAFA
[1] C.S.I.C, DATAMINIG o Minera de Datos, Abril 2013, [En lnea], Disponible en:
http://www.iiia.csic.es/udt/files/DataMining.pdf, [Consultado: 29 de Julio del 2014].
[2] MARTINEZ, Joaqun, Introduccin a DATA MINIG, Octubre 2011, [En lnea],
Disponible en:
http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/DM/introduccion-DM.pdf,
[Consultado: 29 de Julio del 2014].
[3] MILLAHUEL, Ariel, Minera de Datos, 25 Junio 2012, [En lnea], Disponible en:
http://sleepwalkings.wordpress.com/2012/06/25/mineria-de-datos-las-grandes-empresas-
estan-reuniendo-cada-fragmento-de-informacion-que-pueden-acerca-de-usted-y-la-venden-
a-cambio-de-dinero/, [Consultado: 29 Julio del 2014].

También podría gustarte