Documentos de Académico
Documentos de Profesional
Documentos de Cultura
AUDITORIA INFORMATICA.
Tema:
“5 Ejemplos de la aplicación de la minería de
datos”
1. Económicas
o Uso fraudulento de tarjetas de crédito
o Cálculo de indicadores financieros
o Análisis de riesgos de crédito
2. Educación
3. Procesos Industriales
o Modelos de calidad
o Extracción de modelos de coste
o Predicción de fallos y accidentes
4. Medicina
o Gestión hospitalaria
o Mejorar el uso de consultas, habitaciones y salas
o Recomendación de fármacos
o Análisis de procedimientos médicos solicitados
5. Biología y demás ciencias afines
o Análisis de los genes
o Análisis de proteínas
6. Telecomunicaciones
o Modelos de carga en redes
o Establecimiento de patrones de llamadas
7. Turismo
o Indentificar patrones de reserva
8. Tráfico
o Establecimiento de cámaras, GPS...
9. Política
o Diseño de campañas
Referencia bibliográfica
políticashttp://es.oocities.com/mineria.datos/aplicaciones.htm
Ejemplo 2
Referencia bibliográfica
http://es.oocities.com/mineria.datos/aplicaciones.htm
Ejemplo 3
Por su parte, Molina y García (2004) explican que los datos tal cual se almacenan en las
bases de datos no suelen proporcionar beneficios directos; su valor real reside en la
información que podamos extraer de ellos, es decir, información que nos ayude a tomar
decisiones o a mejorar la comprensión de los fenómenos que nos rodean. Ejemplos de ello
pueden ser: contrastar que todo va bien, analizar diferentes aspectos de la evolución de la
empresa, presentar información de forma más intuitiva, comparar información en diferentes
períodos de tiempo, comparar resultados con previsiones, identificar comportamientos y
evoluciones excepcionales, confirmar o descubrir tendencias e interrelaciones, entre otras
acciones.
Para tal efecto, se deben definir medidas cuantitativas para los patrones obtenidos
(precisión, utilidad y beneficio obtenido), para establecer medidas de interés que consideren
la validez y simplicidad de los patrones obtenidos mediante alguna de las técnicas de
Minería de Datos. El objetivo final de todo esto es incorporar el conocimiento obtenido en
algún sistema real, tomar decisiones a partir de los resultados alcanzados, o simplemente
registrar la información conseguida y suministrársela a quien esté interesado.
Cabe resaltar que los efectos sobre la eficiencia de los resultados en la Minería de Datos
como apoyo a la toma de decisiones está generando miles de opiniones desde diferentes
perspectivas, entre ellas se puede destacar: la imposibilidad de encontrar conclusiones
únicas referentes a la evaluación de un resultado obtenido con esta técnica. Sin embargo, la
consecuencia de los datos arrojados es interesante, por algo más que su precisión.
Los índices de bondad de resultado tratan de aportar una idea acerca del error que se
comete al emplear un modelo para realizar una tarea. Tal como manifiestan Padmanabhan y
Tuzhilin (1999), ésta es una medida de la fortaleza estadística del resultado. Para este
indicador se utilizan las siguientes medidas: Precisión, Ratio de error, Varianza y Matriz de
confusión, siendo las dos últimas derivaciones de las anteriores. La precisión se utiliza
cuando el resultado se presenta en forma de clasificación o estimación, la cual se mide a
través del porcentaje de predicciones que son correctas. Para efectos de la clasificación, se
emplea el porcentaje de casos bien clasificados y para la estimación del porcentaje de
registros, se emplea una estimación que el decisor considere correcta. Para medir la
precisión se puede emplear el coeficiente de confianza, el cual no es más que la
probabilidad condicionada de un hecho con respecto a otro.
Ejemplo 4
Otro importante hecho que describen Molina y García (2004) es que con la implementación
de procesos de Minería de Datos, a través de la aplicación de algunas técnicas estadísticas
avanzadas y nuevos métodos de extracción de conocimiento en grandes base de datos, se
pueden determinar las características contables de las empresas más rentables, al igual que
el perfil de sus clientes. Se hace imprescindible, por un lado, un análisis exploratorio
profundo de la base de datos y el empleo de métodos robustos, que hagan que dichos
componentes sean menos sensibles a los amplios casos estadísticos. Por otro lado, es
aconsejable diseñar con base a opiniones de expertos, si no hay información adecuada, o
utilizar algún sistema de aprendizaje, por ejemplo, la utilización de redes neuronales, para
el descubrimiento de patrones y extraer la información de la base de datos disponible.
Referencia bibliográfica
http://www.scielo.org.ve/scielo.php?pid=S1012-15872007000100008&script=sci_arttext
Ejemplo 5
Las técnicas de minería generan una serie de valores o métricas que cuantifican la
información contenida en el sitio web en términos de estructura, contenido y uso del
mismo. Esa información es muy útil para poder entender el comportamiento de los usuarios
de la web, su estructura, como están enlazados sus contenidos, etc.
La gran mayoría de herramientas existentes hoy en día son capaces de recopilar toda esta
información pero suelen representarla de una manera confusa, y difícil de entender. En este
proyecto se pretende utilizar técnicas de Visualización de la Información para crear un
sistema visual e interactivo que permita la fácil exploración de los datos, con el objetivo de
proporcionar un mayor conocimiento del sitio web. La Visualización de la Información es
la disciplina que estudia el uso de representaciones interactivas de datos abstractos para
mejorar su entendimiento.
Sistema desarrollado
Primer prototipo
Esta captura de pantalla muestra una parte de la web de Ayuntamiento de Zaragoza. Cada
objeto de la imagen con forma corresponde a una página de la web accesible des de
Internet, mientras que las líneas que los juntan corresponden a enlaces entre ellas. Cada
color y forma está relacionado con valores extraídos de los ficheros log, y son asignados
mediante un menú por parte del usuario del sistema. En la imagen mostrada anteriormente,
se pueden visualizar al mismo tiempo tres valores:
Número de visitas: el número de veces que cada una de las páginas ha sido
visualizada por un usuario. En la imagen, cuanto más visitada ha sido una página,
mayor es su tamaño, y su color es más azulado.
Ranking en buscadores: la forma de cada página está asociado al valor interno que
le ha asignado el motor de búsqueda Google. De este modo, sabemos que la estrella
tiene un ranking en Google muy alto, y por lo tanto, esa página saldrá en las
posiciones más altas de Google cuando un usuario la busque. Los hexágonos son
páginas con menos ranking, seguido de los triángulos.
Número de enlaces salientes: en la imagen, se puede apreciar que cada página tiene
un color asignado a su borde. Ese color corresponde al número de enlaces que
contiene esa web. Identificar fácilmente las páginas con muchos enlaces es una
tarea de alta importancia, ya que estás páginas sirven de ?punto de entrada? al sitio
web. Descubrir que una página contiene muchos enlaces, y que además es muy
visitada implica deducir, que todos los usuarios que vistan esta página podrán
acceder a más contenidos de forma sencilla, lo cual corrobora el buen diseño de la
web.
Otras métricas o valores han sido extraídos de los ficheros log, que siempre pueden ser
visualizados por parte del usuario de la aplicación con el atributo visual (color, forma o
color del borde) que el desee.
Referencia bibliográfica
http://www.zaragoza.es/ciudad/conocimiento/mineria.htm