Está en la página 1de 10

CLASE: INFORMATICA APLICADA

CATEDRÁTICO: ING. RICARDO J. WOOLERY

ALUMNOS: HECTOR J. ACOSTA MENDEZ

CUENTA: 256023014

RICARDO BAGDIEL CARRILLO

CUENTA: 200960510004

TEMA: MINERIA DE DATOS

FECHA: 6 DE MARZO 2018

CAMPUS TEGUCIGALPA
INTRODUCCION

En este trabajo de investigación que presentamos, tenemos como objetivo general


conocer el concepto como tal de minería de datos, sus aplicaciones más
importantes y el campo de empleo.

Como objetivos específicos queremos conocer el lenguaje y palabras claves que se


utilizan en este trabajo, y trabajar en tablas de Excel para organizarlo de manera
que sea de más fácil comprensión atreves del uso de todas sus herramientas

CAMPUS TEGUCIGALPA
1- GLOSARIO DE PALABRAS CLAVES

Estadística: Ciencia que utiliza conjuntos de datos numéricos para obtener, a


partir de ellos, inferencias basadas en el cálculo de probabilidades.

Análisis de Datos: Es la ciencia que examina datos en bruto con el propósito


de sacar conclusiones sobre la información.

Minería de datos: La minería de datos o exploración de datos (es la etapa de


análisis de "Knowledge Discovery in Databases" o KDD) es un campo de la
estadística y las ciencias de la computación referido al proceso que intenta
descubrir patrones en grandes volúmenes de conjuntos de datos.

Aplicación de la minería de datos en escenarios empresariales: A) Análisis


de datos financieros, B) Industria minorista, C) Industria de las
telecomunicaciones, D) Análisis de datos biológicos.

Métodos de análisis de la minería de datos: KDD, CRISP-DM y SEMMA

Descubrimiento de conocimiento en bases de datos (KDD): Es una


metodología propuesta por Fayyad [3] en 1996, propone 5 fases: Selección, pre
procesamiento, transformación, minería de datos y evaluación e implantación.
Es un proceso iterativo e interactivo.

Diferencia entre minería de datos y estadística: la minería de datos es una


disciplina ligada a la inteligencia artificial y diferenciada respecto a la estadística
y la Estadística: referente a los análisis de datos junto con una aportación propia
de las técnicas específicas de la inteligencia artificial.

CAMPUS TEGUCIGALPA
Diferencia entre minería de datos y análisis de datos: La minería de datos o
exploración de datos (es la etapa de análisis de "Knowledge Discovery in
Databases" o KDD) es un campo de la estadística y las ciencias de la
computación referido al proceso que intenta descubrir patrones en grandes
volúmenes de conjuntos de datos.

Bodega de datos: Una Bodega de Datos es una base de datos que organiza y
almacena una colección de información derivada

Aprendizaje de máquinas: El aprendizaje automático o aprendizaje


automatizado o aprendizaje de máquinas (del inglés, "Machine Learning") es el
subcampo de las ciencias de la computación y una rama de la inteligencia
artificial, cuyo objetivo es desarrollar técnicas que permitan que las
computadoras aprendan.

Clustering: El término clúster (del inglés cluster, que significa grupo o racimo)
se aplica a los conjuntos o conglomerados de ordenadores unidos entre sí
normalmente por una red de alta velocidad y que se comportan como si fuesen
una única computadora.

CAMPUS TEGUCIGALPA
2- PALABRAS CLAVES ADICIONALES

SEMMA: es el acrónimo a las cinco fases: (Sample, Explore, Modify, Model,


Assess).
La metodología es propuesta por SAS Institute Inc. la cual lo define como el
proceso de selección, exploración y modelamiento de grandes cantidades de
datos para descubrir patrones de negocios desconocidos

CRISP- DM: Tiene los siguientes objetivos:


Fomentar la interoperabilidad de las herramientas a través de todo el proceso
de minería de datos
Eliminar la experiencia misteriosa y costosa de las tareas simples de minería de
datos.

Análisis de datos financieros: se emplea tanto en el sector bancario como en


el de las finanzas. Se busca proveer datos que aseguren que es posible practicar
análisis sistemáticos en condiciones avanzadas y con garantías de fiabilidad.

Industria minorista: La minería de datos con sus aplicaciones para la


industria minorista ayuda a identificar patrones de compra de los clientes y
tendencias. De esta forma, las empresas están en condiciones de proporcionar
una mejor calidad deservicio al cliente, aumentando su satisfacción y facilitando
su retención.

Industria de las telecomunicaciones: en este sector, los datos son


especialmente importantes para alcanzar una buena comprensión del negocio.
La minería de datos y aplicaciones específicamente diseñadas para esta área,
ayudan en la identificación de los patrones de telecomunicaciones

CAMPUS TEGUCIGALPA
Análisis de datos biológicos: el campo de la biología es uno de los más
beneficiados por los avances de la tecnología. La genómica, la proteómica, la
genómica funcional y la minería de datos aplicada a la investigación de los seres
vivos son sólo algunos ejemplos, una lista donde no hay que olvidarse de la
bioinformática.

Redes neuronales: Se trata de un sistema de interconexión de neuronas en


una red que colabora para producir un estímulo de salida.

Regresión lineal: Es la más utilizada para formar relaciones entre datos.


Rápida y eficaz pero insuficiente en espacios multidimensionales donde puedan
relacionarse más de 2 variables

Árboles de decisión: Un árbol de decisión es un modelo de predicción


utilizado en el ámbito de la inteligencia artificial y el análisis predictivo, dada
una base de datos se construyen estos diagramas de construcciones lógicas, muy
similares a los sistemas de predicción basados en reglas, que sirven para
representar y categorizar una serie de condiciones que suceden de forma
sucesiva, para la resolución de un problema.

Modelos estadísticos: Es una expresión simbólica en forma de igualdad o


ecuación que se emplea en todos los diseños experimentales y en la regresión
para indicar los diferentes factores que modifican la variable de respuesta.

Reglas de asociación: Se utilizan para descubrir hechos que ocurren en


común dentro de un determinado conjunto de datos.

La inteligencia artificial: Es la inteligencia exhibida por máquinas.


En ciencias de la computación, una máquina «inteligente» ideal es un agente
racional flexible que percibe su entorno y lleva a cabo acciones que maximicen
sus posibilidades de éxito en algún objetivo o tarea.

CAMPUS TEGUCIGALPA
CAMPUS TEGUCIGALPA
3- REPORTE DE PRACTICAS RESUELTOS EN EXCEL

CAMPUS TEGUCIGALPA
4- AUTOCRITICA PERSONAL SOBRE LA CALIDAD DEL TRABAJO

HECTOR:

Personalmente creo que tenemos urgencia por saber todos estos conocimientos porque , lleva
mucho esfuerzo hacer el diseño del trabajo realizado, asi que hay que tener cuidado de escoger
los elementos y herramientas correctas , en esta ocasión fui muy cuidadoso y dedicado en mis
aportes.

RICARDO:

Se tuvo mucho cuidado en revisar lo que se pide que hagamos , y considero que estamos
entregando un trabajo aceptable , tomo horas extendidas en horarios de noche , para completarlo

CAMPUS TEGUCIGALPA
Procuramos apegarnos al plan de trabajo para evitar dejar algo por fuera , sin duda ahora tengo
una comprensión mas amplia del tema . y eso hace que valga la pena el esfuerzo dejado en el
trabajo.

5- EVALUACION DEL PRODUCTO A ENTREGAR

Califico el producto a entregar como altamente satisfactorio, debido a que se cumple con todo
lo dispuesto o la mayoría calificada, es de valorar que la dedicación y el cuidado de los detalles
hacen una enorme diferencia y lo hacemos notar aquí, merece un puntaje alto

6- EVALUACION DE LOS MATERIALES-FUENTES UTILIZADOS

Los recursos empleados , fueron accesibles ya que están hoy en dia al alcance de un ordenador ,

como ser:

MS EXCEL, Cmaps, MS Word. (youtube)

Trabajar de manera individual y luego juntar lo asignado , formo un vinculo fuerte entre el grupo
que formamos .

CAMPUS TEGUCIGALPA

También podría gustarte