Explora Libros electrónicos
Categorías
Explora Audiolibros
Categorías
Explora Revistas
Categorías
Explora Documentos
Categorías
CHONTALPA
“UNIVERSIDAD DEL PUEBLO Y PARA EL PUEBLO”
“MINERIA DE DATOS”
PROFESOR:
NOMBRE DE LA ALUMNA:
TURNO:
VESPERTINO
006LA18
01/OCTUBRE/2021
Cuestionario Unidad 2: “Arquitectura de Minería de Datos”
1. ¿Qué es un Repositorio de Datos?, Explica.
Un repositorio es un espacio centralizado donde se almacena, organiza,
mantiene y difunde información digital, habitualmente archivos informáticos,
que pueden contener trabajos científicos, conjuntos de datos o software. Es
una gran infraestructura de base de datos que reúne, gestiona y almacena
conjuntos de datos variables para análisis, distribución e informes.
2. ¿Cuál es la Función principal de los Repositorios de Datos?
Pueden funcionar como una herramienta para la visualización compartida de
información en la era digital. Los buscadores utilizados en interfaces de
acceso para repositorios, permiten proveer la información a las distintas áreas
institucionales, tanto de una institución académica como de una institución que
genere contenido constantemente.
3. Menciona 5 características de los Repositorios de Datos.
Almacena diferentes tipos de archivos
Cada objeto contiene metadatos
Ofrece un sistema de gestión y validación de las publicaciones
Cuenta con un sistema de búsqueda que agiliza la localización de los
objetos
Incrementa la difusión y visualización de contenidos
4. Menciona 3 ventajas y 3 desventajas en la utilización de los
Repositorios de Datos.
Ventajas
Unidad: Todos los documentos están almacenados en una misma base de
datos, es más fácil su recuperación.
Libre acceso a los contenidos.
Preservación a largo plazo: La garantía de preservación que supone el
depósito en un repositorio es mucho mayor que la que ofrecen las
páginas web personales, los servidores de las revistas, etc.
Desventajas
Es necesario el acceso a internet y tener buena conexión.
La mayoría de los repositorios están en inglés. Europa y Norteamérica
tienen un porcentaje alto en la distribución de repositorios. Por eso es
necesario que nosotros los docentes ayudemos en la elaboración de
materiales para los repositorios de Latinoamérica existentes.
El material publicado por nosotros puede ser copiado sin ser
referenciado, pero es un riesgo quese debe asumir en pro de la
educación.
5. ¿Qué es un Servidor de Datos?
Un servidor es un sistema que proporciona recursos, datos, servicios o
programas a otros ordenadores, conocidos como clientes, a través de una red.
En teoría, se consideran servidores aquellos ordenadores que comparten
recursos con máquinas cliente. Existen muchos tipos de servidores, como los
servidores web, los servidores de correo y los servidores virtuales.
6. ¿Cuál es la principal Función de los Servidores de Datos?
Si vamos a la función fundamental de un servidor de datos, encontraremos que
es el servicio que provee de información a otras aplicaciones web o
equipos/hosts, tal como se especifica en el modelo cliente servidor.
7. Menciona 3 características, 3 ventajas y 3 desventajas de los Servidores
de Datos.
Característica
Consola de gestión de la base de datosWindows.
Se usan para las páginas web con contenido dinámico, alojando allí todos
los datos, elementos e información de la misma
Aplicación Web de administración para el acceso restringido desde
cualquier localización.
Ventajas
Acceso rápido a los datos: Permiten tener un acceso inmediato a los
datos que se alojan en ella. La información puede ser accesada,
modificada, borrada y agregada las 24 hs debido a que las bases de
datos corren siempre, no se detienen.
Aumenta la productividad: Usar una base de datos permite acceso a
los datos de forma instantánea, esto se traduce en mayor velocidad
para realizar las tareas relacionadas a la manipulación de la información,
sea copiarla, eliminarla o simplemente leerla.
Permiten ingresar datos ilimitados: A diferencia del mundo real con
límites físicos, las bases de datos virtuales no tienen límiite alguno
prácticamente, siempre hay discos duros más grandes, cpus y memorias
más rápidas para procesar los crecientes datos de una BD.
Desventajas
Pueden crecer mucho: A medida que se agregan datos, la estabilidad de
la misma se vuelve más crítica. Muchas veces necesitarás ampliar el
espacio en disco duro, así como también la memoria RAM o accesos
simultáneos de los usuarios a medida que crece la demanda.
Suba de costos: Al aumentar la demanda, tamaño y uso de la BD,
también puede que necesites cambiar el equipamiento de tus servidores.
Actualizaciones: Las BDs,sus clientes y servidores requieren de
instalación de actualizaciones constantes.
8. ¿Qué es una Base de Datos de Conocimientos (KB)?, Explica.
Es una biblioteca en línea de autoservicio que contiene información sobre un
producto, servicio, departamento o tema. Los datos contenidos en la base de
conocimiento pueden ser de cualquier parte, pero generalmente provienen de
varios colaboradores, bien versados en temas específicos, que van
manteniéndola y actualizándola.
9. ¿Cuál es la Función principal de una Base de Datos de Conocimientos?
Las bases de conocimiento tienen la principal función de proveer y/o
proporcionar medios de descubrir, soluciones a problemas ya resueltos, los
cuales podrían ser aplicados como base a otros problemas dentro o fuera de la
misma área de conocimiento.
o Recopilar
o Organizar
o Buscar
o Compartir información y datos
10. Menciona 3 ventajas y 3 desventajas en la utilización de las Bases
de Datos de Conocimientos (KB).
Ventajas
Aumenta la productividad de tu equipo
Educa a los clientes y proporciona agilidad en el autoservicio
Facilitar la formación de nuevos colaboradores
Desventajas
El tiempo que pueda tomar su implementación, ya que no tiene un tiempo
específico.
La resistencia al cambio de los usuarios, es decir, al cambio que surgen
con las nuevas tecnologías para la innovación de la información.
Los problemas técnicos que puedan surgir como fallas de hardware,
software o funciones implementadas
11. Define el Proceso de Minería de Datos.
El proceso de minería de datos comprende varios pasos como crear, probar y
trabajar con los modelos de minería.
12. ¿Cuál es la Función principal del Proceso de Minería de Datos?
Esquematiza.
El proceso de Data Mining tiene la función de:
identificación de los datos.
comprensión de los datos
preparación de datos
13. Menciona 3 características, 3 ventajas y 3 desventajas del Proceso
de Minería de Datos.
Características
Explorar los datos que se encuentran en las profundidades de las bases
de datos (por ejemplo los Almacenes de Datos), que algunas veces
contienen información almacenada durante varios años.
En algunos casos, los datos se consolidan en un almacén de datos y en
mercados de datos; en otros, se mantienen en servidores de Internet e
Intranet.
El entorno de la minería de datos suele tener una Arquitectura Cliente
Servidor.
Ventajas
Enormes bases de datos pueden ser analizadas y procesadas mediante la
tecnología de data mining.
Los resultados son fáciles de entender.
Permite ofrecer a tus clientes los productos o servicios que necesitan.
Desventajas
La dificultad de recopilación de los datos. Dependiendo del tipo de
datos que se quieran recopilar puede conllevar mucho trabajo.
El requerimiento de una gran inversión también puede considerarse un
inconveniente. En ocasiones, las tecnologías necesarias para llevar a
cabo la recopilación de datos, no es tarea sencilla y consume muchos
recursos que podrían suponer un coste elevado
14. Menciona las Fases principales, que integran el Proyecto de Minería
de Datos.
Selección y preparación de datos.
Creación del modelo de minería de datos (también denominada fase de
preparación).
Prueba de un modelo y análisis de su calidad.
Utilización de un modelo que ofrece información acerca de:
La visualización de los resultados.
Puntuación de los registros de datos.
Análisis de un modelo y preparación para otros pasos del proceso.
15. Menciona los pasos que forman parte fundamental de cualquier
Proceso de Minería de Datos (Data Mining).
o Determinación de los objetivos.
o Pre-procesamiento de los datos.
o Determinación del modelo.
o Análisis de los resultados.