Está en la página 1de 16

Trabajo 2 de Gestión de Datos

Masivos
Raúl Armas Benavides 732624420
Descripción de los datasets
• Descripción de los repositorios Kaggle , Kdnuggets y
Reddit.
kaggle
• Kaggle , una subsidiaria de Google LLC ,
es una comunidad en línea
de científicos de datos y profesionales
del aprendizaje automático . Kaggle
permite a los usuarios encontrar y
publicar conjuntos de datos, explorar y
construir modelos en un entorno de
ciencia de datos basado en la web,
trabajar con otros científicos de datos e
ingenieros de aprendizaje automático, y
participar en concursos para resolver
desafíos de ciencia de datos. Kaggle
comenzó en 2010 al ofrecer concursos
de aprendizaje automático y ahora
también ofrece una plataforma de
datos públicos, un banco de trabajo
basado en la nube para la ciencia de
datos y la educación en Inteligencia
KDnuggets
• KDnuggets ™ es un sitio
líder en inteligencia
artificial, análisis, big
data, minería de datos,
ciencia de datos y
aprendizaje automático
Reddit
• Reddit es un sitio
web de marcadores sociales y
agregador de noticias donde
los usuarios pueden añadir
texto, imágenes, vídeos o
enlaces. Otros usuarios
pueden votar a favor o en
contra del contenido,
haciendo que aparezcan más
o menos destacados. Se trata
de un mapa de discusión,
como parte de un DDS global
distribuido.
La empresa
• Personalmente, trabajo
como analista
programador para Luz
del Sur S.A.A y Tecsur
S.A.A.
• Es una empresa dedicada
a ofrecer servicios
logísticos y ejecuta obras
de construcción.
• Su principal cliente es
Luz del Sur.
• En almacenes de TECSUR existen diversos
problemas con los datos. Encontramos los
siguientes movimientos :
Entradas ( entradas,reciclaje,devolucuiones)
Salidas ( despachos,pedidos de venta,etc)
Modificaciones
Movimientos dentro de un almacén
Ciclo de vida de un dato
Realizaremos un ejemplo de los despachos
• Creación del dato
• Administración del almacenamiento
• Seguridad basada en roles y uso de datos
• Compartir datos
• Almacenamiento de datos
• Destrucción permanente de datos
Ejemplo : Despacho Masivo
• Creación del dato
En los almacenes se denominado a un despacho
masivo a un agrupador de pedidos al almacén
( ejemplo un pedido de material para una obra).
Luego esos pedidos de materiales se
recepcionan para luego realizar un consolidado.
• Luego se almacena en la base de datos
Informix ( se entiende que en el ambiente de
producción)
• Luego se puede acceder a través de la base de
datos. Existen proyectos para creación de
datawarehouses para el almacén.
Movimientos de materiales del almacén

También podría gustarte