Documentos de Académico
Documentos de Profesional
Documentos de Cultura
de datos y su utilidad en
la inteligencia competitiva
¿Qué es un dato?
Datos son símbolos no aleatorios que representan valores de atributos o sucesos.
Los datos son hechos, acontecimientos y transacciones que se han ido almacenando en un código convenido.
Tipo de formato
Estructurado
Tipo de archivo en que esta
siendo presentado el dato:
JPG, PDF, Exce No estructurado
Etapas del procesamiento
de datos
Minimizar el sesgo
Resultados precisos
Procesamiento eficaz
Información restringida
Costo
Interpretaciones erróneas
Uno de los sftware estadísticos más conocidos, de fácil uso y utilizado usualmente por
principiantes en el análisis estadístico. Permite el análisis de datos mediante estadísitica
SPSS
descriptiva e inferencial.
STATA Es un paquete de software estadístico que permite la gestión de datos, el análisis estadístico,
el trazado de gráficos y las simulaciones.
HERRAMIENTAS A USAR
Existen en uso variados tipos de tecnología o técnicas usadas para el Procesamiento de Datos.
Despliegue y entrenamiento
Al igual que con cualquier nueva tecnología, hay cierto grado de capacitación
involucrada en el manejo de estos sistemas.
Altos costes
Si bien estos sistemas ofrecen una solución de menor costo para la mayoría de
las empresas, que ahorran dinero en mano de obra y hardware cuando
cambian a procesamiento batch, algunas empresas no tienen empleados de
ingreso de datos o hardware costoso para comenzar.
PROCESAMIENTO EN
STREAM
Es una técnica de procesamiento y análisis de datos que
se basa en la implementación de un modelo de flujo de
datos en el que los datos asociados a series de tiempo
(hechos) fluyen continuamente a través de una red de
entidades de transformación que componen el sistema.
Componentes:
Entrada de mensajes en tiempo real
Procesamiento de flujos
Almacén de datos analíticos
Análisis e informes
VENTAJAS
Procesan los datos en tiempo real y en una
latencia mínima para generar informes en
tiempo real.
DESVENTAJAS
No es tan sencillo de poner en práctica
mediante el uso de sistemas de software
comunes.
Tienen un costo mucho mayor a las opciones en
stream.
Procesa datos de forma ininterrumpida.
DESVENTAJAS
Uno de los mayores desafíos del procesamiento de flujo es que es difícil
de implementar a escala. Por ejemplo, necesita un mecanismo
integrado para proporcionar resistencia contra las imperfecciones de
los datos de transmisión, incluidos los datos que faltan y que no
funcionan.
Procesamiento de Almacenamiento de
Ingreso de datos
datos datos
Mapreduce
Flume Hive
HDFS
Comados HDFS Pig
Hbase
Sqoop Cascading
Spark
COMPONENTES BÁSICOS DE UN ENTORNO
BATCH
Trabajo
Un sistema programado que ejecuta un conjunto de tareas hasta su finalización
sin ninguna interacción del usuario, por lo general, para cargas de trabajo de
procesamiento
Tareas
Recursos
RESULTADOS
Creación de una patente que modificó el proceso de
producción del silicio metal, trayendo consigo un
aumento de la demanda de esta tecnología.
TOMA DE DECISIONES-INTELIGENCIA
DEFINICIÓN DE ASPECTOS DE SOPORTE
Se conformó un comité directivo y se concluyó que la
Se identificaron centros tecnológicos para IMPLEMENTACIÓN DEL PROYECTO Y
primera línea a impulsar el fortalecimiento de la
establecimiento de convenios de cooperación MEDICIÓN DE INDICADORES DE
Corporación Eco-eficiente es el del campo de
tecnológica y soporte en el trabajo con la línea de RESULTADOS.
simulación de procesos de conformado de lámina
investigación.
metálica
COMUNICACIÓN DE DECISIONES
Caso : EMPRESA EMBALADORA DE PRODUCTOS
DE VIDRIO
Procesamiento stream- Herramienta Value Stream Mapping
Objetivo principal
Identificar y eliminar aquellas actividades que no agregan valor al proceso y a su
vez mejorar el desempeño del área logística de la compañía disminuyendo la
sensación de un bajo nivel de servicio.
Dibujo del estado actual
Medición de indicadores
APLICACIÓN
DEL Identificación de problemas
VSM
Selección de técnicas
Comparación de
los indicadores
1 2 3
Cambio de Automatización
Información
actores (Perfilado) de procesos
1
Metabuscadores: OBSERVA (Ciencia y Tecnología), Observatorio virtual de
Transferencia tecnológica.
2
Marketplace: HONTZA (Plataforma abierta de vigilancia tecnológica), SOFTVI
(Herramienta de vigilancia tecnológica), VICUBO (Software de VT y VC).
3
Open Analytics: Aborda el desarrollo de tecnologías innovadoras open source, big
data, business intelligence, data mining y open data. Ejem: MediaLab Prado.
5
Base de datos especializadas: LATIPAT y ESP@CENET (Buscadores de patentes), JPO
(Japan Patent Office).
Conclusiones