Está en la página 1de 1

Ciencia de Datos BIG DATA Y CIENCIA DE DATOS Comparación con DW/BI tradicional

Llamada "Estadística Aplicada", ahora fusiona


análisis estadístico, minería de datos y Es la colección (Big Data) y Análisis (Ciencia de los Datos, Analítica y DW/BI Ciencia de Datos
aprendizaje de máquina, junto con Visualización) de muchos tipos de datos diferentes para encontrar respuestas o
Descriptivo Predictivo Prescriptivo
capacidades de modelamiento e integración ideas para preguntas que no son conocidas al comienzo del análisis).
de datos, para producir modelos predictivos Retrospectiva Visión Previsión
que exploran patrones de contenidos de datos.
Depende de: Descubrir relaciones entre los datos y el negocio. Basado en la Basado en Basado en
historia Modelos escenarios
Fuentes de datos enriquecidos Soportar la integración iterativa de fuentes de datos dentro de la empresa.
¿Qué sucedió? Predictivos ¿Qué deberíamos
Alineación y Análisis de Información ¿Por qué ¿Qué es probable hacer para que
Descubrir y analizar nuevos factores que podrían afectar a la empresa.

METAS
Entrega de Información sucedió? que suceda? suceda algo?
Presentación de resultados e Publicar datos, usando técnicas de visualización de manera apropiada,
información de los datos. confiable y ética.

No se han formado completado, pero hay un aspecto claro: Las organizaciones Fuentes de Almacenamiento de Datos

PRINCIPIOS
deberán gestionar cuidadosamente los Metadatos relacionados con las fuentes de
Big Data para tener un inventario exacto delos archivos de datos, sus orígenes y su
1. Definir Internet de las Cosas
estrategia y valor.
sitios sociales sensores / escáneres
necesidades La gestión de Big Data requerirá más disciplina que la gestión de datos
EB audio / video
relacionales. Solo entonces proporcionará un tipo diferente de conocimiento.
Web 2.0 archivos log
2. Escoger

Volumen
fuentes de Aprendizaje de Máquina PB Móvil Marketing
7. Desplegar y Blogs / wikis
datos
monitorear E-commerce
Explora la construcción y el estudio de algoritmos de aprendizaje, buscando programar
Bodegas de datos GPS
máquinas que aprendan rápidamente de las consultas y se adapten a los cambios de TB empresariales Colaboración
conjuntos de datos. Se clasifican en: Bodegas de imágenes y
Proceso de Publicidad
texto
Ciencia de Negocio
Aprendizaje supervisado: Basado en reglas generalizadas (Ejm: Separar correo GB
6. Explorar
Datos 3. Adquirir e
ingerir electrónico SPAM del correo NO-SPAM) Velocidad Variedad Veracidad
datos usando
fuentes de Aprendizaje No Supervisado: Basado en la identificación de patrones ocultos
modelos
datos
(Minería de Datos).
Aprendizaje de Reforzamiento: Basado en el logro de una meta (Ejm: Vencer a un Data Lake
oponente en ajedrez).
4. Desarrollar Es un entorno donde una gran cantidad de datos de
5. Integrar - métodos e varios tipos y estructuras pueden ser ingeridos,
alinear datos hipótesis de Aprendizaje de Sentimientos almacenados, evaluados y analizados.
para análisis ciencia de
datos Explora el análisis semántico a través de NLP (lenguaje de procesamiento natural) o a Se puede implementar usando Hadoop y otros sistemas
través del análisis de frases u oraciones para la detección de sentimiento y predicción de de almacenamiento de datos, servicios de cluster,
posibles escenarios (Ejm: Watson de IBM). transformación e integración de datos.
Sus propósitos son:
BIG DATA Técnicas de Minería de Datos Un entorno para que los cientificos de datos realicen
Conjuntos de datos tan grandes y complejos que Perfilamiento (caracterización del comportamiento típico de un individuo, grupo o mineria y análisis de datos.
precisan de aplicaciones informáticas no población), Reducción de Datos (Sustitución de un conjunto grande de datos por otro Un área de almacenamiento central de datos en bruto,
tradicionales de procesamiento de datos para más pequeño y representativo), Asociación (Proceso de aprendizaje no supervisado que con minima transformación.
tratarlos adecuadamente. encuentra relaciones entre elementos que participan en una transacción), Agrupamiento Almacenamiento alternativo para los datos históricos
Las 7 V's del Big Data: (segmentación de elementos con características comunes), Mapas auto-organizados de un Data Warehouse.
(método de red neuronal de análisis de agrupamiento o cluster que busca reducir la
Volumen (cantidad de datos) Un archivo en linea para registros.
dimensionalidad sin perder la naturaleza del elemento).
Velocidad (rapidez en la captura, generación Un entorno para ingerir datos en streaming con
o compartición de datos) identificación de patrones automatizados.
Motivadores de Negocio
Variedad / Variabilidad (Formas en que los
datos son capturados o entregados). Deseo de encontrar oportunidades de negocio y actuar sobre ellas para
estimular la innovación, definir modelos predictivos que anticipen las Arquitectura Basada en Servicios
Viscosidad (Dificultad de integración y uso de
los datos). necesidades del cliente habilitando presentación personalizada de productos y
Volatilidad (Frecuencia de cambio en los servicios, mejorar - automatizar las operaciones complejas reduciendo costos y Capa de Velocidad
riesgos; procesando para ello grandes cantidades de datos generados por una Tiempo real, sin historia
datos y su consecuente utilidad.
gama diversificada de procesos.
Veracidad (grado de confiabilidad de los Datos Capa de Servicio
fuente Vista combinada
datos)
ACTIVIDADES:
Capa de Lote
Historia totalmente
I. DEFINIR ESTRATEGIA DE BIG DATA Y NECESIDADES DEL NEGOCIO procesada

II. ESCOGER FUENTES DE DATOS

III. ADQUIRIR E INGERIR FUENTES DE DATOS


ENTRADAS: SALIDAS:
IV. DESARROLLAR HIPÓTESIS Y MÉTODOS
Estrategia de Negocio y Metas Estrategia de Big Data y Estándares.
Árbol de Decisiones (Construir - Comprar - V. INTEGRAR / ALINEAR DATOS PARA ANÁLISIS Plan de Abastecimiento de Datos.
Fuentes de Datos Adquiridas.
Rentar) VI. EXPLORAR MODELOS DE USO DE DATOS
Análisis Inicial de Datos e Hipótesis.
Estándares de TI.
VI. DESPLEGAR Y MONITOREAR Visión de Datos y Recomendaciones.
Fuentes de Datos. Plan de Mejora.

PARTICIPANTES:
PROVEEDORES: Arquitectos de Plataforma de Big Data, Arquitectos de Ingesta de Datos,
Expertos en la Materia de Datos, Científicos de Datos, Líder de Diseño Analítico, CONSUMIDORES:
Arquitectos de Plataforma de Big Data,
Científicos de Datos, Productores de Datos, Gerentes de Gestión de Datos, Especialistas de Metadatos. Socios del Negocio, Ejecutivos de Negocio,
Proveedores de Datos, Consumidores de Ejecutivos de TI
Información Motivadores Técnicos

HERRAMIENTAS
MÉTRICAS
TÉCNICAS Soluciones basadas en archivos distribuidos, Compresión de
Métricas de Uso de Datos
columna, Arquitectura no Compartida MPP (procesamiento
Mashups de Datos, Técnicas de Aprendizaje de Máquina, Métricas de Repuesto y Ejecución
masivo paralelo), Computación y Base de Datos en Memoria,
Aprendizaje Supervisado Avanzado. Métricas de Carga y Escaneo de Datos
Algoritmos en Base de Datos, Conjunto de herramientas de
Aprendizaje e Historias
Visualización de Datos.

UNIVERSIDAD PRIVADA CÉSAR VALLEJO - SEDE LOS OLIVOS (LIMA)


MAESTRIA EN INGENIERIA DE SISTEMAS CON MENCION EN TECNOLOGIAS DE INFORMACIÓN 2021-II

CURSO: BUSSINESS INTELLIGENCE GRUPO N° 04 - INTEGRANTES:


DOCENTE: DR. PEDRO MARTÍN LEZAMA GONZÁLES
ESPINOZA BERAMENDI, JUAN ROYER Noviembre de 2021
MUSAYÓN VELÁSQUEZ, OSCAR
OTÁROLA SÁNCHEZ RONALD EDUARDO
TRABAJO FORO 6
PANDAL BLAS, CARLOS ENRIQUE

También podría gustarte