Martínez Flores Saúl Actividad01

U N I V E R S I D A D DE G U A D A L A J A R A
CENTRO UNIVERSITARIO DE CIENCIAS EXACTAS E INGENIERÍA

DEPARTAMENTO DE CIENCIAS COMPUTACIONALES
CLASIFICACIÓN INTELIGENTE DE DATOS
Actividad No. 01
Nombre: Martínez Flores Saúl
Código: 215496568
Clasificación de Datos: Técnica realizada por organizaciones para mantener un control

sobre sus datos, es fundamental dentro de las estrategias de ciberseguridad. Dentro del
contexto de la Ciberseguridad se entiende que consiste en la clasificación de datos,
documentos y archivos basada en el nivel de sensibilidad que tienen para una organización.
Al clasificar estos activos digitales de forma efectiva, es posible proteger mejor la información
confidencial. Normalmente, los datos se clasifican en tres categorías:
- Datos altamente confidenciales: Incluye datos corporativos y de clientes estrictamente

confidenciales que podrían poner a una organización en riesgo financiero, legal o de
Cumplimiento normativo si se filtraran.
- Datos confidenciales internos: contratos con proveedores o clientes, datos de ventas,

documentos de marketing y otras informaciones que podrían representar un riesgo
para las operaciones si se divulgan fuera de la organización.
- Datos públicos: Incluye cualquier información, dato o documento que, si fuera leído
por cualquier miembro del público, no dañaría a la reputación de la organización ni
representaría una amenaza financiera, legal o de otro tipo.
Data mining: Es un conjunto de técnicas y tecnologías que permiten explorar grandes bases
de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones
repetitivos, tendencias o reglas que expliquen el comportamiento de los datos que se han ido
I5912 Clasificación Inteligente de Datos Maestro: Luis Antonio Medellín Serna 2022
recopilando con el tiempo. Estos patrones pueden encontrarse utilizando estadísticas o
algoritmos de búsqueda próximos a la Inteligencia Artificial y a las redes neuronales.
Big Data: La definición de big data son datos que contienen una mayor variedad y que se
presentan en volúmenes crecientes y a mayor velocidad. Esto se conoce también como "las
tres V", Volumen, Velocidad y variedad. Dicho de otro modo, el big data está formado por
conjuntos de datos de mayor tamaño y más complejos, especialmente procedentes de
nuevas fuentes de datos. Estos conjuntos de datos son tan voluminosos que el software de
procesamiento de datos convencional sencillamente no puede gestionarlos. Sin embargo,
estos volúmenes masivos de datos pueden utilizarse para abordar problemas empresariales
que antes no hubiera sido posible solucionar.
Datawarehouse: Un Data Warehouse es un almacén electrónico donde generalmente una

empresa u organización mantiene una gran cantidad de información. Los datos de un data
warehouse deben almacenarse de forma segura, fiable, fácil de recuperar y fácil de
administrar. colección de datos orientada a un tema específico, integrado, variante en el
tiempo y no volátil, que soporta el proceso de toma de decisiones.
Dashboards y Series de Tiempo: Una serie de tiempo es un conjunto de observaciones

sobre los valores que toma una variable (cuantitativa) a través del tiempo. Por tanto, una
serie de tiempo es una forma estructurada de representar datos. Los datos se pueden
comportar de diferentes maneras a través del tiempo: puede que se presente una tendencia,
estacionalidad o simplemente no presenten una forma definida.
Representar los datos del negocio como series de tiempo suele ayudar a las empresas a
visualizar la actividad del negocio. A su vez, usualmente las series de tiempo se utilizan para
predecir el comportamiento futuro de la variable medida. A modo de ejemplo, el siguiente
gráfico presenta la serie de tiempo de las ventas de un producto. A simple vista, se aprecia
una cierta estacionalidad.
Open source business intelligence (OSBI): BI es la gestión y explotación analítica de los
datos de una empresa para ayudar a la toma de decisiones.
Es lo que también se denomina como Inteligencia Empresarial. Para ello se dispone en el

mercado de toda una gran variedad de soluciones, basadas en un conjunto de herramientas.
Para que una solución pueda ser considerada como una solución BI completa, debe incluir,
al menos las siguientes herramientas integradas entre sí:
- ETL (extraer, transformar y cargar)

- Almacén de datos (Data WareHouse, OLAP, Data Marts)
- Gestor del Universo (definición de dimensiones, métricas e indicadores)
- Motor de Reglas de Negocio
- Análisis (Estadísticas, Data Mining, Simulación, Optimización, Procesos)
- Generador de informes
- Cuadro de Mandos (integración de indicadores y alertas)
- Capa de Presentación Web (diseño HTML/CSS/JS, portal de widgets, Web Services,
integración con diferentes visualizadores: navegadores web, CMS, MS Office, Clientes
de email)
-
Ambiente Data Science: Es la combinación de múltiples campos, como las estadísticas, los
métodos científicos, la inteligencia artificial (IA) y el análisis de datos para extraer el valor de
los datos. Los practicantes de la ciencia de datos se llaman científicos de datos y combinan
una variedad de conocimientos para analizar los datos recopilados de la web, teléfonos
inteligentes, clientes, sensores y otras fuentes para obtener información útil.
La ciencia de datos abarca la preparación de los datos para el análisis, incluida la limpieza, la
agregación y la manipulación de los datos para realizar análisis avanzados. Las aplicaciones
analíticas y los científicos de datos pueden revisar los resultados para descubrir patrones y
permitir que los líderes empresariales obtengan información fundamentada.
Contenedores (Dockers): Docker es una plataforma de software que permite crear, probar e
implementar aplicaciones rápidamente. Docker empaqueta software en unidades
estandarizadas llamadas contenedores que incluyen todo lo necesario para que el software
se ejecute, incluidas bibliotecas, herramientas de sistema, código y tiempo de ejecución. Con
Docker, puede implementar y ajustar la escala de aplicaciones rápidamente en cualquier
entorno con la certeza de saber que su código se ejecutará.
La ejecución de Docker en AWS les ofrece a desarrolladores y administradores una manera

muy confiable y económica de crear, enviar y ejecutar aplicaciones distribuidas en cualquier
escala.
Cómputo de Alto Rendimiento (HPC): Se le conoce así a una amplia clase de sistemas
informáticos potentes que abarca desde equipos simples (por ej., 1 CPU con 8 GPU) hasta
supercomputadoras de primer nivel, representa la capacidad de procesar datos y realizar
cálculos complejos a velocidades muy altas. Para ponerlo en perspectiva, un equipo portátil o
de sobremesa con un procesador de 3 GHz puede realizar unos 3.000 millones de cálculos
por segundo. Aunque esto es mucho más rápido de lo que puede lograr cualquier humano,
palidece en comparación con las soluciones HPC que pueden realizar cuadrillones de
cálculos por segundo.
Uno de los tipos de soluciones HPC más conocidos es el superordenador. Un

superordenador contiene miles de nodos de computación que trabajan juntos para completar
una o varias tareas. Esto se denomina procesamiento paralelo. Es similar a tener miles de
equipos conectados en red, combinando la potencia computacional para completar tareas
más rápidamente.
Machine Learning: Es una forma de la IA que permite a un sistema aprender de los datos
en lugar de aprender mediante la programación explícita. Sin embargo, machine learning no
es un proceso sencillo. Conforme el algoritmo ingiere datos de entrenamiento, es posible
producir modelos más precisos basados en datos. Un modelo de machine learning es la
salida de información que se genera cuando entrena su algoritmo de machine learning con
datos. Después del entrenamiento, al proporcionar un modelo con una entrada, se le dará
una salida. Por ejemplo, un algoritmo predictivo creará un modelo predictivo. A continuación,
cuando proporcione el modelo predictivo con datos, recibirá un pronóstico basado en los
datos que entrenaron al modelo.
Virtualización (en SO): La virtualización es una tecnología que permite crear múltiples
entornos simulados o recursos dedicados desde un solo sistema de hardware físico. El
software llamado hipervisor se conecta directamente al hardware y permite dividir un sistema
en entornos separados, distintos y seguros, conocidos como máquinas virtuales (VM). Estas
VM dependen de la capacidad del hipervisor de separar los recursos de la máquina del
hardware y distribuirlos adecuadamente. La virtualización le permite aprovechar al máximo
sus inversiones anteriores.
La máquina física original en que está instalado el hipervisor se llama "host", y las VM que
utilizan estos recursos se llaman "guests". Los guests utilizan los recursos informáticos, como
la CPU, la memoria y el almacenamiento, como un conjunto de medios que pueden
redistribuirse fácilmente. Por su parte, los operadores controlan las instancias virtuales de
estos y otros recursos para que los guests tengan a disposición todos los que necesiten en
cualquier momento.
StoryTelling: El storytelling se ha convertido en una técnica muy potente que muchos

negocios han incluido en su estrategia de marketing. Da igual el tipo de negocio que tengas,
desde una tienda de barrio hasta una multinacional, porque siempre podrás recurrir a una
historia para enganchar a tus potenciales clientes.
En este post veremos en qué consiste el storytelling y cómo puede ayudarte a conectar con
tu audiencia y a aumentar las ventas. Esta técnica de comunicación, que además de barata
es muy sencilla de aplicar, conlleva muchas ventajas a nivel de posicionamiento de marca.
Bibliografía (Formato APA):
Bob Luebbe, Robin Tatam, Tom Huntington (2021, 03 de noviembre). ¿Qué es la Clasificación de
Datos? HelpSystems. https://www.helpsystems.com/es/blog/que-es-la-clasificacion-de-datos
Elena Bello (2021, 20 diciembre) ¿Qué es el minado de Datos o Data Mininig? Técnicas y pasos a seguir.
Innovation & Entrepreneurship Business School. https://www.iebschool.com/blog/data-mining-mineria-datos-
big-data/
Oracle México (s.f) ¿Qué es el Big Data?, Consultado el 17 de enero de 2022, https://www.oracle.com/mx/big-
data/what-is-big-data/
Salesforce latinoamérica (2019, diciembre 10) Data Warehouse, salesforce.com, inc. Disponible en:
https://www.salesforce.com/mx/blog/2019/12/data-mining.html.
Tecnologías información (s.f) Sistemas de información Gerencial, Consultado el 17 de enero de 2022,

https://www.tecnologias-informacion.com/sigerencial.html
Oracle México (s.f) ¿Qué es la ciencia de datos?, Consultado el 17 de enero de 2022,

https://www.oracle.com/mx/data-science/what-is-data-science/
Amazon Web Services (s.f) ¿Qué es Docker?, Consultado el 17 de enero de 2022,

https://aws.amazon.com/es/docker/
NetApp (s.f) ¿Qué es la computación de alto rendimiento?, Consultado el 17 de enero de 2022,

https://www.netapp.com/es/data-storage/high-performance-computing/what-is-hpc/
IBM (s.f) ¿Qué es Machine Learning?, Consultado el 18 de enero de 2022,

https://www.ibm.com/mx-es/analytics/machine-learning
Red Hat (2018, 19 de Marzo) Virtualizacion, ¿Qué es la virtualización?,

https://www.redhat.com/es/topics/virtualization

Martínez Flores Saúl Actividad01

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Martínez Flores Saúl Actividad01

Cargado por

Copyright:

Formatos disponibles

U N I V E R S I D A D DE G U A D A L A J A R A

CENTRO UNIVERSITARIO DE CIENCIAS EXACTAS E INGENIERÍA

CLASIFICACIÓN INTELIGENTE DE DATOS

Clasificación de Datos: Técnica realizada por organizaciones para mantener un control

- Datos altamente confidenciales: Incluye datos corporativos y de clientes estrictamente

- Datos confidenciales internos: contratos con proveedores o clientes, datos de ventas,

Datawarehouse: Un Data Warehouse es un almacén electrónico donde generalmente una

Dashboards y Series de Tiempo: Una serie de tiempo es un conjunto de observaciones

Es lo que también se denomina como Inteligencia Empresarial. Para ello se dispone en el

- ETL (extraer, transformar y cargar)

La ejecución de Docker en AWS les ofrece a desarrolladores y administradores una manera

Uno de los tipos de soluciones HPC más conocidos es el superordenador. Un

StoryTelling: El storytelling se ha convertido en una técnica muy potente que muchos

Tecnologías información (s.f) Sistemas de información Gerencial, Consultado el 17 de enero de 2022,

Oracle México (s.f) ¿Qué es la ciencia de datos?, Consultado el 17 de enero de 2022,

Amazon Web Services (s.f) ¿Qué es Docker?, Consultado el 17 de enero de 2022,

NetApp (s.f) ¿Qué es la computación de alto rendimiento?, Consultado el 17 de enero de 2022,

IBM (s.f) ¿Qué es Machine Learning?, Consultado el 18 de enero de 2022,

Red Hat (2018, 19 de Marzo) Virtualizacion, ¿Qué es la virtualización?,

También podría gustarte