Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Martínez Flores Saúl Actividad01
Martínez Flores Saúl Actividad01
Actividad No. 01
Nombre: Martínez Flores Saúl
Código: 215496568
- Datos públicos: Incluye cualquier información, dato o documento que, si fuera leído
por cualquier miembro del público, no dañaría a la reputación de la organización ni
representaría una amenaza financiera, legal o de otro tipo.
Data mining: Es un conjunto de técnicas y tecnologías que permiten explorar grandes bases
de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones
repetitivos, tendencias o reglas que expliquen el comportamiento de los datos que se han ido
I5912 Clasificación Inteligente de Datos Maestro: Luis Antonio Medellín Serna 2022
recopilando con el tiempo. Estos patrones pueden encontrarse utilizando estadísticas o
algoritmos de búsqueda próximos a la Inteligencia Artificial y a las redes neuronales.
Big Data: La definición de big data son datos que contienen una mayor variedad y que se
presentan en volúmenes crecientes y a mayor velocidad. Esto se conoce también como "las
tres V", Volumen, Velocidad y variedad. Dicho de otro modo, el big data está formado por
conjuntos de datos de mayor tamaño y más complejos, especialmente procedentes de
nuevas fuentes de datos. Estos conjuntos de datos son tan voluminosos que el software de
procesamiento de datos convencional sencillamente no puede gestionarlos. Sin embargo,
estos volúmenes masivos de datos pueden utilizarse para abordar problemas empresariales
que antes no hubiera sido posible solucionar.
Representar los datos del negocio como series de tiempo suele ayudar a las empresas a
visualizar la actividad del negocio. A su vez, usualmente las series de tiempo se utilizan para
predecir el comportamiento futuro de la variable medida. A modo de ejemplo, el siguiente
gráfico presenta la serie de tiempo de las ventas de un producto. A simple vista, se aprecia
una cierta estacionalidad.
I5912 Clasificación Inteligente de Datos Maestro: Luis Antonio Medellín Serna 2022
Open source business intelligence (OSBI): BI es la gestión y explotación analítica de los
datos de una empresa para ayudar a la toma de decisiones.
Ambiente Data Science: Es la combinación de múltiples campos, como las estadísticas, los
métodos científicos, la inteligencia artificial (IA) y el análisis de datos para extraer el valor de
los datos. Los practicantes de la ciencia de datos se llaman científicos de datos y combinan
una variedad de conocimientos para analizar los datos recopilados de la web, teléfonos
inteligentes, clientes, sensores y otras fuentes para obtener información útil.
La ciencia de datos abarca la preparación de los datos para el análisis, incluida la limpieza, la
agregación y la manipulación de los datos para realizar análisis avanzados. Las aplicaciones
analíticas y los científicos de datos pueden revisar los resultados para descubrir patrones y
permitir que los líderes empresariales obtengan información fundamentada.
Contenedores (Dockers): Docker es una plataforma de software que permite crear, probar e
implementar aplicaciones rápidamente. Docker empaqueta software en unidades
estandarizadas llamadas contenedores que incluyen todo lo necesario para que el software
I5912 Clasificación Inteligente de Datos Maestro: Luis Antonio Medellín Serna 2022
se ejecute, incluidas bibliotecas, herramientas de sistema, código y tiempo de ejecución. Con
Docker, puede implementar y ajustar la escala de aplicaciones rápidamente en cualquier
entorno con la certeza de saber que su código se ejecutará.
Cómputo de Alto Rendimiento (HPC): Se le conoce así a una amplia clase de sistemas
informáticos potentes que abarca desde equipos simples (por ej., 1 CPU con 8 GPU) hasta
supercomputadoras de primer nivel, representa la capacidad de procesar datos y realizar
cálculos complejos a velocidades muy altas. Para ponerlo en perspectiva, un equipo portátil o
de sobremesa con un procesador de 3 GHz puede realizar unos 3.000 millones de cálculos
por segundo. Aunque esto es mucho más rápido de lo que puede lograr cualquier humano,
palidece en comparación con las soluciones HPC que pueden realizar cuadrillones de
cálculos por segundo.
Machine Learning: Es una forma de la IA que permite a un sistema aprender de los datos
en lugar de aprender mediante la programación explícita. Sin embargo, machine learning no
es un proceso sencillo. Conforme el algoritmo ingiere datos de entrenamiento, es posible
producir modelos más precisos basados en datos. Un modelo de machine learning es la
salida de información que se genera cuando entrena su algoritmo de machine learning con
datos. Después del entrenamiento, al proporcionar un modelo con una entrada, se le dará
una salida. Por ejemplo, un algoritmo predictivo creará un modelo predictivo. A continuación,
cuando proporcione el modelo predictivo con datos, recibirá un pronóstico basado en los
datos que entrenaron al modelo.
I5912 Clasificación Inteligente de Datos Maestro: Luis Antonio Medellín Serna 2022
Virtualización (en SO): La virtualización es una tecnología que permite crear múltiples
entornos simulados o recursos dedicados desde un solo sistema de hardware físico. El
software llamado hipervisor se conecta directamente al hardware y permite dividir un sistema
en entornos separados, distintos y seguros, conocidos como máquinas virtuales (VM). Estas
VM dependen de la capacidad del hipervisor de separar los recursos de la máquina del
hardware y distribuirlos adecuadamente. La virtualización le permite aprovechar al máximo
sus inversiones anteriores.
La máquina física original en que está instalado el hipervisor se llama "host", y las VM que
utilizan estos recursos se llaman "guests". Los guests utilizan los recursos informáticos, como
la CPU, la memoria y el almacenamiento, como un conjunto de medios que pueden
redistribuirse fácilmente. Por su parte, los operadores controlan las instancias virtuales de
estos y otros recursos para que los guests tengan a disposición todos los que necesiten en
cualquier momento.
En este post veremos en qué consiste el storytelling y cómo puede ayudarte a conectar con
tu audiencia y a aumentar las ventas. Esta técnica de comunicación, que además de barata
es muy sencilla de aplicar, conlleva muchas ventajas a nivel de posicionamiento de marca.
I5912 Clasificación Inteligente de Datos Maestro: Luis Antonio Medellín Serna 2022
Bibliografía (Formato APA):
Bob Luebbe, Robin Tatam, Tom Huntington (2021, 03 de noviembre). ¿Qué es la Clasificación de
Datos? HelpSystems. https://www.helpsystems.com/es/blog/que-es-la-clasificacion-de-datos
Elena Bello (2021, 20 diciembre) ¿Qué es el minado de Datos o Data Mininig? Técnicas y pasos a seguir.
Innovation & Entrepreneurship Business School. https://www.iebschool.com/blog/data-mining-mineria-datos-
big-data/
Oracle México (s.f) ¿Qué es el Big Data?, Consultado el 17 de enero de 2022, https://www.oracle.com/mx/big-
data/what-is-big-data/
Salesforce latinoamérica (2019, diciembre 10) Data Warehouse, salesforce.com, inc. Disponible en:
https://www.salesforce.com/mx/blog/2019/12/data-mining.html.
I5912 Clasificación Inteligente de Datos Maestro: Luis Antonio Medellín Serna 2022