Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Control de Lectura 02
Ciclo 2022-2
INSTRUCCIONES
Al finalizar el examen el alumno deberá subir al aula virtual el presente archivo conteniendo las
respuestas. Deberá subirse al enlace del cuál se descargó la plantilla.
No copiar ni pegar desde cualquier fuente, hacer su propio análisis.
Las imágenes que se adjuntan deben estar nítidas para su revisión.
Las preguntas se responden en la presente plantilla.
En base a las lecturas proporcionadas en clase, deberá dar respuesta a las siguientes preguntas:
Pregunta 01 (05 puntos)
Explique mediante un ejemplo el proceso de toma de decisiones. Considere las cuatro etapas del proceso:
Inteligencia, Diseño, Elección e Implementación.
Empresa “La Dulcerita”
La minería de datos sirve para descubrir patrones y relaciones ocultas en los datos, los cuales ayudan a
tomar mejores decisiones, y las áreas de aplicación de la Minería de Datos son, el área de Comercio
minorista, ya que ayuda a la asociación de ventas a través de promociones, segmentación de clientes,
análisis del comportamiento del cliente y riesgos, puesto que poseen algoritmos o patrones que predicen
el comportamiento del consumidor. Por ejemplo, un estudio de los patrones de compra cuando un varón
va al supermercado y desea comprar productos de primera necesidad como frutas, verduras o despensa
para el hogar, el 60 % de veces se compran cerveza, pero cuando existe promociones, aumenta al 82%,
ayudadas por el Data Mining que en este caso utiliza su tecnología para detectar que productos son los
más consumidos por los varones al momento de comprar en un supermercado. En segundo lugar,
podemos señalar el área de Marketing y ventas, ya que ayuda a pronosticar las ventas, explorar la base
de datos, mejora la segmentación de clientes y la toma de decisiones de mercadeo. Por ejemplo, si somos
una empresa que se dedica a la venta de zapatillas, se analiza algunos parámetros como gustos y/o
preferencias, edad, género y mediante esta base de datos podríamos predecir quiénes son los que compran
más zapatillas si los varones o las mujeres, y mediante que medio compran si es virtual o en tiendas
físicas. Además, conocer que medio de publicidad, ya sea por internet o por publicidad boca a boca, hizo
que las ventas aumentarán.
La diferencia radica en que los datos estructurados, son modelos predefinidos o provienen de un registro,
se utilizan cuando el volumen no crece abruptamente o se puede asumir con un solo servidor, por lo que
se trabaja con textos organizados de tal manera que su búsqueda es más fácil. Su información se
encuentra en tablas, columnas, filas y campos fijos en Bases de datos relacionales y su lenguaje estándar
es conocido como SQL, lenguaje de consultas a un gestor de base de datos relacionales como MySQL,
Oracle. Por ejemplo, los datos estructurados en una cafetería como Starbucks incluyen nombres de
trabajadores, direcciones, DNI, productos entre otros, por ende, al seleccionar a los meseros de la
cafetería se ejecutará esta acción. Es por ello, que las empresas están interesadas en este sistema, ya que
ayuda a una mejor gestión de datos asociados a los productos, trabajadores y la misma empresa. En
cambio, los datos no estructurados no cuentan con formatos o una organización predefinida lo que hace
difícil su búsqueda y procesamiento. El volumen de datos crece rápidamente en momentos puntuales y las
necesidades no se pueden preveer. Es una colección de datos que se parecen entre sí pero que no son
iguales. Su información se almacena de diferente manera en columnas, documentos, gráficos, valor-clave
o variables en Base de datos no relacionales (NoSQL) . Se utiliza JSON (JavaScript Object Notation)
como lenguaje para estructurar el almacenamiento de las bases de datos no relacionadas. Otra diferencia
es que no hay redundancia es mucho más liviana y veloz como Mongo DB, Redis, la cual es una base de
datos donde solo se cuenta con nombres y un indicador único para guardar una variable específica. Por
ejemplo, en un restaurant los meseros se pueden identificar con un nombre, algunos con su fecha de
nacimiento, turno, sexo, años de experiencia y otros atributos nuevos.
Los siguientes son archivos de ejemplo de los dos sistemas que proveerían la información para el almacén
de datos:
a. ¿Qué problemas de negocios se crean al no tener estos datos en un solo formato estándar? (2 puntos)
Según las tablas propuestas los problemas de negocio es que generará datos duplicados lo cual
perjudicaría a la toma de decisiones de la empresa. Asimismo, al momento de realizar las consultas va
a mostrar otros resultados que no se desean obtener e incluso se podría ejecutar la búsqueda de forma
lenta provocando problemas técnicos de mantenimiento. Otro problema es la generación de 2 tablas
de BD relacionadas, lo cual provoca una confusión en la información de las ventas, además no brinda
al usuario los datos que se requieren, puesto que no comparten algún elemento de datos en común. Es
importante, optimizar la base de datos para eliminar la redundancia.
b. ¿Qué tan fácil sería crear una base de datos con un solo formato estándar que pudiera almacenar los
datos de ambos sistemas? Identifique los problemas con los que habría que lidiar. (2 puntos)
No sería fácil crear una Base de datos con un solo formato estándar, ya que se tendría que unir las 2
bases de datos, lo cual podría generar duplicados al tener nombres parecidos, esto aumentará mucho
nuestra información por lo que se requerirá de una solución inmediata. Por ejemplo, se tendrá que arreglar
manualmente los campos duplicados y organizar nuevamente los registros de la mejor manera.
Asimismo, es más laborioso, ya que por seguridad y protección de datos se tendría que generar una
copia de respaldo para no perder nuestra información.
c. Diseñe las tablas que usted implementaría según su respuesta de la pregunta b. (2 puntos)
Se realizará la tarea manualmente de juntar las tablas y eliminar datos innecesarios o repetidos, lo cual
hace más laborioso el trabajo.