Evaluación - Technical Leader Datos

Evaluación – Líder Técnico
Conocimientos generales de BI:

1. Explicar brevemente la diferencia de enfoque utilizadas por Ralph Kimball y Bill Inmon para
construir un DW.
2. Explicar brevemente la diferencia entre un Modelo Estrella y un Modelo Copo de Nieve.
3. Explicar la funcionalidad y beneficios/contras de utilizar tablas agregadas.
4. ¿Qué es un datalake? ¿Qué beneficios le puede traer a una compañía?
5. Beneficios de utilizar soluciones Cloud para el tratamiento de grandes volúmenes de datos
Análisis de Requerimiento Funcional 1:

Suponiendo que se debe construir un nuevo proceso de carga (sin importar la herramienta) cuya fuente de
datos es un archivo CSV que se extrae del sistema transaccional.
El archivo fuente siempre trae la totalidad de los datos utilizados para la Dimensión “Clientes” dado que no
es posible detectar novedades en el sistema fuente (no se registra por fecha los cambios realizados).
Teniendo en cuenta esta situación, se solicita definir la(s) tabla(s) de destino y la mejor estrategia del
proceso de ETL teniendo en cuenta lo siguiente:
 El archivo tiene 20 millones de registros y creciendo dia a dia en unos 20 mil registros.
 El archivo posee 10 campos, entre ellos los siguientes:
o ID_CLIENTE.
o Nombre.
o Apellido.
o Teléfono.
o Dirección.
o Cantidad de Hijos.
o Fecha de Nacimiento.
o Edad.
o Sexo.
o Cantidad de Puntos Acumulados.
 Se requiere almacenar todos los cambios que se produzcan en un cliente (de cualquiera de sus
campos).
 Pueden existir clientes que dejen de informarse en el archivo fuente, esto implica la baja del cliente
en el sistema fuente.
Nota: No es necesario escribir código, sino dibujar el modelo y explicar el paso a paso de la estrategia de ETL
seleccionada.
Nota: No existen restricciones a la hora de definir la(s) tablas(s) de destino. De acuerdo con su experiencia
seleccionar la mejor solución de modelado de datos.
Análisis de Requerimiento Funcional 2:
Suponiendo que el Director Comercial de la compañía requiere saber el Revenue (ganancia) de la empresa
para todos los países del mes de Enero 2024, explicar los pasos que realizaría para relevar y obtener la
información teniendo en cuenta las siguientes reglas de negocio:
 El negocio tiene 2 formas de comercialización:

o Suscripción Mensual.
o Rentas por 24 horas.
 La información se almacena en moneda local de cada uno de los 10 países donde la empresa tiene
operación.
 Se requiere obtener un resultado de cada país por separado y un consolidado general de la
compañía.
 Pueden existir suscripciones y/o rentas bonificadas (precio = 0).
 No se cuenta con tasas de conversión a USD en el DW, aunque existen en las áreas contables de la
compañía.
Adicionalmente sugerir un prototipo de un reporte para presentar la información de la mejor manera posible
a los usuarios finales.
Estrategias de ETL:
1. Suponiendo que tenemos un proceso de carga de Transacciones que deben cumplir con las
siguientes reglas:
a. Cliente existente en el maestro de clientes.
b. Producto existente en el maestro de productos.
c. Fecha válida asociada a la transacción.
d. Monto superior a 0.
Se detecta que existen casos que no cumplen con las reglas funcionales definidas (puede ser 1 o n de
ellas).
¿Cuál sería su solución para tratar estos casos? Explicar con el mayor detalle posible.
LÓGICA DE PROGRAMACIÓN
Genera el pseudocodigo para realizar un pastel de vainilla con decoración de cubierta de chocolate y fresas
encima.
puntos extra (diagrama de flujo)

Python:
1) PROGRAMACIÓN PYTHON
A. Descarga csv de cualquier año de Sistema de Captación de Lluvia

https://datos.cdmx.gob.mx/dataset/scall
Consume y carga el csv descargado con python de preferencia usa lib pandas.
B. Grafica los datos obtenidos con python Matplotlib.
C. Analiza y explica el gráfico resultante observando el comportamiento de los datos.
Nota: Tomar en cuenta que se puede utilizar otra librería o incluso plantear otra forma de analizar estos datos.
Análisis de Performance Reportes:

Se detecta que un reporte de transacciones cada vez ejecuta de forma más lenta. Al inicio del DW el mismo
ejecutaba en 1 minuto y en las últimas ejecuciones se ve una demora de hasta 20 minutos para consultar la
información del día anterior.
Es importante mencionar que el reporte es sencillo, solo obtiene los siguientes campos agrupando por los
mismos:
 Hora de la transacción (de 0 a 23)

 Producto de la transacción.
 Cantidad de Transacciones.
 Revenue generado por las transacciones.
Se requiere explicar de acuerdo a su experiencia previa el paso a paso que realizaría para comenzar el
análisis de este caso y las posibles sugerencias a realizar para mejorar la performance del reporte.
Análisis de Performance API:

Se detecta que una API de servicios de BackEnd de disponibilidad de Contenidos de Video cada vez ejecuta
de forma más lenta. Al inicio del proyecto ejecutaba en 1 milisegundo y en las últimas ejecuciones se ve una
demora de hasta 10 milisegundos para consultar el índice asociado al buscador de contenidos.
Se requiere explicar de acuerdo con su experiencia previa el paso a paso que realizaría para comenzar el
análisis de este caso y las posibles sugerencias a realizar para mejorar la performance de la API.
Preguntas Extra Deseables:
1. Explique de manera detallada que es el descenso de gradiente y para se utiliza el escalado de
características y la normalización media; y finalmente cual es la diferencia con el descenso de
gradiente estocástico.
2. ¿Por qué k-means es definido como un problema de complejidad computacional alta y de qué
manera atacaría esta problemática para una correcta implementación de un modelo de
agrupamiento? (entiéndase que el estudio es sobre una población de datos arriba de los millones de
registros y más de 10 variables).
3. Explicar brevemente la definición de Inteligencia Artificial y fundamentar su opinión y posibilidades

de aplicación actuales y a futuro de esta.
4. Explicar brevemente la diferencia entre la definición de Strong AI y Weak AI.
5. Explicar las diferencias encontradas en base a su experiencia entre Machine Learning, Deep
Learning e Inteligencia Artificial.
6. Explicar qué es una ANN. ¿Cuál es su definición? ¿Cómo se conocen sus diferentes capas?
7. En base a su experiencia, ¿Cómo se relaciona la Teoría de Juegos con la Inteligencia Artificial?
8. En base a su experiencia, ¿Cómo se puede aprovechar la Inteligencia Artificial para estrategias de

Marketing?

Evaluación - Technical Leader Datos

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Evaluación - Technical Leader Datos

Cargado por

Copyright:

Formatos disponibles

Evaluación – Líder Técnico

Conocimientos generales de BI:

2. Explicar brevemente la diferencia entre un Modelo Estrella y un Modelo Copo de Nieve.

3. Explicar la funcionalidad y beneficios/contras de utilizar tablas agregadas.

4. ¿Qué es un datalake? ¿Qué beneficios le puede traer a una compañía?

5. Beneficios de utilizar soluciones Cloud para el tratamiento de grandes volúmenes de datos

Análisis de Requerimiento Funcional 1:

 El negocio tiene 2 formas de comercialización:

puntos extra (diagrama de flujo)

A. Descarga csv de cualquier año de Sistema de Captación de Lluvia

B. Grafica los datos obtenidos con python Matplotlib.

C. Analiza y explica el gráfico resultante observando el comportamiento de los datos.

Análisis de Performance Reportes:

 Hora de la transacción (de 0 a 23)

Análisis de Performance API:

3. Explicar brevemente la definición de Inteligencia Artificial y fundamentar su opinión y posibilidades

4. Explicar brevemente la diferencia entre la definición de Strong AI y Weak AI.

7. En base a su experiencia, ¿Cómo se relaciona la Teoría de Juegos con la Inteligencia Artificial?

8. En base a su experiencia, ¿Cómo se puede aprovechar la Inteligencia Artificial para estrategias de

También podría gustarte