Actividad 2

UNIVERSIDAD
UNT NACIONAL DE
TRUJILLO
“AÑO DE LA UNIDAD, LA PAZ Y EL DESARROLLO”

________________________________________________
FACULTAD DE INGENIERÍA
ESCUELA DE INGENIERÌA DE MINAS
TRABAJO:
ACTIVIDADES DE APLICACIÓN W1
CURSO:
EXCEL, ACCESS/MSPROJECT
DOCENTE:
GONZALES TORRES JORGE OMAR
ALUNMNO:
MURGA GUEVARA BRYAN KEVIN
TRUJILLO – PERÚ
2023
1. Buscar en internet productos, aplicaciones proyectos, que utilicen inteligencia
artificial aplicada a minería y geología. ¿Qué es lo que más te gusta de estos
proyectos? ¿Cómo es que utilizan AI para funcionar?
A. Modelado de yacimientos
B. Monitoreo y seguridad
C. Automatización de equipos y maquinaria
 Modelado geológico: Los algoritmos de aprendizaje automático pueden generar
modelos tridimensionales detallados de la estructura geológica de un yacimiento,
lo que ayuda en la planificación y operación de minas.
 Predicción de leyes minerales: Utilizando datos históricos y técnicas de IA, se
pueden predecir las concentraciones de minerales en un yacimiento, lo que
optimiza la extracción y reduce los costos.
 Detección de cambios geológicos: Utilizando análisis de imágenes y datos de
sensores, la IA puede detectar cambios sutiles en la superficie terrestre, lo que
ayuda a prevenir deslizamientos y derrumbes.
 Gestión de riesgos: Los sistemas de IA pueden predecir eventos geológicos
peligrosos y emitir alertas tempranas para garantizar la seguridad de los
trabajadores.
 Vehículos autónomos en minas: Camiones y maquinaria autónoma equipada con
IA pueden transportar minerales y realizar tareas sin intervención humana,
mejorando la eficiencia y la seguridad.
2. Buscar en internet productos, aplicaciones proyectos, que utilicen Big Data

aplicada a minería y geología. ¿Qué es lo que más te gusta de estos proyectos?
¿Cómo es que utilizan Big Data para funcionar?
A. Modelado y simulación
B. Predicción de riesgos geológicos
C. Proyectos específicos
 Simulación de yacimientos: Los modelos de Big Data ayudan a simular el
comportamiento de un yacimiento en diferentes escenarios, lo que permite una
mejor planificación y toma de decisiones.
 Modelos de flujo de aguas subterráneas: Utiliza datos hidrológicos y geológicos
para predecir el flujo de agua en yacimientos subterráneos, lo que es crucial para
la seguridad y la operación.
 Predicción de deslizamientos y sismos: Los datos geológicos históricos y en
tiempo real se utilizan para predecir eventos geológicos peligrosos, lo que
permite tomar medidas preventivas.
 Proyecto MineSense: Emplea análisis de Big Data para optimizar la selección de
mineral en tiempo real durante el proceso de excavación.
3. ¿Qué relación existe entre Big Data y Data Science?
El Big Data se refiere al manejo y análisis de grandes volúmenes de datos, mientras que
la Ciencia de Datos se enfoca en extraer conocimientos y patrones significativos de los
datos, utilizando técnicas estadísticas y de análisis avanzadas.
4. ¿Cuál es la primera etapa en la jerarquía de necesidades de Data Science?
La primera etapa en la jerarquía de necesidades de Data Science es la "Recopilación y
Almacenamiento de Datos".
5. ¿Qué implica aprender Data Science?
Implica adquirir habilidades en programación, estadísticas, manipulación de datos y uso
de herramientas como lenguajes de programación (como Python o R), bibliotecas de
análisis de datos, bases de datos y técnicas de visualización. También implica
comprender modelos de machine learning y técnicas de análisis predictivo para tomar
decisiones basadas en datos.
6. ¿Cuál es la relación entre la inteligencia artificial y la ciencia de datos?
La Ciencia de Datos utiliza técnicas estadísticas para extraer conocimiento y patrones de
datos, mientras que la Inteligencia Artificial emplea algoritmos para permitir que las
máquinas aprendan y realicen tareas humanas. Ambas se entrelazan en la creación de
modelos y soluciones más avanzadas.
7. ¿Cualquier organización puede empezar a implementar machine learning en
cualquier momento?
Sí, cualquier organización puede implementar el aprendizaje automático, pero se
necesita planificación. Se deben evaluar necesidades, adquirir datos relevantes y tener
habilidades técnicas. Comenzar con proyectos pequeños y capacitación adecuada es
crucial para una implementación exitosa.
8. ¿A qué se refiere el término Big Data?
Se refiere a conjuntos de datos extremadamente grandes y complejos que exceden la
capacidad de las herramientas tradicionales para gestionar, procesar y analizar. Implica
datos de múltiples fuentes, incluyendo estructurados y no estructurados, que requieren
tecnologías y enfoques especializados para obtener información significativa.
9. ¿Cuál es la razón para no querer aprender Data Science?
La complejidad técnica, la falta de interés en análisis de datos, la preferencia por otros
campos o la falta de tiempo para dedicarse al aprendizaje.
10. ¿Cuál es el rango de salarios para los profesionales junior en Latinoamérica?
Varían según el país, la ciudad, la empresa y la demanda que haya en el mercado
empresarial. Sin embargo, en general, los salarios para profesionales junior en esta área
pueden oscilar entre $15,000 a $30,000 dólares anuales.
11. ¿Cuál es el contexto actual del mundo de la ciencia de datos e inteligencia
artificial?
La inteligencia artificial actualmente puede lograr diferentes tareas como
reconocimiento de patrones, toma de decisiones y resolución de problemas. A pesar de
los pronósticos negativos, se predice que esta industria será responsable de crear el 9 %
de todos los empleos nuevos para 2025.
En cuanto al mercado, más del 40 % de los consumidores cree que la inteligencia
artificial mejora sus vidas de alguna manera. Ante esta buena percepción y acogida, se
espera que su valor aumente a los 190 millones USD para 2025. Hoy en día más del 35
% de las empresas utiliza inteligencia artificial y un 85 % de ellas la consideran una
inversión prioritaria en su estrategia comercial
12. ¿Cuál es el factor clave para definir el proceso en un proyecto de ciencia de

datos?
Es la formulación clara de los objetivos y preguntas del proyecto. Establecer metas
específicas y comprender qué información se busca extraer de los datos guía la
selección de métodos, herramientas y pasos a seguir en todas las etapas, desde la
recopilación hasta el análisis y la toma de decisiones.
13. ¿Cuál es la principal rama de la inteligencia artificial utilizada en la ciencia
de datos?
El aprendizaje automático (machine learning) es la principal rama de la inteligencia
artificial utilizada en la Ciencia de Datos. Se centra en desarrollar algoritmos y modelos
que permiten a las computadoras aprender de los datos y mejorar su rendimiento en
tareas específicas sin ser programadas de manera explícita.
14. ¿Qué es la inteligencia artificial?
Se refiere a la simulación de procesos de inteligencia humana por parte de máquinas y
sistemas computacionales. Estos sistemas pueden realizar tareas que normalmente
requieren inteligencia humana, como el aprendizaje, el razonamiento, la resolución de
problemas, la percepción y el procesamiento del lenguaje natural.
15. ¿Cuál es una razón para aprender Data Science?
Es el enorme valor que aporta en la toma de decisiones basadas en datos. Con estas
habilidades, puedes analizar información compleja y tomar decisiones informadas en
campos diversos, desde negocios y ciencia hasta salud y tecnología. El Data Science
también ofrece oportunidades de carrera en auge y la capacidad de resolver problemas
complejos.
16. ¿Qué áreas del conocimiento son importantes en la ciencia de datos?
 Programación y Análisis de Datos: Habilidades en lenguajes como Python o R
para manipular y analizar datos.
 Estadísticas: Comprender conceptos estadísticos para tomar decisiones basadas
en datos y validar resultados.
 Aprendizaje Automático: Conocimiento en algoritmos de ML para construir
modelos predictivos y clasificadores.
 Bases de Datos: Familiaridad con sistemas de gestión de bases de datos para
almacenar y recuperar datos eficientemente.
 Visualización de Datos: Capacidad para representar datos de manera visual y
comunicar resultados de manera efectiva.
 Dominio del Problema: Comprender el contexto y las necesidades del
problema para aplicar las técnicas adecuadas.
 Matemáticas: Fundamentos matemáticos como álgebra lineal y cálculo que
sustentan algoritmos y modelos.
 Comunicación: Habilidad para presentar resultados y explicar hallazgos
técnicos de manera comprensible para diversos públicos.
 Ética y Privacidad: Conciencia sobre las implicaciones éticas y la privacidad
en la manipulación y el análisis de datos.
17. ¿Es siempre necesario trabajar con Big Data para abordar proyectos de
análisis de datos?
No, no siempre es necesario. Muchos proyectos de análisis de datos se pueden abordar
eficazmente con conjuntos de datos de tamaño moderado o pequeño.
18. ¿Cuáles son algunos roles clave en la industria de Data Science e Inteligencia
Artificial?
 Data Scientist: Analiza datos y crea modelos para obtener información valiosa.
 Machine Learning Engineer: Diseña, implementa y ajusta modelos de Machine
Learning.
 Data Engineer: Prepara y gestiona datos para su análisis.
19. ¿Qué oportunidades laborales ofrece la industria de Data Science e
Inteligencia artificial en el sector Minero y Geológico?
 Optimización de Procesos: Utilizar datos para mejorar la eficiencia en la
extracción y procesamiento de minerales.
 Predicción de Fallas: Desarrollar modelos para predecir fallos en equipos y
maquinaria.
 Exploración de Recursos: Utilizar técnicas de análisis geoespacial y Machine
Learning para la exploración de nuevos yacimientos.
 Gestión Ambiental: Monitorear y gestionar el impacto ambiental de las
operaciones mineras.
 Seguridad: Implementar sistemas de IA para mejorar la seguridad en el lugar de
trabajo.
 Análisis Geológico: Utilizar análisis de datos para comprender mejor la geología
y la calidad de los recursos minerales.
20. ¿Cuál es un entorno de trabajo popular para la Ciencia de Datos?
Un entorno de trabajo popular para la Ciencia de Datos es Jupyter Notebook.
21. ¿Para qué son útiles la probabilidad y estadística para un Data Scientist?
La probabilidad y estadística son útiles para un Data Scientist en el análisis y modelado
de datos, permitiendo la toma de decisiones basadas en datos, la evaluación de la
incertidumbre, y la creación y validación de modelos predictivos.
22. ¿Cuál es el objetivo principal de un Data Scientist?
Es extraer conocimiento y obtener información valiosa a partir de datos. Esto implica
analizar datos, desarrollar modelos predictivos, resolver problemas complejos y
proporcionar recomendaciones basadas en datos para respaldar la toma de decisiones
empresariales.
23. Mencione una librería principal utilizada en Python para la Ciencia de Datos
Pandas es ampliamente utilizada para la manipulación y análisis de datos tabulares, lo
que la hace esencial en tareas de limpieza y preparación de datos en proyectos de
Ciencia de Datos.
24. ¿Cuáles con los temas clave para comenzar en un análisis exploratorio de
datos?
 Carga de datos: Importar conjuntos de datos en el entorno de trabajo.
 Limpieza de datos: Identificar y tratar valores faltantes o erróneos.
 Exploración de datos: Resumir datos y calcular estadísticas descriptivas.
 Visualización de datos: Crear gráficos para entender patrones y tendencias.
 Análisis de correlación: Explorar relaciones entre variables.
 Selección de características: Identificar variables relevantes.
 Detección de valores atípicos: Encontrar puntos de datos inusuales.
 Preparación de datos: Transformar datos para análisis o modelado posterior.
25. Mencione un reto común e la carrera de Data Science.
Es la limpieza y preparación de datos, ya que los conjuntos de datos suelen contener
ruido, valores faltantes o inconsistentes.
26. ¿En qué se diferencian el Data Scientist, Data Analyst y Unique Learning
Engineer?
 Data Scientist: Se centra en análisis avanzados y desarrollo de modelos
para tomar decisiones estratégicas.
 Data Analyst: Se enfoca en analizar datos para responder preguntas
específicas y crear informes.
 Machine Learning Engineer: Diseña, implementa y ajusta modelos de
Machine Learning para aplicaciones específicas.
27. ¿Cuál es el principal objetivo de un Data Analyst en una organización?
Es examinar datos para proporcionar información valiosa que respalde la toma de
decisiones empresariales. Esto implica analizar datos, identificar patrones, tendencias y
generar informes para ayudar a la organización a comprender mejor su desempeño y
tomar medidas basadas en evidencia.
28. ¿En qué se diferencian principalmente los roles de un Data Scientist y un
Data Analyst?
La principal diferencia radica en que un Data Scientist se enfoca en análisis avanzados y
desarrollo de modelos predictivos, mientras que un Data Analyst se concentra en
analizar datos para responder preguntas específicas y generar informes descriptivos.
29. ¿Cuáles son los dos lenguajes de programación más utilizados por Data
Science?
 Python: Python es extremadamente popular debido a su amplia gama de
librerías para análisis de datos, aprendizaje automático (Machine
Learning) y visualización.
 R: R es otro lenguaje de programación ampliamente utilizado en
estadísticas y análisis de datos, con una comunidad fuerte y numerosas
librerías estadísticas.
 Ambos lenguajes tienen ventajas y se eligen en función de las
necesidades específicas del proyecto y las preferencias del profesional de
Data Science.
30. ¿Cuáles son los tipos de modelos de machine learning?
 Aprendizaje Supervisado: Los modelos se entrenan utilizando ejemplos
etiquetados y se utilizan para hacer predicciones basadas en nuevas entradas.
Incluye regresión y clasificación.
 Aprendizaje No Supervisado: Los modelos identifican patrones en los datos sin
etiquetar. Esto incluye la segmentación de clústeres y la reducción de
dimensionalidad.
 Aprendizaje Reforzado: Los modelos aprenden a través de la interacción con un
entorno y toman decisiones para maximizar recompensas. Se utiliza en juegos y
robótica.
 Aprendizaje Semisupervisado: Combina elementos de aprendizaje supervisado y
no supervisado, utilizando datos etiquetados y no etiquetados para mejorar el
rendimiento.
 Aprendizaje por Transferencia: Los modelos entrenados en una tarea se aplican a
otra tarea relacionada para acelerar el aprendizaje.
 Aprendizaje Profundo (Deep Learning): Utiliza redes neuronales profundas para
tareas como procesamiento de lenguaje natural, visión por computadora y
recomendaciones.
 Aprendizaje por Refuerzo Imitativo: Los modelos imitan el comportamiento de
expertos humanos en situaciones complejas.
 Aprendizaje No Paramétrico: No asume una forma de función específica para el
modelo, lo que lo hace más flexible.
 Aprendizaje Paramétrico: Asume una forma de función específica con
parámetros fijos y un número limitado de grados de libertad.
31. ¿Cuáles con los lenguajes de programación más conocidos y utilizados en
ciencia de datos y AI?
 Python: Es el lenguaje más popular en estas áreas, gracias a su amplio
ecosistema de librerías y herramientas para análisis de datos, aprendizaje
automático y procesamiento de lenguaje natural.
 R: Es ampliamente utilizado en estadísticas y análisis de datos. Tiene una
comunidad fuerte y numerosas librerías estadísticas.
 Java: A menudo se usa en aplicaciones empresariales y en el desarrollo
de sistemas de inteligencia artificial.
 C++: Se utiliza en proyectos de alto rendimiento, como el desarrollo de
motores de juego y aplicaciones de visión por computadora.
 Julia: Un lenguaje emergente diseñado específicamente para análisis de
datos y cómputo científico de alto rendimiento.
 Scala: A menudo se utiliza junto con Spark para procesamiento de datos
distribuido.
 SQL: Si bien no es un lenguaje de programación en el sentido
tradicional, es esencial para consultar y gestionar bases de datos, un
aspecto fundamental en Ciencia de Datos.
32. ¿Cuáles son algunas de las acciones clave que realiza un Data Analyst?
 Recopilación de Datos: Recolectar datos de diversas fuentes, incluyendo bases
de datos, archivos y API.
 Limpieza de Datos: Identificar y tratar valores atípicos, valores faltantes y
errores en los datos.
 Exploración de Datos: Analizar datos para identificar patrones, tendencias y
relaciones.
 Visualización de Datos: Crear gráficos y visualizaciones para comunicar

hallazgos de manera efectiva.
 Análisis Estadístico: Realizar análisis estadísticos para obtener información
sobre los datos.
 Generación de Informes: Crear informes que resuman hallazgos y proporcionen
recomendaciones.
 Apoyo a la Toma de Decisiones: Proporcionar información que respalde la toma
de decisiones operativas y estratégicas.
 Automatización de Procesos: Automatizar tareas de análisis recurrentes para
mejorar la eficiencia.
 Colaboración: Trabajar con equipos interdisciplinarios, incluyendo científicos de
datos, ingenieros y líderes empresariales.
 Desarrollo de Dashboards: Crear paneles interactivos para que otros usuarios
exploren los datos.
33. ¿Cuáles son algunas habilidades necesarias para un Data Scientist?

 Programación: Dominio de lenguajes como Python o R para manipular
datos y desarrollar modelos de Machine Learning.
 Estadísticas: Comprender y aplicar conceptos estadísticos en el análisis
de datos.
 Manipulación de Datos: Habilidad para limpiar, transformar y preparar
datos para el análisis.
 Aprendizaje Automático: Familiaridad con algoritmos y técnicas de
Machine Learning.
 Visualización de Datos: Crear gráficos y visualizaciones efectivas para
comunicar hallazgos.
 SQL: Capacidad para consultar bases de datos y extraer datos relevantes.
 Herramientas de Ciencia de Datos: Utilizar librerías como pandas,
NumPy y scikit-learn en Python.
 Comunicación: Habilidad para explicar hallazgos y presentar resultados
de manera clara y efectiva.
 Pensamiento Crítico: Capacidad para abordar problemas complejos y
tomar decisiones basadas en datos.
 Conocimiento del Dominio: Comprender el contexto y los objetivos del
negocio o la industria en la que se trabaja.
 Herramientas de Big Data: Familiaridad con herramientas como Hadoop
y Spark para el procesamiento de grandes conjuntos de datos.
 Ética de Datos: Conciencia de las implicaciones éticas y de privacidad en
el manejo de datos.
34. ¿Qué temas son esenciales para aprender en el inicio de la carrera de un
científico de datos?
 Programación: Adquirir habilidades en lenguajes como Python o R para
manipular datos y desarrollar modelos.
 Estadísticas: Comprender conceptos estadísticos básicos para analizar datos y
validar resultados.
 Manipulación de Datos: Aprender a limpiar, transformar y preparar datos para
análisis.
 Visualización de Datos: Crear gráficos y visualizaciones efectivas para
comunicar hallazgos.
 Aprendizaje Automático: Familiarizarse con conceptos y técnicas de Machine
Learning.
 SQL: Conocer SQL para consultar y extraer datos de bases de datos.
 Herramientas de Ciencia de Datos: Utilizar librerías como pandas, NumPy y
scikit-learn en Python.
 Comunicación: Desarrollar habilidades para explicar resultados y presentar
hallazgos de manera efectiva.
35. ¿Qué es un Data Scientist?
Es un profesional que se especializa en la recopilación, procesamiento, análisis y
visualización de datos para obtener información valiosa y tomar decisiones informadas.
36. Menciona una librería para trabajar con modelos de Machine Learning
Una librería común para trabajar con modelos de Machine Learning en Python es scikit-
learn (también conocida como sklearn). Scikit-learn es una biblioteca de aprendizaje
automático de código abierto que proporciona herramientas y algoritmos para crear,
entrenar y evaluar modelos de Machine Learning en una variedad de aplicaciones. Es
ampliamente utilizada en la comunidad de ciencia de datos y aprendizaje automático.
37. ¿Qué librerías de Python son comunes en la ciencia de datos?
 Pandas: Para manipulación y análisis de datos tabulares.
 NumPy: Para operaciones numéricas y matriciales.
 Matplotlib: Para crear gráficos y visualizaciones.
 Seaborn: Una librería basada en matplotlib que simplifica la creación de
visualizaciones estadísticas atractivas.
 Scikit-learn: Para Machine Learning y modelado predictivo.
 TensorFlow y PyTorch: Para desarrollo de modelos de Deep Learning.
 Statsmodels: Para análisis estadísticos avanzados.
 NLTK y spaCy: Para procesamiento de lenguaje natural (NLP).
38. ¿Cuál es un entorno de trabajo popular para la ciencia de datos?
Un entorno de trabajo popular en la ciencia de datos es Jupyter Notebook. Jupyter
Notebook es una aplicación de código abierto que permite crear y compartir
documentos interactivos que contienen código, visualizaciones y explicaciones. Es
ampliamente utilizado en la comunidad de ciencia de datos para desarrollar y
documentar análisis de datos y modelos de Machine Learning.
39. ¿En qué variedad de proyectos y roles puede participar un data Scientist?
 Análisis de Datos Empresariales: Ayudar a las organizaciones a
comprender mejor su desempeño y tomar decisiones basadas en datos.
 Machine Learning: Desarrollar modelos de Machine Learning para
predecir eventos, clasificar datos o automatizar tareas.
 Ciencia de Datos de la Salud: Analizar datos médicos para identificar
patrones y apoyar la investigación médica.
 Ciencia de Datos Ambientales: Trabajar con datos relacionados con el
medio ambiente y la sostenibilidad.
 Procesamiento de Lenguaje Natural (NLP): Desarrollar aplicaciones
basadas en NLP, como chatbots y análisis de sentimientos.
 Visión por Computadora: Trabajar en proyectos relacionados con el
procesamiento de imágenes y reconocimiento de objetos.
 Finanzas Cuantitativas: Aplicar análisis de datos en mercados financieros
y gestión de riesgos.
 Analítica de Redes Sociales: Analizar datos de redes sociales para
comprender el comportamiento del usuario y la tendencia del mercado.
 Investigación de Mercado: Utilizar datos para comprender las
preferencias del consumidor y el mercado.
 Análisis de Juegos: Aplicar análisis de datos en la industria de los
videojuegos para mejorar la experiencia del usuario.
40. ¿Un data Analyst debe saber programar?

Sí, es beneficioso que un Data Analyst tenga conocimientos de programación. La
programación, especialmente en lenguajes como Python o R, permite automatizar tareas
de análisis de datos, manipular datos de manera eficiente y realizar análisis estadísticos
avanzados. Aunque no todos los Data Analysts son programadores expertos, tener
habilidades básicas de programación es una ventaja en esta profesión.
41. ¿Cómo se presentan los hallazgos encontrados en los datos?
Los hallazgos en el análisis de datos se presentan a través de gráficos, tablas y narración
de resultados en informes y presentaciones.
42. ¿Cuáles son algunas de las habilidades principales que requiere un Data
Analyst?
Manipulación de Datos: Capacidad para limpiar, transformar y preparar datos para su
análisis.
 Programación: Conocimiento de lenguajes como Python o R para análisis.
 Estadísticas: Habilidad en análisis estadístico para comprender datos.
 Visualización: Creación de gráficos y visualizaciones efectivas.
 SQL: Consultas a bases de datos para obtener datos.
 Comunicación: Capacidad para explicar hallazgos y presentar resultados de
manera clara.
43. ¿Cuál es el objetivo principal de un Data Analyst?
Examinar datos para identificar patrones, tendencias y conclusiones que ayuden a las
organizaciones a tomar decisiones informadas y estratégicas.
44. ¿Qué herramientas y habilidades debe tener un Data Analyst?
 Herramientas:
a. Excel o Google Sheets para análisis básico.
b. Lenguajes de programación como Python o R.
c. SQL para consultar bases de datos.
d. Herramientas de visualización como Tableau o Power BI.
e. Bibliotecas de análisis de datos como pandas y NumPy.
 Habilidades:
a. Habilidad en la manipulación y limpieza de datos.
b. Capacidad para realizar análisis estadísticos.
c. Conocimiento en visualización de datos.
d. Comunicación efectiva para presentar hallazgos.
e. Curiosidad y pensamiento crítico.
45. ¿Cuál es una habilidad importante que un Data Analyst debe tener?
Es la capacidad de programación y conocimiento en lenguajes como Python o R para
manipular y analizar datos de manera eficiente y realizar análisis estadísticos.
46. ¿Cuál es una habilidad clave para un Data Analyst?
De interpretar y analizar datos de manera efectiva para obtener información valiosa y
tomar decisiones basadas en evidencia.
47. ¿Qué herramientas son líderes en visualización de datos?
 Tableau: Ofrece visualizaciones interactivas y es ampliamente utilizado en
empresas.
 Power BI: De Microsoft, permite crear informes interactivos y tableros de
control.
 D3.js: Una biblioteca JavaScript potente y flexible para crear visualizaciones
personalizadas.
 QlikView/Qlik Sense: Proporciona visualizaciones interactivas y análisis de
datos.
 Matplotlib y Seaborn: En Python, para visualizaciones personalizadas y análisis
de datos.
 Ggplot2: En R, para visualizaciones de alta calidad.
48. ¿Por qué es importante dominar Excel o Google Sheets en el análisis de
datos?
son herramientas ampliamente utilizadas para tareas iniciales de manipulación,
organización y análisis de datos.
49. ¿Qué lenguajes de programación son importantes para un Data Analyst y los
más usados en la industria del análisis de datos?
 Python: Ampliamente preferido debido a su facilidad de uso y una rica colección
de bibliotecas para análisis de datos, como pandas, NumPy y matplotlib.
 R: Especializado en estadísticas y análisis de datos, es popular entre los analistas
cuantitativos.
 SQL: Fundamental para consultar bases de datos y extraer datos para análisis.
 JavaScript: A veces se usa para crear visualizaciones interactivas en la web.
50. ¿Cuál es el propósito principal de un Data Analyst?
Es examinar y analizar datos para descubrir patrones, tendencias y proporcionar
información valiosa que respalde la toma de decisiones informadas en una organización.
51. Mencione 3 librerías importantes en análisis y visualización de datos
 pandas: Para la manipulación y análisis de datos tabulares.
 matplotlib: Para crear gráficos y visualizaciones estáticas.
 Seaborn: Una librería que se basa en matplotlib y simplifica la creación de
visualizaciones estadísticas más atractivas.
52. ¿Qué es importante aprender al inicio de una carrera como Data Analyst?
Es importante aprender habilidades de manipulación de datos con herramientas como
Python y SQL.
53. ¿Cuál es la importancia de conocer las bases de dato de tu mina?
Es crucial porque proporciona visibilidad sobre la producción, seguridad,
mantenimiento y eficiencia operativa.
54. ¿Cómo de presentan los hallazgos encontrados en los datos?
A través de gráficos, tablas, informes escritos y visualizaciones interactivas para
comunicar patrones, tendencias y conclusiones de manera efectiva a las partes
interesadas.
55. Busca en sitios de trabajo vacantes para Data Analyst, Data Scientist, Data
Engineers y Machine learning Engineers
 Machine Learning Engineer
 Analista BI (Valtx – Perú)
 Especialista de Gestión de incidencias de Aplicaciones (Mibanco – Perú)
 Business Specialist Proficient (Yape – Perú).
 Analista de inteligencia de negocios (AENZA – Perú)
 Risk Specialist (Banco de Crédito BCP – Perú).
 Ingeniero de Proyectos (Oben Group – Perú)
56. ¿Cuál es la diferencia entre OLAP y OLTP?
Por lo tanto, OLTP es un sistema de modificación de datos en línea, mientras que OLAP
es un sistema de almacén de datos multidimensional histórico en línea que se utiliza
para recuperar datos de grandes cantidades con fines analíticos. OLAP normalmente
proporciona análisis de los datos capturados por uno o más sistemas OLTP.
57. ¿Qué es el proceso ETL?
La extracción, transformación y carga (ETL) funciona moviendo datos del sistema de
origen al sistema de destino a intervalos periódicos. El proceso ETL funciona en tres
pasos:
 Extracción de los datos relevantes de la base de datos de origen.
 Transformación de los datos para que sean más adecuados para el análisis.
 Carga de los datos en la base de datos de destino.
58. ¿Qué tipos de conocimientos matemáticos son útiles para comprender los
datos en el procesamiento de datos?
Los conocimientos matemáticos útiles incluyen álgebra lineal para comprender
transformaciones de datos, estadísticas para el análisis y la inferencia, y cálculo para
optimización y modelado matemático en el procesamiento de datos.
59. Mencione 3 herramientas o librerías claves en el procesamiento de datos.
 Pandas: Para la manipulación y análisis de datos tabulares.
 Apache Spark: Para procesamiento de datos distribuido y análisis a gran escala.
 SQL: Lenguaje de consulta estructurada para manipular y gestionar bases de
datos relacionales
60. ¿Cuál es el lenguaje de programación principalmente utilizado por Data
Engineers?
Es Python, debido a su versatilidad, amplia gama de bibliotecas para procesamiento de
datos y facilidad de integración con herramientas de Big Data como Apache Spark y
Hadoop.
61. ¿Por qué es importante contar con un Data Enginner en una empresa
minera?
Para gestionar la recopilación, almacenamiento y procesamiento eficiente de grandes
volúmenes de datos de sensores y equipos. Esto permite tomar decisiones informadas,
mejorar la seguridad y optimizar la operación minera.
62. ¿Para qué se utiliza Docker en el procesamiento de datos?
Para crear contenedores de software que encapsulan aplicaciones y sus dependencias,
garantizando un entorno consistente.
63. ¿Cuál es el objetivo principal de un Machine Learning Engineer?
Desarrollar y desplegar sistemas de Machine Learning que puedan aprender de datos y
realizar tareas específicas sin ser programados explícitamente, abordando problemas de
predicción, clasificación, optimización y toma de decisiones en diversas aplicaciones.
64. ¿Qué herramientas y librerías de análisis de datos son comunes en el campo
de Machine Learning?
 Pandas: Para la manipulación y análisis de datos tabulares.
 NumPy: Para operaciones numéricas eficientes y manejo de matrices.
 matplotlib y seaborn: Para visualización de datos.
 scikit-learn: Para implementar algoritmos de Machine Learning.
 Jupyter Notebook: Para crear y compartir documentos interactivos con código y
visualizaciones.
 StatsModels: Para análisis estadístico.
 TensorFlow y PyTorch: Para construir y entrenar modelos de aprendizaje
automático, especialmente para aprendizaje profundo.
 XGBoost y LightGBM: Para algoritmos de gradient boosting.
 spaCy y nltk: Para procesamiento de lenguaje natural (NLP).
 OpenCV: Para visión por computadora.
65. Menciona un framework o librería popular de Machine Learning

TensorFlow es un framework popular de Machine Learning desarrollado por Google.
66. ¿Cuáles son algunos lenguajes de programación de alto nivel que se pueden
utilizar en Machine Learning?
Python: El más popular debido a su amplia comunidad y bibliotecas de ML.
R: Especializado en estadísticas y análisis de datos.
Julia: Con un rendimiento similar a C++ pero con sintaxis amigable.
Java y C#: A menudo utilizados en implementaciones empresariales de ML.
67. ¿Qué framework se sugiere para construir los primeros modelos de machine
learning?
se sugiere utilizar scikit-learn (sklearn) en Python. Es un framework de aprendizaje
automático de código abierto que es fácil de usar y ofrece una amplia gama de
algoritmos para tareas comunes de ML como clasificación y regresión.
68. ¿Qué lenguaje de programación se recomienda aprender para comenzar en
Machine Learning?
Python para comenzar en Machine Learning debido a su facilidad de uso, una amplia
variedad de bibliotecas y herramientas de Machine Learning (como TensorFlow y
PyTorch) y una gran comunidad de desarrollo en este campo.
69. ¿Qué tecnología se utiliza para el despliegue de modelo de Machine
Learning?
Contenedores (como Docker), servicios en la nube (AWS, Azure, Google Cloud), APIs
RESTful y frameworks web (Flask, Django) para aplicaciones en producción.
70. ¿Cuál es el primer paso recomendado para iniciar una carrera en Machine
Learning?
El primer paso es aprender programación en Python y fundamentos matemáticos,
incluyendo álgebra lineal y estadísticas, para comprender y aplicar algoritmos de
Machine Learning.
71. ¿Qué herramienta se utiliza comúnmente para trabajar con análisis de datos
en Python?
Una herramienta comúnmente utilizada para trabajar con análisis de datos en Python es
la biblioteca llamada "pandas".
72. ¿En qué parte del flujo de trabajo de la ciencia de datos interviene una
Machine Learning Enginner?
Interviene principalmente en la etapa de "Modelado y Entrenamiento de Modelos"
73. ¿Cuándo sería conveniente contratar una Machine Learning Enginner en
una mina?
Cuando se busque implementar soluciones avanzadas de monitoreo, predicción de
fallas, optimización de procesos o seguridad utilizando datos recopilados de sensores y
equipos, lo que puede mejorar la eficiencia y la seguridad en la operación minera.
74. ¿Cuál área de las matemáticas es importante para optimizar modelos en
Machine learning?
Álgebra lineal y cálculo
75. ¿Cuál es el primer paso recomendado para iniciar una carrera en Machine
Learning?
El primer paso recomendado para iniciar una carrera en Machine Learning es desarrollar
una base sólida en matemáticas y programación
76. ¿Una Machine Learning Engineer debe saber de lenguaje de programación
de alto y bajo nivel?
Sí, un ingeniero de Machine Learning generalmente debe tener conocimientos de
lenguajes de programación tanto de alto nivel como de bajo nivel, aunque la
importancia de cada uno puede variar según el contexto y las responsabilidades
específicas de la traba.

Actividad 2

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Actividad 2

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD

“AÑO DE LA UNIDAD, LA PAZ Y EL DESARROLLO”

2. Buscar en internet productos, aplicaciones proyectos, que utilicen Big Data

12. ¿Cuál es el factor clave para definir el proceso en un proyecto de ciencia de

 Visualización de Datos: Crear gráficos y visualizaciones para comunicar

33. ¿Cuáles son algunas habilidades necesarias para un Data Scientist?

40. ¿Un data Analyst debe saber programar?

65. Menciona un framework o librería popular de Machine Learning

También podría gustarte