Facultad de Ingenierí1

UNT ING.
MINAS
UNIVERSIDAD NACIONAL DE TRUJILLO
ESTUDIANTE:
DIAZ MALCA WILIAN
ACTIVIDADES DE
APLICACIÓN W1
EXCEL, ACCESS
MS PROJECT
1RA UNIDAD – VI CICLO
2023 “AÑO DE LA UNIDAD, LA PAZ Y EL DESARROLLO”
FACULTAD DE INGENIERÍA
ESCUELA ACADÉMICO PROFESIONAL DE INGENIERÍA DE MINAS
TRABAJO:
ACTIVIDADES DE APLICACIÓN W1
CURSO:
EXCEL, ACCESS MS PROJECT
DOCENTE:
MG. JORGE OMAR GONZALES TORRES
INTEGRANTES:
DÍAZ MALCA WILIAN
TRUJILLO – PERÚ
¿Qué es lo que más te gusta de estos proyectos? ¿Cómo es que utilizan Big Data para
funcionar?
A.
 Simulación de yacimientos: Los modelos de Big Data ayudan a simular el
comportamiento de un yacimiento en diferentes escenarios, lo que permite una mejor
planificación y toma de decisiones.
 Modelos de flujo de aguas subterráneas: Utiliza datos hidrológicos y geológicos
para predecir el flujo de agua en yacimientos subterráneos, lo que es crucial para la seguridad y
la operación.
B.
 Predicción de deslizamientos y sismos: Los datos geológicos históricos y en
tiempo real se utilizan para predecir eventos geológicos peligrosos, lo que permite tomar
medidas preventivas.
C.
 Proyecto MineSense: Emplea análisis de Big Data para optimizar la selección
de mineral en tiempo real durante el proceso de excavación.
3. ¿Qué relación existe entre Big Data y Data Science?
El Big Data se refiere al manejo y análisis de grandes volúmenes de datos, mientras que
la Ciencia de Datos se enfoca en extraer conocimientos y patrones significativos de los datos,
utilizando técnicas estadísticas y de análisis avanzadas.
4. ¿Cuál es la primera etapa en la jerarquía de necesidades de Data Science?
La primera etapa en la jerarquía de necesidades de Data Science es la "Recopilación y
Almacenamiento de Datos".
5. ¿Qué implica aprender Data Science?
Implica adquirir habilidades en programación, estadísticas, manipulación de datos y uso
de herramientas como lenguajes de programación (como Python o R), bibliotecas de análisis de
datos, bases de datos y técnicas de visualización. También implica comprender modelos de
machine learning y técnicas de análisis predictivo para tomar decisiones basadas en datos.
6. ¿Cuál es la relación entre la inteligencia artificial y la ciencia de datos?
La Ciencia de Datos utiliza técnicas estadísticas para extraer conocimiento y patrones
de datos, mientras que la Inteligencia Artificial emplea algoritmos para permitir que las
máquinas aprendan y realicen tareas humanas. Ambas se entrelazan en la creación de modelos y
soluciones más avanzadas.
7. ¿Cualquier organización puede empezar a implementar machine learning en
cualquier momento?
Sí, cualquier organización puede implementar el aprendizaje automático, pero se
necesita planificación. Se deben evaluar necesidades, adquirir datos relevantes y tener
habilidades técnicas. Comenzar con proyectos pequeños y capacitación adecuada es crucial para
una implementación exitosa.
8. ¿A qué se refiere el término Big Data?
Se refiere a conjuntos de datos extremadamente grandes y complejos que exceden la
capacidad de las herramientas tradicionales para gestionar, procesar y analizar. Implica datos de
múltiples fuentes, incluyendo estructurados y no estructurados, que requieren tecnologías y
enfoques especializados para obtener información significativa.
9. ¿Cuál es la razón para no querer aprender Data Science?
La complejidad técnica, la falta de interés en análisis de datos, la preferencia por otros
campos o la falta de tiempo para dedicarse al aprendizaje.
10. ¿Cuál es el rango de salarios para los profesionales junior en Latinoamérica?
Varían según el país, la ciudad, la empresa y la demanda que haya en el mercado
empresarial. Sin embargo, en general, los salarios para profesionales junior en esta área pueden
oscilar entre $15,000 a $30,000 dólares anuales.
11. ¿Cuál es el contexto actual del mundo de la ciencia de datos e inteligencia
artificial?
12. ¿Cuál es el factor clave para definir el proceso en un proyecto de ciencia de

datos?
Es la formulación clara de los objetivos y preguntas del proyecto. Establecer metas
específicas y comprender qué información se busca extraer de los datos guía la selección de
métodos, herramientas y pasos a seguir en todas las etapas, desde la recopilación hasta el
análisis y la toma de decisiones.
13. ¿Cuál es la principal rama de la inteligencia artificial utilizada en la ciencia de
datos?
El aprendizaje automático (machine learning) es la principal rama de la inteligencia
artificial utilizada en la Ciencia de Datos. Se centra en desarrollar algoritmos y modelos que
permiten a las computadoras aprender de los datos y mejorar su rendimiento en tareas
específicas sin ser programadas de manera explícita.
14. ¿Qué es la inteligencia artificial?
Se refiere a la simulación de procesos de inteligencia humana por parte de máquinas y
sistemas computacionales. Estos sistemas pueden realizar tareas que normalmente requieren
inteligencia humana, como el aprendizaje, el razonamiento, la resolución de problemas, la
percepción y el procesamiento del lenguaje natural.
15. ¿Cuál es una razón para aprender Data Science?

Es el enorme valor que aporta en la toma de decisiones basadas en datos. Con estas
habilidades, puedes analizar información compleja y tomar decisiones informadas en campos
diversos, desde negocios y ciencia hasta salud y tecnología. El Data Science también ofrece
oportunidades de carrera en auge y la capacidad de resolver problemas complejos.
16. ¿Qué áreas del conocimiento son importantes en la ciencia de datos?
 Programación y Análisis de Datos: Habilidades en lenguajes como Python o R
para manipular y analizar datos.
 Estadísticas: Comprender conceptos estadísticos para tomar decisiones basadas
en datos y validar resultados.
 Aprendizaje Automático: Conocimiento en algoritmos de ML para construir
modelos predictivos y clasificadores.
 Bases de Datos: Familiaridad con sistemas de gestión de bases de datos para
almacenar y recuperar datos eficientemente.
 Visualización de Datos: Capacidad para representar datos de manera visual y
comunicar resultados de manera efectiva.
 Dominio del Problema: Comprender el contexto y las necesidades del problema
para aplicar las técnicas adecuadas.
 Matemáticas: Fundamentos matemáticos como álgebra lineal y cálculo que
sustentan algoritmos y modelos.
 Comunicación: Habilidad para presentar resultados y explicar hallazgos técnicos
de manera comprensible para diversos públicos.
 Ética y Privacidad: Conciencia sobre las implicaciones éticas y la privacidad en
la manipulación y el análisis de datos.
17. ¿Es siempre necesario trabajar con Big Data para abordar proyectos de análisis
de datos?
No, no siempre es necesario. Muchos proyectos de análisis de datos se pueden abordar
eficazmente con conjuntos de datos de tamaño moderado o pequeño.
18. ¿Cuáles son algunos roles clave en la industria de Data Science e Inteligencia
Artificial?
 Data Scientist: Analiza datos y crea modelos para obtener información
valiosa.
 Machine Learning Engineer: Diseña, implementa y ajusta modelos de
Machine Learning.
 Data Engineer: Prepara y gestiona datos para su análisis.
19. ¿Qué oportunidades laborales ofrece la industria de Data Science e Inteligencia

artificial en el sector Minero y Geológico?
 Optimización de Procesos: Utilizar datos para mejorar la eficiencia en la
extracción y procesamiento de minerales.
 Predicción de Fallas: Desarrollar modelos para predecir fallos en equipos y
maquinaria.
 Exploración de Recursos: Utilizar técnicas de análisis geoespacial y Machine
Learning para la exploración de nuevos yacimientos.
 Gestión Ambiental: Monitorear y gestionar el impacto ambiental de las
operaciones mineras.
 Seguridad: Implementar sistemas de IA para mejorar la seguridad en el lugar de
trabajo.
 Análisis Geológico: Utilizar análisis de datos para comprender mejor la
geología y la calidad de los recursos minerales.
20. ¿Cuál es un entorno de trabajo popular para la Ciencia de Datos?
Un entorno de trabajo popular para la Ciencia de Datos es Jupyter Notebook.
21. ¿Para qué son útiles la probabilidad y estadística para un Data Scientist?
La probabilidad y estadística son útiles para un Data Scientist en el análisis y modelado
de datos, permitiendo la toma de decisiones basadas en datos, la evaluación de la incertidumbre,
y la creación y validación de modelos predictivos.
22. ¿Cuál es el objetivo principal de un Data Scientist?
Es extraer conocimiento y obtener información valiosa a partir de datos. Esto implica
analizar datos, desarrollar modelos predictivos, resolver problemas complejos y proporcionar
recomendaciones basadas en datos para respaldar la toma de decisiones empresariales.
23. Mencione una librería principal utilizada en Python para la Ciencia de Datos
Es "pandas". pandas es ampliamente utilizada para la manipulación y análisis de datos
tabulares, lo que la hace esencial en tareas de limpieza y preparación de datos en proyectos de
Ciencia de Datos.
24. ¿Cuáles con los temas clave para comenzar en un análisis exploratorio de datos?
 Carga de datos: Importar conjuntos de datos en el entorno de trabajo.
 Limpieza de datos: Identificar y tratar valores faltantes o erróneos.
 Exploración de datos: Resumir datos y calcular estadísticas
descriptivas.
 Visualización de datos: Crear gráficos para entender patrones y
tendencias.
 Análisis de correlación: Explorar relaciones entre variables.
 Selección de características: Identificar variables relevantes.
 Detección de valores atípicos: Encontrar puntos de datos inusuales.
 Preparación de datos: Transformar datos para análisis o modelado
posterior.
25. Mencione un reto común e la carrera de Data Science.
Es la limpieza y preparación de datos, ya que los conjuntos de datos suelen contener
ruido, valores faltantes o inconsistentes.
26. ¿En qué se diferencian el Data Scientist, Data Analyst y Unique Learning
Engineer?
 Data Scientist: Se centra en análisis avanzados y desarrollo de modelos para
tomar decisiones estratégicas.
 Data Analyst: Se enfoca en analizar datos para responder preguntas específicas
y crear informes.
 Machine Learning Engineer: Diseña, implementa y ajusta modelos de Machine
Learning para aplicaciones específicas.
27. ¿Cuál es el principal objetivo de un Data Analyst en una organización?
Es examinar datos para proporcionar información valiosa que respalde la toma de
decisiones empresariales. Esto implica analizar datos, identificar patrones, tendencias y generar
informes para ayudar a la organización a comprender mejor su desempeño y tomar medidas
basadas en evidencia.
28. ¿En qué se diferencian principalmente los roles de un Data Scientist y un Data
Analyst?
La principal diferencia radica en que un Data Scientist se enfoca en análisis avanzados y
desarrollo de modelos predictivos, mientras que un Data Analyst se concentra en analizar datos
para responder preguntas específicas y generar informes descriptivos.
29. ¿Cuáles son los dos lenguajes de programación más utilizados por Data
Science?
 Python: Python es extremadamente popular debido a su amplia gama de
librerías para análisis de datos, aprendizaje automático (Machine Learning) y
visualización.
 R: R es otro lenguaje de programación ampliamente utilizado en estadísticas y
análisis de datos, con una comunidad fuerte y numerosas librerías estadísticas.
 Ambos lenguajes tienen ventajas y se eligen en función de las necesidades
específicas del proyecto y las preferencias del profesional de Data Science.
30. ¿Cuáles son los tipos de modelos de machine learning?
 Aprendizaje Supervisado: Los modelos se entrenan utilizando ejemplos

etiquetados y se utilizan para hacer predicciones basadas en nuevas
entradas. Incluye regresión y clasificación.
 Aprendizaje No Supervisado: Los modelos identifican patrones en los
datos sin etiquetar. Esto incluye la segmentación de clústeres y la
reducción de dimensionalidad.
 Aprendizaje Reforzado: Los modelos aprenden a través de la

interacción con un entorno y toman decisiones para maximizar
recompensas. Se utiliza en juegos y robótica.
 Aprendizaje Semisupervisado: Combina elementos de aprendizaje

supervisado y no supervisado, utilizando datos etiquetados y no
etiquetados para mejorar el rendimiento.
 Aprendizaje por Transferencia: Los modelos entrenados en una tarea se

aplican a otra tarea relacionada para acelerar el aprendizaje.
 Aprendizaje Profundo (Deep Learning): Utiliza redes neuronales

profundas para tareas como procesamiento de lenguaje natural, visión
por computadora y recomendaciones.
 Aprendizaje por Refuerzo Imitativo: Los modelos imitan el

comportamiento de expertos humanos en situaciones complejas.
 Aprendizaje No Paramétrico: No asume una forma de función

específica para el modelo, lo que lo hace más flexible.
 Aprendizaje Paramétrico: Asume una forma de función específica con

parámetros fijos y un número limitado de grados de libertad.
31. ¿Cuáles con los lenguajes de programación más conocidos y utilizados en

ciencia de datos y AI?
 Python: Es el lenguaje más popular en estas áreas, gracias a su amplio
ecosistema de librerías y herramientas para análisis de datos, aprendizaje
automático y procesamiento de lenguaje natural.
 R: Es ampliamente utilizado en estadísticas y análisis de datos. Tiene una
comunidad fuerte y numerosas librerías estadísticas.
 Java: A menudo se usa en aplicaciones empresariales y en el desarrollo de
sistemas de inteligencia artificial.
 C++: Se utiliza en proyectos de alto rendimiento, como el desarrollo de motores
de juego y aplicaciones de visión por computadora.
 Julia: Un lenguaje emergente diseñado específicamente para análisis de datos y
cómputo científico de alto rendimiento.
 Scala: A menudo se utiliza junto con Spark para procesamiento de datos
distribuido.
 SQL: Si bien no es un lenguaje de programación en el sentido tradicional, es
esencial para consultar y gestionar bases de datos, un aspecto fundamental en
Ciencia de Datos.
32. ¿Cuáles son algunas de las acciones clave que realiza un Data Analyst?
 Recopilación de Datos: Recolectar datos de diversas fuentes, incluyendo bases
de datos, archivos y API.
 Limpieza de Datos: Identificar y tratar valores atípicos, valores faltantes y

errores en los datos.
 Exploración de Datos: Analizar datos para identificar patrones, tendencias y

relaciones.
 Visualización de Datos: Crear gráficos y visualizaciones para comunicar

hallazgos de manera efectiva.
 Análisis Estadístico: Realizar análisis estadísticos para obtener información

sobre los datos.
 Generación de Informes: Crear informes que resuman hallazgos y proporcionen

recomendaciones.
 Apoyo a la Toma de Decisiones: Proporcionar información que respalde la

toma de decisiones operativas y estratégicas.
 Automatización de Procesos: Automatizar tareas de análisis recurrentes para

mejorar la eficiencia.
 Colaboración: Trabajar con equipos interdisciplinarios, incluyendo científicos

de datos, ingenieros y líderes empresariales.
 Desarrollo de Dashboards: Crear paneles interactivos para que otros usuarios

exploren los datos.
33. ¿Cuáles son algunas habilidades necesarias para un Data Scientist?

 Programación: Dominio de lenguajes como Python o R para manipular datos y
desarrollar modelos de Machine Learning.
 Estadísticas: Comprender y aplicar conceptos estadísticos en el análisis de

datos.
 Manipulación de Datos: Habilidad para limpiar, transformar y preparar datos

para el análisis.
 Aprendizaje Automático: Familiaridad con algoritmos y técnicas de Machine

Learning.
 Visualización de Datos: Crear gráficos y visualizaciones efectivas para

comunicar hallazgos.
 SQL: Capacidad para consultar bases de datos y extraer datos relevantes.
 Herramientas de Ciencia de Datos: Utilizar librerías como pandas, NumPy y

scikit-learn en Python.
 Comunicación: Habilidad para explicar hallazgos y presentar resultados de

manera clara y efectiva.
 Pensamiento Crítico: Capacidad para abordar problemas complejos y tomar

decisiones basadas en datos.
 Conocimiento del Dominio: Comprender el contexto y los objetivos del

negocio o la industria en la que se trabaja.
 Herramientas de Big Data: Familiaridad con herramientas como Hadoop y

Spark para el procesamiento de grandes conjuntos de datos.
 Ética de Datos: Conciencia de las implicaciones éticas y de privacidad en el

manejo de datos.
34. ¿Qué temas son esenciales para aprender en le inicio de la carrera de un
científico de datos?
 Programación: Adquirir habilidades en lenguajes como Python o R para
manipular datos y desarrollar modelos.
 Estadísticas: Comprender conceptos estadísticos básicos para analizar

datos y validar resultados.
 Manipulación de Datos: Aprender a limpiar, transformar y preparar

datos para análisis.
 Visualización de Datos: Crear gráficos y visualizaciones efectivas para

comunicar hallazgos.
 Aprendizaje Automático: Familiarizarse con conceptos y técnicas de

Machine Learning.
 SQL: Conocer SQL para consultar y extraer datos de bases de datos.
 Herramientas de Ciencia de Datos: Utilizar librerías como pandas,

NumPy y scikit-learn en Python.
 Comunicación: Desarrollar habilidades para explicar resultados y

presentar hallazgos de manera efectiva.
35. ¿Qué es un Data Scientist?

Es un profesional que se especializa en la recopilación, procesamiento, análisis y
visualización de datos para obtener información valiosa y tomar decisiones informadas.
36. Menciona una librería para trabajar con modelos de Machine Learning
Una librería común para trabajar con modelos de Machine Learning en Python es scikit-
learn (también conocida como sklearn). Scikit-learn es una biblioteca de aprendizaje automático
de código abierto que proporciona herramientas y algoritmos para crear, entrenar y evaluar
modelos de Machine Learning en una variedad de aplicaciones. Es ampliamente utilizada en la
comunidad de ciencia de datos y aprendizaje automático.
37. ¿Qué librerías de Python son comunes en la ciencia de datos?

 pandas: Para manipulación y análisis de datos tabulares.
 NumPy: Para operaciones numéricas y matriciales.
 matplotlib: Para crear gráficos y visualizaciones.
 Seaborn: Una librería basada en matplotlib que simplifica la creación de
visualizaciones estadísticas atractivas.
 scikit-learn: Para Machine Learning y modelado predictivo.
 TensorFlow y PyTorch: Para desarrollo de modelos de Deep Learning.
 statsmodels: Para análisis estadísticos avanzados.
 NLTK y spaCy: Para procesamiento de lenguaje natural (NLP).
38. ¿Cuál es un entorno de trabajo popular para la ciencia de datos?
Un entorno de trabajo popular en la ciencia de datos es Jupyter Notebook.
Jupyter Notebook es una aplicación de código abierto que permite crear y compartir
documentos interactivos que contienen código, visualizaciones y explicaciones. Es
ampliamente utilizado en la comunidad de ciencia de datos para desarrollar y
documentar análisis de datos y modelos de Machine Learning.
39. ¿En qué variedad de proyectos y roles puede participar un data Scientist?
 Análisis de Datos Empresariales: Ayudar a las organizaciones a comprender
mejor su desempeño y tomar decisiones basadas en datos.
 Machine Learning: Desarrollar modelos de Machine Learning para predecir
eventos, clasificar datos o automatizar tareas.
 Ciencia de Datos de la Salud: Analizar datos médicos para identificar patrones
y apoyar la investigación médica.
 Ciencia de Datos Ambientales: Trabajar con datos relacionados con el medio
ambiente y la sostenibilidad.
 Procesamiento de Lenguaje Natural (NLP): Desarrollar aplicaciones basadas en
NLP, como chatbots y análisis de sentimientos.
 Visión por Computadora: Trabajar en proyectos relacionados con el
procesamiento de imágenes y reconocimiento de objetos.
 Finanzas Cuantitativas: Aplicar análisis de datos en mercados financieros y
gestión de riesgos.
 Analítica de Redes Sociales: Analizar datos de redes sociales para comprender
el comportamiento del usuario y la tendencia del mercado.
 Investigación de Mercado: Utilizar datos para comprender las preferencias del
consumidor y el mercado.
 Análisis de Juegos: Aplicar análisis de datos en la industria de los videojuegos
para mejorar la experiencia del usuario.
40. ¿Un data Analyst debe saber programar?

Sí, es beneficioso que un Data Analyst tenga conocimientos de programación. La
programación, especialmente en lenguajes como Python o R, permite automatizar tareas de
análisis de datos, manipular datos de manera eficiente y realizar análisis estadísticos avanzados.
Aunque no todos los Data Analysts son programadores expertos, tener habilidades básicas de
programación es una ventaja en esta profesión.
41. ¿Cómo se presentan los hallazgos encontrados en los datos?
Los hallazgos en el análisis de datos se presentan a través de gráficos, tablas y narración
de resultados en informes y presentaciones.
42. ¿Cuáles son algunas de las habilidades principales que requiere un Data
Analyst?
Manipulación de Datos: Capacidad para limpiar, transformar y preparar datos
para su análisis.
 Programación: Conocimiento de lenguajes como Python o R para
análisis.
 Estadísticas: Habilidad en análisis estadístico para comprender datos.
 Visualización: Creación de gráficos y visualizaciones efectivas.
 SQL: Consultas a bases de datos para obtener datos.
 Comunicación: Capacidad para explicar hallazgos y presentar
resultados de manera clara.
43. ¿Cuál es el objetivo principal de un Data Analyst?
Examinar datos para identificar patrones, tendencias y conclusiones que ayuden a las
organizaciones a tomar decisiones informadas y estratégicas.
44. ¿Qué herramientas y habilidades debe tener un Data Analyst?
 Herramientas:
a. Excel o Google Sheets para análisis básico.

b. Lenguajes de programación como Python o R.
c. SQL para consultar bases de datos.
d. Herramientas de visualización como Tableau o Power BI.
e. Bibliotecas de análisis de datos como pandas y NumPy.
 Habilidades:
a. Habilidad en la manipulación y limpieza de datos.

b. Capacidad para realizar análisis estadísticos.
c. Conocimiento en visualización de datos.
d. Comunicación efectiva para presentar hallazgos.
e. Curiosidad y pensamiento crítico.
45. ¿Cuál es una habilidad importante que un Data Analyst debe tener?
Es la capacidad de programación y conocimiento en lenguajes como Python o R para
manipular y analizar datos de manera eficiente y realizar análisis estadísticos.
46. ¿Cuál es una habilidad clave para un Data Analyst?
De interpretar y analizar datos de manera efectiva para obtener información valiosa y
tomar decisiones basadas en evidencia.
47. ¿Qué herramientas son líderes en visualización de datos?

 Tableau: Ofrece visualizaciones interactivas y es ampliamente utilizado
en empresas.
 Power BI: De Microsoft, permite crear informes interactivos y tableros

de control.
 D3.js: Una biblioteca JavaScript potente y flexible para crear

visualizaciones personalizadas.
 QlikView/Qlik Sense: Proporciona visualizaciones interactivas y

análisis de datos.
 Matplotlib y Seaborn: En Python, para visualizaciones personalizadas y

análisis de datos.
 ggplot2: En R, para visualizaciones de alta calidad.
48. ¿Por qué es importante dominar Excel o Google Sheets en el análisis de datos?
son herramientas ampliamente utilizadas para tareas iniciales de manipulación,
organización y análisis de datos.
49. ¿Qué lenguajes de programación son importantes para un Data Analyst y los
más usados en la industria del análisis de datos?
 Python: Ampliamente preferido debido a su facilidad de uso y una rica
colección de bibliotecas para análisis de datos, como pandas, NumPy y
matplotlib.
 R: Especializado en estadísticas y análisis de datos, es popular entre los

analistas cuantitativos.
 SQL: Fundamental para consultar bases de datos y extraer datos para

análisis.
 JavaScript: A veces se usa para crear visualizaciones interactivas en la

web.
50. ¿Cuál es el propósito principal de un Data Analyst?

s examinar y analizar datos para descubrir patrones, tendencias y proporcionar
información valiosa que respalde la toma de decisiones informadas en una organización.
51. Mencione 3 librerías importantes en análisis y visualización de datos
 pandas: Para la manipulación y análisis de datos tabulares.
 matplotlib: Para crear gráficos y visualizaciones estáticas.
 Seaborn: Una librería que se basa en matplotlib y simplifica la creación
de visualizaciones estadísticas más atractivas.
52. ¿Qué es importante aprender al inicio de una carrera como Data Analyst?
es importante aprender habilidades de manipulación de datos con herramientas como
Python y SQL,
53. ¿Cuál es la importancia de conocer las bases de dato de tu mina?
es crucial porque proporciona visibilidad sobre la producción, seguridad,
mantenimiento y eficiencia operativa.
54. ¿Cómo de presentan los hallazgos encontrados en los datos?
a través de gráficos, tablas, informes escritos y visualizaciones interactivas para
comunicar patrones, tendencias y conclusiones de manera efectiva a las partes
interesadas.
55. Busca en sitios de trabajo vacantes para Data Analyst, Data Scientist, Data
Engineers y Machine learning Engineers
56. ¿Cuál es la diferencia entre OLAP y OLTP?

La diferencia principal entre OLAP (Procesamiento Analítico en Línea) y OLTP
(Procesamiento de Transacciones en Línea) radica en su propósito y cómo gestionan los datos:
57. ¿Qué es el proceso ETL?
El proceso ETL (Extracción, Transformación y Carga) es un enfoque utilizado en la
gestión de datos
58. ¿Qué tipos de conocimientos matemáticos son útiles para comprender los datos
en el procesamiento de datos?
Los conocimientos matemáticos útiles incluyen álgebra lineal para comprender
transformaciones de datos, estadísticas para el análisis y la inferencia, y cálculo para
optimización y modelado matemático en el procesamiento de datos.
59. Mencione 3 herramientas o librerías claves en el procesamiento de datos.
pandas: Para la manipulación y análisis de datos tabulares.
Apache Spark: Para procesamiento de datos distribuido y análisis a gran escala.
SQL: Lenguaje de consulta estructurada para manipular y gestionar bases de datos
relacionales.
60. ¿Cuál es el lenguaje de programación principalmente utilizado por Data
Engineers?
es Python, debido a su versatilidad, amplia gama de bibliotecas para procesamiento de
datos y facilidad de integración con herramientas de Big Data como Apache Spark y Hadoop.
61. ¿Por qué es importante contar con un Data Enginner en una empresa minera?
para gestionar la recopilación, almacenamiento y procesamiento eficiente de grandes
volúmenes de datos de sensores y equipos. Esto permite tomar decisiones informadas, mejorar
la seguridad y optimizar la operación minera.
62. ¿Para qué se utiliza Docker en el procesamiento de datos?
para crear contenedores de software que encapsulan aplicaciones y sus dependencias,
garantizando un entorno consistente.
63. ¿Cuál es el objetivo principal de un Machine Learning Engineer?
Desarrollar y desplegar sistemas de Machine Learning que puedan aprender de datos y
realizar tareas específicas sin ser programados explícitamente, abordando problemas de
predicción, clasificación, optimización y toma de decisiones en diversas aplicaciones.
64. ¿Qué herramientas y librerías de análisis de datos son comunes en el campo de
Machine Learning?
pandas: Para la manipulación y análisis de datos tabulares.
NumPy: Para operaciones numéricas eficientes y manejo de matrices.
matplotlib y seaborn: Para visualización de datos.
scikit-learn: Para implementar algoritmos de Machine Learning.
Jupyter Notebook: Para crear y compartir documentos interactivos con código y
visualizaciones.
StatsModels: Para análisis estadístico.
TensorFlow y PyTorch: Para construir y entrenar modelos de aprendizaje
automático, especialmente para aprendizaje profundo.
XGBoost y LightGBM: Para algoritmos de gradient boosting.
spaCy y nltk: Para procesamiento de lenguaje natural (NLP).
OpenCV: Para visión por computadora.
65. Menciona un framework o librería popular de Machine Learning

TensorFlow es un framework popular de Machine Learning desarrollado por Google.
66. ¿Cuáles son algunos lenguajes de programación de alto nivel que se pueden
utilizar en Machine Learning?
Python: El más popular debido a su amplia comunidad y bibliotecas de ML.
R: Especializado en estadísticas y análisis de datos.
Julia: Con un rendimiento similar a C++ pero con sintaxis amigable.
Java y C#: A menudo utilizados en implementaciones empresariales de ML.
67. ¿Qué framework se sugiere para construir los primeros modelos de machine
learning?
se sugiere utilizar scikit-learn (sklearn) en Python. Es un framework de aprendizaje
automático de código abierto que es fácil de usar y ofrece una amplia gama de algoritmos para
tareas comunes de ML como clasificación y regresión.
68. ¿Qué lenguaje de programación se recomienda aprender para comenzar en
Machine Learning?
Python para comenzar en Machine Learning debido a su facilidad de uso, una amplia
variedad de bibliotecas y herramientas de Machine Learning (como TensorFlow y PyTorch) y
una gran comunidad de desarrollo en este campo.
69. ¿Qué tecnología se utiliza para el despliegue de modelo de Machine Learning?
contenedores (como Docker), servicios en la nube (AWS, Azure, Google Cloud), APIs
RESTful y frameworks web (Flask, Django) para aplicaciones en producción.
70. ¿Cuál es el primer paso recomendado para iniciar una carrera en Machine
Learning?
El primer paso es aprender programación en Python y fundamentos matemáticos,
incluyendo álgebra lineal y estadísticas, para comprender y aplicar algoritmos de Machine
Learning.
71. ¿Qué herramienta se utiliza comúnmente para trabajar con análisis de datos en
Python?
Una herramienta comúnmente utilizada para trabajar con análisis de datos en Python es
la biblioteca llamada "pandas".
72. ¿En qué parte del flujo de trabajo de la ciencia de datos interviene una Machine
Learning Enginner?
Interviene principalmente en la etapa de "Modelado y Entrenamiento de Modelos"
73. ¿Cuándo sería conveniente contratar una Machine Learning Enginner en una
mina?
Cuando se busque implementar soluciones avanzadas de monitoreo, predicción de
fallas, optimización de procesos o seguridad utilizando datos recopilados de sensores y equipos,
lo que puede mejorar la eficiencia y la seguridad en la operación minera.
74. ¿Cuál área de las matemáticas es importante para optimizar modelos en
Machine learning?
Álgebra lineal y cálculo
75. ¿Cuál es el primer paso recomendado para iniciar una carrera en Machine
Learning?
El primer paso recomendado para iniciar una carrera en Machine Learning es
desarrollar una base sólida en matemáticas y programación
76. ¿Una Machine Learning Engineer debe saber de lenguaje de programación de

alto y bajo nivel?
Sí, un ingeniero de Machine Learning generalmente debe tener conocimientos de
lenguajes de programación tanto de alto nivel como de bajo nivel, aunque la importancia de
cada uno puede variar según el contexto y las responsabilidades específicas de la traba.

Facultad de Ingenierí1

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Facultad de Ingenierí1

Cargado por

Copyright:

Formatos disponibles

UNT ING.

UNIVERSIDAD NACIONAL DE TRUJILLO

ESCUELA ACADÉMICO PROFESIONAL DE INGENIERÍA DE MINAS

12. ¿Cuál es el factor clave para definir el proceso en un proyecto de ciencia de

15. ¿Cuál es una razón para aprender Data Science?

19. ¿Qué oportunidades laborales ofrece la industria de Data Science e Inteligencia

 Aprendizaje Supervisado: Los modelos se entrenan utilizando ejemplos

 Aprendizaje Reforzado: Los modelos aprenden a través de la

 Aprendizaje Semisupervisado: Combina elementos de aprendizaje

 Aprendizaje por Transferencia: Los modelos entrenados en una tarea se

 Aprendizaje Profundo (Deep Learning): Utiliza redes neuronales

 Aprendizaje por Refuerzo Imitativo: Los modelos imitan el

 Aprendizaje No Paramétrico: No asume una forma de función

 Aprendizaje Paramétrico: Asume una forma de función específica con

31. ¿Cuáles con los lenguajes de programación más conocidos y utilizados en

 Limpieza de Datos: Identificar y tratar valores atípicos, valores faltantes y

 Exploración de Datos: Analizar datos para identificar patrones, tendencias y

 Visualización de Datos: Crear gráficos y visualizaciones para comunicar

 Análisis Estadístico: Realizar análisis estadísticos para obtener información

 Generación de Informes: Crear informes que resuman hallazgos y proporcionen

 Apoyo a la Toma de Decisiones: Proporcionar información que respalde la

 Automatización de Procesos: Automatizar tareas de análisis recurrentes para

 Colaboración: Trabajar con equipos interdisciplinarios, incluyendo científicos

 Desarrollo de Dashboards: Crear paneles interactivos para que otros usuarios

33. ¿Cuáles son algunas habilidades necesarias para un Data Scientist?

 Estadísticas: Comprender y aplicar conceptos estadísticos en el análisis de

 Manipulación de Datos: Habilidad para limpiar, transformar y preparar datos

 Aprendizaje Automático: Familiaridad con algoritmos y técnicas de Machine

 Visualización de Datos: Crear gráficos y visualizaciones efectivas para

 Herramientas de Ciencia de Datos: Utilizar librerías como pandas, NumPy y

 Comunicación: Habilidad para explicar hallazgos y presentar resultados de

 Pensamiento Crítico: Capacidad para abordar problemas complejos y tomar

 Conocimiento del Dominio: Comprender el contexto y los objetivos del

 Herramientas de Big Data: Familiaridad con herramientas como Hadoop y

 Ética de Datos: Conciencia de las implicaciones éticas y de privacidad en el

 Estadísticas: Comprender conceptos estadísticos básicos para analizar

 Manipulación de Datos: Aprender a limpiar, transformar y preparar

 Visualización de Datos: Crear gráficos y visualizaciones efectivas para

 Aprendizaje Automático: Familiarizarse con conceptos y técnicas de

 SQL: Conocer SQL para consultar y extraer datos de bases de datos.

 Herramientas de Ciencia de Datos: Utilizar librerías como pandas,

 Comunicación: Desarrollar habilidades para explicar resultados y

35. ¿Qué es un Data Scientist?

37. ¿Qué librerías de Python son comunes en la ciencia de datos?

40. ¿Un data Analyst debe saber programar?

a. Excel o Google Sheets para análisis básico.

a. Habilidad en la manipulación y limpieza de datos.

47. ¿Qué herramientas son líderes en visualización de datos?

 Power BI: De Microsoft, permite crear informes interactivos y tableros

 D3.js: Una biblioteca JavaScript potente y flexible para crear

 QlikView/Qlik Sense: Proporciona visualizaciones interactivas y

 Matplotlib y Seaborn: En Python, para visualizaciones personalizadas y

 ggplot2: En R, para visualizaciones de alta calidad.

 R: Especializado en estadísticas y análisis de datos, es popular entre los

 SQL: Fundamental para consultar bases de datos y extraer datos para

 JavaScript: A veces se usa para crear visualizaciones interactivas en la

50. ¿Cuál es el propósito principal de un Data Analyst?

56. ¿Cuál es la diferencia entre OLAP y OLTP?

65. Menciona un framework o librería popular de Machine Learning

76. ¿Una Machine Learning Engineer debe saber de lenguaje de programación de

También podría gustarte