Está en la página 1de 5

Aprendizaje esperado

2. Aplicar técnicas de aprendizaje supervisado y no supervisado para analizar datos y modelar problemas.

Indicadores de logro

2.1 Conocen fuentes de información en organizaciones comprendiendo estas.


2.2 Manejan datos ruidosos y faltantes, aplicando técnicas de aprendizaje supervisado y no supervisado.
2.3 Analizan datos de componentes principales.

z
P1. En la empresa donde se encuentra le piden definir de dónde pueden obtener los datos para posteriormente analizarlos.

¿Cuál de las siguientes alternativas NO representa una fuente de información?

d) Bases de datos

Retroalimentación
Las bases de datos no son una fuente de información definida, es una manera de almacenar la información.

P2. En la empresa donde se encuentra le piden definir de dónde pueden obtener los datos para posteriormente analizarlos.

¿Cuál de las siguientes alternativas NO corresponde a métodos utilizados en fuentes primarias?

a) Revisión bibliográfica

Retroalimentación
La revisión bibliográfica corresponde a fuentes de información secundarias.

P.3. En la empresa donde se encuentra le piden definir de dónde pueden obtener los datos para posteriormente analizarlos.

¿Cuál de las siguientes alternativas NO corresponde a la definición de ETL?

b) Evaluar el costo de implementación de un sistema de datos

Retroalimentación
Evaluar el costo de implementación de un sistema de datos tiene relación con una etapa previa a la extracción de los datos.

z
P1. Luego de definir las fuentes de datos debiera estar en condiciones de proceder con la limpieza y transformación.

De las siguientes alternativas: ¿Qué acción NO se debiera considerar a la hora de enfrentar datos faltantes?

d) Ninguna de las anteriores

Retroalimentación
Ninguna de las anteriores, ya que son todas son acciones a considerar a la hora de tener datos faltantes, dependiendo del
caso.
P2. Luego de definir las fuentes de datos debiera estar en condiciones de proceder con la limpieza y transformación.

De las siguientes alternativas: ¿Qué acción NO se debiera considerar a la hora de enfrentar datos anómalos o erróneos?

d) Ninguna de las anteriores

Retroalimentación
Ninguna de las anteriores, ya que todas son acciones que se deben considerar a la hora de tener datos anómalos o erróneos,
dependiendo del caso.

P3. Luego de definir las fuentes de datos debiera estar en condiciones de proceder con la limpieza y transformación.

De las siguientes alternativas: ¿Qué característica general de los atributos NO se debiera considerar a la hora de tener
todos los datos integrados?

a) Calcular un modelo de máquinas de aprendizaje

Retroalimentación
Calcular un modelo de máquinas de aprendizaje no corresponde, ya que los modelos se aplican de manera posterior de la
preparación y entendimiento inicial.

z
P1. Luego de definir las fuentes de datos debiera estar en condiciones de proceder con la limpieza y transformación.

De las siguientes alternativas: ¿Cuál de ellas NO corresponde a una técnica de reducción de dimensionalidad?

b) Análisis de regresión logística

Retroalimentación
Análisis de regresión logística NO corresponde a una técnica de reducción de dimensionalidad, ya que sirve para predecir el
resultado de una variable categórica.

P.2. Respecto al análisis de componentes principales podemos indicar lo siguiente:

l. Se genera que los nuevos atributos sean independientes entre sí y, además, que tengan mayor relevancia.
ll. Consiste en transformar los atributos originales en nuevos atributos
lll. Se basa solo en conceptos teóricos
lV. Se genera que los atributos sean dependientes entre sí y, además, que tengan mayor relevancia.

c) l y ll

Retroalimentación
El análisis de componentes principales es una transformación, en tanto, genera que los nuevos atributos se configuren de tal
manera que sean independientes entre sí y, además, los primeros tengan más relevancia que los últimos.

z
P3. ¿Cuál es la función o utilidad que tiene el análisis de componentes principales?

a) Reducir la dimensionalidad de un conjunto de datos

Retroalimentación
Técnica utilizada para describir un conjunto de datos en términos de nuevas variables (componentes) no correlacionadas.
Los componentes se ordenan por la cantidad de varianza original que describen, por ende, esta técnica es útil para reducir la
dimensionalidad de un conjunto de datos.

También podría gustarte