Está en la página 1de 15

 Messages 2

 JARED ABIGAIL VALENCIA SALVADOR 

 MINERIA DE DATOS A_2020-1 Semana 9 Cuestionario Cap.6 Data Mining.- Concepts and Techniques

Started on Monday, 27 July 2020, 2:49 PM


State Finished
Completed on Monday, 27 July 2020, 2:59 PM
Time taken 10 mins 39 secs
Grade 10.00 out of 10.00 (100%)

Question 1 Los patrones frecuentes de un conjunto de datos pueden ser:


Correct

Mark 1.00 out of Conjunto de Una colección de elementos que aparecen frecuentemente juntos en un conjunto de datos de transacción.
1.00 elementos:

Puede referirse a diferentes formas como subgrafías, subárboles o subredes, que se pueden combinar con conjuntos de elementos o subs
Subestructura:

Patrón Una subestructura que ocurre con frecuencia.


estructurado:

Patrón secuencial que ocurre con frecuencia en una base de datos, de un historial de compras.
Subsecuencia:

Respuesta correcta
The correct answer is: Conjunto de elementos: – Una colección de elementos que aparecen
frecuentemente juntos en un conjunto de datos de transacción., Subestructura: – Puede
referirse a diferentes formas como subgrafías, subárboles o subredes, que se pueden combinar
con conjuntos de elementos o subsecuencias., Patrón estructurado: – Una subestructura que
ocurre con frecuencia., Subsecuencia: – Patrón secuencial que ocurre con frecuencia en una
base de datos, de un historial de compras.

Question 2 Las reglas de asociación para minería de datos consisten en encontrar primero un conjunto de
Correct elementos frecuentes (conjuntos de elementos, como A y B, que satisfacen un umbral de
soporte mínimo o un porcentaje de la tarea relevante de la fila), de las cuales reglas de
Mark 1.00 out of
asociación fuertes, en forma de A implica B son generadas.
1.00

Select one:
a. Verdadero

b. Falso

Respuesta correcta
The correct answer is: Verdadero

/
Question 3 En general, la extracción de reglas de asociación se puede ver como un proceso de dos pasos:
Correct
Encontrar
Mark 1.00 out of
todos los
1.00
conjuntos Cada conjunto de elementos se producirá al menos con la misma frecuencia que un recuento de soporte mínimo predeterminado, min sup.
de
elementos
frecuentes:

Generar
reglas de
asociación
sólidas a
partir de Las reglas deben satisfacer un soporte mínimo (min. support) y una confianza mínima (min. confidence)
los
conjuntos
de
elementos
frecuentes:

Respuesta correcta
The correct answer is: Encontrar todos los conjuntos de elementos frecuentes: – Cada conjunto
de elementos se producirá al menos con la misma frecuencia que un recuento de soporte
mínimo predeterminado, min sup., Generar reglas de asociación sólidas a partir de los
conjuntos de elementos frecuentes: – Las reglas deben satisfacer un soporte mínimo (min.
support) y una confianza mínima (min. confidence)

Question 4 Un área popular de aplicación del descubrimiento de patrones y asociaciones es el análisis de


Correct la cesta de la compra, que estudia los hábitos de compra de los clientes

Mark 1.00 out of


Select one:
1.00
a. Falso

b. Verdadero

Respuesta correcta
The correct answer is: Verdadero

Question 5 En el algoritmo de tipo A priori, se presenta la propiedad llamada antimonotonicidad en el


Correct sentido de que si un conjunto no puede pasar una prueba, todos sus superconjuntos también
fallarán en la misma prueba.
Mark 1.00 out of
1.00
Select one:
a. Falso

b. Verdadero

Respuesta correcta
The correct answer is: Verdadero

Question 6 Con respecto a las medidas de evaluación de patrones, una medida es nula-invariante si su
Correct valor está libre de la influencia de las transacciones nulas (es decir, las transacciones que no
contienen ninguno de los conjuntos de elementos que se examinan).
Mark 1.00 out of
1.00
Select one:
a. Verdadero
b. Falso

Respuesta correcta
The correct answer is: Verdadero

/
Question 7 El algoritmo de tipo patrón de crecimiento frecuente:
Correct
Select one:
Mark 1.00 out of
1.00 a. Construye una estructura de datos altamente compacta (un árbol FP) para comprimir la
base de datos de transacciones original.

b. En lugar de emplear la estrategia de generar y probar métodos similares a Apriori, se


centra en el crecimiento frecuente de patrones (fragmentos)
c. Evita la costosa generación de candidatos, lo que resulta en una mayor eficiencia.

d. Es un método para extraer conjuntos de elementos frecuentes sin generación de


candidatos.

e. Todas las opciones

Respuesta correcta
The correct answer is: Todas las opciones

Question 8 Entre las medidas de evaluación de patrones, se examinó:


Correct

Mark 1.00 out of Max_confidence:


1.00
Índice de desequilibrio:

Kulczynski:

Lift:

Coseno:

All_confidence:

X2:

Respuesta correcta
The correct answer is: – Max_confidence:,

– Índice de desequilibrio:, –

Kulczynski:, – Lift:, – Coseno:,

– All_confidence:, – X2:

Question 9 El algoritmo que utiliza datos en formato vertical (Eclat):


Correct
Select one:
Mark 1.00 out of
1.00 a. Todas las opciones

b. Ninguna de las opciones


c. Es un método que transforma un conjunto de datos de transacciones dado en formato de
datos horizontal TID-itemset en formato de datos verticales ítem- TID_set.

d. Extrae el conjunto de datos transformados mediante intersecciones TID_set en función de


la propiedad a priori y técnicas de optimización adicionales como diffset.

Respuesta correcta
The correct answer is: Todas las opciones

/
2
Question 10 Entre las medidas de evaluación de patrones, se examinó: lift , X , all_confidence,
Correct max_confidence, Kulczynski y el coseno, y se demostró que las dos primeras no son nula-
invariantes. Es decir, presentan dificultad para distinguir relaciones de patrones entre conjuntos
Mark 1.00 out of
de elementos.
1.00

Select one:
a. Verdadero

b. Falso

Respuesta correcta
The correct answer is: Verdadero

/
 Messages 2
 JARED ABIGAIL VALENCIA SALVADOR 

 MINERIA DE DATOS A_2020-1 Capítulo 5

Cuestionario Cap.10: Cluster Analysis - Basic Concepts and Methods - "Data mining, Concepts and Techniques - Han, J., Pei,
J., & Kamber, M. (2011)"

Started on Monday, 24 August 2020, 2:48 PM


State Finished
Completed on Monday, 24 August 2020, 2:59 PM
Time taken 10 mins 47 secs
Marks 10.00/10.00
Grade 2.50 out of 2.50 (100%)

Question 1 STING es una técnica de agrupación de múltiples


Correct resoluciones basada en cuadrículas en la que el área
espacial de incrustación de los objetos de entrada se
Mark 1.00 out of
divide en celdas rectangulares. Varios niveles de
1.00
estas celdas rectangulares corresponden a diferentes
niveles de resolución y forman una estructura
jerárquica: cada celda en un nivel alto se divide para
formar una serie de celdas en el siguiente nivel
inferior.

Select one:
True

False

The correct answer is 'True'.

/
Question 2 El método basado en cuadrículas primero cuantifica
Correct el espacio del objeto en un número finito de celdas
que forman una estructura de cuadrícula y luego
Mark 1.00 out of
realiza la agrupación en la estructura de cuadrícula.
1.00

Select one:
True

False

The correct answer is 'True'.

Question 3 El análisis de clústeres se puede usar como una


Correct herramienta de minería de datos independiente para
obtener información sobre la distribución de datos, o
Mark 1.00 out of
como un paso de preprocesamiento para otros
1.00
algoritmos de minería de datos que operan en los
clústeres detectados.

Select one:
True

False

The correct answer is 'True'.

Question 4 Un método jerárquico crea una descomposición


Correct jerárquica del conjunto dado de objetos de datos,
según como se forme la descomposición puede
Mark 1.00 out of
clasificarse como:
1.00

Select one:
a. ii. Divisivo

b. i & ii
c. Ninguna de las opciones

d. i. Aglomerativo

Your answer is correct.


The correct answer is: i & ii

/
Question 5 Los principales métodos de agrupación son:
Correct
Select one:
Mark 1.00 out of
1.00 a. Métodos de partición

b. Métodos jerárquicos
c. Todas las opciones

d. Métodos basados en densidad

e. Métodos basados en cuadrículas

Your answer is correct.


The correct answer is: Todas las opciones

Question 6 Un clúster es una colección de objetos de datos que


Correct son similares entre sí dentro del mismo clúster pero
diferentes a los objetos de otros clústeres.
Mark 1.00 out of
1.00
Select one:
True
False

The correct answer is 'True'.

Question 7 El procedimiento del algoritmo de k-medias se


Correct resume en:

Mark 1.00 out of


1.00 (1) elegir arbitrariamente k objeto de D como los
centros del grupo inicial;
(2) repetir
(3) (re) asignar cada objeto al grupo al que el
objeto es más similar, en función del valor medio
de los objetos del grupo;
(4) calcular el valor medio de los objetos para
cada agrupación;
(5) hasta que no haya cambios

Select one:
True

False

The correct answer is 'True'.


/
Question 8 Los métodos de partición típicos incluyen:
Correct
Select one:
Mark 1.00 out of
1.00 a. CLARANS

b. k-medoids
c. Todas las opciones

d. k-medias

Your answer is correct.


The correct answer is: Todas las opciones

Question 9 Chameleon determina la similitud entre cada par de


Correct grupos Ci y Cj de acuerdo con su interconectividad y
su cercanía relativas, donde la cercanía relativa está
Mark 1.00 out of
definida por:
1.00

Select one:

a.

b.

Your answer is correct.

The correct answer is:

Question 10 La evaluación de agrupamiento:


Correct
Select one:
Mark 1.00 out of
1.00 a. i & ii
b. ii. Evalúa la calidad de los resultados generados
por un método de agrupamiento

c. Ninguna de las opciones

d. i. Evalúa la viabilidad del análisis del


agrupamiento en un conjunto de datos.

Your answer is correct.


The correct answer is: i & ii
/
/
 Messages 2
 JARED ABIGAIL VALENCIA SALVADOR 

 MINERIA DE DATOS A_2020-1 Semana 12

Cuestionario Cap.11: Redes Neuronales - "The Elements of Statistical Learning"

Started on Monday, 17 August 2020, 2:48 PM


State Finished
Completed on Monday, 17 August 2020, 2:59 PM
Time taken 10 mins 53 secs
Marks 9.00/10.00
Grade 2.25 out of 2.50 (90%)

Question 1 Una red neuronal es un modelo (estadístico no lineal)


Correct de clasificación o regresión de dos etapas,
generalmente representado por un diagrama de red.
Mark 1.00 out of
1.00
Select one:
True

False

The correct answer is 'True'.

Question 2 Con la función de activación softmax y la función de


Correct error de entropía cruzada, el modelo de red neuronal
es exactamente un modelo de regresión logística
Mark 1.00 out of
lineal en las unidades ocultas, y todos los parámetros
1.00
se estiman por máxima verosimilitud.

Select one:
True

False

The correct answer is 'True'.

/
Question 3 Tanto la regresión de búsqueda de proyecciones
Correct (PPR), como las redes neuronales toman funciones
no lineales de combinaciones lineales
Mark 1.00 out of
("características derivadas") de las entradas. Este es
1.00
un enfoque poderoso y muy general para la regresión
y la clasificación, y se ha demostrado que compite
bien con los mejores métodos de aprendizaje en
muchos problemas.

Select one:
True

False

The correct answer is 'True'.

Question 4 Con respecto al ajuste de redes neuronales, por lo


Incorrect general, no se requiere el minimizador global de R
(θ), ya que es probable que sea una solución
Mark 0.00 out of
sobreajustada. En cambio, es necesario cierta
1.00
regulación: esto se logra directamente a través de un
término de penalización, o indirectamente mediante
detención anticipada.

Select one:
True
False

The correct answer is 'True'.

/
Question 5 En general, se suele hacer comparaciones de
Correct rendimiento de las redes neuronales bayesianas con:

Mark 1.00 out of


Select one:
1.00
a. Redes neuronales agrupadas

b. Todas las opciones


c. Redes neuronales potenciadas

d. Bosques aleatorios

e. Árboles potenciados

Respuesta correcta
The correct answer is: Todas las opciones

/
Question 6 La siguiente figura muestra la arquitectura de cinco
Correct redes utilizadas en un ejemplo de datos de código
postal. El ejemplo se basa en una tarea de
Mark 1.00 out of
reconocimiento de caracteres: clasificación de
1.00
números escritos a mano. Indicar las características
de las cinco redes diferentes que se ajustaron a los
datos:

Red- Una capa oculta, 12 unidades ocultas completamente conectadas.


2:

Red- Dos capas ocultas conectadas localmente.


3:

Red- Dos capas ocultas, conectadas localmente con el peso compartido.


4:

Red- Dos capas ocultas, conectadas localmente, dos niveles de peso compartido.
5:

Red- Sin capa oculta, equivalente a regresión logística multinomial.


1:

Respuesta correcta
The correct answer is: Red-2: – Una capa oculta, 12
unidades ocultas completamente conectadas., Red-3:
– Dos capas ocultas conectadas localmente., Red-4:
– Dos capas ocultas, conectadas localmente con el
peso compartido., Red-5: – Dos capas ocultas,
conectadas localmente, dos niveles de peso
compartido., Red-1: – Sin capa oculta, equivalente a
regresión logística multinomial. /
Question 7 El enfoque bayesiano funciona bien para modelos
Correct parametrizados suavizados, como las redes
neuronales; todavía no está claro que funcione tan
Mark 1.00 out of
bien para modelos no suavizados como los árboles.
1.00

Select one:
True
False

The correct answer is 'True'.

Question 8 En el procedimiento de retropropagación o regla delta


Correct (Widrow y Hoff, 1960), los componentes
computacionales de la entropía cruzada tienen la
Mark 1.00 out of
misma forma que los de la función de la suma de
1.00
errores al cuadrado. Las ventajas son su naturaleza
simple y local, ya que en el algoritmo cada unidad
pasa y recibe información solo hacia y desde
unidades que comparten una conexión. Por lo tanto,
se puede implementar de manera eficiente en una
computadora de configuración paralela.

Select one:
True

False

The correct answer is 'True'.

Question 9 El modelo de regresión de búsqueda de proyecciones


Correct (PPR), que evolucionó en el dominio de la estadística
semiparamétrica y el suavizado, tiene la siguiente
Mark 1.00 out of
forma:
1.00

Select one:
True

False

The correct answer is 'True'.

/
Question 10 Con respecto al ajuste de redes neuronales, el
Correct modelo tiene parámetros desconocidos, a menudo
llamados pesos, y buscamos valores para ellos que
Mark 1.00 out of
hagan que el modelo se ajuste bien a los datos de
1.00
entrenamiento. Denotamos el conjunto completo de
pesos por θ, que consta de:

Select one:
True

False

The correct answer is 'True'.