Está en la página 1de 14

23/7/22, 16:16 Actividad evaluable 5: Data Science y Big Data: Decisiones Basadas en Datos

Actividad evaluable 5
Fecha de entrega
11 de jul en 23:59
Puntos
20
Preguntas
20
Disponible
5 de jul en 0:00 - 25 de jul en 23:59
21 días
Límite de tiempo
Ninguno
Intentos permitidos
2

Volver a realizar el examen

Historial de intentos
Intento Hora Puntaje
MÁS RECIENTE Intento 1
76 minutos 14.33 de 20


Las respuestas se mostrarán tras su último intento

Puntaje para este intento:


14.33 de 20
Entregado el 23 de jul en 15:13
Este intento tuvo una duración de 76 minutos.

Pregunta 1 1
/ 1 pts

Pregunta 1. ¿Cuáles de los siguientes conceptos son ejemplos de redes?


(Seleccione todas las opciones que correspondan).

 
Las neuronas del cerebro humano

 
Facebook

 
La World Wide Web

 
El metro de Nueva York

https://globalcourses.xpro.mit.edu/courses/73/quizzes/1992 1/14
23/7/22, 16:16 Actividad evaluable 5: Data Science y Big Data: Decisiones Basadas en Datos

Todos ellos figuran como ejemplos de redes en el vídeo de


introducción y pueden modelarse como una red con nodos y
aristas.

Pregunta 2 1
/ 1 pts

Pregunta 2. Si quisiera anunciar un concierto de Justin Bieber en redes


sociales, ¿a quién debería darle una entrada gratis?

 
A la persona que tenga más seguidores

 
Al mayor fan de Justin Bieber.

 
A la persona con mayor influencia, es decir, a alguien con muchos
seguidores que, a su vez, también tienen muchos seguidores.

 
A la persona que viva más cerca del lugar del concierto.

Al dar la entrada a la persona con mayor influencia, la noticia tiene


un potencial mayor de difundirse a un mayor número de personas
debido a que su esfera de influencia es la más grande.

Pregunta 3 1
/ 1 pts

Pregunta 3. ¿Cuáles son ejemplos de redes dirigidas? (Seleccione todas


las opciones que correspondan).

 
Facebook

https://globalcourses.xpro.mit.edu/courses/73/quizzes/1992 2/14
23/7/22, 16:16 Actividad evaluable 5: Data Science y Big Data: Decisiones Basadas en Datos

 
Twitter

 
Red de referencias bibliográficas

 
Una red para personas que juegan juntas al golf

Una red dirigida contiene aristas que van de un nodo a otro. En


twitter, es posible seguir a un usuario y hacer que no te siga. Las
redes de citas bibliogáficas también son dirigidas porque los
artículos científicos previos no citan a aquellos artículos más
nuevos, que sí citan a los previos.

Pregunta 4 1
/ 1 pts

Pregunta 4. En una red bipartita, los nodos se pueden dividir en dos
conjuntos de manera que solo haya aristas entre ellos y no dentro de un
único conjunto. ¿Cuáles de las siguientes redes son bipartitas?
(Seleccione todas las opciones que correspondan).

 
Red de preferencias películas-personas (una arista indica que a alguien le
gusta una determinada película)

 
Twitter

 
Red de preferencias restaurantes-personas

 
Una red neuronal

https://globalcourses.xpro.mit.edu/courses/73/quizzes/1992 3/14
23/7/22, 16:16 Actividad evaluable 5: Data Science y Big Data: Decisiones Basadas en Datos

Las redes de restaurantes-personas y de películas-personas son


bipartitas porque las personas no puntúan a otras personas y los
restaurantes y películas no califican a otros restaurantes y
películas.

Incorrecto Pregunta 5 0
/ 1 pts

Pregunta 5. La popular teoría de los "seis grados de separación" defiende


que cualquier persona del planeta está conectada a otra a través de una
cadena de no más de seis amigos. Suponiendo que hubiera una matriz de
adyacencia universal para la amistad, ¿cómo comprobaría la veracidad de
esta afirmación?o?

 
La matriz de adyacencia no basta para hacerlo.

 
Calcularía la sexta potencia de la matriz de adyacencia y comprobaría si la
traza es positiva.

 
Calcularía la sexta potencia de la matriz de adyacencia y comprobaría si las
entradas diagonales son positivas.

 
Sumaría las seis primeras potencias de la matriz de adyacencia y
comprobaría si todas las entradas no diagonales son positivas.

Incorrecto Pregunta 6 0
/ 1 pts

Pregunta 6. ¿Cuál es la definición de la propiedad no dirigida de Markov


(también llamada "propiedad local de Markov")?

https://globalcourses.xpro.mit.edu/courses/73/quizzes/1992 4/14
23/7/22, 16:16 Actividad evaluable 5: Data Science y Big Data: Decisiones Basadas en Datos

 
Un nodo es independiente de todos los demás nodos.

 
Un nodo es condicionalmente indendiente del resto de nodos, dados sus
vecinos.

 
Un nodo es independiente respecto a todos los demás nodos, exceptuando
sus vecinos.

 
Si A, B y C son tres conjuntos de nodos, si C separa a A de B, A es
condicionalmente independiente de B dado C.

Incorrecto Pregunta 7 0
/ 1 pts

Pregunta 7. Alice, Bob, Christie y David son cuatro amigos que adoran las
fiestas. A Alice le gusta ir con Bob y David por separado. No obstante, no
le gusta ir con ambos a la vez, ya que luchan por llamar su atención.
Aunque, si Christie también va, Alice va más a gusto, ya que la proporción
entre hombres y mujeres se iguala (por simplificar, supongamos que solo
las preferencias de Alice importan a la hora de decidir quién va a la fiesta).
Si hiciéramos una simulación de esta situación mediante un modelo de
grafo no dirigido con cuatro nodos, ¿cuál de las siguientes afirmaciones
sería correcta? (Seleccione todas las opciones que correspondan).

 
El peso de la arista que conecta a Alice y Bob es positivo.

 
El peso de la arista que conecta a Alice y David es negativo.

 
El peso de la interacción de tercer orden entre Alice, Bob y David es
negativo.

 
El peso de la interacción entre Alice y Christie es negativo.

https://globalcourses.xpro.mit.edu/courses/73/quizzes/1992 5/14
23/7/22, 16:16 Actividad evaluable 5: Data Science y Big Data: Decisiones Basadas en Datos

 
El peso de la interacción de cuarto orden entre Alice, Bob, Christie y David
es positivo.

Pregunta 8 1
/ 1 pts

Pregunta 8. Las distribuciones gaussianas se utilizan en muchas ramas de


la ciencia, incluso en los modelos de grafo. Uno de los principales motivos
de su ubicuidad es el teorema del límite central, que defiende que:

 
El límite de cualquier secuencia de variables aleatorias es una gaussiana.

 
La suma de un número considerable de variables aleatorias independientes
tiende a una distribución normal.

 
La suma de variables gaussianas aleatorias independientes también es una
gaussiana.

 
En la naturaleza se observan con frecuencia distribuciones gaussianas.

La definición del Teorema del Límite Central es que la suma de un


gran número de variables aleatorias independientes tiende a una
distribución normal.

Incorrecto Pregunta 9 0
/ 1 pts

Pregunta 9. Supongamos que queremos conocer una red subyacente por


medio de un método que elimine las aristas de manera secuencial. Para
https://globalcourses.xpro.mit.edu/courses/73/quizzes/1992 6/14
23/7/22, 16:16 Actividad evaluable 5: Data Science y Big Data: Decisiones Basadas en Datos

ello, empezamos con un grafo completo y:

 
Quitamos las aristas que contengan menos información.

 
Quitamos las aristas del nodo con más conexiones.

 
Por cada dos nodos A y B conectados, comprobamos si A es independiente
respecto a B. En caso afirmativo, eliminamos la arista.

 
Por cada dos nodos A y B conectados, comprobamos si A es independiente
respecto a B dados todos los demás nodos. En caso afirmativo, eliminamos
la arista.

Pregunta 10 1
/ 1 pts

Pregunta 10. La centralidad del vector propio de un nodo tiene la


propiedad deseable de ser proporcional a la suma de la centralidad de sus
vecinos. Se trata de un mejor modo de medir la influencia de una persona
en comparación a la métrica del número de amigos porque:

 
Tiene en cuenta no solo el número de amigos, sino también la influencia
que tiene cada uno.

 
Es más fácil de calcular

 
Todos los nodos dan 0 si el grafo subyacente es un grafo acíclico dirigido
(DAG)

 
Ninguna de las anteriores.

https://globalcourses.xpro.mit.edu/courses/73/quizzes/1992 7/14
23/7/22, 16:16 Actividad evaluable 5: Data Science y Big Data: Decisiones Basadas en Datos

Para medir con precisión la cantidad de influencia que tiene una


persona, no puedes mirar solamente su cantidad de amigos.
También tienes que considerar cuán influyente es cada amigo para
saber el número total de personas a las que puedes llegar.

Pregunta 11 1
/ 1 pts

Pregunta 11. Imagine que es el Secretario de Transportes de EE. UU. y ha


tomado la decisión de doblar la capacidad de un aeropuerto cualquiera
para reducir el estrés del sistema. Para elegir el aeropuerto, el mejor
criterio sería:

 
La centralidad de vector propio

 
La centralidad de cercanía

 
La centralidad de intermediación de los nodos

 
La centralidad de intermediación de las aristas

Este cambio aumenta el tamaño del aeropuerto (nodo) y no el


medio de transporte hacia o desde el aeropuerto (arista). Por lo
tanto, el mejor criterio para elegir el aeropuerto es la centralidad de
intermediación de los nodos.

Pregunta 12 1
/ 1 pts

Pregunta 12. A continuación, centre su atención en la red de carreteras. Le


gustaría duplicar la capacidad de una carretera cualquiera para reducir el
tráfico en general. En este caso, el mejor criterio para elegir la carretera
sería:
https://globalcourses.xpro.mit.edu/courses/73/quizzes/1992 8/14
23/7/22, 16:16 Actividad evaluable 5: Data Science y Big Data: Decisiones Basadas en Datos

 
La centralidad de vector propio

 
La centralidad de cercanía

 
La centralidad de intermediación de los nodos

 
La centralidad de intermediación de las aristas

Este cambio altera los medios de transporte y la forma en que un


coche se desplaza de un punto a otro (arista). Por lo tanto, el mejor
criterio para elegir la carretera es la centralidad de las aristas.

Parcial
Pregunta 13 0.33
/ 1 pts

Pregunta 13. ¿Cuáles son algunas de las principales características de las


redes de gran escala? (Seleccione todas las opciones que correspondan).

 
El coeficiente de agrupamiento

 
La distribución de grado

 
El rango de página

 
El diámetro

 
La densidad de red

Pregunta 14 1
/ 1 pts

Pregunta 14. Supongamos que estamos haciendo un simulacro de la


propagación de una enfermedad mediante el modelo SI en un grafo de
grado 3. Si p es la probabilidad de que la enfermedad se propague por una
https://globalcourses.xpro.mit.edu/courses/73/quizzes/1992 9/14
23/7/22, 16:16 Actividad evaluable 5: Data Science y Big Data: Decisiones Basadas en Datos

arista, ¿cuáles de las siguientes afirmaciones son correctas? (Seleccione


todas las que correspondan).

 
Si p = 0,9, se trata de una epidemia que probablemente se propagará a
muchos nodos.

 
Si p = 0,1, se trata de una epidemia que probablemente se propagará a
muchos nodos.

 
Si p = 0,3, es probable que la epidemia desaparezca pronto.

 
Si p = 0,6, es probable que la epidemia desaparezca pronto.

Para calcular esto, multiplicamos la probabilidad por el grado. Si


este valor es menor que 1, la enfermedad se extinguirá.

Pregunta 15 1
/ 1 pts

Pregunta 15. El algoritmo voraz (greedy) que se utiliza para hallar el


subconjunto de K nodos que debemos activar funciona gracias a que:

 
Probamos cada posible subconjunto de K nodos y elegimos el mejor.

 
Elegimos K nodos al azar.

 
Realizamos una simulación de Monte Carlo empezando por cada nodo y
seleccionando los mejores K nodos como nuestro subconjunto.

https://globalcourses.xpro.mit.edu/courses/73/quizzes/1992 10/14
23/7/22, 16:16 Actividad evaluable 5: Data Science y Big Data: Decisiones Basadas en Datos

 
Buscamos el mejor nodo dado el conjunto de activación actual y añadimos
ese nodo de forma iterativa a dicho conjunto hasta que se hayan elegido los
K nodos.

Un algoritmo voraz (greedy) siempre toma la mejor opción en el


paso actual. Encontrar el mejor nodo dado el conjunto de
activación actual satisface la propiedad "voraz".

Pregunta 16 1
/ 1 pts

Pregunta 16. ¿Cuáles de las siguientes afirmaciones sobre el genoma son


correctas? (Seleccione todas las que correspondan).

 
El genoma de una persona es independiente del de su hermano.

 
El genoma de una persona es independiente del de su hermano dados los
genomas de sus padres.

 
El genoma de una persona es independiente de los de sus abuelos dados
los genomas de sus padres.

 
El genoma de una persona es independiente del de sus padres dados los
genomas de sus abuelos.

Los genomas son un tipo de grafo y satisfacen la propiedad local


de Markov.

https://globalcourses.xpro.mit.edu/courses/73/quizzes/1992 11/14
23/7/22, 16:16 Actividad evaluable 5: Data Science y Big Data: Decisiones Basadas en Datos

Pregunta 17 1
/ 1 pts

Pregunta 17. No es fácil calcular la distribución de probabilidad de un


único nodo en un modelo de grafo no dirigido. Esto se debe a que:

 
Los nodos no están dirigidos, de modo que es imposible determinar qué
nodo influye en cuál.

 
Otros nodos pueden influir en el nodo directa o indirectamente y debe
considerarse el efecto que esto tiene.

 
Es difícil saber exactamente qué otros nodos influyen en el nodo en
cuestión.

 
La distribución de probabilidad podría depender de unos parámetros
desconocidos.

"Las relaciones directas e indirectas hacen que estas


distribuciones sean difíciles de calcular porque hay que comprobar
todas estas relaciones, lo cual es costoso desde el punto de vista
computacional".

Pregunta 18 1
/ 1 pts

Pregunta 18. Como ya vimos en el caso de los grafos de cadena, el


algoritmo de paso de mensajes debe empezar con nodos de grado 1. Esto
no supone un problema cuando se quiere hacer la generalización a los
grafos de árbol, ya que:

https://globalcourses.xpro.mit.edu/courses/73/quizzes/1992 12/14
23/7/22, 16:16 Actividad evaluable 5: Data Science y Big Data: Decisiones Basadas en Datos

 
Los grafos de árbol son iguales a los grafos de cadena, pero más largos.

 
Los grafos de árbol tienen nodos hoja (leaf nodes), que tienen grado 1.

 
En aplicaciones reales no se encuentran grafos de árbol sin nodos de grado
1.

 
Ninguna de las anteriores.

Los grafos de árbol tienen nodos hoja que son de grado 1, por lo
que se alinean perfectamente con el algoritmo de paso de
mensajes porque también comienzan en grado 1.

Pregunta 19 1
/ 1 pts

Pregunta 19. ¿En cuáles de las siguientes aplicaciones se utilizan los


modelos ocultos de Markov (HMM)? (Seleccione todas las que
correspondan).

 
Reconocimiento de voz

 
Procesamiento de texto

 
Resolución de ecuaciones diferenciales

 
Análisis de datos de series temporales

https://globalcourses.xpro.mit.edu/courses/73/quizzes/1992 13/14
23/7/22, 16:16 Actividad evaluable 5: Data Science y Big Data: Decisiones Basadas en Datos

Los Modelos Ocultos de Markov (Hidden Markov Models)


representan relaciones temporales y tratan con series de acciones.
Las ecuaciones diferenciales carecen de la relación temporal que sí
tienen las otras tres aplicaciones.

Incorrecto
Pregunta 20 0
/ 1 pts

Pregunta 20. Supongamos que la ganancia de nuestro filtro Kalman es


elevada. ¿Cuáles de las siguientes afirmaciones son correctas?
(Seleccione todas las que correspondan).

 
El filtro hace hincapié en datos pasados antes que en los de observaciones
actuales.

 
El filtro hace hincapié en observaciones actuales antes que en datos
pasados.

 
El output del filtro es suave.

 
El output del filtro es muy sensible.

Puntaje del examen:


14.33 de 20

https://globalcourses.xpro.mit.edu/courses/73/quizzes/1992 14/14

También podría gustarte