Está en la página 1de 1

En este video, vamos a hablar de una nueva que generalmente no se cubre mucho.

Se
llama valencia. En pocas palabras, Valence se refiere a la Conectividad. Cuantos
más datos estén conectados, más altas serán las valencias. El término valencia
viene de la química. En química, hablamos de electrones centrales y electrones de
valencia de un átomo. Los electrones de valencia están en la capa más externa,
tienen el nivel de energía más alto y son responsables de la unión con otros
átomos. Esa valencia más alta resulta en una mayor boding, es decir, una mayor
conectividad. Esta idea se traspasa a nuestra definición del término valencia en el
contexto de big data. Los elementos de datos a menudo se conectan directamente
entre sí. Una ciudad está conectada con el país al que pertenece. Dos usuarios de
Facebook están conectados porque son amigos. Un empleado está conectado a su lugar
de trabajo. Data también podría estar conectado indirectamente. Dos científicos
están conectados, porque ambos son físicos. Para una recopilación de datos, la
valencia mide la relación entre los elementos de datos realmente conectados y el
número posible de conexiones que podrían ocurrir dentro de la colección. El aspecto
más importante de valencia es que la conectividad de datos aumenta con el tiempo.
La serie de gráficos de red proviene de un experimento social en el que se pidió a
los científicos asistentes a una conferencia que se reunieran con otros científicos
que no conocían antes. Después de varias rondas de reuniones, encontraron nuevas
conexiones mostradas por sus bordes rojos. El aumento de la valencia puede conducir
a comportamientos de grupos emergentes en redes de personas, como la creación de
nuevos grupos y coaliciones que tienen valores y metas compartidos. Un conjunto de
datos de alta valencia es más denso. Esto hace que muchas críticas analíticas
regulares sean muy ineficientes. Se deben adoptar métodos analíticos más complejos
para dar cuenta de la densidad creciente. Surgen desafíos más interesantes debido
al comportamiento dinámico de los datos. Ahora hay una necesidad de modelar y
predecir cómo la valencia de un conjunto de datos conectado puede cambiar con el
tiempo y el volumen. El comportamiento dinámico también conduce al problema de
detección de eventos, como ráfagas en la cohesión local en partes de los datos. Y
el comportamiento emergente en todo el conjunto de datos, , como el aumento de la
polarización en una comunidad.

También podría gustarte