Está en la página 1de 7

Introducción

Aunque el texto de Mahmood y Hussin (2018) se enfoca en la cuarta revolución

industrial (sus orígenes y características, su relación con el internet de las cosas, la función de

la información, la literatura de la información y el infoemprendimiento), también hace énfasis

en la aparición de los sistemas de Big Data, sus componentes, su relevancia en la era

tecnológica y su aporte en la optimización de las organizaciones, las empresas, las personas

y, en general, las sociedades.

En lo que respecta a la Big Data, el documento aborda sus atributos (volumen,

variedad, velocidad, veracidad y valor), diferenciándolos conceptualmente y

comprendiéndolos tanto particular como holísticamente; además, plantea cada una de las

funciones que asumen los sistemas de la Big Data con respecto al campo tecnológico, en

tanto “comprende el proceso de verificación, limpieza, cambio y modelado de datos, con el

objetivo de encontrar información útil para tomar decisiones” (Mahmood & Hussin, 2018,

pág. 324).

La intención del presente texto se circunscribe al abordaje de la veracidad de la Big

Data, que es el atributo que permite identificar la autenticidad y la integralidad de la

información que recorre las redes.


Veracidad de la Big Data: objetividad, verdad y credibilidad de la información

La Big Data, como exponen (Mahmood & Hussin, 2018), surge como respuesta al

fluido de información (que va desde publicaciones en redes sociales hasta transacciones

económicas) diversa e ilimitada que recorre la red, y sustenta la configuración de una cuarta

revolución industrial en la que los datos se aborden a la luz de tecnologías superiores, a fin de

alcanzar márgenes de error mínimos con respecto a la información que se maneja.

La Big Data implica la aparición diaria de 2.5 quintillones de bytes (Sevillano), lo que

a su vez justifica la insuficiencia de los sistemas de datos tradicionales en el análisis de la

complejidad que representa esa cantidad de información. Así pues, como bien indica el texto

de Mahmood & Hussin (2018), surge la necesidad de crear un sistema –Big Data- que se

armonice con el crecimiento de los sistemas móviles, las capacidades de procesamiento

rápidas, el acceso a internet de alta velocidad y las tecnologías avanzadas de almacenamiento

de datos, con el fin de “transformar procesos, empresas, sectores enteros, e incluso la propia

sociedad” (Montealegre, 2017, pág. 5).

Con el fin de armonizarse con dichas necesidades, la Big Data responde a una serie de

atributos o características, que pueden variar según la doctrina propuesta pero que

esencialmente se engloban en cinco categorías: volumen, variedad, velocidad, veracidad y

valor (Chen, Chiang, & Storey, 2012; Demchenko, 2013; Mahmood & Hussin, 2018).

Sin demérito de los otros factores, el presente documento abordará la importancia de

la veracidad de los datos. En ese orden de ideas, los sistemas de Big Data están obligados a

validar el grado de certidumbre de la mayor cantidad de datos que se recolectan a gran

velocidad (Sevillano) (Montealegre, 2017) y a distinguir, mediante el análisis de varias

fuentes, la información completa y auténtica de la que no lo es (Mahmood & Hussin, 2018),

sobre todo si se tiene en cuenta que con el crecimiento de la Big Data deviene el crecimiento
de la duda (Venkata, 2014). A tales efectos, la veracidad de la información se reconoce en la

identificación de cuatro atributos sustanciales (Guerrero & Rodríguez, 2013):

i) La integridad y autenticidad: es responsabilidad de los sistemas de Big Data

constatar la precisión de los datos en términos porcentuales, con el fin de fijar

valores en términos de autenticidad. Además, el correcto empleo de la

veracidad es lo que asegura que “los datos falsos, fraudulentos o no

autorizados no se introduzcan en el Big Data” (Sevillano, pág. 81).

ii) El origen y la reputación: la Big Data procura organizar la innumerable

cantidad de información, agregándole más valor a los datos que tienen

sustentos críticos, y revisando con especial cuidados aquellos relacionados con

subjetividades y tendencias.

iii) La disponibilidad: los sistemas de Big Data deben observar la propiedad de la

fuente de los datos, así como sus limitaciones, restricciones y autorizaciones

de uso, a fin de brindar mayor credibilidad a las soluciones propuestas.

iv) La responsabilidad: la veracidad, que actúa como limitante de la variedad y la

velocidad, permite filtrar la información (por procesos de eliminación y

reducción de datos erróneos), lo que garantiza la obtención de datos más

fiables.

En el cumplimiento de dichos atributos, la veracidad comporta tres variables

fundamentales: la objetividad, la verdad y la credibilidad, que se relacionan con dimensiones

secundarias como la integridad y la consistencia (Lukoionava & Rubin , 2013). La función de

estas variables es reducir el ruido1 y los potenciales errores relacionados con la información

relacionada, a fines de maximizar la certeza y la plausibilidad en la toma de decisiones con

respecto a los datos.

1
Errores léxicos y sintácticos (Venkata, 2014).
Abarcar objetivamente la información es uno de los mayores retos en la observancia

de la veracidad de los datos debido a que la objetividad no solo se relaciona con los hechos

sino también con los valores que les asignan a aquellos quienes brindan y quienes reciben

información (Lukoionava & Rubin , 2013). En este sentido, aunque la objetividad se asocia

primigeniamente con la verdad y la realidad y comporta la necesidad de sustentar los datos en

pruebas más o menos veraces, también es necesario tomar a consideración el entendimiento

subjetivo o situacional que se haga de la información recolectada, en tanto la objetividad no

es la verdad absoluta, sino la versión más confiable de la verdad material irrecuperable.

En lo que respecta a la dimensión de la verdad, la responsabilidad de los sistemas de

Big Data recae en la elaboración de cuestionarios que midan la intencionalidad de engaño por

parte de las fuentes que proveen la información (sobre todo si se tiene en cuenta que “con el

masivo crecimiento de la comunicación textual, el potencial para las personas de engañar por

medio de la comunicación mediada por las computadoras también ha crecido” (Lukoionava

& Rubin , 2013, pág. 7). Mediante la aplicación de dichas mediciones de engaño, la Big Data

verifica las intenciones de las fuentes y al mismo tiempo robustece los sentimientos de

confianza y credibilidad en los receptores de la información.

La credibilidad, por su parte, se mide simultáneamente desde la confianza y la

experticia que represente la fuente inspeccionada. Se entiende la confianza desde los valores

que la audiencia ha otorgado al emisor de la información, relacionados estos principalmente

con la intención de la información (“buena”) y sus índices de certeza. La experticia, por otro

lado, abarca el conocimiento, la reputación y la competencia de la fuente, lo que desemboca

en la atribución de niveles de autoridad (lo que no implica que las fuentes con autoridad no

puedan equivocarse) (Lukoionava & Rubin , 2013).


Cabe agregar que estas variables confluyen en la cabalidad del proceso ejercido por

los sistemas de Big Data, por lo que es recomendable hacer uso de las tres en un mismo

índice de veracidad que mida, simultánea y equitativamente, las dimensiones que comporta

cada una. Esto, sin embargo, no actúa como una regla inamovible en los casos en los que una

de las dimensiones sea determinante en la verificación de la confianza de la información

estudiada (por ejemplo, en un caso en el que se estudie el fraude en los datos, la variable de

verdad –con base en la que se efectúa el test de intencionalidad de engaño- tiene mayor peso

en el índice de veracidad) (Lukoionava & Rubin , 2013).

Finalmente, es necesario reafirmar la importancia de concebir el estudio de la

veracidad de los datos desde todas sus aristas. Lo mencionado en la línea anterior implica

que, aun comprendiendo las particularidades de cada uno de los atributos y cada una de las

variables contenidas en el índice de veracidad, y aceptando su empleo individual, es

pertinente anotar la importancia de analizar los datos holísticamente (sobre todo en las

instancias en las que se trabaje con Big Data) debido a que todos los atributos y las variables

están relacionados entre sí (el cuestionario de intencionalidad de engaño, usado como

medición de la variable de credibilidad, guarda relación directa con el atributo de

autenticidad, en el entendido de que ambos se preocupan por eliminar la información que sea

fraudulenta o falsa; por su parte, en el análisis del origen y la reputación de los datos

verificables se evidencia la influencia de la variable de objetividad, en tanto se miden los

sustentos fácticos de la información provista por la fuente junto con las subjetividades y

opiniones más o menos fuertes de los emisores y receptores de la información.)


Conclusiones

Aunque la veracidad de la Big Data no es uno de los valores predominantes en la

medición de la calidad de la información recolectada, sí permite evaluar la objetividad, la

confiabilidad y la verdad de los datos contenidos en internet, mediante el manejo efectivo del

contenido inherente y la expresión de incertidumbre de los atributos de la variable. En la

aproximación a la veracidad de los sistemas de la Big Data es importante, además, tener

conocimientos sobre los atributos y las variables que constituyen la variante de confiabilidad,

en especial porque se relacionan entre sí y dependen las unas de las otras.


Bibliografía

Guerrero, F., & Rodríguez, J. (2013). Diseño y desarrollo de una guía para la

implementación de un ambiente Big Data en la Universidad Católica de Colombia.

Bogotá: Universidad Católica de Colombia .

Lukoionava, T., & Rubin , V. (2013). Veracity Roadmap:Is Big Data Objective, Truthful and

Credible? Advances in Classification Research, 1-13.

Mahmood, M., & Hussin, N. (2018). Information in Conversion Era: Impact and Influence

from 4th Industrial Revolution. International Journal of Academic Research in

Business and Social Sciences, 320-328.

Montealegre, A. (2017). Importancia de la solución Big Data en la aplicación de movilidad

Uber Movement. Bogotá: Universidad Libre.

Sevillano, F. (s.f.). Big Data. EI, 71-86.

Venkata, L. (2014). Big Data and Veracity Challenges. IBM, 1-75.

También podría gustarte