Está en la página 1de 11

1

Big data y programación en paralelo

Juan Pablo Chavarria Correa

Institución Universitaria Pascual Bravo

ET0112 – Matemáticas Discretas

Ing. Ramiro Grisales Montoya

28 de agosto de 2022
2

Introducción

En el presente abarcaremos dos paradigmas o modelos que se presentan en la actualidad

como grandes pioneros en el manejo, administración, clasificación e industrialización de datos

que representan grandes avances tecnológicos en la actualidad aunque son temas o estudios de

constante evolución, se presenta una breve línea de tiempo de ambos temas donde se muestra el

avance que ha tenido estos temas atreves del tiempo, aunque estos temas sean comunes su

información histórica está muy esparcida en la red; la Big data, Cuando hablamos de Big Data

nos referimos a conjuntos de datos o combinaciones de conjuntos de datos cuyo tamaño

(volumen), complejidad (variabilidad) y velocidad de crecimiento (velocidad) dificultan su

captura, gestión, procesamiento o análisis mediante tecnologías y herramientas convencionales;

La programación paralela, modelo de programación que permite a un ordenador utilizar múltiples

recursos simultáneamente para resolver problemas de cálculo, paradigma divide y vencerás,

método elegante de resolver problemas simplemente se divide el problema en problemas más

pequeños de la misma clase, entre otros paradigmas; se plantea el impacto evolutivo exponencial

que tienen la big data y la programación paralela para el manejo de datos y la sociedad.
3

Big data y Programación Paralela

Big data

Nuestra vida diaria está siendo observada en todo momento desde el mismo momento de

salir de nuestra casa, sin querer estoy generando datos. Cuando conectas un dispositivo digital,

como el GPS del coche estás dejando un rastro digital cargado de información. Al igual que

cuando envías un email o manejas un teléfono inteligente (smartphone), usas una red social, usas

una tarjeta de crédito o haces la compra semanal. Son sólo unos ejemplos de la cotidianidad de la

información digital. La popularización del término Big-data hace muy pocos años se ha debido a

su utilización por las grandes compañías de las tecnologías de la información a mejorar las

demandas electrónicas (ventas on-line) de sus clientes e intentar orientar las compras de forma

que estas fueran más dirigidas al propio cliente, más amigables y más próximas.

La sociedad crea datos y más datos y cada vez existen más dispositivos y más eficientes

para almacenarlos. Los datos son vistos como una infraestructura o un capital en sí mismos para

la organización ya sea pública o privada que disponga de ellos. Según Chui (2011) estas grandes

cantidades de datos se están convirtiendo en factores de producción esenciales dentro de cada

sector productivo. Dos estudios realizados por Manyika y otros (2011) del McKinsey Global

Institute y por Andrew McAfee y Erik Brynjolfsson (2012) de la Harvard Business Review

Antonio Monleón-Getino El impacto del Big-data en la SI 428 Historia y Comunicación Social

Vol. 20, Núm. 2 (2015) 427-445 indican que el número de datos en actualmente inmanejable.

Aquí van unos ejemplos citados por estos estudios: • El 90 por ciento de los datos del mundo ha

sido creado en los últimos dos años. • Un disco duro que contiene toda la música del mundo sólo

vale unos 500€ • En el año 2010 había ya 5.000 millones de teléfonos móviles • Durante 2012,

cada día se generaron alrededor de 2,5 exabytes de información. Este número se dobla
4

aproximadamente cada 40 meses. Las empresas capturan miles de millones de bytes de

información sobre sus clientes, proveedores y sus operaciones. Millones de sensores conectados

en red están presentes en dispositivos tales como teléfonos móviles, sistemas de detección o redes

sociales. Las personas, bien sea con teléfonos inteligentes (smartphones) o a través de redes

sociales estimulan el crecimiento exponencial de la información. El término Big-data es confuso,

ya que si son grandes datos ¿a qué tamaño se refiere?, no hay un tamaño definido, pero se estima

entre en más de 2 Terabytes Así según la bibliografía consultada no se refiere a un tamaño de

información específica (IBM, 2014), ya que es usualmente utilizado cuando se habla en términos

de petabytes (PB) y exabytes (EB) de datos. La información digital se mide en bytes1 que es la

unidad básica de información, a partir de ésta se construye la escala de medida digital de bytes: •

Kylobyte (KB) = 103 = 1,000 bytes • Megabyte (MB) = 106 = 1,000,000 bytes • Gigabyte (GB)

= 109 = 1,000,000,000 bytes • Terabyte (TB) = 1012 = 1,000,000,000,000 byt…

Resumiendo, la complejidad de la Big data se debe a la naturaleza no estructurada de los

miles de millones de datos que se generan por las tecnologías de la actualidad, entonces estos

conjuntos  cuyo tamaño (volumen), complejidad (variabilidad) y velocidad de crecimiento

(velocidad) dificultan su captura, gestión, procesamiento o análisis mediante tecnologías y

herramientas convencionales, tales como bases de datos relacionales y estadísticas

convencionales o paquetes de visualización, dentro del tiempo necesario para que sean útiles.

¿importancia de la Big data? Lo que hace que Big Data sea tan útil para muchas empresas es el

hecho de que proporciona respuestas a muchas preguntas que las empresas ni siquiera sabían que

tenían. En otras palabras, proporciona un punto de referencia. Con una cantidad tan grande de

información, los datos pueden ser moldeados o probados de cualquier manera que la empresa
5

considere adecuada. Al hacerlo, las organizaciones son capaces de identificar los problemas de

una forma más comprensible.

La recopilación de grandes cantidades de datos y la búsqueda de tendencias dentro de los

datos permiten que las empresas se muevan mucho más rápidamente, sin problemas y de manera

eficiente. También les permite eliminar las áreas problemáticas antes de que los problemas

acaben con sus beneficios o su reputación.

El análisis de Big Data ayuda a las organizaciones a aprovechar sus datos y utilizarlos

para identificar nuevas oportunidades. Eso, a su vez, conduce a movimientos de negocios más

inteligentes, operaciones más eficientes, mayores ganancias y clientes más felices. Las empresas

con más éxito con Big Data consiguen valor de las siguientes formas: reducción de coste, más

rápido mejor, mejor toma de decisiones, nuevos productos y servicios

Programación paralela

La programación paralela es un modelo de programación que permite a un ordenador

utilizar múltiples recursos simultáneamente para resolver problemas de cálculo. Mientras que las

versiones anteriores de los programas informáticos seguían un proceso en serie, lo que significa

que sólo podían dirigir sus recursos a resolver un problema a la vez, la programación paralela

permite a los ordenadores procesar varios problemas al mismo tiempo. La mayoría de los

ordenadores modernos utilizan este tipo de programación, y tiene amplios usos en diversas

industrias. Esta técnica tiene principios aparentemente simples: “divide y vencerás” esto permite

ejecutar más instrucciones en menos tiempo; aunque aún es un tema en constante investigación y

evolución.
6

El paradigma Divide and coquer (D & V) [3,6] es un metodo elegante de resolver

problemas simplemente se divide el problema en problemas más pequeños de la misma clase, los

que se resuelven separadamente y cuyos resultados parciales se combinan para obtener la

solución final. Este método es utilizado recursivamente para dividir las partes más y más

pequeños hasta alcanzar un punto donde el problema se resuelve trivialmente.

para la implementación de este paradigma secuencial D&V cumple tres propiedades

simples:

 Para un problema tamaño n, su solución queda definida para un arreglo de n

elementos

 Para un problema de tamaño 1, éste mismo es su propia solución.

 Para un problema tamaño 1, su solución se obtiene dividiendo el problema en

mitades, los cuales pueden ser resuelto separadamente

Luego de establecer estas propiedades y de analizar su propiedad recursiva

inherente se detectó que la arquitectura de programa que mejor se adapta es un árbol

binario de procesadores. Al iniciar el proceso existe un único procesador que actúa

como nodo raíz y que inicia con el problema completo, este procesador denominado

procesador padre, genera la división del problema y realiza la distribución de los

subproblemas a otros dos procesadores, denominados hijos, cada uno de estos hijos se

convierte en la raíz de un nuevo sub-arbol y el proceso es repetido (fase de división).

Cuando el problema ya no es más divisible comienza el proceso de combinación, cada

procesador hijo toma su solución trivial y se la manda al procesador padre quien luego
7

de combinar resultados repite el procedimiento (fase de conquista). Finalmente, el

procesador obtiene la solución al problema completo.

Beneficios de la programación paralela además de las ya mencionadas

Eficiencia: Un ordenador que utiliza la programación paralela puede

aprovechar mejor sus recursos para procesar y resolver problemas.

Rentabilidad: Además, la arquitectura de hardware que permite la

programación en paralelo es más rentable que los sistemas que sólo permiten el

procesamiento en serie.

Velocidad: Otra ventaja de la computación paralela es su capacidad para

resolver problemas complejos. Los programas paralelos pueden dividir los problemas

complejos en tareas más pequeñas y procesar estas tareas individuales

simultáneamente.

Paralelismo de datos

Podemos observar una relación entre la big data y la programación paralela,

ambos actúan en el manejo de datos masivos, ambos buscan la eficiencia su fácil

administración y rentabilidad, aunque actúan de formas diferentes podemos encontrar

que comparten cierto paradigma como, la paralelización de datos que funciona

mediante la distribución. Sin embargo, esta función difiere del paralelismo de tareas al

distribuir los datos entre los procesadores en lugar de utilizar los mismos datos en

todos los procesos.


8

Objetivo general

Aprender y identificar las principales características y funciones de los

paradigmas para comprender su impacto y la importancia que tienen para el desarrollo

tecnológico e intuir como será nuestra participación como futuros programadores

Objetivo especifico

Saber como funciona la big data y la programación paralela y como se

desarrollan en el campo tecnológico

Identificar la importancia que han tenido a través de la historia y la

importancia que tienen para nosotros en la actualidad

Analizar como los programadores se desarrollan en estos campos para saber

cual es la carga que tenemos como estudiantes al desarrollar habilidades para manejar

dichos campos.
9

Conclusión

La big data y la programación en paralelo son dos campos que se especializan

en el manejo (distribución, análisis, reconocimiento, reutilizamiento, resolución…) de

conjuntos de datos o información, sus principales objetivos es dinamizar las industrias

al hacer el manejos de estos miles de millones de datos más legibles y adquiribles para

que en base de estos se pueda brindar un servicio eficiente y eficaz a los usuarios.
10

Referencias

Puyol Moreno, J. (2014). Una aproximación a Big Data= An approach to Big

Data.Marr, B. (2018, 9 agosto). A Brief History of Big Data Everyone Should Read.

Linkedin. Recuperado 27 de agosto de 2022, de https://www.linkedin.com/pulse/brief-

history-big-data-everyone-should-read-bernard-marr?trk=mp-author-card

Monleón-Getino, A. (2015). El impacto del Big-data en la Sociedad de la

Información. Significado y utilidad. Historia y comunicación social, 20(2), 427.

Tascón, M. (2013). Introducción: Big data. Pasado, presente y futuro. Telos:

Cuadernos de comunicación e innovación, (95), 47-50.

Saez, F., Piccoli, M. F., Printista, A. M., & Gallard, R. H. (2003). Paradigmas de

programación paralela. . In V Workshop de

Investigadores en Ciencias de la Computación.

historial de la empresa. (2021, 25 noviembre). Programación paralela: Definición,

beneficios y usos en la industria. Historiadelaempresa.com, 1. Recuperado 27 de agosto

de 2022, de https://historiadelaempresa.com/programacion-paralela
11

También podría gustarte