Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DATOS
Juan Loaiza ha estado trabajando en Oracle Database por más de 27 años,
ayudando a refinar la tecnología como la conocemos hoy en día. Con esa
perspectiva, Loaiza piensa que los oficios de los desarrolladores, arquitectos e
implementadores dependen de que tan bien se preparen para “las grandes olas que
atraviesan la industria de las bases de datos”.
He aquí un ejemplo: las bases de datos NoSQL son usadas por redes gigantes para
administrar la información de millones de usuarios, y los enfoques de escala web de
estos NoSQL están comenzando a aparecer como características de la base de
datos principal de Oracle. Por ejemplo, “sharding”, un tipo de partición de base de
datos que separa bases de datos muy grandes en partes más pequeñas llamadas
data shards (fragmentos de datos). Redes gigantes han usado el “sharding” por
años para romper una base de datos enorme NoSQL y hacer la más manejable.
Pero cuando esta técnica se convierta en parte de una base de datos Oracle (y lo
hará), heredará las décadas de funcionalidad sofisticada y, por tanto, se volverá
más útil y confiable.
Loaiza y Oracle tienen confianza en este enfoque, pero el jurado todavía está
deliberando sobre si esto barrerá la industria de la misma manera que algunas
tendencias lo hicieron. Después de todo, Oracle ha vencido durante una década y
tiene miles de clientes en producción, pero nadie más ha seguido su ejemplo a lo
grande. “Suena bastante sencillo, pero nadie más en la industria lo hace”, dice
Loaiza.
Quizás es porque no pueden.
Loaiza dice que Oracle es único en ofrecer “arquitectura de doble formato”, una
única base de datos que usa el mejor enfoque dependiendo el uso: análisis de filas
para OLTP y análisis en columnas en memoria para análisis. “En memoria” es parte
de la arquitectura de Oracle Database 12c, lo que significa que las empresas lo
obtienen sin cambiar las aplicaciones existentes que usan Oracle y también las
características que se esperan, como la alta disponibilidad y escalabilidad. Desde
formatos en disco hasta bases de datos en memoria, “toda la industria se dirige
ahí”, dice Loaiza.
3. Software en silicio
Los profesionales de bases de datos enfrentarán cada vez más esta cuestión:
¿Cómo integramos Macrodatos con los datos operacionales existentes?”.
Señala 2 tecnologías de Oracle como ejemplos que pueden ayudar: Uno, “Oracle
Big Data Appliance” es un sistema que ejecuta Apache Hadoop y Spark, lo que
permite a los equipos de TI configurar un sistema de Macrodatos mucho más rápido
y a un costo mucho menos. En segundo lugar “Oracle Big Data SQL” permite a los
analistas ejecutar consultas Oracle SQL completas y paralelas a través de los datos
relacionales, Hadoop y NoSQL. Oracle SQL es más sofisticado que lo que se usa
generalmente con estos grandes conjuntos de datos. “El objetivo es hacer que sea
simple y eficiente para poder integrar todos estos datos”.
Como dijimos en el inicio, grandes compañías en la red con miles, e incluso millones
de usuarios dependen de las bases de datos fragmentadas, en lugar de tener bases
de datos masivas para administrar tal cantidad de usuarios, fragmentan la base de
datos para que se divida en elementos más manejables, pero de manera que la
compañía pueda consultar todos los fragmentos.
Oracle planea ofrecer “Sharding nativo” dentro de la base de datos Oracle, ya que
en el pasado los usuarios tenían que simular el “sharding” de forma manual. La
fragmentación nativa permitirá que el departamento de TI administre los
fragmentos, al tiempo que obtiene los beneficios habituales de la base de datos
Oracle, como la alta disponibilidad y seguridad que la caracteriza.
6. Protección completa de los datos
Cuando las copias de seguridad de las bases de datos basadas en disco entraron
a escena la década pasado, trajeron 2 grandes avances: más accesibilidad a los
datos y deduplicación que redujo el volumen de los datos. “Y ahí es donde se detuvo
en la última década” dice Loaiza.
Cada vez más, la expectativa será que las copias de seguridad sucedan
constantemente, en tiempo real, de modo que la información nunca se pierda. Con
copias de respaldo basadas en disco y basadas en lotes, los datos se pueden perder
entre las copias de seguridad. Eso no se reduce aún hoy en los modelos
comerciales digitales. “Nadie quiere perder datos, es casi imposible acudir a los
usuarios financieros y decir ‘he perdido sus datos’, nadie quiere perder su asiento
en un avión o su día de compras” Dice Loaiza.
Oracle cumple con esta necesidad con un enfoque similar a sus sistemas de
ingeniería, usando algoritmos especializados en hardware personalizado llamado
“Zero Data Loss Recovery Appliance” (Dispositivo de recuperación con cero pérdida
de datos). Además de evitar la pérdida de datos, el dispositivo tiene un mínimo
impacto en los servidores de producción, porque solo realiza copias de seguridad
de los cambios en la base de datos, en lugar de una copia de seguridad completa.
Tiene una recuperación que valida los datos a medida que se realiza la copia de
seguridad y ofrece protección a escala de nube, por lo que un único dispositivo
puede respaldar un centro de datos completo.
7. JSON creciendo en popularidad, ahora integrado con SQL
JSON es una forma de representar datos que son muy populares entre
desarrolladores. En gran medida reemplaza a XML como el formato de datos con
estructuras complejas, como páginas web o perfiles de usuario. Los proyectos de
bases de datos NoSQL adoptaron JSON a medida que más desarrolladores lo
usaban para hacer sus aplicaciones.
Ahora los desarrolladores pueden almacenar datos JSON de manera nativa como
columnas en Oracle. Mediante el uso de SQL mejorado para acceder a los datos
JSON más fácilmente, los profesionales de bases de datos pueden realizar
cualquier tardea relacional con esa información. “Si miras las bases de datos
NoSQL, tenían 2 tecnologías realmente interesantes: “Sharding” y JSON” dice
Loaiza. “Ahora los hemos introducido en las bases de datos relacionales”.