Está en la página 1de 10

INSTITUTO DE COMPUTACION INGORMATICA

MAZATENANGO, SUCH.
CATEDRA: COMPUTACION
CATEDRATICO: EDDY CHOJOLAN

TEMA: INVESTIGACION FORMAL S.Q.L Y BIG DATA

NOMBRE: JAIME ISMAEL AVILA COLON


GRADO Y SECCION: 6TO PAE B
FECHA: 15/06/2022
INTRODUCCION

En pleno desarrollo de las bases de datos, IBM creaba un lenguaje con el que
gestionar los datos almacenados en el nuevo software System R. Era el SEQUEL,
que más tarde pasaría a llamarse SQL Se trata de un lenguaje muy similar al
humano, por lo que su manejo no resulta complicado.

Incorpora una serie de rutinas que se traducen en un importante ahorro de tiempo


y también de dinero. Pues no solamente programadores o gestores de bases de
datos. Cualquier persona que trabaje con análisis de datos o tratamiento de
información debería tener conocimientos de SQL, independientemente de que
esté en el departamento de RR.HH., Estadística o en el de Marketing. La ventaja
está en que no es difícil de aprender.

El lenguaje de consulta estructurado (SQL) es un lenguaje de base de datos


normalizado, utilizado por el motor de base de datos de Microsoft Jet.
modificar o eliminar la información que se almacena en las bases de datos. Esta
información está relacionada entre sí, por lo que debe ser estructurada y
almacenada siguiendo un sistema. es un lenguaje de consulta
propietario orientado a objetos para consultar bases de datos relacionales.

Es un término evolutivo que describe cualquier cantidad voluminosa de datos


estructurados, semiestructurados y no estructurados que tienen el potencial de ser
extraídos para obtener información. necesidad de grandes velocidades de datos
impone demandas únicas en la infraestructura de computación subyacente. La
potencia de cálculo necesaria para procesar rápidamente grandes volúmenes y
variedades de datos puede sobrecargar un solo servidor o un clúster de
servidores.
Los datos también pueden existir en una amplia variedad de tipos de archivo,
incluyendo datos estructurados, como almacenes de bases de datos SQL; datos
no estructurados, como archivos de documentos; o transmisión de datos desde
sensores. Además, big data puede incluir múltiples fuentes de datos simultáneas,
que de otro modo no podrían ser integradas.
S.Q.L
El lenguaje SQL, o lenguaje de consulta estructurado, es hoy el más utilizado en
cualquier ámbito en el que se trabaje con bases de datos. Se trata de un lenguaje
que permite acceder, modificar o eliminar la información que se almacena en las
bases de datos. Esta información está relacionada entre sí, por lo que debe ser
estructurada y almacenada siguiendo un sistema. El lenguaje SQL permite
interactuar con esa información.
En la década de los 70, en pleno desarrollo de las bases de datos, IBM creaba un
lenguaje con el que gestionar los datos almacenados en el nuevo software System
R. Era el SEQUEL, que más tarde pasaría a llamarse SQL (Structured Query
Language). En 1986, fue declarado estándar del Instituto Nacional
Estadounidense de Estándares (ANSI) y, un año después, de la Organización
Internacional de Normalización (ISO). Fue tal su impacto, que a partir de ese
momento, varias compañías lanzaron su propia versión. Hoy continúa siendo el
principal referente, tanto en el uso individual como en servidores.
ventajas del lenguaje SQL son:
Se trata de un lenguaje muy similar al humano, por lo que su manejo no resulta
complicado.
Incorpora una serie de rutinas que se traducen en un importante ahorro de tiempo
y también de dinero.
Aunque sí ha ido evolucionando a lo largo de los años, lo cierto es que
los principios básicos de SQL son los mismos.
Permite entender mejor el funcionamiento de los modelos de programación OMR.
El permitir el uso compartido por varios usuarios facilita el trabajo en cualquier
equipo multidisciplinar.
SQL recurre al álgebra y al cálculo relacional, tanto para obtener aquella
información que se está buscando como para poder modificar la propia estructura
del sistema. Lo que en un principio fue diseñado como una herramienta de
consulta, también tiene otros muchos usos:
Se utiliza para crear nuevas bases de datos y tablas.
Es capaz de administrar una cantidad mucho mayor de información que una hoja
de cálculo.
Actualiza la base de datos, incorporando nuevas cuestiones.
Puede eliminar definitivamente o corregir.
Controla el acceso a la base de datos, otorgando permisos.
Posibilita crear vistas haciendo una selección de campos de una o más tablas de
la base de datos.
Permite crear procedimientos almacenados.
Da respuesta a cualquier pregunta relacionada con los datos almacenados.
Las distintas aplicaciones del lenguaje SQL
El internet ha llevado a las bases de datos a otro nivel. Son la clave del
funcionamiento de las páginas web, por lo que SQL tiene una especial importancia
en el ámbito digital. Cualquier sitio web recurre al sistema de base de datos para
que sus contenidos puedan ser utilizados. SQL simplifica en gran medida su
gestión.
Hoy, todas las empresas manejan una cantidad importante de información, pero la
clave está en saber gestionarla. En ese sentido, un experto en SQL en el equipo
de trabajo es una garantía, ya sea en el sector de las telecomunicaciones como en
la industria de la automoción, la hostelería, la educación, la banca, el marketing…
Todos ellos son sectores muy distintos, pero con una misma necesidad: el manejo
de las bases de datos. Una base de datos correctamente estructurada es una
herramienta enormemente útil con un rendimiento muy alto.
Entonces, ¿quién debe aprender SQL? Pues no solamente programadores o
gestores de bases de datos. Cualquier persona que trabaje con análisis de datos o
tratamiento de información debería tener conocimientos de SQL,
independientemente de que esté en el departamento de RR.HH., Estadística o en
el de Marketing. La ventaja está en que no es difícil de aprender.
Lenguaje de consulta
Un lenguaje de consulta es un lenguaje informático usado para hacer consultas
en bases de datos y sistemas de información.
Los lenguajes de consulta pueden ser clasificados de acuerdo a si son lenguajes
de consulta de bases de datos o lenguajes de consulta de recuperación de
información. Algunos ejemplos son:
SQL es un lenguaje de consulta propietario orientado a objetos para
consultar bases de datos relacionales;1
Common Query Language (CQL) un lenguaje formal para representar consultas
para sistemas de recuperación de información como índices web o catálogos
bibliográficos;
CODASYL;
D es un lenguaje de consulta para sistemas de administración de bases de datos
verdaderamente relacionales (truly relational database management systems -
TRDBMS);2
DMX es un lenguaje para modelos de minería de datos;
Datalog es un lenguaje de consulta para bases de datos deductivas;
ERROL es un lenguaje de consulta sobre el modelo entidad-relación (ERM),
especialmente diseñado para bases de datos relacionales;
Gellish English es un lenguaje que puede ser usado para consultas en bases de
datos Gellish English,3 para diálogos (pedidos y respuestas) como también para
modelado de información y modelado de conocimiento;
ISBL es un lenguaje de consulta para PRTV, uno de los más recientes sistemas
de administración de bases de datos;
LDAP es un protocolo de aplicación para consultar y modificar servicios de
directorios que funcionan sobre TCP/IP;
MQL es un lenguaje de consulta de quimioinformática para búsqueda de
subestructuras permitiendo propiedades nominales y numéricas;
MDX es un lenguaje de consulta para bases de datos OLAP;
OQL es un lenguaje de consulta de objetos;
OCL (Object Constraint Language - lenguaje de restricciones de objetos). Pese a
su nombre, OCL es también un lenguaje de consulta de objetos y un
estándar OMG;
OPath, pensado para el uso consultando almacenes WinFS;
Poliqarp Query Language es un lenguaje de consulta especial diseñado para
analizar texto con anotaciones. Usado en el motor de búsqueda Poliqarp;4
QUEL es un lenguaje de acceso a bases de datos relacionales, muy similar
a SQL;
SMARTS es el estándar de quimioinformática para búsqueda de subestructuras;5
SPARQL es un lenguaje de consulta para grafos RDF;
SQL es un lenguaje de consulta muy reconocido para bases de datos relacionales;
SuprTool es un lenguaje de consulta propietario para SuprTool,6 un programa de
acceso a bases de datos para obtener datos en Image/SQL (TurboIMAGE) y
bases de datos Oracle;
TMQL Topo Magic Queeen Lion es un lenguaje de consulta para Topic Maps;
XQuery es un lenguaje de consulta para fuentes de datos XML;
EPL es un lenguaje de consulta para el procesado de eventos complejos en
tiempo real.
Sintaxis

En esta página, enumeramos la sintaxis SQL para cada uno de los comandos SQL
en esta guía de referencia. Para obtener explicaciones detalladas para cada
sintaxis SQL, por favor diríjase a la sección individual haciendo clic en la palabra
clave.

El propósito de esta página es brindar una página de referencia rápida para la


sintaxis SQL. Le sugerimos que agregue esta página a favoritos ahora
presionando Control-D para que pueda tener esta página de sintaxis a mano.
Comandos SQL
Definiendo cómo es almacenada la información.
CREATE DATABASE se utiliza para crear una nueva base de datos vacía.
DROP DATABASE se utiliza para eliminar completamente una base de datos
existente.
CREATE TABLE se utiliza para crear una nueva tabla, donde la información se
almacena realmente.
ALTER TABLE se utiliza para modificar una tabla ya existente.
DROP TABLE se utiliza para eliminar por completo una tabla existente.
Manipulando los datos.
SELECT se utiliza cuando quieres leer (o seleccionar) tus datos.
INSERT se utiliza cuando quieres añadir (o insertar) nuevos datos.
UPDATE se utiliza cuando quieres cambiar (o actualizar) datos existentes.
DELETE se utiliza cuando quieres eliminar (o borrar) datos existentes.
REPLACE se utiliza cuando quieres añadir o cambiar (o reemplazar) datos nuevos
o ya existentes.
TRUNCATE se utiliza cuando quieres vaciar (o borrar) todos los datos de la
plantilla.

Big data
Big data (en español, grandes datos o grandes volúmenes de datos) es un término
evolutivo que describe cualquier cantidad voluminosa de datos estructurados,
semiestructurados y no estructurados que tienen el potencial de ser extraídos para
obtener información.
Los datos grandes se caracterizan a menudo por tres Vs: el Volumen extremo de
datos, la gran Variedad de tipos de datos y la Velocidad a la que se deben
procesar los datos. Aunque los grandes datos no equivalen a ningún volumen
específico de datos, el término se utiliza a menudo para describir terabytes,
petabytes e incluso exabytes de datos capturados con el tiempo.
Desglosando las 3 Vs de big data
Volumen: Tales datos voluminosos pueden provenir de innumerables fuentes
diferentes, como registros de ventas comerciales, los resultados recogidos de
experimentos científicos o sensores en tiempo real utilizados en la internet de las
cosas (IoT). Los datos pueden estar en bruto o ser preprocesados utilizando
herramientas de software independientes antes de que se apliquen los análisis.
Variedad: Los datos también pueden existir en una amplia variedad de tipos de
archivo, incluyendo datos estructurados, como almacenes de bases de datos SQL;
datos no estructurados, como archivos de documentos; o transmisión de datos
desde sensores. Además, big data puede incluir múltiples fuentes de datos
simultáneas, que de otro modo no podrían ser integradas. Por ejemplo, un gran
proyecto de análisis de datos puede intentar medir el éxito de un producto y las
ventas futuras correlacionando datos de ventas pasadas, datos de devolución y
datos de revisión de compradores en línea para ese producto.
Por último, la velocidad se refiere al lapso de tiempo en el que se deben analizar
grandes volúmenes de datos. Cada gran proyecto de análisis de datos va a ingerir,
correlacionar y analizar las fuentes de datos, y luego proveer una respuesta o
resultado basado en una consulta general. Esto significa que los analistas
humanos deben tener una comprensión detallada de los datos disponibles y tener
cierto sentido de qué respuesta están buscando. La velocidad también es
significativa, ya que el análisis de datos se expande en campos como el
aprendizaje automático y la inteligencia artificial, donde los procesos
analíticos imitan la percepción mediante la búsqueda y el uso de patrones en los
datos recopilados.
Big data en las demandas de infraestructura
La necesidad de grandes velocidades de datos impone demandas únicas en la
infraestructura de computación subyacente. La potencia de cálculo necesaria para
procesar rápidamente grandes volúmenes y variedades de datos puede
sobrecargar un solo servidor o un clúster de servidores. Las organizaciones deben
aplicar el poder de cálculo adecuado a las tareas de big data para lograr la
velocidad deseada. Esto puede potencialmente demandar cientos o miles de
servidores que pueden distribuir el trabajo y operar de manera colaborativa.
Alcanzar esa velocidad de una manera rentable es también un dolor de cabeza.
Muchos líderes empresariales son reticentes a invertir en un servidor extenso y
una infraestructura de almacenamiento que sólo se puede utilizar ocasionalmente
para completar tareas de big data. Como resultado, la computación en la nube
pública ha surgido como un vehículo primario para alojar grandes proyectos de
análisis de datos. Un proveedor de nube pública puede almacenar petabytes de
datos y escalar miles de servidores el tiempo suficiente para realizar el proyecto
de big data. El negocio sólo paga por el tiempo de almacenamiento y cálculo
realmente utilizado, y las instancias de nube se pueden desactivar hasta que se
necesiten de nuevo.
Para mejorar aún más los niveles de servicio, algunos proveedores de nube
pública ofrecen grandes capacidades de datos, como instancias de computación
altamente distribuidas de Hadoop, almacenes de datos, bases de datos y otros
servicios relacionados con la nube. Amazon Web Services Elastic MapReduce
(Amazon EMR) es un ejemplo de servicios de big data en una nube pública.
El lado humano de la analítica de big data
En última instancia, el valor y la eficacia de los grandes datos depende de los
operadores humanos encargados de comprender los datos y formular las
consultas adecuadas para dirigir proyectos de big data. Algunas grandes
herramientas de datos se encuentran con nichos especializados y permiten a los
usuarios menos técnicos hacer varias predicciones a partir de datos de negocios
cotidianos. Sin embargo, otras herramientas están apareciendo, como los
dispositivos Hadoop, para ayudar a las empresas a implementar una
infraestructura de computación adecuada para abordar grandes proyectos de
datos, minimizando la necesidad de hardware y conocimientos de software de
computación distribuida.
Pero estas herramientas sólo abordan casos de uso limitados. Muchas otras
grandes tareas de datos, como la determinación de la efectividad de un nuevo
fármaco, pueden requerir una gran experiencia científica y computacional del
personal analítico. Actualmente hay una escasez de científicos de datos y otros
analistas que tengan experiencia trabajando con grandes datos en un entorno de
código abierto distribuido.
Los datos grandes se pueden contrastar con los datos pequeños (small data), otro
término que se utiliza a menudo para describir los datos cuyo volumen y formato
se puede utilizar fácilmente para el análisis de autoservicio. Un axioma
comúnmente citado es que "los grandes datos son para las máquinas, los
pequeños datos son para las personas".
CONCLUSIONES.

E llegado a mi conclusión que los datos grandes se pueden contrastar con los
datos pequeños (small data), otro término que se utiliza a menudo para describir
los datos cuyo volumen y formato se puede utilizar fácilmente para el análisis de
autoservicio.

E llegado a mi conclusión que estas herramientas sólo abordan casos de uso


limitados. Muchas otras grandes tareas de datos, como la determinación de la
efectividad de un nuevo fármaco, pueden requerir una gran experiencia científica y
computacional del personal analítico.

E llegado a mi conclusión que lenguaje de consulta estructurado, es hoy el más


utilizado en cualquier ámbito en el que se trabaje con bases de datos
E grafía

¿Qué es SQL? Características y usos de este lenguaje (unir.net)

¿Qué es SQL? Características y usos de este lenguaje (unir.net)

Comandos SQL Básicos - MariaDB Knowledge Base

¿Qué es Big data (grandes volúmenes de datos)? - Definición en WhatIs.com


(computerweekly.com)

También podría gustarte