Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Has aprendido que una consulta SQL usa SELECT, FROM y WHERE para especificar los
datos que se devolverán desde la consulta. Esta lectura proporciona información más
detallada sobre cómo estructurar las consultas, usar condiciones WHERE, elegir todas las
columnas en una tabla, agregar comentarios y usar alias. Esta información hace que sea más
fácil para ti entender (y escribir) consultas para poner SQL en práctica. En la última sección de
esta lectura, se proporciona un ejemplo de lo que haría un analista de datos a fin de extraer
los datos de los empleados para un proyecto.
Ten cuenta que la instrucción SQL que se muestra arriba tiene un punto y coma al final. El
punto y coma es un terminador de instrucción que forma parte de la norma SQL-92 del
Instituto Nacional Estadounidense de Estándares (ANSI), la cual es una sintaxis común
recomendada para su adopción por todas las bases de datos SQL. Sin embargo, no todas las
bases de datos SQL han adoptado o cumplido con el uso del punto y coma, por lo que es
posible que te encuentres con algunas instrucciones SQL que no terminan con un punto y
coma. Si una instrucción funciona sin punto y coma, es correcta.
Condiciones WHERE
En la consulta que se mostró anteriormente, la cláusula SELECT identifica la columna de la
cual deseas extraer datos por nombre, field1, y la cláusula FROM identifica la tabla donde se
encuentra la columna por nombre, table. Por último, la cláusula WHERE restringe la consulta
para que la base de datos devuelva solo los datos con una coincidencia de valor exacta, o los
datos que coincidan con una determinada condición que deseas satisfacer.
Por ejemplo, si estás buscando a un cliente específico con el apellido Chavez, la cláusula
WHERE sería:
Sin embargo, si estás buscando a todos los clientes que tienen un apellido que empieza con
las letras “Ch”, la cláusula WHERE sería:
WHERE field1 LIKE 'Ch%'
En conclusión, la cláusula LIKE es muy poderosa porque te permite decirle a la base de datos
que busque un patrón determinado. El signo de porcentaje (%) se usa como comodín para
que coincida con uno o más caracteres. En el ejemplo anterior, se devolverían tanto Chávez
como Chen. Ten en cuenta que en algunas bases de datos se usa un asterisco (*) como
comodín en lugar de un signo de porcentaje (%).
En el ejemplo, si reemplazaras SELECT field1 por SELECT * , elegirías todas las columnas de
la tabla en lugar de la columna field1 sola. Desde el punto de vista de la sintaxis, es una
instrucción SQL correcta, pero debes usar el asterisco (*) con moderación y precaución.
Según cuántas columnas tenga una tabla, es posible que elijas una enorme cantidad de datos.
Si eliges demasiados datos, es posible que la consulta se ejecute muy lentamente.
Comentarios
Algunas tablas no están diseñadas con convenciones de nomenclatura suficientemente
descriptivas. En el ejemplo, field1 era la columna del apellido de un cliente; pero no podrías
saberlo por el nombre. Un nombre más adecuado podría haber sido algo como last_name. En
estos casos, puedes agregar comentarios junto a tu SQL para ayudarte a recordar qué
representa el nombre. Los comentarios son textos colocados entre ciertos caracteres, /* y */, o
después de dos guiones (--), como se muestra a continuación.
Los comentarios también se pueden agregar dentro o fuera de una instrucción. Puedes usar
esta flexibilidad para proporcionar una descripción general de lo que harás, notas paso a paso
sobre cómo lo lograrás y por qué estableces diferentes parámetros o condiciones.
Mientras más cómodo te sientas con SQL, más fácil te resultará leer y comprender las
consultas de un vistazo. Aun así, nunca está de más que tengas comentarios en una consulta
para recordar lo que estás tratando de hacer. Esto también facilita que otros usuarios
entiendan tu consulta si la compartes con ellos. A medida que tus consultas se vuelvan más
complejas, esta práctica te ahorrará mucho tiempo y energía para comprender las consultas
complejas que escribiste hace meses o años.
En el ejemplo anterior, se agregó un comentario antes de la instrucción SQL para explicar qué
hace la consulta. Además, se agregó un comentario junto a cada uno de los nombres de
columna para describir la columna y su uso. Generalmente, se admiten dos guiones (--). Por lo
tanto, se recomienda usarlos de manera coherente. Puedes usar # en lugar de -- en la
consulta anterior, pero # no se reconoce en todas las versiones de SQL; por ejemplo, MySQL
no reconoce #. También puedes colocar comentarios entre /* y */ si la base de datos que
estás usando lo permite.
A medida que perfecciones tus capacidades desde un punto de vista profesional, según la
base de datos SQL que uses, podrás elegir los símbolos de delimitación de comentarios
adecuados que prefieras y continuar su uso para mantener un estilo coherente. A medida que
tus consultas se vuelvan más complejas, esta práctica te ahorrará mucho tiempo y energía
para comprender las consultas complejas que escribiste, probablemente, hace varios meses o
años.
Alias
Para simplificarte la tarea, puedes asignar un nuevo nombre o alias a los nombres de columna
o tabla para que sea más fácil trabajar con ellos (y evitar la necesidad de agregar
comentarios). Esto se hace con una cláusula SQL AS. En el siguiente ejemplo, se asigna el
alias last_name a field1 y el alias customers a table.Estos alias son válidos solo para la duración
de la consulta. Un alias no cambia el nombre real de una columna o tabla de la base de datos.
Quieres extraer todas las columnas: empID, firstName, lastName, jobCode y salary. Como
sabes que la base de datos no es tan amplia, usas SELECT * en lugar de escribir el nombre
de cada columna en la cláusula SELECT. Mediante esta opción, elegirás todas las columnas
de la tabla Empleado (Employee) en la cláusula FROM.
Ahora, puedes obtener información más específica sobre los datos que deseas de la tabla
Empleado (Employee). Si deseas todos los datos sobre los empleados que trabajan en el
código de trabajo SFI, puedes usar una cláusula WHERE para filtrar los datos en función de
este requisito adicional.
Aquí usas:
Es posible que una parte de los datos de los resultados devueltos por la consulta SQL tengan
el siguiente aspecto:
empID firstName lastName jobCode salary
0002 Homer Simpson SFI 15000
0003 Marge Simpson SFI 30000
0034 Bart Simpson SFI 25000
0067 Lisa Simpson SFI 38000
0088 Ned Flanders SFI 42000
0076 Barney Gumble SFI 32000
Supongamos que observas un amplio intervalo salarial para el código de trabajo SFI. Puede
que quieras marcar a los empleados de todos los departamentos que tienen los salarios más
bajos para tu gerente. Debido a que los pasantes también están incluidos en la tabla y tienen
salarios inferiores a USD 30,000, debes asegurarte de que los resultados te devuelvan
únicamente a los empleados de tiempo completo con salarios que sean menores que esa
cantidad. En otras palabras, deseas excluir a los pasantes con el código de trabajo INT que
también ganan menos de USD 30,000. La cláusula AND te permite analizar ambas
condiciones.
Tú creas una consulta SQL similar a la siguiente, en la cual <> significa “no es igual a”:
Los datos obtenidos de la consulta SQL podrían ser parecidos a los siguientes (los datos de
los pasantes con el código de trabajo INT no se devuelven):
empID firstName lastName jobCode salary
Al
0002 Homer Simpson SFI 15000
0003 Marge Simpson SFI 30000
0034 Bart Simpson SFI 25000
0108 Edna Krabappel TUL 18000
0099 Moe Szyslak ANA 28000
contar con un rápido acceso a este tipo de datos mediante SQL, puedes proporcionarle a tu
gerente muchas perspectivas diferentes acerca de los datos de los empleados, por ejemplo, si
los salarios que ganan los empleados en toda la empresa son equitativos. Afortunadamente,
la consulta muestra que solo dos empleados adicionales podrían necesitar un ajuste salarial, y
compartes los resultados con tu gerente.
Extraer los datos, analizarlos e implementar una solución podría, en última instancia, contribuir
a mejorar la satisfacción y la lealtad de los empleados. Esto convierte a SQL en una
herramienta muy poderosa.
Si es la primera vez que usas SQL, esta lectura te ayudará a adquirir los conceptos básicos
para que veas lo útil que es SQL y, en particular, las consultas. Empezarás a escribir
consultas SQL en muy poco tiempo.
Cada lenguaje de programación, incluido SQL, sigue un conjunto de pautas único que se
conoce como sintaxis. La sintaxis es la estructura predeterminada de un lenguaje, que incluye
todas las palabras, los símbolos y la puntuación requeridos, así como su correcta colocación.
Cuando escribes tus criterios de búsqueda con la sintaxis correcta, la consulta empieza a
trabajar en extraer los datos que solicitaste de la base de datos de destino.
A continuación, escribe el nombre de la tabla después del FROM, las columnas de la tabla
que deseas después de SELECT y, por último, las condiciones que quieres agregar a tu
consulta después del WHERE. Asegúrate de agregar un nuevo renglón y sangría cuando las
agregues, como se muestra a continuación:
Seguir este método facilita el proceso de escribir consultas SQL. También puede ayudarte a
cometer menos errores de sintaxis.
first_name
Tony
Tony
Tony
En conclusión, esta consulta tenía la sintaxis correcta, pero no fue muy útil después de la
devolución de los datos.
Si solicitas varios campos de datos de una tabla, debes incluir estas columnas en el comando
SELECT. Cada columna está separada por una coma, como se muestra a continuación:
Este es un ejemplo de cómo aparecería en BigQuery:
La consulta anterior usa tres comandos para localizar clientes que se llaman Tony:
Ten en cuenta que, a diferencia del comando SELECT, que usa una coma para separar
campos/variables/parámetros, el comando WHERE usa la instrucción AND para conectar
condiciones. Cuando te conviertas en un escritor de consultas más experimentado, usarás
otros conectores u operadores, como OR y NOT.
Este es un ejemplo de BigQuery con varios campos usados en una cláusula WHERE:
La consulta anterior usa tres comandos para localizar clientes con un ID de cliente válido
(mayor que 0) cuyo nombre es Tony, y su apellido es Magnolia.
1967 Tony
Si hay más de un cliente con el mismo nombre, los resultados de la consulta podrían ser:
Conclusión clave
Lo más importante es recordar cómo usar SELECT, FROM y WHERE en una consulta. Una
vez que hayas practicado cómo escribir tus propias consultas SQL más adelante en el
programa, las consultas con varios campos serán más sencillas.
SELECT * indica a la base de datos que seleccione todas las columnas de la tabla de
empleados. Los criterios de la cláusula WHERE le indican a la base de datos qué datos
de esas columnas debe devolver la consulta.
Esta consulta seleccionará todos los datos de la tabla de empleados en los que jobCode
es FTE y el apellido es James.
La cláusula WHERE album_id = 277 mostrará solo datos sobre el álbum con el número de
ID 277. La consulta completa es SELECT * FROM album WHERE album_ID = 277. La
cláusula WHERE filtra los resultados que cumplen con ciertas condiciones. La cláusula
WHERE incluye el nombre de la columna, un signo de igual y el valor o los valores a
incluir en la columna. El nombre del álbum con el número de ID 277 es Bach: Variaciones
Goldberg.
Mientras revisas los datos, observas un patrón entre las personas que visitan el sitio web de la
empresa con mayor frecuencia: la geografía y mayores cantidades de dinero invertido en
compras. Si se realiza un análisis más detallado, esta información podría explicar por qué las
ventas son tan fuertes en este momento en el noreste y ayudar a tu compañía a encontrar
nuevas formas de continuar mejorándolas a través del nuevo sitio web.
Puedes usar las herramientas de visualización de tu hoja de cálculo para crear visualizaciones
simples, como gráficos de líneas y barras.
Puedes usar herramientas más avanzadas, como Tableau, que te permiten integrar datos en
visualizaciones de estilo de panel.
Si estás trabajando con el lenguaje de programación R, puedes usar las herramientas de
visualización en RStudio.
Tu elección de visualización dependerá de varios factores, incluidos el tamaño de tus datos y
el proceso que usaste para analizarlos (hoja de cálculo, bases de datos/consultas o lenguajes
de programación). Por ahora, solo considera los conceptos básicos.
Pero, a veces, necesitas una herramienta más poderosa para darles realmente vida a tus
datos. Tableau y RStudio son dos ejemplos de plataformas muy usadas que pueden ayudarte
a planificar, crear y presentar visualizaciones de datos efectivas y atractivas.
Conclusión clave
Los mejores analistas de datos usan una gran variedad de herramientas y métodos para
visualizar y compartir sus datos. A medida que vayas aprendiendo más sobre la visualización
de datos durante este curso, mantén la curiosidad, investiga diferentes opciones y prueba
continuamente nuevos programas y plataformas que te ayuden a aprovechar tus datos al
máximo.