Está en la página 1de 19

Las posibilidades de SQL son infinitas

Has aprendido que una consulta SQL usa SELECT, FROM y WHERE para especificar los
datos que se devolverán desde la consulta. Esta lectura proporciona información más
detallada sobre cómo estructurar las consultas, usar condiciones WHERE, elegir todas las
columnas en una tabla, agregar comentarios y usar alias. Esta información hace que sea más
fácil para ti entender (y escribir) consultas para poner SQL en práctica. En la última sección de
esta lectura, se proporciona un ejemplo de lo que haría un analista de datos a fin de extraer
los datos de los empleados para un proyecto.

Uso de mayúsculas, sangría y punto y coma


Puedes escribir tus consultas SQL solo en minúsculas, y no tienes que preocuparte por los
espacios adicionales entre palabras. Sin embargo, el uso de mayúsculas y sangría puede
ayudarte a leer la información más fácilmente. Mantén tus consultadas ordenadas. Serán más
fáciles de revisar o solucionar si necesitas comprobarlas más adelante.

Ten cuenta que la instrucción SQL que se muestra arriba tiene un punto y coma al final. El
punto y coma es un terminador de instrucción que forma parte de la norma SQL-92 del
Instituto Nacional Estadounidense de Estándares (ANSI), la cual es una sintaxis común
recomendada para su adopción por todas las bases de datos SQL. Sin embargo, no todas las
bases de datos SQL han adoptado o cumplido con el uso del punto y coma, por lo que es
posible que te encuentres con algunas instrucciones SQL que no terminan con un punto y
coma. Si una instrucción funciona sin punto y coma, es correcta.

Condiciones WHERE
En la consulta que se mostró anteriormente, la cláusula SELECT identifica la columna de la
cual deseas extraer datos por nombre, field1, y la cláusula FROM identifica la tabla donde se
encuentra la columna por nombre, table. Por último, la cláusula WHERE restringe la consulta
para que la base de datos devuelva solo los datos con una coincidencia de valor exacta, o los
datos que coincidan con una determinada condición que deseas satisfacer.

Por ejemplo, si estás buscando a un cliente específico con el apellido Chavez, la cláusula
WHERE sería:

WHERE field1 = 'Chavez'

Sin embargo, si estás buscando a todos los clientes que tienen un apellido que empieza con
las letras “Ch”, la cláusula WHERE sería:
WHERE field1 LIKE 'Ch%'

En conclusión, la cláusula LIKE es muy poderosa porque te permite decirle a la base de datos
que busque un patrón determinado. El signo de porcentaje (%) se usa como comodín para
que coincida con uno o más caracteres. En el ejemplo anterior, se devolverían tanto Chávez
como Chen. Ten en cuenta que en algunas bases de datos se usa un asterisco (*) como
comodín en lugar de un signo de porcentaje (%).

ELEGIR (SELECT) todas las columnas


¿Puedes usar SELECT * ?

En el ejemplo, si reemplazaras SELECT field1 por SELECT * , elegirías todas las columnas de
la tabla en lugar de la columna field1 sola. Desde el punto de vista de la sintaxis, es una
instrucción SQL correcta, pero debes usar el asterisco (*) con moderación y precaución.
Según cuántas columnas tenga una tabla, es posible que elijas una enorme cantidad de datos.
Si eliges demasiados datos, es posible que la consulta se ejecute muy lentamente.

Comentarios
Algunas tablas no están diseñadas con convenciones de nomenclatura suficientemente
descriptivas. En el ejemplo, field1 era la columna del apellido de un cliente; pero no podrías
saberlo por el nombre. Un nombre más adecuado podría haber sido algo como last_name. En
estos casos, puedes agregar comentarios junto a tu SQL para ayudarte a recordar qué
representa el nombre. Los comentarios son textos colocados entre ciertos caracteres, /* y */, o
después de dos guiones (--), como se muestra a continuación.

Los comentarios también se pueden agregar dentro o fuera de una instrucción. Puedes usar
esta flexibilidad para proporcionar una descripción general de lo que harás, notas paso a paso
sobre cómo lo lograrás y por qué estableces diferentes parámetros o condiciones.
Mientras más cómodo te sientas con SQL, más fácil te resultará leer y comprender las
consultas de un vistazo. Aun así, nunca está de más que tengas comentarios en una consulta
para recordar lo que estás tratando de hacer. Esto también facilita que otros usuarios
entiendan tu consulta si la compartes con ellos. A medida que tus consultas se vuelvan más
complejas, esta práctica te ahorrará mucho tiempo y energía para comprender las consultas
complejas que escribiste hace meses o años.

Ejemplo de una consulta con comentarios


Este es un ejemplo de cómo se pueden escribir los comentarios en BigQuery:

En el ejemplo anterior, se agregó un comentario antes de la instrucción SQL para explicar qué
hace la consulta. Además, se agregó un comentario junto a cada uno de los nombres de
columna para describir la columna y su uso. Generalmente, se admiten dos guiones (--). Por lo
tanto, se recomienda usarlos de manera coherente. Puedes usar # en lugar de -- en la
consulta anterior, pero # no se reconoce en todas las versiones de SQL; por ejemplo, MySQL
no reconoce #. También puedes colocar comentarios entre /* y */ si la base de datos que
estás usando lo permite.

A medida que perfecciones tus capacidades desde un punto de vista profesional, según la
base de datos SQL que uses, podrás elegir los símbolos de delimitación de comentarios
adecuados que prefieras y continuar su uso para mantener un estilo coherente. A medida que
tus consultas se vuelvan más complejas, esta práctica te ahorrará mucho tiempo y energía
para comprender las consultas complejas que escribiste, probablemente, hace varios meses o
años.

Alias
Para simplificarte la tarea, puedes asignar un nuevo nombre o alias a los nombres de columna
o tabla para que sea más fácil trabajar con ellos (y evitar la necesidad de agregar
comentarios). Esto se hace con una cláusula SQL AS. En el siguiente ejemplo, se asigna el
alias last_name a field1 y el alias customers a table.Estos alias son válidos solo para la duración
de la consulta. Un alias no cambia el nombre real de una columna o tabla de la base de datos.

Ejemplo de una consulta con alias


Pon SQL a trabajar como analista de datos
Imagina que eres un analista de datos que trabaja para una pequeña empresa, y tu gerente te
pide algunos datos de los empleados. Tú decides escribir una consulta con SQL para obtener
lo que necesitas de la base de datos.

Quieres extraer todas las columnas: empID, firstName, lastName, jobCode y salary. Como
sabes que la base de datos no es tan amplia, usas SELECT * en lugar de escribir el nombre
de cada columna en la cláusula SELECT. Mediante esta opción, elegirás todas las columnas
de la tabla Empleado (Employee) en la cláusula FROM.

Ahora, puedes obtener información más específica sobre los datos que deseas de la tabla
Empleado (Employee). Si deseas todos los datos sobre los empleados que trabajan en el
código de trabajo SFI, puedes usar una cláusula WHERE para filtrar los datos en función de
este requisito adicional.

Aquí usas:

Es posible que una parte de los datos de los resultados devueltos por la consulta SQL tengan
el siguiente aspecto:
empID firstName lastName jobCode salary
0002 Homer Simpson SFI 15000
0003 Marge Simpson SFI 30000
0034 Bart Simpson SFI 25000
0067 Lisa Simpson SFI 38000
0088 Ned Flanders SFI 42000
0076 Barney Gumble SFI 32000
Supongamos que observas un amplio intervalo salarial para el código de trabajo SFI. Puede
que quieras marcar a los empleados de todos los departamentos que tienen los salarios más
bajos para tu gerente. Debido a que los pasantes también están incluidos en la tabla y tienen
salarios inferiores a USD 30,000, debes asegurarte de que los resultados te devuelvan
únicamente a los empleados de tiempo completo con salarios que sean menores que esa
cantidad. En otras palabras, deseas excluir a los pasantes con el código de trabajo INT que
también ganan menos de USD 30,000. La cláusula AND te permite analizar ambas
condiciones.

Tú creas una consulta SQL similar a la siguiente, en la cual <> significa “no es igual a”:

Los datos obtenidos de la consulta SQL podrían ser parecidos a los siguientes (los datos de
los pasantes con el código de trabajo INT no se devuelven):
empID firstName lastName jobCode salary
Al
0002 Homer Simpson SFI 15000
0003 Marge Simpson SFI 30000
0034 Bart Simpson SFI 25000
0108 Edna Krabappel TUL 18000
0099 Moe Szyslak ANA 28000
contar con un rápido acceso a este tipo de datos mediante SQL, puedes proporcionarle a tu
gerente muchas perspectivas diferentes acerca de los datos de los empleados, por ejemplo, si
los salarios que ganan los empleados en toda la empresa son equitativos. Afortunadamente,
la consulta muestra que solo dos empleados adicionales podrían necesitar un ajuste salarial, y
compartes los resultados con tu gerente.
Extraer los datos, analizarlos e implementar una solución podría, en última instancia, contribuir
a mejorar la satisfacción y la lealtad de los empleados. Esto convierte a SQL en una
herramienta muy poderosa.

Recursos para obtener más información


Los no abonados pueden acceder a estos recursos de forma gratuita; pero, si un sitio limita el
número de artículos gratuitos por mes y tú ya alcanzaste tu límite, marca el recurso como
favorito y vuelve a él más tarde.

 Tutorial de SQL de W3Schools: Si te gustaría explorar un tutorial detallado de SQL, este es el


lugar perfecto para empezar. Este tutorial incluye ejemplos interactivos que puedes editar,
analizar y recrear. Úsalo como referencia o completa todo el tutorial para practicar el uso de
SQL. Haz clic en el botón verde Empezar el aprendizaje de SQL ahora o en el botón Siguiente
para comenzar el tutorial.
 Hoja de referencia de SQL: Si eres un estudiante más avanzado, lee este artículo para
obtener información sobre la sintaxis SQL estándar que se usa en PostgreSQL. Cuando
finalices, sabrás mucho más sobre SQL y estarás preparado para aplicarlo en el análisis
empresarial y otras tareas.

Guía de SQL: Primeros pasos


Las computadoras usan diferentes idiomas para comunicarse entre sí, al igual que los seres
humanos. El lenguaje de consulta estructurado (SQL, que se pronuncia “ese-cu-ele”) permite a
los analistas de datos hablar con sus bases de datos. SQL es una de las herramientas de
análisis de datos más útiles, especialmente cuando se trabaja con grandes conjuntos de datos
en tablas. Puede ayudarte a investigar grandes bases de datos y rastrear texto (conocido
como cadenas) y números, y filtrar el tipo exacto de datos que necesitas, mucho más rápido
que una hoja de cálculo.

Si es la primera vez que usas SQL, esta lectura te ayudará a adquirir los conceptos básicos
para que veas lo útil que es SQL y, en particular, las consultas. Empezarás a escribir
consultas SQL en muy poco tiempo.

¿Qué es una consulta?


Una consulta es una solicitud de datos o información que proviene de una base de datos.
Cuando consultas bases de datos, usas SQL para comunicar tu pregunta o solicitud. Puedes
intercambiar información con la base de datos siempre y cuando dominen el mismo idioma.

Cada lenguaje de programación, incluido SQL, sigue un conjunto de pautas único que se
conoce como sintaxis. La sintaxis es la estructura predeterminada de un lenguaje, que incluye
todas las palabras, los símbolos y la puntuación requeridos, así como su correcta colocación.
Cuando escribes tus criterios de búsqueda con la sintaxis correcta, la consulta empieza a
trabajar en extraer los datos que solicitaste de la base de datos de destino.

La sintaxis de cada consulta SQL es la misma:

 Usa SELECT para elegir las columnas que deseas devolver.


 Usa FROM para elegir las tablas donde se encuentran las columnas que deseas.
 Usa WHERE para filtrar determinada información.
Una consulta SQL es como rellenar una plantilla. Descubrirás que, si escribes una consulta
SQL desde cero, es mucho mejor iniciar una consulta escribiendo las palabras clave SELECT,
FROM y WHERE en el siguiente formato:

A continuación, escribe el nombre de la tabla después del FROM, las columnas de la tabla
que deseas después de SELECT y, por último, las condiciones que quieres agregar a tu
consulta después del WHERE. Asegúrate de agregar un nuevo renglón y sangría cuando las
agregues, como se muestra a continuación:

Seguir este método facilita el proceso de escribir consultas SQL. También puede ayudarte a
cometer menos errores de sintaxis.

Ejemplo de una consulta


Así es como aparecería una simple consulta en BigQuery, un almacén de datos de
Google Cloud Platform.
La consulta anterior usa tres comandos para localizar clientes que se llaman Tony:

1. ELEGIR (SELECT) la columna denominada nombre (first_name)


2. DESDE (FROM) una tabla denominada nombre_del_cliente (customer_data) (en un conjunto de
datos denominado nombre_del_cliente [customer_data]) (el nombre del conjunto de datos
siempre va seguido de un punto y, a continuación, del nombre de la tabla).
3. Pero solo se devuelven los datos DONDE (WHERE) el primer_nombre (first_name) es Tony
Los resultados de la consulta pueden ser similares a los siguientes:

first_name
Tony
Tony
Tony
En conclusión, esta consulta tenía la sintaxis correcta, pero no fue muy útil después de la
devolución de los datos.

Varias columnas en una consulta


En la vida real, tendrás que trabajar con más datos, además de los clientes llamados Tony. El
mismo comando SELECT elige varias columnas que se pueden sangrar y agrupar.

Si solicitas varios campos de datos de una tabla, debes incluir estas columnas en el comando
SELECT. Cada columna está separada por una coma, como se muestra a continuación:
Este es un ejemplo de cómo aparecería en BigQuery:

La consulta anterior usa tres comandos para localizar clientes que se llaman Tony:

1. ELEGIR (SELECT) las columnas denominadas id_del_cliente (customer_id), nombre


(first_name) y apellido (last_name)
2. DESDE (FROM) una tabla denominada nombre_del_cliente (customer_data) (en un conjunto de
datos denominado nombre_del_cliente [customer_data]) (el nombre del conjunto de datos
siempre va seguido de un punto y, a continuación, del nombre de la tabla)3. Pero solo se
devuelven los datos DONDE (WHERE) el nombre (first_name) es Tony”
3. Pero solo se devuelven los datos DONDE (WHERE) el nombre (first_name) es Tony
La única diferencia entre esta consulta y la anterior es que se eligen más columnas de datos.
La consulta anterior eligió solamente el nombre (first_name), mientras que esta consulta elige
el ID_del_cliente (customer_id) y el apellido (last_name), además del nombre (first_name). En
general, para usar los recursos de manera más eficiente, debes elegir solo las columnas que
necesitas. Por ejemplo, tiene sentido que elijas más columnas si vas a usar los campos
adicionales en tu cláusula WHERE. Si tienes varias condiciones en tu cláusula WHERE,
pueden escribirse de la siguiente manera:

Ten en cuenta que, a diferencia del comando SELECT, que usa una coma para separar
campos/variables/parámetros, el comando WHERE usa la instrucción AND para conectar
condiciones. Cuando te conviertas en un escritor de consultas más experimentado, usarás
otros conectores u operadores, como OR y NOT.

Este es un ejemplo de BigQuery con varios campos usados en una cláusula WHERE:
La consulta anterior usa tres comandos para localizar clientes con un ID de cliente válido
(mayor que 0) cuyo nombre es Tony, y su apellido es Magnolia.

1. ELEGIR (SELECT) las columnas denominadas id_del_cliente (customer_id), nombre


(first_name) y apellido (last_name)
2. DESDE (FROM) una tabla denominada nombre_del_cliente (customer_data) (en un conjunto de
datos denominado nombre_del_cliente [customer_data]) (el nombre del conjunto de datos
siempre va seguido de un punto y, a continuación, del nombre de la tabla).
3. Pero solo devuelve los datos DONDE (WHERE) el ID_del_cliente (customer_id) es mayor que
0, el nombre (first_name) es Tony y el apellido (last_name) es Magnolia.
Ten en cuenta que una de las condiciones es una condición lógica que comprueba si el
ID_del_cliente (customer_id) es mayor que cero.

Si un cliente se llama Tony Magnolia, los resultados de la consulta podrían ser:

1967 Tony
Si hay más de un cliente con el mismo nombre, los resultados de la consulta podrían ser:

1967 Tony Magnolia


7689 Tony Magnolia

Conclusión clave
Lo más importante es recordar cómo usar SELECT, FROM y WHERE en una consulta. Una
vez que hayas practicado cómo escribir tus propias consultas SQL más adelante en el
programa, las consultas con varios campos serán más sencillas.
SELECT * indica a la base de datos que seleccione todas las columnas de la tabla de
empleados. Los criterios de la cláusula WHERE le indican a la base de datos qué datos
de esas columnas debe devolver la consulta.
Esta consulta seleccionará todos los datos de la tabla de empleados en los que jobCode
es FTE y el apellido es James.
La cláusula WHERE album_id = 277 mostrará solo datos sobre el álbum con el número de
ID 277. La consulta completa es SELECT * FROM album WHERE album_ID = 277. La
cláusula WHERE filtra los resultados que cumplen con ciertas condiciones. La cláusula
WHERE incluye el nombre de la columna, un signo de igual y el valor o los valores a
incluir en la columna. El nombre del álbum con el número de ID 277 es Bach: Variaciones
Goldberg.

Conviértete en un experto en visualización


de datos
Tu caja de herramientas de análisis de datos se está llenando.
Aprender tanto sobre las hojas de cálculo
como sobre SQL te llevará lejos en el mundo del análisis de datos.
Hay más que aprender, por supuesto,
y muchas más herramientas que podrás usar,
pero tu futuro se ve brillante.
Y está a punto de verse aún más brillante
porque estamos aquí para hablar más sobre la visualización de datos.
Te contaré un poco más sobre el papel de
las herramientas de visualización de datos y el análisis de datos
y te daré la oportunidad de ver
esas herramientas en acción más adelante en este video.
Quizás recuerdes que la visualización de datos
es la representación gráfica de cierta información.
Para muchos analistas de datos,
es la parte más emocionante de
su trabajo porque
ven que su esfuerzo se ve recompensado con algo interesante.
Sin mencionar que la visualización de datos
es hermosa y útil.
Me quedé anonadado cuando llegué a Google y
comencé a recibir un informe de datos trimestral en
mi correo electrónico y tenía
una gran plataforma de diapositivas
donde la gente contribuía con sus visualizaciones.
Definitivamente fue una luz en el camino
cuando comencé a generar mis propias visualizaciones.
Si no te impresiona mi historia,
déjame contarte sobre Florence Nightingale.
¿Te suena ese nombre?
Es responsable de gran parte de
la filosofía de la enfermería moderna y,
lo creas o no,
también fue analista de datos.
Durante la Guerra de Crimea, en la década de 1850,
miles de soldados morían todos los días,
Nightingale quería encontrar una manera
de reducir la cantidad de muertes.
Después de examinar los datos,
descubrió que la mayoría de
los soldados morían a causa de afecciones evitables.
Para convencer a los administradores del hospital
de que debían concentrarse en estas afecciones,
creó un gráfico que mostraba
la cantidad de muertes durante varios meses.
Las secciones azules mucho más grandes en
la visualización representan las muertes evitables.
Su trabajo condujo directamente a cambios importantes en la atención al paciente.
Ella hizo todo esto hace más de
150 años sin una computadora.
Una de las principales razones por las que Nightingale creó
esta visualización fue para que
los datos fueran más fáciles de entender para su audiencia.
Sintió que tendría más
éxito en convencer a los interesados
utilizando imágenes en lugar de solo palabras y números.
Tenía razón. Las tablas llenas de datos,
si bien son necesarias para el análisis,
simplemente no pueden mostrar tendencias y patrones
tan rápida y claramente como las visualizaciones.
Imagínate que recibes una tarea que
debe completarse el mismo día.
Si recopilas los datos que necesitas en una tabla,
¿podrías explicar resultados usando la tabla?
Sí, probablemente podrías,
pero una mejor idea sería utilizar
una visualización como este gráfico de barras.
Algo como esto hace que sea mucho
más fácil para ti explicarlo rápidamente,
y tienes el beneficio de
un gráfico genial para respaldar tu análisis.
Como analista de datos,
te conviene crear visualizaciones que
hagan que los datos sean fáciles de entender
e interesantes de ver, así que lúcete.
Es posible que los interesados no tengan
mucho tiempo para dedicarle a los datos.
Tu trabajo será hacer que su tiempo valga la pena.
Volvamos a la tabla de datos que
creamos anteriormente en el curso.
Si has creado la tuya para practicar,
puedes abrirla ahora o probarla más tarde.
Estos son los datos que agregamos antes.
Vamos a crear una visualización de los datos
insertando un gráfico, un gráfico de barras.
Puedes ver que la hoja de cálculo visualizó
los datos de nuestra tabla
de la manera que tenía más sentido.
Creó un gráfico de barras o
un gráfico de columnas para comparar las edades de cada persona por nombre,
pero es posible que ya lo hayas descubierto.
Esa es la belleza de la visualización:
muestra el análisis de datos de manera rápida y clara.
Podemos usar el editor de gráficos para ajustarlo.
Los diferentes programas de hojas de cálculo pueden
tener diferentes formas de hacer esto,
pero todos tienen funciones de visualización
y maneras de editar esas visualizaciones.
Por ahora, echemos un vistazo a los gráficos sugeridos.
Podemos hacer que las barras vayan horizontalmente usando un gráfico de barras.
Eso se ve muy bien, así que vamos a cerrar el editor de gráficos.
Hay muchas opciones que tener en cuenta,
pero lo mantendremos a un nivel básico por ahora.
Siéntete libre de probar otras visualizaciones
si practicas más tarde.
Ahora, podemos ajustar nuestro gráfico para que
toda nuestra hoja de cálculo se vea limpia y profesional.
¡Excelente! Espero que aprendas a amar
las visualizaciones de datos tanto como yo.
Tal vez te conviertas en un pionero de la visualización de datos,
al igual que Florence Nightingale.
Como analista de datos novato,
empezaste a llenar tu cinturón de trabajo con
herramientas valiosas que
utilizarás durante el resto del programa.
Tener conocimientos sobre hojas de cálculo, SQL y visualización de datos
te ayudará a convertirte en un detective de datos excelente.
Podrás utilizar estas herramientas durante todo
el proceso de análisis de datos a medida que avances.
A continuación, completa
algunas actividades para concluir esta parte del programa.
También completarás una evaluación para
verificar tu comprensión de todo lo que aprendiste.
Esta es una gran oportunidad para
pensar en algunas de las áreas que
continuarás explorando
en este curso y en tu carrera.
Como siempre, eres libre de revisar los videos y
los textos para ayudarte a recordar ciertos temas e ideas,
incluso si ya te sientes preparado.
Estás a solo unos pasos del próximo curso;
eso es un gran progreso. Sigue así.

Planificar una visualización de datos


Antes, aprendiste que la visualización de datos es la representación gráfica de la información.
Como analista de datos, te interesará crear visualizaciones que hagan que tus datos sean
fáciles de entender e interesantes para observar. Debido a la importancia de la visualización
de datos, la mayoría de las herramientas de análisis de datos (como hojas de cálculo y bases
de datos) tienen un componente de visualización integrado, mientras que otras (como
Tableau) se especializan en la visualización como su principal valor agregado. En esta lectura,
explorarás los pasos que implica el proceso de visualización de datos y algunas de las
herramientas de visualización de datos más comunes disponibles.

Pasos para planificar una visualización de datos


Veamos un ejemplo de una situación de la vida real en la que un analista de datos podría
necesitar crear una visualización de datos para compartir con los interesados. Imagina que
eres un analista de datos que trabaja para un distribuidor de ropa. La compañía ayuda a las
pequeñas tiendas de ropa a administrar su inventario, y las ventas están en auge. Un día, te
enteras de que tu compañía se está preparando para hacer una actualización importante en
su sitio web. Para guiar las decisiones relativas a la actualización del sitio web, se te pide que
analices los datos del sitio web existente y de los registros de ventas. Revisemos los pasos
que deberías seguir.

Paso 1: Explora los datos en busca de patrones


Primero, le pides a tu gerente o al propietario de los datos acceso a los registros de ventas
actuales y a los informes de análisis del sitio web. Esto incluye información sobre cómo se
comportan los clientes en el sitio web existente de la compañía; es decir, información básica
sobre quiénes lo visitaron, quiénes compraron en la compañía y cuánto compraron.

Mientras revisas los datos, observas un patrón entre las personas que visitan el sitio web de la
empresa con mayor frecuencia: la geografía y mayores cantidades de dinero invertido en
compras. Si se realiza un análisis más detallado, esta información podría explicar por qué las
ventas son tan fuertes en este momento en el noreste y ayudar a tu compañía a encontrar
nuevas formas de continuar mejorándolas a través del nuevo sitio web.

Paso 2: Planifica tus imágenes


A continuación, llegó la hora de refinar los datos y presentar los resultados de tu análisis. En
este momento, tienes muchos datos distribuidos en varias tablas, y esta no es la mejor
manera de compartir tus resultados con la administración y el equipo de Marketing.
Probablemente, te interesará crear una visualización de datos que explique los resultados a tu
público objetivo de una forma rápida y efectiva. Como sabes que tu público está orientado a
las ventas, eres consciente de que la visualización de datos que uses debería tener estas
características:

 Mostrar números de ventas a lo largo del tiempo


 Conectar las ventas con la ubicación
 Mostrar la relación entre las ventas y el uso del sitio web
 Mostrar qué clientes impulsan el crecimiento

Paso 3: Crea tus imágenes


Como ya decidiste qué tipo de información y perspectivas deseas mostrar, es hora de
empezar a crear las visualizaciones reales. Ten en cuenta que crear la visualización correcta
para una presentación o para compartir con los interesados es un proceso. Este proceso
consiste en probar diferentes formatos de visualización y hacer ajustes hasta conseguir lo que
estás buscando. En este caso, una combinación de diferentes imágenes comunicará mejor tus
resultados y convertirá tu análisis en una historia más atractiva para los interesados. Por lo
tanto, puedes usar las capacidades de diagrama que están incorporadas en tus hojas de
cálculo para organizar los datos y crear imágenes.

1) line charts can


track sales over time 2) maps can connect sales to locations 3) donut charts can show
customer segments 4) bar charts can compare total visitors that make a purchase
1) los gráficos de líneas pueden rastrear las ventas a lo largo del tiempo; 2) los mapas pueden
conectar las ventas con las ubicaciones; 3) los gráficos de donas pueden mostrar segmentos
de clientes, y 4) los gráficos de barras pueden comparar el total de visitantes que realizan una
compra.
Crea tu kit de herramientas de visualización de datos
Hay muchas herramientas que puedes usar en la visualización de datos.

 Puedes usar las herramientas de visualización de tu hoja de cálculo para crear visualizaciones
simples, como gráficos de líneas y barras.
 Puedes usar herramientas más avanzadas, como Tableau, que te permiten integrar datos en
visualizaciones de estilo de panel.
 Si estás trabajando con el lenguaje de programación R, puedes usar las herramientas de
visualización en RStudio.
Tu elección de visualización dependerá de varios factores, incluidos el tamaño de tus datos y
el proceso que usaste para analizarlos (hoja de cálculo, bases de datos/consultas o lenguajes
de programación). Por ahora, solo considera los conceptos básicos.

Hojas de cálculo (Microsoft Excel o Google Sheets)


En nuestro ejemplo, los diagramas y gráficos integrados en las hojas de cálculo facilitaron y
aceleraron el proceso de creación de imágenes. Las hojas de cálculo son excelentes para
crear visualizaciones simples, como gráficos de barras y de torta, e incluso proporcionan
algunas visualizaciones avanzadas, como mapas y diagramas de cascada y embudo (que se
muestran en las siguientes figuras).

Pero, a veces, necesitas una herramienta más poderosa para darles realmente vida a tus
datos. Tableau y RStudio son dos ejemplos de plataformas muy usadas que pueden ayudarte
a planificar, crear y presentar visualizaciones de datos efectivas y atractivas.

Software de visualización (Tableau)


Tableau es una herramienta de visualización de datos popular que te permite extraer datos de
casi cualquier sistema y convertirlos en imágenes atractivas o información procesable. La
plataforma ofrece las mejores prácticas visuales integradas, lo que hace que analizar y
compartir datos sea más rápido, fácil y (lo más importante) útil. Tableau funciona bien con una
amplia variedad de datos, e incluye un panel interactivo que les permite tanto a ti como a tus
interesados hacer clic para explorar los datos de forma interactiva.

Un gráfico circular muestra cómo un todo se divide en partes y es una visualización


efectiva para una clase desglosada por edad. Un diagrama de dispersión muestra la
relación entre dos o más variables y es una visualización efectiva para la edad y los
ingresos.
Puedes comenzar a explorar Tableau en los recursos de Video instructivo. Tableau Public es
gratuito, fácil de usar y contiene mucha información útil. La página Recursos es una ventanilla
única para videos instructivos, ejemplos y conjuntos de datos con los cuales puedes practicar.
Si deseas ver lo que otros analistas de datos comparten en Tableau, visita la página
Visualización del día, donde encontrarás hermosas imágenes que varían desde la Búsqueda
de planetas (habitables) hasta Quién habla en películas populares.

Lenguaje de programación (R con RStudio)


Muchos analistas de datos trabajan con un lenguaje de programación llamado R. La mayoría
de las personas que trabajan con R también terminan usando RStudio, un entorno de
desarrollo integrado (IDE), para satisfacer sus necesidades de visualización de datos. Al igual
que con Tableau, puedes crear visualizaciones de datos de estilo panel con RStudio.

Visita su sitio webpara obtener más información sobre RStudio.


Seguramente, pasarías días explorando todos los recursos que se proporcionan en
RStudio.com, pero las Hojas de referencia de RStudio y la Guía de iniciación a la visualización
de datos de RStudio son excelentes lugares para empezar. Cuando tengas más tiempo,
consulta los videos y seminarios web que ofrecen consejos y perspectivas útiles para usuarios
principiantes y avanzados.

Conclusión clave
Los mejores analistas de datos usan una gran variedad de herramientas y métodos para
visualizar y compartir sus datos. A medida que vayas aprendiendo más sobre la visualización
de datos durante este curso, mantén la curiosidad, investiga diferentes opciones y prueba
continuamente nuevos programas y plataformas que te ayuden a aprovechar tus datos al
máximo.

También podría gustarte