Documentos de Académico
Documentos de Profesional
Documentos de Cultura
A
Agenda: Lista de citas programadas
Alcance del trabajo (SOW): Esquema acordado de las tareas a realizar durante un proyecto
Algoritmo: Proceso o conjunto de reglas a seguir para realizar una tarea específica
Análisis de déficits: Método para examinar y evaluar el estado actual de un proceso con el fin
de identificar las oportunidades de mejora en el futuro
Analista de datos: Persona que recopila, transforma y organiza los datos para sacar
conclusiones, hacer predicciones e impulsar la toma de decisiones fundamentada
Apertura: Aspecto de la ética de datos que promueve el acceso libre, el uso y el uso
compartido de los datos
Árbol de decisiones: Herramienta que ayuda a los analistas a tomar decisiones sobre características
esenciales de una visualización
Archivo CSV (valores separados por coma): Archivo de texto delimitado que utiliza una
coma para separar valores
Asignación de alias: Nombrar temporalmente una tabla o columna en una consulta para que
sea más fácil de leer y escribir
Atributo: Característica o cualidad de los datos que se usa para etiquetar una columna en una
tabla
AVERAGE: Función de una hoja de cálculo que muestra el resultado de un promedio de los
valores de un rango seleccionado
AVERAGEIF: Función de una hoja de cálculo que devuelve el promedio de todos los valores
de las celdas de un determinado rango que cumplen una condición especificada
B
Base de datos normalizada: Base de datos en la que solo se almacenan datos relacionados
en cada tabla
Base de datos relacional: Base de datos que contiene una serie de tablas que se pueden
conectar para formar relaciones
Bordes: Líneas que se pueden agregar alrededor de dos o más celdas en una hoja de cálculo
C
Cadena de texto: Grupo de caracteres en una celda, mayormente compuesto por letras
Cálculo: Rama de la matemática que implica el estudio de las tasas de cambio y los cambios
entre valores que están relacionados por una función
Campo calculado: Campo nuevo dentro de una tabla dinámica que realiza ciertos cálculos en
función de los valores de otros campos
Campo: Información de una fila o columna de una hoja de cálculo; en una tabla de datos, suele
ser una columna de la tabla
Canal: Aspecto visual o variable que representa características de los datos en una
visualización
CASE: Instrucción de SQL que muestra resultados de registros que cumplen con las
condiciones al incluir una instrucción si/entonces en una consulta
CAST: Función de SQL que convierte los datos de un tipo en otro
Causalidad: Cuando una acción lleva directamente a un resultado, como una relación de
causa-efecto
Ciclo de vida de los datos: Secuencia de etapas por las que pasan los datos, que incluye
planificar, capturar, gestionar, analizar, archivar y destruir
Ciencia de datos: Campo de estudio que utiliza datos sin procesar para crear nuevas formas
de modelar y entender lo desconocido
Clasificación: Sistema para ubicar valores de un conjunto de datos en una escala de logro o
estado
Clave externa: Campo en una tabla de una base de datos que es una clave primaria en otra
tabla (Ver clave primaria)
Clave primaria: Identificador en una base de datos que hace referencia a una columna en la
que cada valor es único (Ver clave externa)
Clúster: Conjunto de puntos de datos en una visualización de datos con valores similares
COALESCE: Función de SQL que arroja valores que no son nulos en una lista
Código abierto: Código que está libremente disponible y puede ser modificado y compartido
por las personas que lo usan
Compatibilidad: Qué tan bien dos o más conjuntos de datos pueden trabajar juntos
Composición de datos: Proceso que combina las partes individuales en una visualización y
las muestra juntas como un todo
CONCAT: Función de SQL que une cadenas y crea nuevas cadenas de texto que se pueden
usar como claves únicas
CONCATENATE: Función de una hoja de cálculo que une dos o más cadenas de texto
Conjunto de datos: Recopilación de datos que pueden ser manipulados o analizados como
una unidad
Consulta interna: Subconsulta de SQL que está dentro de otra instrucción de SQL
CONVERT: Función de SQL que cambia la unidad de medida de un valor en los datos
Cookie: Pequeño archivo almacenado en una computadora que contiene información acerca
de sus usuarios
COUNT DISTINCT: Función de SQL que solo devuelve los valores distintos en un rango
especificado
COUNT: Función de la hoja de cálculo que cuenta el número de celdas en un rango que
cumplen con una condición especificada
COUNTA: Función de la hoja de cálculo que cuenta el número total de valores en un rango que
cumplen con un criterio especificado
COUNTIF: Función de la hoja de cálculo que devuelve el número de celdas que coinciden con
un valor especificado
CREATE TABLE: Cláusula de SQL que añade una tabla temporal a una base de datos que
puede ser utilizada por varias personas
CSS (Cascading Style Sheets): Lenguaje de programación usado para el diseño de páginas
web que controla los elementos gráficos y la presentación de la página
D
DATEDIF: Función de la hoja de cálculo que calcula el número de días, meses o años entre
dos fechas
Datos continuos: Datos que se miden y que pueden tener casi cualquier valor numérico
Datos de primera fuente: Datos recopilados por una persona o por un grupo por medio de sus
propios recursos
Datos de segunda fuente: Datos recopilados por un grupo directamente de su audiencia y que
luego se venden
Datos de terceros: Datos proporcionados por fuentes externas que no los recopilaron de
forma directa
Datos desactualizados: Cualquier dato que haya sido reemplazado por información más
nueva y más precisa
Datos duplicados: Cualquier registro que inadvertidamente comparte datos con otro registro
Datos en formato ancho: Conjunto de datos en el que cada tema tiene una sola fila con varias
columnas para retener los valores de los distintos atributos del tema
Datos en formato largo: Conjunto de datos en el que cada fila es un punto de tiempo por
tema; por lo tanto, cada tema tiene datos en varias filas
Datos incoherentes: Datos que usan diferentes formatos para representar lo mismo
Datos limpios: Datos que están completos y son correctos y pertinentes para el problema que
se está resolviendo
Datos no estructurados: Datos que no se organizan de forma que sea fácil identificarlos
Datos nominales: Tipo de datos cualitativos que se categorizan sin un orden establecido
Datos sucios: Datos que están incompletos, o son incorrectos o irrelevantes para el problema
a resolver
Design Thinking: Proceso que se usa para resolver problemas complejos de una manera
centrada en el usuario
Diagrama de dispersión: Visualización de datos que representa relaciones entre las diferentes
variables con puntos de datos individuales sin una línea de conexión
DISTINCT: Palabra clave que se agrega a una instrucción SELECT en SQL para recuperar
solamente entradas no duplicadas
Dominio del problema: Área de análisis que abarca cada actividad que afecta a un problema
o se ve afectada por él
DROP TABLE: Cláusula de SQL que elimina una tabla temporal de una base de datos
E
Ecosistema de datos: Los distintos elementos que interactúan entre sí para producir,
gestionar, almacenar, organizar, analizar y compartir datos
Ecuación: Cálculo que implica suma, resta, multiplicación o división (también se denomina
expresión matemática)
Eje X: Línea horizontal de un gráfico que suele situarse en la parte inferior y, a menudo, se usa
para representar escalas de tiempo y categorías puntuales
Eje Y: Línea vertical de un gráfico que suele situarse a la izquierda y, a menudo, se usa para
representar frecuencias y otras variables numéricas
Elemento de datos: Información en un conjunto de datos
Encabezado: Primera fila en una hoja de cálculo que hace referencia al tipo de datos en cada
columna
Énfasis: Principio de diseño que consiste en organizar los elementos visuales para centrar la
atención del público en la información importante de una visualización de datos
Equidad: Cualidad del análisis de datos que no genera sesgos ni los reafirma
Equilibrio: Principio de diseño que consiste en crear un atractivo estético y claridad en una
visualización de datos mediante la distribución uniforme de los elementos visuales
Esquema: Forma de describir cómo se organiza algo, por ejemplo, los datos
Estrategia de datos: Gestión de las personas, los procesos y las herramientas que se usan en
el análisis de datos
Ética de los datos: Normas justificadas respecto de lo que está bien y lo que está mal a la
hora de recopilar, compartir y usar datos
Ética: Normas justificadas respecto de lo que está bien y lo que está mal. Por lo general,
presuponen lo que deben hacer los seres humanos, usualmente en términos de derechos,
obligaciones, beneficios para la sociedad, equidad o virtudes específicas
Etiqueta: Texto en una visualización que identifica un valor o describe una escala
Exactitud: Grado de conformidad de los datos con respecto a la entidad real que se mide o
describe
Exhaustividad: Grado en que los datos contienen todas las medidas o componentes deseados
Expresión matemática: Cálculo que implica suma, resta, multiplicación o división (también se
denomina ecuación)
Expresión regular (RegEx): Regla que establece que los valores de una tabla deben coincidir
con un patrón prescrito
F
Filtrado: Proceso que muestra solo los datos que cumplen con un criterio específico mientras
oculta el resto
Filtro de panel: Herramienta que muestra solo los datos que cumplen con un criterio específico
y oculta el resto
Formato condicional: Herramienta de la hoja de cálculo que cambia la forma en que aparecen
las celdas cuando los valores cumplen con una condición específica
Formato visual: Apariencia de la visualización de datos que les aporta una estructura y un
atractivo estético
Fórmula: Conjunto de instrucciones que se utilizan para realizar un cálculo utilizando los datos
de una hoja de cálculo
Framework: Contexto que necesita una presentación para establecer conexiones lógicas entre
la tarea empresarial y las métricas
FROM: Sección de una consulta que indica de qué tabla(s) extraer los datos
Fuente de datos correctos: Fuente de datos que es confiable, original, integral, actual y citada
(ROCCC)
Fuente de datos erróneos: Fuente de datos que no es confiable, original, integral, actual ni
citada (ROCCC)
Función matemática: Función que se utiliza como parte de una fórmula matemática
Fusión de datos: Proceso de combinar dos o más conjuntos de datos en un único conjunto de
datos
G
Geolocalización: Ubicación geográfica de una persona o dispositivo mediante información
digital
Gobierno de datos: Proceso para garantizar la gestión formal de los recursos de datos de una
empresa
Gráfico circular: Visualización de datos que usa segmentos de un círculo para representar las
proporciones de cada categoría de datos en comparación con el total
Gráfico de áreas: Visualización de datos que utiliza puntos de datos individuales para una
variable cambiante conectados por una línea continua con un área de relleno debajo
Gráfico de barras: Visualización de datos que usa el tamaño para contrastar y comparar dos o
más valores
Gráfico de burbujas agrupadas: Visualización de datos que muestra los datos en círculos
agrupados
Gráfico de burbujas: Visualización de datos que muestra puntos de datos individuales como
burbujas, y compara valores numéricos por su tamaño relativo
Gráfico de columnas: Visualización de datos que usa puntos de datos individuales para una
variable cambiante, representada mediante columnas verticales
Gráfico de líneas: Visualización de datos que usa una o más líneas para mostrar cambios o
variaciones en los datos a lo largo del tiempo
Gráfico de viñetas: Visualización de datos que muestra los datos como un gráfico de barras
horizontal que se mueve hacia un valor deseado
Gráfico dinámico: Gráfico creado a partir de los campos en una tabla dinámica
GROUP BY: Cláusula de SQL que agrupa las filas que tienen los mismos valores de una tabla
en filas de resumen
Guiones bajos: Líneas utilizadas para subrayar palabras y conectar caracteres de texto
H
Habilidades interpersonales: Rasgos y comportamientos no técnicos que se relacionan con la
manera en que las personas trabajan
Hacer contactos: Construir relaciones con otros tanto en persona como en línea
HAVING: Cláusula de SQL que añade un filtro a una consulta en lugar de la tabla subyacente
que solo se puede usar con funciones de agregado
Histograma: Visualización de datos que muestra con qué frecuencia los valores de los datos
se encuadran en ciertos rangos
HTML5: Lenguaje de programación que brinda una estructura para páginas web y conecta a
plataformas de hosting
I
IDE (entorno de desarrollo integrado): Aplicación de software que junta todas las
herramientas que un analista de datos puede querer usar en un solo lugar
Ingeniero de datos: Profesional que transforma los datos en un formato útil para su análisis y
les da una estructura confiable
INNER JOIN: Función de SQL que devuelve registros con valores coincidentes en ambas
tablas
Intervalo de confianza: Rango de valores que transmite qué probabilidad hay de que una
estimación estadística refleje la población
J
Java: Lenguaje de programación que se usa ampliamente para crear aplicaciones web de
empresas que pueden ejecutarse en múltiples clientes
JOIN: Función de SQL que se usa para combinar filas de dos o más tablas basadas en una
columna relacionada
L
LEFT JOIN: Función de SQL que devuelve todos los registros de la tabla izquierda y solo los
registros coincidentes de la tabla derecha
LEN: Función que indica la longitud de una cadena de texto al contar el número de caracteres
que contiene
LIMIT: Cláusula de SQL que especifica el número máximo de registros devueltos en una
consulta
M
Macrodatos: Conjuntos de datos grandes y complejos que, generalmente, se recopilan durante
largos períodos y que permiten que los analistas de datos aborden los problemas comerciales
de gran alcance
Manipulación de datos: Proceso para cambiar los datos, de manera que estén más
organizados y sean más fáciles de leer
Mapa coroplético: Visualización de datos que colorea las áreas en un mapa según las
mediciones o las dimensiones
Mapa de densidad: Visualización de datos que representa concentraciones, con un color que
representa el número o la frecuencia de los puntos de datos en un área determinada de un
mapa
Mapa de símbolos: Visualización de datos que muestra una marca sobre una determinada
longitud y latitud
Mapa térmico: Visualización de datos que usa el contraste del color para comparar categorías
en un conjunto de datos
Mapeo de datos: Proceso de hacer coincidir campos entre una fuente de datos y otra
Marca: Objeto visual en una visualización de datos, como un punto, una línea o una forma
Margen de beneficio: Porcentaje que indica cuántos centavos de ganancia se generaron por
cada dólar de venta
Margen de error: Cantidad máxima que se espera que los resultados de la muestra difieran de
los de la población real
MATCH: Función de la hoja de cálculo que se usa para ubicar la posición de un valor de
búsqueda específico
MAX: Función de la hoja de cálculo que muestra el resultado del valor numérico más alto de un
rango de celdas
MAXIFS: Función de la hoja de cálculo que devuelve el valor máximo de un determinado rango
que cumple una condición especificada
Mentalidad técnica: Capacidad de dividir las cosas en pasos o piezas más pequeñas y
trabajar con ellas de forma ordenada y lógica
Mentor: Persona que comparte su conocimiento, sus habilidades y su experiencia para ayudar
a otras personas a crecer, tanto en el campo profesional como en el personal
Metadatos descriptivos: Metadatos que describen datos y que se pueden utilizar para
identificarlos más adelante
Metadatos estructurales: Metadatos que indican cómo se organizan ciertos datos y si forman
parte de una recopilación de datos o de varias
Método McCandless: Método que se utiliza para presentar visualizaciones de datos y que
pasa de la información general a la específica
Métrica de negocios: Criterio de medición que se utiliza para resolver una tarea empresarial
Métrica: Tipo único y cuantificable de datos que pueden utilizarse para medición
MID: Función que extrae un segmento desde el medio de una cadena de texto
MIN: Función de la hoja de cálculo que muestra el resultado del valor numérico más bajo de un
rango de celdas
MINIFS: Función de la hoja de cálculo que devuelve el valor mínimo de un rango determinado
que cumple una condición especificada
Modelo de datos: Herramienta para organizar los elementos de los datos y la forma en que se
relacionan entre ellos
Módulo: Operador (%) que devuelve el resto cuando se divide un número por otro
Movimiento: Principio de diseño que consiste en organizar los elementos visuales para guiar la
atención del público de una parte de una visualización de datos a otra
Muestra: En el análisis computacional de datos, segmento de una población que la representa
en su totalidad
Muestreo aleatorio: Forma de seleccionar una muestra de una población para que todos los
tipos posibles de la muestra tengan la misma oportunidad de ser elegidos
N
Narrativa de datos: Comunicar el significado de un conjunto de datos con elementos visuales
y una historia personalizada según el público
Nivel de confianza: Probabilidad de que el tamaño de una muestra refleje con precisión a la
porción más grande de la población
Nube: Lugar para mantener los datos en línea, en vez de guardarlos en el disco duro de una
computadora
O
Objetivo métrico: Objetivo medible establecido por una empresa y evaluado mediante
métricas
Oficina del Censo de los Estados Unidos: Agencia del Departamento de Comercio de los
Estados Unidos que funciona como proveedor principal de la nación de datos de calidad sobre
las personas y la economía
Orden de las operaciones: Uso de paréntesis para agrupar los valores de la hoja de cálculo a
fin de aclarar el orden en el que deben realizarse las operaciones
Ordenación: Proceso de organizar los datos en un orden significativo para que sean más
fáciles de entender, analizar y visualizar
Ordenar hoja: Función del menú de la hoja de cálculo que ordena todos los datos por la
clasificación de una columna específica ordenada y mantiene los datos juntos a través de las
filas
ORDER BY: Cláusula de SQL que ordena los resultados devueltos en una consulta
OUTER JOIN: Función de SQL que combina RIGHT y LEFT JOIN para devolver todos los
registros coincidentes en ambas tablas
P
Paleta de color divergente: Tema de color que muestra dos rangos de valores de datos que
usan dos tonalidades diferentes, donde la intensidad del color representa la magnitud de los
valores
Patrón: Principio de diseño que usa elementos visuales similares para demostrar tendencias y
relaciones en una visualización de datos
Poner de relieve: Explorar los datos para identificar rápidamente la información más
importante
Pregunta con límite de tiempo: Pregunta que especifica un plazo para ser analizada
Pregunta principal: Pregunta que orienta a las personas hacia cierta respuesta
Pregunta relevante: Pregunta que tiene importancia para el problema que se debe resolver
Privacidad de los datos: Preservación de la información sobre los datos de una persona cada
vez que ocurre una transacción de datos
Proceso de análisis de datos: Las seis fases de preguntar, preparar, procesar, analizar,
compartir y actuar cuyo propósito es el de obtener conocimiento que propicie la toma de
decisiones informada
Propiedad: Aspecto de la ética de datos que presupone que cada persona es dueña de los
datos sin procesar que proporciona y que tiene control primordial sobre su uso, procesamiento
y uso compartido
Proporción: Principio de diseño que consiste en usar el tamaño relativo y la disposición de los
elementos visuales para mostrar la información en una visualización de datos
Pruebas A/B: Proceso de probar dos variaciones de la misma página web para determinar qué
página es más exitosa para atraer el tráfico de usuarios y generar ingresos
R
R: Lenguaje de programación que se usa para análisis estadísticos, visualización y análisis de
datos
Rango de datos: Valores numéricos que se encuentran entre valores máximos y mínimos
predefinidos
Rango de ordenación: Función del menú de la hoja de cálculo que ordena un rango
especificado y preserva las celdas que no están incluidas en ese rango
Redes sociales: Sitios web y aplicaciones donde los usuarios crean y comparten contenido o
interactúan entre sí
Referencia absoluta: Referencia dentro de una función que está bloqueada para que las filas
y las columnas no cambien si se copia la función
Referencia de celda: Celda o rango de celdas en una hoja de cálculo que se usa
generalmente en fórmulas y funciones
Registro: Conjunto de datos relacionados en una tabla de datos, generalmente sinónimo de fila
Repetición: Principio de diseño que consiste en repetir elementos visuales para demostrar el
significado en una visualización de datos
Resaltar tabla: Visualización de datos que usa formato condicional y color en una tabla
Retorno de la inversión (ROI): Fórmula que utiliza las métricas de inversión y ganancias para
evaluar el éxito de una inversión
RIGHT JOIN: Función de SQL que devuelve todos los registros de la tabla derecha y solo los
registros coincidentes de la izquierda
RIGHT: Función que muestra un número establecido de caracteres a la derecha de una cadena
de texto
Ritmo: Principio de diseño que consiste en crear movimiento y fluidez en una visualización de
datos para captar la atención de una audiencia
ROUND: Función de SQL que devuelve un número redondeado hasta un número determinado
de decimales.
Ruby: Lenguaje de programación orientado a objetos para el desarrollo de aplicaciones web
S
Seguridad de los datos: Emplear medidas de seguridad para proteger los datos contra el
acceso no autorizado o contra la corrupción
SELECT INTO: Cláusula de SQL que copia datos de una tabla a una tabla temporal sin añadir
la nueva tabla a la base de datos
SELECT: Sección de una consulta que indica de qué columna(s) extraer los datos
Sesgo de los datos: Cuando una preferencia a favor o en contra de una persona, un grupo de
personas o una cosa sesga sistemáticamente los resultados del análisis de datos en una cierta
dirección
Sesgo del muestreo: Representar en mayor o en menor medida a ciertos miembros de una
población debido a que se trabaja con una muestra que no representa a la población en su
totalidad
Sesgo del observador: Tendencia de distintas personas a observar las cosas de forma
diferente (también se denomina sesgo del investigador)
Sesgo del observador: Tendencia de distintas personas a observar las cosas de forma
diferente (también se denomina sesgo del investigador)
Sesgo: Preferencia consciente o subconsciente a favor o en contra de una persona, un grupo
de personas o una cosa
Sintaxis: Estructura predeterminada de un lenguaje que incluye todas las palabras, los
símbolos y la puntuación requeridos, así como su correcta ubicación
SPLIT: Función de la hoja de cálculo que divide el texto en base a un carácter específico y
ubica cada fragmento en una nueva celda separada
SUBSTR: Función de SQL que extrae una subcadena de una variable de cadenas
SUM: Función de una hoja de cálculo que suma los valores de un rango de celdas
seleccionadas
SUMIF: Función de una hoja de cálculo que suma datos numéricos basados en una condición
SUMPRODUCT: Función que multiplica las matrices y muestra el resultado de la suma de esos
productos
Tabla dinámica: Herramienta de resumen de datos que se utiliza para clasificar, reorganizar,
agrupar, contar, totalizar o promediar datos
Tabla temporal: Tabla de una base de datos que se crea y existe temporalmente en el servidor
de una base de datos
Tarea empresarial: Pregunta o problema que el análisis de datos resuelve para un negocio
Tasa de respuesta estimada: Número promedio de personas que suele completar una
encuesta
Tasa de rotación: Ritmo en el que los empleados abandonan voluntariamente una empresa
Texto alternativo: Texto que ofrece una alternativa al contenido no textual, como las imágenes
y los vídeos
Tipo de datos: Atributo que describe cierto dato según sus valores, su lenguaje de
programación o las operaciones que puede realizar
Tipos de problemas: Distintos problemas que encuentra el analista de datos; entre ellos,
categorizar elementos, descubrir conexiones, hallar patrones, identificar temas, hacer
predicciones y detectar algo inusual
Título: Texto en la parte superior de una visualización que comunica los datos que se están
presentando
Toma de decisiones basada en datos: Uso de datos para guiar la estrategia empresarial
Toma de decisiones inspirada en datos: Explorar diferentes fuentes de datos para descubrir
qué tienen en común
Transacciones: Aspecto de la ética de los datos que considera que las personas deben
conocer las transacciones financieras resultantes del uso de sus datos personales y la
dimensión de esas transacciones
TRIM: Función que quita los espacios al principio, al final o los repetidos en los datos
U
Único: Valor que no puede tener un duplicado
Unidad: Principio de diseño que consiste en usar elementos visuales que se complementan
entre sí para crear un atractivo estético y claridad en la visualización de datos
V
Validación de campos cruzados: Proceso que garantiza el cumplimiento de ciertas
condiciones para múltiples campos de datos
Validez: Grado de conformidad de los datos con respecto a las restricciones cuando se los
ingresa, recopila o crea
VALUE: Función de la hoja de cálculo que convierte una cadena de texto que representa un
número en un valor numérico
Variedad: Principio de diseño que consiste en usar diferentes tipos de elementos visuales en
una visualización de datos para captar la atención del público
Vista en círculo: Visualización de datos que muestra la fortaleza comparativa en los datos
Visualización estática: Visualización de datos que no cambia a lo largo del tiempo a menos
que se edite
VLOOKUP: Función de una hoja de cálculo que busca verticalmente cierto valor en una
columna y arroja la información correspondiente
W
WHERE: Sección de una consulta que especifica los criterios que deben cumplir los datos
solicitados
WITH: Cláusula de SQL que crea una tabla temporal que se puede consultar muchas veces