Está en la página 1de 8

Analista de datos

Analizar datos significa traducir cifras y palabras brutos en


inteligencia que impulse un beneficio en la vida real. Solo
existe un objetivo al hacer un análisis de datos: “Tomar
mejores decisiones”, para lograrlo se sigue un proceso de
cinco pasos:
1. Definir una Necesidad.
2. Tomar los datos disponibles y adquirir otros.
3. Estudiarlos y transformarlos en conocimiento.
4. Evaluar las conclusiones.
5. Tomar o recomendar una decisión que cubra la
necesidad.

Etapas de un análisis de Datos

Proceso básico de análisis

El proceso básico de análisis consta de cuatro pasos:

1. Define el problema: encuentra la necesidad a cubrir.


Para definir un problema debes describirlo con mucho
detalle si no defines el problema lo más seguro es que
naufragues por mares de datos sin ningún destino. lo
primero que debes hacer es pedirle a tu cliente que te
ayude a definirlo pues al final el tomara las decisiones. Si
él te dice “toma mis datos hazme un análisis”, es una
expresión vaga sin utilidad. a veces el cliente no tiene ni
idea de cuál es su problema y tú debes ayudarle a
encontrarlo. Para definir el problema hazle preguntas
explicitas, por ejemplo, si tu cliente tiene un negocio y
quiere aumentar sus ventas las preguntas que debes
hacerle son: ¿por cuanto quieres aumentarlas? ¿Cómo
crees que podríamos lograrlo? ¿el objetivo te parece
razonable? ¿Cómo están las ventas de tu competencia?
¿Cuánto inviertes en publicidad? Tu cliente puede estar
bien informado acerca de sus problemas y metas, pero
debes tomar sus impresiones. mientras más entiendas a
tus clientes tu análisis será de más ayuda.
2. Divide el problema en partes: debes ir de lo general a
lo particular. Toma lo que aprendiste de tu cliente y sus
datos y dividirlos para llevar el análisis a un nivel fino,
por ejemplo, retomando la pregunta ¿Cómo crees que
podríamos aumentar las ventas? Se puede dividir en:
¿Qué esperan de nosotros nuestros mejores clientes?
¿Qué promociones podrían funcionar mejor? ¿está
funcionando nuestra publicidad? Para esta etapa hay
dos opciones si tienes datos resumidos debes elegir los
elementos que satisfacen cada pregunta detallada, si
tienes datos brutos lo primero es resumirlos para para
hacerlos útiles. Tener preguntas detalladas es lo que da
la pauta a elegir un método de análisis y saber que datos
requieres, por eso, es importante que tengas bien
definidas las necesidades a cubrir.
3. Evalúa la información y los datos que requieres
antes del análisis, así como sus conclusiones al
final: escribir tus observaciones del problema y de los
datos el análisis real comienza cuando tú te involucras.
Es importante que apuestes tu credibilidad en tus
conclusiones así serás el responsable del éxito de tu
trabajo y al mismo tiempo tus clientes respetaran más
tus juicios y entenderán las limitaciones de tus
conclusiones. Si no te involucras en un análisis evitas la
responsabilidad y por tanto nadie creerá en ti. Para
evaluar debes comparar a simple vista las respuestas de
tu cliente con los datos que se relacionan con las
preguntas detalladas.
4. Decide tu mejor opción y da tu recomendación:
recuerda en todo momento que el resultado de tu trabajo
se reflejara en mejores decisiones que son la conclusión
de un estudio de los datos. Un punto clave para decidir
bien es comunicar los resultados de forma precisa a tu
cliente. En un reporte debe estar incluida la metodología
usada. La interpretación de los datos y una
recomendación hacha por ti.
Ten presente estos cuatro pasos pues los aplicaras en todos
los análisis que hagas.

Confidencialidad de la información

Es común que al efectuar un análisis se te confíe información


privada del cliente o de una organización, por ello debes
garantizar que esta se mantendrá bien protegida. La
confidencialidad es la garantía de que la información no será
divulgada, reproducida o modificada sin la autorización de su
dueño. La confidencialidad de la información es muy
importante ya que por un descuido mínimo podrías tener fuga
de información, lo cual te hace vulnerable a fraude, robos de
identidad, piratería, perdida de información, daño a la imagen
de la empresa entre otros. Actualmente existen leyes en la
mayoría de los países que obligan a guardar en estricto
secreto los asuntos confiados por tu cliente. Además, en la
mayoría de los casos te harán firmar un documento legal.
Para garantizar la confidencialidad toma las siguientes
medidas:
 Se consciente de la necesidad de la seguridad
informática y difúndela.
 Asesórate para elaborar contratos con cláusulas de
confidencialidad y protección de datos esto te ampara a
ti y a tu cliente.
 Resguarda bien tus contraseñas, de preferencia
memorízalas y no las anotes.
 Genera contraseñas alfanuméricas de al menos ocho
caracteres.
 Evita trabajar en equipos públicos de computo.
 Cuida el uso del correo electrónico elimina contactos
desconocidos.
 Evita trabajar con software libre de dudosa procedencia.
 Confirma que las actualizaciones de software sean de su
fuente oficial.
 Utiliza antivirus, cortafuegos y anti phishing.
 Si la información que utilizas es muy importante usa un
software de cifrado de datos en unidades de
almacenamiento y comunicaciones.

Con estas medidas tendrás una buena reputación como


analista y evitaras meterte en problemas.

Obtención de los datos necesarios para el análisis

Una vez que definiste el problema y lo dividiste a detalle el


siguiente paso es definir el método de análisis a emplear y
posteriormente los datos que necesitas. para realizarlo debes
basarte en la pregunta detallada que quieres responder para
definir el método de análisis por ejemplo para responder a la
pregunta ¿cómo se comportaron mis ventas el último año? se
puede emplear el método de comparación sobre una gráfica.
Una vez definido requieres una gráfica que defina las ventas
por cada mes durante todo el año para construir la gráfica
propuesta.

Definición de variables de datos


Los datos se presentan de diversas maneras por ejemplo una
fecha, un país o una postura política, todos estos son datos.
Para agrupar datos de distintos tipos se definen variables, se
les llama así porque su valor cambia o varía según el caso. En
una base de datos una variable sería equivalente a un campo.
Para hacer un análisis preciso es necesario hacer las
preguntas detalladas y definir las variables de forma correcta,
de hacerlo mal todo el análisis será erróneo, a pesar de que
elijas y apliques el método correctamente.
Para saber que datos específicos requieres, primero debes
definir las variables que necesitas. Existen dos tipos de
variables que dependen de los datos que contienen estas
pueden ser:
1. Cualitativas: las variables cualitativas tienen valores
definidos por una cualidad, no por una cantidad, por
ejemplo, estado civil (Soltero, casado, viudo), modelo de
auto, dirección entre otros. Existen dos tipos ordinales y
nominales. Las nominales son cuando los datos no tienen
valores mayores o menores que otros generalmente son
texto, pero pueden ser números como números de
teléfono código postal o código de productos. Por otro
lado, las ordinales si son valores que pueden ser
mayores o menores que otros por ejemplo estrato alto
medio o bajo.
2. Cuantitativas: tienen valores definidos por una cantidad
numérica y siempre pueden ser ordenadas de mayor a
menor o viceversa.

Fuentes de datos
Una vez que sabes cuales son los datos que requieres debes
obtenerlos de distintas fuentes. Las fuentes de datos más
comunes son: tablas dinámicas y bases de datos relacionales.
Por lo general en estas se obtendrán datos cuantitativos de
forma agrupada es decir sumas o promedios. Pero también
pueden estar los datos brutos a los que les hará falta una
agrupación.
Por otro lado, para datos cualitativos las fuentes serán textos
tanto digitales como impresos por ejemplo encuestas,
artículos, correos, audios.
En ocasiones los datos que requieres no estarán disponibles
así que hay que modificar el método de análisis para
satisfacer el problema.

Manejo de datos en hojas de calculo

Las hojas de cálculo son herramientas básicas para un


analista porque son altamente usadas por las organizaciones.
Uso de las hojas de calculo
Un analista de datos debe dominar el uso de las hojas de
cálculo ya que es una buena herramienta para aprender a
manipular datos. Con estas se pueden obtener graficas útiles
y resolver análisis no complejos. Sin embargo, una hoja de
cálculo tiene limitaciones para manipular y graficar datos,
para contrarrestarlas, los analistas profesionales, usan un
lenguaje de programación y algún software especializado para
hacer análisis más complejos. Aun cuando domines las
herramientas más poderosas encontraras clientes con miles
de hojas de cálculo, es por esto que debes saber cómo
manipularlas cuando lo requieras.

Extensiones Txt y Csv

Cuando necesitas manipular los datos de una hoja de cálculo


en otras herramientas de software lo que harás es exportarlas
como archivos de tipo TXT o CSV. El tipo TXT es el texto plano
sin formato, sin embargo, el tipo CSV es más usado ya que es
un formato sencillo para representar los datos como tabla. Las
ventajas de usarlo es que por lo general todos los gestores de
bases de datos y lenguajes de programación lo aceptan.

Manejo de datos en una base de datos relacional

En tu trabaja tendrás que exportar información desde una


base de datos a un archivo tipo CSV para que diferentes
softwares puedan analizar la información de este archivo. La
información que puedes extraer de una base de datos puede
ser una tabla, es resultado de una consulta o todo el
contenido de la base de datos. El procedimiento más común
es extraer el contenido necesario por medio de una consulta
para depositarla en un archivo tipo CSV o TXT de esta manera
el proceso de la consulta lo realiza el sistema gestor dejando
la interpretación de los datos al analista de datos.
Creación de encuestas observacionales

Una encuesta es parte de un estudio observacional (Hay


también estudios experimentales) esta sirve para obtener
datos y hacer conjeturas sobre los resultados.
¿Cuándo hacer una encuesta?
El mejor momento para hacer una encuesta es cuando quieres
describir causalidad, es decir, relaciones causa-efecto entre
variables, pero no tienes los suficientes datos. En estos casos
se formulan teorías que son puestas a prueba antes de hacer
una conclusión, de esta forma le da certeza a tu análisis. Las
encuestas se aplican para obtener variables cuantitativas que
sirven para posteriormente hacer un análisis estadístico.

Factores de confusión

Una encuesta puede salir contaminada si no se diseña


correctamente. Em primer lugar las preguntas deben ser
efectivas. No deben dejar pauta a la interpretación, por lo que
deben ser muy específicas. Debes tomar en cuenta que la
encuesta sirve para comprobar algunas de las teorías que ya
tienes, por lo que nunca hagas encuestas sin un objetivo, solo
para adquirir más datos. Si tienes una teoría que dice que dos
variables tienen relación, antes de aplicar una encuesta,
debes tomar en cuenta las variables de confusión, estas, son
las que les restan veracidad a los datos. Por ejemplo, las
ventas de un negocio de vino han ido a la baja. Con los pocos
datos que tienes, formulas la teoría de que la economía de la
zona ha ido a la baja y el precio del vino se ha mantenido alto.
Aplicas encuestas para comprobar tu teoría, pero dentro de la
zona existe un sector que posee alto poder adquisitivo y para
ellos el precio no es un problema. Esos clientes harían que se
confundan los resultados, en este caso la variable de
confusión es la localización.
Pedazos y aleatoriedad
Para evitar las variables de confusión existen dos estrategias
que te ayudan:
1. División en grupos: dividir la población en grupos.
Regresando al ejemplo de las ventas de vinos, dividiendo
la población en grupos obtendrás resultados por cada
región, así, el distrito de alto poder adquisitivo tendrá su
resultado y el resto otro.
2. Aleatoriedad: la toma de datos debe ser al azar, pero
tomando en cuenta que los sujetos a encuestar, sean
comparables el uno del otro. Retomando el ejemplo del
negocio de vino, un sujeto no comparable sería un niño
que no puede comprar alcohol.

También podría gustarte