0% encontró este documento útil (0 votos)
171 vistas15 páginas

Guía Completa de Análisis de Datos

Este documento describe las 6 etapas clave de un proceso de análisis de datos: 1) definir el problema, 2) recolectar datos, 3) limpiar datos, 4) explorar datos, 5) analizar datos, y 6) sacar conclusiones. También explica los tipos de variables, cómo organizar y visualizar datos en tablas, y las técnicas estadísticas comunes para diferentes tipos de problemas. El software R se recomienda para realizar análisis estadísticos de datos.

Cargado por

Chuy Uy Uy
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
171 vistas15 páginas

Guía Completa de Análisis de Datos

Este documento describe las 6 etapas clave de un proceso de análisis de datos: 1) definir el problema, 2) recolectar datos, 3) limpiar datos, 4) explorar datos, 5) analizar datos, y 6) sacar conclusiones. También explica los tipos de variables, cómo organizar y visualizar datos en tablas, y las técnicas estadísticas comunes para diferentes tipos de problemas. El software R se recomienda para realizar análisis estadísticos de datos.

Cargado por

Chuy Uy Uy
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

El secreto para Analizar Datos como un pro que un consultor estadístico nunca

te contaría

Has oído hablar de estadística alguna vez. O incluso has estudiado alguna asignatura
en la universidad. Llega el momento de aplicarla… y no sabes ni por dónde empezar.
Seguramente ahora mismo tienes una pregunta que te inquieta:
¿Qué método estadístico aplico para analizar datos de mi proyecto? o, dicho de
otro modo ¿Cómo puedo analizar mis datos de forma eficaz?
Es muy normal tener esta preocupación. La estadística aplicada es una herramienta
viva que requiere práctica y enfoque. Hoy te quiero mostrar una visión global y práctica de
un proceso de análisis de datos y cómo encontrar el foco necesario para analizar datos
como un profesional. No saber qué técnica aplicar ni cómo utilizar la estadística aplicada es
una preocupación muy recurrente. La estadística aplicada es una disciplina con muchas
técnicas y conceptos, para ello sirve contestar las siguientes preguntas:
1. ¿Cuáles son las etapas de un proceso de análisis de datos?
Es esencial que tengas una foto global de un proceso de análisis de datos. Te puedes
perder en la cantidad de técnicas y estrategias estadísticas que tienes a tu disposición. A
continuación, puedes ver las 6 etapas.
1. El Problema. Todo nace de un problema, de una necesidad real. En
esta etapa definirás el foco del estudio.
2. La Recolección. Es el diseño de un método para obtener datos. Más
técnicamente es un proceso de experimentación, puede ser una encuesta,
pruebas en laboratorios con pacientes, datos de marketing en redes sociales etc.
3. La Limpieza. Homogeneizar los datos en cuanto a formato, deshacer
observaciones que no te interesan y almacenar las más útiles.
4. La Exploración. Utilizando la estadística descriptiva podrás traducir
los datos a gráficos y características que puedas interpretar.
5. El Análisis. Con la ayuda de la estadística inferencia encontrarás
conclusiones de un conjunto grande (población) con la información de una
pequeña parte de este conjunto (muestra). El contraste de hipótesis es la
herramienta más famosa de esta etapa. Pero existen otras técnicas como: la
predicción, la clasificación o los métodos de causa-efecto, entre otros.
6. La Conclusión. Interpretarás los resultados del análisis y listarás las
conclusiones. Estarás mucho más cerca del objetivo que te habrás planteado al
inicio.
2. ¿Qué es una tabla de datos y cómo está ordenada?
En la etapa 4 La Exploración, empiezas a trabajar con datos ya limpios y ordenados.
Vas a empezar a modelar tu tabla de datos, la cual es una matriz con sus celdas (filas y
colunas). Algo así:

 Las filas son las observaciones. Las observaciones son las veces
que mides la realidad
 Las columnas son las variables. Las variables son las características
que vas a medir.
 El header (encabezado) son los nombres que vas a asignar a las
variables.
Entender que tu tabla de datos son columnas de números o letras en columnas es
sumamente crucial. Y también lo es la clasificación de las variables.
Las variables son las características que vas a medir y, en la práctica, te vas a
encontrar con 3 tipos.
 Cuantitativa. Son números y tienen unidades. Tienen un sentido de
escala. Pueden ser discretas (sin decimales) y continuas (con decimales). Por
ejemplo, el peso en kg es una variable continua porque hay 1,2 kg. o 1,45 kg.
En cambio, el número de alumnos en la clase de estadística es una variable
discreta ya que puede haber 15 o 14 pero no 15,5 alumnos.
 Cualitativa. Son aquellas que no se expresan en términos numéricos
sino en palabras y pueden ser de dos tipos. Las variables nominales, son
etiquetas o nombres de las cosas, por ejemplo, el país de procedencia (México,
Canadá Guatemala, Argentina), el estado civil (casado, Soltero, Divorciado), el
sexo (Hombre, Mujer), etc. Aquí no hay un orden, sino que su acomodo puede
ser de forma indistinta, El otro tipo son las variables ordinales, que son
aquellas que tienen un sentido de escala. Por ejemplo: la calidad del servicio
puede ser regular, normal, bueno, muy bueno, aquí sí hay un orden y una tiene
mayor peso que otra.

Estas son las bases más importantes para analizar datos. Enseguida nos
enfocaremos en la exploración, o también llamada, la descripción.
3. ¿Cómo puedo interpretar los datos?
Una vez que tengas tu tabla de datos limpia y entiendas qué tipo de variables tienes
y qué significan, es importante que puedas visualizar la información “escondida” en esta
tabla. ¿Qué quiere decir esto? Saber interpretar esa tabla de datos y poder comunicarte
con tus datos. Para ello, puedes descubrir información interesante con la ayuda de
gráficos.
La estadística descriptiva te va a ayudar a ver información que no puedes ver a
simple vista. Vas a utilizar gráficos y también características numéricas simples.
En este post vas a ver una lista con los gráficos más típicos explicados uno a
uno 🙂
¿Qué técnica estadística aplico en cada caso?
O dicho de otro forma, ¿qué test estadístico aplico?. La sensación de no controlar
todas las técnicas estadísticas es un poco agobiante. ¡Pero no te preocupes! Voy a
intentar deshacer esta sensación.
Lo más importante es entender los problemas tipo. Y hoy te voy a mostrar los 6
problemas más comunes:
1. Distinguir si un grupo es diferente a otro. Por ejemplo “ver si la
presión arterial es más alta en un grupo de pacientes con obesidad y los que no”
Por un lado tienes la variable numérica (presión arterial) y por el otro grupos de
pacientes (con o sin obesidad)
2. Distinguir si las proporciones son diferentes de un grupo al otro.
Por ejemplo: “¿La proporción de accidentes de moto es diferente por rangos de
edad 15-20, 20-25, 25-30 y 30-35?» Tenemos 4 proporciones que queremos
comparar.
3. Ver si los grupos tienen relación en la tabla de contingencias.
Por ejemplo “¿Hay relación en cuanto a la precisión (buena, regular, mala) de un
aparato de medida analógico y uno óptico?” En el fondo, es relacionar variables
cualitativas.
4. Analizar si hay relación entre variables numéricas. La asociación
entre medidas. Por ejemplo “Tienes datos de 200 familias sobre las ganancias y
los gastos. ¿Es verdad que se cumple que cuánto más tienes más gastas?”
5. Calcular un modelo matemático que permita predecir una
variable en función de otras. Por ejemplo “Un modelo que te permita calcular
la frecuencia cardíaca máxima en función de datos como la edad, la presión baja
y alta, el sexo, la altura y el peso”
6. Técnicas avanzadas de reconocimiento de patrones o machine
learning. Modelos y algoritmos predictivos para poder aportar respuestas de tus
datos y solucionar problemas reales con aplicaciones personalizadas para tu
caso.
Estos problemas se pueden resolver con diferentes técnicas estadísticas. Y
muchas de estas técnicas siguen la estrategia más famosa: el contraste de hipótesis. En
este formulario te puedes descargar una guía dónde te explico paso por paso esta
estrategia tan común y tan complicada de entender al inicio:
Accede a la guía PDF "Las 6 Técnicas Estadísticas" y al curso gratuito "Pro
Statistics"
Con este material vas a descubrir:
 Cómo analizar los datos para justificar tus hipótesis y resultados de tus
proyectos
 Una método para aplicar la estadística en tus datos para poder presentar tus
estudios con éxito delante de la comunidad científica
 Aportar resultados estadísticamente relevantes para demostrar con
seguridad tus hipótesis

Aceptas darte de alta a la lista de Conceptos Claros. Recibir material gratuito


sobre estadística y cómo analizar los datos y trainings gratuitos que pueden terminar en
una oferta comercial de vez en cuando. Política de privacidad y aviso legal para más
información.
ENVÍAME EL MATERIAL AHORA
¿Qué software utilizo y cómo aprendo a manejarlo?
Uno de los puntos más importantes es saber aplicar los conceptos y técnicas
estadísticos con datos reales. Es la magia de la estadística aplicada. Existen mucho
softwares. Unos comerciales otros no. Y la decisión puede parecer difícil pero no lo es.
Para mi el software que me ha aportado mayor beneficios a medio plazo ha sido R
con RStudio. ¿Por qué? Por estos motivos:
1. Primero, porque es gratuito.
2. Segundo, porque es un software consolidado con una comunidad
enorme. Con más peso tanto dentro de los centros de investigación como en
las empresas.
3. Y tercero, porque una vez superas la curva inicial de aprendizaje,
puedes seguir creciendo en modo DIY. ¡Y no habrá quien te pare!
Y es posible que pienses que es sólo para programadores porque hace uso de
comandos. Pero no es del todo cierto. Si posees las plantillas de código tipo puedes realizar
análisis estadísticos muy rápidos y eficaces sin aprender la estructura de programación.
Pero no te voy a engañar, si quieres utilizar este programa a un nivel
avanzado necesitarás utilizar la programación para aprovechar todo su potencial del
software.
Aquí tienes un artículo que te va a ayudar a empezar con R y entender el potencial
de esta herramienta.

# ¿Cómo analizar datos como un pro? La metodología probada paso a paso


¡Y este es el secreto que quería desvelarte hoy! Y para entender este secreto me he
querido asegurar de englobar los aspectos básicos en el funcionamiento de un proyecto de
análisis de datos. Por este motivo, te he explicado los puntos del principio 😉
Este secreto es un método paso a paso. Una metodología de aplicación.
Son los 4 pasos que, por mi experiencia, se van repitiendo en cualquier proceso de
análisis de datos. Y hoy, te los voy a desvelar:
# PASO1. Define UN objetivo para tu estudio (y sólo uno)
En este paso vas a definir un objetivo de tu estudio y SÓLO uno. El ser humano tiende
a complicarse (yo el primero) es muy importante focalizar los esfuerzos en un sólo objetivo.
Defínelo siguiendo estos puntos:
1. ¿Qué problema quiero solucionar con estos datos?
2. ¿Qué significan las variables?
3. ¿Qué tipo de variables tienes?
4. Definir 1 objetivo y sólo 1 que ayude a solucionar el problema que
has definido en el punto 1
# PASO2. Explorar los datos a lo Sherlock Holmes
Me gusta Holmes. Porque es capaz de ordenar toda la información de diferentes
escenas y sospechosos para poder aclarar el lío inicial.
Antes que Sherlock Holmes sepa quién es el asesino, Holmes explora diferentes
escenas: busca objetos, interroga a los sospechosos y los presentes, etc. “Explora” con su
lupa lugares inverosímiles. Consigue un listado de objetos y hechos relevantes. Después
los analiza para atar cabos y encontrar el culpable.
Y nosotros vamos a hacer lo mismo. Primero de todo exploraremos y después
analizaremos.
La etapa de descripción se compone de estos puntos:
1. Crea los gráficos más apropiados
2. Interpreta los gráficos
3. Encuentra tus primeros indicios. Tus primeras preconclusiones
4. Lista por orden de importancia los indicios que han desvelado los
gráficos
Esta paso es fundamental y muy muy importante.
Podrás recoger información muy útil de tu tabla de datos y la listarás por orden de
importancia.
El conocimiento de las herramientas gráficas de la estadística descriptiva es muy
importante. Si accedes al bonus te voy a desvelar los gráficos más utilizados en la práctica
ordenados caso por caso en el curso Pro Statistics 🙂
Curso Gratuito de Estadística + Guía PDF
Con este material vas a descubrir:
 Cómo utilizar el contraste de hipótesis para responder a tus preguntas como
investigador
 Clarificar conceptos estadísticos que te servirán en el 95% de tus estudios e
investigaciones
 Utilizar una metodología para analizar los datos de tus investigaciones y
poder presentar los resultados con éxito

Aceptas darte de alta a la lista de Conceptos Claros. Recibir material gratuito


sobre estadística y cómo analizar los datos y trainings gratuitos que pueden terminar en
una oferta comercial de vez en cuando. Política de privacidad y aviso legal para más
información.
ENVÍAME EL CURSO GRATUITO
# PASO3. Analiza los datos con un software y un mapa
Ahora es momento de decidir si tus preconclusiones son ciertas o no. Te vas a apoyar
de la estadística inferencial y de estrategias estadísticas.
Para hacerlo necesitas dos cosas:
 Conocimiento de un mapa de técnicas estadísticas
 Cómo aplicar estas técnicas con un software
Los puntos necesarios en este paso son:
1. Encuentra las técnicas más apropiadas para corroborar las
preconclusiones con la ayuda de un mapa
2. Diseña la metodología de análisis
3. Aplica esta metodología
4. Resume los resultados
El conocimiento de las técnicas estadísticas y tu experiencia juegan un gran papel en
esta etapa.
Si quieres más puedes encontrar 6 técnicas estadísticas más utilizadas en la práctica
que te ayudarán a ampliar el conocimiento de las técnicas.
Accede a la guía PDF "Las 6 Técnicas Estadísticas" y al curso gratuito "Pro
Statistics"
Con este material vas a descubrir:
 Cómo analizar los datos para justificar tus hipótesis y resultados de tus
proyectos
 Una método para aplicar la estadística en tus datos para poder presentar tus
estudios con éxito delante de la comunidad científica
 Aportar resultados estadísticamente relevantes para demostrar con
seguridad tus hipótesis

Aceptas darte de alta a la lista de Conceptos Claros. Recibir material gratuito


sobre estadística y cómo analizar los datos y trainings gratuitos que pueden terminar en
una oferta comercial de vez en cuando. Política de privacidad y aviso legal para más
información.
ENVÍAME EL MATERIAL AHORA
# PASO4. Crear el informe final listando conclusiones cristalinas
Es el último y muy importante. Saber comunicar tus hallazgos delante de tu audiencia.
Es un proceso muy, muy importante. Los datos sólo son útiles si se muestran los resultados
de forma cristalina.
Me ha pasado que en ocasiones no he sabido transmitir la importancia de mis
resultados y conclusiones. Y, ¡es el resultado final lo que importa! Te he preparado 6 puntos
que todo informe o presentación debe incluir:
1. Contextualiza tu estudio
2. Cita la problemática
3. Define tu objetivo alineado al problema que quieres resolver
4. Muestra la información escondida (etapa de exploración)
5. Define tu metodología de análisis (etapa de análisis)
6. Muestra los resultados (etapa de análisis)
7. Resume las conclusiones
8. Problemas encontrados durante el estudio y siguientes pasos
# ¿Quieres más detalle de este método paso a paso?
Entender estos pasos fue de verdad una revelación. Seguir este orden me dió claridad
y foco para aplicar la estadística de forma práctica sin complicarme con fórmulas complejas.
Como has visto requiere de conocimientos estadísticos y de manejo de softwares.
En mis principios utilicé R como software de aplicación y gracias a él tuve la
oportunidad de acceder a en un buen puesto de trabajo en el departamento de I+D de un
gran empresa de diseño de turbinas eólicas.
De verdad, recomiendo esta herramienta.
Puede ser que te interese entrar un poquito más en este método y entender paso a
paso esta metodología y cómo aplicarla con R.
Si es así puedes echar un vistazo a los recursos exclusivos + mini curso incluido
dónde resumo con la máxima claridad los pasos de la metodología y cómo empezar a
utilizar R con éxito 🙂
Me hubiera encantado poder recibir esta descripción del método paso a paso cuando
empecé. Espero que a ti también te haya sido útil.
Ya sabes que si quieres entrar en más profundidad puedes acceder aquí al mini curso
estadística gratuito.
¡Un abrazo!

Acerca del autor


Jordi Olle Sanchez
Autor de ConceptosClaros.com. Ayuda a investigadores apasionados a aplicar
estadística y análisis de datos en sus proyectos para catapultar su carrera investigadora y
adaptarse a la era de los datos. Accede a los recursos gratuitos para aplicar estadística en
tus datos

También podría gustarte