Está en la página 1de 7

Power BI

Kaggle, un indispensable en el mundo de la Data Science

Kaggle, un indispensable en el
mundo de la Data Science
Colaborar con otros usuarios, encontrar y
publicar conjuntos de datos, competir con otros
cientí cos de datos para resolver los desafíos de
este campo cientí co: eso y más en un sola
plataforma online.

Puedes escuchar este audio en la versión online de tu clase o escaneando este código QR

Kaggle.com es una plataforma en línea que se dedica a la ciencia de datos y el aprendizaje automático
(machine learning). Fundada en 2010 y adquirida por Google en 2017, Kaggle se ha convertido en una de las
comunidades de ciencia de datos más grandes y activas en línea, con más de 4 millones de usuarios
registrados en todo el mundo.

Estos usuarios tienen la oportunidad de participar en competencias, colaborar en proyectos y acceder a


conjuntos de datos públicos para resolver problemas y desarrollar soluciones en el campo de la ciencia de
datos.

Power BI
1 de 7
Power BI
Kaggle, un indispensable en el mundo de la Data Science

Algunas de estas competencias o desafíos son planteados por empresas y organizaciones que pueden
necesitar, entre otras cosas, la predicción de ciertos resultados, la clasi cación de datos, el análisis de
imágenes, entre otros. Los participantes tienen acceso a datos reales para desarrollar modelos y
soluciones efectivas.

Además de las competencias, Kaggle también ofrece un espacio para colaborar en proyectos de ciencia de
datos, donde los usuarios pueden trabajar juntos en el análisis y la resolución de problemas especí cos.

Así, los usuarios de Kaggle han creado soluciones innovadoras para una amplia variedad de problemas,
desde la detección de fraude en el comercio electrónico hasta la predicción de la calidad del aire en las
ciudades, o como veremos a continuación, una contribución que permite visualizar de una manera más
clara la población en la India.

Caso práctico: Censo en la India


El censo 2011 resulta ser, a la fecha, la última encuesta censal nacional realizada por la Organización del
Censo de la India, la cual fue llevada a cabo en 2 fases: listado de viviendas y población. Esta encuesta
censal cubrió los 28 estados del país, donde un total de 2.7 millones funcionarios visitaron hogares en 7,935
ciudades y 600,000 aldeas, clasi cando a la población según género, religión, educación y ocupación.

Este censo enfrentó grandes desafíos, considerando la vasta extensión de la India y la diversidad de
culturas, así como el hecho de que se realiza cada 10 años.

Así, esta encuesta censal contenía 9 preguntas para los hogares:

Power BI
2 de 7
Power BI
Kaggle, un indispensable en el mundo de la Data Science

Pero no tiene sentido hablar de todos estos datos, cuando puedes explorarlos por ti mismo, gracias a un
colaborador y miembro de Kaggle.com que ha realizado uninforme en referencia a ellos, el cual dejo
disponiblepara su apertura e interacción de otros usuarios.

¿Cómo abrir un archivo?


Para que explores estos datos con Power BI, te invitamos a que, en primer lugar, descargues el archivo
presentado a continuación.

Archivo Censo India 2011 (pbix)

Puedes descargar este PDFFile en la versión online de tu clase o escaneando este código QR

Power BI
3 de 7
Power BI
Kaggle, un indispensable en el mundo de la Data Science

Ahora, procede a seguir el siguiente tutorial para que puedas visualizar los datos antes mencionados:

Puedes ver este video en la versión online de tu clase o escaneando este código QR

India como se aprecia en el informe tiene un 69% de su población rural siendo Bihan uno de los mayores,
con una población rural del 88% – unas 92 millones de personas.

Power BI
4 de 7
Power BI
Kaggle, un indispensable en el mundo de la Data Science

Usando el segmentador, elije el estado de Uttar Pradesh, con mayor población rural, y responde:

Ejercita lo aprendido

Pregunta no obligatoria

En Uttar Pradesh, ¿cuál es el porcentaje de población rural que aparece en tu visualización?

A) 22,28%

B) 11,3%

C) 77,72%

D) 88,7%

La alternativa correcta es C)

El censo de 2011 resulta ser la encuesta nacional más reciente realizada en dicho país. Su
última versión, programada para 2021, no pudo ser llevada a cabo debido a la pandemia
por Covid-19. La nueva fecha está prevista para el año 2024.

Como puedes ver con este pequeño ejemplo, Kaggle cuenta con una amplia biblioteca de conjuntos de
datos públicos – de los más diversos temas, desde datos económicos y sociales hasta datos cientí cos y
de salud – que se pueden explorar y utilizar para proyectos personales, practicar o investigación.

Esta herramienta, junto a Power BI pueden llegar a ser una poderosa dupla de visualización y análisis de
datos, siendo de gran utilidad, por ejemplo, en el contexto de un censo, ya que permite manejar y presentar
grandes volúmenes de datos de manera efectiva, como por ejemplo:

Visualización de datos demográ cos

Permite crear visualizaciones interactivas y dinámicas que facilitan la comprensión de los datos
demográ cos recopilados, pudiendo generar grá cos, mapas, tablas y otros tipos de visualizaciones
que permitan explorar patrones, tendencias y relaciones en la información demográ ca.

Power BI
5 de 7
Power BI
Kaggle, un indispensable en el mundo de la Data Science

Análisis comparativo

Es posible comparar diferentes variables demográ cas y realizar análisis comparativos entre distintas
regiones geográ cas o grupos de población. Esto ayuda a identi car diferencias signi cativas y
comprender las características demográ cas de manera más precisa.

Seguimiento de tendencias

Permite realizar un seguimiento de las tendencias demográ cas a lo largo del tiempo. Puede
visualizar datos históricos y crear grá cos que muestren la evolución de variables demográ cas clave,
como la población total, el crecimiento demográ co o la distribución por edad y género.

Segmentación de datos

Power BI facilita la segmentación de datos demográ cos según diferentes criterios, como la edad, el
género, la ubicación geográ ca o cualquier otra variable relevante. Esto ayuda a explorar y comprender
mejor las características de grupos especí cos de la población.

Generación de informes

Permite crear informes personalizados basados en los datos del censo. Estos informes pueden incluir
tablas, grá cos y visualizaciones interactivas que resuman y presenten los resultados del análisis de
manera clara y comprensible.

Finalmente, con este ejemplo podemos ver que Power BI es una herramienta valiosa para cualquier análisis
de datos, ya que facilita la visualización, el análisis comparativo, el seguimiento de tendencias, la
segmentación de datos y, en el caso del censo en india, la generación de informes basados en la
información demográ ca recopilada, ayudando a obtener insights y tomar decisiones informadas.

¡No esperes más para comenzar a explorarlo!

Power BI
6 de 7
Power BI
Kaggle, un indispensable en el mundo de la Data Science

Comparte tu experiencia
¿Qué tipo de competencias crees que pueden ofrecer las empresas a través de Kaggle?

Copyright Todos los derechos reservados

Los recursos alojados en enlaces y códigos QR presentes en este documento podrían no estar disponibles a partir del 28 de enero del 2025

Power BI
7 de 7

También podría gustarte