Está en la página 1de 14

Ciencia de Datos con Python

en QGis3

Ciencia de Datos
La ciencia es un conocimiento
que entendemos tan bien que
podemos enseñarlo a un
ordenador

Kunth: Computer programming as a art


http://www.paulgraham.com/knuth.html
Ciencia de Datos

Ciencia de datos se trata de emplear técnicas de


programación para analizar datos, requiere el desarrollo de
habilidades en cuatro áreas:

Programación. todo científico de datos utiliza la


programación para explicar a las computadoras lo que
necesita de ellas.

Estadística. imprescindible para extraer conocimiento de los


datos. Es sorprendente lo mucho que puede lograrse con
sólo unos rudimentos (media, mediana, desvío estándar y
cuartiles).

Comunicación. Visualización de datos.

Conocimiento de dominio. experiencia acumulada en un


campo particular de: agricultura, relaciones públicas, física
cuántica….Complementa de forma las habilidades
analíticas. El conocimiento de dominio ayuda a discernir si
las respuestas obtenidas mediante un análisis estadístico
tienen sentido. También es necesario para saber cuáles son
las preguntas que deberíamos estar haciendo.

Fuente: Antonio Vazquez Brust 2019 Ciencia de Datos y Políticas Públicas


Ciencia de Datos

La Ciencia de Datos (Data Science) consiste en sacar


conclusiones útiles de extensos y diversos conjuntos
de datos, mediante la exploración, la predicción y la
inferencia.

Exploración: identificación de
patrones en la información.
La predicción usar la información que
conocemos para hacer suposiciones
sustentadas sobre los valores que
deseamos conocer.
La inferencia trata de cuantificar el
grado de certeza

?
Ciencia de Datos

Nuestras principales herramientas


de exploración son las
visualizaciones y la estadística
descriptiva, para la predicción son
los algoritmos de aprendizaje y la
optimización, para la inferencia son
los tests y los modelos estadísticos.

La Estadística es un componente
central de la ciencia de datos debido a
que el objetivo de los métodos
estadísticos es lograr conclusiones
solidas basados en datos incompletos 𝑥
Q1-Q2-Q3
𝑛

𝑘=0

La ciencia de los datos amplía el campo Ρxy


Ơx
de la estadística aprovechando al
máximo la computación, la visualización
de datos, el aprendizaje de la máquina, la
optimización y el acceso a la información.
.
Ciencia de Datos

Para cualquier aspecto del mundo que


deseemos estudiar ya sea:
 Clima de la Tierra

 Mercados mundiales,

 Análisis médicos,

 Deserción escolar,

 Impactos ambientales

 …………………………….

Los datos que recogemos suelen ofrecer una descripción


incompleta del tema en cuestión.

El desafío de la ciencia de los datos es extraer


conclusiones confiables usando esta información parcial.
Bibliotecas científicas Python en
QGis
Python es un lenguaje de programación poderoso debido
a su portabilidad, flexibilidad, la sintaxis, el estilo y la
extensibilidad.

Para definir una función o iniciar un bucle, solo requiere


una pequeña sangría en lugar de corchetes.

El resultado es profundo: un programador de Python puede


mirar cualquier código Python no comentado y entender
rápidamente su funcionamiento y propósito.

Tres paquetes en
particular son las Numpy
principales
herramientas de Matplotlib
computación científica
de Python y los tres Python
están integrados en Scipy
QGis
Mapas y Datos

Componente espacial Componente numérico


Flujo de trabajo a seguir
para el análisis de datos
Flujo del Análisis de Datos

¿Cómo puedo analizar mis datos de


forma eficaz?

¿Qué método es el más apropiado para


analizar los datos de mi proyecto?

¿Antes de aplicar técnicas geoespaciales como puedo


explorar mis datos?
Flujo del Análisis de Datos

¿Cuáles son las etapas de un proceso


de
análisis de datos?
¿Qué es una tabla de datos?
¿Cómo puedo interpretar los datos?
¿Qué técnica estadística puedo aplicar?
¿Qué software utilizo?

¿?

¿?
¿?

¿? ¿? ¿?
Flujo del Análisis de
Datos
¿Cuáles son las etapas de un proceso de
análisis de datos?

Problema

Conclusiones. Comunicar

Recolección de datos

Pre-Procesamiento

Análisis

Limpie
za de
Exploración datos
¿Qué es una tabla de datos?
Formato de los datos:
- Texto por tabulaciones
- Delimitados por comas
- Excel
- Bases de datos

- Tablas de Estructura de la tabla de


atributos datos

Encabezado

Campos

Celdas

- Raster

Tipos de datos:
- Texto
- Numéricos
- Fecha
- Lógicos
¿Cómo puedo interpretar los datos?

Análisis exploratorio de datos: 𝑥


• Estadística descriptiva Q1-Q2-Q3
𝑛

• Visualización
𝑘=0
Ρxy
Ơx

¿Qué técnica estadística puedo aplicar? ¿Qué software utilizo?

Inferencia estadística:
• Distinguir si un grupo es
diferente a otro.
• Analizar si hay relación entre
variables numéricas
• Crear un modelo matemático
que permita predecir una
variable en función de otra(s)
PyQGis3

También podría gustarte