Está en la página 1de 92

Simulacro Tercer Ejercicio

Proyecto RURALIZA

07/09/2019
Antes de comenzar….
Antes de comenzar….
Antes de comenzar….
Tenemos que recordar que…
- Se busca una solución coherente.

- Después de hacer varios supuestos hay


cosas que ya nos suenan.
Objetivo

ENI Actores
KPI
En el examen ocurren cosas…
¿Y si me bloqueo?

¿Y si no entiendo lo que me preguntan?

¿Y si no tengo ni idea del tema que me han


puesto?

¡¡¡¡¡RESPIRA!!!!!!
¿Cuándo consigues ver lo que quiero
dibujar?
La artista pide comprensión…

Pero el examen se puede ver un poco


como ese dibujo…

… no hace falta tenerlo perfecto para que


el tribunal sepa lo que estás haciendo.
Proyecto RURALIZA
Este puede considerarse un proyecto “RARUCO”,
pero…¿se ha entendido lo que se quería hacer?

¿Hay cosas que sabemos y que se pueden


aplicar?

¿Nos hemos acordado de algún sistema


conocido al hacerlo?

YA TENÉIS PARTE DEL TRABAJO HECHO


Proyecto RURALIZA

VAMOS AL LÍO
Pregunta 1

Diagrama de contexto
- Actores
- Fuentes de datos
Pregunta 1

POSIBLES PERSONAS/ENTIDADES JURÍDICAS


Pregunta 1
Pregunta 1
Pregunta 1

¿Con cuáles nos quedamos para nuestro


diagrama de contexto?

- Ministerio de Agricultura  es quien va a


realizar el proyecto.

- Ministerio de Cultura  dará información al


sistema.

- Turespaña  da información sobre las


oficinas de turismo y actividades.
Pregunta 1

- Oficinas de
Puede interpretarse como que
turismo
vuelcan la información a
Turespaña o como que tienen
- Empresas
acceso al sistema para insertar
información.
- Asociaciones

Nosotros elegimos que sea Turespaña.


Pregunta 1

- Municipios  Dan de alta los “focos de


creación artística”, completan información.

- Ciudadanos - Usuarios Turismo Rural

- Artistas

- Funcionarios y altos cargos


Pregunta 1

OTROS ACTORES QUE INTERACTÚAN CON


NUESTRO SISTEMA

¿Qué servicios podemos usar?

- ¿Se firmará en la aplicación? NO


- ¿Habrá certificados? SÍ Puede haber otras que se
te ocurran o puede que
- ¿Habrá un gestor documental? SÍ algunas de las propuestas
- ¿Se utilizarán mapas? SÍ no te parezcan
importantes o estén
- ¿Se enviarán comunicaciones ? SÍ integradas en tu sistema.
- ¿Habrá un registro? NO
- ¿Se podrá traducir a lenguas cooficiales? SÍ
Pregunta 1

FUENTES DE DATOS
- Turespaña  Volcará los datos de los municipios.

- Redes Sociales  El sistema podrá obtener datos


para las recomendaciones.

- INE  Información sobre la población de un


municipio.

- AEMET  Información meteorológica.


Pregunta 1

- AEAT  Información económica (renta) de


municipios de más de 1000 habitantes.

- Portal País Vasco  Información económica


(renta) de municipios del País Vasco.

- Portal Navarra  Información económica


(renta) de municipios de Navarra.
Pregunta 1

Altos
Cargos
Artistas PLATA
Usuarios cl@ve
Turismo Funcionarios
Rural
autentic@
Ministerio
Cultura y RURALIZA
Deporte
SIM
Turespaña
EGEO/
GIS
Municipios
INE
AEMET RRSS

AEAT
Portales
Pregunta 2

Diferencias entre sistemas de


recomendación

Una aproximación

¿Utilizar el mismo sistema de


recomendación?
Pregunta 2

¡SISTEMAS DE
RECOMENDACIÓN!

¡NO SÉ NADA DE
ESO!

¿DE VERDAD
NO SABES
NADA?
Pregunta 2

TURISMO RURAL

Muchos usuarios que pueden hacer numerosos viajes en poco tiempo.

ARTE Y CULTURA RURAL

Pocos usuarios con pocas residencias en mucho tiempo.


Pregunta 2

TURISMO RURAL
Recomendamos a un
Muchos datos usuario lo que haya FILTRADO
potenciales gustado a otros usuarios COLABORATIVO
que se le parezcan.

ARTE Y CULTURA RURAL

Recomendamos a un
Pocos datos usuario según FILTRADO
potenciales concuerden sus BASADO EN
preferencias con las CONTENIDO
características de las
residencias/focos
artísticos.
Pregunta 2

Diferencias sistemas de recomendación

Factor Turismo Rural Cultura y Arte Rural


Alta: Baja:
Cantidad de
 Muchos usuarios (turistas)  Pocos usuarios (artistas)
información
 Muchos lugares y actividades  Pocos lugares
ENTRADA
1. Relacionada con el tiempo
1. Relacionada con el tiempo (meteorología, (meteorología, tipo día…):
tipo día…): alta (por la breve duración de media-baja (residencias de
Influencia
las estancias) mayor duración)
contextual
2. Relacionada con el espacio (servicios de 2. Relacionada con el espacio
uso diario en la zona): media-baja (servicios de uso diario en
la zona): alta
Frecuencia de
ACTUALIZ. actualización
Media Baja
Alta (es importante que la
Importancia de la recomendación se adapte muy
fiabilidad de las Media-baja bien a las preferencias de los
recomendaciones artistas, ya que se persiguen
SALIDA estancias de más alta duración)
Importancia de la
variedad y Alta (es importante para que no se recomiende
Media-baja
originalidad de las visitar siempre los mismos sitios)
recomendaciones
Pregunta 2

Datos Turismo Rural

USUARIOS
LUGARES ESTADÍST.
Edad
Arte
Sexo CONTEXTO
Patrimonio
Sit. fam.
Rutas Meteo
Estudios
PERFILES Naturaleza Época

Costas Tipo día
Gastronomía …

PREFEREN
CIAS DE
USUARIO

PREFEREN
CIAS ACTIVIDA TIPO
DES EXPERIENC.
VALORACI
VECINDARIOS
ONES
Pregunta 2

TURISMO RURAL. 2 tipos de recomendación:

1) Usuarios registrados

a)Régimen permanente Hay “cold start” porque al


b)Inicio (“cold start”) principio no tenemos
información del usuario
solicitante ni de otros con
quienes comparar.
2) Usuarios anónimos

a)Régimen permanente
No hay “cold start” porque
b)Inicio (“cold start”) desde el principio tenemos
la información de lugares.
Pregunta 2

TURISMO RURAL. Esquema recomendación. Día 0

PERFILES Y
LUGARES Modelado
CONTEXTO
contextual

Usuario Explicación
1) Solicita recomendación Genera
recomendaciones
Evaluación
Ítem

Módulo
2) Visita Medida Redes
visita Sociales
Pregunta 2

TURISMO RURAL. Esquema recomendación. Día n


PERFILES Y
VALORACIONES VECINDARIOS LUGARES Modelado
CONTEXTO
contextual

3) Valora
Genera
similitudes
Usuario Explicación
1) Solicita recomendación Genera
recomendaciones
Evaluación
Ítem

Módulo
2) Visita Medida Redes
visita Sociales

Día 1: se recomienda utilizando perfiles creados dinámicamente.


Día n: se recomienda a partir de los vecindarios individuales.
Usuario anónimo: solo contexto para recomendación basada en usuario. Vecindario de
lugares para recomendación basada en ítem.
Pregunta 2

Datos Cultura y Arte Rural

CONTEXTO
ARTISTA DISCIPLINA
Características
LUGARES ARTÍSTICA
… Servicios
Características
PERFILES Población
Materiales

PREFEREN
CIAS DE
ARTISTA

PREFERENCI LUGARES
AS POR
DISCIPLINA
VALORACI
ART.
ONES
Pregunta 2

CULTURA Y ARTE RURAL. Esquema recomendación

3) Valora estancia PERFILES Y


LUGARES Modelado
CONTEXTO
contextual

Usuario Explicación
1) Solicita recomendación Genera
recomendaciones
Evaluación
Ítem

2) Estancia Medida
estancia

Recomendación basada en perfiles


Pregunta 2

Se reutilizan los núcleos de


recomendación (y módulos de
contexto, evaluación, explicación),
pero se configuran y se diseñan en
el sistema general de manera
distinta.
Pregunta 3

- Data set para el Foco 2

- Tratamiento de datos erróneos,


sesgados, ausentes
Pregunta 3

¡¡¡DATA
SEEEEEEEEE
EEEEEET!!!
Pregunta 3

1)Data set inicial bruto.


2)Se limpia y normaliza y se realiza una
ingeniería de características para filtrar
qué variables son útiles y tienen
potencial carga predictiva y cuáles no.
3)Data set final limpio.
Definir data set inicial bruto
¿Qué nos
piden? Definir procedimientos de
limpieza
Pregunta 3

Data set 1: series temporales sin variables predictoras.

Municipio | Año | Población total

Índice Target

Desde 2003  16 años x 8.131 municipios = 130.096 registros


Pregunta 3

Data set 2: simulación en función de variables


socioeconómicas.
Target Variable cuantitativa: problema
Índice de regresión

Municipio | Año | Población total | Tasa_Menores_18 | Tasa_Entre_18-40 |


Tasa_Entre_40-65 | Tasa_Mayores_65 | Tasa_mujeres_hombres |
Tasa_emigración_nacional_provincial | Tasa_emigración_exterior_provincial |
Tasa_inmigración_nacional_provincial | Tasa_inmigración_exterior_provincial |
Tasa_industria | Tasa_construcción | Tasa_comercio | Tasa_servicios |
Unidades_ganaderas | Explotaciones_agrícolas | Superficie_agrícola | Tasa_viviendas |
Temperatura_media_anual | Dispersión_temperatura_anual |
Precipitaciones_media_anual | Dispersión_precipitaciones_anual |
Renta_disponible_media | Visitas_app_Turismo_Rural | Efecto_app_Cultura_Rural

Desde 2003  16 años x 8.131 municipios = 130.096 registros


Pregunta 3

Datos erróneos:
Pregunta 3
Pregunta 3

Datos erróneos: se establecerán los tipos de valores posibles


y los rangos. Se aplicará algún tipo de algoritmo de detección
de outliers (valores anómalos) para detectar potenciales
errores. Determinados casos tendrán corrección automática;
otros, tras supervisión humana.
Datos sesgados: Renta -> No son comparables los datos de
País Vasco, Navarra y el resto de España. Es necesario
llevarlos a un tipo de medida común. En el caso del País
Vasco sí se puede, porque tenemos el dato de población, por
lo que se puede desnormalizar. Si tenemos el número de
declarantes, se puede normalizar como el de la AEAT. Si no,
habría que desnormalizar el dato de la AEAT y llevarlo a la
referencia del País Vasco, ya que tenemos rangos de edad del
INE a nivel municipal.
Pregunta 3

Datos ausentes:
1. Se intentan inferir a partir de la información real. Si la
inferencia produjera una distorsión en los resultados, sería
preferible eliminar los registros asociados a dichos datos
ausentes.

2. Se debe diferenciar entre datos ausentes esporádicos o


sistemáticos.
a) Esporádicos: como no es posible controlarlos, una
opción es inferirlos de valores promedio de la variable, ya
sea para cualquier municipio o para el asociado al dato
ausente, para intentar minimizar los sesgos introducidos.
Pregunta 3
b) Sistemáticos. Anuales entre 2003 y 2018 (diezmado de datos de Población):
Indicadores Inferencia de datos ausentes
Se infieren para los municipios de menos de 1000 habitantes: si
Tasas de empresas: existen totales provinciales, se infieren mediante un reparto
industria, construcción, proporcional a la población; si no, la aproximación sería más
comercio y servicios gruesa, pero se podrían inferir aplicando los patrones de los
municipios de más de 1000 habitantes.
Están para todos los municipios, pero solo existen para 1999 y
2009. Se infieren mediante interpolación (entre ambos años) y
Relacionados con censo extrapolación (a partir de 2009) lineal. Cuando hubiera algún dato
agrario más se podría utilizar una interpolación polinomial mediante
regresión del conjunto de años o mantener la lineal entre año y
año con datos reales.
Relacionados con el censo
Análogo al censo agrario para más de dos datos reales.
demográfico
Promediar en función de la distancia de cada municipio a los datos
Datos meteorológicos
reales de las estaciones meteorológicas más próximas.
De la AEAT, se infieren para los municipios de menos de 1000
habitantes mediante un reparto proporcional a la población. Para
los años ausentes se interpolan polinomialmente para AEAT y País
Renta disponible
Vasco. Los datos de renta de Navarra se descartan hasta tener los
datos de metodología que permitan una inferencia análoga a la de
la AEAT.
Pregunta 4

- Realimentación usuario -> sistema.


- Respuesta del recomendador (Turismo
Rural).
- Posibles sesgos.
- Criterios éticos, sociales, transparencia.
Pregunta 4

¡Por fin una fácil!

¿O tiene truco?
Pregunta 4

a) Realimentación usuario -> sistema


1) REALIMENTACIÓN EXPLÍCITA
OPCIÓN 1 (cuantitativa): si el usuario ha visitado un lugar o realizado una
actividad, se habilita una casilla para dar una puntuación de preferencia en una
escala determinada (por ejemplo, de 1 a 5).
OPCIÓN 2 (cualitativa): si el usuario ha visitado un lugar o realizado una actividad,
se habilita una casilla para que marque si le ha gustado la visita (‘me gusta’ o ‘no
me gusta’).

2) REALIMENTACIÓN IMPLÍCITA
Se buscan patrones de comportamiento asociados a los “no me gusta” o a las
valoraciones bajas. Luego se utilizan esos patrones para inferir valoración
implícita de quienes no la han suministrado.
También se buscan indicadores en las redes sociales (si el usuario lo autoriza y
suministra su cuenta en el registro) que puedan indicar satisfacción o disgusto.
Pregunta 4

b) Respuesta recomendador (TR)


Recomendación general para un usuario: general en función de preferencias, perfiles o
estadísticas. Los resultados estarán filtrados si el usuario especifica alguna restricción al
solicitar la recomendación. Lista de lugares/actividades ordenadas por utilidad de la
recomendación. De cada lugar o actividad se indicaría:

1. Imagen representativa y nombre identificativo del lugar. Información de servicio


flotante al pasar el ratón por encima (provincia, población, etc).
2. Utilidad de la recomendación (la lista estará ordenada según este parámetro, de
mayor a menor).
Opción 1: se presentará la utilidad como la predicción del gusto en la escala de
entrada (por ejemplo, de 1 a 5).
Opción 2: se presentará la utilidad como una medida de la probabilidad de gusto
(por ejemplo, en porcentaje).
3. Explicación. Para garantizar la transparencia y aumentar la confianza del usuario, se
especificará la razón de la recomendación. Por ejemplo, qué parámetros han influido
más en la obtención de esa utilidad, o a partir de la similitud con qué usuarios
(anonimizados para garantizar la privacidad) se ha generado la recomendación.
4. Sostenibilidad medioambiental de la visita. Parámetro que el sistema genera a la
vez que la explicación en función de datos asociados al lugar y al contexto.
Pregunta 4

b) Respuesta recomendador (TR)


Recomendaciones similares a una dada:

Análoga a la anterior, cambiando en la explicación las referencias de similitud con el


perfil de usuario por referencias a la similitud con el lugar asociado a la recomendación
origen cuando proceda. O ambas cosas si se trata de una recomendación híbrida
(filtrado colaborativo + filtrado basado en contenido).
Pregunta 4

c) Sesgos posibles
1. Subjetividad de las valoraciones. Hay personas que tienden a valorar, en
general, más alto o más bajo que otras. Para evitar el sesgo que introduce
esta subjetividad, se propone no trabajar con los valores absolutos de las
valoraciones (opción 1), sino con una medida de variación de la
puntuación de un usuario respecto a su propia media de valoraciones. La
opción 2, al ser binaria, minimiza este posible sesgo.

2. Popularidad de ítems. Los lugares más visitados tenderían a


recomendarse más al ser más conocidos y tener más valoraciones. Para
compensar esto, en la parte contextual se podrían introducir variables de
sostenibilidad ambiental, económica o de concurrencia que introdujeran
penalizaciones en el modelo. Esto mejoraría la ética y sostenibilidad de las
recomendaciones. Sería imprescindible, por transparencia, incluir esto en
la información asociada a cada recomendación de la interfaz de salida.
Pregunta 5

- Indicadores del sistema.

- Métricas y forma de evaluar el


modelo.
Pregunta 5

a) Indicadores del sistema.


Efectividad de la recomendación: tasa que tendría un
valor máximo si el usuario visita el lugar de su primera
recomendación y descendiera progresivamente hasta el
mínimo (en el caso de que visitara un caso no presente en
la lista de las N primeras recomendaciones).

Otros indicadores genéricos: grado de utilización de los


ciudadanos y crecimiento de su uso (foco 1), satisfacción
de usuarios (funcionarios y altos cargos) (foco 2).

Tasa de efectividad de foco 1: medida a través de la


aplicación del foco 2. Sería de implantación a medio/largo
plazo.
Pregunta 5

b) Métricas y forma de evaluar


modelo.
Si no existieran datos de inicio para validar los modelos, se
generarían mediante simulaciones que cumplieran ciertos
criterios. Conforme el sistema incorporara datos reales
suficientes, desde el backend se debería poder comprobar el
valor de las métricas, las cuales, a su vez, tendrían impacto
en la configuración de parámetros internos del modelo.
Pregunta 5

b) Métricas y forma de evaluar


modelo.
OPCIÓN 1: realimentación con puntuaciones de 1 a 5 de los
lugares/actividades.
Cross-validation con n-folds: del data set completo, se oculta al sistema
la variable target de un porcentaje de los registros (por ejemplo, un 25%). Se
realiza una predicción de esas puntuaciones (paso previo a generar la lista
de recomendación) y se compara con el valor real, obteniéndose un error.
Como ambos datos son cuantitativos, se podrían utilizar como métricas el
MAE (error medio absoluto) o el RMSE (error cuadrático medio).
Esto se repite n veces (folds) aleatoriamente (o según procedimiento
establecido con distintas combinaciones) ocultando puntuaciones diferentes
para asegurar los resultados. Finalmente, se promedian los errores y se
estudia su convergencia.
Pregunta 5

b) Métricas y forma de evaluar


modelo.
OPCIÓN 2: realimentación con “me gusta” o “no me gusta”
El método de cross-validation sería análogo al anterior. Cambiarían las
métricas, porque aquí tenemos que comprobar el acierto en la asignación de
la clase adecuada (“me gusta” o “no me gusta”). Así que se proponen como
métricas de validación la Accuracy, Precision y Recall. Como solo hay dos
clases, es suficiente, si no incluiríamos una Matriz de confusión.

Aciertos "me gusta"


𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 =
Aciertos "me gusta" + Fallos "me gusta"
𝐴𝑐𝑖𝑒𝑟𝑡𝑜𝑠
𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 =
𝑇𝑜𝑡𝑎𝑙
Aciertos "me gusta"
𝑅𝑒𝑐𝑎𝑙𝑙 =
Aciertos "me gusta" + Fallos "no me gusta"
Pregunta 6

- Entorno tecnológico: desarrollo y


despliegue de los modelos.

- Ingesta de datos: inicialización y


actualización automática.
Pregunta 6

Se propone que el modelo se realice con tecnologías de Inteligencia


Artificial y Big Data. Se desarrollarán modelos predictivos y de machine
learning.
Pregunta 6
Para desarrollar podremos usar:
Pregunta 6

¿Con cuál nos quedamos?

- Código abierto

- Actualización

- Comunidad

- Especialización en machine learning


Pregunta 6

Lenguaje de propósito general

Creación de sistemas robustos en


producción fácilmente interoperable
con otros sistemas.
Pregunta 6
Herramientas de visualización de control de mandos

Tableau
Kibana

Power BI
Pregunta 6

Despliegue en el CPD del Ministerio o en la nube:

En este caso, habrá que tener previsto el almacenamiento y


procesamiento que se tiene que realizar para poder llevar a cabo
el sistema.

Será necesario tener acceso a las bases de datos


correspondientes del Ministerio y poder acceder a los datos de
Turespaña y del Ministerio de Cultura y Deporte.

Del mismo modo, tiene que ser posible poder actualizar los
datos de los portales abiertos que se van a utilizar en el modelo:
AEMET, AEAT, INE, etc.

Habrá que publicar un portal web al que los usuarios puedan


acceder y en el que se almacenen las claves de los usuarios
registrados, así como enlazar con cl@ve y autentic@.
Pregunta 6

¿Dónde desplegarías y por qué?

Los dos tienen ventajas:

CPD: Control de los datos.


Sistemas propios.
Forma tradicional.

Nube: Escalable, no es necesario conocer de


antemano todos los recursos que se van
a utilizar.
Contiene todo lo necesario para crear un
sistema de inteligencia artificial.
Innovador.
Pregunta 6

Y desventajas

CPD: ¿Cómo se dimensiona inicialmente?


Hay que crear todo el sistema de cero.

Nube: ¿dónde están nuestros datos?


Cumplimiento de seguridad.
Contratación.
¿podemos quedarnos cautivos en la
nube?
Pregunta 6

Plataformas en la nube:

Nube
SARA

¿Se te ocurre por qué elegirías una de ellas?

Puede que en examen no conozcas el nombre de


cada uno de los productos: siempre puedes escribir
en genérico “almacenamiento de AWS” y luego
buscarlo  S3.
Pregunta 6

Ingesta:

- Los problemas que podemos encontrar aquí:

- ¿Atacamos directamente a una base de


datos en producción?

- Seguridad: ¿puede haber alguna entrada no


deseada que ponga en riesgo los datos del
Ministerio?

- ¿Cómo conectamos las bases de datos que


utiliza nuestra sistema?
Pregunta 6

Ingesta:

Para no atacar directamente a una base de datos


en producción  Replicar la base de datos en un
nuevo servidor, o sólo los datos que vayan a ser
necesarios.

Utilizar Edge Computing: procesar en local los


datos y luego subirlos a la plataforma en la nube.
Mejora tiempos de respuesta y ancho de banda.
Además, no consume procesamiento en la nube.
Pregunta 6
Pregunta 6

Seguridad  Crear una vpn, accesos limitados,


autenticación.

Conexión con otros sistemas  Pedir la


información y volcarla en el nuevo servidor, crear
enlaces seguros.

Comprobación periódica de cambios en la base de


datos  Reglas de comprobación.
Pregunta 6

Comprobación periódica de cambios en los


datos abiertos  script de avisos

a) Cambios en las fuentes de datos.

b) Cambios en el formato de los datos o


rangos.

c) Datos erróneos que no cumplan con


Recordar el problema
de la calidad de los las reglas establecidas.
datos  Es como una
receta de cocina.
Pregunta 7
- Perfiles.
- Responsabilidades y compromisos de
los organismos involucrados.
- Contratación en la nube: valor y
duración.
- Líneas de la estrategia de
comunicación.
Pregunta 7

a. Determine el tipo y cantidad de perfiles que


necesitaría para desarrollar el proyecto.

Es un proyecto basado en datos… hay que


introducir algún perfil que permita desarrollar
el proyecto de la forma más confiable.

Puede que alguien de nuestro grupo de trabajo


conozca cómo se desarrolla en la nube y la
arquitectura necesaria, pero si no es así, para
poder garantizar la seguridad y continuidad del
sistema, debería haber un especialista.
Pregunta 7

Además, hay partes del proyecto que


necesitan de perfiles de programación y
desarrolladores web.

Es necesario tener un jefe de proyecto


que haga la función de enlace con el
equipo que va a desarrollar el proyecto.
Pregunta 7

Científico de datos Arquitecto de soluciones

Ingeniero de datos

Jefe de proyecto

Analista de
datos

Diseñador web y
Programador (x3) Data Artist
Pregunta 7

http://dataanalysis.blogs.uoc.edu/2019/01/24/salario-de-un-data-scientist-en-espana-o-no/
Pregunta 7

b. ¿Cómo articularía, dentro de la legislación vigente, las


responsabilidades y compromisos de los distintos
organismos involucrados?

Según la ley 40/2015:

Artículo 47. Definición de Convenio.

Son convenios los acuerdos con efectos jurídicos adoptados


por las Administraciones Públicas, los organismos públicos y
entidades de derecho público vinculados o dependientes o
las Universidades públicas entre sí o con sujetos de derecho
privado para un fin común.
Pregunta 7

Tipos de convenios:

Convenios interadministrativos (CON MUNICIPIOS).

Convenios intradministrativos (ENTRE AGE).

Convenios firmados con un sujeto de derecho


privado.

Convenios firmados con organismos, órganos o


entes de un sujeto de derecho internacional.
Pregunta 7

Artículo 140. Principios de las relaciones interadministrativas.

Colaboración.
Cooperación.

Artículo 142. Técnicas de colaboración.

Suministro de información, datos, documentos o


medios probatorios.

La creación y mantenimiento de sistemas


integrados de información administrativa
con el fin de disponer de datos actualizados,
completos y permanentes.
Pregunta 7

Ley 9/2017. Artículo 31.


Las entidades pertenecientes al sector público podrán cooperar
entre sí […] previa celebración de los correspondientes convenios

[…] podrán acordar la realización conjunta de contrataciones


específicas

[…] contratación se desarrolle en su totalidad de forma conjunta


[…] tendrán la responsabilidad conjunta

Cuando […] no se desarrolle en su totalidad en nombre y por cuenta


de las entidades interesadas, estas solo tendrán la responsabilidad
conjunta por aquellas partes que se hayan llevado a cabo
conjuntamente

Cada entidad será única responsable del cumplimiento de


sus obligaciones
Pregunta 7

c. En el caso de que decida desplegar el proyecto en la nube,


determine el procedimiento de contratación, teniendo en
cuenta un valor estimado aproximado y especificando la
duración.

1- Pensar qué servicios se van a necesitar: almacenamiento,


procesamiento, desarrollo, visualización, seguridad, etc.
(si se conocen los nombres de los servicios ya…).

2- El proyecto en la nube supone que tendrá que tener


continuidad  no es comprar una máquina, hacer el desarrollo
y ya. Es un gasto continuo.
¿Podría pagarse como la luz o el agua, un gasto corriente?
¿y si no?
Pregunta 7
AWS - estimación de servicios que vamos a usar
Función – nombre del servicio
ALMACENAMIENTO - S3
TRANSFERENCIAS EN TIEMPO REAL - KINESIS
PROCESAMIENTO – EC2
CONSTRUCCIÓN DE APLICACIÓN - Lambda
Codebuild
Codepipeline
CodeDeply
MONITORIZACIÓN – Cloudwatch
Cloudtrail
VISUALIZACIÓN – ElasticSearch
Kibana
CONFIGURACIÓN, SEGURIDAD - VPC; IAM;
AUTENTICACIÓN (externa)- Cognito
ENVÍO DE MENSAJES - SNS
Pregunta 7

Consulta de precios https://aws.amazon.com/es/pricing/


Servicio Estimación Precio Total
anual
S3 500 Gb/mes 0,023/GB/mes 138 €
Gastos asociados (put, select, transferencia, etc) 5.000€

KINESIS 100 Gb /mes 0,031 /GB/mes 37,2


EC2 (reserva instancia) 235 €/anual 235
Lambda 4.000.000 solicitudes resto 320€
*Hay gratuitas 0,00001667/mes
Codebuild Instancia – 20.000 minutos 0,005/min/mes 1200€
Codepipeline 20 canalizaciones 1 /canalización/mes 480€
CodeDeploy *gratis
Pregunta 7

Consulta de precios https://aws.amazon.com/es/pricing/

Servicio Estimación Precio Total


anual
Cloudwatch 1 millón de eventos 1 €/millón/mes 1
60 GB transferencia de datos 0,09€/GB/mes 64,8

Cloudtrail 3 millones invocaciones lambda 0,1 €/millón/mes 3,6


ElasticSearch Instancia – reserva 1896€ 1896€
Almacenamiento – 700 GB 0,149€ / GB/mes 1341
Kibana
VPC; IAM; *gratuito
Cognito *gratuito
SNS *gratuito

Total: 10.716,6 €
Pregunta 7

Hay que añadir precio por:

- La configuración de reglas de seguridad ( 5.000 € aprox.).

- Servicios que están asociados a otros servicios y consumen


(1.000 €).

En total, con esta configuración nos saldría por unos 16.716,6€


anuales.

(* No hemos utilizado bases de datos (RDS), contenedores,


etc.) -> ESTO OS LO DEJAMOS PARA CUANDO HAGÁIS EL
PLIEGO…
Pregunta 7

¿Por cuánto tiempo queremos contratar?

1. Suponemos que el sistema va a funcionar


fenomenal, vamos a lo grande, queremos
continuidad:
contratamos por 4 años (2+2)

2. Queremos ser algo más conservadores:


contratamos por 2 años (1+1)

Será un abierto por 16.716,6 euros anuales


(X 4 años)  66.866,4 euros
Pregunta 7

d. Enumere las tres líneas principales de la


estrategia de comunicación que diseñaría para el
proyecto RURALIZA
- Analizar el público objetivo, cuáles son sus intereses y cuál
es la mejor manera en la que hacerles llegar que existe un
nuevo sistema para turismo rural y colectivos de artistas.

- Identificar los canales de comunicación más apropiados:


campañas publicitarias en zonas de artistas, municipios,
anuncios televisivos.

- Analizar el impacto de la primera campaña de comunicación


y depurar el mensaje si no hubiese tenido el éxito esperado,
o bien ampliar el rango de público objetivo.
Pregunta 8

Preguntas adicionales
Pregunta 8

a. Indique cómo podría afectar el hecho de que la variable


“precipitaciones” presentara el histograma de la Figura 1 y si
tomaría alguna medida en su preprocesamiento.

Existe un desbalanceo en los datos.

Hay que comprobar que no sea la variable que queremos


predecir  Si lo es, el desbalanceo es importante, en caso
contrario, no tiene tanta importancia.

Dependiendo del algoritmo utilizado, este puede ser más o


menos robusto a los desbalanceos estadísticos. De todos
modos, en general los mejores resultados son con variables
normales. Por ejemplo, aplicar una función logaritmo sobre
los datos nos daría información sobre si la distribución sigue
un patrón de normalidad.
Pregunta 8

b. ¿Podría tener la plataforma del foco 2 alguna influencia


directa sobre los ciudadanos? ¿Qué medidas tomaría para
ello?

Ejemplo de respuesta cuando no sé qué quieren que conteste


pero estoy inspirado…

- Al permitir conocer la influencia del turismo rural y la


dinamización de la economía a través de actividades que los
visitantes realizan, los responsables de tomar decisiones
podrían decidir cómo y en dónde invertir dinero para poder
dinamizar las zonas rurales de la España Vacía.
Pregunta 8

- Además, en el caso de las colonias de artistas, sería un


impacto directo en la población y la economía de la zona.

- Sería interesante crear una comisión de seguimiento,


para ver cómo van cambiando las características
socioeconómicas, impulsando aquéllas que son más
relevantes y enviando mensajes para que creciesen las
inversiones y las empresas en las zonas rurales.
Pregunta 8

Lo que querían…

Publicación de datos en portales de datos


abiertos.
Estrategia de Digitalización del sector agroalimentario y
forestal y del medio rural  Objetivo 2

¿Son las dos válidas?


Pregunta 8

c. En el ámbito a (Turismo Rural) del foco 1, ¿podría haber un


sesgo de popularidad que condicionara el resultado? En ese
caso, ¿cómo lo combatiría?

¡Que nos han ido a pillar!

Que ya la hemos respondido antes…

Este tribunal….
Pregunta 8

d. Proponga nuevos ámbitos sectoriales que pudieran


añadirse al foco 1 del proyecto RURALIZA.

VUESTRO TURNO

También podría gustarte