Está en la página 1de 6

No olviden a las personas en el uso de grandes datos para

el desarrollo.
Información de satélites, celulares y otras fuentes no son una panacea
(remedio universal) para el desarrollo internacional de problemas, advierte
Joshua Blumenstock.

Hoy, el 95% de la población global tiene cobertura celular, y el número de personas que
tienen un celular está incrementando rápidamente (ver “Marcando”)1. Los celulares generan un
tesoro de información personal de billones de personas, incluyendo a aquellos que viven con
pocos dólares al día. Así que organizaciones de ayuda, investigadores y compañías privadas están
en la búsqueda de formas en las que esta “revolución de datos” pueda transformarse en
desarrollo internacional.
Algunos negocios están comenzando a hacer sus datos y herramientas disponibles a
aquellos que intentan solucionar problemas humanitarios. La empresa creadora de imágenes de la
Tierra Planet en San Francisco, California, por ejemplo, permite el libre acceso a sus fotografías
satelitales de alta resolución luego de un desastre natural, para que investigadores y
organizaciones de ayuda puedan coordinar esfuerzos de ayuda. Mientras tanto, organizaciones
como el Banco Mundial y las Naciones Unidas están reclutando a equipos de científicos de
información para que apliquen sus habilidades de estadísticas y aprendizaje automático para retos
en desarrollo internacional.
Pero en el apuro para encontrar soluciones tecnológicas para problemas globales
complejos, existe el peligro de que investigadores y otros sean distraídos por la tecnología y
pierdan el camino de las dificultades claves y restricciones únicas de cada contexto local. Diseñar
aplicaciones habilitadas para datos que funcionen en el mundo real requerirá de un lento
acercamiento que preste mucha más atención a la gente detrás de los números.

LA PROMESA.

En estos momentos, los datos de los teléfonos móviles tienen préstamos de consumo
transformados en muchos países en desarrollo2. Alrededor de 5 años atrás, investigadores
descubrieron que algunas personas, como aquellas que realizan llamadas internacionales de
manera frecuente o que tienen mayor cantidad de amigos de Facebook que otros en su misma
área son más propensas a pagar sus deudas34. Algoritmos de aprendizaje automático pueden
detectar estos patrones y arrojar puntajes de créditos para cientos de millones de personas
dueñas de un teléfono pero quienes de otras maneras serían excluidos de los servicios financieros
formales por carecer de garantía o acceso a un banco.
Otros estudios han señalado que con algunos retoques, los mismos algoritmos que Google,
Facebook y otras compañías usan para agrupar anuncios para gente en línea pueden ser usados
para coincidir recursos para personas que viven en pobreza56. Estos algoritmos identifican la
“firma digital” de pobreza en los datos personales de redes de telefonía móvil e imágenes
satelitales.
Por ejemplo, en la mayoría de los países africanos, la gente más rica tiende a realizar más llamadas
internacionales que la gente pobre, y que a cambio estos son más propensos a vivir bajo un techo
de paja que aquellas personas ricas, como muestran las imágenes de satélite. Estudios de hace
algún par de años muestran que pueden usarse enfoques relacionales para generar mapas de alta
resolución de rendimiento de campos de cultivo y malnutrición infantil78.
En principio, dichos mapas podrían permitir a que gobiernos y otros distribuyan ayuda humanitaria
de forma más enfocada y oportuna de lo que generalmente hacen ahora. Analistas estiman que
los ricos se benefician más que los pobres en un cuarto de todas las intervenciones dirigidas a la
reducción de la pobreza. En dos proyectos que comenzaron en Armenia en 1996, solo el 8% de
decenas de millones de dólares destinados a los más necesitados del país en realidad llegó a ellos9.
El análisis de las huellas digitales de las personas podría también mejorar la intervención
de la salud pública durante una epidemia o ayudar a las respuestas nacionales e internacionales de
crisis. Como ejemplo, investigadores han usado los datos de celulares para revelar que vecindarios
e individuales son más afectados por desastres naturales, hacia donde se traslada la gente y como
el traslado afecta a la propagación de enfermedades101112. Dentro de algunos años debería ser
posible de rastrear los efectos de un desastre natural en individuos minuto a minuto- similar a
como los inversores rastrean las fluctuaciones de sus carteras de acciones.

LAS TRAMPAS.

Existen por lo menos cuatro problemas con estas herramientas.

Efectos no anticipados, Las soluciones habilitadas por grandes datos con frecuencia fortalecen a
aquellos ya empoderados en vez de a personas vulnerables- principalmente porque el poder para
derivar valor de los datos tiende a estar concentrado en las manos de unos pocos.
Tomen el ejemplo del “crédito digital”. Los potenciales prestatarios son asesorados usando
puntajes de créditos basados en su historial de uso del teléfono y los préstamos son despachados
de forma instantánea a través del celular. Una industria en auge ha sido desarrollada desde que el
primer servicio de este tipo, M-Shwari fue lanzado en Kenia en 2012. Bancos, compañías
telefónicas y proveedores de servicios financieros de próxima generación hacen colectivamente
cientos de miles de préstamos al día solo en el África subsahariana. Hoy, más del 25% de la
población keniana ha sacado al menos un préstamo digital. (Ver go.nature.com/2jytdp2).
Hasta ahora, que yo sepa, ningún estudio publicado ha documentado si estos préstamos
ayudan a la gente o si- como muchos otros préstamos “día de pago” (aquí el texto se refiere una
forma de préstamo en la que el deudor se compromete a devolver el dinero en su próximo pago
de sueldo, tienden a ser préstamos de poca cantidad de dinero pero con alto riesgo porque el
interés es muy alto) de corto plazo y alto interés en los Estados Unidos- conducen a ciclos de
pobreza y trampas de deudas que impiden a las personas obtener más adelante préstamos de
bancos como el resultados de pagos faltantes. De hecho, una importante literatura sobre
microcrédito, que precede al crédito digital por varias décadas, indica que no todos se benefician
al ser capaces de pedir dinero prestado13.
Ciertamente, la mayoría de los clientes de créditos digitales son prestatarios por primera
vez y encuestas sugieren que muchos no entienden los términos de los préstamos que les son
ofrecidos. Como ejemplo, un estudio de 2015 en Ruanda encontró que solo el 51% de los
prestatarios estaban al tanto de la tasa de interés que les era cargado 14.
Los riesgos de malversación se extienden más allá de las compañías. De hecho, el potencial
de que las tecnologías sean usadas de manera en que los ciudadanos no necesariamente sean
beneficiados es mucho mayor en países en que las instituciones sociales son débiles y existan
regímenes semi-autoritarios. Por ejemplo, varios reportes desde China, sugieren que algunas
personas han sido bloqueadas para el uso de trenes y aviones debido a un bajo “puntaje de
crédito social”- incluyendo aquellos que, según se ha informado, han difundido información falsa
de terrorismo o cometido irregularidades financieras. (Ver go.nature.com/2wwcnwq).

Falta de validación.

Los métodos convencionales de recolección de datos de desarrollo internacional, que implican


encuestas y entrevistas cara a cara, son imperfectas. Pero han sido desarrolladas a lo largo de las
décadas y sus limitaciones han sido bien documentadas. En contraste, los defectos en los nuevos
enfoques no son bien entendidos. Existe un riesgo de que dichas herramientas sean desplegadas
antes de ser testeadas de forma adecuada.
Con datos digitales, se pueden producir mapas granulares de la distribución de la riqueza
en una nación, reduciendo a una fracción el costo de un censo de hogares convencional. Pero la
exactitud de dichos mapas ha sido testeada en solo un puñado de países. Y evidencia sugiere que
patrones encontrados en un lugar no siempre generalizan. La tendencia a realizar muchas
llamadas internacionales se correlaciona con la riqueza en Ruanda de manera más fuerte de lo que
lo hace en Afganistán, por ejemplo 15.
Más preocupante es la falta de evidencia de que dichos algoritmos se mantendrán
precisos con el tiempo. He estado trabajando con colegas en herramientas interactivas para
proveer visualizaciones en tiempo real de la pobreza y vulnerabilidad de la población. Haciendo
evaluaciones comparativas con múltiples rondas de datos de encuestas (incluyendo respuestas a
preguntas de status de ingresos, salud y empleo), hemos visto que la exactitud de nuestros mapas
cae rápidamente, a veces luego de algunos meses. ¿Por qué un modelo entrenado para predecir la
riqueza a partir de los datos telefónicos recolectados en invierno tiene un desempeño pobre en
verano? Porque la relación entre pobreza y uso del teléfono puede cambiar. Por ejemplo,
personas más enriquecidas pueden realizar más llamadas internacionales durante las temporadas
festivas, pero el patrón podría cambiar durante los meses de peregrinación, cuando muchas
personas se encuentran por lo general de viaje.
Finalmente, cuando las personas se dan cuenta del hecho de que sus datos personales
están siendo monitoreados para tomar decisiones- por ejemplo, quién recibirá ayuda humanitaria
o quién es elegible para un préstamo- son inevitablemente incentivados a jugar con el sistema.(se
refiere a hacer uso del sistema para lograr el beneficio propio). GiveDirectly, una organización sin
ánimos de lucro en África y Estados Unidos que permite la transferencia directa de dinero a
personas viviendo en pobreza alrededor del mundo, inicialmente hacía uso de imágenes satelitales
para identificar hogares con techos de paja. Sin embargo las personas se dieron cuenta de esto, al
punto de que pretendían vivir en una estructura de paja adyacente a sus hogares de techo
metálico para recibir la ayuda.

Algoritmos sesgados. (PARCIALES, QUE SE INCLINAN A UNA TENDENCIA)

Cuando las herramientas son entrenadas en datos sesgados o parcheados, aquellos que son
pobremente representados son frecuentemente marginados. Esto puede ser problemático
especialmente para personas en economías emergentes: globalmente, las personas con menos
ventajas tienden a ser las menos representadas en nuevas fuentes de datos digitales.
La representación puede variar considerablemente incluso dentro de tales países. Los
datos de aplicaciones de navegación como Google Maps o Waze, por ejemplo, son utilizados cada
vez más para entender la movilidad urbana 16. Pero dichas aplicaciones requieren por lo general de
un Smartphone, por lo tanto cualquier decisión política tomada sobre esta base podría beneficiar
principalmente a los segmentos más ricos de la sociedad.
Un teléfono móvil requiere de conectividad y energía eléctrica. Interactuar con redes
sociales requiere de un poco de alfabetización. Y muchas plataformas de crédito digital requieren
de un Smartphone y una cuenta de Facebook. Estos prerrequisitos excluyen vastos segmentos de
la población en países en desarrollo.

Falta de regulación.

Los datos de desarrollo convencional generalmente son recolectados y difundidos por agencias
gubernamentales y organizaciones de ayuda. Los datos que respaldan las aplicaciones de
inteligencia artificial generalmente son propiedad de empresas privadas y son controlados por
estas, quienes tienen poco incentivo a hacer otra cosa excepto maximizar las ganancias.
En la mayoría de los países ricos la legislación está destinada a limitar el abuso de poder
del gobierno y las compañías. La Suprema Corte de Estados Unidos recientemente dictaminó que
las agencias policiales no pueden acceder a los datos telefónicos sin una orden judicial. El
Reglamento General de Protección de Datos en Europa es aún más restrictivo. En muchas naciones
en desarrollo existen pocos controles y balances de este tipo, además las regulaciones que existen
son raramente aplicadas17.
Actualmente, problemas de privacidad de datos, transparencia algorítmica, la equidad y
responsabilidad están fuera del radar de la mayoría de las compañías que operan en países en
desarrollo.

CAMINOS HACIA ADELANTE.

Pueden tomarse varios pasos para abordar estas preocupaciones.

Validar. Nuevas fuentes de datos deben complementar, no remplazar a las antiguas. Los conjuntos
de datos convencionales son esenciales para calibrar y validar aplicaciones de grandes datos. Y
cuando se utilicen herramientas como mapas de pobreza, deben ser comparados con los métodos
existentes.
Un ejemplo de este doble enfoque es el trabajo en curso para evaluar el Programa
Mundial de Alimentos en Haití. La organización está al tanto del potencial para ahorrar costos
mediante el uso de datos telefónicos. Así, en colaboración con investigadores, se está ejecutando
una comparación, recolectando datos de teléfono y encuestas de lado a lado.

Personalizar. En la mayoría de los casos, la tecnología principal que está siendo utilizada es la que
se ha diseñado para un propósito del primer mundo- ya sea, etiquetando los nombre de amigos
automáticamente en fotografías de Facebook. Encontrando que un algoritmo puede ser adoptado
para un uso diferente, como identificar focos de pobreza en fotos de satélite, es una visión crucial-
pero se necesita de una mayor personalización antes de que pueda ser útil para formuladores de
políticas en el terreno.
En el caso de crédito digital, por ejemplo, un algoritmo de aprendizaje puede ser muy
preciso para predecir el pago del préstamo, pero la decisión del préstamo también debe tener en
cuenta el contexto local. Con esto en mente, mis colegas y yo estamos colaborando con Branch,
una compañía de California que provee micro-préstamos a millones en África para investigar
algoritmos que midan el riesgo de incumplimiento del prestatario frente al impacto probable de
un préstamo. La idea es incorporar desde un comienzo, una forma de investigar si los préstamos
son realmente beneficiales y para enlazar a cada prestatario a un “puntaje de impacto” además de
un “puntaje de crédito”. Las perspectivas que surgen de la comunidad de investigadores centrados
en hacer que los algoritmos de aprendizaje automático sean más justos, responsables y
transparentes (FAT (abreviación en inglés de los tres términos)) deberían ayudar.

Profundizar la colaboración. Mucha de la innovación proviene del sector privado- específicamente


de ingenieros de Silicon Valley en California. Muchas compañías, incluyendo a pioneras en crédito
digital, están motivadas por el deseo de hacer el bien y la promesa de grandes ganancias. Pero los
desafíos de desarrollo no pueden abordarse como proyectos paralelos de “20% de tiempo”. Y las
soluciones de próxima generación deben ser diseñadas y producidas por personas que entienden
los problemas y el contexto- no solo por esos que entienden los algoritmos.
Una forma de lograr esto es fomentar la colaboración entre científicos de datos, expertos
en desarrollo, gobiernos, sociedad civil y el sector privado- y específicamente con las personas y
organizaciones del país en cuestión. Un paso en la dirección correcta es DataKind, una red global
que intenta vincular a los científicos de datos a organizaciones de cambio social, muchas de las
cuales enfocadas en problemas de economías emergentes. Al igual que los desafíos de Datos para
el Desarrollo: en 2012 y 2014, la compañía telefónica Orange con base en París, puso a disposición
de investigadores de todo el mundo grandes cantidades de datos, los que permitieron un trabajo
temprano en el mapeo de pobreza y planificación urbana. Mientras tanto, las becas, concursos,
pasantías y tal vez algún tipo de año en el extranjero ofrecido a los ingenieros de Silicon Valley
podrían mejorar la comprensión de los desafíos que las personas enfrentan en distintos países.
Mejor aún son los esfuerzos para aumentar la capacidad técnica a nivel local. Google y
Facebook están financiando un Máster africano de Inteligencia Mecánica: un programa intensivo
de un año que será lanzado este mes (Ver go.nature.com/2mcxjpc). También son alentadores el
campamento de entrenamiento intensivo de tres semanas en verano que ahora ofrece la
Universidad de Ciudad del Cabo en Sudáfrica y Data Science en África, una conferencia concebida
por investigadores africanos. Del mismo modo iHub, un espacio de trabajo creativo en Nairobi, ha
ayudado a incubar cientos de nuevas empresas kenianas. Pero estas son las excepciones, no la
norma. Se necesitan muchos más de esos esfuerzos.

UNA CIENCIA DE DATOS MÁS HUMILDE.

Estoy entre aquellos convencidos de que los grandes datos podrían transformar el desarrollo
internacional. Pero muchas de las supuestas balas de plata han perdido su marca en las últimas
décadas. Piensen en la iniciativa de una laptop por niño. Aclamada como un salvador del mundo,
la tecnología fracasó porque los desarrolladores no entendieron el entorno social y cultural en el
que se implementó18.
Mike Driscoll, jefe ejecutivo de la plataforma Metamarket ha descrito a la ciencia de datos
como “una combinación de piratería impulsada por Red-Bull y estadísticas inspiradas por el
espresso”. En mi opinión, el uso exitoso de grandes datos en desarrollo requiere de una versión de
la ciencia de datos que es considerablemente más humilde que aquella que ha capturado la
imaginación popular. ■

Joshua Blumenstock es el director del Laboratorio de Desarrollo de Datos Intensivos y profesor asistente en la Escuela de
Información, Universidad de California, Berkeley, Estados Unidos.

1
GSM Association. Unlocking Rural Coverage (GSMA, 2017).
2
Francis, E., Blumenstock, J. & Robinson, J. BREAD Working Paper No. 516 (2017).
3
San Pedro, J., Proserpio, D. & Oliver, N. in User Modeling, Adaptation and Personalization (eds Ricci, F. et al.) 195–207
(Springer, 2015).
4
Björkegren, D. & Grissen, D. Behavior Revealed in Mobile Phone Usage Predicts Loan Repayment (SSRN, 2015).
5
Blumenstock, J., Cadamuro, G. & On, R. Science 350, 1073–1076 (2015).
6
Jean, N. et al. Science 353, 790–794 (2016).
7
Burke, M. & Lobell, D. B. Proc. Natl Acad. Sci. USA 114, 2189–2194 (2017).
8
Osgood-Zimmerman, A. et al. Nature 555, 41–47 (2018).
9
Coady, D., Grosh, M. & Hoddinott, J. World Bank Res. Obser. 19, 61–85 (2004).
10
Lu, X., Bengtsson, L. & Holme, P. Proc. Natl Acad. Sci. USA 109, 11576–11581 (2012).
11
Blumenstock, J. E., Eagle, N. & Fafchamps, M. J. Dev. Econ. 120, 157–181 (2016).
12
. Wesolowski, A. et al. Proc. Natl Acad. Sci. USA 112, 11887–11892 (2015).
13
Banerjee, A., Karlan, D. & Zinman, J. Am. Econ. J. Appl. Econ. 7, 1–21 (2015).
14
CGAP and InterMedia. Financial Inclusion Insights: National Survey Report Rwanda (CGAP/InterMedia, 2015).
15
Blumenstock, J. E. AEA Pap. Proc. 108, 72–76 (2018).
16
Hanna, R., Kreindler, G. & Olken, B. A. Science 357, 89–93 (2017).
17
Taylor, L. Environ. Plan. D 34, 319–336 (2016).
18
Kraemer, K. L., Dedrick, J. & Sharma, P. Commun. ACM 52, 66–73 (2009).

(Puse las referencias como marcas en el texto para saber a qué párrafo equivalen)

También podría gustarte