Documentos de Académico
Documentos de Profesional
Documentos de Cultura
https://methodsblog.wordpress.com/2016/03/17/citizen-science/
Publicado en 17 de marzo de 2016 de Chris Grieves
A medida que lee esto, miles de voluntarios de todas las edades y antecedentes estn
recolectando informacin para ms de 1.100 proyectos cientficos en todo el mundo. Estos
proyectos abarcan una amplia gama de temas: desde voluntarios que recolectan muestras de
los microbios en sus tractos digestivos , hasta turistas que proporcionan imgenes de especies
amenazadas ( como los tigres ) que a menudo son costosas de estudiar.
La popularidad de las iniciativas de ciencia ciudadana ha aumentado exponencialmente en la
ltima dcada , y la riqueza de conocimiento que se aporta es abrumadora. Por ejemplo, casi
300.000 participantes han enviado alrededor de 300 millones de observaciones de aves de 252
pases en todo el mundo al programa eBird desde 2002. Sorprendentemente, las tasas
de envos han superado los 9,5 millones de observaciones en un solo mes!
El esfuerzo combinado de millones de cientficos ciudadanos genera una cantidad
impresionante de informacin valiosa, pero lo ms importante es que la informacin se est
recopilando a travs de escalas espaciales y temporales previamente inimaginables para los
programas de monitoreo biolgico. Por lo tanto, no debe sorprender que la participacin de los
cientficos ciudadanos en la investigacin ha demostrado ser muy valioso para estos estudios de
seguimiento. De hecho, ms del 70% de todos los artculos publicados que utilizan datos
cientficos de los ciudadanos se encuentran en campos relacionados con la biologa .
El uso y aplicacin de los datos cientficos de los ciudadanos slo ha comenzado a alcanzar su
mximo potencial. La combinacin de mltiples diseos de muestreo con diferencias en la
estructura del protocolo en muchos programas basados en voluntarios a menudo presentan
desafos analticos. Sin embargo, si los cientficos pueden incorporar y explicar estos factores,
muchos creen que los datos de la ciencia ciudadana pueden ser significativamente ms tiles
para informar a la investigacin a escala local y global .
Al mismo tiempo, la inclusin de protocolos de muestreo especficos y unificados (por ejemplo,
las encuestas de aves reproductoras en el Reino Unido y los Estados Unidos), junto con
objetivos claros, puede mejorar la calidad general de la informacin que se recopila. Estas
mejoras han demostrado ser fuertes indicadores del retorno de las inversiones en la recopilacin
y anlisis de datos cientficos ciudadanos que informan sobre la gestin y las polticas .
Recopilacin y anlisis de datos de la ciencia ciudadana
Para determinar la mejor manera de recopilar y analizar los datos cientficos de los ciudadanos,
primero debemos responder a dos preguntas:
1. Los datos de la ciencia ciudadana son diferentes de los datos recopilados por tcnicos y
cientficos capacitados?
2. Cules son las formas en que podemos reducir la incertidumbre en la informacin
biolgica que podemos obtener de los programas cientficos de los ciudadanos?
Debido a la amplia gama de proyectos de ciencia ciudadana, es imposible abordar
adecuadamente estas preguntas de una manera que sea aplicable a todas ellas. Decidimos
enfocarnos en un proyecto publicado en nuestro reciente trabajo - " Incertidumbre en el
monitoreo biolgico: un marco para la recoleccin y anlisis de datos para tener en cuenta
mltiples fuentes de sesgo de muestreo " - sobre cuestiones relacionadas con la calidad de los
datos donde el foco de inferencia es la probabilidad que ocurrir un evento (por ejemplo, la
probabilidad de encontrar una especie rara o detectar una enfermedad emergente).
La respuesta a la primera pregunta es: "no realmente". La evidencia reciente sugiere que no hay
mucha diferencia entre la informacin recopilada por los ciudadanos promedio y la recopilada
por tcnicos y cientficos. Por ejemplo, Danielsen et al . (2014)analizaron los datos recogidos
por los individuos entrenados y no entrenados sobre la situacin y las tendencias de un
impresionante 63 taxones de vertebrados en 34 sitios de bosques tropicales a travs de cuatro
pases y los resultados eran indistinguibles. Los miembros de la comunidad que recolectaban
los datos (tambin conocidos como cientficos ciudadanos) produjeron resultados similares a
los cientficos.
Para responder a la segunda pregunta, tenemos que examinar de cerca las dos fuentes
principales de sesgo de muestreo para cualquier programa de monitoreo biolgico, donde el
objetivo principal es recopilar la informacin necesaria para estimar la probabilidad de que
ocurra un evento:
1. La probabilidad de perder un evento que realmente ha ocurrido
2. La probabilidad de reportar inadvertidamente un evento que no ha ocurrido
Ilustramos estos principios utilizando un ejemplo hipottico, en el que queremos estimar la
probabilidad de que un ciervo individual tenga enfermedad crnica ( enfermedad ), dado que la
muestra que se tom de este individuo result positiva para la enfermedad
( prueba + ).
Esta ecuacin puede parecer abstracta e irrelevante para nuestra vida cotidiana, pero esta
estructura de probabilidad de la aparicin o ausencia de un evento (tambin conocido como
teorema de Bayes) es la base de todas nuestras inferencias en las ciencias mdicas y biolgicas!
Esta probabilidad es una combinacin de la probabilidad de dar positivo para la enfermedad,
dado que el individuo tiene la enfermedad (es decir, sensibilidad de la prueba mdica)
multiplicado por la prevalencia de la enfermedad en la poblacin, dividida por la suma de este
producto ( P ) con la probabilidad de probar positivo para la enfermedad cuando el individuo
no tiene la enfermedad (es decir, 1 - especificidad del examen mdico) multiplicado por la
prevalencia de individuos sanos en la poblacin. La correccin de ambas probabilidades, aun
cuando sea pequea, se ha demostrado que influye considerablemente en nuestras inferencias,
donde la prediccin de la ocurrencia de un evento raro podra estar sesgada hasta en un 70% en
algunos casos.
Corregir el sesgo: Falso-negativos
Las palomas de luto son una de las 16 especies focales para CUBS. CUBS
Ahora que sabemos que en algunos casos los datos recolectados por individuos entrenados y no
entrenados son similares - pero debemos corregir el sesgo en ambos tipos de datos - cmo
podemos aplicar esta estructura de probabilidad para reducir la incertidumbre en la inferencia
basada en informacin biolgica? En primer lugar, necesitamos visitas repetidas para estimar la
probabilidad de detectar un evento cuando ocurre, tambin conocido como sensibilidad en el
campo mdico, o la probabilidad de falsos negativos en las ciencias biolgicas. Este enfoque de
muestreo es la columna vertebral de numerosos avances estadsticos en lo que comnmente se
conoce como modelos de ocupacin .
Sorprendentemente, pocos programas cientficos ciudadanos han aplicado este tipo de diseo
de muestreo. El Programa de Monitoreo de Anfibios de Amrica del Norte (NAAMP) del
Servicio Geolgico de los Estados Unidos, donde los voluntarios inspeccionan rutas 3-4 veces
al ao para detectar la presencia y ausencia de especies de ranas en la primavera durante el
verano es uno de los pocos que lo hacen. Otro buen ejemplo es el Programa de Celebracin de
Aves Urbanas (CUBS) del Laboratorio Cornell de Ornitologa , donde grupos escolares y otros
voluntarios visitan un sitio tres veces en una semana, cualquier semana del ao y registran la
presencia y ausencia de 16 aves focales especies en espacios verdes en las ciudades.
Correccin de sesgo: Falso-Positivos
En este punto, podemos corregir las probabilidades falsas negativas usando un diseo de
muestreo de visitas repetidas. Sin embargo, para corregir las probabilidades falsas positivas
(por ejemplo, 1- especificidad), necesitamos recopilar informacin adicional. La naturaleza de
esa informacin depende del modelo estadstico que se utilizar para hacer inferencias, que se
clasifican en tres categoras generales :
La informacin recolectada en el campo que se valida o se puede asumir con seguridad
que es verdadera deteccin de un evento ( Site Confirmation Model)
Fuentes independientes de informacin sobre las probabilidades falsas-positivas y falsas
negativas ( Modelo de Calibracin)
Diferentes tipos de informacin recogida durante el muestreo que puede clasificarse
como ausencias verdaderas, presencias verdaderas, falsos positivos y una combinacin
de falsas ausencias y presencias ( Modelo de Confirmacin de Observaciones )
Qu enfoque es ms til para los datos de ciencias ciudadanas, cuando se realizan visitas
repetidas como parte de nuestro marco de muestreo? Pues bien, es probable que el costo y la
viabilidad de obtener datos en el campo que se puedan clasificar con exactitud como
"verdaderos" sean limitados para millones de observaciones, descartando los modelos
de Confirmacin de Sitio y Confirmacin de Observacin .
El modelo de calibracin: una forma prometedora de contabilizar la incertidumbre en el
monitoreo
Esto hace que el Modelo de Calibracin sea el enfoque ms prometedor y los pasos para
aplicar este modelo a los datos cientficos de los ciudadanos son el foco de nuestro reciente
artculo en Mtodos en Ecologa y Evolucin . Desarrollamos un modelo computacionalmente
eficiente y flexible que puede acomodar los datos de visitas repetidas para estimar las
probabilidades falsas negativas. Tambin incorpora un paso de datos de prueba independiente
para estimar las probabilidades de falsos positivos. Este modelo demostr ser muy preciso en
una gama de escenarios simulados, y puede acomodar grandes volmenes de observaciones de
campo y datos de prueba independientes.
Para evaluar la utilidad de nuestro enfoque, aplicamos nuestro modelo a los datos del programa
NAAMP y los datos de una prueba de campo realizada para estimar las probabilidades falsas
negativas de los voluntarios de NAAMP. Sin este enfoque para corregir ambas fuentes de
incertidumbre, los modelos existentes habran sobreestimado la ocurrencia de la rana de
Cricketdel Norte ( Acris crepitans ) en el noreste de Estados Unidos hasta en un 67%.
Esto es slo el comienzo sin embargo. Las plataformas en lnea necesitan ser desarrolladas para
reunir ms datos de prueba para informar las probabilidades falsas positivas. Nuestras
simulaciones nos mostraron que para especies raras que son difciles de detectar,
necesitaramos llevar a cabo por lo menos 15.000 ensayos independientes para cada especie
para poder hacer inferencias exactas usando datos de monitoreo recopilados por tcnicos y
cientficos capacitados, as como aquellos recopilados por cientficos ciudadanos.
Para ello, recomendamos que los programas cientficos de los ciudadanos aprovechen la
popularidad de las aplicaciones mviles para llevar a cabo estas pruebas. Por ejemplo,
la aplicacin de identificacin de pjaros Merlin podra tener un juego de prueba de su
habilidad , donde los observadores podran entrar y probar sus habilidades de identificacin
visual y auditiva de aves. Esto ayudara a los cientficos (incluyendo nuestro grupo en
el Laboratorio Cornell de Ornitologa ) para obtener la informacin que necesitan para hacer
inferencias mejores de las observaciones de aves recogidas por los cientficos ciudadanos!
Las tecnologas, como los drones, abren nuevas oportunidades para la vigilancia de la vida silvestre J. Lahoz-Monfort,
UMelb.
Funcin de probabilidad de perfil para el parmetro de probabilidad de deteccin p11 (en valores verdes en intervalo
creble).