Está en la página 1de 9

Gestión de datos (cuestiones básicas sobre investigación

responsable)
Autores

 Reid Cushman, PhD


Programa CITI

 Deborah L. Barnard, MS
Children's Hospital of Philadelphia

Introducción

En su forma de libro de texto clásico, el método científico se basa en un


experimento impulsado por una hipótesis. Se recolectan los datos y luego se
analizan e interpretan. Los resultados se comunican a terceros, quienes evalúan
los métodos, los datos y las conclusiones. Se utiliza una cantidad suficiente de
hipótesis confirmadas para justificar una teoría. Y así sucesivamente.

En el mundo real, esto casi nunca es tan perfecto y lineal. Asimismo, las
oportunidades de llevar a cabo verdaderos experimentos controlados —con una
sola intervención evaluada en un grupo experimental aleatorizado y comparado
con un grupo de control aleatorizado— generalmente son limitadas. Se utilizan
muchos otros diseños cuasiexperimentales, tales como estudios con cohortes y
control de casos, estudios transversales y análisis de casos individuales. Los
requisitos clave, cualquiera sea el diseño, son que el estudio se describa de forma
adecuada para que otros puedan evaluarlo y replicarlo, y que el diseño, en
principio, permita probar la hipótesis en cuestión. Los estudios se basan en un
conjunto de datos subestándar que probablemente son, en el mejor de los casos,
inútiles y un desperdicio de recursos. En el peor de los casos, pueden provocar
contratiempos e incluso un daño directo si se toman acciones en función de
información falsa.

La Academia Nacional de Ciencias (2009) ha destacado que "los investigadores


noveles generalmente reciben poco o nada de capacitación formal sobre cómo
registrar, analizar, almacenar o compartir datos". Si bien este módulo ofrece una
descripción general de estas cuestiones, no sustituye una capacitación más formal
sobre cada uno de estos aspectos de la gestión de datos. Comprender los
requisitos para una gestión adecuada de los datos es fundamental para nuestra
eficacia como investigador.

Objetivos de aprendizaje

Al finalizar este módulo, usted podrá:

 Describir las cuestiones principales acerca de la gestión de datos que


surgen durante el proceso de investigación.
 Analizar las cuestiones metodológicas, tecnológicas y normativas/legales
que influyen sobre las decisiones de gestión de datos.
 Describir las cuestiones éticas relacionadas con el diseño y el informe de
los datos de la investigación.
 Analizar las cuestiones éticas inherentes a la titularidad de los datos, la
divulgación de datos y la gestión de datos.

La naturaleza de los datos

Los datos representan información obtenida al cumplir con un estudio


cuidadosamente definido. No toda la información obtenida en un entorno de
investigación se considera dato desde un punto de vista técnico.

En la mayoría de los tipos de investigación, el punto de inicio es la


operacionalización de conceptos. En otras palabras, implica articular conceptos de
forma tal que sean susceptibles de ser medidos, con los objetivos de lograr tanto
confiabilidad como validez. Laconfiabilidad generalmente se define en términos
de replicación, es decir, si uno obtiene el mismo resultado en mediciones repetidas
del mismo fenómeno. En otras palabras, se refiere a la coherencia de los
resultados.

En este contexto, la validez se refiere a la noción más compleja de si los


conceptos operacionalizados —es decir, las definiciones, los dispositivos y los
métodos de medición— en verdad miden lo que se supone que deben medir.

Lograr confiabilidad y validez puede ser relativamente sencillo o difícil al extremo


en función del contexto. Se encuentra entre los pasos más difíciles del diseño de
un estudio. Los diferentes campos cuentan con diferentes estándares para los
atributos que constituyen medidas de calidad suficiente. Por lo tanto, los
investigadores deben aprender los estándares específicos de la disciplina
dentro de su campo de investigación.

Categorización de los problemas de datos

Los problemas de datos pueden categorizarse de muchas formas. En este módulo,


se dividen en tres tipos principales.

Los problemas metodológicos son aquellos vinculados con verificar que un


estudio de investigación esté bien diseñado con respecto al análisis estadístico.
Esto incluye las elecciones acerca de la población y la elección de la muestra, la
asignación de grupos, la recolección de datos y el análisis de los datos. Los pasos
empleados para disminuir el "error" (factores aleatorios que opacan una relación) y
eliminar el "sesgo" (factores no aleatorios que sesgan un resultado y pueden
producir conclusiones falsas) también representan problemas metodológicos
cruciales.

Los problemas tecnológicos se refieren al uso de las herramientas y los procesos


disponibles para gestionar la información durante todo el proyecto de investigación.
Esto algunas veces se conoce como gestión de la vida útil de los datos (DLM). Los
objetivos principales de la DLM son garantizar la confidencialidad, integridad y
disponibilidad de los datos, que de forma colectiva algunas veces se menciona
como "CIA" por sus siglas en inglés, durante el tiempo que existan datos.
Los problemas éticos, normativos/legales, profesionales y de política
organizacional se refieren a lo que se requiere, recomienda, desaconseja o
prohíbe en las organizaciones que supervisan las actividades de investigación.

Cada uno de estos se analiza en el contexto del ciclo típico del diseño del estudio,
adquisición de datos, análisis, generación de informes y mantenimiento posterior al
estudio.

Diseño del estudio

El diseño del estudio implica la planificación de todos los pasos en el ciclo de


investigación. La planificación detallada es interés del investigador, pero también
surge del cumplimiento de requisitos normativos/legales y organizacionales. Por
ejemplo, en los EE. UU., los estudios que incluyen sujetos humanos pueden
requerir una revisión de parte del Comité de Revisión Institucional (IRB) y los que
incluyen como sujetos a animales vertebrados deben ser aprobados por un Comité
Institucional de Cuidado y Uso de Animales (IACUC). Si los datos se derivan de un
entorno sanitario, deben cumplirse los requisitos de la Ley de portabilidad y
responsabilidad del seguro médico (HIPAA). Si derivan de un entorno
educativo, existen requisitos de la Ley de derechos de educación familiar y
privacidad (FERPA) a tener en cuenta.

Asimismo, hay otros requisitos que rigen el uso de determinados tipos de


materiales de investigación, tales como sustancias radioactivas y compuestos
químicos peligrosos. Fuera de los EE. UU., se aplicarán otras normas legales. Las
investigaciones realizadas en centros particulares, tales como en un lugar fuera de
una organización, pueden requerir una variedad de permisos de acceso en
función de la jurisdicción.

Las organizaciones generalmente generan recursos para guiar al investigador en


torno a las complejidades metodológicas y tecnológicas inherentes a la
investigación. En general, las organizaciones no quieren frenar o demorar la
investigación. Por el contrario, quieren asegurarse de que su investigación no
infrinja ninguna norma o regla importante. Una de las obligaciones fundamentales
de un investigador es buscar los recursos que su organización ofrece para
ayudarlo con el diseño y la realización del estudio.

 Uso de bases de datos electrónicas

Adquisición de datos

La adquisición de datos debe regirse por un plan de recolección. Las cuestiones a


tener en cuenta incluyen:

 ¿Qué datos deben recolectarse?


 ¿Por qué medios deben recolectarse los datos a fin de garantizar
confiabilidad y validez?
 ¿Qué cantidad de datos debe recolectarse —es decir, cuántos sujetos o
eventos se requieren para un poder estadístico adecuado?
 ¿Qué métodos de recolección se utilizarán y cómo disminuirán esos
métodos la posibilidad de error o sesgo?
 ¿Quién realizará cada tarea relacionada con los datos?
 ¿Cómo se brindará la capacitación sobre los métodos y equipos necesarios
a cada miembro del equipo de investigación?
 ¿Quién supervisará el trabajo y de qué forma se garantizará la calidad e
integridad del estudio?

La planificación de la adquisición de datos permite a los investigadores contemplar


de forma proactiva cuándo y dónde se necesitan ajustes en los métodos, los
procedimientos o la cantidad de datos recolectados. Si bien podrían ser necesarios
cambios, por ejemplo, recolectar menos conjuntos de datos que los planificados
originalmente, los investigadores deben proceder con cautela. Existe un límite más
allá del cual se altera la calidad de un estudio de forma tal que ya no vale la pena
llevarlo a cabo. Realizar estas elecciones con mucha anticipación y de forma
coherente en todas las dimensiones de un estudio es probable que produzca
determinaciones más objetivas y confiables.

Los datos pueden "minarse" de fuentes existentes o recolectarse nuevamente para


un estudio. En general, los datos preexistentes tienen la ventaja de ser mucho más
económicos y rápidos de adquirir. En algunos casos, obtenerlos puede tener un
costo casi nulo. Sin embargo, una desventaja clave es que el recolector o
propietario original de los datos puede imponer términos y condiciones estrictos
para utilizar los datos. Otra desventaja, posiblemente más grave, es si la
metodología original de recolección de datos era confiable.

Gestión de datos y tecnología de la información (TI)

Planificar un estudio de investigación también debe incluir los aspectos puramente


tecnológicos de la "TI" de la gestión de datos. Tal como lo mencionamos, es
frecuente dividir los objetivos en: confidencialidad, integridad y disponibilidad (CIA).

La confidencialidad se refiere a evitar usuarios o usos inadecuados de los datos.


La confidencialidad generalmente se aborda dentro del contexto de la protección
de la privacidad de los sujetos de investigación, un requisito normativo y ético si los
sujetos son seres humanos. También implica la protección de la propiedad
intelectual relacionada con la investigación.

La integridad se refiere a la responsabilidad de registrar, almacenar y preservar


los datos de forma adecuada durante todo el ciclo de un estudio para que lo que
esté disponible sea completamente preciso.

La disponibilidad se refiere a garantizar que todos los usuarios adecuados tengan


acceso a los datos cuando sea necesario.

Mantener la "CIA" de nuestra propia privacidad puede requerir enfoques muy


distintos en función del tipo de información y del medio de registro de los datos.
Por ejemplo, los requisitos para mantener cuadernos en papel difieren de
aquellos para calibrar instrumentos que generan datos directamente en
formato electrónico.

El factor común es que los investigadores deben cumplir con requisitos normativos
legales, organizacionales y disciplinarios, y asegurarse de que cada miembro del
equipo de investigación los cumpla debidamente. Esto es de especial importancia
cuando se utilizan instrumentos y metodologías de almacenamiento o de
adquisición de datos complejos. Además de la capacitación, será necesario
especificar procedimientos para realizar pruebas periódicas de los dispositivos de
recolección y almacenamiento y confirmar copias de seguridad de los datos. Los
investigadores siempre deben poder recuperar los datos de forma que no estén
corruptos ni alterados.

Algunos organismos de financiación de los EE. UU., tales como la Fundación


Nacional de Ciencias (NSF), requieren un plan general de gestión de datos para
los proyectos que financian. Los investigadores no solo deben contar con un plan,
sino cumplir con dicho plan a fin de cumplir con los requisitos. Cuando se detecten
desviaciones, deben corregirse tan pronto como sea posible, y la corrección debe
registrarse formalmente para el registro de la investigación. En algunos casos,
puede ser necesaria una desviación significativa del plan de investigación para
informarse a un organismo de supervisión tal como un IRB o un IACIC.

Análisis de datos

La elección de los métodos, estadísticos o de otra


naturaleza, utilizados para analizar los datos idealmente se
lleva a cabo antes de recolectar cualquier dato. Los
resultados inesperados algunas veces requieren el uso de
métodos analíticos no contemplados durante el diseño del
estudio. Puede ser adecuado utilizar nuevas herramientas si
existe una justificación sólida para hacerlo. Los
investigadores deben tener motivos coherentes para elegir
un enfoque en particular. De lo contrario, uno parece estar "de compras" a la
espera de que aparezca algo aparentemente importante si se prueban varios
enfoques distintos. Sin embargo, esto aumenta el riesgo de comprometer la
integridad de la investigación.

Los organismos de supervisión, tales como los IRB e IACUC, algunas veces
pueden detectar y abordar problemas metodológicos durante el proceso de
revisión. Sin embargo, detectar problemas metodológicos no es típicamente el
énfasis principal de los organismos de supervisión. En general, dichas entidades
solo cuestionan la metodología de investigación dentro del contexto del
cumplimiento de las normas y políticas organizacionales. Por tal motivo, los
investigadores no deben confiar en que el organismo de supervisión identificará
problemas metodológicos por ellos.

Más allá de los errores metodológicos se encuentra el territorio del fraude y la


falsificación de datos, dos formas de conducta indebida en investigación. Los
investigadores deben comprender que inventar datos (fraude) es inaceptable. Sin
embargo, el límite entre la manipulación legítima (falsificación) y la "mejora"
legítima al contemplar si es adecuado desechar datos inservibles no siempre es
claro. En parte esto depende de si existe la intención de engañar, lo cual se
adentra en el terreno de la conducta indebida en investigación. Incluso sin la
intención de engañar, la desprolijidad compromete el registro de la investigación.

Gestionar los datos de forma adecuada compromete a un estudio y puede hacerlo


inservible para otros investigadores. Desechar resultados incómodos o inventar
resultados son conductas indebidas poco éticas y corroen la confianza depositada
en las comunidades de investigación. Los investigadores están obligados a
conocer los estándares del análisis de datos en sus campos y a evitar las prácticas
de investigación desprolijas. La expectativa es que todo lo que se lleve a cabo con
respecto al "ajuste" de datos siempre se registrará de forma completa para que
otros puedan evaluar la legitimidad del enfoque empleado.

Informe de los resultados

En cualquier fuero o formato en que se elija presentar los resultados, los


investigadores tienen la obligación de ser claros, honestos y parciales. Esto incluye
una descripción lo suficientemente detallada del diseño y la realización del estudio,
y de los datos, incluida información acerca de lo que se dejó de lado. Los
investigadores también deben describir sus métodos analíticos de forma completa
para que pueda evaluarse el estudio y, en principio, replicarse. Asimismo, los datos
deben presentarse de forma precisa en gráficos, tablas, imágenes u otros
formatos. Por ejemplo, resulta inadecuado distorsionar la forma en que se
muestran los datos a fin de generar una conclusión que parece ser más sólida de
lo que es.

Para algunos tipos de investigación, la variedad de revistas, congresos y otros


fueros en los que informar los resultados puede ser muy amplia. Para otros, la
naturaleza del tema y la disciplina puede limitar significativamente la elección. En
la mayoría de los casos, los investigadores desean publicar sus resultados lo más
pronto posible a fin de evitar que otro lo haga primero. Sin embargo, una demora
puede ser ventajosa en algunos casos, especialmente cuando hay cuestiones de
propiedad intelectual, tal como una patente en trámite.

Las elecciones acerca del momento y los fueros para presentar las investigaciones
dependen ampliamente de la estrategia personal. Sin embargo, hay límites. Por
ejemplo, si la investigación se lleva a cabo como parte de un equipo de
colaboración, las preferencias de los miembros del equipo deberán analizarse y
equilibrarse. Asimismo, quienes financian el proyecto pueden tener opiniones
acerca de cuándo y dónde informar; de hecho, los plazos para informar pueden
establecerse de forma específica en el acuerdo de financiación. Suponiendo que la
investigación sea importante, demorar la publicación puede excluir un beneficio
significativo para la sociedad (o al menos para los demás investigadores en el
campo). Asimismo, algunas investigaciones tienen implicancias de seguridad y,
como resultado, publicarlas demasiado rápido podría generar consecuencias
perjudiciales. En esos casos, la demora podría no solo ser adecuada, sino también
legalmente necesaria.
Titularidad y gestión

La titularidad puede definirse formalmente como un conjunto de derechos,


privilegios y responsabilidades con respecto a un objeto. El objeto puede ser un
bien tangible, como un automóvil, que puede ser "poseído" solamente por una
persona a la vez, o puede ser algo lógico, tal como un conjunto de datos, que
posiblemente pueda ser poseído por varias personas al mismo tiempo.

La titularidad de los datos puede incluir los derechos de permitir o denegar el


acceso, además de conllevar responsabilidades tales como mantener la
confidencialidad, integridad y disponibilidad. Sin embargo, solo porque los
investigadores trabajan con un conjunto de datos, esto no necesariamente significa
que son propietarios de los datos o del registro oficial de los datos. Por ejemplo,
cuando las investigaciones son financiadas por el gobierno de los EE. UU., la beca
se emite a la organización (no a los investigadores) y los datos generalmente son
de propiedad de la organización. Sin embargo, las instituciones académicas u
otras organizaciones generalmente asignan la responsabilidad de ser "gestores"
de los datos al equipo de investigación. Asimismo, el equipo de investigación
puede tener parte de los derechos de propiedad intelectual sobre los datos en
función de las políticas organizacionales u otras políticas relacionadas.

Divulgación de los datos

 Divulgación de datos a nivel internacional

Algunos tipos de datos, especialmente aquellos relacionados con la investigación


en sujetos humanos, conllevan una obligación de prevenir la divulgación
inadecuada. Es decir, puede haber un deber de evitar la divulgación de datos, al
menos de forma identificable, con personas que no deben tener acceso a ellos.

Las cuestiones de propiedad intelectual también pueden imponer obligaciones


sobre los investigadores para evitar compartir los datos fuera de un conjunto
definido de personas. Los acuerdos de confidencialidad, si son firmados por los
investigadores o terceros, pueden especificar estas obligaciones en mayor detalle.
Por ejemplo, una empresa privada podría requerir una revisión o aprobación antes
de que se publiquen los resultados de la investigación que financia. Las cuestiones
de seguridad nacional también restringen la divulgación de datos. Por ejemplo, las
restricciones podrían imponerse sobre la divulgación de información acerca de las
investigaciones que tengan aplicaciones militares o "dobles".

Por el contrario, las entidades que financian la investigación, notablemente muchos


organismos federales estadounidenses, ahora cuentan, por lo general, con
requisitos sobre la divulgación de datos. Las revistas también pueden imponer
obligaciones para compartir los datos para los artículos que publican. Uno podría
decir que los principios de ser un investigador responsable en sí mismos imponen
obligaciones de compartir datos con terceros. La motivación principal es la misma:
la divulgación permite la replicación de la investigación, lo cual permite a los
demás confirmar que los datos justifiquen una conclusión en particular. Asimismo,
permite a otros avanzar sobre la base de la investigación previa con mayor
facilidad.

Las obligaciones de compartir los datos con otros equipos de investigación no


necesariamente implican obligaciones de hacerlo de inmediato. Cada equipo de
investigación requiere tiempo para completar su trabajo y publicar los resultados
antes de compartirlos con terceros. También se comprende que los costos de la
divulgación de datos pueden recuperarse.

Protección de datos

La titularidad de los datos implica obligaciones para la gestión


a largo plazo, para la protección de los datos durante toda la
creación desde la creación hasta la destrucción, para que
puedan divulgarse correctamente y se evite la divulgación no
autorizada. Las cuestiones sobre la gestión de la vida útil de
los datos (DLM) impulsan la elección de dispositivos, medios y
procesos para proteger los datos a largo plazo. Por ejemplo, si
un dispositivo de almacenamiento queda obsoleto, puede ser
difícil recuperar los datos.

Debido a que la mayoría de los investigadores no son especialistas en TI, esta es


otra área en la que puede ser necesario consultar con expertos. Los requisitos de
retención de los datos generalmente derivan de las mismas fuentes que rigen la
divulgación de datos. Quienes aportan los fondos, las revistas, nuestra propia
organización o incluso los gobiernos estaduales o nacionales pueden tener
requisitos de retención de datos.

Resumen

La investigación no siempre procede de forma prolija y ordenada. Sin embargo, la


gestión de los datos generados a lo largo del camino hacia el descubrimiento
requiere el desarrollo de planes y procesos sistemáticos de forma tal de eliminar
errores y sesgo en la mayor medida posible.

Agradecimientos

Varios revisores anónimos brindaron comentarios y asesoramiento para este


módulo, al igual que el editor de la serie CITI-RCR Jason Borenstein. El trabajo
original de Reid Cushman en este módulo fue respaldado, en parte, por los
Programas de Ética de la Universidad de Miami.

Bibliografía consultada

 National Academy of Sciences, National Academy of Engineering, and


Institute of Medicine. 2009. On Being a Scientist. Washington, DC: National
Academies Press.
 National Science Foundation (NSF). 2014. Dissemination and Sharing of
Research Results: NSF Data Management Plan Requirements. Acceso a la
página el 12 de marzo de 2014.

También podría gustarte