Está en la página 1de 1139

Investigación en

enfermería
Desarrollo de la práctica
enfermera basada en la
evidencia

7.ª EDICIÓN

Susan K. Grove, PhD, RN, ANP-BC,


GNP-BC
Professor Emerita, College of Nursing and Health Innovation, The
University of Texas at Arlington, Arlington, Texas
Adult Nurse Practitioner, WellMed Clinic, Grand Prairie, Texas

Jennifer R. Gray, PhD, RN, FAAN


2
Associate Dean, College of Natural and Health Sciences, Oklahoma
Christian University, Oklahoma City, Oklahoma
Professor EmeritaCollege of Nursing and Health Innovation, The
University of Texas at Arlington, Arlington, Texas

3
Índice de Capítulos
Cubierta

portada

Página de créditos

Dedicatoria

COLABORADORAS Y REVISORAS

PRÓLOGO

AGRADECIMIENTOS

Capítulo 1: Introducción a la investigación en enfermería y su


importancia en el desarrollo de una práctica basada en la evidencia

¿QUÉ ES LA INVESTIGACIÓN EN ENFERMERÍA?

¿QUÉ ES LA PRÁCTICA BASADA EN LA EVIDENCIA?

DESARROLLO HISTÓRICO DE LA INVESTIGACIÓN EN


ENFERMERÍA

4
ADQUISICIÓN DE CONOCIMIENTOS DE ENFERMERÍA

ADQUISICIÓN DE CONOCIMIENTOS A TRAVÉS DE LA


INVESTIGACIÓN EN ENFERMERÍA

OBJETIVOS DE LA INVESTIGACIÓN PARA IMPLEMENTAR


UNA PRÁCTICA DE ENFERMERÍA BASADA EN LA
EVIDENCIA

COMPRENSIÓN DEL PAPEL DEL PROFESIONAL EN LA


INVESTIGACIÓN DE ENFERMERÍA

DETERMINACIÓN DE LA MEJOR EVIDENCIA DE LA


INVESTIGACIÓN PARA LA PRÁCTICA

PUNTOS CLAVE

Capítulo 2: Introducción a la investigación cuantitativa

¿QUÉ ES LA INVESTIGACIÓN CUANTITATIVA?

SOLUCIÓN DE PROBLEMAS Y PROCESOS DE


ENFERMERÍA: BASES PARA LA COMPRENSIÓN DEL
PROCESO DE INVESTIGACIÓN CUANTITATIVA

IDENTIFICACIÓN DE LOS PASOS DEL PROCESO DE


INVESTIGACIÓN CUANTITATIVA

LECTURA DE INFORMES DE INVESTIGACIÓN

PRÁCTICA DE LECTURA DE ESTUDIOS


CUASIEXPERIMENTALES

PUNTOS CLAVE

Capítulo 3: Introducción a la investigación cualitativa

IDENTIFICACIÓN DE LOS PASOS DEL PROCESO DE


INVESTIGACIÓN CUALITATIVA

5
ENFOQUES DE LA INVESTIGACIÓN CUALITATIVA

MUESTREO Y RECLUTAMIENTO

MÉTODOS DE RECOGIDA DE DATOS

MANEJO Y ANÁLISIS DE LOS DATOS

RIGOR EN INVESTIGACIÓN CUALITATIVA

PUNTOS CLAVE

Capítulo 4: Análisis de la ética en investigación en enfermería

INVESTIGACIÓN NO ÉTICA: PERIODO DE 1930 A 1989

ESTÁNDARES ÉTICOS PARA INVESTIGACIÓN

PROTECCIÓN DE LOS SUJETOS HUMANOS

COMPRENSIÓN DEL CONSENTIMIENTO INFORMADO

COMPRENSIÓN DE LA REVISIÓN INSTITUCIONAL

CUESTIONES ACTUALES EN LA ÉTICA DE LA


INVESTIGACIÓN

PUNTOS CLAVE

Capítulo 5: Evaluación de los problemas, los propósitos y las


hipótesis de investigación

¿CUÁLES SON LOS PROBLEMAS Y PROPÓSITOS DE LA


INVESTIGACIÓN?

IDENTIFICACIÓN DEL PROBLEMA Y DEL PROPÓSITO EN


ESTUDIOS CUANTITATIVOS Y CUALITATIVOS

DETERMINACIÓN DE LA RELEVANCIA DEL PROBLEMA Y

6
DEL PROPÓSITO DE UN ESTUDIO

ANÁLISIS DE LA VIABILIDAD DEL PROBLEMA Y DEL


PROPÓSITO DE UN ESTUDIO

ANÁLISIS DE LOS OBJETIVOS, PREGUNTAS E HIPÓTESIS


DE LA INVESTIGACIÓN EN LOS INFORMES DE
INVESTIGACIÓN

COMPRENSIÓN DE LAS VARIABLES DEL ESTUDIO Y DE


LOS CONCEPTOS DE INVESTIGACIÓN

PUNTOS CLAVE

Capítulo 6: Comprensión y valoración crítica de la revisión de la


literatura científica

PROPÓSITO DE LA REVISIÓN DE LA LITERATURA

FUENTES INCLUIDAS EN UNA REVISIÓN DE LA


LITERATURA

VALORACIÓN CRÍTICA DE LA REVISIÓN DE LA


LITERATURA

REVISIÓN DE LA LITERATURA

PUNTOS CLAVE

Capítulo 7: Comprensión de la teoría y los marcos de investigación

COMPRENSIÓN DE LOS ELEMENTOS DE UNA TEORÍA

NIVELES DE PENSAMIENTO TEÓRICO

EJEMPLOS DE VALORACIÓN CRÍTICA DE MARCOS DE


INVESTIGACIÓN

PUNTOS CLAVE

7
Capítulo 8: Introducción a los diseños de investigación cuantitativa

IDENTIFICACIÓN DE LOS DISEÑOS DE INVESTIGACIÓN


CUANTITATIVA EN ESTUDIOS DE ENFERMERÍA

COMPRENSIÓN DE LOS CONCEPTOS RELEVANTES PARA


LOS DISEÑOS DE INVESTIGACIÓN CUANTITATIVA

ANÁLISIS DE LA VALIDEZ DEL DISEÑO DE ESTUDIOS


CUANTITATIVOS

DISEÑOS DESCRIPTIVOS

DISEÑOS DE CORRELACIÓN

ELEMENTOS DE LOS DISEÑOS QUE ANALIZAN LA


CAUSALIDAD

DISEÑOS CUASIEXPERIMENTALES

DISEÑOS EXPERIMENTALES

PUNTOS CLAVE

Capítulo 9: Análisis de poblaciones y muestras en investigación

COMPRENSIÓN DE LOS CONCEPTOS CLAVE DE LA


TEORÍA DEL MUESTREO

REPRESENTATIVIDAD DE UNA MUESTRA EN


INVESTIGACIÓN CUANTITATIVA

MÉTODOS DE MUESTREO PROBABILÍSTICO

MÉTODOS DE MUESTREO NO PROBABILÍSTICO MÁS


UTILIZADOS EN INVESTIGACIÓN CUANTITATIVA

TAMAÑO DE LA MUESTRA EN ESTUDIOS CUANTITATIVOS

MUESTREO EN INVESTIGACIÓN CUALITATIVA

8
TAMAÑO DE LA MUESTRA EN ESTUDIOS CUALITATIVOS

ENTORNOS DE INVESTIGACIÓN

PUNTOS CLAVE

Capítulo 10: Clarificación de la medición y la recogida de datos en


investigación cuantitativa

CONCEPTOS DE LA TEORÍA DE LA MEDICIÓN

EXACTITUD, PRECISIÓN Y ERROR DE LAS MEDIDAS


FISIOLÓGICAS

USO DE LA SENSIBILIDAD, LA ESPECIFICIDAD Y LOS


COCIENTES DE VEROSIMILITUDES PARA DETERMINAR
LA CALIDAD DE LAS PRUEBAS DIAGNÓSTICAS

ESTRATEGIAS DE MEDICIÓN EN ENFERMERÍA

PROCESO DE RECOGIDA DE DATOS

PUNTOS CLAVE

Capítulo 11: Consideraciones sobre la estadística en investigación

COMPRENSIÓN DE TEORÍAS Y CONCEPTOS DEL


PROCESO DE ANÁLISIS ESTADÍSTICO

IDENTIFICACIÓN DE LOS PASOS DEL PROCESO DE


ANÁLISIS DE LOS DATOS

USO DE LA ESTADÍSTICA PARA DESCRIBIR VARIABLES

DETERMINACIÓN DE LA IDONEIDAD DE LA ESTADÍSTICA


INFERENCIAL EN LOS ESTUDIOS

USO DE LA ESTADÍSTICA PARA EXAMINAR RELACIONES

9
USO DE LA ESTADÍSTICA PARA PREDECIR RESULTADOS

USO DE LA ESTADÍSTICA PARA EXAMINAR DIFERENCIAS

INTERPRETACIÓN DE LOS RESULTADOS DE


INVESTIGACIÓN

PUNTOS CLAVE

Capítulo 12: Estudios cuantitativos

PROPÓSITO DE LA REALIZACIÓN DE VALORACIONES


CRÍTICAS DE LOS ESTUDIOS EN ENFERMERÍA

PRINCIPIOS CLAVE PARA REALIZAR VALORACIONES


CRÍTICAS INTELECTUALES DE LOS ESTUDIOS
CUANTITATIVOS Y CUALITATIVOS

COMPRENSIÓN DEL PROCESO DE VALORACIÓN CRÍTICA


DE INVESTIGACIONES CUANTITATIVAS

EJEMPLO DE UNA VALORACIÓN CRÍTICA DE UN ESTUDIO


CUANTITATIVO

COMPRENSIÓN DEL PROCESO DE VALORACIÓN CRÍTICA


DE INVESTIGACIONES CUALITATIVAS

EJEMPLO DE UNA VALORACIÓN CRÍTICA DE UN ESTUDIO


CUALITATIVO

PUNTOS CLAVE

Capítulo 13: Creación de una práctica enfermera basada en la


evidencia

BENEFICIOS Y DIFICULTADES RELACIONADOS CON LA


PRÁCTICA ENFERMERA BASADA EN LA EVIDENCIA

DESARROLLO DE PREGUNTAS CLÍNICAS CON EL FIN DE

10
BUSCAR EVIDENCIA BASADA EN LA INVESTIGACIÓN
EXISTENTE PARA SU USO EN LA PRÁCTICA

VALORACIÓN CRÍTICA DE SÍNTESIS DE


INVESTIGACIONES: REVISIONES SISTEMÁTICAS Y
METAANÁLISIS

VALORACIÓN CRÍTICA DE METASÍNTESIS

VALORACIÓN CRÍTICA DE REVISIONES SISTEMÁTICAS


DE MÉTODOS MIXTOS

MODELOS PARA PROMOVER LA PRÁCTICA BASADA EN


LA EVIDENCIA EN ENFERMERÍA

APLICACIÓN EN LA PRÁCTICA DE GUÍAS BASADAS EN LA


EVIDENCIA

INTRODUCCIÓN A LOS CENTROS DE PRÁCTICA BASADA


EN LA EVIDENCIA

INTRODUCCIÓN A LA INVESTIGACIÓN TRASLACIONAL

PUNTOS CLAVE

Capítulo 14: Introducción a las metodologías de investigación


adicionales en enfermería: investigación de métodos mixtos y de
resultados

INVESTIGACIÓN Y DISEÑO DE MÉTODOS MIXTOS

INVESTIGACIÓN DE RESULTADOS

PUNTOS CLAVE

GLOSARIO

ÍNDICE ALFABÉTICO

11
Interior de contracubierta

12
Página de créditos

Avda. Josep Tarradellas, 20-30, 1.º, 08029, Barcelona, España

Understanding Nursing Research: Building an Evidence-Based Practice,


7th edition

Copyright © 2019 by Elsevier, Inc. All rights reserved

Previous editions copyrighted 2015, 2011, 2007, 2003, 1999, and 1995

ISBN: 978-0-323-53205-1

This translation of Understanding Nursing Research: Building an


Evidence-Based Practice, 7th edition by Susan K. Grove and Jennifer
R. Gray was undertaken by Elsevier España, S.L.U. and is
published by arrangement with Elsevier, Inc.

Esta traducción de Understanding Nursing Research: Building an


Evidence-Based Practice, 7.ª edición, de Susan K. Grove y Jennifer R.

13
Gray, ha sido llevada a cabo por Elsevier España, S.L.U. y se
publica con el permiso de Elsevier, Inc.

Investigación en enfermería. Desarrollo de la práctica enfermera basada en


la evidencia, 7.ª ed., de Susan K. Grove y Jennifer R. Gray
© 2019 Elsevier España, S.L.U., 2016, 2012, 2004
ISBN: 978-84-9113-511-1
eISBN: 978-84-9113-532-6

Todos los derechos reservados

Reserva de derechos de libros


Cualquier forma de reproducción, distribución, comunicación
pública o transformación de esta obra solo puede ser realizada con
la autorización de sus titulares, salvo excepción prevista por la ley.
Diríjase a CEDRO (Centro Español de Derechos Reprográficos) si
necesita fotocopiar o escanear algún fragmento de esta obra
(www.conlicencia.com; 91 702 19 70/93 272 04 45).

Advertencia
Esta traducción ha sido llevada a cabo por Elsevier España, S.L.U.
bajo su única responsabilidad. Facultativos e investigadores deben
siempre contrastar con su propia experiencia y conocimientos el uso
de cualquier información, método, compuesto o experimento
descrito aquí. Los rápidos avances en medicina requieren que los
diagnósticos y las dosis de fármacos recomendadas sean siempre
verificados personalmente por el facultativo. Con todo el alcance de
la ley, ni Elsevier, ni los autores, los editores o los colaboradores
asumen responsabilidad alguna por la traducción ni por los daños
que pudieran ocasionarse a personas o propiedades por el uso de
productos defectuosos o negligencia, o como consecuencia de la
aplicación de métodos, productos, instrucciones o ideas contenidos
en esta obra.

Revisión científica:
Esperanza Vélez Vélez, PhD, MSc, RN
Profesora titular de Metodología de la Investigación en Cuidados
Coordinadora de Trabajos Fin de Grado
Coordinadora de Estudios de Posgrado

14
Escuela de Enfermería Fundación Jiménez Díaz-Universidad
Autónoma de Madrid

Servicios editoriales: DRK Edición


Depósito legal: B. 14.938-2019
Impreso en Polonia

15
Dedicatoria

A todos los profesionales de enfermería que cambian las vidas de


pacientes, familias y estudiantes mediante la aplicación de la
mejor evidencia de investigación en la práctica y la docencia.

Susan and Jennifer

En memoria de mi querida hermana, y a mi marido, Jay Suggs, y


mis hijas, Monece Appleton y Nicole Horn, que me han
proporcionado amor y apoyo durante los treina años que llevo
escribiendo libros sobre desarrollo de investigación.

Susan

A mi marido, Randy Gray, y nuestros hijos y nietos, que me


dejan espacio cuando estoy escribiendo y no paran de quererme.

Jennifer

16
COLABORADORAS
Y REVISORAS
COLABORADORAS
Christy J. Bomer-Norton, PhD, RN, CNM, IBCLC, Concord,
Massachusetts
Kathryn M. Daniel, PhD, MS, BSN, BA, Associate Professor,
College of Nursing and Health Innovation, The University of Texas
at Arlington, Arlington, Texas
REVISORAS
Sue Ellen Bingham, PhD, RN, Professor of Nursing, Clayton
State University, Morrow, Georgia
Sara L. Clutter, PhD, RN, Professor of Nursing, Waynesburg
University, Waynesburg, Pennsylvania
Angela N. Cornelius, DNP, RN, CNE, CNL, Associate Professor
of Nursing, Central Methodist University, Fayette, Missouri
Polly A. Hulme, PhD, CNP, RN, Professor, College of Nursing,
South Dakota State University, Brookings, South Dakota
Tamara M. Kear, PhD, RN, CNS, CNN, Associate Professor of
Nursing, College of Nursing, Villanova University, Villanova,
Pennsylvania
Llynne C. Kiernan, DNP, MSN, RN-BC, Assistant Professor of
Nursing, Norwich University School of Nursing, Northfield,
Vermont

17
Kathleen S. Murtaugh, MSN, RN, CNA, Assistant Professor,
Saint Joseph College—St. Elizabeth School of Nursing Cooperative
Program, Rensselaer, Indiana
Michael Perlow, DNS, RN, Professor of Nursing, School of
Nursing and Health Professions, Murray State University, Murray,
Kentucky

18
PRÓLOGO
La investigación es una fuerza importante en la enfermería y la
evidencia obtenida de ella está cambiando constantemente la
práctica, la educación y la política sanitarias. Un objetivo principal
de la enfermería profesional y de la asistencia sanitaria es
proporcionar una asistencia basada en la evidencia. Al hacer que la
investigación en enfermería sea una parte integral de la educación,
esperamos facilitar que la investigación pase a ser un elemento
principal en la enfermería profesional. Nuestro objetivo en la
elaboración de este libro de investigación, Investigación en enfermería.
Desarrollo de la práctica enfermera basada en la evidencia, es fomentar el
entusiasmo por la investigación en los estudiantes. El texto hace
hincapié en la importancia de que los profesionales de enfermería
sean capaces de leer, valorar críticamente y sintetizar la
investigación con el fin de poder utilizar esta evidencia para hacer
cambios en su práctica asistencial. También esperamos que con este
libro el estudiante conozca y valore todo el conocimiento que se ha
generado a través de la investigación en enfermería, y que dicho
conocimiento sea importante para su práctica futura. Solo a través
de la investigación, la enfermería podrá ser realmente reconocida
como una profesión, con resultados documentados eficaces para el
paciente, su familia, el profesional de enfermería y el sistema
sanitario.
El desarrollo de una séptima edición de Investigación en enfermería
nos ha proporcionado la oportunidad de actualizar, aclarar y
perfeccionar el contenido básico de esta obra de investigación para
estudiantes. El libro está diseñado para ayudarles a superar los
obstáculos a los que con frecuencia deben enfrentarse para

19
comprender el lenguaje utilizado en la investigación en enfermería.
Las revisiones de esta edición se basan en nuestras propias
experiencias con el libro y las aportaciones de revisores entregados,
estudiantes curiosos y profesores que, desde diferentes lugares, nos
han proporcionado muchas sugerencias útiles.
El capítulo 1, «Introducción a la investigación en enfermería y su
importancia en el desarrollo de una práctica basada en la
evidencia», introduce al lector en la investigación en enfermería, la
historia de la investigación y la importancia de la evidencia de
investigación para la práctica profesional. En él se describen los
principales tipos de investigación que se realizan en enfermería:
revisión sistemática, metaanálisis, metasíntesis y revisión
sistemática de métodos mixtos. La definición de práctica basada en la
evidencia (PBE) se ha actualizado en función de la literatura actual y
las actividades de PBE implementadas en enfermería. Se ha
actualizado y ampliado el análisis de las metodologías de
investigación y su importancia en el desarrollo de una PBE para la
enfermería con el fin de incluir la investigación de métodos mixtos.
También se ha incorporado en esta edición un análisis de las
competencias de la educación de calidad y seguridad en enfermería
(QSEN, quality and safety education for nursing), y su relación con la
investigación para aumentar la comprensión por parte de los
estudiantes de la importancia de una asistencia sanitaria de calidad
y segura para los pacientes y sus familias.
El capítulo 2, «Introducción a la investigación cuantitativa»,
presenta los pasos del proceso de investigación cuantitativa de
manera concisa y clara, y muestra a los estudiantes el objetivo y los
hallazgos de los estudios cuantitativos. Se proporcionan ejemplos
recientes y extensos de estudios descriptivos, de correlación,
cuasiexperimentales y experimentales, que reflejan la calidad de la
investigación actual en enfermería.
El capítulo 3, «Introducción a la investigación cualitativa»,
describe cuatro enfoques de la investigación cualitativa y la filosofía
en la que se basan: fenomenología, teoría fundamentada, etnografía
y cualitativo exploratorio-descriptivo. Se comentan los métodos
específicos de recogida y análisis de datos en este tipo de
investigación. Las guías para la lectura y la valoración crítica de los
estudios cualitativos se explican utilizando ejemplos de estudios

20
publicados.
El capítulo 4, «Análisis de la ética en investigación en
enfermería», ofrece un análisis extenso del uso de la ética en la
investigación, y la legislación que rige este proceso, incluidos los
cambios recientes de la Common Rule que ha implementado el
Department of Health and Human Services estadounidense para
proteger a las personas. Se describen las implicaciones de la Health
Insurance Portability and Accountability Act (HIPAA) para la
investigación. Se proporcionan guías para ayudar a los estudiantes
en la valoración crítica de los debates éticos de los estudios
publicados, y en su participación en la revisión ética de la
investigación en instituciones clínicas.
El capítulo 5, «Evaluación de los problemas, los propósitos y las
hipótesis de investigación», precisa la diferencia entre un problema
y un propósito. Se recogen ejemplos de problemas y propósitos de
estudios actuales cualitativos y cuantitativos. Se aplican guías
detalladas de valoración crítica a estudios actuales para ayudar a
los estudiantes en la valoración crítica de los problemas, los
propósitos, las hipótesis y las variables de los estudios.
El capítulo 6, «Comprensión y valoración crítica de la revisión de
la literatura científica», comienza con una descripción del contenido
y de la calidad de diferentes tipos de publicaciones que podrían
incluirse en una revisión. Se estudian las guías para la valoración
crítica de revisiones de la literatura publicada, centrándose en las
diferencias en cuanto al propósito y la planificación de la revisión
de la literatura en estudios cuantitativos y cualitativos. Se presentan
los pasos para la búsqueda adecuada de fuentes, la lectura de
publicaciones y la síntesis de la información en una revisión
coherente y lógica.
El capítulo 7, «Comprensión de la teoría y los marcos de
investigación», describe brevemente los componentes de la teoría y
los distintos tipos de teorías que sirven de base para marcos de un
estudio. Se analiza el propósito de un marco de investigación
sabiendo que este puede ser implícito. También se exponen las
guías de valoración crítica del marco de un estudio. Las guías se
aplican a estudios con marcos obtenidos de resultados de
investigación previos y de diferentes tipos de teorías.
El capítulo 8, «Introducción a los diseños de investigación

21
cuantitativa», aborda los diseños descriptivos, de correlación,
cuasiexperimentales y experimentales, y los criterios de valoración
crítica de estos diseños en los estudios. Los principales puntos
fuertes y las amenazas a la validez del diseño se resumen en una
tabla y se analizan en relación con estudios actuales.
El capítulo 9, «Análisis de poblaciones y muestras en
investigación», ofrece una explicación detallada de los conceptos de
muestreo en la investigación. Se describen diferentes tipos de
métodos de muestreo en investigación, tanto cualitativa como
cuantitativa. Se incluyen las guías de valoración crítica de los
criterios de muestreo, el método de muestreo y el tamaño de la
muestra de estudios cuantitativos y cualitativos.
El capítulo 10, «Clarificación de la medición y la recogida de
datos en investigación cuantitativa», se ha renovado para recoger
los conocimientos actuales acerca de los métodos de medición
utilizados en investigación en enfermería. El contenido se ha
ampliado y organizado para ayudar a los estudiantes en la
valoración crítica de la fiabilidad y la validez de las escalas, de la
precisión y exactitud de medidas fisiológicas, y de la sensibilidad, la
especificidad y los cocientes de verosimilitudes de las pruebas
diagnósticas y de cribado.
El capítulo 11, «Consideraciones sobre la estadística en
investigación», se centra en teorías y conceptos del proceso de
análisis estadístico, y las herramientas utilizadas para describir las
variables, examinar las relaciones, predecir resultados y examinar
las diferencias de grupo en los estudios. Se proporcionan guías para
la valoración crítica de resultados y la discusión de los estudios de
enfermería. Se valoran críticamente los resultados de estudios
actuales seleccionados como ejemplos para ayudar a los estudiantes
a comprender el contenido del capítulo.
El capítulo 12, «Valoración crítica de la investigación cuantitativa
y cualitativa para la práctica enfermera», se ha revisado con el fin
de incluir tres criterios principales para la valoración crítica de
estudios cuantitativos y cualitativos. Estos criterios son: 1)
identificar los pasos o elementos de los estudios, 2) determinar los
puntos fuertes y débiles de los estudios y 3) evaluar la credibilidad,
la confianza y el significado de los estudios. Estos criterios incluyen
preguntas para la valoración crítica de estudios cuantitativos y

22
cualitativos. El capítulo también incluye un estudio cualitativo y
otro cuantitativo actuales, que se evalúan críticamente utilizando
las guías proporcionadas en el propio capítulo.
El capítulo 13, «Creación de una práctica enfermera basada en la
evidencia», se ha actualizado significativamente con el fin de
reflejar las tendencias actuales en la asistencia sanitaria para
proporcionar PBE en enfermería. Se ofrecen unas guías detalladas
de valoración crítica de los cuatro tipos de síntesis más frecuentes
en la investigación enfermera (revisión sistemática, metaanálisis,
metasíntesis y revisión sistemática de métodos mixtos). Estas guías
se han utilizado en la valoración crítica de síntesis de
investigaciones actuales para ayudar a los estudiantes a evaluar la
calidad de las síntesis de investigaciones publicadas y el posible uso
de la evidencia de investigación en la práctica. El capítulo incluye
modelos actualizados para ayudar a profesionales de enfermería y
organismos a avanzar hacia una PBE. Se presenta la investigación
aplicada como método para fomentar el uso de la evidencia de
investigación en la práctica asistencial.
El capítulo 14, «Introducción a las metodologías de investigación
adicionales en enfermería: investigación de métodos mixtos y de
resultados», ha sido revisado en profundidad para incluir estudios
de ambos tipos de investigación. Los estudios de métodos mixtos,
que incluyen metodologías tanto cuantitativas como cualitativas,
son cada vez más frecuentes en la literatura de enfermería, por lo
que requieren una exposición detallada en este libro. El objetivo de
este capítulo es aumentar la comprensión por parte de los
estudiantes del impacto de la investigación de métodos mixtos y de
resultados en enfermería y en la asistencia sanitaria. Se
proporcionan el contenido y las guías para ayudar a los estudiantes
en la lectura y la valoración crítica de los estudios de métodos
mixtos y de resultados que aparecen en la literatura enfermera.
La séptima edición está escrita y organizada para facilitar la
lectura, la comprensión y la valoración crítica de los estudios. Los
principales puntos fuertes del libro son los siguientes:

• Cobertura de los conocimientos actuales de la PBE, un tema


de importancia vital en enfermería.
• Cobertura equilibrada de las metodologías de investigación

23
cualitativa y cuantitativa.
• Introducción a las metodologías de investigación de
métodos mixtos y de resultados.
• Ilustración profusa y abundante de los principales puntos y
conceptos de la literatura de investigación en enfermería
más reciente sobre las distintas áreas de práctica enfermera.
• Estilo de escritura claro y conciso a lo largo de todos los
capítulos para facilitar el aprendizaje de los estudiantes.
• Referencias bibliográficas electrónicas y sitios web que
dirigen al estudiante a una extensa información importante
para la lectura, la valoración crítica y el uso de
conocimientos de investigación en la práctica.

Esta séptima edición de Investigación en enfermería es idónea para


su uso en diversos cursos sobre investigación, tanto para
profesionales como para estudiantes de Enfermería, ya que
proporciona una introducción a la metodología de investigación
cuantitativa, cualitativa, de métodos mixtos y de resultados. No
solo ayudará a los estudiantes en la lectura de la literatura
científica, la valoración crítica de los estudios publicados y a la hora
de sintetizar la evidencia de la investigación para hacer cambios en
la práctica, sino que también servirá como recurso valioso para los
profesionales de enfermería en la valoración crítica de los estudios y
la aplicación de la evidencia de la investigación en su práctica
diaria.

24
AGRADECIMIENTOS
La elaboración de este libro sobre los aspectos esenciales de la
investigación ha sido un proyecto de dos años y nos gustaría
expresar nuestro agradecimiento a muchas personas. Queremos
enviar un agradecimiento muy especial a la Dra. Christy Bomer-
Norton por su revisión del capítulo 6, centrado en la revisión de la
literatura, y el capítulo 12, que hace hincapié en la valoración crítica
de los estudios cuantitativos y cualitativos. También queremos
agradecer a la Dra. Kathryn M. Daniel su revisión del capítulo 2,
centrado en la investigación cuantitativa. Somos muy afortunadas
porque estas profesionales hayan querido compartir su experiencia
y su tiempo en la elaboración de la séptima edición de este libro.
Asimismo, expresamos nuestro aprecio a los profesores de
nuestras universidades, College of Nursing and Health Innovation
de The University of Texas at Arlington y Oklahoma Christian
University, por su apoyo y aliento, y agradecemos a otros
profesores de Enfermería de todo el mundo que utilizan nuestro
libro para la docencia de la investigación que hayan dedicado un
tiempo precioso para enviarnos ideas e identificar errores en el
libro. Un agradecimiento especial se dirige a los estudiantes que
han leído nuestro libro y que han proporcionado una
retroalimentación sincera sobre su claridad y su utilidad para ellos.
También queremos reconocer las excelentes revisiones de las
colegas enumeradas en la página siguiente, que nos han ayudado a
realizar mejoras importantes del libro.
Para finalizar, damos las gracias al personal de Elsevier que nos
ha ayudado a elaborar este libro. Agradecemos a las personas que
han dedicado una gran cantidad de tiempo al desarrollo de esta

25
séptima edición. Se trata de Lee Henderson, Lisa Newton, Laurel
Shea, Anne Konopka y Hari Maniyaan. Laurel Shea ha estado en
constante comunicación con nosotras para garantizar la calidad y la
coherencia de la estructura y el contenido del libro. Ha sido todo un
placer trabajar con ella.

Susan K. Grove, PhD, RN, ANP-BC, GNP-BC

26
Jennifer R. Gray, PhD, RN, FAAN

27
CAPÍTULO 1

Introducción a la
investigación en
enfermería y su
importancia en el
desarrollo de una
práctica basada en la
evidencia
Susan K. Grove

La página web de la National Guideline Clearinghouse de la Agency for


Healthcare Research and Quality (AHRQ) se cerró en 2018. Puede
consultarse más información en https://www.ahrq.gov/.

ÍNDICE DEL CAPÍTULO

28
¿Qué es la investigación en enfermería?, 2
¿Qué es la práctica basada en la evidencia?, 3
Desarrollo histórico de la investigación en enfermería, 6
Adquisición de conocimientos de enfermería, 11
Adquisición de conocimientos a través de la
investigación en enfermería, 14
Objetivos de la investigación para implementar una
práctica de enfermería basada en la evidencia, 18
Comprensión del papel del profesional en la
investigación en enfermería, 20
Determinación de la mejor evidencia de la investigación
para la práctica, 21
Puntos clave, 25
Bibliografía, 26

OBJETIVOS DE APRENDIZAJE
Tras concluir este capítulo, el lector debería ser capaz de:
1. Definir la investigación, la investigación en enfermería y la
práctica basada en la evidencia.
2. Comentar las actividades presentes y pasadas que influyen en
la investigación en enfermería.
3. Evaluar las formas de adquisición de conocimientos de
enfermería (tradición, autoridad, préstamo, ensayo y error,
experiencia personal, modelado de roles, intuición y
razonamiento).
4. Describir los tipos comunes de investigación (cuantitativa,
cualitativa, métodos mixtos y de resultados) realizada para
generar una evidencia para la práctica enfermera.
5. Describir los objetivos de la investigación a la hora de
implementar una práctica de enfermería basada en la
evidencia.

29
6. Comentar el papel del profesional de enfermería en la
investigación.
7. Describir las siguientes estrategias para sintetizar la
investigación sanitaria: revisión sistemática, metaanálisis,
metasíntesis y revisión sistemática de métodos mixtos.
8. Evaluar los niveles de evidencia de la investigación
disponibles para la práctica enfermera.

En este primer capítulo, queremos dar nuestra bienvenida a los


lectores al mundo de la investigación en enfermería. Puede resultar
raro considerar que la investigación es un mundo, pero realmente se
trata de una nueva forma de experimentar la realidad. Entrar en un
nuevo mundo significa aprender un lenguaje único, incorporar
nuevas reglas y utilizar nuevas experiencias para aprender a
interactuar de manera eficaz en él. Al pasar a formar parte de este
nuevo mundo, los lectores modificarán y ampliarán sus
percepciones y métodos de razonamiento. Por ejemplo, utilizar la
investigación para dirigir la práctica implica plantear preguntas y
aquí se animará a hacer preguntas como estas:

• ¿Cuál es el problema de la asistencia sanitaria para el


paciente?
• ¿Qué intervención(es) de enfermería controlaría(n)
eficazmente este problema en la práctica?
• ¿Están basadas estas intervenciones de enfermería en una
evidencia de investigación sólida que permita seleccionar la
más eficaz para la población de pacientes?
• ¿Cómo puede utilizarse más eficazmente la investigación
para promover una práctica basada en la evidencia (PBE)?

Dado que la investigación es un mundo nuevo para muchos


lectores, hemos elaborado este libro con el fin de facilitar su entrada
en él y la comprensión de esta contribución a la prestación de
cuidados de enfermería seguros y de calidad. El capítulo 1 explica
el significado de la investigación en enfermería y su importancia en
el desarrollo de una PBE para la enfermería. Se describen los logros

30
de la investigación en la profesión de los últimos 170 años. Se
exponen las formas de adquirir conocimientos de enfermería y se
presentan las metodologías comunes de investigación utilizadas
para generar evidencia para la práctica. Se analizan los roles de los
profesionales de enfermería en la investigación de acuerdo con su
nivel de estudios y su contribución en la implementación de una
PBE. El capítulo concluye con los elementos cruciales de la práctica
de enfermería basada en la evidencia, como las estrategias para
sintetizar la evidencia de investigación, los niveles de evidencia de
investigación y las guías basadas en la evidencia.

¿QUÉ ES LA INVESTIGACIÓN EN
ENFERMERÍA?
La investigación es la búsqueda o el estudio sistemático y
minucioso que valida y mejora los conocimientos existentes y
desarrolla otros nuevos. El estudio sistemático y minucioso implica
planificación, organización y persistencia. El objetivo final de la
investigación es desarrollar un cuerpo empírico de conocimientos
para una disciplina o profesión, como la enfermería en este caso.
Definir la investigación en enfermería requiere determinar qué
conocimientos son relevantes para los profesionales que la ejercen.
Debido a que la enfermería es una profesión práctica, la
investigación es fundamental para desarrollar y aumentar el
conocimiento que estos profesionales pueden aplicar para mejorar
la práctica clínica y promover resultados de calidad (Melnyk,
Gallagher-Ford y Fineout-Overholt, 2017). Varios investigadores
expertos han estudiado muchas intervenciones y los profesionales
de enfermería han sintetizado estos estudios para proporcionar
guías y protocolos para su uso en la práctica. Los profesionales de
enfermería en ejercicio y los estudiantes tienen que ser capaces de
leer informes procedentes de la investigación y resúmenes de
hallazgos de esta investigación para implementar intervenciones
basadas en la evidencia a la práctica. Por ejemplo, se ha investigado
ampliamente para determinar la técnica más eficaz para
administrar medicamentos por vía intramuscular (i.m.). Esta
investigación fue resumida y utilizada para elaborar guías basadas

31
en la evidencia para la administración de inyecciones i.m. a adultos
(Cocoman y Murray, 2008; Nicoll y Hesby, 2002; Ogston-Tuck,
2014). Más recientemente, se han resumido varias investigaciones
para determinar si los profesionales de enfermería deberían aspirar
durante una inyección i.m., lo que se comenta más adelante en este
capítulo (Sisson, 2015; Thomas, Mraz y Rajcan, 2016).
La investigación en enfermería también es necesaria para generar
conocimientos sobre educación, administración, servicios sanitarios
y características del personal de enfermería y sus roles. Los
hallazgos de estos estudios influyen indirectamente en la práctica
enfermera y se añaden al cuerpo de conocimientos empíricos de la
enfermería. La investigación es esencial para aportar experiencias
docentes de calidad a los estudiantes de enfermería. A través de la
investigación, los profesionales de enfermería pueden desarrollar y
perfeccionar los mejores métodos para ofrecer una educación de
enfermería a distancia y usar la simulación para mejorar el
aprendizaje de los estudiantes. Se necesitan estudios de
administración y servicios sanitarios de enfermería para mejorar la
calidad, la seguridad y la rentabilidad del sistema sanitario. Los
estudios de los roles del personal de enfermería y de la enfermería
en general pueden influir en la calidad de la asistencia, la
productividad, la satisfacción y la conservación del puesto de
trabajo de estos profesionales. En esta era de escasez de
profesionales de enfermería, se necesitan más investigaciones para
determinar formas eficaces de reclutar nuevos profesionales y de
retenerlos para que no abandonen la profesión. En resumen, la
investigación de enfermería es un proceso científico que valida y
mejora el conocimiento existente y genera otros nuevos que
influyen directa e indirectamente en la práctica enfermera. La
investigación de enfermería es fundamental para el desarrollo de la
PBE en nuestra profesión.

¿QUÉ ES LA PRÁCTICA BASADA EN


LA EVIDENCIA?
El fin último de la enfermería es una PBE que promueva resultados
de calidad, seguros y rentables para los pacientes, sus familias, los

32
profesionales y el sistema sanitario (Melnyk y cols., 2017;
Moorhead, Johnson, Maas y Swanson, 2013). La PBE se desarrolla a
partir de la integración de la mejor evidencia de la investigación
con la experiencia clínica y las circunstancias y valores de los
pacientes para producir unos resultados sanitarios de calidad
(Institute of Medicine [IOM], 2001; Straus, Glasziou, Richardson,
Rosenberg y Haynes, 2011). En la figura 1.1 se muestran los
elementos de la PBE y se demuestra la principal contribución de la
mejor evidencia de investigación al desarrollo de esta práctica. La
mejor evidencia de investigación es el conocimiento empírico
generado a partir de la síntesis de estudios de calidad para abordar
un problema clínico. Los equipos de expertos investigadores,
profesionales sanitarios y, a veces, políticos y usuarios sintetizarán
la mejor evidencia de investigación en distintas áreas para
desarrollar guías estandarizadas nacionales para la práctica clínica.
Por ejemplo, un equipo de expertos llevó a cabo, valoró
críticamente y sintetizó la investigación relacionada con el
problema de salud crónico de la hipertensión arterial (HTA) para
elaborar una guía de PBE para la práctica que se describe más
adelante en esta sección.

FIG 1.1 Modelo de práctica basada en la evidencia.

33
La destreza clínica incluye el conocimiento y las habilidades del
profesional sanitario que proporciona los cuidados. La destreza
clínica de un profesional de enfermería depende de sus años de
experiencia clínica, el conocimiento actual de la investigación y
literatura clínica, así como de la preparación académica. Una mayor
experiencia clínica implica un mejor criterio clínico para aplicar la
mejor evidencia de la investigación en la práctica.
La PBE también incorpora las circunstancias y los valores del
paciente. Las circunstancias del paciente engloban el estado clínico
individual, que podría centrarse en la promoción de la salud, la
prevención de enfermedades, el tratamiento de la enfermedad
aguda o crónica, la rehabilitación y/o los cuidados de personas al
final de su vida, así como el entorno clínico (p. ej., hospital, clínica,
hogar; Straus y cols., 2011). Además, el paciente aporta valores o
preferencias, expectativas, problemas y creencias culturales únicas
en cada entrevista clínica que el profesional de enfermería debe
integrar en la asistencia prestada. Por tanto, la PBE es la
combinación única de la mejor evidencia de la investigación
implementada por expertos profesionales de enfermería en cuanto a
proporcionar cuidados a los pacientes y familias con circunstancias
y valores de salud específicos para promover unos resultados de
calidad, seguros y rentables (v. fig. 1.1). Con la PBE, se anima al
paciente y a su familia a adoptar un papel activo en el manejo de su
salud.

Guía de práctica basada en la evidencia para


la hipertensión arterial
La evidencia de investigación de múltiples estudios se sintetiza
para desarrollar guías, estándares, protocolos, algoritmos (árboles
de decisión clínica) y/o políticas orientadas a la implementación de
varias intervenciones de enfermería. Como se comentó
anteriormente, los miembros del Eighth Joint National Committee
(JNC 8) han elaborado la Guía basada en la evidencia de 2014 para el
tratamiento de la hipertensión arterial en adultos (James y cols., 2014,
pág. 507). La presión arterial (PA) alta o hipertensión arterial (HTA)
se diagnostica con una PA de 140/90 mmHg o más en adultos
menores de 60 años (tabla 1.1). En las personas a partir de 60 años

34
(≥60 años), la guía del JNC 8 indica que la HTA se diagnostica con
una PA de 150/90 mmHg o más (James y cols., 2014). Por el
contrario, la guía de la American Society of Hypertension y la
International Society of Hypertension afirma que la HTA se
diagnostica con una PA de 140/90 mmHg o más para personas
menores de 80 años y una PA de 150/90 mmHg o más a partir de 80
años (Weber y cols., 2014). La tabla 1.1, basada en la guía JNC 8
para la HTA, también indica que las personas a partir de 60 años
que tengan diabetes mellitus (DM) o enfermedad renal crónica
(ERC) tienen HTA si su PA es de 140/90 mmHg o mayor.

TABLA 1.1
GUÍA BASADA EN LA EVIDENCIA PARA LA EVALUACIÓN Y
TRATAMIENTO DE LA HIPERTENSIÓN ARTERIAL EN
ADULTOS

DM, diabetes mellitus; ERC, enfermedad renal crónica; HTA, hipertensión


arterial; PA, presión arterial.
Datos de James y cols. (2014). 2014 evidence-based guidelines for the
management of high blood pressure in adults: Report from the panel
members appointed to the Eighth Joint National Committee (JNC 8).
Journal of the American Medical Association, 311(5), 507-520.
a
El tratamiento está determinado por la categoría de PA más alta (sistólica
o diastólica).
b
Modificación del estilo de vida: se debería recomendar una dieta
equilibrada, ejercicio con regularidad, lograr una PA normal y dejar de
fumar, si es preciso, en todos los adultos con HTA.
c
Los pacientes con DM o ERC necesitan educación sobre el tratamiento de
estas enfermedades y su relación con la hipertensión.
Los estudiantes o profesionales de enfermería tienen un papel en
el tratamiento de los pacientes con HTA. Deben saber cuándo los
pacientes tienen HTA en función de su edad y de si tienen DM o

35
ERC. La tabla 1.1 indica cuándo se deben notificar las cifras altas de
PA a los profesionales de enfermería y a los médicos, así como los
objetivos de PA sistólica y diastólica en los pacientes con HTA. La
guía JNC 8 recomienda diversas modificaciones del estilo de vida
(MEV) para todos los pacientes con HTA, como dieta equilibrada,
realizar ejercicio con regularidad, lograr un peso normal y dejar de
fumar, si es preciso. Se debe educar a los pacientes sobre las MEV y
monitorizar su éxito a la hora de realizar cambios saludables en sus
vidas. Los pacientes con DM y ERC requieren educación y apoyo
para ayudarles a manejar estas enfermedades crónicas junto con la
HTA. Los pacientes diagnosticados de HTA deberían recibir
tratamiento farmacológico que debe ser monitorizado por personal
de enfermería y otros profesionales sanitarios (v. tabla 1.1). Se
dispone de muchas guías estandarizadas en la National Guideline
Clearinghouse (NGC, 2017).

Prestación de cuidados basados en la


evidencia a una población de pacientes
seleccionados con hipertensión
La figura 1-2 proporciona un ejemplo de la prestación de cuidados
de enfermería basados en la evidencia a mujeres hispanas adultas
menores de 60 años con cifras de PA de 140/90 mmHg o más. En
este ejemplo, la mejor evidencia de la investigación señala lo
siguiente:

36
FIG 1.2 Práctica basada en la evidencia para mujeres
hispanas adultas con hipertensión. HTA, hipertensión
arterial; PA, presión arterial; PE, profesional de
enfermería. *James, P. A., Oparil, S., Carter, B. L., Cushman,
W. C., Denison-Himmelfard, C., Handler, J., y cols. (2014). 2014
evidence-based guidelines for the management of high blood
pressure in adults: Report from the panel members appointed to
the Eighth Joint National Committee (JNC 8). Journal of the
American Medical Association, 311(5), 507-520.; †Weber, M. A.,
Schiffrin, E. L., White, W. B., Mann, S., Lindholm, L. H., Kenerson,
J. G., y cols. (2014). Clinical practice guidelines for the
management of hypertension in the community: A statement by
the American Society of Hypertension and the International
Society of Hypertension. Journal of Hypertension, 32(1), 3-15.

1. Mediciones de PA para la HTA.


2. Objetivos de las cifras sistólicas y diastólicas de PA <140/90
mmHg.
3. Educación para MEV.
4. Apoyo y educación para el tratamiento de la DM y ERC con
HTA (si es apropiado).
5. Monitorización del tratamiento farmacológico (v. tabla 1.1;
James y cols., 2014).

Estas guías, elaboradas a partir de la mejor evidencia de la

37
investigación las aplican los profesionales y estudiantes de
enfermería para cubrir las circunstancias y los valores de mujeres
hispanas adultas con HTA. Estas mujeres deben tratar su
enfermedad crónica de acuerdo con sus valores culturales. Los
resultados de calidad, seguros y rentables de la PBE en este ejemplo
corresponden a mujeres que monitorizan sus PA y determinan que
es menor de 140/90 mmHg, aplican MEV, tratan la DM y la ERC
según se precise y se adhieren a la medicación prescrita para la
HTA.

DESARROLLO HISTÓRICO DE LA
INVESTIGACIÓN EN ENFERMERÍA
Inicialmente, la investigación en enfermería evolucionó despacio,
desde las investigaciones de Nightingale en el siglo XIX hasta los
estudios de formación de enfermería en las décadas de 1930 y 1940,
y la investigación de los roles del personal de enfermería en las
décadas de 1950 y 1960. A partir de la década de 1970 hasta la de
2010, cada vez más estudios de enfermería se han centrado en los
problemas clínicos, con el objetivo de desarrollar una PBE para la
enfermería. La revisión de la historia de la investigación en
enfermería permite identificar los logros y comprender la necesidad
de seguir investigando para determinar la mejor evidencia de la
investigación para su uso en la práctica. En la tabla 1.2 se muestran
los principales acontecimientos históricos que han influido en el
desarrollo de la investigación en enfermería.

TABLA 1.2
ACONTECIMIENTOS HISTÓRICOS QUE INFLUYERON EN
EL DESARROLLO DE LA INVESTIGACIÓN EN ENFERMERÍA

38
Florence Nightingale
Nightingale (1859) es reconocida como la primera investigadora en
enfermería y sus primeros estudios se centraron en la importancia
de un entorno saludable para fomentar el bienestar físico y mental
de los pacientes. Estudió la ventilación, la limpieza, la pureza del
agua y la dieta para determinar su influencia en la salud de los
pacientes (Herbert, 1981). Nightingale también fue conocida por su
recogida de datos y análisis estadísticos, sobre todo durante la
guerra de Crimea. Estudió las tasas de morbilidad y de mortalidad

39
de los soldados y los factores que influían en ellas, y presentó sus
resultados en tablas y gráficos circulares. Fue la primera mujer
elegida para la Royal Statistical Society por sus investigaciones y
conocimientos estadísticos (Oakley, 2010).
La investigación de Nightingale le permitió promover cambios de
actitud, organizativos y sociales. Modificó las actitudes militares y
sociales sobre el cuidado de los enfermos. El ejército comenzó a
considerar que los enfermos tenían derecho a disfrutar de una
alimentación saludable y disponer de cuarteles y tratamientos
médicos adecuados, lo que redujo en gran medida la mortalidad
(Cook, 1913). Debido a la evidencia e influencia de la investigación
de Nightingale, la sociedad comenzó a aceptar la necesidad de
tratar el agua pública, mejorar el saneamiento, prevenir la
hambruna y disminuir la morbilidad y mortalidad (Palmer, 1977).

Investigación en enfermería de 1900 a la


década de 1970
El American Journal of Nursing fue publicado por primera vez en
1900 y, a finales de la década de 1920, comenzaron a aparecer en
esta revista los primeros estudios de casos clínicos. Un estudio de
caso es un análisis a fondo y descripción sistemática de un paciente
o un grupo de pacientes similares con el fin de promover el
conocimiento de las intervenciones, problemas y/o situaciones de
enfermería. Los estudios de caso son un ejemplo de la investigación
relacionada con la práctica que se ha realizado en enfermería
durante el último siglo.
Las oportunidades formativas en enfermería se incrementaron
hasta una categoría de grado. El Teachers College en la Columbia
University ofreció el primer programa académico de doctorado
para el personal de enfermería en 1923 y la Yale University instauró
el primer máster en Enfermería en 1929. En 1950, la American
Nurses Association (ANA) puso en marcha un estudio de 5 años
acerca de las funciones y actividades del personal de enfermería. En
1959 los resultados de este estudio se utilizaron para desarrollar
declaraciones de funciones, estándares y cualificaciones de los
profesionales de enfermería. Durante esta época, la investigación
clínica empezó a crecer a medida que los grupos de enfermería

40
especializada, como salud comunitaria, salud mental y psiquiátrica,
médico-quirúrgica, pediatría y obstetricia, desarrollaron estándares
de cuidados. La investigación llevada a cabo por la ANA y los
grupos de especialistas sirvió de base para crear los estándares de la
práctica enfermera que actualmente guían la práctica profesional
(Gortner y Nahm, 1977).
Durante las décadas de 1950 y 1960, las escuelas de enfermería
comenzaron a introducir la investigación y las fases del proceso de
investigación a nivel de grado y máster (MSN, Master of Science in
Nursing), proporcionando las bases para la realización de pequeños
estudios de replicación. En 1953, se creó el Institute for Research
and Service in Nursing Education en el Teachers College de la
Columbia University, que comenzó a proporcionar experiencias de
aprendizaje de investigación para estudiantes de doctorado
(Gortner y Nahm, 1977). El aumento de las actividades de
investigación llevó a la publicación de la primera revista de
investigación, Nursing Research, en 1952, que sigue siendo una de
las revistas de investigación más sólidas en la actualidad. En 1955,
se creó la American Nurses Foundation para financiar los proyectos
de investigación en enfermería. En 1957, se crearon el Southern
Regional Educational Board, la Western Interstate Commission on
Higher Education, la Midwestern Nursing Research Society y el
New England Board of Higher Education, que tienen un papel
importante en la actualidad para apoyar y difundir la investigación
en enfermería en Estados Unidos.
En la década de 1960, un gran número de estudios clínicos se
centraron en la calidad de la asistencia y en el desarrollo de los
criterios para medir los resultados del paciente. Se crearon
unidades de cuidados intensivos que promovieron la investigación
de las intervenciones de enfermería, los patrones de dotación de
personal y la rentabilidad de los cuidados (Gortner y Nahm, 1977).
En 1963, se publicó otra revista de investigación, el International
Journal of Nursing Studies. En 1965, la ANA patrocinó el primero de
una serie de congresos de investigación en enfermería para facilitar
la comunicación de los resultados de investigación, así como su
implementación en la práctica clínica.
A finales de la década de 1960 y principios de la de 1970, el
personal de enfermería desarrolló los modelos, los marcos

41
conceptuales y las teorías que servirían de guía en la práctica
enfermera. Estos teóricos de la enfermería elaboraron propuestas
que requirieron ponerlas a prueba, lo que sirvió de orientación para
la investigación en enfermería. En 1978, Chinn se convirtió en el
editor de una nueva revista, Advances in Nursing Science, que
publicó los trabajos de los teóricos de la enfermería y la
investigación relacionada. En 1970, se creó la ANA Commission on
Nursing Research para incrementar la realización de
investigaciones. Este organismo influyó en el desarrollo de guías
federales para la investigación con seres humanos y financió
programas de investigación nacionales e internacionales (See, 1977).
La comunicación de los resultados de la investigación a
profesionales de enfermería clínica fue una cuestión primordial en
la década de 1970. Sigma Theta Tau Internacional, la prestigiosa
sociedad internacional de enfermería, financió conferencias de
investigación a nivel nacional e internacional y diversas
delegaciones de esta organización financiaron numerosas
conferencias locales para comunicar los resultados de las
investigaciones. Esta organización y sus delegaciones aún tienen un
papel muy activo a la hora de facilitar, financiar y comunicar
investigaciones. En 1976, Stetler y Marram desarrollaron el primer
modelo de enfermería para fomentar la implementación de
resultados de investigación en la práctica. La revista Research in
Nursing & Health se publicó por primera vez en 1978 y el Western
Journal of Nursing Research en 1979, para aumentar la comunicación
de las investigaciones.
A finales de la década de 1970, el profesor Archie Cochrane creó
el concepto de PBE y abogó por la prestación de una asistencia
sanitaria basada en la investigación para mejorar su calidad. Para
facilitar la utilización de la evidencia de la investigación en la
práctica, en 1992 se creó el Cochrane Center y en 1993, la Cochrane
Collaboration. La Cochrane Collaboration and Library alberga
numerosos recursos para promover la PBE, como revisiones
sistemáticas de investigación y guías basadas en la evidencia para
su implementación en la práctica (v. Cochrane Collaboration,
http://www.cochrane.org).
En la década de 1970, el proceso de enfermería fue el foco de
atención de numerosos estudios, con investigaciones de técnicas de

42
evaluación, clasificación de diagnósticos de enfermería, métodos
para la obtención de resultados e intervenciones de enfermería
específicas. La primera Nursing Diagnosis Conference, celebrada en
1973, se convirtió en la North American Nursing Diagnosis
Association (NANDA). En 2002, la NANDA se expandió a nivel
internacional, convirtiéndose en la NANDA-I, que apoya
actividades de investigación orientadas a la identificación de
diagnósticos adecuados de enfermería y al desarrollo de un proceso
de diagnóstico eficaz. La revista de la NANDA, Nursing Diagnosis,
se publicó en 1990 y más tarde pasó a llamarse International Journal
of Nursing Terminologies and Classifications. Se puede encontrar más
información sobre la NANDA-I en su página web
(http://www.nanda.org).

Investigación en enfermería en las décadas


de 1980 y 1990
La realización de investigación clínica fue el tema central de la
década de 1980, por lo que en las revistas clínicas se empezaron a
publicar más estudios sobre ello. En 1987, se publicó una nueva
revista de investigación, Scholarly Inquiry for Nursing Practice, y dos
más en 1988, Applied Nursing Research y Nursing Science Quarterly.
Aunque el cuerpo de los conocimientos empíricos generados
mediante investigación clínica aumentó rápidamente en la década
de 1980, solo una pequeña parte de este conocimiento se utilizó en
la práctica. En 1982 y 1983, los estudios de un proyecto financiado
por el gobierno federal, Conduct and Utilization of Research in
Nursing, se publicaron para facilitar el uso de la investigación con el
fin de mejorar la práctica (Horsley, Crane, Crabtree y Wood, 1983).
En 1983, se publicó el primer volumen de la revista Annual Review
of Nursing Research (Werley y Fitzpatrick, 1983). Estos volúmenes
incluían revisiones de la investigación realizadas por expertos y
clasificadas en cuatro áreas: práctica enfermera, administración de
cuidados de enfermería, formación del personal de enfermería y la
profesión de enfermería. Actualmente sigue publicándose la Annual
Review of Nursing Research, en la que profesionales de enfermería
expertos ofrecen resúmenes de investigación en sus áreas de
especialización. Estos resúmenes del conocimiento actual en

43
investigación fomentan la implementación de los resultados de la
investigación en la práctica y marcan la dirección para próximas
investigaciones. Este incremento de los estudios de enfermería
clínica dio lugar a la publicación en 1992 de Clinical Nursing
Research.
La investigación cualitativa se introdujo en enfermería a finales
de la década de 1970; los primeros estudios aparecieron en revistas
de enfermería en la década de 1980. La investigación cualitativa
analizó la naturaleza holística de las personas y de los fenómenos,
con el descubrimiento de significado y la obtención de nuevas
perspectivas sobre cuestiones relevantes para la enfermería. El
número de investigadores y estudios cualitativos creció
enormemente en la década de 1990, con la publicación de estudios
cualitativos en la mayoría de las revistas clínicas y de investigación
en enfermería. En 1994, se publicó por primera vez una revista
centrada en la difusión de la investigación cualitativa, Qualitative
Health Research.
Otra de las prioridades de la década de 1980 fue obtener más
financiación para la investigación en enfermería. La mayoría de los
presupuestos federales en esa década fueron destinados a estudios
médicos sobre el diagnóstico y el tratamiento de enfermedades. Sin
embargo, la ANA logró una importante victoria política para la
investigación en enfermería con la creación del National Center for
Nursing Research (NCNR) en 1985. El objetivo de este centro era
apoyar el desarrollo y la difusión del conocimiento desarrollado a
través de la investigación básica y clínica en enfermería, la
formación y otros programas de investigación sobre el cuidado del
paciente (Bauknecht, 1985). El NCNR se convirtió en el National
Institute of Nursing Research (NINR) en 1993 para incrementar el
estatus de la investigación en enfermería y obtener más financiación
para los estudios.
La investigación de resultados surgió a finales de las décadas de
1980 y 1990 como una metodología importante para documentar la
eficacia de los servicios sanitarios. Esta investigación de la eficacia
se desarrolló a partir del control de calidad y de las funciones para
garantizar la calidad que surgieron con las organizaciones de
revisión de los estándares profesionales en 1972. En 1989 se creó la
Agency for Healthcare Policy and Research (AHCPR) para facilitar

44
la realización de investigación de resultados (Rettig, 1991). La
AHCPR también tuvo un papel activo en la comunicación de
resultados de investigación a los profesionales sanitarios y se
encargó de publicar las primeras guías de práctica clínica. Dichas
guías incluyen una síntesis de la mejor evidencia de la
investigación, con directivas para la práctica de enfermería y
médica desarrolladas por expertos en cuidados sanitarios de
diferentes áreas. La Healthcare Research and Quality Act de 1999
reautorizó a la AHCPR, cambiando su nombre por el de Agency for
Healthcare Research and Quality (AHRQ). Este cambio de nombre
significativo situó a la AHRQ como colaborador científico tanto con
el sector público como con el privado para mejorar la calidad y la
seguridad de la asistencia al paciente.
Basándose en el proceso de utilización de la investigación,
médicos, profesionales de enfermería y otros profesionales de la
salud se centraron en el desarrollo de la PBE para la asistencia
sanitaria durante la década de 1990. Un grupo de investigación
dirigido por el Dr. David Sackett desarrolló metodologías de
investigación explícitas para determinar la «mejor evidencia» para
la práctica. David Eddy utilizó por primera vez el término basado en
la evidencia en 1990, con el fin de promover la PBE en medicina
(Straus y cols., 2011). La PBE aumentó su importancia en enfermería
cuando el American Nurses Credentialing Center implementó el
Magnet Hospital Designation Program for Excellence in Nursing
Services. La designación de un hospital con el estatus Magnet
garantiza que los profesionales de enfermería participan en
actividades de investigación y de provisión de asistencia basada en
la evidencia a los pacientes. El énfasis en la PBE animó a los
profesionales de enfermería a realizar más ensayos controlados
aleatorizados (ECA) y estudios cuasiexperimentales para evaluar la
eficacia de las intervenciones de enfermería.

Investigación en enfermería en el siglo XXI


El objetivo de la investigación en enfermería en el siglo XXI incluye
la realización de estudios de calidad utilizando diferentes
metodologías, resumir los hallazgos de estudios en la mejor
evidencia de la investigación y utilizar esta evidencia para su

45
implementación en la práctica (Brown, 2018; Melnyk y Fineout-
Overholt, 2015; Melnyk y cols., 2017). En 2002, la Joint Commission,
responsable de la homologación de instituciones sanitarias, revisó
las políticas de homologación para los hospitales con objeto de
apoyar la implementación de una asistencia sanitaria basada en la
evidencia (The Joint Commission, 2017). Con el fin de expandir la
PBE en centros clínicos, Stetler (2001) revisó el modelo denominado
«Research Utilization to Facilitate EBP» (v. una descripción de este
modelo en el cap. 13). El interés por la PBE en enfermería se vio
respaldado con la publicación de la revista Worldviews on Evidence-
Based Nursing en 2004.
La American Association of Colleges of Nursing (AACN, 2006)
presentó su declaración de principios sobre la investigación en
enfermería para proporcionar direcciones de futuro a la disciplina.
Para asegurar una investigación eficaz en enfermería, la disciplina
debe:

1. Crear una cultura de investigación.


2. Ofrecer programas educativos de alta calidad (p. ej.,
licenciatura, máster, doctorado centrado en la práctica,
doctorado centrado en la investigación y posdoctorado)
para preparar un grupo consolidado de investigadores en
enfermería.
3. Desarrollar una infraestructura de investigación sólida.
4. Obtener financiación suficiente para la investigación básica.

El foco de atención por la investigación y la financiación sanitaria


se ha extendido más allá del tratamiento de las enfermedades para
incluir intervenciones de promoción de la salud y prevención de
enfermedades. Los documentos Healthy People 2000 y Healthy People
2010 han aumentado la visibilidad de los objetivos y la
investigación en intervenciones de fomento de la salud. Los temas y
objetivos de Healthy People 2020 se pueden revisar en la página web
del Department of Health and Human Services estadounidense
(2017). Algunos de los temas incluidos son la salud de los
adolescentes, las enfermedades hematológicas y la seguridad de las
transfusiones, las demencias (incluida la enfermedad de
Alzheimer), las fases inicial e intermedia de la infancia, la

46
genómica, la salud mundial, las infecciones asociadas a la asistencia
sanitaria, la salud de lesbianas, homosexuales, bisexuales y
transexuales, los ancianos, la preparación para emergencias en
momentos de catástrofes, la salud del sueño y los determinantes
sociales de la salud. En la próxima década, los investigadores en
enfermería tendrán un papel importante en el desarrollo de
intervenciones para el fomento de la salud y la prevención de las
enfermedades en individuos y familias.
La AHRQ (2017) fue creada como la institución líder en el apoyo
de la investigación dirigida a mejorar la calidad de la asistencia
sanitaria, reducir sus costes, mejorar la seguridad del paciente,
disminuir los errores médicos e incrementar el acceso a los servicios
básicos. La AHRQ realiza y financia investigaciones que
proporcionan información basada en la evidencia sobre resultados,
calidad, coste, uso y acceso de la asistencia sanitaria. Esta
información es necesaria para fomentar una toma de decisiones
eficaz sobre la asistencia sanitaria por parte de los pacientes,
médicos, directivos del sistema sanitario y responsables políticos.
La misión actual del NINR (National Institute of Nursing
Research, 2017) es «promover y mejorar la salud de los individuos,
familias, comunidades y poblaciones. El NINR apoya y lleva a cabo
una investigación clínica y básica, así como una enseñanza de
investigación sobre la salud y la enfermedad a lo largo de la vida,
con el fin de desarrollar una base científica para la práctica clínica,
prevenir la enfermedad y la discapacidad, tratar y eliminar los
síntomas causados por la enfermedad, y mejorar los cuidados
paliativos y del final de la vida». El NINR ha tratado de aumentar
los presupuestos para la investigación en enfermería y está
fomentando el uso de varias metodologías con el fin de generar
conocimientos básicos para la práctica enfermera. La página web
del NINR (2013) (http://ninr.nih.gov) proporciona la información
más actualizada sobre las posibilidades de financiación de la
investigación del instituto y los estudios que respalda. El plan
estratégico del NINR se actualizó en 2016 y está disponible en su
página web.

Relación entre la educación en calidad y seguridad


para las competencias de enfermería y la investigación

47
en enfermería
En 2001, el IOM publicó un informe que subrayaba la importancia
de la calidad y la seguridad en la prestación de la asistencia
sanitaria. Basándose en este informe, se identificaron seis áreas de
competencia esenciales en la formación del personal de enfermería
para asegurar que los estudiantes fueran capaces de ofrecer
cuidados de calidad y seguros. Dichas áreas de competencias
fueron: la asistencia centrada en el paciente, el trabajo en equipo y
la colaboración, la PBE, la mejora de la calidad, la seguridad y la
informática. La iniciativa Quality and Safety Education for Nurses
(QSEN) identificó los conocimientos, habilidades y actitudes
requeridas en cada una de las competencias para la formación de
grado y posgrado.
La página web del QSEN Institute (http://qsen.org) ofrece
estrategias y recursos didácticos para facilitar la adquisición de las
competencias QSEN en los programas educativos de enfermería.
Las competencias más actuales dirigidas a los programas
educativos de los futuros graduados pueden encontrarse en la
página web http://qsen.org/competencies/pre-licensure-ksas/
(QSEN, 2017; Sherwood y Barnsteiner, 2017). La competencia de la
PBE se define como «la integración de la mejor evidencia actual con
la experiencia clínica y las preferencias y valores del
paciente/familia para proporcionar una asistencia sanitaria óptima»
(QSEN, 2017). Los estudiantes de enfermería tienen que dominar la
valoración crítica de los estudios, el uso de la evidencia de
investigación apropiada en la práctica, el cumplimiento de las guías
del comité de revisión institucional y la recogida de datos
apropiada. Cada facultad implementará estrategias para mejorar las
experiencias y los resultados de aprendizaje de los estudiantes
basados en estas competencias QSEN (Barnsteiner y cols., 2013). Se
requiere un mayor conocimiento de la investigación para alcanzar
las competencias en PBE y QSEN.

ADQUISICIÓN DE CONOCIMIENTOS
DE ENFERMERÍA
El conocimiento es la información esencial que se adquiere de

48
diversas formas y de la que se espera que sea un fiel reflejo de la
realidad; se utiliza para guiar las acciones de una persona (Kaplan,
1964). Durante la formación en enfermería, los estudiantes
adquirirán un gran volumen de conocimientos teóricos y prácticos.
Se aprende a sintetizar, incorporar y aplicar este conocimiento para
poder ejercer la profesión. En enfermería, los conocimientos se han
adquirido históricamente mediante tradiciones, autoridad,
préstamo, ensayo y error, experiencia personal, modelado de roles,
intuición y razonamiento. En esta sección se presentan estas
diferentes formas de adquirir conocimientos y su relación con el
conocimiento o la evidencia procedente de la investigación.

Tradiciones
Las tradiciones incluyen «verdades» o creencias basadas en
costumbres y tendencias. Las tradiciones de enfermería del pasado
se han transferido al presente mediante modelado de roles y por
comunicación escrita y oral. Las tradiciones siguen influyendo en la
práctica enfermera actualmente. Por ejemplo, algunos manuales de
normas y procedimientos en hospitales contienen ideas
tradicionales. Las tradiciones pueden influir positivamente en la
práctica enfermera, ya que se desarrollaron a partir de las
experiencias eficaces del pasado. Sin embargo, las tradiciones
también pueden reducir y limitar el conocimiento para la práctica
enfermera. Por ejemplo, las unidades de enfermería suelen
organizarse y funcionar según reglas o tradiciones preestablecidas
que pueden ser inefectivas e ineficaces. A menudo, estas tradiciones
no se cuestionan ni se cambian debido a que han existido durante
años y con frecuencia son respaldadas por personas con poder y
autoridad. El cuerpo de conocimiento de la enfermería debe basarse
más en la investigación que en las tradiciones si sus profesionales
quieren tener un gran impacto en los resultados del paciente.

Autoridad
Una autoridad es una persona con experiencia y poder capaz de
influir en la opinión y el comportamiento de otros. A alguien se le
otorga autoridad porque se considera que sabe más de un área
concreta que otras personas. El conocimiento adquirido por una

49
autoridad se muestra cuando una persona da crédito a otra como
fuente de información. Los profesionales de enfermería que
publican artículos y libros o desarrollan teorías con frecuencia se
consideran autoridades. Los estudiantes suelen ver a sus profesores
como autoridades y los expertos en enfermería clínica se consideran
autoridades en la práctica clínica. Los profesionales de enfermería
con autoridad deben ser cuidadosos para enseñar y ejercer su
práctica según la evidencia de la investigación, porque influyen en
las acciones de otras personas.

Préstamo
Algunos líderes de enfermería han afirmado que parte del
conocimiento en este campo proviene de información prestada de
disciplinas como la medicina, la sociología, la psicología, la
fisiología y la educación (McMurrey, 1982). El préstamo en
enfermería implica la aportación y el uso del conocimiento de otros
campos o disciplinas para guiar la práctica enfermera. La
enfermería ha recurrido al préstamo de dos formas. Durante años,
algunos profesionales de enfermería han obtenido información de
otras disciplinas y la han aplicado directamente a la práctica
enfermera. Esta información no se integró en el objetivo único de la
enfermería. Por ejemplo, algunos profesionales utilizaron el modelo
médico para orientar su práctica enfermera centrándose en el
diagnóstico y el tratamiento de la enfermedad. Este tipo de
préstamo continúa hoy en día cuando el personal de enfermería
utiliza los avances tecnológicos para especializarse y centrarse en la
detección y el tratamiento de la enfermedad. La segunda forma de
préstamo, más útil en enfermería, implica integrar la información
de otras disciplinas en los objetivos propios. Por ejemplo, los
profesionales de enfermería utilizan el conocimiento de otras
disciplinas, como la psicología y la sociología, como base para la
comunicación terapéutica y lo integran en la asistencia holística de
los pacientes y sus familias que sufren enfermedades agudas y
crónicas.

Ensayo y error
El ensayo y error es una estrategia con resultados desconocidos

50
utilizada en situaciones de incertidumbre cuando no hay otras
fuentes de conocimiento. Debido a que cada paciente responde de
forma única a una situación, la práctica de enfermería implica un
cierto grado de incertidumbre. Por tanto, los profesionales de
enfermería deben utilizar un cierto grado de ensayo y error al
proporcionar su asistencia a los pacientes basada en la evidencia de
investigación. El elemento desconocido corresponde a las
respuestas de los pacientes y familias individuales a las
intervenciones de enfermería específicas. Sin embargo, este enfoque
de ensayo y error con frecuencia implica la inexistencia de una
documentación formal de acciones eficaces e ineficaces de
enfermería. Con esta estrategia, el conocimiento se adquiere a partir
de la experiencia, pero a menudo no se comparte con otros, lo que
da lugar a que se sigan implementando algunas intervenciones
ineficaces.

Experiencia personal
La experiencia personal consiste en adquirir conocimientos por
implicación personal en un acontecimiento, situación o
circunstancia. Permite adquirir habilidades y experiencia al
proporcionar cuidados a los pacientes y sus familias en el ámbito
clínico. El aprendizaje que se obtiene a partir de la experiencia
personal permite agrupar ideas en un todo significativo. Por
ejemplo, se puede leer sobre la forma de administrar una inyección
i.m. o se puede escuchar en clase, pero no se sabrá cómo hacerlo
hasta que se observe a otros profesionales de enfermería poner
inyecciones a los pacientes y cuando se administren varias por uno
mismo.
La suma de experiencias personales afecta a la complejidad de la
base de conocimientos de un profesional de enfermería. Benner
(1984) llevó a cabo un estudio cualitativo fenomenológico para
identificar los niveles de experiencia en el desarrollo del
conocimiento y la experiencia clínicos para la práctica de
enfermería. Esta autora identificó las siguientes fases para adquirir
la experiencia: 1) principiante, 2) principiante avanzado, 3) hábil, 4)
competente y 5) experto.
Los profesionales de enfermería principiantes no tienen

51
experiencia personal en el trabajo que realizan, pero tienen algunas
ideas preconcebidas y expectativas sobre la práctica clínica que han
aprendido durante su formación. Estas ideas preconcebidas y
expectativas son desafiadas, mejoradas, confirmadas o refutadas
por la experiencia personal en un entorno clínico. El profesional de
enfermería principiante avanzado tiene suficiente experiencia para
reconocer e intervenir en situaciones recurrentes. Por ejemplo, el
principiante avanzado es capaz de reconocer e intervenir en el
tratamiento del dolor del paciente. Los profesionales de enfermería
hábiles son capaces de generar planes y alcanzar objetivos a largo
plazo debido a los años de experiencia personal. El profesional de
enfermería competente también puede utilizar su conocimiento
personal para realizar acciones conscientes y deliberadas que sean
eficientes y organizadas. Con una base de conocimientos más
compleja el profesional de enfermería competente considera al
paciente como un todo y como miembro de una familia y de la
comunidad. Reconoce que cada paciente y familia responde de
manera diferente a la enfermedad y la salud, y puede realizar
ajustes en función de estas respuestas. El profesional de enfermería
experto tiene una gran experiencia y puede intervenir con habilidad
en una situación. La experiencia personal aumenta la capacidad del
profesional de enfermería experto para reconocer una situación
intuitivamente, con exactitud y rapidez. Dicho de otro modo, estos
profesionales pueden integrar con habilidad y de forma fluida la
experiencia personal y la evidencia de la investigación en sus
respuestas a las circunstancias cambiantes de los pacientes.
La investigación fenomenológica cualitativa de Benner (1984) ha
proporcionado una mayor comprensión sobre el modo en el que el
conocimiento se adquiere a través de la experiencia personal. A
medida que se adquiere experiencia clínica durante la formación y
después de graduarse, se aprecia la evolución personal a través de
los diferentes niveles de experiencia y habilidad clínicas para usar
la evidencia de la investigación en la práctica.

Modelado de roles
Cuando se adquiere el conocimiento mediante modelado de roles,
se aprende por imitación de las conductas de un experto. En

52
enfermería, el modelado de roles permite al profesional
principiante aprender mediante la observación y la interacción con
profesionales de enfermería expertos y muy competentes. El
modelado de roles abarca a los profesores admirados, clínicos
expertos, investigadores o personas que inspiran a otros a través de
su ejemplo. Una forma clave en el modelado de roles es la tutoría,
en la que el profesional de enfermería experto ejerce de profesor,
mecenas, guía y consejero para el principiante. El conocimiento
adquirido a través de la experiencia personal mejora enormemente
con una relación de calidad con el modelo de rol o tutor. Muchos de
los nuevos graduados entran en programas de prácticas o de
residencia en centros clínicos, por lo que pueden ser tutorizados por
profesionales de enfermería expertos durante los primeros meses de
incorporación al mundo laboral. Durante las prácticas, los
profesionales expertos deben enseñar mediante modelado de roles
la práctica de enfermería basada en la evidencia.

Intuición
La intuición es una percepción o comprensión de una situación o
acontecimiento como un todo que, por lo general, una persona no
suele poder explicar lógicamente. Dado que la intuición es un tipo
de conocimiento que parece acontecer espontáneamente, los
profesionales de enfermería suelen describirla como un «instinto
visceral» o una «corazonada». Como la intuición no puede
explicarse científicamente con facilidad, muchas personas se sienten
incómodas con ella e incluso creen que no existe. Lo que no
comprenden es que la intuición no es la falta de conocimiento; más
bien, es un resultado de un conocimiento profundo (Benner, 1984).
Este conocimiento profundo se incorpora de un modo tan absoluto
en el subconsciente de las personas intuitivas que les resulta difícil
explicar qué saben y cómo lo saben, y expresarlo de una manera
lógica. Algunos profesionales de enfermería reconocen
intuitivamente el momento en que un paciente está sufriendo una
crisis de salud, como por ejemplo un ictus. Gracias a este
conocimiento intuitivo, estos profesionales pueden valorar el
problema del paciente, actuar y avisar al médico para que
intervenga si es necesario.

53
Razonamiento
El razonamiento es el procesamiento y la organización de ideas
para llegar a conclusiones. A través del razonamiento, las personas
son capaces de dar sentido a sus pensamientos, sus experiencias y a
la evidencia de la investigación (Gray, Grove y Sutherland, 2017).
Gracias a él, los profesionales de enfermería reconocen la necesidad
de más evidencia para realizar cambios en la práctica, lo que
proporciona orientación para investigaciones futuras.
El uso del pensamiento lógico permite exponer verbalmente un
argumento en el que cada parte está relacionada para llegar a una
conclusión lógica. La ciencia de la lógica incluye el razonamiento
inductivo y deductivo. El razonamiento inductivo va de lo
específico a lo general; se observan casos concretos y después se
combinan en un conjunto mayor o declaración general (Chinn y
Kramer, 2015). A continuación, se presenta un ejemplo de
razonamiento inductivo.
CASOS CONCRETOS
Una cefalea es un estado alterado de salud que resulta estresante.
Una enfermedad terminal es un estado alterado de salud que
resulta estresante.
DECLARACIÓN GENERAL
Por tanto, se puede inducir que todos los estados alterados de la
salud son estresantes. El razonamiento inductivo interviene en la
síntesis de los hallazgos de múltiples estudios para extraer
conclusiones sobre las mejores prácticas. Más adelante en este
capítulo se presentan modos formales en los que el razonamiento
inductivo se aplica para llevar a cabo una PBE.
El razonamiento deductivo va de lo general a lo específico o de
una premisa general a una situación particular o conclusión (Chinn
y Kramer, 2015). Una premisa general puede ser una proposición,
que es una declaración de una teoría que describe una relación
propuesta entre dos o más conceptos (v. cap. 7). A continuación se
presenta un ejemplo de razonamiento deductivo.
PROPOSICIONES
Todos los seres humanos experimentan pérdida.
Todos los adolescentes son seres humanos.
CONCLUSIÓN
Por tanto, puede deducirse que todos los adolescentes

54
experimentan pérdida.
En este ejemplo se utiliza el razonamiento deductivo para pasar
de las dos proposiciones generales sobre los seres humanos y los
adolescentes a la conclusión de que «todos los adolescentes
experimentan pérdida». Sin embargo, las conclusiones obtenidas a
partir de un razonamiento deductivo solo son válidas si se basan en
proposiciones válidas. La investigación es un medio para evaluar y
confirmar o refutar una proposición de modo que las premisas
válidas puedan ser utilizadas como base para el razonamiento en la
práctica enfermera.

ADQUISICIÓN DE CONOCIMIENTOS A
TRAVÉS DE LA INVESTIGACIÓN EN
ENFERMERÍA
El conocimiento de investigación necesario para la práctica es
específico y holístico, así como orientado hacia el proceso y
centrado en los resultados. Por tanto, se necesitan diferentes
métodos de investigación para obtener este conocimiento. En esta
sección se presentan los métodos de investigación cuantitativa,
cualitativa, de métodos mixtos y de resultados que suelen utilizarse
con el fin de generar conocimiento empírico para la práctica
enfermera (cuadro 1.1). Estos métodos de investigación son
esenciales con el fin de generar evidencia de investigación para los
siguientes objetivos de la profesión de enfermería (AACN, 2017;
NINR, 2016):

CUADRO 1.1 CLASIFICACIÓN DE LOS


MÉTODOS DE INVESTIGACIÓN
PRESENTADOS EN ESTE LIBRO
Tipos de investigación cuantitativa
Investigación descriptiva.
Investigación de correlación.
Investigación cuasiexperimental.
Investigación experimental.

55
Tipos de investigación cualitativa
Investigación fenomenológica.
Investigación teórica fundamentada.
Investigación etnográfica.
Investigación cualitativa exploratoria-descriptiva.
Investigación de métodos mixtos
Investigación de resultados

• Promover la comprensión de las experiencias de pacientes y


sus familias con la salud y la enfermedad (un objetivo
común de la investigación cualitativa).
• Evaluar la eficacia de las intervenciones de enfermería a la
hora de promover la salud de las personas y las familias (un
objetivo común de la investigación cuantitativa).
• Combinar métodos cuantitativos y cualitativos para
comprender mejor los problemas de salud, las conductas y
situaciones con un alto grado de complejidad (un objetivo
común de la investigación de métodos mixtos).
• Evaluar los resultados de la asistencia para determinar la
calidad, seguridad y rentabilidad dentro de la asistencia de
enfermería en el sistema sanitario (un objetivo común de la
investigación de resultados).

Introducción a la investigación cuantitativa y


cualitativa
Los métodos de investigación cuantitativa y cualitativa se
complementan entre sí porque generan diferentes tipos de
conocimiento que son útiles en la práctica enfermera. Familiarizarse
con ambos tipos de investigación ayuda a identificar, comprender y
valorar críticamente estos estudios. Las metodologías en estos dos
tipos de investigación tienen algunas similitudes: en ambas se
requiere experiencia como investigador, rigor al realizar los
estudios y que se genere un conocimiento científico para la práctica
enfermera. En la tabla 1.3 se presentan algunas de las diferencias
entre ambas metodologías.

56
TABLA 1.3
CARACTERÍSTICAS DE LOS MÉTODOS DE
INVESTIGACIÓN CUANTITATIVOS Y CUALITATIVOS

INVESTIGACIÓN INVESTIGACIÓN
CARACTERÍSTICA
CUANTITATIVA CUALITATIVA
Origen filosófico Positivismo lógico Naturalista, interpretativa,
humanística
Fundamento del Relación causa y efecto Significado, descubrimiento,
conocimiento comprensión
Enfoque teórico Teoría de las pruebas Desarrollo de teorías y marcos
de la investigación
Implicación del Objetivo Interpretación compartida
investigador
Métodos habituales Escalas, cuestionarios y Entrevistas no estructuradas,
de medición mediciones fisiológicas observaciones, grupos focales
Datos Números Palabras
Análisis Análisis estadístico Análisis basado en textos
Hallazgos Variables descriptivas, Únicos, dinámicos, centrados
relaciones entre variables y en la comprensión de los
eficacia de las fenómenos y la facilitación del
intervenciones; desarrollo de teorías
generalización

La mayoría de los estudios realizados en enfermería han incluido


métodos de investigación cuantitativa, que se considera el método
científico tradicional. La investigación cuantitativa es un proceso
formal, objetivo y sistemático en el que se utilizan datos numéricos
para obtener información sobre el mundo. El enfoque cuantitativo
de la investigación científica surgió de una rama de la filosofía
denominada positivismo lógico, que actúa según las estrictas reglas
de la lógica, la verdad, las leyes y las predicciones. Los
investigadores cuantitativos sostienen que la «verdad» es absoluta
y que cualquier realidad es susceptible de ser definida con una
medición cuidadosa. Para encontrar la verdad, el investigador debe
ser objetivo, lo que significa que ni los valores ni los sentimientos ni
las percepciones personales deberían influir en la medición de la
realidad. La investigación cuantitativa se centra en probar teorías
describiendo variables (investigación descriptiva), evaluando las
relaciones entre las variables (investigación de correlación) y
determinando la causa y el efecto de las interacciones entre

57
variables (investigación cuasiexperimental y experimental; Shadish,
Cook y Campbell, 2002). Los métodos de medición utilizados
habitualmente en la investigación cuantitativa incluyen escalas,
cuestionarios y mediciones fisiológicas (v. tabla 1.3). Los datos
recopilados son números que se analizan con técnicas estadísticas
para determinar los resultados (Grove y Cipher, 2017). Los
investigadores tratan de extender sus hallazgos más allá de la
situación estudiada. Cuando se realizan investigaciones exhaustivas
en un área, los hallazgos podrían generalizarse a poblaciones y
entornos distintos. En el capítulo 2 se describen los tipos y el
proceso de investigación cuantitativa.
La investigación cualitativa es un enfoque subjetivo y
sistemático utilizado para describir las experiencias y situaciones
vitales y darles un significado (Creswell y Poth, 2018). La base
filosófica de la investigación cualitativa es interpretativa, humanista
y naturalista, y se ocupa de la comprensión del significado de las
interacciones sociales y las interpretaciones compartidas de los
sujetos implicados (v. tabla 1.3). Los investigadores cualitativos
creen que la verdad es compleja y dinámica, y solo puede
estudiarse observando a las personas mientras actúan con y en sus
ámbitos sociohistóricos (Creswell, 2014). Como las emociones
humanas son difíciles de cuantificar (es decir, asignarles un valor
numérico), la investigación cualitativa parece ser un método más
eficaz de investigar las respuestas emocionales y las experiencias
personales que la investigación cuantitativa. Los datos de la
investigación cualitativa adoptan la forma de palabras, que se
recogen mediante entrevistas, observaciones y grupos focales, y se
analizan para determinar su significado. Los hallazgos de la
investigación cualitativa son únicos, dinámicos, centrados en la
comprensión y facilitan el desarrollo de teorías. Son varios los tipos
de estudios cualitativos que se realizan y que generan resultados.
En el capítulo 3 se describen los tipos de investigación cualitativa
que se exponen en este libro.

Tipos de investigación cuantitativa y cualitativa


Se han realizado varios tipos de investigación cuantitativa y
cualitativa con el fin de generar conocimientos de enfermería para
la práctica. Estos tipos de investigación se pueden clasificar de

58
diferentes formas. El sistema de clasificación de este libro se
presenta en el cuadro 1.1 e incluye los tipos más frecuentes de
investigación cuantitativa y cualitativa realizados en enfermería.
Los métodos de investigación cuantitativa se dividen en cuatro
categorías: descriptiva, de correlación, cuasiexperimental y
experimental (Gray y cols., 2017; Shadish y cols., 2002).

• La investigación descriptiva explora nuevas áreas de


investigación y describe situaciones que existen en el
mundo.
• La investigación de correlación evalúa relaciones y se lleva a
cabo para desarrollar y mejorar el conocimiento explicativo
para la práctica enfermera.
• Los estudios cuasiexperimentales y experimentales
determinan la eficacia de las intervenciones de enfermería
en la predicción y el control de los resultados deseados para
los pacientes y sus familias.

Los métodos de investigación cualitativa incluidos en este libro


son fenomenológicos, teórica fundamentada, investigación
etnográfica y descriptivos exploratorios (v. cuadro 1.1).

• La investigación fenomenológica es un método holístico


inductivo utilizado para describir una experiencia vivida
por las personas, como la experiencia vivida de perder un
hijo.
• La investigación de teoría fundamentada es una técnica de
investigación inductiva utilizada para formular, probar y
mejorar una teoría sobre un fenómeno concreto (Charmaz,
2014). Fue desarrollada inicialmente por Glaser y Strauss
(1967) y se utilizó para formular una teoría sobre el proceso
del duelo.
• La investigación etnográfica fue desarrollada por la
disciplina de la antropología para investigar culturas a
través de un estudio profundo de los miembros de dichas
culturas. Las prácticas de salud varían entre culturas y estas
prácticas deben reconocerse al prestar cuidados a pacientes
y familias (Creswell y Poth, 2018; Marshall y Rossman,

59
2016).
• La investigación cualitativa exploratoria descriptiva se
realiza para afrontar un tema o problema que requiera una
solución y/o comprensión. Los profesionales de enfermería
dedicados a la investigación cualitativa utilizan esta
metodología para analizar un problema utilizando diversas
técnicas cualitativas, con la intención de describir el tema de
interés y facilitar su comprensión.

Introducción a la investigación de métodos


mixtos
La investigación de métodos mixtos es un enfoque investigador
que combina los métodos cuantitativos y cualitativos de
investigación en un único estudio. El objetivo y las preguntas de la
investigación se plantean para abordar los elementos tanto
cuantitativos como cualitativos del estudio. Los investigadores
podrían centrarse más en el método de investigación cuantitativo o
cualitativo, dependiendo del objetivo de su estudio. Los estudios de
métodos mixtos suelen implicar la recogida de datos tanto
cualitativos como cuantitativos y el análisis de ambas formas de
datos (Creswell, 2014). Los datos se analizan y se integran según lo
determine el diseño del estudio. En ocasiones, los métodos
cuantitativo y cualitativo de investigación se aplican de forma
simultánea o consecutiva, dependiendo del conocimiento que se va
a generar. Por ejemplo, los investigadores podrían evaluar la
eficacia de una intervención utilizando un diseño cuasiexperimental
y realizar a continuación una investigación cualitativa para tratar
de comprender las percepciones de los pacientes sobre la
intervención. Las distintas estrategias para combinar los métodos
cualitativo y cuantitativo de investigación en los estudios de
métodos mixtos se describen en el capítulo 14.

Introducción a la investigación de resultados


El aumento del coste de la asistencia sanitaria ha generado muchas
preguntas sobre la calidad, seguridad y eficacia de los servicios
sanitarios y los resultados de los pacientes relacionados con dichos

60
servicios. Los usuarios quieren saber cuáles son los servicios que
están utilizando y si estos mejorarán su salud. Los responsables de
las políticas sanitarias quieren saber si la asistencia es rentable y de
alta calidad. Estas preocupaciones han dado origen al desarrollo de
la investigación de resultados, que se centra en la evaluación de los
resultados de la asistencia y la determinación de los cambios en el
estado de salud del paciente y la familia. Algunas de las áreas
fundamentales que requieren ser estudiadas mediante investigación
de resultados son las siguientes: 1) respuestas del paciente a las
intervenciones de enfermería y médicas, 2) mantenimiento o
mejoría de la función física, mental y social del paciente, 3)
resultados económicos obtenidos con la prestación de servicios
sanitarios y 4) satisfacción del paciente con los resultados sanitarios,
la asistencia recibida y los profesionales de la salud.
Los profesionales de enfermería tienen un papel activo en la
identificación de resultados sensibles a enfermería y en la
realización de estudios de resultados. «Un resultado sensible a
enfermería es un estado, comportamiento o percepción de una
persona, familia o comunidad que se mide a lo largo de un
continuum en respuesta a una(s) intervención(es) de enfermería»
(Moorhead y cols., 2013, pág. 2). La Clasificación de Resultados de
Enfermería (NOC, Nursing Outcomes Classification) se desarrolló
para estandarizar la terminología de los resultados sensibles a
enfermería y se debe utilizar en las diversas especialidades de
enfermería y en varios entornos de práctica para captar los cambios
en el estado de un paciente después de una intervención. La NOC
contiene 490 resultados que se han desarrollado en los últimos 20
años (Moorhead y cols., 2013). Algunos de los resultados son
participación en el ejercicio, autocontrol: asma, y conocimiento:
control del peso. La investigación de resultados en enfermería
determina la calidad, seguridad y rentabilidad de la asistencia de
enfermería y proporciona una base para mejorar dicha asistencia en
el futuro. La investigación de resultados se describe en el capítulo
14. Los distintos tipos de métodos de investigación (v. cuadro 1.1)
proporcionan información importante para las enfermeras a la hora
de implementar una PBE.

61
OBJETIVOS DE LA INVESTIGACIÓN
PARA IMPLEMENTAR UNA
PRÁCTICA DE ENFERMERÍA
BASADA EN LA EVIDENCIA
Los profesionales de enfermería necesitan una base sólida para
implementar intervenciones de enfermería seleccionadas y
documentar su eficacia a la hora de tratar problemas de salud
específicos de los pacientes. Las intervenciones eficaces favorecen
unos resultados positivos en estos y sus familias. La evidencia de la
investigación necesaria en la práctica clínica incluye estudios
centrados en la descripción, la explicación, la predicción y el control
de fenómenos.

Descripción
La descripción implica identificar y comprender la naturaleza de
los fenómenos de enfermería y, en ocasiones, las relaciones entre
ellos (Chinn y Kramer, 2015). Mediante la investigación, los
profesionales de enfermería describen lo que existe en la práctica
enfermera y descubren nueva información. La investigación
descriptiva también se usa para promover la comprensión de las
situaciones y clasificar la información que se va a utilizar en la
disciplina. Algunos ejemplos de evidencia de la investigación
clínicamente importante que se ha desarrollado a partir de la
investigación centrada en la descripción son:

• Identificación del fenómeno de la esperanza y sus


dimensiones o características.
• Identificación y clasificación de los diagnósticos de
enfermería.
• Descripción de las respuestas de los individuos a diversos
estados de salud y al envejecimiento.
• Determinación de la incidencia de una enfermedad a nivel
local (p. ej., la incidencia del virus del Nilo Occidental en
Dallas, Texas), nacional e internacional (p. ej., el virus Zika
en Estados Unidos y otros países).

62
Un ejemplo de investigación realizada con un objetivo
descriptivo fue un estudio cualitativo llevado a cabo por Koehn,
Ebright y Draucker (2016, pág. 567) «para evaluar los procesos de
toma de decisiones de los profesionales de enfermería sobre la
notificación de errores». Los autores observaron que:
«Cometer un error es un proceso dinámico complejo ubicado a
menudo en el contexto de un entorno laboral muy estresante. La
respuesta más destacada de los profesionales de enfermería al
cometer un error era aprender de dicho error para no volver a
cometerlo. Cometer un error suele ser una experiencia muy
angustiante para estos profesionales, y la falta de seguimiento y
apoyo institucional agrava esta angustia» (Koehn y cols., 2016, pág.
572).
Koehn y cols. (2016) proporcionaron una descripción dinámica
única de las experiencias de los profesionales de enfermería tras
cometer un error médico. Estos autores recomendaban que los
estudios futuros se centrasen en el desarrollo de estrategias para
facilitar la notificación de errores y la mejora del aprendizaje y el
afrontamiento de los profesionales de enfermería después de un
error. La investigación centrada en la identificación y descripción es
una base fundamental para llevar a cabo otros estudios que
ofrezcan explicaciones, predicciones y control de los fenómenos de
enfermería en la práctica.

Explicación
Una explicación aclara las relaciones entre fenómenos e identifica
los posibles motivos por los que tienen lugar ciertos
acontecimientos. La investigación centrada en la explicación ofrece
los siguientes tipos de evidencia fundamentales para la práctica:

• Comprensión de qué factores están relacionados con el


cuidado de un recién nacido en la familia y las
características completas de este cuidado.
• Evaluación de la relación entre los datos de evaluación con
un diagnóstico de enfermería.
• Determinación de las relaciones entre los riesgos para la
salud, las conductas de salud y el estado de salud.

63
Por ejemplo, Newland, Lunsford y Flach (2017) estudiaron «la
interacción de la fatiga, la actividad física y la calidad de vida
relacionada con la salud [CVRS] en adultos con esclerosis múltiple
[EM] y enfermedad cardiovascular [ECV])». Los autores observaron
que «la naturaleza compleja e interconectada de la fatiga, que afecta
negativamente a la actividad física y la CVRS, supone una
dificultad para los adultos con EM y ECV en la comunidad. Los
profesionales de enfermería y otros profesionales del equipo
sanitario pueden subestimar y/o comprender de forma incompleta
la necesidad de que los adultos con EM y ECV practiquen actividad
física para mejorar la CVRS como parte de su régimen de
autocontrol» (Newland y cols., 2017, pág. 52). Los estudios futuros
sobre las intervenciones para controlar la fatiga, aumentar la
actividad física y fomentar la CVRS tienen el potencial de mejorar el
autocontrol de los adultos sobre sus enfermedades crónicas.

Predicción
Mediante la predicción se puede estimar la probabilidad de un
resultado específico en una situación determinada (Chinn y
Kramer, 2015). Sin embargo, la predicción de un resultado no
permite necesariamente modificarlo o controlarlo. A través de la
predicción, se identifica el riesgo de enfermedad o lesión y se
relaciona con posibles métodos de cribado para identificar y
prevenir problemas de salud. El conocimiento generado a partir de
la investigación centrada en la predicción es fundamental en la PBE
e incluye lo siguiente:

• Predicción del riesgo de una enfermedad o lesión en


diferentes poblaciones.
• Predicción de conductas que promueven la salud y
previenen enfermedades.
• Predicción de asistencia de enfermería necesaria basada en
las circunstancias y valores del paciente.

Lee, Faucett, Gillen, Krause y Landry (2013) realizaron un estudio


cuantitativo para evaluar los factores que los profesionales de
enfermería de unidades de cuidados intensivos (UCI) consideraban

64
predictivos del riesgo de lesión musculoesquelética (MEQ)
derivada del trabajo. Observaron que una mayor sobrecarga física,
un estrés laboral más elevado, las tareas más frecuentes derivadas
de la manipulación del paciente y la falta de equipos o dispositivos
de elevación eran factores predictivos del riesgo de lesiones MEQ
en el personal de enfermería de UCI. Concluyeron que «Mejorar el
entorno de trabajo físico y psicosocial puede hacer que el trabajo de
enfermería sea más seguro, reducir el riesgo de lesiones MEQ y
mejorar la percepción de la seguridad laboral por parte de los
profesionales de enfermería» (Lee y cols., 2013, pág. 43).
Este estudio predictivo identificó variables independientes
(sobrecarga física, tensión laboral, tareas de manipulación de
pacientes y falta de equipos o dispositivos de elevación) como
predictivos de lesiones MEQ en el personal de enfermería de UCI.
Las variables identificadas en estudios predictivos requieren más
investigaciones para asegurar que su manipulación o control den
lugar a resultados de calidad para pacientes, profesionales
sanitarios y centros de asistencia sanitaria.

Control
Si puede predecirse el resultado de una situación, el siguiente paso
es controlar o modificar dicha situación para obtener el resultado
deseado. En la asistencia sanitaria, el control es la capacidad de
escribir una prescripción para obtener los resultados deseados.
Utilizando la mejor evidencia de la investigación, los profesionales
de enfermería podrían prescribir intervenciones específicas para
satisfacer las necesidades de los pacientes y sus familias (Melnyk y
cols., 2017; Straus y cols., 2011). Los resultados de varios estudios en
las siguientes áreas han permitido que el personal de enfermería
preste una asistencia que aumente el control sobre los resultados
deseados para la práctica:

• Evaluar la eficacia de intervenciones para mejorar el estado


de salud de personas y familias.
• Resumir la investigación para el desarrollo de guías de PBE.
• Determinar la eficacia de las guías de PBE en cada centro
sanitario.

65
Como ya se ha comentado, se han realizado numerosos estudios
respecto a la administración segura de inyecciones i.m. y se han
resumido en guías de PBE. La guía de PBE para las inyecciones i.m.
incluye lo siguiente: 1) el tamaño y la longitud adecuados de la
aguja utilizada para administrar diferentes tipos de fármacos, 2) el
lugar de inyección más seguro (ventroglúteo) para muchos
fármacos y 3) la mejor técnica de inyección para administrar la
medicación, minimizar las molestias del paciente y prevenir daños
físicos (Cocoman y Murray, 2008; Nicoll y Hesby, 2002; Ogston-
Tuck, 2014). Se han seguido realizando investigaciones sobre la
aspiración durante una inyección i.m. con los trabajos de Sisson
(2015) (que recomienda no aspirar) y de Thomas y cols. (2016) (que
sí lo recomienda). Por tanto, los profesionales de enfermería deben
tomar decisiones para determinar si han de aspirar o no en función
de cada situación. El uso de los conocimientos basados en la
evidencia para administrar inyecciones i.m. ayuda a controlar los
siguientes resultados: 1) administración adecuada de la medicación
para fomentar la salud del paciente, 2) molestias mínimas del
paciente y 3) ausencia de daño físico al paciente. Sin embargo,
Greenway (2014) ha revisado recientemente la literatura y ha
observado que muchos profesionales de enfermería utilizan los
conocimientos tradicionales al administrar inyecciones i.m. en lugar
de las guías de PBE. Las guías de PBE mejoran significativamente la
calidad de las inyecciones i.m. y disminuyen la incidencia de dolor
y lesión muscular y del nervio ciático (Stringer, 2010).
En general, la profesión de enfermería es responsable ante la
sociedad de proporcionar cuidados de calidad, seguros y rentables
a los pacientes y sus familias. El gran número de estudios clínicos
realizados en los últimos 50 años ha ampliado enormemente el
conocimiento científico disponible para describir, explicar, predecir
y controlar los fenómenos en la práctica enfermera.

COMPRENSIÓN DEL PAPEL DEL


PROFESIONAL EN LA
INVESTIGACIÓN DE ENFERMERÍA
El desarrollo de una base de conocimiento empírico para su

66
implementación en la práctica requiere la participación de todos los
profesionales de enfermería en diversas actividades de
investigación. Algunos de estos profesionales son emprendedores
de investigaciones y realizan estudios para generar y mejorar los
conocimientos necesarios para la práctica enfermera. Otros son
usuarios de la investigación y utilizan la evidencia de la
investigación para mejorar dicha práctica. La AACN (2006, 2017) y
la ANA (2010) han publicado manifiestos sobre las funciones de los
profesionales de enfermería en la investigación. Cualquiera que sea
su formación o posición, todos los profesionales de enfermería
tienen una función en la investigación; algunas ideas sobre estas
funciones se presentan en la tabla 1.4. El papel investigador que un
profesional de enfermería suele asumir se incrementa con una
mayor formación, experiencia clínica y trayectoria profesional. Los
profesionales de enfermería con titulación de Bachelor of Science in
Nursing (BSN) conocen el proceso de investigación y poseen
habilidades en la lectura y valoración crítica de estudios. Ayudan a
la implementación en la práctica de guías basadas en la evidencia,
protocolos, algoritmos y políticas (Melnyk y cols., 2017). Además,
estos profesionales de enfermería pueden proporcionar una valiosa
ayuda al identificar problemas de investigación y en la recogida de
datos para los estudios. Las competencias QSEN (2017) identifican
estos conocimientos y habilidades como básicos para los
estudiantes prediplomados.

TABLA 1.4
PARTICIPACIÓN DE LOS PROFESIONALES DE
ENFERMERÍA EN LA INVESTIGACIÓN EN DIVERSOS
NIVELES EDUCATIVOS

FORMACIÓN
ACADÉMICA DE
EXPECTATIVAS Y COMPETENCIAS DE
LOS
INVESTIGACIÓN
PROFESIONALES
DE ENFERMERÍA
Bachelor of Leer y valorar críticamente los estudios; utilizar la mejor
Science in evidencia de investigación en la práctica con orientación;
Nursing, BSN ayudar en la identificación de problemas y la recogida de
(grado) datos

67
Master of Science Valorar críticamente y sintetizar los estudios para elaborar y
in Nursing, MSN revisar protocolos, algoritmos y políticas para la práctica.
(máster) Implementar la mejor evidencia de investigación en la
práctica; colaborar en proyectos de investigación y
proporcionar experiencia clínica para la investigación
Doctor of Nursing Participar en la elaboración de guías basadas en la evidencia;
Practice, DNP desarrollar, implementar, evaluar y revisar protocolos,
(doctorado en políticas y guías basadas en la evidencia en la práctica según
Práctica de se precise; realizar estudios clínicos, habitualmente en
Enfermería) colaboración con otros investigadores de enfermería
Doctor of Papel importante, como investigador principal, en la
Philosophy, PhD realización de investigaciones y en la contribución al
(doctorado PhD) conocimiento empírico generado en un área seleccionada de
estudio; obtener financiación para la investigación; coordinar
los equipos de investigación de profesionales de enfermería
con grados de BSN, MSN y DNP
Posdoctorado Implementar un programa financiado de investigación; dirigir
y/o participar en equipos de investigación de enfermería e
interdisciplinares; considerados expertos en sus áreas de
investigación; actuar como tutores de investigadores con
grado de PhD

Los profesionales de enfermería con un MSN (máster) tienen la


preparación académica para valorar críticamente y sintetizar los
resultados de los estudios, revisar o desarrollar protocolos,
algoritmos o políticas para su uso en la práctica. También tienen la
capacidad de identificar y valorar críticamente la calidad de las
guías basadas en la evidencia elaboradas por organizaciones
nacionales. Los profesionales de enfermería de práctica avanzada
(profesionales de enfermería especializada, especialistas en
enfermería clínica, especialistas en enfermería de anestesia y
matronas) y administradores de enfermería tienen la capacidad
para dirigir equipos de asistencia sanitaria y realizar cambios
básicos tanto en la práctica enfermera como en el sistema sanitario
basados en la evidencia de la investigación actual. Algunos
profesionales de enfermería con MSN realizan estudios, pero por lo
general lo hacen en colaboración con otros investigadores en
enfermería (v. tabla 1.4).
El doctorado en enfermería puede estar orientado a la práctica
(DNP, doctor of nursing practice) o a la investigación (PhD, doctor of
philosophy). Los profesionales de enfermería con el grado de DNP
están formados para alcanzar el más alto nivel de conocimientos
clínicos especializados, con capacidad de traducir el conocimiento

68
científico para su uso en la práctica. Muchos profesionales de
práctica avanzada obtienen un grado de DNP para aumentar su
base de conocimientos. Los profesionales de enfermería con DNP
tienen conocimientos científicos y de liderazgo avanzados que les
permiten desarrollar, aplicar, valorar y revisar las guías basadas en
la evidencia, protocolos, algoritmos y políticas para la práctica
(Butts y Rich, 2015). Además, los profesionales de enfermería con
un DNP tienen experiencia suficiente para desarrollar y colaborar
en estudios clínicos.
Los profesionales de enfermería con un PhD asumen un papel
importante en el desarrollo de la investigación y creación de
conocimientos de enfermería en un área de interés seleccionada.
Estos científicos de enfermería suelen coordinar equipos de
investigación que incluyen a profesionales con un DNP, MSN y
BSN para facilitar la realización de estudios rigurosos en diversas
instituciones sanitarias y universidades. Los profesionales de
enfermería con formación posdoctoral tienen los conocimientos
necesarios para desarrollar programas de investigación con una
gran financiación. Dirigen equipos interdisciplinares de
investigadores y, a veces, llevan a cabo estudios en múltiples
entornos. Estos científicos a menudo se identifican como expertos
en áreas de investigación seleccionadas y son tutores de nuevos
investigadores con PhD (v. tabla 1.4).

DETERMINACIÓN DE LA MEJOR
EVIDENCIA DE LA INVESTIGACIÓN
PARA LA PRÁCTICA
La PBE implica utilizar la mejor evidencia de la investigación para
apoyar las decisiones clínicas en la práctica. La mejor evidencia de
la investigación se definió previamente como una síntesis de los
conocimientos empíricos actuales y de máxima calidad en un área
específica de asistencia sanitaria que se desarrolla a partir de una
síntesis de los estudios de calidad en esa área. Los profesionales de
enfermería tienen que tomar muchas decisiones clínicas cada día
que afectan a los resultados de salud de sus pacientes. El uso de la
mejor evidencia de la investigación disponible permite tomar

69
decisiones clínicas de calidad que mejoren los resultados de salud
de los pacientes y sus familias. Esta sección se centra en ampliar la
comprensión del concepto de mejor evidencia de la investigación
para la práctica proporcionando: 1) una descripción de las
estrategias utilizadas para sintetizar la evidencia de la
investigación, 2) un modelo de los niveles disponibles de evidencia
de la investigación y 3) una relación entre la mejor evidencia de la
investigación y las guías basadas en la evidencia para la práctica.

Estrategias utilizadas para sintetizar la


evidencia de la investigación
La síntesis de los hallazgos de un estudio es un proceso complejo y
muy estructurado que se realiza mejor con al menos dos personas o
incluso con un equipo de investigadores y profesionales sanitarios.
Se llevan a cabo varios tipos de síntesis de investigación, en función
de la calidad, el número y los tipos de evidencia de la investigación
disponibles. La evidencia de la investigación en enfermería suele
sintetizarse mediante los siguientes procesos: 1) revisión
sistemática, 2) metaanálisis, 3) metasíntesis y 4) revisión sistemática
de métodos mixtos. Dependiendo de la cantidad y la solidez de los
resultados de las investigaciones disponibles, los profesionales
sanitarios y de enfermería utilizan uno o más de estos cuatro
procesos de síntesis para determinar la mejor evidencia de la
investigación actual en un área. En la tabla 1.5 se presentan los
procesos habituales utilizados en la síntesis de la investigación, el
objetivo de cada proceso de síntesis, los tipos de investigación
incluidos en la síntesis (marco de muestreo) y las técnicas analíticas
usadas para lograr la síntesis de la evidencia de la investigación
(Cooper, 2017; Higgins y Green, 2008; Sandelowski y Barroso, 2007;
Whittemore, Chao, Jang, Minges y Park, 2014).

TABLA 1.5
PROCESOS UTILIZADOS PARA SINTETIZAR LA EVIDENCIA
CIENTÍFICA

70
Basada en contenidos de Barnett-Page, E. y Thomas, J. (2009). Methods
for the synthesis of qualitative research: A critical review. BMC Medical
Research Methodology, 9, 59; Cooper, H. (2017). Research synthesis and
meta-analysis: A step-by-step approach (5.ª ed.). Los Angeles, California:
Sage; Creswell, J. W. (2014). Research design: Qualitative, quantitative
and mixed methods approaches (4.ª ed.). Thousand Oaks, California:
Sage; Finfgeld-Connett, D. (2010). Generalizability and transferability of
meta-synthesis research findings. Journal of Advanced Nursing, 66(2), 246-
254; Gray, J. R., Grove, S. K. y Sutherland, S. (2017). Burns and Grove’s
the practice of nursing research: Appraisal, synthesis, and generation of
evidence (8.ª ed.). San Luis, Missouri: Elsevier; Higgins, J. P. T. y Green,
S. (2008). Cochrane handbook for systematic reviews of interventions.
West Sussex, Inglaterra: Wiley-Blackwell and The Cochrane Collaboration;
Sandelowski, M. y Barroso, J. (2007). Handbook for synthesizing qualitative
research. Nueva York, Nueva York: Springer; Whittemore, R., Chao, A.,
Jang, M., Minges, K. E. y Park, C. (2014). Methods for knowledge
synthesis: An overview. Heart & Lung, 43(5), 453-461.
Una revisión sistemática es una síntesis estructurada y
exhaustiva de la literatura científica dirigida a determinar la mejor
evidencia de la investigación disponible para abordar una pregunta
sobre la asistencia sanitaria. Una revisión sistemática implica
identificar, localizar, valorar y sintetizar la evidencia de la
investigación de calidad por parte de expertos clínicos con el fin de
usarla para fomentar la PBE (Gray y cols., 2017; Higgins y Green,
2008; Melnyk y Fineout-Overholt, 2015). Estas revisiones las
realizan equipos de investigadores expertos, clínicos y, a veces,
estudiantes para obtener el mejor conocimiento actual para su
aplicación en la práctica. Las revisiones sistemáticas también se

71
utilizan en la elaboración de guías estandarizadas a nivel nacional e
internacional para el manejo de problemas de salud como el dolor
agudo, la HTA y la depresión. Las guías estandarizadas se
encuentran disponibles en internet, se publican en artículos y libros,
y se presentan en congresos y reuniones profesionales. El proceso
para la valoración crítica de las revisiones sistemáticas se describe
en el capítulo 13.
Un metaanálisis se realiza para relacionar o agrupar los
resultados de estudios cuantitativos previos en un análisis
estadístico único que ofrezca una evidencia sólida sobre la eficacia
de una intervención (Andrel, Keith y Leiby, 2009; Cooper, 2017).
Debido a que los estudios cualitativos no proporcionan resultados
estadísticos, no pueden incluirse en un metaanálisis. Algunas de las
evidencias más sólidas para el uso de una intervención en la
práctica se obtienen de un metaanálisis de múltiples estudios
cuasiexperimentales y experimentales controlados. Además, puede
realizarse un metaanálisis con estudios de correlación para
determinar el tipo (positivo o negativo) y la solidez de las relaciones
entre las variables seleccionadas (Grove y Cipher, 2017). Muchas
revisiones sistemáticas realizadas para elaborar guías basadas en la
evidencia incluyen metaanálisis (v. cap. 13).
La síntesis de investigación cualitativa es el proceso y el
producto de la revisión sistemática y la integración formal de los
resultados de estudios cualitativos (Sandelowski y Barroso, 2007).
El proceso de síntesis de la investigación cualitativa se encuentra
todavía en evolución y han aparecido en la literatura diversos
métodos de síntesis (Barnett-Page y Thomas, 2009; Finfgeld-
Connett, 2010). En este libro, se utiliza el concepto de metasíntesis
para describir el proceso de síntesis de la investigación cualitativa.
La metasíntesis se define como la recopilación e integración
sistemáticas de estudios cualitativos para aumentar la comprensión
y desarrollar una interpretación única de los hallazgos de estudios
en un área seleccionada. El foco de atención se centra en la
interpretación en lugar de en la combinación de los resultados del
estudio, como sucedía con la síntesis de la investigación
cuantitativa. En el capítulo 13 se proporcionan más detalles sobre la
metasíntesis.
A lo largo de los últimos 10 años, los investigadores en

72
enfermería han llevado a cabo estudios de métodos mixtos que
incluían métodos de investigación cuantitativa y cualitativa
(Creswell, 2014). Además, la determinación de la evidencia de la
investigación actual en un área podría requerir la síntesis de
estudios cuantitativos y cualitativos. Higgins y Green (2008)
denominaron a esta síntesis de estudios cuantitativos, cualitativos y
de métodos mixtos revisión sistemática con métodos mixtos (v.
tabla 1.5). Las revisiones sistemáticas de métodos mixtos podrían
incluir diversos diseños, como estudios cualitativos y
cuasiexperimentales, de correlación y/o descriptivos (Creswell,
2014). Algunos investigadores han realizado síntesis de estudios
cuantitativos y cualitativos, denominadas revisiones integrales de
investigación. El valor de estas revisiones depende de los estándares
utilizados en su realización (v. cap. 13).

Niveles de evidencia de la investigación


Los estudios cuantitativos experimentales, como los ECA,
proporcionan la evidencia de la investigación más sólida (v. cap. 8).
Además, la reproducción o la repetición de estudios con
metodología similar aumenta la fuerza de la evidencia de la
investigación generada. Los niveles de evidencia de la investigación
se presentan en una pirámide (fig. 1.3) que muestra un continuum,
con la mayor calidad de la evidencia científica en el vértice y la
evidencia de investigación más débil en la base (Brown, 2018;
Melnyk y cols., 2017). Las revisiones de investigación sistemáticas y
los metaanálisis de estudios cuasiexperimentales y experimentales
de alta calidad proporcionan la evidencia de investigación más
sólida o mejor para su uso por los clínicos en la práctica. Los
metaanálisis de estudios de correlación, cuasiexperimentales,
experimentales y de resultados también proporcionan una
evidencia de investigación muy sólida para el manejo de problemas
prácticos. Las revisiones sistemáticas de métodos mixtos y las
metasíntesis proporcionan síntesis de calidad de estudios
cuantitativos, cualitativos y/o de métodos mixtos. La evidencia de
estudios de correlación individuales, de correlación predictivos y de
cohortes proporciona orientación para investigaciones futuras, pero
no está lista para su uso en la práctica. Los estudios descriptivos y

73
cualitativos a menudo proporcionan el conocimiento inicial, que
sirve de base para el desarrollo de estudios de correlación,
cuasiexperimentales, experimentales y de resultados (v. fig. 1.3). La
base de la pirámide incluye la evidencia más débil, que se genera a
partir de opiniones de comités de expertos y autoridades.

74
FIG 1.3 Niveles de evidencia de la investigación.
(Modificada de Gray, J. R., Grove, S. K. y Sutherland, S. [2017].
Burns and Grove’s the practice of nursing research: Appraisal,
synthesis, and generation of evidence [8.ª ed.]. San Luis,
Missouri: Elsevier.)

Al tomar una decisión en la práctica clínica, hay que asegurarse


de basarla en la mejor evidencia de la investigación disponible. Los
niveles de evidencia de la investigación que se muestran en la
figura 1.3 ayudarán a determinar la calidad de la evidencia
disponible. Se utiliza la mejor evidencia de la investigación
generada a partir de revisiones sistemáticas, metaanálisis,
metasíntesis y revisiones sistemáticas de métodos mixtos para
elaborar guías estandarizadas basadas en la evidencia para su uso

75
en la práctica.

Introducción a las guías basadas en la


evidencia
Las guías basadas en la evidencia son unas guías clínicas rigurosas
y explícitas que se han desarrollado sobre la base de la mejor
evidencia de la investigación disponible en esa área. Estas guías
suele elaborarlas un equipo o panel de clínicos expertos (p. ej.,
profesionales de enfermería, médicos, farmacéuticos),
investigadores y, en ocasiones, usuarios, responsables políticos y
economistas. El panel de expertos trabaja para alcanzar un consenso
sobre el contenido de la guía, que debe proporcionar a los médicos
la mejor información disponible para la toma de decisiones en la
práctica. Se ha producido un drástico crecimiento en la producción
de guías basadas en la evidencia para ayudar a los profesionales
sanitarios a desarrollar una PBE y mejorar los resultados de salud
de pacientes, familias, proveedores e instituciones sanitarias.
Cada año se desarrollan nuevas guías y algunas de las existentes
se revisan en función de la nueva evidencia de la investigación.
Estas guías se han convertido en el patrón oro (estándar de
excelencia) para la asistencia a los pacientes y se anima al personal
de enfermería y a otros profesionales sanitarios a incorporar estas
guías estandarizadas a su práctica. Muchas de estas guías basadas
en la evidencia están disponibles en las páginas web de
instituciones estatales nacionales e internacionales, organismos
profesionales y centros de excelencia. La fuente más importante de
guías basadas en la evidencia en Estados Unidos es la National
Guideline Clearinghouse (NGC, 2017), creada en 1998 por la
AHRQ. La NGC surgió con 200 guías y se ha incrementado a más
de 2.000 guías basadas en la evidencia. Cuando se selecciona una
guía para la práctica, hay que comprobar que la guía se haya
desarrollado por una agencia u organización creíble y que la lista de
referencias refleje una síntesis de un número extenso de estudios.
En resumen, el capítulo 13 proporciona orientación para realizar
una valoración crítica de la calidad de las guías basadas en la
evidencia y aplicarlas en la práctica. Los capítulos del 2 al 12 se han
elaborado para ampliar la comprensión de los procesos de

76
investigación cuantitativa y cualitativa, con el fin de poder realizar
una valoración crítica de estos tipos de estudios. Una valoración
crítica de investigaciones implica un análisis cuidadoso de todos
los aspectos de un estudio para evaluar sus puntos fuertes,
limitaciones, significado y trascendencia. El capítulo 14 proporciona
una introducción a la investigación de resultados y de métodos
mixtos. Creemos que los lectores considerarán la investigación en
enfermería como una aventura emocionante y muy prometedora
para su futura práctica asistencial.

PUNTOS CLAVE
• La investigación se define como una búsqueda sistemática,
concienzuda y cuidadosa para validar y mejorar el
conocimiento existente y desarrollar nuevos conocimientos.
• La investigación de enfermería es un proceso científico que
valida y mejora el conocimiento existente y genera otros
nuevos que influyen directa e indirectamente en la práctica
enfermera.
• La PBE es la incorporación consciente de la mejor evidencia
de la investigación, junto con la experiencia clínica y las
circunstancias y valores de los pacientes, a la prestación de
una asistencia sanitaria de calidad, segura y rentable.
• Florence Nightingale fue la primera enfermera
investigadora que desarrolló el conocimiento empírico para
mejorar la práctica de enfermería en el siglo XIX.
• La realización de investigación clínica continúa siendo un
foco de atención importante en el siglo XXI, con el objetivo
de elaborar una PBE para la enfermería.
• El conocimiento en enfermería se adquiere de diversas
maneras, como la tradición, la autoridad, el préstamo, el
ensayo y error, la experiencia personal, el modelado de
roles, la intuición, el razonamiento y, lo más importante, la
investigación.
• La investigación cuantitativa es un proceso formal, objetivo
y sistemático en el que se utilizan datos numéricos para
obtener información sobre el mundo. Este método de

77
investigación se utiliza para describir, analizar las
relaciones y determinar la causa y el efecto.
• La investigación cualitativa es un enfoque único, dinámico y
subjetivo usado para describir experiencias vitales y darles
sentido. El conocimiento generado a partir de la
investigación cualitativa proporcionará el significado y la
comprensión de experiencias vitales, situaciones,
acontecimientos y culturas.
• La investigación de métodos mixtos es un enfoque
investigador que combina los métodos cuantitativos y
cualitativos de investigación en un único estudio.
• La investigación de resultados se centra en la evaluación de
los resultados finales de la asistencia y la determinación de
los cambios necesarios para mejorar el estado de salud del
paciente y la calidad del sistema sanitario.
• Los objetivos de la investigación en enfermería incluyen la
descripción, la explicación, la predicción y el control de
fenómenos en la práctica.
• Los profesionales de enfermería con un BSN (grado), MSN
(máster), doctorado (DNP y PhD) y formación posdoctoral
tienen papeles claramente definidos en la investigación
basados en la extensión y profundidad de los conocimientos
de investigación adquiridos durante sus programas
académicos y sus experiencias clínicas y de investigación.
• La evidencia de la investigación en enfermería se sintetiza
mediante los siguientes procesos: 1) revisión sistemática, 2)
metaanálisis, 3) metasíntesis y 4) revisión sistemática de
métodos mixtos.
• Una revisión sistemática es una síntesis estructurada y
exhaustiva de estudios cuantitativos y de resultados en un
área de salud determinada con el fin de identificar las
mejores evidencias de investigación existentes para que los
clínicos las utilicen en la promoción de la PBE.
• El metaanálisis es un tipo de estudio que combina o agrupa
estadísticamente los resultados de estudios previos en un
análisis cuantitativo único para ofrecer uno de los más altos
niveles de evidencia para la eficacia de una intervención.
• La metasíntesis consiste en la recopilación e integración

78
sistemáticas de estudios cualitativos en un área para
aumentar la comprensión y desarrollar una interpretación
única de los hallazgos.
• La revisión sistemática de métodos mixtos es la síntesis de
los resultados de estudios individuales realizados con
diversos métodos (cuantitativos, cualitativos y métodos
mixtos) para determinar el conocimiento actual en un área.
• Los niveles de evidencia de la investigación son un
continuum, con la mayor calidad de la evidencia de la
investigación en el vértice de la pirámide y la más débil en
la base (v. fig. 1.3). Las revisiones científicas sistemáticas y
los metaanálisis de estudios experimentales de calidad
proporcionan la mejor evidencia de la investigación para la
práctica.
• Las guías basadas en la evidencia son unas guías clínicas
rigurosas y explícitas que se han desarrollado sobre la base
de la mejor evidencia de la investigación disponible en un
área particular.

BIBLIOGRAFÍA
Agency for Healthcare Research and Quality (AHRQ), Research
tools and data. Author, Rockville, MD, 2017. Consultada el 8 de
noviembre de 2017 en. http://www.ahrq.gov/research/index.html

American Association of Colleges of Nursing (AACN), AACN


position statement on nursing research. AACN, Washington, DC,
2006. Consultada el 20 de febrero de 2017 en.
http://www.aacn.nche.edu/publications/position/nursing-research

American Association of Colleges of Nursing (AACN), News &


information: Research and data center. Author, Washington, DC,
2017. Consultada el 10 de noviembre de 2017 en.
http://www.aacnnursing.org/news-information/research-data

79
American Nurses Association (ANA). Nursing: Scope and standards
of practice, 2nd ed. Washington, DC: Author; 2010.

Andrel, J. A., Keith, S. W., Leiby, B. E. Meta-analysis: A brief


introduction. Clinical and Translational Science. 2009; 2(5):374–378.

Barnett-Page, E., Thomas, J., Methods for the synthesis of


qualitative research: A critical review. BMC Medical Research
Methodology 2009; 9:59. https://doi.org/10.1186/147-2288-9-59

Barnsteiner, J., Disch, J., Johnson, J., McGuinn, K., Chappell, K.,
Swartwout, E. Diffusing QSEN competencies across schools of
nursing: The AACN/RWJF faculty development institutes. Journal of
Professional Nursing. 2013; 29(2):68–74.

Bauknecht, V. L. Capital commentary: NIH bill passes, includes


nursing research center. American Nurse. 1985; 17(10):2.

Benner, P. From novice to expert: Excellence and power in clinical


nursing practice. Menlo Park, CA: Addison-Wesley; 1984.

Brown, S. J., Evidence-based nursing: The research-practice


connection 4th ed. Jones & Bartlett, Sudbury, MA, 2018.

Butts, J. B., Rich, K. L. Philosophies and theories for advanced nursing


practice. Burlington, MA: Jones & Bartlett Learning; 2015.

Charmaz, K. Constructing grounded theory, 2nd ed. Los Angeles, CA:


Sage; 2014.

Chinn, P. L., Kramer, M. K. Knowledge development in nursing: Theory


and process, 9th ed. St. Louis, MO: Mosby Elsevier; 2015.

Cocoman, A., Murray, J. Intramuscular injections: A review of best

80
practice for mental health nurses. Journal of Psychiatric and Mental
Health Nursing. 2008; 15(5):424–434.

Cook, E., The life of Florence Nightingale Vol. 1. Macmillan,


London, England, 1913.

Cooper, H. Research synthesis and meta-analysis: A step-by-step


approach, 5th ed. Los Angeles, CA: Sage; 2017.

Creswell, J. W. Research design: Qualitative, quantitative and mixed


methods approaches, 4th ed. Thousand Oaks, CA: Sage; 2014.

Creswell, J. W., Poth, C. N. Qualitative inquiry & research design:


Choosing among five approaches, 4th ed. Thousand Oaks, CA: Sage;
2018.

Finfgeld-Connett, D. Generalizability and transferability of meta-


synthesis research findings. Journal of Advanced Nursing. 2010;
66(2):246–254.

Glaser, B. G., Strauss, A. L. The discovery of grounded theory: Strategies


for qualitative research. Chicago, IL: Aldine; 1967.

Gortner, S. R., Nahm, H. An overview of nursing research in the


United States. Nursing Research. 1977; 26(1):10–33.

Greenway, K. Rituals in nursing: Intramuscular injections. Journal of


Clinical Nursing. 2014; 23(23/24):3583–3588.

Gray, J. R., Grove, S. K., Sutherland, S. Burns and Grove’s the practice
of nursing research: Appraisal, synthesis, and generation of evidence, 8th
ed. St. Louis, MO: Elsevier; 2017.

Grove, S. K., Cipher, D. J. Statistics for nursing research: A workbook

81
for evidence-based practice, 2nd ed. St. Louis, MO: Elsevier; 2017.

Herbert, R. G. Florence Nightingale: Saint, reformer or rebel?. Malabar,


FL: Robert E. Krieger; 1981.

Higgins, J. P.T., Green, S. Cochrane handbook for systematic reviews of


interventions. West Sussex, England: Wiley-Blackwell and The
Cochrane Collaboration; 2008.

Horsley, J. A., Crane, J., Crabtree, M. K., Wood, D. J. Using research


to improve nursing practice: A guide. In: CURN project. New York,
NY: Grune & Stratton; 1983.

Institute of Medicine. Crossing the quality chasm: A new health system


for the 21st century. Washington, DC: National Academy Press; 2001.

James, P. A., Oparil, S., Carter, B. L., Cushman, W. C., Denison-


Himmelfard, C., Handler, J., et al. 2014 evidence-based guidelines
for the management of high blood pressure in adults: Report from
the panel members appointed to the Eighth Joint National
Committee (JNC 8). Journal of the American Medical Association. 2014;
311(5):507–520.

Kaplan, A. The conduct of inquiry; Methodology for behavioral science.


San Francisco, CA: Chandler; 1964.

Koehn, A. R., Ebright, P. R., Draucker, C. B. Nurses’ experiences


with errors in nursing. Nursing Outlook. 2016; 64(6):566–574.

Lee, S., Faucett, J., Gillen, M., Krause, N., Landry, L. Risk perception
of musculoskeletal injury among critical care nurses. Nursing
Research. 2013; 62(1):36–44.

Marshall, C., Rossman, G. B. Designing qualitative research, 6th ed.

82
Thousand Oaks, CA: Sage; 2016.

McMurrey, P. H. Toward a unique knowledge base in nursing.


Image. 1982; 14(1):12–15.

Melnyk, B. M., Fineout-Overholt, E. Evidence-based practice in nursing


and healthcare: A guide to best practice, 3rd ed. Philadelphia, PA:
Lippincott, Williams, & Wilkins; 2015.

Melnyk, B. M., Gallagher-Ford, E., Fineout-Overholt, E.


Implementing evidence-based practice competencies in healthcare: A
practical guide for improving quality, safety, & outcomes. Indianapolis,
IN: Sigma Theta Tau International; 2017.

Moorhead, S., Johnson, M., Maas, M. L., Swanson, E. Nursing


outcomes classification (NOC): Measurement of health outcomes, 5th ed.
St. Louis, MO: Elsevier; 2013.

National Guideline Clearinghouse. AHRQ’s national guideline


clearinghouse: Public resource for summaries of evidence-based
clinical practice guidelines. Consultada el 3 de marzo de 2017 en
https://www.guideline.gov/, 2017.

National Institute of Nursing Research. The NINR Strategic Plan:


Advancing science, improving lives. Consultada el 20 de febrero de
2017 en
https://www.ninr.nih.gov/sites/www.ninr.nih.gov/files/NINR_StratPlan2016_re
2016.

National Institute of Nursing Research, About the NINR


Consultada el 10 de noviembre de 2017 en.
https://www.ninr.nih.gov/aboutninr, 2017

83
Newland, P. K., Lunsford, V., Flach, A. The interaction of fatigue,
physical activity, and health-related quality of life in adults with
multiple sclerosis (MS) and cardiovascular disease (CVD). Applied
Nursing Research. 2017; 33(1):49–53.

Nicoll, L. H., Hesby, A. Intramuscular injections: An integrative


research review and guideline for evidence-based practice. Applied
Nursing Research. 2002; 16(2):149–162.

Nightingale, F. Notes on nursing: What it is, and what it is not.


Philadelphia, PA: Lippincott; 1859.

Oakley, K. Nursing by the numbers. Occupational Health. 2010;


62(4):28–29.

Ogston-Tuck, S. Intramuscular injection technique: An evidence-


based approach. Nursing Standard. 2014; 29(4):52–59.

Palmer, I. S. Florence Nightingale: Reformer, reactionary,


researcher. Nursing Research. 1977; 26(2):84–89.

Quality, Safety Education for Nurses (QSEN). Pre-licensure


knowledge, skills, and attitudes (KSAs). Consultada el 31 de
octubre de 2017 en http://qsen.org/competencies/pre-licensure-
ksas/, 2017.

Rettig, R. History, development, and importance to nursing of


outcomes research. Journal of Nursing Quality Assurance. 1991;
5(2):13–17.

Sandelowski, M., Barroso, J. Handbook for synthesizing qualitative


research. New York, NY: Springer; 2007.

See, E. M. The ANA and research in nursing. Nursing Research. 1977;

84
26(3):165–171.

Shadish, W. R., Cook, T. D., Campbell, D. T. Experimental and quasi-


experimental designs for generalized causal inference. Chicago, IL: Rand
McNally; 2002.

Sherwood, G., Barnsteiner, J. Quality and safety in nursing: A


competency approach to improving outcomes, 2nd ed. Ames, IA: Wiley-
Blackwell; 2017.

Sisson, H. Aspirating during the intramuscular injections


procedure: A systematic literature review. Journal of Clinical
Nursing. 2015; 24(17/18):2368–2375.

Stetler, C. B. Updating the Stetler model of research utilization to


facilitate evidence-based practice. Nursing Outlook. 2001; 49(6):272–
279.

Straus, S. E., Glasziou, P., Richardson, W. S., Rosenberg, W.,


Haynes, R. B. Evidence-based medicine: How to practice and teach EBM,
5th ed. Edinburgh: Churchill Livingstone Elsevier; 2011.

Stringer, P. M. Sciatic nerve injury from intramuscular injections: A


persistent and global problem. International Journal of Clinical
Practice. 2010; 64(11):1573–1579.

The Joint Commission. About The Joint Commission. Consultada el


7 de marzo de 2017 en https://www.jointcommission.org, 2017.

Thomas, C. M., Mraz, M., Rajcan, L. Blood aspiration during IM


injection. Clinical Nursing Research. 2016; 25(5):549–559.

US Department of Health and Human Services (US DHHS).


Healthy people 2020: Topics and objectives. Consultada el 10 de

85
noviembre de 2017 en https://www.healthypeople.gov/2020/topics-
objectives, 2017.

Weber, M. A., Schiffrin, E. L., White, W. B., Mann, S., Lindholm, L.


H., Kenerson, J. G., et al. Clinical practice guidelines for the
management of hypertension in the community: A statement by the
American Society of Hypertension and the International Society of
Hypertension. Journal of Hypertension. 2014; 32(1):3–15.

Werley, H. H., Fitzpatrick, J. J., Annual review of nursing research


Vol. 1. Springer, New York, NY, 1983.

Whittemore, R., Chao, A., Jang, M., Minges, K. E., Park, C. Methods
for knowledge synthesis: An overview. Heart & Lung. 2014;
43(5):453–461.

86
CAPÍTULO 2

Introducción a la
investigación
cuantitativa
Kathryn M. Daniel

La página web de la National Guideline Clearinghouse de la Agency for


Healthcare Research and Quality (AHRQ) se cerró en 2018. Puede
consultarse más información en https://www.ahrq.gov/.

ÍNDICE DEL CAPÍTULO

¿Qué es la investigación cuantitativa?, 30


Solución de problemas y procesos de enfermería: bases
para la comprensión del proceso de investigación
cuantitativa, 36
Identificación de los pasos del proceso de investigación
cuantitativa, 38
Lectura de informes de investigación, 48
Práctica de lectura de estudios cuasiexperimentales, 52
Puntos clave, 56
Bibliografía, 57

87
OBJETIVOS DE APRENDIZAJE
Tras concluir este capítulo, el lector debería ser capaz de:
1. Definir los términos importantes en el proceso de la
investigación cuantitativa: investigación básica, investigación
aplicada, rigor y control.
2. Comparar y contrastar el proceso de solución de problemas, el
proceso de enfermería y el proceso de investigación.
3. Identificar los pasos del proceso de investigación cuantitativa
en estudios descriptivos, de correlación, cuasiexperimentales y
experimentales publicados.
4. Leer informes de investigación cuantitativa.
5. Realizar valoraciones críticas iniciales de las comunicaciones
de la investigación cuantitativa.

Al escuchar la palabra investigación, a menudo viene a la mente la


idea de la experimentación o de un estudio. Los rasgos
característicos de un experimento son la distribución aleatoria de
los sujetos en grupos, la recogida de datos y la realización de
análisis estadísticos. Es posible pensar en investigadores que
realizan un estudio para determinar la eficacia de una intervención,
como, por ejemplo, la eficacia de un programa de ejercicio de
marcha sobre el índice de masa corporal (IMC) en pacientes con
diabetes de tipo 2. Estas ideas se asocian con la investigación
cuantitativa, que consta de pasos específicos que se detallan en los
informes de los estudios. La valoración crítica de los estudios
cuantitativos requiere el aprendizaje de términos nuevos, la
comprensión del proceso de investigación cuantitativa y la
aplicación de diversas habilidades analíticas.
Este capítulo proporciona una introducción a la investigación
cuantitativa para ayudar en la lectura y la comprensión de las
comunicaciones de investigación cuantitativa. Se definen los

88
términos importantes y se presentan los procesos de solución de
problemas y de enfermería para aportar un fundamento para la
comprensión del proceso de la investigación cuantitativa. Se
presentan los pasos del proceso de investigación cuantitativa, así
como un estudio de correlación descriptivo como ejemplo para
apoyar la comprensión del proceso. También se describen las
habilidades de pensamiento crítico necesarias para la lectura de los
informes de investigación y guías para la realización de una
valoración crítica inicial de estos informes. El capítulo concluye con
la identificación de los pasos del proceso de investigación en un
estudio cuasiexperimental, con una valoración crítica inicial de
dicho estudio.

¿QUÉ ES LA INVESTIGACIÓN
CUANTITATIVA?
La investigación cuantitativa es un proceso sistemático, riguroso,
objetivo y formal para generar una información numérica acerca del
mundo. La investigación cuantitativa se lleva a cabo para describir
nuevas situaciones, fenómenos o conceptos, examinar las relaciones
entre variables y determinar la eficacia de intervenciones sobre
resultados de salud seleccionados. Algunos ejemplos son los
siguientes:

1. Descripción de la propagación de casos de gripe en cada


estación y su influencia potencial sobre la salud local,
nacional y global (estudio descriptivo).
2. Análisis de las relaciones entre las variables, como minutos
viendo televisión por semana, minutos jugando a
videojuegos por semana e IMC de un niño en edad escolar
(estudio de correlación).
3. Determinación de la eficacia de un programa de prevención
de caídas sobre la tasa de caídas de ancianos hospitalizados
(estudio cuasiexperimental).

Los diseños experimentales clásicos para probar la eficacia de los


tratamientos fueron desarrollados por Sir Ronald Fisher (1935). Este

89
autor es conocido por añadir una estructura a los pasos del proceso
de investigación cuantitativa con ideas como la hipótesis, el diseño
de la investigación y el análisis estadístico. Los estudios de Fisher
proporcionaron las bases para lo que ahora se denomina
investigación experimental.
A lo largo de los años, se han desarrollado varios métodos
cuantitativos adicionales. Campbell y Stanley (1963) desarrollaron
métodos cuasiexperimentales para estudiar los efectos de
tratamientos en condiciones menos controladas. Karl Pearson
(Porter, 2004) desarrolló métodos estadísticos para examinar las
relaciones entre variables, que se usaron para analizar los datos de
estudios de correlación. Los campos de la sociología, la educación y
la psicología destacan por su desarrollo y la expansión de
estrategias para la realización de investigación descriptiva. El
desarrollo del conocimiento empírico necesario para establecer la
práctica basada en la evidencia (PBE) en enfermería necesita una
variedad amplia de enfoques de investigación cuantitativa (Melnyk,
Gallagher-Ford y Fineout-Overholt, 2017). La PBE se presentó en el
capítulo 1 y se detalla en el capítulo 13 de este libro. La PBE es
esencial para fomentar la calidad y unos resultados seguros para los
pacientes y sus familias, la formación en enfermería y el sistema de
salud (Straus, Glasziou, Richardson, Rosenberg y Haynes, 2011). Es
esencial comprender el proceso de investigación cuantitativa para
cumplir las competencias de Quality and Safety Education for
Nurses (QSEN, 2017) para estudiantes de enfermería, que se
focalizan en una asistencia centrada en el paciente, el trabajo en
equipo y la colaboración, la PBE, la mejora de la calidad, la
seguridad y la informática (Sherwood y Barnsteiner, 2017). Esta
sección presenta los diferentes tipos de investigación cuantitativa y
aporta las definiciones de los términos importantes para el proceso
de esta investigación.

Tipos de investigación cuantitativa


En la figura 2.1 se muestran cuatro tipos frecuentes de investigación
cuantitativa: el tipo de investigación cuantitativa que se realiza está
influenciado por el conocimiento actual sobre un problema de
investigación. Cuando se dispone de pocos conocimientos, a

90
menudo se llevan a cabo estudios descriptivos que constituyen la
base para una investigación de correlación. Los estudios
descriptivos y de correlación se realizan con frecuencia con el fin de
proporcionar una base para los estudios cuasiexperimentales y
experimentales más controlados (v. fig. 2.1).

FIG 2.1 Tipos de investigación cuantitativa realizados


en enfermería.

Investigación descriptiva
La investigación descriptiva es el análisis y descripción de
fenómenos en situaciones de la vida real. Proporciona una
explicación exacta de las características de individuos, situaciones o
grupos particulares mediante el uso de números (Kerlinger y Lee,
2000). Los estudios descriptivos suelen realizarse con un gran
número de sujetos o participantes, en entornos naturales, sin
manipulación de la situación. Mediante los estudios descriptivos,
los investigadores descubren un nuevo significado, describen lo que

91
existe, determinan la frecuencia con la que ocurre algo y clasifican
la información en entornos del mundo real. Los resultados de la
investigación descriptiva son la identificación y descripción de
conceptos, la identificación de posibles relaciones entre conceptos y
el desarrollo de hipótesis que proporcionen una base para la futura
investigación cuantitativa.

Investigación de correlación
La investigación de correlación consiste en la investigación
sistemática de las relaciones entre variables. Cuando se realiza este
tipo de estudio, los investigadores miden variables seleccionadas en
una muestra y después usan la estadística de correlación para
determinar las relaciones entre las variables del estudio. Mediante
el análisis de correlación, el investigador es capaz de determinar el
grado de fuerza y el tipo de relación (positiva o negativa) entre dos
variables. La fuerza de la relación varía entre −1 (correlación
negativa perfecta) y +1 (correlación positiva perfecta), y 0 indica la
ausencia de relación (Grove y Cipher, 2017).
Una relación positiva indica que las variables cambian juntas; es
decir, ambas aumentan o disminuyen a la vez. Por ejemplo, la
investigación ha demostrado que cuantos más minutos de ejercicio
realizan las personas a la semana, mayor es su densidad ósea. Una
relación negativa indica que las variables pueden cambiar en
dirección opuesta; por tanto, cuando una variable aumente, la otra
disminuirá. Por ejemplo, la investigación ha demostrado que a
medida que aumenta el número de paquetes fumados-años
(número de años que se ha fumado multiplicado por el número de
paquetes fumados al día), disminuye la esperanza de vida de las
personas. La intención principal de los estudios de correlación es
explicar la naturaleza de las relaciones en el mundo real, no
determinar causas y efectos. Sin embargo, las relaciones
identificadas mediante los estudios de correlación son el medio
para el desarrollo de hipótesis que orienten estudios
cuasiexperimentales y experimentales destinados a examinar las
relaciones causa-efecto (v. fig. 2.1).

Investigación cuasiexperimental
El objetivo de la investigación cuasiexperimental es examinar las

92
relaciones causales o determinar el efecto de una variable sobre
otra. Estos estudios consisten en aplicar una intervención y
examinar los efectos de dicha intervención usando métodos de
medida seleccionados (Shadish, Cook y Campbell, 2002). Por
ejemplo, podría aplicarse una intervención consistente en un
programa de ejercicios de natación para mejorar el equilibrio y la
fuerza muscular de mujeres mayores con artrosis. Los estudios
cuasiexperimentales difieren de los experimentales en el nivel de
control logrado por los investigadores. Los estudios
cuasiexperimentales tienen menos control sobre la implementación
de la intervención, el manejo del entorno y/o la selección de los
participantes que los estudios experimentales. Cuando se estudia la
conducta humana, especialmente en entornos clínicos, los
investigadores con frecuencia no pueden seleccionar a los sujetos de
forma aleatoria o de controlar ciertas variables relacionadas con la
intervención o el entorno. Como resultado, los investigadores en
enfermería realizan más estudios cuasiexperimentales que
experimentales. El control se trata con mayor detalle
posteriormente en este capítulo.

Investigación experimental
La investigación experimental es una investigación muy
controlada, sistemática y objetiva que se realiza con el propósito de
predecir y controlar fenómenos en la práctica enfermera. En un
estudio experimental, se examina la causalidad entre la variable
independiente (tratamiento) y la dependiente (resultado) en
condiciones muy controladas (Shadish y cols., 2002). La
investigación experimental es el método cuantitativo más potente
debido al control riguroso de las variables. Las tres características
principales de los estudios experimentales son las siguientes: 1)
manipulación controlada de al menos una variable de tratamiento
(variable independiente), 2) exposición de algunos participantes del
estudio al tratamiento (grupo experimental) y ausencia de
exposición de los demás participantes (grupo control) y 3)
asignación aleatoria de los participantes al grupo control o
experimental. El grado de control conseguido en los estudios
experimentales varía según la población estudiada, las variables
examinadas y el entorno del estudio. En un estudio, la selección

93
aleatoria de los participantes y su realización en un laboratorio o un
centro de investigación refuerzan el control.
Liao, Chung y Chen (2017) han evaluado los efectos de los
ejercicios frecuentes con bandas elásticas sobre la producción de
radicales libres y enzimas antioxidantes en adultos mayores. El
ejercicio regular tiene muchos beneficios para todas las personas,
incluidos los adultos mayores. Sin embargo, no se sabe si el ejercicio
de alta intensidad, rápido y a corto plazo puede aumentar los
radicales libres y las enzimas antioxidantes, que se asocian con
enfermedades crónicas y otros efectos generalizados del
envejecimiento. Se reclutó a un total de 22 adultos mayores de un
centro comunitario y se asignaron de forma aleatoria al grupo
control o al de intervención. Los del grupo intervención realizaron
ejercicio regularmente en una clase con bandas elásticas; los del
grupo control siguieron sus rutinas de vida habituales. A todos los
participantes se les extrajeron muestras de sangre 30 minutos antes
de la intervención y una hora después de acabar las clases de
ejercicios. Para responder a la pregunta del estudio, los
investigadores compararon las concentraciones de ácido
tiobarbitúrico y de glutatión peroxidasa entre los grupos de
intervención y control.
Los participantes del estudio se distribuyeron de forma aleatoria
al grupo intervención o al grupo control, lo que aumentó el control
del estudio y redujo la posibilidad de errores en sus resultados.
Quedaron excluidos del estudio todos aquellos que tenían
afecciones que pudiesen influir en sus resultados. Por ejemplo, las
personas con demencia, las que tomaban suplementos de vitaminas
antioxidantes, o los fumadores se excluyeron de la participación en
el estudio, porque estos factores podrían afectar a sus
concentraciones de ácido tiobarbitúrico y de glutatión peroxidasa.
La intervención fue estructurada y se implementó de forma
homogénea en el grupo experimental. Gracias a la solidez del
diseño de su estudio, Liao y cols. (2017) pudieron afirmar con
confianza que el ejercicio con bandas elásticas no aumenta la
producción de radicales libres ni la actividad de enzimas
antioxidantes y que resulta prometedor como una actividad física
beneficiosa para los adultos mayores.

94
Definición de términos importantes en
investigación cuantitativa
Para entender la investigación cuantitativa es preciso comprender
los siguientes términos importantes: investigación básica,
investigación aplicada, rigor y control. Estos términos se definen en las
secciones siguientes, donde se aportan ejemplos obtenidos de
estudios cuantitativos.

Investigación básica
En ocasiones, la investigación básica se denomina investigación
pura o investigación de laboratorio. Consiste en investigaciones
científicas realizadas en busca del conocimiento por el propio
conocimiento o por el placer de aprender y descubrir la verdad. Los
investigadores básicos buscan nuevos conocimientos acerca de los
fenómenos de la salud, con la esperanza de establecer principios
científicos generales que suelen requerir investigación aplicada para
su uso en la práctica. La investigación básica en enfermería podría
incluir investigaciones de laboratorio con animales o seres humanos
para fomentar una mayor comprensión de la función fisiológica, los
trastornos genéticos y hereditarios, y los procesos patológicos. El
National Institute of Nursing Research (NINR, 2016) respalda y
proporciona financiación para investigación básica o de laboratorio.
Estos estudios podrían centrarse en aumentar nuestra comprensión
de la oxigenación, los trastornos del sistema inmunitario, los
patrones de alimentación y ejercicio, los trastornos del sueño, así
como el dolor y el estado de bienestar.
El lector podría llevar a cabo una valoración crítica inicial de los
estudios cuantitativos identificando si se realizó una investigación
básica o aplicada. Por ejemplo, Wacker y cols. (2016) llevaron a cabo
un estudio para aumentar los conocimientos sobre la patología
celular y muscular implicada en la osteomalacia hipofosfatémica
(raquitismo). Los investigadores han observado que las personas
con raquitismo suelen tener debilidad muscular, que complica aún
más su patología ósea crónica. Wacker y cols. (2016) realizaron un
estudio experimental básico de este proceso utilizando ratones que
tienen una fisiopatología muscular y ósea similar.
El estudio de Wacker y cols. (2016) revela la importancia de la

95
investigación de laboratorio para aumentar nuestra comprensión de
los efectos de los tratamientos sobre los procesos patológicos
celulares. Suelen realizarse investigaciones de laboratorio con
animales para aumentar los conocimientos sobre la genética de los
problemas de salud y con el fin de establecer una base para futuras
investigaciones en humanos en esta área. Un pilar fundamental en
investigación genética es el National Human Genome Research
Institute (NHGRI, 2017), que planifica y lleva a cabo un amplio
programa de investigación de laboratorio para aumentar nuestra
comprensión de la constitución genética humana, la genética de las
enfermedades y la posible terapia génica. Esta investigación básica
proporciona una base para la realización de «investigación clínica
aplicada para traducir la investigación genómica y genética en una
mayor comprensión de la enfermedad genética humana y para
desarrollar mejores métodos para la detección, la prevención y el
tratamiento de los trastornos genéticos y hereditarios» (NHGRI,
2017).

Investigación aplicada
La investigación aplicada también se denomina investigación
práctica y abarca las investigaciones científicas realizadas para
desarrollar conocimientos que influirán directamente en la práctica
clínica o la mejorarán. El objetivo de la investigación aplicada es
resolver problemas, tomar decisiones y/o predecir o controlar los
resultados en situaciones prácticas de la vida real. Los hallazgos de
los estudios aplicados también pueden tener un valor incalculable
para que los legisladores realicen cambios que aborden los
problemas de salud y sociales. Muchos de los estudios llevados a
cabo en enfermería son estudios aplicados, porque los
investigadores han elegido centrarse en los problemas clínicos y en
la valoración de las intervenciones de enfermería para mejorar los
resultados del paciente. La investigación aplicada también se utiliza
para probar teorías y validar su utilidad en la práctica clínica (Gray,
Grove y Sutherland, 2017). A menudo, los investigadores examinan
y valoran la utilidad en la práctica de los nuevos conocimientos
descubiertos a través de la investigación básica mediante la
investigación aplicada, lo que hace que ambos métodos sean
complementarios.

96
Finch, Griffin y Pacala (2017) llevaron a cabo un estudio aplicado
para determinar la eficacia de una intervención de tecnología de
vida cotidiana asistida por el entorno en la reducción de la
utilización de recursos sanitarios. Esta intervención consistió en la
monitorización remota pasiva de pacientes (adultos mayores),
combinada con la intervención proactiva de un coordinador
siempre que se detectaba una desviación del comportamiento basal.
Se determinó de forma independiente que los participantes en el
estudio cumplían los requisitos para estar en una residencia
geriátrica. Aunque los participantes no se distribuyeron de forma
aleatoria en grupos, la solidez del diseño del estudio se aumentó
mediante la inclusión de un grupo de control histórico, un grupo de
intervención y un grupo que declinó la intervención. La
intervención duró 12 meses y los investigadores midieron las
reclamaciones a seguros que realizaron los participantes del estudio
durante este período. Aunque los hallazgos no fueron
estadísticamente significativos, el grupo intervención recurrió
menos a los cuidados supervisados, tuvo menos visitas a urgencias
e ingresos hospitalarios, así como menores costes por urgencias que
el grupo control histórico o el grupo sin intervención.
Los hallazgos de Finch y cols. (2017) respaldan aún más la
inversión en tecnologías pasivas para preservar la seguridad y la
salud de los ancianos frágiles. Estos hallazgos, combinados con los
de estudios adicionales en esta área, tienen el potencial de generar
un conocimiento importante para la provisión de asistencia basada
en la evidencia en ancianos frágiles que viven en la comunidad. Los
estudios aplicados con un rigor y control elevados proporcionan
una evidencia de investigación sólida para la práctica.

Rigor en investigación cuantitativa


El rigor es la lucha por la excelencia en investigación y requiere
disciplina, fidelidad a los detalles, precisión y exactitud. Un estudio
cuantitativo realizado rigurosamente tiene herramientas de medida
precisas, una muestra representativa y un diseño del estudio
firmemente controlado. La valoración crítica del rigor de un estudio
implica examinar el razonamiento usado para llevar a cabo el
estudio. El razonamiento lógico, incluidos los razonamientos
deductivo e inductivo (v. cap. 1), es esencial para el desarrollo de

97
los estudios cuantitativos (Chinn y Kramer, 2015). El proceso de
investigación, que se describe más adelante en este capítulo, consta
de pasos específicos que se desarrollan rigurosamente con un
detalle meticuloso y que se relacionan de forma lógica en estudios
descriptivos, de correlación, cuasiexperimentales y experimentales.
Otro aspecto del rigor es la precisión, que abarca exactitud,
detalle y orden. La precisión es evidente en la declaración concisa
del objetivo de investigación y el desarrollo detallado del diseño del
estudio. No obstante, el ejemplo más explícito de precisión es la
medida o cuantificación de las variables del estudio (Waltz,
Strickland y Lenz, 2017). Por ejemplo, un investigador podría usar
un monitor cardiaco para medir y registrar la frecuencia cardiaca de
los sujetos en una base de datos durante un programa de ejercicio,
en lugar de palpar el pulso radial durante 30 segundos y registrarlo
en una hoja de recogida de datos. La precisión es esencial para la
transparencia en la investigación, de modo que otros investigadores
conozcan lo más explícitamente posible los pasos y elementos
exactos que constituyen un estudio. La precisión permite la
replicación y la variación, que son necesarias para que otros
científicos validen o amplíen los hallazgos.

Control en investigación cuantitativa


El control implica la imposición de reglas por parte de los
investigadores para disminuir la posibilidad de error, lo que
aumenta la probabilidad de que los hallazgos del estudio sean un
reflejo exacto de la realidad. Las reglas que se usan para conseguir
el control en investigación se denominan diseño. Los estudios
cuantitativos incluyen varios grados de control que varían desde no
controlado hasta muy controlado, dependiendo del tipo de estudio.
En la tabla 2.1, se presentan ejemplos de estudios cuantitativos que
se describen en este capítulo y el nivel de control logrado en ellos.
Los estudios descriptivos y de correlación se realizan
rigurosamente, pero a menudo se diseñan con un mínimo control
del investigador, porque no se implementa ninguna intervención y
los participantes en el estudio se examinan estando en su entorno
natural, como el hogar, el trabajo, el colegio o un centro sanitario (v.
fig. 2.1).

98
TABLA 2.1
CONTROL EN INVESTIGACIÓN CUANTITATIVA

Datos de Moon, H., Rote, S. y Beaty, J. A. (2017). Caregiving setting and


Baby Boomer caregiver stress processes: Findings from the National Study
of Caregiving (NSOC). Geriatric Nursing, 38(1), 57-62; George, L. E.,
Locasto, L. W., Pyo, K. A. y Cline, T. W. (2017). Effect of the dedicated
education unit on nursing student self-efficacy: A quasi-experimental
research study. Nurse Education in Practice, 23(1), 48-53; Liao, L. Y.,
Chung, W. S. y Chen, K. M. (2017). Free radicals and antioxidant enzymes
in older adults after regular senior elastic band exercising: An experimental
randomized controlled pilot study. Journal of Advanced Nursing, 73(1), 108-
111.
Los estudios cuasiexperimentales se centran en determinar la
eficacia de una intervención a la hora de producir un resultado
deseado en un entorno parcialmente controlado. Estos estudios se
realizan con un mayor control de las variables externas, selección
de los sujetos y entornos, e implementación de la intervención
(Shadish y cols., 2002; v. tabla 2.1). Sin embargo, los estudios
experimentales son el tipo de investigación cuantitativa más
controlada realizada para examinar el efecto de intervenciones
sobre variables dependientes. Los estudios experimentales suelen
realizarse en participantes en unidades experimentales de centros
sanitarios o en animales en el laboratorio. Por ejemplo, Wacker y
cols. (2016) estudiaron ratones para comprender los efectos de la
osteomalacia hipofosfatémica sobre el músculo esquelético. Los
elementos más frecuentes que se controlan en los estudios
cuantitativos se muestran en el cuadro 2.1.

CUADRO 2.1 ELEMENTOS CONTROLADOS EN


INVESTIGACIÓN CUANTITATIVA

99
• Variables externas.
• Selección del(de los) entorno(s).
• Proceso de muestreo.
• Asignación de los participantes del estudio a grupos.
• Desarrollo e implementación de las intervenciones del estudio.

Variables externas
Mediante el control, el investigador puede reducir la influencia de
variables externas. Las variables externas existen en todos los
estudios y pueden interferir con la obtención de un conocimiento
claro de las relaciones entre las variables del estudio. Por ejemplo, si
un estudio se centra en el efecto del tratamiento de relajación en la
percepción del dolor durante las incisiones quirúrgicas, los
investigadores tendrían que controlar variables externas, como el
tipo y momento de la incisión quirúrgica, la cantidad y el tipo de
analgésicos administrados tras la cirugía, para evitar su influencia
en la percepción del dolor por el paciente. La selección únicamente
de pacientes con incisiones abdominales que están hospitalizados y
que reciben un solo tipo de analgésico intravenoso para el dolor tras
la cirugía controlaría algunas de estas variables externas.

Entornos de investigación
El entorno es la localización en la que se realiza un estudio. Existen
tres entornos habituales para la realización de una investigación:
natural, parcialmente controlado y muy controlado (v. tabla 2.1).
Un entorno natural, o entorno de campo, es una situación o un
entorno de la vida real no controlado. La realización de un estudio
en un entorno natural significa que el investigador no manipula ni
modifica el entorno para el estudio. Los estudios descriptivos y de
correlación se llevan a cabo a menudo en entornos naturales. Un
entorno parcialmente controlado es aquel que el investigador ha
manipulado o modificado de alguna manera. Un número creciente
de estudios de enfermería se están realizando en entornos
parcialmente controlados para limitar los efectos de variables
externas sobre los resultados del estudio. Un entorno muy
controlado es aquel que está construido artificialmente y
desarrollado con el único objetivo de llevar a cabo una

100
investigación. Los laboratorios, centros de investigación y las
unidades de pruebas en universidades o centros sanitarios son
entornos muy controlados en los que a menudo se realizan estudios
de laboratorio y experimentales. Múltiples entornos con un control
importante de las variables externas suelen proporcionar unos
resultados más precisos y creíbles en los estudios cuantitativos.

Muestreo y asignación de los participantes a grupos


El muestreo es un proceso de selección de participantes que
representan a la población que se estudia. El muestreo aleatorio
suele proporcionar una muestra que es representativa de una
población, porque cada uno de los miembros se selecciona
independientemente y tiene la misma oportunidad o probabilidad
de ser incluido en el estudio. En investigación cuantitativa, se usan
muestras aleatorias y no aleatorias. En investigación de enfermería,
es muy difícil obtener una muestra seleccionada aleatoriamente, por
lo que los estudios cuantitativos a menudo se realizan con muestras
no aleatorias. Para aumentar el control y el rigor de un estudio y
disminuir el potencial de sesgo (desviación de los hallazgos fuera
de lo que es verdadero o exacto), en los estudios
cuasiexperimentales y experimentales, los participantes que se
seleccionan inicialmente con un método de muestreo no aleatorio a
menudo se asignan de forma aleatoria al grupo de intervención o al
grupo control. Por ejemplo, Liao y cols. (2017) inicialmente
obtuvieron su muestra de ancianos usando un método de muestreo
no aleatorio por conveniencia. Sin embargo, la solidez del diseño
del estudio aumentó mediante la asignación aleatoria de estos
ancianos para recibir la intervención de ejercicio con banda elástica
(grupo experimental) o seguir con su actividad habitual (grupo de
comparación).

Intervenciones del estudio


Los estudios cuasiexperimentales y experimentales examinan el
efecto de una variable independiente o intervención sobre una
variable dependiente o resultado. Muchos estudios de intervención
en enfermería se realizan para establecer una PBE en dicha
disciplina. El control del desarrollo y de la aplicación de una
intervención en estudio aumenta la validez del diseño del estudio

101
(v. cap. 8) y la credibilidad de los hallazgos. Una intervención en
estudio debe: 1) desarrollarse de forma clara y precisa, 2) aplicarse
de forma consistente y 3) examinarse para valorar su eficacia a
través de la medición de calidad de las variables dependientes. El
desarrollo detallado de una intervención de calidad y su aplicación
homogénea se denominan fidelidad de la intervención (Eymard y
Altmiller, 2016; Murphy y Gutman, 2012).

SOLUCIÓN DE PROBLEMAS Y
PROCESOS DE ENFERMERÍA:
BASES PARA LA COMPRENSIÓN
DEL PROCESO DE INVESTIGACIÓN
CUANTITATIVA
La investigación es un proceso similar en cierta forma a otros
procesos. Por tanto, el bagaje adquirido en las fases iniciales de
formación en enfermería en lo que respecta a la solución de
problemas y el proceso de enfermería también es útil para la
investigación. Un proceso consta de un propósito, una serie de
acciones y una meta. El propósito proporciona la dirección para la
aplicación de una serie de acciones para conseguir una meta
identificada o resultado. Los pasos específicos del proceso pueden
revisarse y volver a aplicarse para alcanzar el punto final u objetivo.
En la tabla 2.2 se relacionan los pasos del proceso de solución de
problemas, el proceso de enfermería y el proceso de investigación.
Relacionar el proceso de investigación con los procesos de solución
de problemas y de enfermería puede ser útil para entender los
pasos del proceso de investigación cuantitativa.

TABLA 2.2
COMPARACIÓN DEL PROCESO DE SOLUCIÓN DE
PROBLEMAS, EL PROCESO DE ENFERMERÍA Y EL
PROCESO DE INVESTIGACIÓN

102
Comparación de los procesos de solución
de problemas y de enfermería
El proceso de solución de problemas implica: 1) la recogida
sistemática de datos para identificar un problema, dificultad o
dilema, 2) determinar los objetivos relacionados con el problema, 3)
identificar posibles enfoques o soluciones para conseguir esos
objetivos (planificación), 4) implementar las soluciones
seleccionadas y 5) evaluar la obtención del objetivo (Chinn y
Kramer, 2015). La solución de problemas se usa frecuentemente en
las actividades diarias y en la práctica enfermera. Por ejemplo, la
solución de problemas se emplea al escoger la ropa, cuando se
decide dónde vivir o al girar a un paciente con una cadera
fracturada.
El proceso de enfermería es un subgrupo dentro del proceso de
solución de problemas. Los pasos del proceso de enfermería son:
valoración, diagnóstico, planificación, implementación, evaluación
y modificación (v. tabla 2.2). La valoración consiste en la recogida e
interpretación de datos subjetivos (anamnesis) y objetivos
(exploración física) para el desarrollo de diagnósticos de
enfermería. Estos diagnósticos orientan los pasos restantes del
proceso de enfermería, al igual que el paso de identificación del
problema dirige el resto de pasos del proceso de solución de
problemas. El paso de la planificación en el proceso de enfermería
es el mismo que en el proceso de solución de problemas. Ambos
procesos implican implementación (puesta en práctica del plan) y
evaluación (determinación de la eficacia del proceso). Si el proceso

103
es ineficaz, los profesionales de enfermería deben revisar todos los
pasos y corregirlos (modificar) como sea necesario para conseguir
resultados de calidad para el paciente y la familia. Estos
profesionales implementan el proceso de enfermería hasta que se
resuelven los diagnósticos y se logran los objetivos identificados.

Comparación de los procesos de enfermería


e investigación
El proceso de enfermería y el proceso de investigación tienen
similitudes y diferencias importantes. Ambos procesos son
similares porque implican el pensamiento crítico abstracto y el
razonamiento complejo. Estos procesos ayudan a identificar nueva
información, descubren relaciones y hacen predicciones acerca de
fenómenos. En ambos procesos se reúne información, se hacen
observaciones, se identifican problemas, se desarrollan planes
(metodología) y se llevan a cabo acciones (recogida y análisis de
datos). Ambos procesos se revisan para valorar la eficacia y la
eficiencia; el proceso de enfermería se evalúa y en el proceso de
investigación se determinan los resultados (v. tabla 2.2). La
implementación de ambos procesos amplía y mejora el
conocimiento del usuario. Con este aumento del conocimiento y del
pensamiento crítico, el usuario puede implementar procesos y
estudios de enfermería cada vez más complejos.
El conocimiento del proceso de enfermería ayudará a entender el
proceso de investigación. Sin embargo, el proceso de investigación
es más complejo que el proceso de enfermería e implica la
aplicación rigurosa de diversos métodos de investigación (Creswell,
2014). El proceso de investigación también tiene un enfoque más
amplio que el proceso de enfermería, en el que el profesional se
centra en un paciente específico y su familia. Durante el proceso de
investigación cuantitativa, el investigador se centra en grupos
grandes de individuos, como una población de pacientes con
hipertensión. Además, los investigadores deben ser conocedores del
mundo de la enfermería para identificar los problemas que
requieren estudio. Este conocimiento procede de experiencias
clínicas o personales y de la realización de una revisión de la
literatura relevante (v. cap. 6).

104
Los fundamentos teóricos del proceso de investigación son
mucho más sólidos que los del proceso de enfermería. Todos los
pasos del proceso de investigación están relacionados entre sí de
forma lógica, así como con las bases teóricas del estudio (v. cap. 7).
La realización de investigación requiere mayor precisión, rigor y
control que los necesarios para la implementación del proceso de
enfermería. Los resultados de la investigación suelen compartirse
con un gran número de profesionales de enfermería y de otras áreas
de la salud a través de presentaciones y publicaciones. Además, los
resultados de varios estudios pueden sintetizarse para proporcionar
evidencias claras para la práctica enfermera (Melnyk y cols., 2017).

IDENTIFICACIÓN DE LOS PASOS DEL


PROCESO DE INVESTIGACIÓN
CUANTITATIVA
El proceso de investigación cuantitativa implica la
conceptualización de un proyecto de investigación, la planificación
e implementación de ese proyecto y la comunicación de los
hallazgos. En la figura 2.2 se muestran los pasos del proceso de
investigación cuantitativa que suelen incluirse en un informe de
investigación. La figura ilustra el flujo lógico del proceso a medida
que un paso se desarrolla progresivamente sobre otro. El proceso de
investigación se muestra en un círculo porque hay un flujo de ida y
vuelta a medida que se desarrollan e implementan los diferentes
pasos de un estudio. Los pasos del proceso de investigación
cuantitativa se presentan aquí brevemente; en los capítulos 4 a 11 se
describen con más detalle. Para presentar los pasos del proceso de
investigación cuantitativa se usa como ejemplo el estudio de
correlación descriptivo realizado por Moon, Rote y Beaty (2017)
sobre las relaciones entre los procesos de estrés del cuidador en los
cuidadores de la generación del baby-boom (GBB) y el entorno de
cuidado.

105
FIG 2.2 Pasos del proceso de investigación
cuantitativa.

Problema y propósito de la investigación


Un problema de investigación es un área de interés en la que existe
una laguna en el conocimiento necesario para la práctica enfermera.
La declaración del problema en un estudio suele identificar un área
de interés para una población particular que requiere investigación.
A continuación, se realiza la investigación para generar un
conocimiento esencial que aborde el problema con el objetivo
último de desarrollar una evidencia de investigación sólida para la
práctica de enfermería (Brown, 2018; Melnyk y cols., 2017). El
problema de investigación suele ser amplio y podría servir de base
para varios estudios. El propósito de la investigación se desarrolla
a partir del problema e identifica el enfoque específico u objetivos

106
específicos del estudio. El elemento central de un estudio
cuantitativo podría ser identificar, describir o explicar una
situación, predecir una solución para una situación o controlar una
situación para producir resultados positivos en la práctica. El
propósito incluye las variables, la población y a menudo el entorno
del estudio (v. cap. 5).
El tema de investigación de Moon y cols. (2017) fue el estrés del
cuidador, un tema que puede afectar a millones de personas de la
GBB a medida que llegan a la edad de jubilación. Estas personas se
enfrentan a responsabilidades como cuidadores de sus progenitores
ancianos al mismo tiempo que abordan sus propios problemas
relacionados con el envejecimiento. El objetivo de este estudio es
analizar las relaciones entre las variables importantes para los
procesos de estrés del cuidador de las personas de la GBB. El
problema y el propósito del estudio se muestran en el Ejemplo de
investigación 2.1.

EJEMPLO DE INVESTIGACIÓN 2.1


Problema y propósito
Extracto del estudio de investigación
Problema de investigación
En Estados Unidos, hay más de 46 millones de personas de 65 años o más
y uno de los principales causantes del rápido envejecimiento de la
población es la generación del baby-boom (GBB, nacidos entre 1946 y
1964)... En 2040, cuando todas las personas de la GBB sean mayores de
65 años, los ancianos supondrán más del 20% de la población general
estadounidense... Muchas de las personas cuidadas por personas de la
GBB tienen 85 años o más y, aunque la mayoría de los ancianos que
reciben cuidados viven en la comunidad, el 13% reside en entornos
institucionales... Una comprensión mejor del bienestar emocional y de la
salud física de los cuidadores de la GBB (CGBB) será beneficioso no solo
para los profesionales sanitarios, sino también para los propios cuidadores
familiares, con el fin de aumentar la concienciación tanto sobre su salud
como sobre las áreas para mejorar su bienestar. (Moon y cols., 2017,
págs. 57-58)

107
Propósito de la investigación
El objetivo de este estudio fue proporcionar una comprensión exhaustiva
del modo en el que el entorno y la experiencia del cuidado están
relacionados en los CGBB. (Moon y cols., 2017, pág. 57)

Revisión de la literatura relevante


Los investigadores realizan una revisión de la literatura relevante
para crear un panorama de lo que se conoce y lo que no se conoce
acerca de un problema en particular y para documentar por qué
debe realizarse el estudio. La literatura relevante incluye solo
aquellas fuentes que son pertinentes o muy importantes porque
proporcionan un conocimiento en profundidad necesario para
estudiar un problema seleccionado (Aveyard, 2014). A menudo, la
sección de revisión de la literatura concluye con un párrafo de
resumen que indica los conocimientos actuales sobre un área del
problema e identifica la investigación adicional necesaria para
desarrollar la evidencia esencial para la práctica (v. cap. 6).
Moon y cols. (2017) presentaron una revisión de la literatura con
estudios relevantes que proporcionó la base para la sección del
propósito y métodos de su estudio. Los aspectos clave de esta
revisión se presentan en el Ejemplo de investigación 2.2.

EJEMPLO DE INVESTIGACIÓN 2.2


Revisión de la literatura
Extracto del estudio de investigación
Las expectativas de que los cuidadores estarán libres de angustia o de
carga después de ingresar a un familiar anciano en un centro de cuidados
crónicos son un mito... Los estudios sugieren que los cuidadores familiares
de ancianos en entornos de cuidados residenciales, a pesar de liberarse de
las tareas de los cuidados directos... siguen refiriendo angustia continuada
tras la institucionalización, con depresión, tristeza, pérdida, culpa y
posibles conflictos familiares... Este riesgo de angustia se debe
probablemente a la implicación continua del cuidador familiar tras el
ingreso, aunque de formas nuevas y diferentes: visitas, interacción con el

108
personal y los familiares, provisión de ayuda instrumental como
transporte y toma de decisiones sobre asuntos económicos y asistencia
sanitaria... La mayoría de los estudios disponibles sobre los cuidadores de
personas que reciben cuidados asistenciales se han centrado en las
residencias geriátricas y en los cambios del rol del cuidador familiar tras la
institucionalización.
De los pocos estudios realizados sobre el tema, las
investigaciones demuestran que los cuidadores de personas con
demencia que viven en la comunidad refieren una mayor carga
relacionada con el trabajo que los cuidadores de personas con
demencia que viven en centros asistidos, y que los cuidadores de
pacientes que viven en centros asistidos refieren una carga mayor
que los de pacientes ingresados en residencias geriátricas...
Además, un estudio sugiere que los cuidadores pueden continuar
sintiendo culpa al menos 10 meses después de que su familiar
anciano haya sido ingresado en una residencia geriátrica o en un
hogar asistencial residencial (Kolanowski y cols., 2012), lo que
indica un riesgo de depresión y de otros resultados de salud
negativos. Se ha prestado menos atención a los factores predictivos
de carga y bienestar de los cuidadores familiares de personas que
viven en entornos de cuidados residenciales distintos a residencias
geriátricas, incluidos centros de vida asistida, hogares asistenciales
y centros de atención continuada para jubilados... Estos entornos
de cuidados residenciales distintos a residencias geriátricas tienden
a acoger a residentes con menos discapacidad y tienen menos
supervisión intensiva, lo que permite a los cuidadores y a los
ancianos que viven en ellos unas visitas más frecuentes y una
implicación con las tareas de cuidados instrumentales... Aunque la
mayor parte del cuidado institucional se proporciona en entornos
de residencias geriátricas, en los últimos años ha aumentado el uso
de entornos distintos a dichas residencias... sobre todo a medida
que la generación del baby-boom hace frente a las obligaciones de
la vida laboral y familiar.
En particular, los CGBB... reciben múltiples demandas de
cuidado. Por ejemplo, a diferencia de las generaciones previas, es
previsible que las personas de la GBB pasen 40 años
simultáneamente trabajando y proporcionando cuidado personal y
ayuda económica a sus hijos, progenitores ancianos, hermanos

109
mayores, cónyuges y/o hijos de sus cónyuges y a ellos mismos...
Los proveedores de cuidados institucionales aún se enfrentan a los
desafíos de comprender las necesidades y experiencias de los
cuidadores familiares, y les puede resultar difícil diseñar las
intervenciones apropiadas para estos cuidadores (Wethington y
Burgio, 2015). (Moon y cols., 2017, págs. 57-58)

Marco del estudio


El marco teórico es la base abstracta que permite al investigador
relacionar los hallazgos con el cuerpo de conocimientos de
enfermería. En investigación cuantitativa, el marco es una teoría
comprobable que se ha desarrollado en enfermería u otra disciplina,
como psicología, fisiología, patología o sociología. Una teoría
consta de axiomas, un conjunto integrado de conceptos definidos y
afirmaciones relacionales que presentan una visión de un fenómeno
y pueden usarse para describir, explicar, predecir o controlar el
fenómeno (Chinn y Kramer, 2015). Los axiomas son declaraciones
tenidas por ciertas o consideradas verdaderas, aunque no hayan
sido probadas científicamente, y constituyen una base para el
fenómeno descrito por la teoría. Un concepto es un término que
describe de forma abstracta y denomina un objeto o fenómeno,
proporcionándole así una identidad o significado distintivo.
Las declaraciones relacionales de las teorías identifican las
relaciones entre dos o más conceptos que se ponen a prueba en la
investigación. En los estudios cuantitativos, los investigadores
ponen a prueba las declaraciones relacionales seleccionadas de la
teoría, pero habitualmente no la teoría completa. El marco teórico
de un estudio puede expresarse como un mapa o diagrama de las
relaciones que proporcionan la base para el estudio y se describe en
el informe de la investigación, o puede presentarse de forma
narrativa (v. cap. 7).
El marco teórico del estudio de Moon y cols. (2017) fue el estrés y
el modelo de afrontamiento del cuidador (Haley, Levine, Brown y
Bartolucci, 1987) y lo presentaron de forma narrativa en el texto
como se describe en el Ejemplo de investigación 2.3.

110
EJEMPLO DE INVESTIGACIÓN 2.3
Marco teórico
Extracto del estudio de investigación
Entre los factores predictivos de bienestar del cuidador se incluyen los
factores estresantes primarios, que engloban tanto a) indicadores objetivos
del estado de salud cognitiva y física del receptor de cuidados (RC) como
b) indicadores subjetivos de sobrecarga del cuidador. Los factores
estresantes en el dominio del cuidado influyen en las tensiones de rol
secundarias sobre la cohesión y economía familiares, así como en las
tensiones intrapsíquicas, incluidas la autoestima y la pérdida del sentido
de uno mismo. Un componente clave de este marco es el papel de los
antecedentes y los recursos, que influyen en todas las etapas del proceso de
estrés del cuidado. Nosotros no tenemos todos los factores propuestos del
modelo de proceso de estrés del cuidador en nuestra serie de datos. Sin
embargo, sí tenemos variables para los factores estresantes primarios clave
e indicadores de salud del RC (p. ej., EA [enfermedad de Alzheimer] u otra
demencia), así como indicadores de discapacidad, como necesidad de ayuda
con las actividades diarias y si había una programación regular de la
provisión de cuidados. También hemos incluido indicadores de tensiones
secundarias, como dificultades económicas y calidad de la relación,
recursos (incluido el apoyo informal), así como bienestar emocional y
salud general autoevaluada de los cuidadores. (Moon y cols., 2017, pág.
58)

Objetivos, preguntas o hipótesis de la


investigación
Los investigadores formulan objetivos, preguntas o hipótesis de
investigación para salvar la distancia entre el problema y propósito
de la investigación, más abstractos, y el diseño del estudio y la
planificación para la recogida y el análisis de los datos. Los
objetivos, preguntas e hipótesis tienen un enfoque más reducido
que el propósito y a menudo especifican solo una o dos variables de
investigación. También identifican la relación entre las variables e
indican la población que se va a estudiar. Algunos estudios

111
descriptivos tienen solo un propósito de investigación, mientras
que otros tienen un propósito y, además, objetivos o preguntas para
dirigir el estudio. Algunos estudios de correlación tienen un
propósito y preguntas o hipótesis específicas. Los estudios
cuasiexperimentales y experimentales deben incluir hipótesis para
dirigir su realización y la interpretación de los hallazgos (Gray y
cols., 2017; v. cap. 5).
Moon y cols. (2017) plantearon dos preguntas de investigación,
que se recogen en el Ejemplo de investigación 2.4.

EJEMPLO DE INVESTIGACIÓN 2.4


Preguntas de investigación
Extracto del estudio de investigación

1. ¿Hay diferencias en cuanto a factor estresante primario, factores


estresantes secundarios, recursos y resultados entre los cuidadores
de ancianos en entornos de cuidados residenciales distintos a
residencias geriátricas y los de CGBB de ancianos en la
comunidad?
2. ¿Hay diferencias en cuanto a los factores asociados con el bienestar
emocional y el estado de salud autopercibida de los cuidadores, en
función de su entorno (cuidados residenciales distintos a
residencias geriátricas o comunidad)? (Moon y cols., 2017, pág.
58)

Variables del estudio


El propósito de la investigación y sus objetivos, preguntas o
hipótesis identifican las variables que se deben examinar en un
estudio. Las variables son conceptos con diversos niveles de
abstracción que se miden, manipulan o controlan en un estudio. En
un estudio, los conceptos más concretos, como temperatura, peso o
presión arterial, se denominan variables. Los conceptos más
abstractos, como creatividad, empatía o apoyo social, en ocasiones
se denominan conceptos de investigación.

112
Los investigadores hacen operacionales las variables o conceptos
de un estudio mediante la identificación de definiciones
conceptuales y operacionales. Una definición conceptual
proporciona un significado teórico a una variable o concepto (Gray
y cols., 2017) y deriva de una definición del concepto por parte de
un teórico o se desarrolla mediante el análisis del concepto. Las
definiciones conceptuales de las variables relacionan los conceptos
seleccionados en el marco teórico del estudio con las variables de
dicho estudio. Los investigadores desarrollan una definición
operacional, de modo que la variable pueda medirse o que se
pueda aplicar una intervención en un estudio (v. cap. 5). El
conocimiento adquirido al estudiar la variable aumentará la
comprensión del concepto teórico del marco del estudio que
representa la variable.
Moon y cols. (2017) identificaron con claridad las siguientes
variables del estudio en su propósito y preguntas de investigación:
factores estresantes primarios, factores estresantes secundarios,
recursos, contexto y salud del cuidador, así como resultados del
bienestar emocional y de la salud general autoevaluada. Se
proporcionaron definiciones conceptuales claras para las dos
variables de factores estresantes primarios y estresantes
secundarios a partir del marco teórico conceptual. Las definiciones
conceptuales y operacionales para los factores estresantes primarios
y secundarios se muestran como ejemplo en el Ejemplo de
investigación 2.5.

EJEMPLO DE INVESTIGACIÓN 2.5


Variables
Extracto del estudio de investigación
Factores estresantes primarios
Definición conceptual
Los factores estresantes primarios incluyeron el estatus de demencia del
RC, el nivel de cuidado proporcionado por el cuidador y si el cuidado se
proporcionó según una programación regular. (Moon y cols., 2017, pág.

113
58)
Definición operacional
Definimos el estatus de demencia del RC utilizando un informe de los
participantes en el National Health & Aging Trends Study (NHATS) o
por un intermediario (si un médico dijo al RC que tenía demencia o EA).
Creamos una variable de nivel de actividades de cuidado basada en la
suma de las respuestas a las cinco preguntas del NSOC [National Study
of Caregiving] relacionadas con la ayuda con: 1) tareas domésticas, 2)
compras, 3) cuidado personal, 4) moverse por la casa y 5) transporte. Las
categorías de respuesta oscilaron de 1 = casi nunca a 4 = a diario. Unas
puntuaciones más elevadas indicaron un nivel mayor de implicación en la
ayuda con las actividades diarias. También creamos una variable para
determinar si el cuidado se proporcionó según una programación regular
o no (0 = variable, 1 = programación regular). (Moon y cols., 2017, pág.
58)
Factores estresantes secundarios
Definición conceptual
Los factores estresantes secundarios incluyeron la percepción de las
dificultades económicas y la calidad de la relación entre el cuidador y el
RC. (Moon y cols., 2017, pág. 58)
Definición operacional
Se preguntó a los encuestados si proporcionar cuidados al RC era difícil
desde el punto de vista económico (1 = sí, 0 = no). Definimos la calidad de
la relación del cuidador con el anciano como la suma de cuatro preguntas
(cuánto disfruta el cuidador de estar con el RC, cuánto aprecia el RC al
cuidador, cuánto discute el RC con el cuidador y cuánto sacaba de quicio
el RC al cuidador)... Unas puntuaciones más elevadas indicaban una
relación mejor. (Moon y cols., 2017, pág. 58)

Diseño del estudio


El diseño de la investigación es un proyecto para la realización de
un estudio que maximiza el control sobre los factores que podrían
interferir con el resultado deseado del estudio. El tipo de diseño
orienta la selección de la población, los procedimientos de
muestreo, los métodos de medición y la planificación para la
recogida y el análisis de los datos. La elección del diseño de

114
investigación depende de lo que se conoce y lo que no se conoce
acerca del problema de investigación, la pericia del investigador, el
propósito del estudio y la intención de generalizar los hallazgos. En
ocasiones, el diseño de un estudio indica que se llevó a cabo un
estudio piloto. Un estudio piloto suele ser una versión reducida de
un estudio propuesto y los investigadores suelen realizarlo para
perfeccionar el proceso de muestreo del estudio, el tratamiento o la
medida de las variables (Her-zog, 2008).
Los diseños se han desarrollado para cumplir las necesidades
únicas de la investigación a medida que surgen; por ello, con el
tiempo se han desarrollado diversos diseños descriptivos, de
correlación, cuasiexperimentales y experimentales. En los estudios
descriptivos y de correlación, no se administra tratamiento o
intervención, de modo que los propósitos del diseño de estos
estudios consisten en mejorar la precisión de la medición, describir
lo que existe y clarificar las relaciones que proporcionan una base
para los estudios cuasiexperimentales y experimentales. Los
estudios cuasiexperimentales y experimentales suelen implicar la
presencia de grupos de intervención y de control, y se centran en
conseguir altos niveles de control, así como la precisión en la
medición (v. tabla 2.1). Generalmente, en un informe de
investigación, el diseño de un estudio se encuentra en la sección de
metodología. En el capítulo 8 se presentan diversos diseños que
suelen implementarse en los estudios cuantitativos.
Moon y cols. (2017) no identificaron el diseño de su estudio. Sin
embargo, el propósito y las preguntas de investigación del estudio
indican que se realizó un estudio de correlación descriptivo con un
diseño descriptivo simple y un diseño de correlación predictivo. La
parte descriptiva del diseño proporcionaba una base para describir
y comparar las variables del estudio de factores estresantes
primarios, factores estresantes secundarios, recursos, contexto y
salud del cuidador, y resultados de salud emocional y salud física
general del cuidador (v. Ejemplo de investigación 2.1). La parte de
correlación predictiva del diseño se centraba en el examen de las
relaciones entre las variables del estudio y el uso de los factores
estresantes primarios y secundarios, recursos y contexto del RC
para predecir la salud emocional y física general de los CGBB (v.
Ejemplo de investigación 2.2)

115
Población y muestra
La población es el conjunto de todos los elementos (individuos,
objetos o sustancias) que cumplen ciertos criterios para la inclusión
en un estudio. Una muestra es un subgrupo de la población
seleccionada para un estudio particular y los miembros de una
muestra son los participantes. El muestreo se describió al principio
de este capítulo y el capítulo 9 proporciona el fundamento para la
valoración crítica de poblaciones, muestras y entornos en los
informes de investigación.
Moon y cols. (2017) utilizaron una base de datos existente que
incluía las variables que querían estudiar en la población de CGBB.
Estos autores ofrecieron una descripción detallada de la fuente de la
muestra de su estudio. Para este estudio, evaluaron solo un
subgrupo de los datos originales, que incluyó a los participantes
identificados como cuidador familiar según los criterios de
muestreo específicos. En el artículo se presentaron las características
de la muestra en una tabla y en la narración. El Ejemplo de
investigación 2.6 incluye una descripción de la muestra de este
estudio.

EJEMPLO DE INVESTIGACIÓN 2.6


Población y muestra
Extracto del estudio de investigación
Este estudio se basó en los datos secundarios del NSOC [National Study
of Caregiving], que es una muestra de cuidadores informales de 2007
identificados por beneficiarios de Medicare a partir de 65 años que
participaron en el estudio National Health and Aging Trends Study
(NHATS) de 2011, un estudio representativo a nivel nacional que recoge
datos de ancianos de forma anual. El NSOC recopila información sobre el
modo en el que el cuidador ayuda al anciano encuestado en el NHATS con
las actividades diarias junto con información sobre la propia salud, familia
e ingresos del cuidador... Se excluyó a los cuidadores que no habían nacido
entre 1946 y 1964 (n = 994). El NSOC incluye a todos los cuidadores
elegibles para los que los encuestados en el NHATS proporcionaron

116
información de contacto. Para identificar al cuidador primario de un RC
determinado, se contó el número de cuidadores entrevistados por cada
anciano. Si un anciano tenía un cuidador, se utilizó su información. Para
los ancianos con múltiples cuidadores, se identificó el cuidador primario
como aquel que realizaba la mayoría de las obligaciones de cuidados... Por
tanto, nuestros análisis incluyeron solo los cuidadores (N = 782) que
proporcionaron la mayoría de los cuidados a un anciano que viviese en la
comunidad o en un entorno de cuidados residenciales distinto a una
residencia geriátrica. (Moon y cols., 2017, pág. 58)

Métodos de medición
La medición es el proceso de «asignar números a objetos (o sucesos
o situaciones) de acuerdo con alguna regla» (Kaplan, 1964, pág.
177). Un componente de la medición es la instrumentación, que es
la aplicación de reglas específicas al desarrollo de un método o
instrumento de medida (Waltz y cols., 2017). Para medir una
variable específica de un estudio, se selecciona un instrumento. Los
datos numéricos generados con un instrumento pueden ser de nivel
nominal, ordinal, de intervalo o de razón de medición. El nivel de
medida, siendo el nominal la forma más inferior de medida y la
razón la más superior, determina el tipo de análisis estadístico que
puede realizarse con los datos. El capítulo 10 presenta el concepto
de medición, describe los diferentes tipos de métodos de medición
y proporciona una guía para la valoración crítica de las técnicas de
medición en los estudios.
Moon y cols. (2017) midieron los factores estresantes primarios y
secundarios utilizando las respuestas a la encuesta realizada a
cuidadores incluidas en el NSOC. (Estos instrumentos se
mencionaron anteriormente en la definición operacional de factores
estresantes primarios y secundarios.) En el Ejemplo de
investigación 2.7, se identifican las escalas y cuestionarios utilizados
para medir las otras variables del estudio. Los investigadores
proporcionaron descripciones de calidad de los métodos de
medición usados en su estudio e indicaron que estos métodos se
empleaban con frecuencia en otros estudios y se observó que eran
fiables (medición consistente) y válidos (exactitud en la medición de
una variable).

117
EJEMPLO DE INVESTIGACIÓN 2.7
Métodos de medición
Extracto del estudio de investigación
Recursos
Nosotros definimos el apoyo informal como la suma de tres preguntas
sobre la existencia de amigos de apoyo y la posibilidad de recurrir a redes
de apoyo (las opciones de respuesta incluyen 1 = sí, 0 = no). (Moon y
cols., 2017, págs. 58-59)
Antecedentes y salud del cuidador
Las características de los antecedentes incluyeron la edad del cuidador, el
sexo (0 = varón, 1 = mujer) y el nivel educativo (0 = secundaria o menos, 1
= estudios universitarios o más). Se preguntó a los participantes en el
NSOC sobre si habían tenido alguna enfermedad crónica de una lista de
10... Definimos el dolor crónico mediante un único ítem del NSOC (si el
participante había tenido molestias debido al dolor) (0 = no, 1 = sí).
(Moon y cols., 2017, págs. 58-59)
Resultados
Estimamos el bienestar emocional del cuidador como la suma de siete
preguntas (cada una con un rango de respuesta de cuatro niveles que
oscilaba de 1 = «nada en absoluto» a 4 = «casi a diario»). Las
puntuaciones más elevadas indicaban un mayor bienestar emocional
percibido. Clasificamos la salud general autoevaluada del cuidador en
cinco niveles, de mala (1) a excelente (5). (Moon y cols., 2017, págs. 58-
59)

Recogida de datos
La recogida de datos es la recopilación sistemática y precisa de la
información relevante para el propósito de la investigación o los
objetivos, preguntas o hipótesis específicos de un estudio. Para
recoger los datos, el investigador debe obtener permiso del entorno
o de la organización en la que se realizará el estudio. Los
investigadores también deben obtener el consentimiento de todos
los participantes en el estudio indicando su voluntad de estar en el

118
mismo. Con frecuencia, el investigador pide a los participantes en el
estudio que firmen un formulario de consentimiento que describe el
estudio, garantiza su confidencialidad e indica que pueden retirarse
de este en cualquier momento. El informe de la investigación debe
hacer constar el permiso de una organización para realizar el
estudio y el consentimiento de sus participantes (v. cap. 4).
Durante la recogida de los datos, los investigadores usan diversas
técnicas para medir las variables del estudio, como observaciones,
entrevistas, cuestionarios, escalas y mediciones biológicas. Cada vez
es mayor el número de estudios en los que el personal de
enfermería mide las variables fisiológicas y patológicas con equipos
de alta tecnología. Los investigadores recogen y registran
sistemáticamente los datos de cada participante en el estudio,
organizándolos de un modo que facilite su introducción en el
ordenador (v. cap. 10). La recogida de datos suele describirse en la
sección de metodología del informe de investigación bajo el
subepígrafe «Procedimientos».
Moon y cols. (2017) describen claramente su proceso de recogida
de datos en el Ejemplo de investigación 2.8 referente a los
procedimientos.

EJEMPLO DE INVESTIGACIÓN 2.8


Recogida de datos
Extracto del estudio de investigación
El NSOC recoge información sobre el modo en el que el cuidador ayuda al
anciano encuestado en el NHATS con las actividades diarias, junto con
información sobre la propia salud, familia e ingresos del cuidador...
Ningún encuestado en el NHATS del NSOC vivía en residencias
geriátricas (los encuestados en el NHATS del NSOC vivían en la
comunidad (n = 1.786) o en entornos de cuidados residenciales distintos a
residencias geriátricas (centros de vida asistida, hogares asistenciales y
centros de atención continuada para jubilados, n = 221). Se excluyó a los
cuidadores que no habían nacido entre 1946 y 1964 (n = 994). El NSOC
incluye a todos los cuidadores elegibles... para los que los encuestados en el
NHATS proporcionaron información de contacto. Para identificar al

119
cuidador primario de un RC determinado, se contó el número de
cuidadores entrevistados por cada anciano. Si un anciano tenía un
cuidador, se utilizó su información. En los ancianos con múltiples
cuidadores, identificamos el cuidador primario como aquel que realizaba la
mayoría de las obligaciones de cuidados (en función de la horas diarias) y
utilizamos su información (n = 180), eliminando a los cuidadores
secundarios (n = 231). Por tanto, nuestros análisis incluyeron solo a los
cuidadores (n = 782) que proporcionaban la mayor parte de los cuidados a
un anciano que viviese en una comunidad o en un entorno de cuidados
residenciales distinto a una residencia geriátrica. (Moon y cols., 2017,
pág. 58)

Análisis de datos
El análisis de datos reduce, organiza y otorga significado a los
datos. Las técnicas de análisis en investigación cuantitativa son los
análisis descriptivo e inferencial (v. cap. 11; Grove y Cipher, 2017) y
algunas técnicas sofisticadas de análisis avanzado. Los
investigadores basan su elección de las técnicas de análisis
principalmente en los objetivos, preguntas e hipótesis de
investigación, así como en el nivel de medición conseguido por los
métodos de medición. Los informes de investigación a menudo
indican las técnicas de análisis que se utilizaron en el estudio y este
contenido se presenta antes de los resultados del estudio. Los
resultados del proceso de análisis de los datos se encuentran en la
sección de resultados del informe de investigación; esta sección se
organiza mejor por los objetivos de la investigación, preguntas o
hipótesis del estudio.
Moon y cols. (2017) describieron las técnicas de análisis utilizadas
en los datos de su estudio en el Ejemplo de investigación 2.9. Los
resultados del estudio se presentaron en tablas y se describen en la
narración.

EJEMPLO DE INVESTIGACIÓN 2.9


Análisis de datos

120
Extracto del estudio de investigación
Utilizamos pruebas de la t independientes de dos colas y pruebas de χ2
para evaluar las diferencias de las características entre los CGBB de
ancianos que vivían en la comunidad y en entornos de cuidados
residenciales distintos a residencias geriátricas. (Moon y cols., 2017, pág.
59)
Resultados
…Los CGBB de ancianos que vivían en entornos de cuidados residenciales
distintos a residencias geriátricas referían un menor nivel de provisión de
ayuda con las actividades diarias, incluido el transporte (t(774) = 8,85, p
<0,001); una relación de mejor calidad con el RC (t(766 = −2,03, p
<0,001); una mejor salud física (t(558) = −4,054, p <0,0,01), y un mejor
bienestar emocional (t(762) = −2,055, p <0,05). Además, los CGBB de
ancianos en entornos de cuidados residenciales distintos a residencias
geriátricas referían un nivel mayor de apoyo informal (t(733) = −2,035, p
<0,05). Había también diferencias significativas en lo referente a
proporcionar cuidados con regularidad (χ2(1, N = 777) = 13,4, p <0,001) y
a dificultades económicas (χ2(1, N = 779) = 12,589, p <0,001). (Moon y
cols., 2017, pág. 59)

Moon y cols. (2017) también realizaron análisis de regresión para


predecir el bienestar emocional y la salud general percibida en los
dos grupos. El análisis de regresión es una técnica frecuente que se
utiliza en estudios de enfermería para realizar predicciones (v. cap.
11).

Discusión de los resultados de la


investigación
Los resultados obtenidos del análisis de los datos requieren
interpretación para cobrar sentido. La interpretación de los
resultados de investigación implica el examen de los resultados a
partir del análisis de los datos, la identificación de las limitaciones
del estudio, la exploración de la significación de los hallazgos, la
formulación de conclusiones, la generalización de los hallazgos, la
consideración de las implicaciones para la enfermería y la
sugerencia de estudios adicionales. Los resultados del estudio

121
suelen presentarse en la sección de discusión del informe de
investigación. Las limitaciones son restricciones en la metodología
y/o el marco del estudio que pueden reducir la credibilidad y la
posibilidad de generalización de los hallazgos. La generalización es
la extensión de las conclusiones obtenidas basándose en los
hallazgos de investigación en la muestra estudiada a una población
más grande. Las conclusiones del estudio proporcionan la base para
las implicaciones de los hallazgos respecto a la práctica e identifican
las áreas para investigaciones futuras (v. cap. 11). Los resultados del
estudio suelen presentarse en la sección de discusión del informe de
investigación. Moon y cols. (2017) proporcionaron la siguiente
discusión de los resultados de su estudio en el Ejemplo de
investigación 2.10.

EJEMPLO DE INVESTIGACIÓN 2.10


Discusión
Extracto del estudio de investigación
Aunque muchas investigaciones se han centrado en la experiencia de
cuidadores de ancianos que residen en la comunidad, menos estudios han
prestado atención a los cuidadores de ancianos que viven en instituciones,
sobre todo en centros de cuidados residenciales distintos a residencias
geriátricas, como centros de vida asistida, hogares asistenciales y centros
de atención continuada para jubilados. A la vista de esto, nuestro
propósito fue proporcionar unos conocimientos exhaustivos sobre la
demografía, la prevalencia de enfermedades crónicas, el estado de ánimo
percibido, los sentimientos y otras experiencias de cuidado de los CGBB de
ancianos que viven en entornos de cuidados distintos a residencias
geriátricas. Nuestros resultados contribuyen de varias formas al cuerpo de
investigaciones sobre cuidados. Nosotros abordamos la laguna existente
en la literatura sobre los CGBB, presentamos los resultados utilizando
datos estadounidenses y ponemos de relieve diferencias importantes en la
experiencia de cuidado entre los CGBB de ancianos que viven en entornos
de cuidados residenciales distintos a residencias de ancianos y en la
comunidad.
Nuestros hallazgos muestran la importancia de los antecedentes

122
de los cuidadores, en especial el sexo, los ingresos y el nivel
educativo. Los CGBB de ancianos que residen en la comunidad
(frente a los que viven en centros de cuidados residenciales
distintos a residencias de ancianos) tienden a referir menores
ingresos económicos en su hogar y un menor nivel educativo; sin
embargo, el nivel educativo se asoció con el estado de salud y de
bienestar para ambos grupos. Los recursos y dificultades
económicos también se relacionan con el estado de salud de los
CGBB con independencia del entorno de cuidados. De forma
global, más apoyos e intervenciones deberían centrarse en las
necesidades de los cuidadores con bajos ingresos y sus familias que
tienen menos recursos económicos para cubrir las complejas
necesidades de los RC. Además, la mayoría de los cuidadores del
estudio son mujeres que cuidan de mujeres. Los resultados
muestran que el internamiento en un centro de cuidados
residenciales distinto a una residencia geriátrica se relaciona con
un mayor bienestar emocional en las mujeres que en los varones y
la institucionalización puede ayudar a contrarrestar la carga de
afrontar múltiples tareas y necesidades familiares en las mujeres
CGBB. (Moon y cols., 2017, págs. 60-61)
Limitaciones y sugerencias para estudios adicionales
Nuestros hallazgos se enfrentan con varias limitaciones. En primer lugar,
utilizamos un diseño transversal (en el que todos los participantes en un
estudio se evalúan en el mismo momento), lo que limita la capacidad de
evaluar cualquier cambio a lo largo del tiempo en las relaciones entre los
factores estresantes, los resultados y los recursos. Las investigaciones
longitudinales de personas con demencia pueden ser particularmente
informativas cuando se evalúa el cambio durante períodos críticos o
puntos de transición (p. ej., traslado a otros centros, cambios funcionales
conductuales o cognitivos). Tal vez sea posible comprender el modo en el
que los factores estresantes, resultados y recursos cambian a lo largo del
tiempo en los cuidadores de ancianos en entornos de cuidados
residenciales distintos a residencias geriátricas, así como en los cuidadores
de ancianos que viven en la comunidad. En segundo lugar, este estudio se
basa en un análisis secundario de datos. Nos centramos en los cuidadores
que pasaron más tiempo proporcionando cuidados entre los múltiples
cuidadores de cada anciano. El estrés y el bienestar de los cuidadores
secundarios constituyen un tema importante para investigaciones

123
futuras... También nos centramos solo en los factores estresantes
primarios de los cuidadores relacionados directamente con el cuidado. No
se disponía de información sobre el impacto que la relación del cuidador
con el personal del centro o la satisfacción con dicho centro tiene en el
bienestar emocional y la salud del cuidador... Los estudios futuros
deberían incluir esta información en sus análisis de los efectos de los
factores estresantes en el bienestar y la salud percibida. (Moon y cols.,
2017, pág. 61)
Conclusiones e implicaciones para la práctica de
enfermería
Nuestros hallazgos contribuyen al conocimiento actual de varias formas
Los CGBB que continúan cuidando de sus seres queridos en entornos de
cuidados residenciales distintos a residencias geriátricas deberían recibir
más información sobre los modos en los que el cuidado proporcionado en
dichos entornos afecta a la experiencia del cuidado. Nuestros hallazgos
sobre la experiencia de los CGBB de ancianos en entornos de cuidados
residenciales distintos a residencias geriátricas y los de ancianos que viven
en la comunidad deberían aumentar nuestro conocimiento sobre la
experiencia del cuidado para la cohorte de cuidadores de la GBB. En
particular, proporcionamos evidencia de que el cuidado residencial para
RC podría ser útil no solo para la salud física de los cuidadores, sino
también para su bienestar emocional. Nuestros resultados también
aportan información crucial sobre los factores de riesgo para los CGBB de
ancianos en entornos de cuidados residenciales distintos a residencias
geriátricas y los de ancianos que viven en la comunidad. Por último,
hemos aportado información útil para que los profesionales sanitarios
identifiquen las necesidades de los CGBB, sobre todo los de ancianos en
entornos de cuidados residenciales distintos a residencias geriátricas.
(Moon y cols., 2017, pág. 61)

LECTURA DE INFORMES DE
INVESTIGACIÓN
La comprensión de los pasos del proceso de investigación y el
aprendizaje de nuevos términos relacionados con esos pasos
ayudará a la lectura de los informes de investigación. Un informe
de investigación resume los elementos principales de un estudio e

124
identifica las contribuciones de ese estudio al conocimiento de
enfermería. Los informes de investigación se presentan en
reuniones y conferencias profesionales y se publican en internet, así
como en revistas y en libros impresos. Los estudiantes y los nuevos
graduados en enfermería suelen encontrar difícil leer estos informes
y aplicar el conocimiento en la práctica. Es posible que el lector
haya tenido dificultades para localizar artículos de investigación o
para entender su contenido. Nos gustaría ayudar a superar algunas
de estas barreras y colaborar en la comprensión de la literatura de
investigación mediante: 1) la identificación de las fuentes que
publican informes de investigación; 2) la descripción del contenido
de un informe de investigación, y 3) la aportación de consejos para
la lectura de la literatura de investigación.

Fuentes de informes de investigación


Las fuentes más habituales de informes de investigación en
enfermería son las revistas profesionales. Los informes de
investigación son el elemento central de muchas revistas de
investigación en enfermería, que se citaron en el capítulo 1. Dos
revistas en particular, Applied Nursing Research y Clinical Nursing
Research, se centran en la comunicación de los hallazgos de la
investigación a los profesionales de enfermería en ejercicio. La
revista Worldviews on Evidence-Based Nursing se centra en ideas
innovadoras para el uso de la evidencia con el fin de mejorar de
forma global los cuidados del paciente.
Muchas de las revistas clínicas especializadas de enfermería
también otorgan una prioridad importante a la publicación de los
hallazgos de investigación. Algunas de las revistas clínicas que
publican muchos estudios son las siguientes: Geriatric Nursing,
Oncology Nursing Forum, Journal of Pediatric Nursing, Heart & Lung y
Nephrology Nursing. En Estados Unidos, se publican más de 100
revistas de enfermería y la mayoría de ellas incluyen artículos de
investigación. Los hallazgos de muchos estudios se comunican
ahora a través de internet, ya que las revistas tienen una versión
online; ciertos sitios web seleccionados incluyen las que presentan la
investigación sanitaria más actual (v. cap. 6).

125
Contenido de los informes de investigación
Llegados a este punto, el lector puede sentirse abrumado por la
aparente complejidad de un informe de investigación. Es más
sencillo leer y comprender estos informes si se comprende cada una
de las partes que lo componen. Un informe de investigación suele
constar de seis partes: 1) resumen; 2) introducción; 3) métodos; 4)
resultados; 5) discusión, y 6) bibliografía. En esta sección se
describen estas partes y se presenta como ejemplo el estudio de
Chan, Yates y McCarthy (2016) que analiza las conductas de
automanejo de la fatiga en pacientes con cáncer avanzado.

Resumen
La comunicación suele comenzar con un resumen, que es un
sumario conciso y claro de un estudio. Los resúmenes varían entre
100 y 250 palabras, y suelen constar del propósito del estudio, el
diseño, el entorno, el tamaño de la muestra, los resultados
principales y las conclusiones. La American Psychological
Association (APA, 2010) ha proporcionado orientación para
elaborar resúmenes de calidad. Los investigadores esperan que sus
resúmenes expresen los hallazgos de su estudio de forma concisa y
capten la atención del lector para que lea el informe completo. Por
lo general, al resumen le siguen cuatro secciones principales del
informe de investigación: introducción, métodos, resultados y
discusión. En el cuadro 2.2 se resume el contenido que abarca cada
una de estas secciones; Chan y cols. (2016) han elaborado el
resumen claro y conciso que se muestra en el Ejemplo de
investigación 2.11. En él se proporciona la información crucial sobre
su estudio cuasiexperimental e incluye la relevancia clínica del
estudio.

CUADRO 2.2 SECCIONES PRINCIPALES DE UN


INFORME DE INVESTIGACIÓN
Introducción
Declaración del problema con antecedentes y relevancia.
Declaración del propósito.
Breve revisión de la literatura.

126
Identificación del marco teórico.
Identificación de los objetivos, preguntas o hipótesis de
investigación (si corresponde).
Métodos
Identificación del diseño de la investigación.
Descripción de la intervención (si corresponde).
Descripción de la muestra y del entorno.
Descripción de los métodos de medición.
Explicación del proceso de recogida de datos.
Resultados
Descripción de los procedimientos de análisis de datos.
Presentación de los resultados en tablas, figuras o de forma
narrativa, organizados según el propósito(s) y/o los objetivos,
preguntas o hipótesis.
Discusión
Discusión de los hallazgos principales.
Identificación de las limitaciones.
Presentación de conclusiones.
Implicaciones de los hallazgos para la práctica de enfermería.
Recomendaciones para futuras investigaciones.

EJEMPLO DE INVESTIGACIÓN 2.11


Resumen
Extracto del estudio de investigación
Propósito
Evaluar las conductas de automanejo de la fatiga y los factores asociados
con la eficacia de estas conductas en pacientes con cáncer avanzado.
Diseño
Encuesta longitudinal prospectiva realizada por el entrevistador.
Métodos
Los pacientes se encuestaron en tres ocasiones: en el momento basal, a las

127
cuatro semanas y a las ocho semanas.
Hallazgos
Los participantes refirieron unos niveles moderados de fatiga en el
momento basal y mantuvieron niveles moderados a las cuatro y ocho
semanas. En promedio, los participantes utilizaron de forma constante
unas nuevas conductas en cada momento temporal. Los factores asociados
de forma significativa con niveles mayores de eficacia percibida de las
conductas de automanejo de la fatiga fueron una mayor autoeficacia, un
nivel educativo más elevado y unos niveles menores de síntomas
depresivos.
Conclusiones
Los hallazgos de este estudio demuestran que los pacientes con cáncer,
incluso los que tienen una enfermedad avanzada, aún quieren y son
capaces de usar varias conductas para controlar su fatiga. Las
intervenciones de automanejo dirigidas a aumentar la autoeficacia y a
abordar cualquier síntoma depresivo concurrente pueden reducir la
gravedad de la fatiga.
Implicaciones para enfermería
Los profesionales de enfermería disfrutan de una posición idónea para
apoyar a los pacientes en su automanejo de la fatiga. (Moon y cols.,
2016, pág. 762)

Copyright de las citas © 2016 Oncology Nursing Society. Todos los


derechos reservados.

Introducción
La sección de introducción de un informe de investigación
identifica la naturaleza y el alcance del problema que se investiga y
proporciona un argumento para la realización del estudio. El lector
debería ser capaz de identificar la relevancia de la realización del
estudio. Chan y cols. (2016) identificaron que la fatiga relacionada
con el cáncer es un síntoma angustiante que se produce en,
aproximadamente, el 75% de todos los pacientes oncológicos. La
fatiga es debilitante y reduce la calidad de vida de estos pacientes.
El conocimiento de la fisiopatología y de las causas de la fatiga ha
mejorado, pero el tratamiento de la fatiga relacionada con el cáncer

128
no lo ha hecho. El propósito de este estudio abordó esta área de
interés.
Dependiendo del tipo de informe de investigación, la revisión de
la literatura y el marco teórico pueden ser secciones separadas o
parte de la introducción. La revisión de la literatura documenta el
conocimiento actual del problema e incluye lo que se sabe y lo que
no, además de proporcionar una base para el propósito del estudio.
Por ejemplo, Chan y cols. (2016) resumieron varios estudios en la
sección de antecedentes de su informe. La revisión de la literatura
se centró en las áreas de estrategias farmacológicas y no
farmacológicas para manejar la fatiga, como higiene del sueño,
conservación de la energía y ejercicio.
Un informe de investigación también debe incluir un marco
teórico, aunque solo lo identifican de forma explícita alrededor de
la mitad de los estudios publicados. Chan y cols. (2016)
identificaron con claridad el marco propuesto por Grey, Knafl y
McCorkle (2006) «automanejo y gestión familiar» para guiar su
estudio de la fatiga y las conductas de automanejo. Este marco
refleja la teoría de autoeficacia de Bandura (1977) y es compatible
con ella. Las relaciones en el marco aportan una base para la
formulación de hipótesis que deben ser probadas en estudios
cuasiexperimentales y experimentales.
Los investigadores a menudo terminan la introducción
identificando los objetivos, preguntas o hipótesis que emplearon
para dirigir el estudio. Dado que este es un estudio de correlación
descriptivo, Chan y cols. (2016, pág. 763) plantearon las siguientes
preguntas al final de su revisión de la literatura:

• ¿Cuáles son las estrategias de manejo que escogen utilizar


los pacientes (preferencias del paciente)?
• ¿Cuál es la eficacia de estas estrategias desde el punto de
vista del paciente?
• ¿Cuáles son los factores asociados con la eficacia de estas
estrategias?»

Métodos
La sección de métodos de un informe de investigación describe
cómo se realizó el estudio y suele incluir el diseño del estudio, la

129
intervención (si es apropiada), la muestra, el ámbito, los métodos de
medición y el proceso de recogida de datos (v. cuadro 2.2). Esta
sección del informe debe presentarse con suficiente detalle para que
los lectores puedan valorar de forma crítica la idoneidad de los
métodos del estudio para producir hallazgos creíbles.
Chan y cols. (2016) describieron de forma extensa la metodología
de su estudio. El diseño se identificó claramente como una encuesta
longitudinal prospectiva realizada por el entrevistador. Se
describieron la muestra, el ámbito y las herramientas de la encuesta,
incluida la programación en agenda para encuestar a los
participantes. También se detallaron la aprobación institucional
para la realización de este estudio y el consentimiento de los
participantes.

Resultados
Esta sección incluye los resultados de los análisis estadísticos y su
relevancia. Los investigadores identifican los análisis estadísticos
realizados para orientar el propósito o cada objetivo, pregunta o
hipótesis, y presentan los resultados en tablas, figuras o de forma
narrativa en el informe (v. cuadro 2.2; Grove y Cipher, 2017).
Centrarse más en el resumen de los resultados del estudio y su
relevancia que en los valores estadísticos puede ayudar a reducir la
confusión que pueden causar las cifras.
La sección de resultados de Chan y cols. (2016) incluyó una
descripción de la muestra, cuyas características se presentaron en
una tabla. Los resultados del estudio se organizaron en función de
sus variables de gravedad de la fatiga, frecuencia de la fatiga, así
como eficacia y autoeficacia de las conductas de automanejo. Los
investigadores ampliaron su análisis para incluir los factores
predictivos de eficacia percibida de conductas de automanejo.

Discusión
La sección de discusión relaciona las otras secciones del informe de
investigación y les da sentido. Esta sección incluye los hallazgos
principales, las limitaciones del estudio, las conclusiones obtenidas
a partir de los hallazgos, las implicaciones de los hallazgos para la
enfermería y las sugerencias para futuras investigaciones (v. cuadro
2.2).

130
Chan y cols. (2016) discutieron sus hallazgos con detalle y los
compararon y contrastaron con los hallazgos de estudios previos.
También presentaron las limitaciones de su estudio; todos los
participantes tenían cáncer metastásico conocido, pero estaban
bastante saludables y tenían un estado funcional elevado al
comienzo del estudio pese a estar recibiendo quimioterapia
simultáneamente. Un porcentaje de participantes del estudio se
perdieron para el seguimiento porque su enfermedad se agravó
demasiado y no pudieron continuar. Los factores de riesgo de fatiga
en pacientes oncológicos (anemia, caquexia, pérdida de peso y
ciertos fármacos quimioterápicos) no se midieron debido a la carga
de pacientes y a la naturaleza explicativa del estudio. Los autores
desarrollaron la herramienta de recogida de datos para este estudio,
por lo que su fiabilidad y validez se desconocían.
Las conclusiones obtenidas de un proyecto de investigación
pueden ser útiles al menos de tres maneras diferentes. En primer
lugar, la intervención evaluada en un estudio puede implementarse
en los pacientes para mejorar su cuidado y fomentar un resultado
de salud positivo. En segundo lugar, la lectura de informes de
investigación podría cambiar la visión de la situación de un
paciente o aportar una mayor comprensión de la situación. Por
último, los estudios intensifican la concienciación sobre los
problemas que experimentan los pacientes y ayudan a valorar y
trabajar en busca de soluciones para estos problemas. Chan y cols.,
2016) ofrecieron conclusiones relevantes, implicaciones para la
práctica y sugerencias para estudios adicionales que se pusieron de
relieve en el resumen del estudio.

Bibliografía
La sección o lista de referencias bibliográficas incluye todas las
fuentes de estudios, teorías y recursos metodológicos que
proporcionaron la base para la realización del estudio. Estas fuentes
proporcionan la oportunidad para leer sobre el problema de
investigación en mayor profundidad. Desde aquí animamos
encarecidamente a los lectores a consultar el artículo de Chan y
cols. (2016) para identificar las secciones de un informe de
investigación y analizar el contenido de cada una de estas secciones.
Estos investigadores detallaron un estudio de correlación

131
descriptivo realizado rigurosamente, proporcionaron hallazgos que
apoyan la investigación previa e identificaron conclusiones que
aportan una evidencia sólida para orientar la asistencia de los
pacientes oncológicos con fatiga.

Consejos para la lectura de informes de


investigación
Cuando se comienza la lectura de informes de investigación, los
nuevos términos y la información compleja que se presenta pueden
resultar abrumadores. Esperamos que los lectores no se desanimen,
sino que acepten el reto de examinar los nuevos conocimientos
generados mediante la investigación. Es probable que deba leer el
informe despacio dos o tres veces. También se puede usar el
glosario que se presenta al final de este libro para revisar las
definiciones de términos poco familiares. Recomendamos que se lea
primero el resumen y después la discusión del informe. Este
método permitirá determinar la importancia de los hallazgos para
el lector personalmente y para su práctica. Inicialmente hay que
centrarse en informes de investigación que se considere que pueden
proporcionar información relevante para la práctica.
La lectura de informes de investigación requiere el uso de
diversas habilidades de pensamiento crítico, como lectura rápida y
entender y analizar para facilitar la comprensión del estudio
(Wilkinson, 2012). La lectura rápida de informes de investigación
consiste en revisar con rapidez la fuente para lograr una visión
general amplia del contenido. Se puede intentar la siguiente técnica.
En primer lugar, hay que familiarizarse con el título y comprobar el
nombre del autor. Después, hay que echar un vistazo a las secciones
de resumen o introducción y a la discusión. Conocer los hallazgos
del estudio aportará una base para evaluar el resto del artículo.
Después, se leen los encabezamientos principales y quizás una o
dos frases bajo cada encabezamiento. Por último, se vuelven a
examinar las conclusiones y las implicaciones para la práctica del
estudio. La lectura rápida permite realizar un juicio preliminar
sobre el valor de una fuente y decidir si se lee la comunicación en
profundidad.
La comprensión en profundidad de un informe de

132
investigación requiere leer todo el estudio cuidadosamente.
Durante la lectura, hay que centrarse en entender los principales
conceptos y el flujo lógico de ideas del estudio. Se puede resaltar la
información sobre los investigadores, como su formación, cargo
actual y la financiación que hayan recibido para el estudio. A
medida que se lea el estudio, también se podrían subrayar los pasos
del proceso de investigación. Es posible poner notas en el margen
para poder identificar fácilmente el problema, el propósito, el
marco, las principales variables, el diseño del estudio, el
tratamiento, la muestra, los métodos de medición, el proceso de
recogida de datos, las técnicas de análisis, los resultados y las
conclusiones del estudio. Se puede anotar también cualquier idea
creativa o pregunta que surja en el margen del informe.
Nuestro consejo es que se subrayen las partes del artículo que no
se entiendan y que se pregunte a un formador o a otros
investigadores en enfermería para que las aclaren. La mayor
dificultad para la lectura del informe de investigación
probablemente consista en entender los análisis estadísticos (v. cap.
11). Básicamente, se deben identificar las pruebas y parámetros
estadísticos particulares utilizados, los resultados de cada análisis
estadístico y el significado de los resultados. Los análisis
estadísticos describen las variables, examinan las relaciones entre
ellas y/o determinan las diferencias entre grupos. El propósito del
estudio o los objetivos, preguntas o hipótesis específicas indican si
el estudio se centra en la descripción, las relaciones o las diferencias
(Grove y Cipher, 2017). Por tanto, hay que relacionar cada técnica
de análisis con sus resultados y después con el propósito del
estudio o con los objetivos, preguntas o hipótesis presentadas en
este.
El análisis de informes de investigación es la habilidad de
lectura final e implica determinar el valor del contenido del
informe. El contenido del informe se divide en varias partes que se
examinan en profundidad para valorar su exactitud, integridad,
singularidad de la información y organización. Hay que observar si
los pasos del proceso de investigación se refuerzan de forma lógica
entre sí o si alguno de ellos está ausente o incompleto. Se debe
examinar la sección de discusión del informe para determinar si los
investigadores han aportado un argumento crítico para utilizar los

133
hallazgos del estudio en la práctica. El uso de las habilidades de
lectura rápida, comprensión en profundidad y análisis al leer
informes de investigación aumentará la comodidad con los
estudios, permitirá convertirse en un consumidor informado de
investigación y aumentará los conocimientos para hacer cambios en
la práctica. Estas habilidades para la lectura de informes de
investigación son esenciales para la realización de una valoración
crítica exhaustiva de un estudio.

PRÁCTICA DE LECTURA DE
ESTUDIOS CUASIEXPERIMENTALES
El conocimiento de las secciones del informe de investigación
(introducción, métodos, resultados y discusión, v. cuadro 2.2) sirve
de base para la lectura de informes de investigación de estudios
cuantitativos. La lectura rápida, comprensión en profundidad y
análisis son habilidades de pensamiento crítico que pueden
aplicarse en la lectura del estudio cuasiexperimental que se
presenta en este capítulo. La capacidad de leer informes de
investigación e identificar los pasos del proceso de investigación (v.
fig. 2.2) debería permitir que el lector realice una valoración crítica
inicial de un informe. A lo largo de este texto, se presentan cuadros
titulados «Guías de valoración crítica» que presentan las preguntas
que se pueden plantear en la valoración crítica de diversos
elementos o pasos de la investigación. Este capítulo concluye con
las valoraciones críticas iniciales de un estudio cuasiexperimental
usando las guías proporcionadas.
El propósito de la investigación cuasiexperimental es examinar
las relaciones causa-efecto entre variables independientes y
dependientes seleccionadas. Los investigadores realizan estudios
cuasiexperimentales en enfermería para determinar los efectos de
intervenciones de enfermería (variables independientes) sobre los
resultados del paciente (variables dependientes; Shadish y cols.,
2002). George, Locasto, Pyo y Cline (2017) realizaron un estudio
cuasiexperimental para comparar los resultados de los estudiantes
de enfermería de un modelo de unidad de formación dedicada con
un modelo de formación clínica tradicional. Los pasos de este

134
estudio se ilustran en el Ejemplo de investigación 2.12, con breves
extractos del informe de investigación.

EJEMPLO DE INVESTIGACIÓN 2.12


Pasos del proceso de investigación en un
estudio cuasiexperimental
Extracto del estudio de investigación
1 Introducción
Problema de investigación
Cada vez se tiene mayor conciencia de que los modelos actuales de
formación clínica tal vez no proporcionen las experiencias de aprendizaje
más eficaces para los estudiantes de enfermería pregraduados... Se ha
exhortado a los profesores de enfermería y sus colaboradores clínicos para
que mejoren la calidad y capacidad de la formación clínica. En 2010,
varias publicaciones de referencia respaldaron la transformación de los
estudios de enfermería. La primera fue ‘Educating Nurses: A Call for
Radical Transformation’ (Benner y cols., 2010) y otra fue ‘The Future of
Nursing: Leading Change, Advancing Health’ (IOM [Institute of
Medicine], 2010)… El desarrollo de las Unidades de Formación
Dedicadas (UFD) puede relacionarse con el llamamiento para la
transformación de los estudios de enfermería. Aunque actualmente se
usan varios modelos de UFD, la mayoría de ellos tienen un concepto
central según el cual una colaboración más exhaustiva entre el educador
de enfermería, el profesional de enfermería y el estudiante proporciona el
entorno de aprendizaje clínico óptimo. (George y cols., 2017, pág. 49)
Propósito de la investigación
El propósito de este estudio cuasiexperimental fue comparar los resultados
de estudiantes del modelo de formación clínica tradicional (FCT) con los
del modelo de UFD. (George y cols., 2017, pág. 48)
Revisión de la literatura
La revisión de la literatura del estudio de George y cols. (2017)
incluyó los estudios relevantes y actuales que resumen lo que se
sabe y lo que no se sabe sobre el impacto de las UFD en la
autoeficacia de los estudiantes. Las fuentes eran actuales y las

135
fechas de publicación oscilaron de 1999 a 2014. La mayoría de los
estudios se habían publicado en los últimos 5 años. El estudio se
aceptó para su publicación el 10 de febrero de 2017 y se publicó en
el número de marzo de 2017. George y cols. (2017, pág. 48)
resumieron el conocimiento actual sobre el efecto de las UFD en la
autoeficacia de los estudiantes y afirmaron que «Aunque la UFD ha
mostrado resultados prometedores inicialmente en cuanto a la
satisfacción con el entorno enseñanza/aprendizaje, pocos estudios
han evaluado los resultados de los estudiantes en relación con la
participación en UFD aparte de su satisfacción».
Marco teórico
George y cols. (2017) utilizaron la teoría de la autoeficacia de
Bandura para explicar los conceptos y relaciones incluidos en su
estudio.

La autoeficacia se considera un resultado importante de los estudios


de enfermería, porque los profesionales de enfermería con
autoeficacia se han relacionado con las siguientes habilidades:
fijación de objetivos apropiados, uso de distintas estrategias,
perseverancia para completar una tarea y realización de una
transición más fácil de estudiante a profesional de enfermería.
(George y cols., 2017, pág. 50)

Prueba de la hipótesis
Los investigadores plantearon la hipótesis nula:

no habrá diferencias en las puntuaciones de autoeficacia de los


estudiantes que participan en un modelo educativo clínico de
UFD en comparación con los que participan en un modelo de
FCT. (George y cols., 2017, pág. 49)

Variables
La variable independiente era la UFD y la variable dependiente era
la puntuación de autoeficacia de los estudiantes. Solo la UFD y las
puntuaciones de autoeficacia se definieron con definiciones
conceptuales y operacionales. Las definiciones conceptuales se
tomaron del marco del estudio y las definiciones operacionales se
obtuvieron de la sección de métodos de este estudio.

136
Variable independiente: Unidad de Formación Dedicada

Definición conceptual: «En la UFD, los profesionales y


educadores de enfermería constituyen una asociación que
combina la experiencia de ambos con una acción centrada en
el uso de prácticas clínicas y educativas basadas en la
evidencia para crear el entorno de aprendizaje clínico más
eficaz para el estudiante (George y cols., 2017, pág. 48).
Definición operacional: la UFD implementada en este estudio
se basa en el modelo de la Universidad de Portland e implica
una «colaboración exhaustiva entre el educador de
enfermería, el profesional de enfermería y el estudiante para
proporcionar un entorno óptimo de aprendizaje clínico»
(George y cols., 2017, pág. 49).

Variable dependiente: autoeficacia

Definición conceptual: la autoeficacia es un reflejo de la


creencia de los estudiantes de su capacidad de llevar a cabo
una línea de acción que producirá los resultados deseados. El
personal de enfermería con una autoeficacia elevada se ha
relacionado con el logro de unas habilidades y capacidades
deseables en el campo de la enfermería profesional.
Definición operacional: la autoeficacia se midió utilizando la
Escala de Autoeficacia Adaptada (EAA) de 10 ítems.

2 Métodos
Diseño
El diseño fue cuasiexperimental pretest/postest, con dos grupos y
muestreo por conveniencia. Los estudiantes que consintieron
participar en el estudio se asignaron a las UFD del grupo de
intervención o a la FCT del grupo control. Ambos grupos
cumplimentaron la EAA antes y después de completar sus
rotaciones clínicas.
Muestra
Se reclutó una muestra por conveniencia de estudiantes de
enfermería matriculados en un programa de licenciatura de 4 años.

137
Los estudiantes no se asignaron de forma aleatoria a una UFD o a
la FCT, sino que se siguió la política de ubicación clínica del
departamento, permitiendo respetar las preferencias de los
estudiantes cuando fue posible. Una vez que se habían realizado
las asignaciones clínicas, la información sobre el estudio se
presentó a todos los estudiantes y se obtuvo el consentimiento
informado. La muestra incluyó 193 estudiantes (59 en el grupo de
UFD y 134 del grupo de FCT), que completaron la EAA de
formación tanto preclínica como posclínica.
Intervención
La intervención en este estudio fue la UFD. En una UFD,

los profesionales y educadores de enfermería constituyen una


asociación que combina la experiencia de ambos con una acción
centrada en el uso de prácticas clínicas y educativas basadas en la
evidencia para crear el entorno de aprendizaje clínico más eficaz
para el estudiante. En el modelo de UFD, un estudiante suele
asociarse con un profesional de enfermería que asume el papel de
instructor clínico. El formador académico, denominado coordinador
del profesorado clínico, colabora con el instructor clínico y el
estudiante para relacionar los conceptos de la clase con las
actividades prácticas y proporcionar orientación para el proceso
formativo. (George y cols., 2017, pág. 48)

Medición
Se midieron las puntuaciones de autoeficacia pre- y posclínica
utilizando la escala EAA de 10 ítems. La escala EAA se adaptó a
partir de la Escala de Autoeficacia General desarrollada por
Schwarzer y Jerusalem (1995), con autorización para incluir solo
ítems esenciales y contenido relacionado con la formación clínica
pregraduada. Los ítems de la escala EAA se presentan en el
artículo de George y cols. (2017, pág. 51). Los valores de fiabilidad
para los pretests y postests de esta escala fueron sólidos, lo que
indica una fiabilidad elevada para esta escala adaptada.
Recogida de datos
La información demográfica de los participantes se recogió
después de que los estudiantes firmasen el consentimiento
informado. La escala EAA se aplicó antes de asistir a cualquier

138
actividad clínica y después de haber completado todas las
actividades clínicas.
3 Resultados
En todos los participantes en el estudio se evaluó la autoeficacia al
comienzo del estudio y no se observaron diferencias significativas
entre los estudiantes en el grupo de UFD frente al grupo de FCT.
Sin embargo, después de completar la rotación clínica, los
estudiantes del grupo de UFD, que recibieron la intervención,
tenían unas puntuaciones de autoeficacia significativamente
mayores que los del grupo de FCT.
4 Discusión
Los hallazgos del estudio respaldan el concepto de que los
estudiantes ubicados en una UFD tendrán un beneficio mayor en
términos de aumento de la autoeficacia en comparación con los
estudiantes asignados a un contexto clínico tradicional. Los
hallazgos del estudio sugieren que los estudiantes obtienen el
máximo beneficio cuando los profesores y el personal de
enfermería clínica trabajan en conjunto para fomentar la
autoeficacia de los estudiantes de enfermería en una unidad
formativa dedicada. Un aspecto particularmente importante es el
desarrollo de la autoeficacia en los estudiantes, porque se ha
demostrado que este rasgo se asocia con personas más propensas a
asumir tareas exigentes, a esforzarse más para llevar a cabo esas
tareas y a persistir más tiempo frente a la adversidad (Gore, 2006).
Es importante fomentar estas cualidades en los estudiantes de
enfermería principiantes.
Las limitaciones de este estudio son las habituales de muchos
estudios que analizan las metodologías docentes. El estudio se
llevó a cabo en una única facultad, aunque había múltiples UFD en
las posibles localizaciones clínicas a las que podrían haberse
asignado los estudiantes. Los estudiantes no se asignaron de forma
aleatoria a una UFD o una UFT y pudieron autoescoger una
unidad para su experiencia clínica en función de otros factores,
como la conveniencia geográfica. Los futuros estudios podrían
centrarse en la superación de las limitaciones de este estudio (falta
de aleatorización, una sola facultad) para reforzar y probar los
hallazgos en una población más amplia, de forma que estos

139
hallazgos se convirtiesen en un conocimiento generalizable que se
pudiese aplicar a otras facultades y programas.

GUÍAS DE VALORACIÓN CRÍTICA


Investigación cuantitativa
Las siguientes preguntas son importantes a la hora de realizar
una valoración crítica inicial de un informe de investigación
cuantitativa:

1. ¿Qué tipo de estudio cuantitativo se ha realizado: descriptivo,


de correlación, cuasiexperimental o experimental?
2. ¿Es posible identificar las siguientes secciones en el informe
de investigación: Introducción, Métodos, Resultados y
Discusión, tal y como se muestran en el cuadro 2.2?
3. ¿Se identificaron claramente los pasos del estudio? En la
figura 2.2 se muestran los pasos del proceso de investigación
cuantitativa.
4. ¿Faltaba alguno de los pasos del proceso de investigación?

Cuando se examina el informe de investigación de ejemplo, se


observa que George y cols. (2017) describieron de forma explícita su
estudio como cuasiexperimental. Había dos grupos de participantes
en el estudio (estudiantes de enfermería) que eran muy similares.
Un grupo de estudiantes se expuso a la intervención del estudio
(UFD) y el otro grupo se expuso a una experiencia de formación
clínica tradicional (FCT). En el cuerpo del informe hay partes
claramente identificadas que describen la introducción, métodos,
resultados y conclusiones del estudio. La sección de introducción
de este manuscrito incluye una sección sobre los antecedentes y la
relevancia del problema que se está estudiando y una revisión
breve de la literatura relacionada tanto con la idea de una unidad
educativa específica como con la autoeficacia. Los autores
comentaron sus resultados en detalle, así como los métodos y los
análisis estadísticos. Aunque sus pronósticos sobre las
investigaciones futuras y las implicaciones más amplias de sus
hallazgos fueron prudentes y modestos, no se pasó por alto

140
ninguno de los pasos del proceso de investigación.

PUNTOS CLAVE
• La investigación cuantitativa es el enfoque tradicional de la
investigación en enfermería; incluye los tipos de estudios
descriptivo, de correlación, cuasiexperimental y
experimental.
• La investigación básica, o de laboratorio, es una
investigación científica que implica la búsqueda de
conocimiento por el mero conocimiento o por el placer de
aprender y encontrar la verdad.
• La investigación aplicada o práctica es una investigación
científica destinada a desarrollar conocimientos que
influirán o mejorarán directamente la práctica clínica.
• La realización de investigación cuantitativa requiere rigor y
control.
• La comparación del proceso de solución de problemas, el
proceso de enfermería y el proceso de investigación
muestra similitudes y diferencias entre dichos procesos y
proporciona una base para entender el proceso de
investigación.
• El proceso de investigación cuantitativa implica la
conceptualización de un proyecto de investigación, la
planificación e implementación de ese proyecto y la
comunicación de los hallazgos. Los pasos del proceso de
investigación cuantitativa se han presentado brevemente en
este capítulo.
• Un problema de investigación es un área de interés en la
que existe una laguna en el conocimiento necesario para la
práctica de enfermería. El propósito de la investigación se
desarrolla a partir del problema e identifica el objetivo
específico o enfoque del estudio.
• La revisión de la literatura relevante se realiza para crear un
panorama de lo que se conoce y lo que no se conoce acerca
de un problema en particular y proporciona un argumento
sobre la necesidad de realizar el estudio.

141
• El marco del estudio es la base teórica para el estudio que
guía el desarrollo de este y permite al investigador
relacionar los hallazgos con el conjunto de conocimientos
de enfermería.
• Los objetivos, preguntas y/o hipótesis de investigación se
formulan para salvar la distancia entre el problema y el
propósito de la investigación, establecidos de forma más
abstracta, y el diseño del estudio y la planificación para la
recogida y el análisis de los datos.
• Las variables del estudio son conceptos con varios niveles
de abstracción que se miden, manipulan o controlan en un
estudio.
• El diseño de investigación es un proyecto para la realización
de un estudio que maximiza el control sobre los factores
que podrían interferir con los resultados deseados del
estudio.
• La población está formada por todos los elementos que
cumplen ciertos criterios para la inclusión en un estudio.
Una muestra es un subgrupo de la población que se
selecciona para un estudio en particular; los miembros de
una muestra son los sujetos o participantes del estudio.
• La medición es el proceso de asignación de valores
numéricos a objetos, fenómenos o situaciones de acuerdo
con cierta norma. Los métodos de medición se identifican
para medir cada una de las variables del estudio.
• El proceso de recogida de datos implica la recopilación
precisa y sistemática de la información relevante para el
propósito de la investigación o para los objetivos, preguntas
o hipótesis del estudio.
• Los análisis de los datos se realizan para reducir, organizar
y dar significado a los datos, y abordar el propósito de
investigación y/o los objetivos, preguntas o hipótesis.
• Los resultados de la investigación abarcan los hallazgos, las
limitaciones, la generalización de los hallazgos, las
conclusiones, las implicaciones para la enfermería y las
sugerencias para futuras investigaciones.
• El contenido de un informe de investigación tiene seis
partes: resumen, introducción, métodos, resultados,

142
discusión y bibliografía.
• La lectura de los informes de investigación implica una
lectura rápida, la comprensión en profundidad y el análisis
del informe.
• Se proporcionan guías para la realización de una valoración
crítica inicial de un estudio cuantitativo.
• Se identifican los pasos de un estudio cuasiexperimental,
seguidos de una valoración crítica inicial de este estudio.

BIBLIOGRAFÍA
American Psychological Association (APA). Publication manual of the
American Psychological Association, 6th ed. Washington, DC: APA;
2010.

Aveyard, H. Doing a literature review in health and social care: A


practical guide, 3rd ed. New York, NY: McGraw Hill Education
Open University Press; 2014.

Bandura, A. Self-efficacy: Toward a unifying theory of behavioral


change. Psychological Review. 1977; 84(2):191–215.

Benner, P., Sutphen, M., Leonard, V., Day, I. Educating nurses: A call
for radical transformation. San Francisco, CA: Jossey-Bass; 2010.

Brown, S. J. Evidence-based nursing: The research-practice connection,


4th ed. Sudbury, MA: Jones & Bartlett; 2018.

Campbell, D. T., Stanley, J. C. Experimental and quasi-experimental


designs for research. Chicago, IL: Rand McNally; 1963.

Chan, R. J., Yates, P., McCarthy, A. L. Fatigue self-management


behaviors in patients with advanced cancer: A prospective
longitudinal survey. Oncology Nursing Forum. 2016; 43(6):762–771.

143
Chinn, P. L., Kramer, M. K. Knowledge development in nursing: Theory
and process, 9th ed. St. Louis, MO: Elsevier Mosby; 2015.

Creswell, J. W. Research design: Qualitative, quantitative, and mixed


methods approaches, 4th ed. Thousand Oaks, CA: Sage; 2014.

Eymard, A. S., Altmiller, G. Teaching nursing students the


importance of treatment fidelity in intervention research: Students
as interventionists. Journal of Nursing Education. 2016; 55(5):288–291.

Finch, M., Griffin, K., Pacala, J. T., Reduced healthcare use and
apparent savings with passive home monitoring technology: A
pilot study. Journal of the American Geriatrics Society 2017; .
https://doi.org/10.1111/jgs.14892

Fisher, R. A. The designs of experiments. New York. NY: Hafner; 1935.

George, L. E., Locasto, L. W., Pyo, K. A., Cline, T. W. Effect of the


dedicated education unit on nursing student self-efficacy: A quasi-
experimental research study. Nurse Education in Practice. 2017;
23(1):48–53.

Gore, P. A., Jr. Academic self-efficacy as a predictor of college


outcomes: Two incremental validity studies. Journal of Career
Assessment. 2006; 14(1):92–115.

Gray, J. R., Grove, S. K., Sutherland, S. The practice of nursing


research: Appraisal, synthesis, and generation of evidence, 8th ed. St.
Louis, MO: Elsevier; 2017.

Grey, M., Knafl, K., McCorkle, R. A framework for the study of self-
and family management of chronic conditions. Nursing Outlook.
2006; 54(5):278–286.

144
Grove, S. K., Cipher, D. J. Statistics for nursing research: A workbook
for evidence-based practice, 2nd ed. St. Louis, MO: Elsevier; 2017.

Haley, W. E., Levine, E. G., Brown, S. L., Bartolucci, A. A. Stress,


appraisal, coping, and social support as predictors of adaptational
outcome among dementia caregivers. Psychology and Aging. 1987;
2(4):323.

Hertzog, M. A. Considerations in determining sample size for pilot


studies. Research in Nursing & Health. 2008; 31(2):180–191.

Institute of Medicine (IOM). The future of nursing: Leading change,


advancing health. Washington, DC: The National Academies Press;
2010.

Kaplan, A. The conduct of inquiry: Methodology for behavioral science.


San Francisco, CA: Chandler; 1964.

Kerlinger, F. N., Lee, H. B. Foundations of behavioral research, 4th ed.


Fort Worth, TX: Harcourt; 2000.

Kolanowski, A., Bossen, A., Hill, N., Guzman-Velez, E., Litaker, M.


Factors associated with sustained attention during an activity
intervention in persons with dementia. Dementia and Geriatric
Cognitive Disorders. 2012; 33(4):233–239.

Liao, L. Y., Chung, W. S., Chen, K. M. Free radicals and antioxidant


enzymes in older adults after regular senior elastic band exercising:
An experimental randomized controlled pilot study. Journal of
Advanced Nursing. 2017; 73(1):108–111.

Melnyk, B. M., Gallagher-Ford, E., Fineout-Overholt, E.,


Implementing evidence-based practice competencies in healthcare:

145
A practical guide for improving quality, safety, & outcomes. Sigma
Theta Tau International, Indianapolis, IN, 2017.

Moon, H., Rote, S., Beaty, J. A. Caregiving setting and Baby Boomer
caregiver stress processes: Findings from the National Study of
Caregiving (NSOC). Geriatric Nursing. 2017; 38(1):57–62.

Murphy, S. L., Gutman, S. A. Intervention fidelity: A necessary


aspect of intervention effectiveness studies. American Journal of
Occupational Therapy. 2012; 66(4):387–388.

National Human Genome Research Institute (NHGRI). An


overview of the division of intramural research. Consultada el 26 de
mayo de 2017 en http://www.genome.gov/10001634, 2017.

National Institute of Nursing Research (NINR). The NINR Strategic


Plan: Advancing science, improving lives. Consultada el 20 de
febrero de 2017 en
https://www.ninr.nih.gov/sites/www.ninr.nih.gov/files/NINR_StratPlan2016_re
2016.

Porter, T. M. Karl Pearson: The scientific life in a statistical age.


Oxfordshire, United Kingdom: Princeton University Press; 2004.

Quality and Safety Education for Nurses (QSEN). Pre-licensure


knowledge, skills, and attitudes (KSAs). Consultada el 16 de enero
de 2018 en http://qsen.org/competencies/pre-licensure-ksas/, 2017.

Schwarzer, R., Jerusalem, M. Generalized self-efficacy scale. In:


Weinman J., Wright S., Johnson M., eds. Measures in health
psychology: A user’s portfolio, causal and control beliefs. Windsor, UK:
NFER-NELSON; 1995:35–37.

146
Shadish, W. R., Cook, T. D., Campbell, D. T. Experimental and quasi-
experimental designs for generalized causal inference. Chicago, IL: Rand
McNally; 2002.

Sherwood, G., Barnsteiner, J. Quality and safety in nursing: A


competency approach to improving outcomes, 2nd ed. Ames, IA: Wiley-
Blackwell; 2017.

Straus, S. E., Glasziou, P., Richardson, W. S., Rosenberg, W.,


Haynes, R. B. Evidence-based medicine: How to practice and teach EBM,
5th ed. Edinburgh: Churchill Livingstone Elsevier; 2011.

Wacker, M. J., Touchberry, C. D., Silswal, N., Brotto, L., Elmore, C.


J., Bonewald, L. F., et al, Skeletal muscle, but not cardiovascular
function, is altered in a mouse model of autosomal recessive
hypophosphatemic rickets. Frontiers in Physiology 2016; 7:173.
https://doi.org/10.3389/fphys.2016.00173

Waltz, C. F., Strickland, O. L., Lenz, E. R. Measurement in nursing


and health research, 5th ed. New York, NY: Springer Publishing
Company; 2017.

Wethington, E., Burgio, L. D., Translational research on caregiving:


Missing links in the translation processWethington E., Burgio L.D.,
eds. Family caregiving in the new normal 2015 193–210.
https://doi.org/10.1016/b978-0-12-417046-9.00011-8

Wilkinson, J. M. Nursing process and critical thinking, 5th ed. Upper


Saddle River, NJ: Pearson; 2012.

147
CAPÍTULO 3

Introducción a la
investigación
cualitativa
Jennifer R. Gray

La página web de la National Guideline Clearinghouse de la Agency for


Healthcare Research and Quality (AHRQ) se cerró en 2018. Puede
consultarse más información en https://www.ahrq.gov/.

ÍNDICE DEL CAPÍTULO

Identificación de los pasos del proceso de investigación


cualitativa, 60
Enfoques de la investigación cualitativa, 64
Muestreo y reclutamiento, 75
Métodos de recogida de datos, 77
Manejo y análisis de los datos, 84
Rigor en investigación cualitativa, 86
Puntos clave, 87
Bibliografía, 87

148
OBJETIVOS DE APRENDIZAJE
Tras concluir este capítulo, el lector debería ser capaz de:
1. Identificar los pasos del proceso de investigación cualitativa.
2. Describir cuatro diseños de investigación cualitativa:
investigación fenomenológica, teoría fundamentada, etnografía
e investigación cualitativa exploratoria-descriptiva, así como
sus resultados pretendidos.
3. Identificar las diferencias en el muestreo, el reclutamiento, la
recogida de datos y el análisis de los datos entre las
investigaciones cuantitativa y cualitativa.
4. Describir las estrategias utilizadas por los investigadores
cualitativos para aumentar la credibilidad y la transferibilidad de
sus resultados.
5. Evaluar críticamente los estudios cualitativos para su
aplicación en la práctica.

La investigación cualitativa es un enfoque sistemático que se


utiliza para describir experiencias y situaciones desde la
perspectiva de las personas que se encuentran en esa situación. El
investigador analiza las palabras del participante(s), descubre su
significado y describe la experiencia de forma que se comprenda
mejor (Creswell y Poth, 2018). Debido a que cuidar de las personas
y querer ayudarlas son valores centrales de enfermería, la
investigación cualitativa puede resultar útil por la información que
proporciona sobre las vidas y circunstancias de los pacientes. La
investigación cualitativa puede proporcionar descripciones
detalladas de las experiencias de los pacientes y sus familiares, que
aumenten la comprensión del personal de enfermería sobre cuáles
son las formas más adecuadas de intervenir y de servir de apoyo
(Powers, 2015). Por tanto, los resultados cualitativos contribuyen
claramente a la práctica basada en la evidencia (Hall y Roussel,

149
2017).
En este capítulo se incluyen los elementos del proceso de
investigación cualitativa y se presenta un resumen de cuatro
diseños cualitativos que se utilizan habitualmente en enfermería:
investigación fenomenológica, investigación aplicando teoría
fundamentada, investigación etnográfica e investigación cualitativa
exploratoria-descriptiva. Se describe un ejemplo de cada tipo de
estudio. Se presentan algunos de los métodos que se utilizan con
más frecuencia para obtener, analizar e interpretar datos
cualitativos. Este contenido proporciona una base que se puede
utilizar para leer y comprender los estudios cualitativos publicados,
evaluarlos críticamente y aplicar sus resultados en la práctica.

IDENTIFICACIÓN DE LOS PASOS DEL


PROCESO DE INVESTIGACIÓN
CUALITATIVA
La investigación cualitativa se realiza en entornos naturales para
aprender sobre un tema desde las perspectivas de los participantes.
El investigador es el instrumento clave de la investigación,
mediante la recogida y análisis de datos textuales y experimentales
(Creswell y Poth, 2018). Otras características de la investigación
cualitativa son la presencia de múltiples fuentes de datos, diseños
emergentes y reflexividad. En el cuadro 3.1 se muestran varias
características de la investigación cualitativa.

CUADRO 3.1 CARACTERÍSTICAS DE LA


INVESTIGACIÓN CUALITATIVA
Entorno natural.
Dependiente del contexto.
Investigador como instrumento.
Múltiples fuentes de datos.
Análisis inductivo y deductivo.
Reflexividad.
Se centra en la perspectiva de los participantes.
Diseño emergente y evolutivo.

150
Descripción holística, compleja.

Adaptado de Creswell, J. y Poth, C. (2018). Qualitative inquiry and


research design: Choosing among five approaches (4.ª ed.). Thousand Oaks,
CA: Sage, pág. 45.

El proceso de investigación cualitativa sigue los mismos pasos


generales que el proceso de investigación cuantitativa, pero se basa
en valores filosóficos y suposiciones diferentes (tabla 3.1). Los
investigadores cualitativos otorgan valor a las percepciones y
perspectivas individuales a la hora de comprender el significado
que tiene un fenómeno para las personas que lo han
experimentado. En lugar de buscar información sobre un problema
bien definido a partir de un grupo (muestra) para realizar una
generalización a un grupo mayor (población), como en la
investigación cuantitativa, los investigadores cualitativos buscan
información sobre un problema de investigación menos definido
obteniendo múltiples perspectivas individuales para obtener una
comprensión más profunda del fenómeno. Los pasos del proceso de
investigación cualitativa están interconectados. Cada uno está
influido por el paso previo y afecta a los pasos siguientes.

TABLA 3.1
SIMILITUDES Y DIFERENCIAS EN LOS PROCESOS DE
INVESTIGACIÓN CUANTITATIVA Y CUALITATIVA

151
El problema de investigación es una laguna en el conocimiento.
Los problemas del paciente o de la práctica que mejor se abordan
mediante la investigación cualitativa son aquellos de los que se sabe
muy poco. Incluso en los problemas que ya se han estudiado, puede
faltar la perspectiva de los afectados. Creswell y Poth (2018, pág. 52)
han señalado que los problemas de investigación cualitativa están
«cargados de emoción, están próximos a las personas y son
prácticos». Por ejemplo, Weyant, Clukey, Roberts y Henderson
(2017) realizaron un estudio cualitativo sobre el uso de sujeciones

152
en cuidados intensivos. Cuando entrevistaron a pacientes en
quienes se habían usado sujeciones mientras recibían ventilación
mecánica y a sus familiares, los investigadores pidieron a los
participantes que identificaran las acciones del personal de
enfermería que se consideraron útiles. Los investigadores
identificaron que la laguna de conocimiento era la falta de
bibliografía publicada sobre «las percepciones de los pacientes
sometidos a ventilación mecánica y de sus familias que pasaban
tiempo en la unidad de cuidados intensivos» (Weyant y cols., 2017,
pág. 112). El propósito del estudio era «evaluar las percepciones
que los pacientes intubados y sus familiares tenían de las conductas
de cuidado del personal de enfermería» (Weyant y cols., 2017, pág.
111). El propósito debería ser y era congruente con el problema de
investigación.
Los siguientes tres pasos en el proceso de investigación
cualitativa (identificación del diseño del estudio, revisión de la
bibliografía y selección de un marco teórico) son los mismos que los
de la investigación cuantitativa, pero con algunas modificaciones
(v. tabla 3.1). Los investigadores toman decisiones sobre el diseño
del estudio en una fase precoz del proceso de elaboración de dicho
estudio. Cuando se redacta el propósito del estudio, el investigador
ha seleccionado el diseño basado en la estructuración del estudio de
manera que permita abordar la laguna de investigación. Los
diseños de investigación para los estudios cualitativos son más
abiertos y flexibles que los usados para los estudios cuantitativos.
Los métodos de un estudio cualitativo pueden evolucionar a lo
largo del estudio (Creswell y Poth, 2018). Los investigadores
cualitativos contemplan el paso de la revisión de la bibliografía con
cautela, porque quieren permanecer abiertos a la perspectiva del
participante. Como resultado, los investigadores cualitativos
pueden revisar la bibliografía para identificar el problema de
investigación, pero pueden demorar una segunda revisión de la
bibliografía hasta que se hayan recogido los datos. El tipo y la
amplitud de la revisión inicial de la bibliografía pueden variar
dependiendo del diseño de investigación que se use (v. cap. 6).
Se puede seleccionar o no un marco teórico. Por ejemplo, en los
estudios de teoría fundamentada, el investigador cualitativo trata
de describir los procesos sociales que intervienen en una

153
experiencia con el fin de desarrollar una teoría inicial (Charmaz,
2014). Los investigadores que utilizan métodos de teoría
fundamentada no suelen seleccionar un marco teórico. En otros
tipos de estudio, como los estudios cualitativos exploratorios-
descriptivos y los estudios etnográficos, los investigadores pueden
seleccionar un marco teórico para estructurar el estudio. Weyant y
cols. (2017) identificaron que su estudio era fenomenológico, lo que
indica su base filosófica. Sin embargo, no especificaron un marco
teórico, lo que es habitual en los estudios fenomenológicos. La
revisión de la bibliografía fue muy limitada. No obstante, lo que se
describe en el artículo puede que no representase toda la
bibliografía que los investigadores revisaron antes del estudio.
Algunas revistas limitan el número de páginas de los artículos y los
investigadores pueden resumir la bibliografía a fin de tener
suficiente espacio en el artículo para los resultados.
El siguiente paso en el proceso de investigación es determinar los
objetivos, preguntas o hipótesis de investigación. Los
investigadores cualitativos pueden utilizar los objetivos o las
preguntas para dirigir la recogida de datos (Creswell y Poth, 2018).
Weyant y cols. (2017, pág. 112) identificaron que sus preguntas
eran: «¿Cómo perciben los familiares de pacientes intubados y con
sujeción en una unidad de cuidados intensivos cardiacos los
cuidados proporcionados por el personal de enfermería? ¿Qué
identifican como una conducta de cuidado o de ausencia de
cuidado?».
Los informes de investigación de estudios cualitativos y
cuantitativos difieren bastante en las secciones de métodos,
resultados y discusión. Los datos recogidos por los investigadores
cuantitativos para cada variable serán numéricos; en cambio, los
investigadores cualitativos recogen datos en forma de texto e
imágenes, por lo que identificar variables y definirlas es
inapropiado (v. tabla 3.1). Los métodos de recogida de datos deben
ser coherentes con el problema de investigación y el propósito del
estudio, condición descrita por Creswell y Poth (2018) como
congruencia metodológica. Los métodos de recogida de datos
pueden evolucionar a medida que el estudio progresa. Por ejemplo,
se puede comenzar con una entrevista con preguntas generales. A
medida que se recogen y se analizan los datos, se identifica un

154
posible tema y se añade una pregunta sobre el tema emergente en
las entrevistas posteriores. Weyant y cols. (2017) describieron sus
métodos que incluían la transcripción de las entrevistas que
realizaban con los pacientes ventilados previamente y sus familias,
así como el análisis del texto de la transcripción para identificar las
conductas de cuidados.
El paso de muestreo en el proceso de investigación se produce en
los estudios tanto cuantitativos como cualitativos, pero las
características de una muestra de calidad para cada tipo de
investigación son diferentes. Lo ideal es que los investigadores
cuantitativos puedan reclutar una gran muestra aleatoria, de modo
que los hallazgos puedan generalizarse a la población diana. La
realización de un análisis de potencia permite a los investigadores
determinar el tamaño muestral mínimo para un estudio
cuantitativo. Debido a que los investigadores cualitativos quieren
comprender el problema de investigación identificado desde el
punto de vista de los participantes, reclutan deliberadamente
menos participantes, pero se aseguran de que cada uno tenga
experiencia con el tema de investigación o que viva o trabaje en una
cultura específica. El tamaño muestral puede variar según el
método cualitativo del estudio. Los estudios fenomenológicos
pueden necesitar 10 o menos participantes si el tema es restringido
y los participantes proporcionan datos adecuados (Creswell y Poth,
2018). Los estudios de teoría fundamentada pueden requerir más de
30 participantes para garantizar que se dispone de suficientes
detalles para desarrollar una teoría sólida (Bolderston, 2012). Por lo
general, el muestreo se realiza hasta alcanzar la saturación
(Creswell y Poth, 2018), definida como el momento en el que los
participantes o fuentes de datos adicionales no proporcionan
información nueva. Cada participante proporciona muchos datos
que permiten al investigador identificar la perspectiva de los
participantes y el significado del fenómeno. Weyant y cols. (2017,
pág. 112) indicaron que «los datos se recogieron hasta que se
alcanzó la saturación de los temas frecuentes». Entrevistaron a 14
pacientes y 8 familiares. Hay más información sobre muestreo más
adelante en este capítulo.
El análisis de los datos se realiza en estudios tanto cuantitativos
como cualitativos. Para los estudios cuantitativos, los datos

155
numéricos se analizan utilizando fórmulas y ecuaciones estadísticas
calculadas por un programa informático. El análisis de los datos
cualitativos no es estadístico, lo que significa que las hipótesis no se
comprueban en los estudios cualitativos. En los estudios
cualitativos, la mente del investigador es el «programa» que analiza
los datos, aprecia patrones, identifica temas y permite que surja el
significado de los datos. La mente del investigador encuentra de
forma inductiva elementos comunes y luego piensa
deductivamente, volviendo a los datos para encontrar más
evidencia que respalde el elemento común (Creswell y Poth, 2018).
Se puede utilizar un programa informático durante el proceso de
análisis de los datos para mantener un registro de los temas que el
investigador encuentra y las decisiones tomadas durante el estudio.
Weyant y cols. (2017) proporcionaron una lista de preguntas de
entrevista para su estudio de conductas de cuidados percibidas por
los pacientes con ventilación mecánica y ofrecieron una descripción
muy breve del modo en el que se analizaron los datos. «…cualquier
información de identificación personal se eliminó y se utilizó un
código de letras para proteger la confidencialidad. Los datos se
recogieron hasta que se alcanzó la saturación de los temas
frecuentes. Los datos se analizaron utilizando el programa de
investigación cualitativa NVivo 9 (QSR International)» (Weyant y
cols., 2017, pág. 112).
Para ambos tipos de investigación, los resultados del estudio se
presentan en el informe de investigación. La presentación de los
resultados cuantitativos será los resultados del análisis estadístico,
mientras que los resultados cualitativos se presentan como
descripciones profusas, temas o una teoría emergente. En los
informes cuantitativos, los números y los resultados estadísticos se
presentan de forma concisa. Para los estudios cualitativos, la
sección de resultados puede ser muy larga, porque el investigador
expone un tema y lo respalda con una o más citas de los
participantes (v. tabla 3.1).
En el estudio de Weyant y cols. de (2017), cinco tipos de
conductas de enfermería se percibieron como cuidados por los
pacientes que habían recibido ventilación mecánica y por sus
familias. Estas conductas consistieron en proporcionar información,
proporcionar tranquilidad, demostrar competencia, estar presente y

156
proporcionar orientación con un tono de voz suave (Weyant y cols.,
2017). Para cada una de ellas, los investigadores proporcionaron
citas y ejemplos de sus entrevistas con los pacientes y sus familias.
Los restantes pasos del proceso de investigación son los mismos.
Durante el paso de la interpretación de los resultados, los
investigadores comparan lo que encuentran con lo que otros
investigadores han descubierto y publicado previamente en la
bibliografía (v. tabla 3.1). Por ejemplo, Weyant y cols. (2017) citaron
a otros dos investigadores que habían encontrado conductas de
cuidados similares.
Los investigadores cuantitativos y cualitativos identifican las
limitaciones de los estudios y después comentan si los hallazgos
pueden generalizarse o aplicarse a otros grupos. La
generalizabilidad es un resultado deseado para los estudios
cuantitativos cuando la muestra es representativa de las
poblaciones diana. La aplicabilidad de los hallazgos a individuos
similares o la transferibilidad es el resultado deseado de los
estudios cualitativos. Los investigadores también realizan
recomendaciones para la práctica, cuando resulta apropiado, y para
estudios futuros. Las recomendaciones para estudios futuros
pueden incluir los estudios que se diseñarían para superar las
limitaciones del estudio actual, aumentar la muestra a otros grupos,
o perfeccionar los datos recogidos. En unas pocas frases, Weyant y
cols. (2017) señalaron las limitaciones, la magnitud de la
transferibilidad y las recomendaciones para estudios futuros en la
siguiente cita. «Este estudio se realizó en un centro y en un tipo de
entorno de cuidados intensivos. Por tanto, la transferibilidad de los
resultados es limitada… se recomiendan investigaciones futuras en
varios centros en entornos de cuidados intensivos. Se necesita
ampliar los hallazgos de este estudio para aumentar el cuerpo de
conocimiento relacionado con las conductas de cuidados en
unidades de cuidados intensivos» (pág. 116).

ENFOQUES DE LA INVESTIGACIÓN
CUALITATIVA
Los fenómenos son la percepción consciente de experiencias que

157
conforman la vida de los seres humanos (van Manen, 2017). Una
experiencia se considera única para el individuo, el momento y el
contexto, por lo que los investigadores cualitativos describen un
fenómeno desde la perspectiva de las personas que han tenido la
experiencia que se está estudiando (Cypress, 2015). Los
investigadores cualitativos reconocen que la personas experimentan
la vida desde distintas perspectivas, porque los pensamientos,
palabras y acciones de una persona están influidos por el pasado y
el presente, así como por los contextos físico, psicológico y social de
la conducta o experiencia (Hoggan, Mälkki y Finnegan, 2017). Los
resultados de un estudio cualitativo dan lugar a la comprensión de
un fenómeno en una situación en particular y no se generalizan de
la misma forma que en los estudios cuantitativos. El rigor o la
fortaleza de un estudio cualitativo es el grado en que los
significados identificados representan las perspectivas de los
participantes con precisión. Los métodos cualitativos rigurosos
pueden facilitar que el investigador mantenga un punto de vista
abierto sobre el fenómeno.
Cada uno de los cuatro enfoques se basa en una orientación
filosófica que influye en la interpretación de los datos. Es
fundamental entender la filosofía en la que se basa el método de
cada enfoque, ya sea fenomenología, teoría fundamentada,
etnografía o investigación cualitativa exploratoria-descriptiva. Cada
enfoque se analiza en relación con su orientación filosófica y el
resultado previsto. Se proporciona un estudio para ilustrar cada
metodología de investigación cualitativa. Decidir qué enfoque
cualitativo utilizar depende de la pregunta de investigación y del
propósito del estudio (Creswell y Poth, 2018). Cada uno de los
estudios se valorará críticamente utilizando las siguientes guías
para identificar y comprender los enfoques cualitativos.

GUÍAS DE VALORACIÓN CRÍTICA


Estudios cualitativos

1. ¿Qué tipo de estudio cualitativo se ha realizado:


fenomenológico, de teoría fundamentada, etnográfico o

158
investigación cualitativa exploratoria-descriptiva?
2. ¿Cuál fue el resultado del estudio que se ha presentado en el
informe de investigación para el tipo de estudio cualitativo
realizado?
a. Fenomenología: descripción profusa de la
experiencia vivida.
b. Teoría fundamentada: descripción teórica de
procesos sociales.
c. Etnografía: descripción de una cultura, ya sea raza/
étnica, o una organización.
d. Investigación cualitativa exploratoria-descriptiva:
respuesta a la pregunta de investigación con el fin
de solucionar problemas.
3. ¿Se pueden identificar las siguientes secciones en el informe
de investigación: Introducción, Métodos, Resultados y
Discusión?
4. ¿Se identificaron claramente los pasos del estudio? En la tabla
3.1 se muestran los pasos del proceso de investigación
cualitativa.
5. ¿Faltaba alguno de los pasos del proceso de investigación?

Investigación fenomenológica
Orientación filosófica
La fenomenología se refiere a una filosofía y un grupo de
métodos de investigación congruentes con la filosofía que guía el
estudio de experiencias o fenómenos (Tuohy, Cooney, Dowling,
Murphy y Sixmith, 2013). Los fenomenologistas contemplan a la
persona integrada con el entorno. El mundo moldea a la persona y
la persona moldea al mundo. La pregunta de investigación amplia
que plantean los fenomenologistas es: «¿Cómo es vivida esta
experiencia?» (van Manen, 2017, pág. 776). Mediante un estudio
fenomenológico, el investigador recoge datos de personas que han
tenido la experiencia y trata de crear una combinación de la esencia
de la experiencia (Creswell y Poth, 2018).
Los fenomenologistas difieren en sus creencias filosóficas. Los
investigadores fenomenológicos de enfermería suelen basar su
diseño de estudio en Husserl o Heidegger, dos de los primeros

159
filósofos de la fenomenología. Cada una de estas perspectivas
filosóficas apoya un tipo específico de investigación
fenomenológica.
Husserl se centró en el propio fenómeno. El objetivo de la
investigación es «capturar la experiencia en su… esencia, sin
interpretar, explicar o teorizar» (van Manen, 2017, pág. 775). Las
declaraciones cargadas de significado se analizan para descubrir la
estructura existente en el fenómeno. La filosofía de Husserl apoya la
investigación fenomenológica descriptiva, cuyo propósito es
describir las experiencias tal y como se viven o, en términos
fenomenológicos, captar la «experiencia vivida» de los participantes
en el estudio. Según Husserl, para describir las experiencias
vividas, los investigadores deben realizar una reducción
fenomenológica (bracketing) que supone una puesta entre
paréntesis de toda intencionalidad con el fin de dejar aparte sus
propios sesgos y prejuicios para describir el fenómeno de una
manera inocente (Dowling y Cooney, 2012).
Heidegger sostenía que era imposible apartar los prejuicios
propios y comprender el mundo de un modo inocente. Creía que
los investigadores fenomenológicos describen el modo en el que los
participantes han interpretado u otorgado significado a sus
experiencias (Converse, 2012). A continuación, los investigadores
analizan las interpretaciones que los participantes hacen de la
experiencia, buscando el significado oculto (Dowling y Cooney,
2012). La fenomenología interpretativa, concordante con la
filosofía de Heidegger, implica el análisis de los datos y la
presentación de una descripción suficientemente profusa del
fenómeno, tal y como lo interpreta el investigador.
La hermenéutica es un tipo de método de investigación
fenomenológica interpretativa congruente con la perspectiva
filosófica de Heidegger y la utilizan los investigadores de
enfermería (Dowling y Cooney, 2012). La hermenéutica implica un
análisis textual que comienza con una lectura inocente de los textos
(Flood, 2010). Para hacer una lectura neutral o inocente del texto, el
investigador permanece abierto de forma consciente al punto de
vista del participante. Los investigadores de enfermería analizan
textos tales como transcripciones de entrevistas y documentos
publicados. A partir de estas lecturas inocentes, el investigador

160
identifica subtemas y temas que se analizan a la luz de las
preguntas de investigación del estudio. A medida que el texto,
temas y bibliografía relevante se integran, se elabora una
descripción del fenómeno tal y como se ha interpretado.

Resultado de la fenomenología
El propósito de la investigación fenomenológica es proporcionar
una descripción exhaustiva de una experiencia vivida. Algunos
investigadores escriben una descripción profusa y detallada, o un
ejemplo de su experiencia. En ocasiones, los participantes tendrán
perspectivas muy diversas sobre los fenómenos y el investigador
puede desarrollar dos o más descripciones detalladas de la
experiencia vivida.
Una quemadura grave puede cambiar el curso de la vida de una
persona y afectar a todos los aspectos de la salud. Abrams,
Ogletree, Ratnapradipa y Neumeister (2016) entrevistaron a ocho
participantes sobre la experiencia de sobrevivir a una quemadura
grave en su estudio fenomenológico. Los estudios previos habían
analizado los efectos específicos a largo plazo de las quemaduras,
como el ajuste psicológico y la reincorporación laboral, pero había
una carencia de conocimiento sobre el modo en el que los aspectos
interrelacionados de la salud y la etapa de la vida afectaban a la
salud posquemadura de los supervivientes. Un enfoque
fenomenológico del problema de investigación permitió que los
participantes compartiesen sus experiencias vividas de ser
supervivientes de quemaduras. En el Ejemplo de investigación 3.1
se muestran extractos del estudio y de la discusión relacionada.

EJEMPLO DE INVESTIGACIÓN 3.1


Estudio fenomenológico
Extracto del estudio de investigación

Introducción: Las implicaciones individuales de las quemaduras


graves probablemente afecten a todo el espectro de la salud física,
emocional, psicológica, social, ambiental, espiritual y laboral de los

161
pacientes. Sin embargo, no todas las implicaciones de salud
posquemadura son inevitablemente negativas. Este estudio
fenomenológico heurístico utiliza un enfoque cualitativo para
analizar las experiencias y percepciones de adultos jóvenes (18-35
años) y de mediana edad (36-64 años)…
Métodos: Se entrevistó a los participantes utilizando una entrevista
semiestructurada. Los registros de la entrevista se transcribieron
textualmente y después se codificaron línea a línea… El análisis
cualitativo del contenido dio lugar a tres categorías emergentes
relacionadas con la salud y temas asociados que representaban los
significados compartidos en la muestra de participantes. La
categoría de «Salud física» reflejaba el tema de limitaciones físicas,
dolor y sensibilidad a la temperatura. En la categoría de «Salud
intelectual» se incluían temas de introspección, fijación de objetivos
y autoeficacia, optimismo y humor, mientras que en la de «Salud
emocional» estaban los temas de empatía y gratitud…
Conclusiones: Mediante el análisis de las experiencias y
percepciones subjetivas de la salud compartidas a través del diálogo
con personas que habían sufrido quemaduras, surgen
oportunidades para elaborar una visión más completa del modo en
el que la salud holística puede afectarse por quemaduras graves, lo
que a su vez puede apoyar las trayectorias futuras a largo plazo de
rehabilitación de pacientes quemados adultos jóvenes y de mediana
edad. (Abrams y cols., 2016, pág. 152)

El propósito del estudio fue «analizar el fenómeno de las


quemaduras graves en la salud holística de los supervivientes
adultos jóvenes y de mediana edad» (Abrams y cols., 2016, pág.
153). Se utilizó un muestreo deliberado (o intencional) para reclutar
a los participantes que cumplieron los criterios de inclusión:
individuo anglófono, edad de 18-64 años y superviviente de una
quemadura que afectase a un mínimo del 20% de la superficie
corporal total. Se buscaron participantes que hubiesen sido «dados
de alta después de su hospitalización inicial por la quemadura al
menos 12 meses antes de las entrevistas del estudio» (Abrams y
cols., 2016, pág. 153). Los investigadores describieron su estudio
como de tipo fenomenológico heurístico. Según el artículo, la
etiqueta de «heurístico» se añadió para reconocer e incorporar la

162
experiencia personal del investigador principal, que también era
un superviviente de una quemadura.

Como investigador principal, mis intereses en las implicaciones


biopsicosociales positivas y negativas a largo plazo de las quemaduras
y la resiliencia de los supervivientes a estas se han desarrollado a lo
largo de toda la vida. Al haber sufrido quemaduras graves en la
infancia, yo he vivido toda la vida con cicatrices evidentes de
quemaduras e injertos en la cara y las extremidades superiores… y los
participantes observaban enseguida que yo tenía experiencia personal
con quemaduras graves. (Abrams y cols., 2016, pág. 159)

Los datos se recogieron mediante entrevistas en localizaciones


seleccionadas por los ocho participantes. Se pidió a cada
participante que identificara a una persona que hubiese estado
implicada activamente en el periodo posterior y la recuperación de
la quemadura para que proporcionase información corroborativa
(muestreo por redes; v. cap. 9). Se realizó un total de 12 entrevistas
(ocho participantes y cuatro familiares) de 45-60 minutos. Las
transcripciones literales de las entrevistas se remitieron por correo
a los participantes, que comprobaron su precisión. Otros datos
adicionales fueron las reflexiones escritas en el diario del
investigador principal y las observaciones escritas realizadas
después de cada entrevista. Los datos se codificaron y se
analizaron a partir de las transcripciones de los supervivientes y las
transcripciones de los familiares se usaron como respaldo.
Los investigadores aumentaron la confianza de sus hallazgos
«implicando a los familiares como fuentes de corroboración y
haciendo que comprobasen las transcripciones de las entrevistas
para triangular los datos, así como mediante una revisión por
terceros de las categorías y temas para respaldar los hallazgos del
estudio» (Abrams y cols., 2016, pág. 160). La triangulación significa
que los investigadores utilizan al menos dos perspectivas
diferentes para converger en un único punto de vista sobre el tema.
En este artículo, Abrams y cols. (2016) combinaron y compararon la
información de las entrevistas a los participantes y los familiares,
así como la información de los compañeros. Abrams y cols.
también señalaron la posibilidad de sesgos debido a que el

163
investigador principal era un superviviente de quemaduras, pero
subrayaron el beneficio de «un nivel de candidez y honestidad…
observado entre los compañeros con una experiencia traumática
compartida» (pág. 160).
El análisis de contenidos reveló tres categorías de significados
compartidos. Los investigadores subrayaron el modo en el que los
participantes usaban el humor para ayudar a que los demás
estuviesen más cómodos en las situaciones sociales. El humor
permitía a los supervivientes de quemaduras hablar sobre sus
«quemaduras sin que los demás se sintiesen incómodos y/o sin ser
rechazados» (Abrams y cols., 2016, pág. 157). La salud emocional se
manifestó por la empatía y la gratitud expresada por los
participantes. Estos señalaron que habían logrado un crecimiento
personal, se habían vuelto más sensibles a las dificultades de los
demás y habían desarrollado empatía. Se describió que la gratitud
se sentía hacia «la familia, los miembros de la comunidad, los
profesionales sanitarios y el personal de rescate. Cada grupo tenía
un lugar en las historias de supervivencia de los participantes»
(Abrams y cols., 2016, pág. 160).
Los hallazgos eran descripciones de las «experiencias vividas de
dificultad, adaptación, resiliencia y esperanza a medida que los
participantes se esforzaban para recuperar su equilibrio basado en
la salud después de quemaduras graves» (Abrams y cols., 2016,
pág. 158). Los investigadores ofrecieron un resumen de los
hallazgos del estudio, con implicaciones para los cuidados
posquemaduras.
Valoración crítica
Abrams y cols. (2016) realizaron un estudio fenomenológico
interpretativo. El resultado fue una descripción temática de la
experiencia vivida de salud posquemaduras, que fue concordante
con el método cualitativo utilizado para el estudio. Las secciones
clave del informe de investigación se identificaron con claridad. Al
igual que en los estudios fenomenológicos, no se identificó un
marco teórico porque el estudio se guió por la filosofía de la
fenomenología. Los investigadores se remitieron a los estadios de
desarrollo de Erikson e indicaron que el estadio de desarrollo de la
persona se introdujo en los distintos problemas del desarrollo

164
después de las quemaduras. La revisión de la bibliografía se
integró en la introducción, en lugar de identificarla como un paso
separado del proceso de investigación. Todos los demás pasos del
proceso de investigación se identificaron con claridad. Los
investigadores reconocieron que existían diferencias entre los
participantes, de modo que algunos mostraban más autoeficacia y
resiliencia que otros. También identificaron áreas para futuros
estudios, como secuelas funcionales y psicológicas de las
quemaduras y el impacto de la localización geográfica y la
disponibilidad de recursos comunitarios sobre la adaptación.

Investigación de teoría fundamentada


La investigación de teoría fundamentada es una técnica inductiva
que surgió de la disciplina de la sociología. El término fundamentada
significa que la teoría se desarrolló a partir de la investigación, es
decir, la teoría está fundamentada en el mundo real a partir de los
datos proporcionados por los participantes. La mayoría de los
académicos basan la metodología de teoría fundamentada en la
teoría de la interacción simbólica. George Herbert Mead (Mead,
1934) fue un psicólogo social que desarrolló la teoría de la
interacción simbólica. Esta evalúa el modo en el que las personas
definen la realidad y el modo en el que sus creencias se relacionan
con sus acciones. La realidad se crea asignando significados a las
situaciones. El significado se expresa en símbolos como palabras,
objetos religiosos, patrones de conducta y forma de vestir. Estos
significados simbólicos son la base para las acciones e interacciones.
Sin embargo, los significados simbólicos son diferentes para cada
persona y no es posible conocerlos por completo en cada caso. En la
vida social, los significados son compartidos por los grupos y se
comunican a los nuevos miembros a través de procesos de
socialización. La vida del grupo se basa en el consenso y en
significados compartidos. La interacción puede dar lugar a la
redefinición de un significado o a la construcción de otros nuevos.
El investigador que utiliza la teoría fundamentada intenta
comprender la interacción entre el yo y el grupo desde la
perspectiva de los participantes y, a partir de esa comprensión,
desarrollar una teoría de la interacción o de los procesos sociales

165
(Creswell y Poth, 2018).
La teoría fundamentada se ha utilizado con más frecuencia para
estudiar áreas en las que se ha realizado poca investigación previa y
para conseguir una nueva perspectiva en áreas ya investigadas.
Mediante sus entrevistas para comprender los puntos de vista de
las personas que estaban muriendo, Glaser y Strauss (1967)
desarrollaron la investigación de teoría fundamentada como
método y publicaron un libro en el que se describía como un
método cualitativo. Este sistema atrajo a los profesionales de
enfermería debido a su aplicabilidad a las experiencias vitales de las
personas con problemas de salud y a su potencial para explicar la
conducta humana (Wuerst, 2012). Los investigadores de enfermería
siguen utilizando los métodos de la teoría fundamentada para
estudiar un amplio rango de temas, como la elección de la
reinserción desde el punto de vista de refugiados iraquíes
(Davenport, 2017), la rehabilitación multidisciplinar para pacientes
con fibromialgia (Rasmussen, Amris y Rydahl-Hanson, 2017) y el
modo en el que los profesionales de enfermería en cuidados
paliativos pediátricos afrontan sus propias emociones (Erikson y
Davies, 2017).

Resultado previsto
Los estudios de teoría fundamentada completamente desarrollados
producen marcos teóricos con declaraciones relacionales entre los
conceptos. Algunos teóricos de la fundamentación proporcionan un
diagrama que muestra las interacciones entre los procesos sociales
que se han identificado. Otros describen los conceptos y relaciones
mediante una descripción narrativa.
Se ha observado que los errores médicos son la tercera causa de
muerte en Estados Unidos (Makary y Daniel, 2016). Por desgracia,
los profesionales de enfermería fueron responsables de algunos de
estos errores. Koehn, Ebright y Draucker (2016) desarrollaron una
teoría fundamentada a partir de entrevistas con profesionales de
enfermería que habían cometido un error en el cuidado de
pacientes. En su estudio se identificaron las etapas por las que
pasaban los profesionales de enfermería cuando descubrían que se
había cometido un error y comenzaban a afrontar las consecuencias.
El Ejemplo de investigación 3.2 describe su estudio.

166
EJEMPLO DE INVESTIGACIÓN 3.2
Estudio de teoría fundamentada
Extracto del estudio de investigación
Una comprensión mejor de la toma de decisiones de los profesionales
de enfermería respecto a la notificación de errores y de los factores del
puesto de trabajo que influyen en sus decisiones puede orientar el
desarrollo de estrategias para mejorar la frecuencia y precisión de la
notificación de errores por estos profesionales. Por tanto, el propósito
del estudio fue analizar los procesos de toma de decisiones de los
profesionales de enfermería sobre la notificación de errores. La
muestra del estudio estaba compuesta por profesionales de enfermería
que trabajaban en una unidad de cuidados intensivos (UCI) de
adultos como cuidadores directos de pacientes. Las UCI se escogieron
porque se notificaban tasas elevadas de errores en unidades de
enfermería que proporcionan cuidados agudos a pacientes en estado
crítico… La recogida y el análisis de los datos se realizaron
simultáneamente. Se utilizaron los procedimientos descritos por
Charmaz (2014) para analizar los datos. Estos procedimientos se
basan en una estrategia denominada análisis de comparación
constante, que es un proceso por el que los datos se comparan tanto en
una misma narrativa como entre las distintas narrativas y se generan
reconstrucciones teóricas cada vez más abstractas de los datos… Se
escogió la etiqueta «Estar descentrado» para la primera etapa, porque
los errores cometidos por los participantes a menudo se cometieron en
el contexto de condiciones laborales que eran complejas o que les
inquietaban de algún modo… Se escogió la etiqueta «Vivir el error»
para la segunda etapa debido a la naturaleza abrumadora y personal
de estas experiencias de error. La mayoría de los participantes
contaron historias vívidas y detalladas sobre el error cometido y
describieron las intensas emociones que rodearon la experiencia… Se
escogió la etiqueta «Notificación o narración de un error» para la
tercera etapa, porque refleja las diversas formas en las que el error se

167
dio a conocer a los demás en el lugar de trabajo. Todos los
participantes explicaron si revelaron el error a otras personas, cuándo
y cómo… Se escogió la etiqueta «Vivir las consecuencias» para la
cuarta etapa, porque los participantes a menudo estaban
atormentados por los recuerdos del error aunque se hubiese resuelto y
tenían la determinación de no volver a cometerlo… Se escogió la
etiqueta «Persistencia del recuerdo» para la etapa final porque la
mayoría de los participantes creían que sus recuerdos del error
cometido nunca desaparecerían, ni siquiera se atenuarían. Los
participantes estaban convencidos de que estos recuerdos «les
perseguirían» durante todas sus carreras y continuarían influyendo
en su práctica. (Koehn y cols., 2016, págs. 567-570)

Koehn y cols. (2016) comenzaron su estudio observando a


profesionales de enfermería en ocho unidades de cuidados
intensivos. Al compartir espacio con los profesionales de
enfermería, encontraron oportunidades para hablar con ellos sobre
el estudio y obtener información de contacto de los que parecían
interesados. Las 30 entrevistas que se realizaron a partir de su
reclutamiento se llevaron a cabo en una ubicación privada que
tanto el investigador como el profesional de enfermería
consideraron aceptable. El enfoque fue que los errores eran una
experiencia universal de los profesionales de enfermería (Koehn y
cols., 2016).
Como se ha señalado en el extracto, el método de análisis de los
datos que se utilizó fue una comparación constante. Los
investigadores compararon y combinaron los códigos iniciales
durante la etapa de codificación focalizada. En la etapa de
codificación axial del análisis, Koehn y cols. propusieron relaciones
entre los códigos focalizados, los integraron en un marco
provisional y desarrollaron un diagrama con los conceptos y
relaciones entre ellos. Denominaron a la teoría provisional
«Lecciones aprendidas del error» y el proceso de aprendizaje a
partir del error se desarrolló en cinco etapas (fig. 1).
Los profesionales de enfermería describieron las lecciones
aprendidas que les ayudarían a evitar un error similar en el futuro.
Los beneficios que obtuvieron de aprender «unas lecciones

168
personales dolorosas» «no se compartieron con otros profesionales
de enfermería que trabajaban en los mismos entornos», lo que
podría haber dado lugar a mejoras del sistema (Koehn y cols., 2016,
pág. 570).
La riqueza de los hallazgos y el diagrama de las etapas y
relaciones entre ellas constituyen las bases sobre las que una
institución podría considerar formas de disminuir la complejidad
del entorno laboral y aumentar su seguimiento de los errores con el
fin de proporcionar más apoyo psicológico y emocional al personal
de enfermería después de que se producen errores.
Valoración crítica
Koehn y cols. (2016) identificaron que su estudio era de teoría
fundamentada. Realizaron un número adecuado de entrevistas
porque tenían abundantes datos, que analizaron utilizando un
marco estructurado. El resultado previsto (una descripción teórica
de los procesos sociales) se logró y las etapas de vivir con un error
en la aplicación de cuidados se representaron en una figura. Cada
componente del informe de investigación era claramente
identificable. De forma adecuada, Koehn y cols. (2016) no
identificaron un marco teórico porque estaban desarrollando una
teoría «fundamentada» en los procesos sociales experimentados
por los profesionales de enfermería después de un error. La amplia
revisión de la bibliografía se incluyó en la introducción del artículo.
Los otros pasos del proceso de investigación se incluyeron en el
informe. El estudio tiene un buen diseño de teoría fundamentada
que proporcionó unos hallazgos sólidos con relevancia clínica.

169
FIG 1 Lecciones aprendidas del error. Esta figura
ilustra el modelo teórico desarrollado a partir del
estudio de Koehn y cols. ODM, Oh Dios mío.
(Modificada de Koehn, A., Ebright, P. y Draucker, C. [2016].
Nurses’ experiences with errors in nursing. Nursing Outlook,
64[6], 566-574.)

Investigación etnográfica
La investigación etnográfica fue desarrollada por antropólogos
como un método para estudiar el modo en el que las culturas se
desarrollan y se mantienen a través del tiempo (Marshall y
Rossman, 2016). Mediante la inmersión en la cultura, los
antropólogos estudian un grupo de personas que comparten una
cultura y sus orígenes, formas de vida del pasado y modos de

170
supervivencia a lo largo del tiempo (Creswell y Poth, 2018). El
término etnografía también se puede aplicar al producto de la
investigación, la descripción escrita del estudio de la cultura
(Morgan-Trimmer y Wood, 2016). Los primeros investigadores
etnográficos estudiaban culturas primitivas, extrañas o remotas.
Estos estudios permitían al investigador pasar un año o más en otra
cultura para adquirir nuevos puntos de vista sobre un pueblo
concreto, incluidas sus formas de vida, sus creencias y la
adaptación a las circunstancias cambiantes del entorno. Esto refleja
el abordaje émico, consistente en estudiar las conductas desde
dentro de la cultura reconociendo la singularidad del individuo
(Morgan-Trimmer y Wood, 2016). El abordaje émico desde dentro
de la cultura es el objetivo típico de la etnografía, pero puede
alternarse con el abordaje ético. El abordaje ético consiste en
contemplar la cultura como un espectador ingenuo y analizar sus
elementos como un investigador. Morgan-Trimmer y Wood (2016)
han abogado por el uso de ambos enfoques para lograr los objetivos
de la etnografía.
La perspectiva filosófica de la investigación etnográfica se basa en
la antropología y reconoce que la cultura es material e inmaterial.
La cultura material consiste en todos los aspectos creados o
construidos de la cultura, como los edificios que se utilizan para
eventos culturales, los símbolos de la cultura, las tradiciones
familiares, las redes de las relaciones sociales y las creencias
reflejadas en las instituciones sociales y políticas. El significado
simbólico, las costumbres sociales y las creencias (componentes de
la cultura inmaterial) pueden ser evidentes en una cultura diferente
solo a lo largo del tiempo, pero son elementos esenciales de las
culturas. Las culturas también tienen ideales que las personas
consideran deseables, aunque no siempre se ajusten a estas normas.
Los antropólogos y los profesionales de enfermería etnógrafos
intentan descubrir las múltiples partes de una cultura y determinar
cómo se interrelacionan. La imagen de la cultura como un todo se
vuelve más clara.
Es posible que los profesionales de enfermería no observen una
cultura durante meses o años, pero pueden observar una cultura
organizativa durante un periodo menor para aprender sobre «las
experiencias compartidas de un fenómeno predeterminado más

171
limitado» (Rashid, Caine y Goez, 2015, pág. 3). Este tipo de estudio
se denomina etnografía enfocada (Savage, 2006). Las observaciones
que duran menos de meses o años son apropiadas cuando la
pregunta de investigación es más restringida, y el alcance del
estudio se limita a un lugar u organización específica. Sin embargo,
Morse (2016, pág. 875) recuerda a los investigadores que una
«buena etnografía requiere tiempo».
La enfermera que aumentó la visibilidad de la etnografía dentro
de la enfermería fue Madeline Leininger, que se doctoró en
antropología. El trabajo de campo para obtener su título consistió
en pasar un año en Papúa Nueva Guinea. A partir de esta
experiencia, desarrolló el Sunshine Model of Transcultural Nursing
Care, que identifica los aspectos culturales que deben tenerse en
cuenta durante la comunicación con pacientes y familiares de otra
cultura (Leininger, 1988). Los profesionales de enfermería utilizan
la Teoría de Enfermería Transcultural de Leininger (Leininger,
2002) en la práctica mediante la evaluación de múltiples aspectos
del paciente, la familia y su entorno, como la religión, las normas
sociales, el nivel económico, el país de origen, el subgrupo étnico y
las creencias sobre la salud y la enfermedad. Esta teoría ha dado
lugar a una estrategia de investigación etnográfica para enfermería
denominada investigación de etnoenfermería. La investigación de
etnoenfermería «se centra principalmente en la observación y la
documentación de las interacciones con las personas [y] en cómo
estas condiciones de la vida diaria y los patrones influyen en el
cuidado humano, la salud y la práctica de los cuidados de
enfermería» (Leininger, 1985, pág. 238). Sin embargo, varios
profesionales de enfermería antropólogos no asociados con la
orientación de etnoenfermería también están haciendo importantes
contribuciones al cuerpo de conocimiento de la enfermería (Roper y
Shapiro, 2000).
El investigador etnográfico debe familiarizarse mucho con la
cultura que está estudiando mediante su observación, participando
activamente en ella y entrevistando a sus miembros. Incluso para
las etnografías enfocadas, el investigador debe sumergirse en la
cultura que se está estudiando. El proceso de inmersión en una
cultura implica estar en ella y familiarizarse cada vez más con sus
aspectos, como el lenguaje, las normas socioculturales, las

172
tradiciones y otras dimensiones sociales, que comprenden la
familia, los patrones de comunicación (verbales y no verbales), la
religión, las pautas de trabajo y la expresión de las emociones.
Mediante la inmersión, el investigador etnográfico cada vez es más
aceptado en la cultura. Aunque estos investigadores deben
implicarse activamente en la cultura que están estudiando, han de
evitar «asimilarse», porque esto podría interferir en la recogida y el
análisis de los datos. Mediante la asimilación, el investigador se
convierte en parte de la cultura y pierde su capacidad de observar
con claridad (Creswell y Poth, 2018).

Resultado previsto
El etnógrafo prepara un informe escrito basado en el análisis de la
cultura. Las etnografías tradicionales suelen tener la extensión de
un libro y superan lo que se puede publicar en una revista
profesional. Las etnografías enfocadas tienen más probabilidades
de que se publiquen en una revista de enfermería. A semejanza de
una etnografía enfocada, en la que el estudio tiene un enfoque más
restringido, los profesionales de enfermería han utilizado la
etnografía crítica, un método que se centra en los factores
socioecológicos y políticos en el seno de una cultura (Sanon,
Spigner y McCullagh, 2016). Dependiendo del método específico
escogido y de la pregunta de investigación inicial, el investigador
puede proponer estrategias para aumentar la aceptabilidad cultural
de una intervención sanitaria, estimular conductas que fomentan la
salud o mejorar la calidad de la asistencia que se está
proporcionando en una organización.
Una unidad de cuidados intensivos neonatales (UCIN) es un
entorno dependiente de la tecnología con bebés vulnerables y sus
progenitores. A partir de los hallazgos de sus estudios previos,
Cricco-Lizza (2016) llevó a cabo una etnografía enfocada en una
UCIN para comprender mejor las barreras y apoyos para los
métodos de alimentación de los lactantes (Ejemplo de investigación
3.3).

EJEMPLO DE INVESTIGACIÓN 3.3

173
Estudio etnográfico
Extracto del estudio de investigación

Propósito: El propósito es analizar las creencias sobre alimentación


del lactante y las prácticas diarias de alimentación de los
profesionales de enfermería de una UCIN con el objetivo de
identificar formas de mejorar la promoción de la lactancia
materna… Las creencias sobre lactancia materna no se producen en
el vacío y un enfoque amplio es importante para analizar el
contexto de alimentación del lactante en la UCIN…
Muestra: En esta UCIN había 250 profesionales de enfermería
contratados… En este estudio, 114 informadores generales se
seleccionaron a la cabecera del paciente basándose en sus diversas
interacciones durante la alimentación del lactante y los cuidados de
enfermería… Del grupo de 114 informadores generales se
seleccionaron 18 informadores clave. Durante la observación
participante, se observó que eran conocedores y elocuentes sobre
diversas creencias y prácticas de alimentación de lactantes, y
aceptaron realizar un seguimiento en profundidad.
Recogida de datos: El trabajo de campo en la UCIN se realizó
durante sesiones de 1-2 horas en días, horarios y turnos distintos a
lo largo de un periodo de 14 meses… El papel del investigador de
enfermería varió desde la observación hasta la entrevista formal
durante las 128 sesiones de observación participante en este
estudio… Se observaron/entrevistaron informalmente un promedio
de 3,5 veces cada uno, con un rango de 1-24 durante el estudio.
Estos datos se documentaron en notas de campo detalladas
inmediatamente después de cada sesión y se utilizaron seudónimos
para proteger la confidencialidad… Se grabó en cinta una
entrevista formal de una hora con cada uno de los 18 informadores
clave… Las notas de campo de las observaciones, las
transcripciones de las entrevistas y las notas analíticas elaboradas
con regularidad se introdujeron en el programa informático QSR
NUD*IST… Los análisis de los datos se realizaron junto con la
recogida de datos de forma espiral. Las preguntas planteadas
durante los análisis se analizaron a continuación con mayor
profundidad en la siguiente entrevista u observación…

174
Hallazgos: Los hallazgos de este estudio reflejan las creencias y
prácticas diarias del personal de enfermería sobre la alimentación de
los lactantes en una UCIN para pacientes muy críticos, bien dotada
de personal.
Conclusiones: Se necesitan nuevas estrategias con el fin de superar
las dificultades para la promoción de la lactancia materna en la
UCIN. Los bebés de UCIN vulnerables y sus madres necesitan que
sus profesionales de enfermería tengan preparación clínica para
apoyar, fomentar y proteger la lactancia materna a pie de cama del
paciente. Los profesionales de enfermería de este estudio
identificaron que sintieron ansiedad, frustración o vergüenza con
las dificultades de la lactancia materna en la UCIN. Esta
investigación demuestra que las necesidades tanto emocionales
como educativas del personal de enfermería de la UCIN deben
abordarse antes de que puedan sentirse competentes y cómodas con
la promoción y el apoyo de la lactancia materna. (Cricco-Lizza,
2016, págs. e92–e97)

Cricco-Lizza (2016, pág. e92) identificó que la laguna de


conocimiento era la necesidad de contar con «una comprensión
más matizada de la cultura de alimentación en la UCIN». Como ya
se ha indicado, los métodos principales en la etnografía fueron la
observación participante, entrevistas informales, entrevistas
formales y notas de campo detalladas (Cricco-Lizza, 2016). La
credibilidad del hallazgo se reforzó por el uso de múltiples
métodos, triangulación entre los métodos, compromiso
prolongado, comprobación de los miembros y revisión por
compañeros en la universidad del investigador durante el análisis
de los datos.
Tres temas principales con subcomponentes surgieron de los
datos como indicadores del entorno de la UCIN y de las creencias y
conductas de los profesionales de enfermería. Estos hallazgos se
muestran en el cuadro 3.2. Los profesionales de enfermería de la
UCIN describieron que las ventajas de la lactancia materna eran
«los beneficios intelectuales, nutricionales, digestivos,
antiinfecciosos y antialérgicos para los bebés, junto con el vínculo y
el empoderamiento para las madres» (Cricco-Lizza, 2016, pág. e93).
Las creencias de los profesionales de enfermería sobre las

175
dificultades de la lactancia materna eran difíciles de superar e
incluyeron a «bebés vulnerables, madres ansiosas y la
incomodidad del personal, junto con la falta de privacidad en el
entorno de la UCIN» (pág. e94). La logística de las prácticas diarias
de la lactancia materna en la UCIN conllevaba otras dificultades. El
apoyo de una madre para que realice lactancia materna o para que
prepare la leche materna que se va a administrar en un biberón
requería más tiempo que simplemente dar un biberón de fórmula.
La alimentación con fórmula se consideraba segura, cómoda y más
aceptable para las madres adolescentes. La lactancia materna se
consideraba arriesgada en situaciones en las que las madres
tomaban fármacos. El último tema describía las diferencias
respecto a las creencias de los profesionales de enfermería de la
UCIN que habían tenido una experiencia personal positiva con la
lactancia materna o que habían recibido formación continuada
sobre los beneficios de la lactancia materna en comparación con los
que no tenían esas experiencias o formación. Los profesionales de
enfermería con experiencias positivas o formación eran firmes
defensores de la lactancia materna y estaban dispuestos a dedicar
tiempo y energía para ayudar a las madres a amamantar a sus
bebés en la UCIN.

CUADRO 3.2 TEMAS Y SUBTEMAS DE UNA


ETNOGRAFÍA DE UN LACTANTE
ALIMENTADO EN UNA UNIDAD DE
CUIDADOS INTENSIVOS NEONATALES

Tema 1. Los profesionales de enfermería


identificaron los beneficios de la lactancia
materna, pero hablaron con más detalle y con más
emoción sobre las dificultades diarias de la
lactancia materna en la UCIN.
• Creencias sobre los beneficios de la
lactancia materna para la salud.
• Creencias sobre las dificultades de la

176
lactancia materna en la UCIN.
• Dificultades prácticas diarias de la
lactancia materna en la UCIN.
Tema 2. La alimentación con fórmula evocó menos
emociones y la mayoría de los profesionales de
enfermería la consideraron segura y cómoda.
Tema 3. A pesar de las dificultades de la
alimentación del lactante en la UCIN, los
profesionales de enfermería que tenían formación
continuada sobre lactancia materna y/o algunas
experiencias positivas con esta lactancia
identificaron los beneficios basados en la
evidencia de la lactancia materna para las madres
y bebés, subrayaron las diferencias para la salud
entre la leche materna y la fórmula, y mostraron
un mayor compromiso para resolver las
dificultades con la lactancia materna.
UCIN, unidad de cuidados intensivos neonatales.

De Cricco-Lizza, R. (2016). Infant feeding beliefs and day-to-day


feeding practices of NICU nurses. Journal of Pediatric Nursing, 31(2),
e93–e94.

Valoración crítica
Cricco-Lizza (2016) proporcionó un ejemplo sólido de una
etnografía rigurosa. Los puntos fuertes del estudio fueron la
información detallada proporcionada en el informe sobre los
métodos y la inmersión del investigador en la cultura a lo largo del
tiempo. El investigador señaló que una limitación era el abundante
personal de la UCIN de alta intensidad que constituyó el entorno
del estudio. Las investigaciones futuras deben centrarse en UCIN
con unos pacientes menos críticos y posiblemente con menos
personal. La conclusión de la etnografía fue que «se necesitan

177
nuevas estrategias para superar las dificultades de la promoción de
la lactancia materna en la UCIN» (Cricco-Lizza, 2016, pág. e97).
Para que estas estrategias sean eficaces, deben abordar las
«necesidades emocionales y educativas de los profesionales de
enfermería de la UCIN» para ayudarles a ser «más competentes y a
estar más cómodos a la hora de promover y apoyar la lactancia
materna» (Cricco-Lizza, 2016, pág. e97).
Cricco-Lizza (2016) realizó una etnografía enfocada de un
aspecto específico de los cuidados de lactantes en un único
entorno. Esta autora logró el resultado deseado de la etnografía al
proporcionar una descripción exhaustiva de la cultura de una
UCIN que afectaba a la alimentación de los lactantes. Proporcionó
detalles sobre el número y el tipo de entrevistas y observaciones
que respaldaban sus conclusiones. Cada sección del informe de
investigación se identificó con claridad y el informe estaba bien
organizado. Aunque no se identificó un marco teórico, los estudios
previos de la investigadora sobre el tema proporcionaron hallazgos
y declaraciones conceptuales que guiaron el enfoque y los métodos
de este estudio. La revisión de la bibliografía se integró en la
introducción. Se llevaron a cabo todos los pasos del proceso de
investigación.

Investigación cualitativa exploratoria-


descriptiva
Algunos informes de estudios cualitativos no hacen mención a un
diseño o enfoque específico, como la fenomenología o la teoría
fundamentada. Los investigadores pueden haber descrito sus
estudios como una investigación naturalista, descriptiva o solo
cualitativa. Por ejemplo, Fallatah y Edge (2015) realizaron un
estudio cualitativo descriptivo para «describir la experiencia de los
miembros de la familia que proporcionan apoyo social a su familiar
con artritis reumatoide (AR) y explorar las formas de apoyo que
requieren» (pág. 180).
Los investigadores diseñan estudios cualitativos exploratorios-
descriptivos con el fin de obtener la información necesaria para
desarrollar un programa o intervención para un grupo específico de
pacientes. Generalmente, exploran un tema nuevo o describen una

178
situación, por lo que hemos elegido etiquetar estos estudios como
investigación cualitativa exploratoria-descriptiva (Gray, Grove y
Sutherland, 2017). Los estudios concordantes con este enfoque no
son un tipo específico de investigación; más bien son estudios
realizados con un propósito específico que no encajan en las otras
categorías (Sandelowski, 2000, 2010).
Los estudios cualitativos exploratorios-descriptivos se han
desarrollado para proporcionar información y conocimientos de los
problemas clínicos o prácticos. Los estudios cualitativos suelen
desarrollarse para tratar problemas en la práctica cuando se
necesita un enfoque novedoso, sobre todo problemas que requieren
que se aborden apropiadamente las perspectivas del paciente o de
la familia. La orientación filosófica de la investigación cualitativa
exploratoria-descriptiva puede variar dependiendo del propósito
del estudio, pero el investigador suele tener una orientación
pragmática (McCready, 2010), busca información útil y soluciones
prácticas (Creswell y Poth, 2018) y diseña estudios para
comprender lo que funciona (Houghton, Hunter y Meskell, 2012).

Resultado previsto
Un estudio cualitativo exploratorio-descriptivo bien diseñado
responde a la pregunta de investigación. Se consigue el propósito
del estudio y los investigadores tienen la información que necesitan
para abordar la situación o el problema del paciente que era el foco
del estudio. Los hallazgos del estudio se aplican al problema
práctico que indujo la investigación. En el estudio de Fallatah y
Edge (2015), los familiares habían ajustado sus propias vidas para
proporcionar apoyo a su pareja o progenitor. Los miembros de la
familia pocas veces habían «recibido información exhaustiva sobre
la salud por parte del médico» (Fallatah y Edge, 2015, pág. 184). Las
implicaciones clínicas fueron que los miembros de la familia que
cuidan de un familiar con AR necesitaban un apoyo social que
englobaba apoyo informativo, emocional e instrumental para lograr
el equilibrio y afrontar la enfermedad crónica. Algunos estudios
cualitativos exploratorios-descriptivos se ocupan de temas menos
emocionales y con hechos sobre los que desarrollar intervenciones.
Hatzfeld, Nelson, Waters y Jennings (2016) realizaron un estudio
que hizo esto último con el tema de la preparación para el combate.

179
La preparación para el combate de los soldados puede verse
comprometida por su salud física. Hatzfeld y cols. (2016) llevaron a
cabo un estudio cualitativo exploratorio-descriptivo debido a las
preocupaciones acerca de la obesidad y el riesgo cardiovascular, y
su impacto sobre la preparación para el combate. Los problemas
cardiacos eran la razón más frecuente para el traslado a cuidados
críticos por razones no relacionadas con heridas en entornos de
despliegue (Hatzfeld y cols., 2016). Un enfoque cualitativo
exploratorio-descriptivo era apropiado debido a las escasas
investigaciones que se han realizado sobre el tema. El Ejemplo de
investigación 3.4 proporciona información sobre el estudio y una
valoración crítica de los puntos fuertes y débiles del estudio.

EJEMPLO DE INVESTIGACIÓN 3.4


Estudio cualitativo exploratorio-descriptivo
Extracto del estudio de investigación
La USAF (Fuerza Aérea de Estados Unidos) ha desarrollado un
programa integral de ejercicio físico con responsabilidades específicas
para los comandantes de todos los niveles y unidades médicas de la
USAF… Debido a la importancia de la forma física y la salud en la
USAF, el objetivo principal de este estudio era identificar los factores
que influyen en las conductas saludables del estilo de vida de los
militares de la USAF en servicio activo. Un objetivo secundario de
este análisis fue comparar estos factores con los elementos del Health
Promotion Model (HPM)… Se utilizó un diseño descriptivo
cualitativo (Sandelowski, 2000, 2010) para guiar la identificación de
factores que influyen en las conductas de salud del estilo de vida de
militares en servicio activo de la USAF… El objetivo final de este
estudio fue utilizar las perspectivas de los participantes para
desarrollar las bases de un programa de modificación del estilo de vida
apropiado para la población de la USAF. Los dos criterios de
inclusión para participar fueron a) ser un miembro en servicio activo
de la USAF en la actualidad y b) haber sido asignado a más de una

180
base militar… Se utilizó un muestreo deliberado con máxima
variación para incluir a los participantes, con el fin de lograr
heterogeneidad y variación en relación con la dimensión principal de
interés… Los datos se recogieron con un formulario demográfico
breve desarrollado específicamente para este estudio, junto con
entrevistas cara a cara en un lugar neutral alejado de los lugares de
trabajo de los participantes. El investigador principal realizó todas las
entrevistas utilizando preguntas de entrevista semiestructurada…
Los códigos se agruparon en temas, que se revisaron y se confirmaron
por todo el equipo de investigación. Hubo pocas diferencias de
opinión, que se discutieron hasta que se logró el acuerdo sobre las
interpretaciones. Las discusiones del equipo proporcionaron diversa
información que contribuyó a la validez de los temas. A continuación,
el equipo de investigación comparó los temas finales con los elementos
principales del HPM para identificar los factores que influían en la
conducta de salud en los miembros de la USAF en servicio activo y
para ver cómo los hallazgos se ajustaban al modelo de HPM existente.
(Hatzfeld y cols., 2016, págs. 441-443)

Con el fin de generar descripciones de una amplia gama de


experiencias, los investigadores utilizaron un muestreo deliberado
con máxima variación para lograr la heterogeneidad en relación
con la hipertensión (presente o ausente), raza y etnicidad, edad y
rango de oficial o soldado. Este método de muestreo implica
encontrar a participantes que difieran en las características
identificadas. El reclutamiento consistió en una serie de correos
electrónicos, boca a boca y reclutamiento de tipo bola de nieve, y se
continuó hasta que se había incluido a 24 participantes en el
estudio.
Los métodos fueron rigurosos y el análisis de los datos lo realizó
un equipo diverso compuesto por investigadores militares en
activo y retirados, así como investigadores académicos. Se
mantuvo un registro de auditoría, que es el registro de las acciones
realizadas respecto a la organización de los datos y las decisiones
que se tomaron durante el análisis y la interpretación (Miles,
Huberman y Saldaña, 2014). El registro de auditoría permite que
los lectores tengan más confianza en la transparencia del estudio.

181
Cuando el equipo de investigación tenía diferencias de opinión
sobre la codificación y los temas, discutían los datos y los posibles
significados hasta que se alcanzaba un consenso (Hatzfeld y cols.,
2016).
Los participantes definían la salud como «la presencia de
ejercicio, una dieta adecuada, sueño suficiente y una conexión
espiritual, así como la ausencia de tabaquismo, estrés excesivo y
consumo excesivo de alcohol y cafeína» (Hatzfeld y cols., 2016,
pág. 443). Se identificaron tres factores que contribuyeron a las
decisiones sobre sus conductas de salud. El primer factor (la
cultura de la USAF) englobaba los aspectos positivos y negativos
de lograr la puntuación requerida de forma física. Se identificó que
un entrenamiento físico obligatorio varias veces a la semana era
parte de la cultura, junto con el efecto de los oficiales sobre la salud
de la unidad. Los líderes se consideraban modelos de rol de
conductas sanas, pero también aumentaban el nivel de estrés de los
soldados en su unidad cuando se adoptaban acciones punitivas. La
cultura de la USAF también incluía los factores de estrés del
despliegue, la reintegración, la asignación a un nuevo destino y las
asignaciones temporales que contribuían a elecciones alimentarias
poco saludables y al consumo de tabaco y alcohol (Hatzfeld y cols.,
2016).
El segundo factor (¿Quién soy yo?) incluía la influencia de las
experiencias infantiles respecto a la dieta y el ejercicio, así como la
conciencia personal como adulto de las preferencias por ciertos
tipos de alimentos y ejercicio (Hatzfeld y cols., 2016). Otras
características personales incluidas en este factor eran las
circunstancias vitales individuales de cada persona, como las tareas
del cuidado de hijos, las necesidades de otros familiares y el nivel
de comodidad en el gimnasio u otras localizaciones de
entrenamiento.
«Lo que a mí me funciona» fue el tercer factor identificado por
Hatzfeld y cols. (2016). Los participantes describieron cuáles eran
los tipos de ejercicio que preferían y el modo de incorporarlos a su
programa de actividades. Las elecciones alimentarias y los
patrones de sueño también reflejaban un proceso deliberado de
probar distintos métodos para identificar los que les funcionasen
en sus circunstancias personales. Sin embargo, algunos

182
participantes expresaron frustración y desesperanza por la
incapacidad de encontrar aquello que les funcionaba.
El segundo objetivo del estudio era comparar los hallazgos con el
HPM (Pender, Murdaugh y Parsons, 2011). Aunque los conceptos
teóricos de los factores personales y las influencias situacionales se
reflejaron parcialmente en los hallazgos, Hatzfeld y cols. (2016)
concluyeron que sus hallazgos no eran congruentes con el HPM.
Debido a que el estudio se realizó de forma concordante con los
estándares de rigor para los estudios cualitativos, Hatzfeld y cols.
(2016, pág. 447) propusieron que «los hallazgos de este estudio
ofrecen un marco útil para profesionales de enfermería militar y
oficiales en su búsqueda de intervenciones apropiadas para reducir
de forma más específica las conductas de riesgo cardiovascular…
los profesionales de enfermería pueden fomentar mejor la salud
entre los militares integrando su historia personal (“quién soy yo”)
y sus preferencias (“lo que a mí me funciona”)» en planes
individualizados para implementar y mantener conductas de estilo
de vida saludable a lo largo del tiempo.
Valoración crítica
Hatzfeld y cols. (2016) realizaron un estudio cualitativo
exploratorio-descriptivo para abordar un problema de salud
específico en el personal de la USAF. Estos autores señalaron que
para que las estrategias para reducir los riesgos cardiacos fueran
eficaces tendrían que incorporar las preferencias individuales y la
logística de los oficiales y los soldados. De este modo, los
investigadores lograron el resultado deseado de los estudios
cualitativos exploratorios-descriptivos, que era proporcionar
información para guiar la solución de un problema. Las secciones
del informe de investigación se identificaron y los pasos del
proceso de investigación se incorporaron al informe. Los
investigadores identificaron el HPM como el marco del estudio,
pero concluyeron que los conceptos del modelo no eran
concordantes con los hallazgos del estudio.

MUESTREO Y RECLUTAMIENTO
Los métodos utilizados para realizar los estudios cualitativos son

183
diferentes de los empleados en los estudios cuantitativos. Los
métodos exclusivos de los investigadores cualitativos se describen
aquí con cierto detalle para aumentar la comprensión de la
investigación cualitativa. La sección de métodos incluye el modo en
el que los datos se recogen, se manejan y se analizan. También se
han analizado los métodos utilizados para asegurar el rigor en la
investigación cualitativa. Cada aspecto de los métodos incluirá
guías para valorar de forma crítica ese aspecto del estudio. En la
primera sección, se discute el modo en el que los participantes se
seleccionan para los estudios cualitativos y la relación entre el
investigador y el participante.

Selección de los participantes


Los individuos en los estudios cualitativos se denominan
participantes porque el investigador y los participantes realizan el
estudio de forma cooperativa. El muestreo en la investigación
cualitativa es deliberado (o intencional). El investigador recluta a
los participantes debido a su conocimiento, experiencia u opiniones
particulares en relación con el estudio (Munhall, 2012). Otros
métodos de muestreo adicionales (p. ej., por redes y teórico) se usan
en función del foco de interés del estudio (v. cap. 9). Para algunos
estudios, como el realizado por Hatzfeld y cols. (2016), el
reclutamiento de participantes heterogéneos proporciona un rango
de experiencias más amplio. Las muestras heterogéneas, en las que
los participantes tienen características diferentes, se utilizan con
frecuencia para los estudios de teoría fundamentada con el fin de
respaldar el desarrollo de una teoría (Creswell y Poth, 2018). Para
otros estudios, los participantes pueden tener características
similares (una muestra homogénea) porque el foco central del
estudio son los fenómenos.

Relaciones entre el investigador y el


participante
Una de las diferencias importantes entre la investigación
cuantitativa y la cualitativa es el grado de implicación del
investigador con los participantes del estudio. Los investigadores

184
cualitativos consideran que esta implicación es un elemento crítico
del proceso de investigación, aunque es una fuente de sesgo. La
naturaleza de la relación investigador-participante afecta a la
recogida y la interpretación de los datos (Maxwell, 2014). El
investigador establece una relación respetuosa con cada
participante, que incluye ser honesto y abierto sobre el objetivo y
los métodos del estudio. Los objetivos del investigador y los medios
para lograrlos deben negociarse con los participantes y deben
respetarse sus puntos de vista y sus valores (Creswell y Poth, 2018;
Gray y cols., 2017; Maxwell, 2014; Munhall, 2012). El investigador
influye en las personas que está estudiando a varios niveles y, a su
vez, es influenciado por ellas. Por tanto, debe tener su apoyo y su
confianza para terminar la investigación. Su personalidad es un
factor clave en la investigación cualitativa. Se cultivan las
habilidades de empatía e intuición, y debe involucrarse
estrechamente en la experiencia del participante para interpretar los
datos. Es necesario que los investigadores estén abiertos a las
percepciones de los participantes, en lugar de dar su propio
significado a la experiencia.
En los estudios cualitativos, las relaciones entre el investigador y
el participante pueden ser breves cuando los datos se recogen de
una vez en una entrevista o en un grupo focal. Los estudios
fenomenológicos y de teoría fundamentada pueden implicar una o
dos entrevistas, aunque las relaciones entre el investigador y el
participante pueden extenderse a lo largo del tiempo cuando el
diseño del estudio supone varias entrevistas para estudiar una
experiencia vivida o un proceso a lo largo del tiempo.
Los estudios etnográficos requieren una especial atención en
cuanto a la relación existente entre el investigador y el participante.
El investigador etnográfico observa la conducta, la comunicación y
los patrones dentro de los grupos en culturas específicas. Puede
establecer lazos estrechos con los participantes que son informantes
clave, personas con extensos conocimientos e influencia dentro de
una cultura. Estas relaciones pueden volverse complejas,
especialmente en los estudios etnográficos en los que el
investigador vive durante mucho tiempo en la cultura que está
estudiando.

185
GUÍAS DE VALORACIÓN CRÍTICA
Selección de los participantes y relación
investigador-participante

1. ¿Identificaron los investigadores el tipo específico de


muestreo que se utilizó, como deliberado, por redes o
teórico?
2. ¿Eran las características y experiencias vitales de los
participantes apropiadas para el método cualitativo?
3. ¿Era el número de participantes adecuado para cumplir con el
propósito del estudio?
4. ¿Era la duración y la profundidad de las relaciones entre el
investigador y el participante en el estudio apropiadas para
el método y el propósito de este?

En el estudio de teoría fundamentada de Koehn y cols. (2016)


sobre errores de enfermería, expuesto anteriormente en este
capítulo, los investigadores reconocieron que los profesionales de
enfermería podrían sentir vergüenza o miedo al hablar acerca de los
errores que habían cometido. En el Ejemplo de investigación 3.5, se
puede observar que los investigadores dedicaron tiempo a
desarrollar las relaciones con los posibles participantes para superar
esta resistencia.

EJEMPLO DE INVESTIGACIÓN 3.5


Relación entre el investigador y el participante
Extracto del estudio de investigación
La muestra del estudio incluyó a profesionales de enfermería que
trabajaban en una unidad de cuidados intensivos (UCI) de adultos
como cuidadores directos de pacientes… Después de la aprobación de
cada supervisor de unidad, el investigador pasó tiempo en cada
unidad para observar y estar junto con los profesionales de

186
enfermería. Durante estas visitas, el investigador inició
conversaciones sobre el estudio, proporcionó detalles a los que
parecían interesados en participar y recogió información de contacto
de quienes aceptaron ser entrevistados. (Koehn y cols., 2016, págs.
567-568)

Valoración crítica
Las características, experiencias y número de participantes fueron
apropiados para el enfoque del estudio y adecuados para cumplir
con su propósito. Koehn y cols. (2016) utilizaron un muestreo por
conveniencia (los participantes del estudio estaban en el momento
y lugar adecuados para formar parte del estudio), pero pasaron
tiempo en cada UCI para aumentar la probabilidad de que los
profesionales de enfermería se sintiesen seguros estando en el
estudio. El tiempo pasado en las UCI proporcionó las bases para
una relación investigador-participante que concluyó con una
entrevista de 40-60 minutos de duración sobre el tema sensible de
los errores en la práctica clínica. La profundidad e integridad de la
teoría fundamentada que desarrollaron los investigadores
indicaron que el muestreo y las relaciones del estudio cumplieron
los estándares de rigor para los estudios cualitativos.

MÉTODOS DE RECOGIDA DE DATOS


En la mayoría de los estudios de investigación cualitativa, los datos
son «los pensamientos, las ideas y las percepciones de los
participantes» (Bolderston, 2012, pág. 68). Los métodos de recogida
de datos que se utilizan con más frecuencia en los tipos de estudios
cualitativos que se analizan en este capítulo son las entrevistas a los
participantes, la realización de grupos focales, la observación de los
participantes y el análisis de documentos y de materiales
multimedia. Creswell y Poth (2018) han señalado que el uso de
datos audiovisuales y materiales multimedia está aumentando. Los
materiales multimedia incluyen fotografías, grabaciones y
dispositivos. Puesto que estos métodos se han utilizado en los
estudios cualitativos, se describen con detalle en las siguientes
secciones y se proporcionan ejemplos de la bibliografía. Se

187
presentan guías para la valoración crítica de cada tipo de recogida
de datos cualitativos, junto con una breve valoración crítica de ese
método.

Entrevistas
Existen diferencias entre las entrevistas realizadas para un estudio
cualitativo y las que se efectúan para los estudios cuantitativos. En
estos últimos, el investigador estructura las entrevistas para recoger
las respuestas de los participantes a cuestionarios o encuestas (v.
cap. 10). En los estudios cualitativos, estas entrevistas varían desde
una entrevista semiestructurada (conjunto fijo de preguntas, sin
respuestas predeterminadas) hasta una entrevista no estructurada
(preguntas abiertas con sondeos; Bolderston, 2012). Los sondeos
son consultas que realiza el investigador para obtener más
información del participante sobre una pregunta concreta de la
entrevista.
En la entrevista no estructurada, que también se denomina
entrevista abierta, el enunciado o la pregunta inicial podría ser
«Hábleme de alguna ocasión en la que haya recibido malas noticias
sobre una prueba diagnóstica» o «Después de su diagnóstico,
¿cómo aprendió sobre la diabetes?». Aunque el investigador defina
el foco de la entrevista, puede haber una secuencia no
predeterminada de preguntas. Las preguntas abordadas en las
entrevistas tienden a cambiar a medida que se obtiene información
de entrevistas y observaciones previas. A los entrevistados se les
permite plantear cuestiones importantes que es posible que el
investigador no haya abordado, e incluso se les anima a que lo
hagan.
El objetivo del investigador es obtener una visión real de las
experiencias del participante (Creswell y Poth, 2018). Aunque los
datos pueden obtenerse en una única entrevista, el diálogo entre el
investigador y el participante puede continuar a intervalos durante
semanas o meses, y proporcionar datos abundantes para el análisis.
El uso de entrevistas recurrentes permite explorar un proceso
evolutivo (Munhall, 2012) y que se desarrolle la relación entre el
investigador y el participante. A medida que se desarrolla la
relación y aumenta la confianza, el participante puede revelar

188
aspectos emocionales y cargados de valores del proceso con más
libertad.
El propósito de las entrevistas puede variar, dependiendo del
tipo de enfoque cualitativo. En los estudios fenomenológicos, estas
entrevistas pueden tener una pregunta principal y preguntas de
seguimiento utilizadas según sea necesario para obtener el punto de
vista del participante sobre el fenómeno. En los estudios de teoría
fundamentada, las entrevistas son parecidas en cuanto a que
pueden tener solo una o dos preguntas, pero las preguntas de
seguimiento se centrarán en los procesos sociales del fenómeno. En
los estudios de etnografía, la entrevista puede usarse para obtener
información y explicaciones sobre los aspectos de la cultura que el
investigador ha apreciado durante su observación. En un estudio
cualitativo exploratorio-descriptivo pueden formularse preguntas
más estructuradas para conseguir su objetivo.
Algunas estrategias que se utilizan para registrar la información
son escribir notas durante la entrevista, escribir notas detalladas
inmediatamente después y grabar la entrevista (en vídeo o audio).
Por ejemplo, Cricco-Lizza (2016), en su etnografía enfocada sobre la
lactancia materna en la UCIN, grabó en audio las entrevistas
formales que realizó con los informadores clave. Después de una
entrevista, la grabación se transcribió con el fin de elaborar un
documento escrito para el análisis de los datos. Aunque no indicó
quién realizó la transcripción, describió que se comprobó la
grabación línea a línea para garantizar la precisión. En su estudio
cualitativo exploratorio-descriptivo sobre las conductas de salud
del personal de la USAF, Hatzfeld y cols. (2016) también grabaron
las entrevistas, pero utilizaron un transcriptor profesional para
preparar el documento escrito de las grabaciones.
Las entrevistas deberían organizarse para que se realicen en un
momento y en un lugar privado que resulte cómodo para el
participante. Pueden llevarse a cabo en el domicilio del
participante, una consulta de la clínica, la sala de reuniones de una
biblioteca pública o un restaurante. Lo ideal es que el lugar para la
entrevista esté libre de distracciones (Creswell y Poth, 2018) y que
sea un lugar donde tanto el investigador como el participante se
sientan seguros. Reunirse en una clínica, por ejemplo, puede que no
sea apropiado si la entrevista implica la descripción de la asistencia

189
que se está recibiendo. Es posible que una persona que tenga una
infección causada por el virus de la inmunodeficiencia humana no
quiera ser entrevistada en un lugar donde podría ser vista por
amigos o familiares. También es deseable un lugar lo bastante
tranquilo para permitir una grabación adecuada de audio.
En su estudio etnográfico de los lactantes alimentados en la
UCIN, Cricco-Lizza (2016) describió que las entrevistas eran uno de
los métodos de recogida de datos que utilizaba, como se muestra en
el Ejemplo de investigación 3.6.

EJEMPLO DE INVESTIGACIÓN 3.6


Entrevistas
Extracto del estudio de investigación
Los 114 informadores generales describieron sus creencias y su
trabajo diario en la unidad. Se observaron o entrevistaron de un modo
informal un promedio de 3,5 veces cada uno, con un rango de 1-24 a
lo largo del estudio. Estos datos se documentaron en notas de campo
detalladas inmediatamente después de cada sesión y se utilizaron
seudónimos para proteger la confidencialidad… Había una entrevista
formal de 1 hora grabada en cinta para cada uno de los 18
informadores clave. Estas entrevistas se realizaron en una habitación
privada cerca de la UCIN en momentos específicos escogidos por estos
profesionales de enfermería. Se les garantizó la confidencialidad de
sus respuestas a las preguntas abiertas sobre la lactancia materna, la
alimentación con fórmula y la naturaleza de sus cuidados de
enfermería. Se les pidió que describieran sus días de trabajo y sus
responsabilidades específicas en la alimentación de los lactantes.
Además, también se les pidieron más explicaciones sobre las
cuestiones que pudiesen haber surgido durante las sesiones de
observación participante… (Cricco-Lizza, 2016, pág. e93)

Valoración crítica
Cricco-Lizza (2016) proporcionó detalles suficientes para la

190
valoración crítica de las entrevistas utilizadas en el estudio como
uno de los métodos de recogida de datos. El resultado del estudio
proporcionó evidencia de que las preguntas de investigación
abordaron las cuestiones expresadas en el problema de
investigación y fueron relevantes para el propósito y las preguntas
de investigación. El número de entrevistas a los informantes clave
se complementó con 128 entrevistas informales realizadas mientras
Cricco-Lizza realizaba su observación en la UCIN. El número y la
duración de las entrevistas fueron más que adecuadas para
abordar la pregunta de investigación y cumplir con el propósito del
estudio.

GUÍAS DE VALORACIÓN CRÍTICA


Entrevistas

1. ¿Las preguntas de la entrevista abordan las inquietudes


expresadas en el problema de investigación?
2. ¿Son las preguntas de la entrevista relevantes para el
propósito y objetivos o preguntas de la investigación?
3. ¿La duración y el número de las entrevistas fueron adecuados
para abordar el propósito de la investigación o para
responder a la pregunta de investigación?

Grupos focales
Los grupos focales se diseñaron para obtener los puntos de vista de
los participantes sobre un tema específico en un entorno permisivo
y no amenazante. Una de las suposiciones que subyacen al uso de
los grupos focales es que las dinámicas de grupo pueden ayudar a
las personas a expresar y aclarar sus puntos de vista de una manera
que tiene menos probabilidades de producirse en una entrevista
individual. El grupo puede dar una sensación de «seguridad por el
número» a quienes desconfían de los investigadores o tienen
ansiedad. El tamaño recomendado para estos grupos es de cinco a
ocho participantes. En ocasiones se utilizan grupos más grandes,
pero puede ser más difícil moderarlos. Debido a que los grupos

191
focales más grandes tienen más voces que ser escuchadas, la
transcripción de la grabación puede ser difícil. Todos los
participantes deben tener la oportunidad de hablar y puede ser más
difícil conseguirlo cuando el número es mayor. Estos grupos a
veces se denominan entrevistas en grupo (Bolderston, 2012), por lo
que siguen siendo aplicables los principios de las entrevistas, como
responder sin emitir juicios de valor.
Los grupos focales son dirigidos por un moderador o facilitador,
que puede ser el investigador o no. Los investigadores pueden
pedir la ayuda de moderadores que compartan características
comunes con los participantes. Un ejemplo podría ser el
investigador urbano que contrata a un profesional sanitario que se
crió en una comunidad agrícola rural para moderar un grupo focal
sobre la prevención de las lesiones agrícolas. Los moderadores o
líderes de un grupo focal deben estar altamente capacitados y
comprender la importancia de seguir los procedimientos o el guion
que ha desarrollado el investigador.
Todas las interacciones se graban en audio y, en algunos casos, en
vídeo. Además de las grabaciones, los miembros del equipo de
investigación pueden actuar como observadores para tomar notas
de los procedimientos. Lo ideal es que un grupo focal se lleve a
cabo en un entorno natural, pero este tipo de entorno puede
plantear dificultades. Es importante que el investigador haya
visitado la sala o localización del grupo focal propuesto para
garantizar que la confidencialidad de los participantes se pueda
mantener y que el ruido exterior sea mínimo para permitir que la
comunicación del grupo focal se grabe en audio o en vídeo. La
confidencialidad y la comodidad pueden hacer que el diálogo y los
datos sean más profusos.

GUÍAS DE VALORACIÓN CRÍTICA


Grupos focales

1. ¿El tamaño, composición y duración del grupo focal eran


adecuados para promover la interacción del grupo y
producir unos datos fiables?

192
2. ¿Las preguntas usadas durante el grupo focal eran relevantes
para el propósito de investigación del estudio y sus objetivos
o preguntas (Gray y cols., 2017; Maxwell, 2014)?

El Ejemplo de investigación 3.7 muestra un estudio en el que se


usaron grupos focales para la recogida de datos. La cultura y la
comunidad son factores clave a la hora de determinar la eficacia de
las intervenciones cuando estas se crearon para otra población.
Brunk, Taylor, Clark, Williams y Cox (2017) identificaron una
intervención integral de educación y apoyo para mejorar los
resultados de la diabetes tipo 2 (DT2). Utilizaron grupos focales
para evaluar la intervención.

EJEMPLO DE INVESTIGACIÓN 3.7


Grupos focales
Extracto del estudio de investigación
En el contexto de diversos entornos de asistencia al paciente donde
podría haber una discordancia cultural entre los profesionales
sanitarios y los pacientes, la asistencia centrada en el paciente debe
ser sensible a los aspectos culturales y lingüísticos… El objetivo de
este proyecto era estudiar la viabilidad de la adaptación de un
programa de modificación del estilo de vida centrado en el paciente
para el automanejo de la diabetes tipo 2 (DT2) a una población
hispana con un bajo nivel de conocimientos sobre la salud… Los datos
se obtuvieron mediante sesiones de grupos focales sobre la
aplicabilidad cultural del programa de modificación del estilo de
vida… Este estudio cualitativo descriptivo utilizó un enfoque
fenomenológico.

Recogida de datos. Los datos se recogieron mediante las cuatro


clases de dos horas y sesiones de grupos focales, cada una de las cuales
se grabó en formato digital… Después de un breve descanso, se
facilitó una discusión en grupo utilizando preguntas orientativas

193
como: «Desde su punto de vista, ¿qué ha sido lo más útil de la sesión
de hoy?».

La investigadora aportó a este proyecto cualitativo no solo sus


experiencias al crecer en un país de habla hispana, sino también una
historia de 29 años de trabajo con diversas poblaciones hispanas en
Chicago. La comprobación de los miembros la realizó, en parte, el
facilitador del grupo que revisó con los miembros del grupo los
comentarios de la semana anterior para garantizar que lo entendido
de su discusión era en realidad la información que los miembros del
grupo habían querido transmitir. La credibilidad se aumentó
trabajando estrechamente con la segunda autora, reuniéndose con ella
cada semana para revisar el progreso, las transcripciones y los temas
clave que iban surgiendo. (Brunk y cols., 2017, págs. 187-188, 192)

Este grupo estaba compuesto por nueve pacientes que


cumplieron los criterios de inclusión de ser hispanos, poseer un
bajo nivel educativo y tener un diagnóstico de DT2 o ser un
familiar de una persona con diabetes. El entorno fue un centro de
salud rural. Los participantes reclutados recibieron y evaluaron la
intervención (Brunk y cols., 2017). El informe de investigación
incluyó el número de grupos focales (cuatro), la duración (2 horas)
y la composición (ocho pacientes y un familiar). Aunque las
investigadoras describieron que los grupos focales tuvieron dos
horas de duración, solo se llevaron a cabo en la última parte de
cada sesión de dos horas.
Las investigadoras indicaron que algunas partes de los registros
del grupo focal eran ininteligibles debido a que varios participantes
hablaban a la vez. Las grabaciones se «transcribieron y se
tradujeron al inglés, y el servicio de traducción revisó su precisión»
(Brunk y cols., 2017, pág. 189). Los datos se analizaron y se
identificaron los temas que abordaron el problema de
investigación. «…Los participantes compartieron comentarios en
torno a cuatro temas: información y conocimientos sobre DT2,
motivación y barreras contra la modificación de las conductas,
experiencias con nuevas conductas de automanejo y
responsabilidad personal en el manejo de la enfermedad» (Brunk y

194
cols., 2017, pág. 190).
Valoración crítica
Los resultados del estudio basados en los datos de grupo focal
fueron apropiados para el problema de investigación y el propósito
del estudio. El estudio se vio fortalecido por las estrategias
utilizadas para aumentar su rigor. Las limitaciones fueron el escaso
número de participantes y la falta de información acerca de los
grupos focales. El uso de grupos focales podría haberse reforzado
mediante la descripción explícita de la duración de la porción de
grupo focal de las sesiones y de la proporción de datos que se
perdió debido a las secciones ininteligibles de las grabaciones.

Observación
La observación es un método fundamental para recopilar datos en
los estudios cualitativos, especialmente en los etnográficos. El
objetivo es obtener información de primera mano en una situación
que se produce de forma natural. El investigador asume la función
de un estudiante para responder a la pregunta «¿Qué está pasando
aquí?». Las actividades que se observan pueden ser automáticas o
rutinarias para los participantes, que pueden no ser conscientes de
algunas de sus acciones. El investigador observa cuidadosamente el
foco del estudio, percibe a las personas y los objetos del entorno, y
escucha lo que se dice y lo que no se dice. Se centra en los detalles,
que comprenden los sucesos discretos y cómo se desarrollan las
actividades. Los hechos inesperados que se producen durante las
actividades rutinarias pueden ser importantes y se anotan
cuidadosamente. Como en cualquier proceso de observación, el
investigador cualitativo presta atención a algunos aspectos de la
situación y no hace caso a otros, dependiendo del foco del estudio.
El investigador también debe determinar el papel del observador
que permitirá abordar el propósito y la pregunta de la
investigación. El papel del investigador es un continuum desde ser
un participante completo hasta ser un observador completo
(Creswell y Poth, 2018). Esto último es más probable que se logre
cuando se están recogiendo los datos de una grabación en vídeo de
los eventos que están teniendo lugar. Con más frecuencia, el papel
del investigador es una mezcla de participante y observador.

195
En los estudios que utilizan la observación, las notas que se
toman durante las observaciones o poco después se denominan
notas de campo. Esperar hasta que la observación termine permite
al investigador centrarse completamente en su experiencia
observacional para evitar pasar por alto algo importante, pero
puede impedir que se registren todos los datos pertinentes. Se
puede crear una lista de comprobación o un resumen de los eventos
clave que se quieren captar. Otra estrategia útil es grabar en vídeo
los eventos para poder realizar observaciones cuidadosas y tomar
notas detalladas después. Recoger los datos de una grabación en
vídeo permite ser un observador completo, porque los actores de la
situación desconocen que se les está observando. Sin embargo,
desde el punto de vista de los derechos humanos, los actores deben
haber otorgado el consentimiento en un estudio y saber que se
están realizando grabaciones en vídeo.

GUÍAS DE VALORACIÓN CRÍTICA


Observación

1. ¿Se realizaron las observaciones en momentos y durante


períodos de suficiente duración para recoger datos
abundantes para una descripción exhaustiva de la cultura,
entorno o proceso de interés (Wolf, 2012)?
2. ¿El investigador tomó notas de campo o anotaciones en un
diario (Creswell, 2014; Miles y cols., 2014)?

Para el estudio etnográfico de la alimentación de lactantes en la


UCIN, Cricco-Lizza (2016) utilizó la observación como otra fuente
de datos, tal y como se describe en el Ejemplo de investigación 3.8.

EJEMPLO DE INVESTIGACIÓN 3.8


Observación
Extracto del estudio de investigación

196
El trabajo de campo en la UCIN se realizó durante sesiones de 1-2
horas durante varios días, momentos y turnos a lo largo de un período
de 14 meses… Se observó a los profesionales de enfermería durante
sus interacciones con los bebés, familias, personal de enfermería y otro
personal durante las diversas actividades de la unidad. El papel del
investigador de enfermería varió de la observación a la entrevista
informal durante las 128 sesiones de observación participante en este
estudio. Estas entrevistas informales fueron de tipo abierto y se
relacionaron con las circunstancias inmediatas de los cuidados en la
UCIN. Los 114 informadores generales describieron sus creencias y
su trabajo diario en la unidad. Se observaron o entrevistaron de un
modo informal un promedio de 3,5 veces cada uno, con un rango de 1-
24 a lo largo del estudio. Estos datos se documentaron en notas de
campo detalladas inmediatamente después de cada sesión y se
utilizaron seudónimos para proteger la confidencialidad. (Cricco-
Lizza, 2016, págs. e92–e93)

Valoración crítica
Los detalles proporcionados por Cricco-Lizza (2016) respaldaron el
rigor de sus observaciones en lo referente al número de estas, la
duración del estudio y el número de los diferentes profesionales de
enfermería observados. Las observaciones fueron muy adecuadas
para recoger datos abundantes y describir de forma exhaustiva la
alimentación de los lactantes en la cultura de la UCIN. La
investigadora tomó unas notas de campo detalladas que se
convirtieron en una fuente importante de datos para determinar los
hallazgos del estudio.

Análisis de los documentos y los materiales


multimedia
En los estudios cualitativos, los documentos como datos textuales
pueden considerarse una fuente abundante de datos. Por ejemplo,
en la etnografía de la UCIN sobre la lactancia materna, Cricco-Lizza
(2016) podría haber revisado las políticas y procedimientos
referentes a la alimentación de los lactantes en el hospital como
fuente adicional de datos. Otras fuentes de textos preexistentes son

197
las notas clínicas en la historia clínica electrónica, manuales de
políticas, informes anuales de una organización y artículos de
periódicos. Los datos textuales tienen más probabilidad de
utilizarse en estudios etnográficos. Pueden crearse otros
documentos para el propósito del estudio. Por ejemplo, el
investigador puede pedir a los participantes que escriban sobre un
tema en particular. En algunos casos, estos relatos escritos pueden
solicitarse por correo o por correo electrónico en vez de en persona.
El texto proporcionado por los participantes puede ser un
componente de un estudio más grande en el que se utilicen varias
fuentes de datos.
Los materiales multimedia pueden ser fotografías o grabaciones
que el investigador realiza durante las observaciones o en una
comunicación online. La fotovoz es un uso específico del material
multimedia en los estudios cualitativos que consiste en la
realización de fotografías por los participantes, relacionadas con el
tema de investigación como fuente de datos. Un equipo de
investigación de enfermería ha utilizado materiales online como
fuente de datos para varios estudios. Durante 10 años, Im y cols.
han realizado un estudio de mujeres supervivientes de cáncer y
mujeres de mediana edad de distintas culturas utilizando foros
online como fuentes de datos. Un ejemplo fue un análisis secundario
de datos online recogidos durante un estudio más prolongado (Im y
cols., 2013). Se crearon cuatro foros online para el estudio, cada uno
para una raza o grupo étnico específico. Las investigadoras
identificaron temas comunes en los distintos foros, además de
observar las diferencias. Los datos cualitativos recogidos han
respaldado el desarrollo de una intervención apropiada para
fomentar la actividad física en supervivientes asiático-americanas
de cáncer de mama (Chee y cols., 2017).
Postma, Peterson, Vega, Ramon y Cortez (2014) realizaron un
estudio de los riesgos medioambientales para la salud de jóvenes
latinos en comunidades agrícolas. Los participantes fueron
estudiantes de enseñanza media y promotores de salud
comunitaria. Los promotores eran bilingües en inglés y español, y
se establecieron en la comunidad como enlaces culturales entre
comunidades migrantes y el sistema de salud (Postma y cols., 2014).
Se recogieron fotografías (una de las diversas fuentes de datos del

198
estudio) en dos rondas. En el Ejemplo de investigación 3.9 se
describe el análisis de los documentos y materiales multimedia
realizado en este estudio.

EJEMPLO DE INVESTIGACIÓN 3.9


Análisis de los documentos y el material
multimedia
Extracto del estudio de investigación
Los participantes tenían la opción de utilizar una cámara desechable o
sus propias cámaras digitales o de sus teléfonos móviles. En cada
ronda, se pidió a los participantes que realizaran 24-27 fotografías que
representasen personas, lugares y cosas que transmitiesen sus puntos
de vista sobre los problemas y puntos fuertes relacionados con los
«niños, la salud y el entorno». La película se organizó y cada
participante recibió una copia impresa de sus fotografías. La segunda
copia se recogió como datos. (Postma y cols., 2014, pág. 510)

Las fotografías por sí solas eran elocuentes, pero Postma y cols.


(2014) también llevaron a cabo sesiones con los participantes y
pidieron a cada uno que seleccionase dos o tres fotografías
significativas para compartir con el grupo. Los participantes
«contextualizaron la fotografía contando historias sobre la imagen
mediante un proceso facilitado» (Postma y cols., 2014, pág. 511).
Las sesiones se grabaron en audio como otra fuente de datos. Uno
de los temas problemáticos fue la falta de actividades estructuradas
para la juventud, así como la falta subsiguiente de supervisión por
adultos y la prevalencia de actividad de bandas. Otro tema fue la
pobreza y el estrés, que también se describían como «puntos
críticos». Los puntos críticos de la pobreza y el estrés eran motivo
de preocupación, porque los jóvenes solían consumir drogas y
alcohol para aliviar la presión. El último tema problemático
correspondía a los beneficios y perjuicios del trabajo agrícola.
Algunos de los perjuicios eran el uso de pesticidas y de escaleras
inseguras utilizadas para recoger frutas de los árboles (Postma y

199
cols., 2014). El beneficio principal del trabajo agrícola era la
creación de empleo que permitía a las familias autosustentarse. El
foco de la sesión final fue la identificación de acciones que
pudiesen adoptarse en la comunidad para mejorar la salud de los
niños.
Valoración crítica
Las fotografías utilizadas como datos en el estudio de Postma y
cols. (2014) se crearon para el propio estudio. El informe de
investigación incluyó información sobre el modo en el que los
participantes recibieron formación para conseguir los permisos y
los consentimientos informados de las personas que pudiesen
resultar identificados en sus fotografías. Los participantes
recibieron una copia de sus propias fotografías para que las
conservasen. Las fotografías se utilizaron por el contenido que
ofrecían, pero también como estímulo útil para recoger historias y
las perspectivas de los participantes. De esta manera, la fotovoz se
utilizó de forma rigurosa y apropiada en el estudio de los riesgos
medioambientales para la salud de los niños (Postma y cols., 2014).

GUÍAS DE VALORACIÓN CRÍTICA


Análisis de documentos y material
multimedia como datos

1. ¿Se crearon los documentos o materiales multimedia


específicamente para el estudio?
2. En lo que respecta a los materiales no creados para el estudio,
¿se confirmaron su autenticidad y su autoría?
3. En lo que respecta a los materiales creados para el estudio,
¿estaban protegidos los derechos humanos de los
participantes por el consentimiento informado y la
confidencialidad?
4. ¿Los datos procedentes de esas fuentes se utilizaron para
abordar el propósito del estudio o para responder a la
pregunta de investigación de un modo significativo?

200
MANEJO Y ANÁLISIS DE LOS DATOS
La limitación de la longitud de los manuscritos para revistas
revisadas por pares puede impedir que los investigadores ofrezcan
informes detallados sobre los procesos de análisis y manejo de los
datos. Sin embargo, tener unos conocimientos generales sobre esta
parte del proceso permitirá valorar de forma crítica los estudios
publicados y proporcionar la base necesaria para evaluar las
propuestas del estudio que están siendo consideradas por cada
centro o comité de revisión institucional.

Transcripción de las entrevistas


Los datos textuales que se utilizan con más frecuencia en los
estudios cualitativos son las transcripciones de las entrevistas
grabadas y de los grupos focales. La transcripción está en el centro
del proceso de investigación cualitativa porque «una transcripción
literal recoge las propias palabras, lenguaje y expresiones de los
participantes» y permite al investigador «descifrar la conducta, los
procesos y los significados culturales ligados a los puntos de vista
de las personas» (Hennink y Weber, 2013, pág. 700). Las
transcripciones de estas grabaciones pueden dar lugar a una gran
cantidad de datos para su análisis. En el informe del estudio, los
investigadores deberían describir cómo se registraron los datos
durante las entrevistas, los grupos focales o las observaciones, así
como las estrategias que se utilizaron para garantizar la exactitud
de las transcripciones (Miles y cols., 2014). Generalmente, se
realizan transcribiendo toda la grabación palabra por palabra de la
persona que habla, incluidos los ruidos audibles, como las risas,
toses o vacilaciones. Ahora existen programas informáticos que se
activan por voz y crean un registro escrito de la grabación. Aunque
se utilice un programa informático o intervenga un transcriptor
profesional, el investigador debe asegurar la exactitud de la
transcripción leyéndola y corrigiéndola mientras escucha la
grabación.

Organización de los datos


El análisis de los datos cualitativos se produce simultáneamente a

201
su recogida y requiere planificación, porque los estudios
cualitativos generan una gran cantidad de datos. Cuando los
investigadores cualitativos se preparan para realizar un estudio, su
plan incluye múltiples localizaciones en las que se almacenarán los
datos. A menudo, una de las localizaciones es un servicio online o
una red electrónica. La cantidad de datos puede ser abundante,
porque una entrevista de una hora puede dar lugar a archivos
electrónicos (informáticos) para la transcripción, notas de campo,
diarios relacionados con códigos y análisis, así como un formulario
demográfico. Los investigadores experimentados desarrollan una
forma estándar para nombrar los archivos antes de comenzar la
recogida de datos. Por ejemplo, el nombre del archivo podría
incluir el nombre o seudónimo del entrevistado, la fecha en la que
se creó y lo que es (transcripción o nota de campo). Otros archivos
pueden generarse a partir de reuniones de un equipo de
investigación o de una consulta con un experto sobre las
dificultades que pueden surgir durante la recogida de datos. Los
investigadores mantienen un registro del modo en el que se
nombraron los datos y de dónde se almacenan, lo que evita perder
tiempo buscando los archivos durante el análisis, la interpretación y
la difusión (Miles y cols., 2014).
Los investigadores de enfermería utilizan cada vez más
programas de análisis de datos cualitativos asistidos por ordenador
(PADCAO) (Creswell y Poth, 2018). El investigador lee las
transcripciones, identifica los códigos y agrupa códigos similares en
temas. El programa informático no hace el análisis, pero puede
registrar las decisiones que se toman. Otros beneficios de estos
PADCAO son la creación automática de un registro de auditoría, la
facilidad para recuperar texto con el mismo código, el
mantenimiento de un sistema organizado de almacenamiento de
archivos, el desarrollo de representaciones visuales de los datos
analizados, la vinculación de notas y diarios con el texto o código,
así como la capacidad de compartir el análisis con colegas
investigadores (Creswell y Poth, 2018). Los inconvenientes del uso
de PADCAO son el tiempo invertido en la selección y aprendizaje
del programa informático, el distanciamiento percibido respecto a
los datos, así como las dificultades específicas con el programa
informático seleccionado (Creswell y Poth, 2018).

202
Análisis de los datos
El análisis de los datos es un proceso riguroso. Puesto que es
posible que los estudios cualitativos publicados no contengan la
metodología detallada, muchos profesionales creen que la
investigación cualitativa es un proceso libre, poco estructurado. La
creatividad y una profunda reflexión pueden dar lugar a códigos o
formas de analizar los datos innovadores, pero el proceso requiere
disciplina para desarrollar planes de análisis de datos congruentes
con el método filosófico específico del estudio. Por ejemplo, los
investigadores que realizan estudios de teoría fundamentada
utilizan el proceso comparativo constante confrontando conceptos y
temas identificados a través del análisis con los identificados en los
datos posteriores. En la teoría fundamentada, el análisis comienza
con la primera entrevista a un participante, por lo que las ideas de
ese participante pueden integrarse en las preguntas y sondeos de
las entrevistas posteriores. En fenomenología, esta forma de
sumergirse en los datos se denomina inmersión en los datos. Esta
denominación se usa para indicar que el investigador ha empleado
mucho tiempo en la lectura y reflexión de los datos.

Códigos y codificación
La codificación es el proceso de leer los datos, dividir el texto en
subpartes y asignar una etiqueta a cada parte del texto. Estas
etiquetas sirven para que el investigador comience a identificar
patrones en los datos, porque pueden compararse las similitudes y
las diferencias de las secciones de texto que se codificaron de la
misma forma (Miles y cols., 2014). Un código es un símbolo o una
abreviatura que se utiliza para clasificar palabras o frases en los
datos. Los códigos pueden escribirse a mano en una transcripción
impresa. En un programa de procesamiento de textos o PADCAO
pueden ponerse códigos resaltando una sección del texto y
haciendo comentarios en el margen o en la barra lateral. Los
códigos pueden dar lugar a temas, procesos o ejemplos del
fenómeno que se está estudiando. Por ejemplo, en un estudio
cualitativo del cumplimiento con la toma de los fármacos, los
participantes mencionaron relojes, calendarios y horas a las que
había que tomar las dosis que el investigador codificó como

203
«tiempo». Un estudio cualitativo exploratorio-descriptivo sobre las
experiencias dolorosas de los pacientes quirúrgicos puede dar lugar
a una taxonomía de los tipos de dolor, las actividades que causaron
dolor y los tipos de estrategias para aliviar dicho dolor.

Temas e interpretación
Los temas surgen a medida que los códigos se combinan en frases o
términos más abstractos. A veces hay varias capas de temas y cada
capa es otro nivel de abstracción superpuesto a los códigos iniciales.
Relacionar estos temas con los datos originales puede hacerse más
difícil a medida que los temas se vuelven más abstractos. La
claridad de los vínculos entre los códigos y los temas es esencial
para mantener el rigor del estudio, y los PADCAO proporcionarán
estos vínculos de forma automática. Sin embargo, es el investigador
quien debe mantener el rigor al crear las relaciones desde los temas
de vuelta a los códigos y de los códigos a los datos originales. Si se
está valorando críticamente un estudio cualitativo que utiliza
temas, hay que identificarlos, evaluar si el investigador ha
proporcionado unas citas apropiadas de los participantes para
respaldar los temas y determinar si los temas parecen suficientes y
adecuados para el estudio. Durante la interpretación, el
investigador sitúa los hallazgos en un contexto más amplio y puede
relacionar distintos temas o factores de los hallazgos entre sí. Está
respondiendo a la pregunta «¿Qué significan los resultados?». La
interpretación puede centrarse en la utilidad de los hallazgos para
la práctica clínica o puede avanzar hacia la teorización.

GUÍAS DE VALORACIÓN CRÍTICA


Manejo, análisis e interpretación de los
datos

1. ¿Los procesos de análisis e interpretación de los datos fueron


congruentes con la orientación filosófica, el problema de
investigación, la pregunta de investigación y el propósito del
estudio?

204
2. ¿Los investigadores describieron cómo registraron las
decisiones tomadas durante el análisis y la interpretación?
3. ¿Los investigadores relacionaron los códigos y los temas
utilizados con citas de ejemplo?
4. ¿El análisis y la interpretación de los datos fueron lógicos y
congruentes con el método del estudio?
5. ¿Los investigadores describieron adecuadamente los procesos
de análisis e interpretación de los datos?

Koehn y cols. (2016) realizaron un estudio de teoría


fundamentada sobre las experiencias de profesionales de
enfermería con los errores, como se ha descrito previamente en este
capítulo. Los investigadores proporcionaron información adecuada
para valorar de forma crítica su análisis, manejo e interpretación de
los datos, tal y como se muestra en el Ejemplo de investigación 3.10.

EJEMPLO DE INVESTIGACIÓN 3.10


Manejo, análisis e interpretación de los datos
Extracto del estudio de investigación
Todos los participantes firmaron un documento de consentimiento
informado etiquetado con un número de identificación anónimo que
relacionaba los datos recogidos durante la entrevista y cualquier nota
subsiguiente sobre la entrevista… La recogida y el análisis de los
datos se realizaron simultáneamente. Se utilizaron los procedimientos
descritos por Charmaz (2014) para analizar los datos… El primer
autor realizó la codificación inicial, y la codificación focalizada y axial
fueron completadas por todo el equipo de investigación mediante
procesos de discusión y consenso. Se utilizaron notas para
documentar todas las decisiones analíticas… Los hallazgos de este
estudio se añaden a la bibliografía al describir la experiencia de
cometer un error médico como un proceso complejo y matizado… el
modo en el que cometer un error afecta a los profesionales de
enfermería a lo largo de sus carreras, incluso años después de que se

205
produjese… la forma en la que los procedimientos y prácticas
institucionales sobre la notificación de errores influye en las
experiencias de los profesionales de enfermería… sugieren que se
necesitan estrategias organizativas no solo para alentar a los
profesionales de enfermería a notificar los errores, sino para apoyarlos
cuando cometen un error. (Koehn y cols., 2016, págs. 568, 571-572)

Valoración crítica
El análisis y la interpretación de los datos en el estudio de Koehn y
cols. (2016) eran apropiados para el enfoque del estudio, las
preguntas de investigación y el propósito del estudio. Los autores
utilizaron notas para documentar todas las decisiones del análisis.
Utilizaron citas directas de los profesionales de enfermería para
respaldar cada tema que surgía de los datos y relacionaron de
forma explícita los códigos y los temas. Koehn y cols. (2016)
proporcionaron un buen ejemplo del modo en el que se analizaron
e interpretaron los datos de su estudio. El informe de investigación
incluyó citas directas cortas de los participantes para respaldar los
temas. Koehn y cols. (2016) relacionaron claramente sus hallazgos
con la bibliografía e indicaron las contribuciones del estudio a los
conocimientos de enfermería. Proporcionaron menos información
sobre la organización de los datos, pero la minuciosidad y la
claridad del informe indican que los datos se manejaron de forma
cuidadosa.

RIGOR EN INVESTIGACIÓN
CUALITATIVA
El rigor científico es apreciado porque los hallazgos de estudios
rigurosos se consideran más creíbles y de mayor valía. Los estudios
se valoran de forma crítica para juzgar su rigor. El rigor se define de
forma diferente para la investigación cualitativa porque el resultado
deseado es distinto del resultado deseado para la investigación
cuantitativa (Gray y cols., 2017). El rigor se valora en relación con el
detalle incorporado en el diseño del estudio cualitativo, el esmero
de la recogida de datos y la meticulosidad del análisis. Cuando los
«propósitos, preguntas y métodos de la investigación están

206
interconectados e interrelacionados» y el investigador describe el
estudio como un «todo cohesivo», el estudio tiene congruencia
metodológica (Creswell y Poth, 2018, pág. 50). El encaje entre estos
elementos clave de un estudio (propósito, preguntas, métodos) es
importante para la investigación cuantitativa y cualitativa, pero
tiene una relevancia especial en la investigación cualitativa debido a
la naturaleza evolutiva de los estudios.
Se espera que los investigadores cualitativos mantengan una
mente abierta y permitan que se revele el significado, aunque este
no sea lo que se había previsto (Munhall, 2012). También se espera
que proporcionen suficiente información en el informe publicado,
de modo que el lector pueda valorar de forma crítica la
confiabilidad y auditabilidad del estudio (Petty, Thomson y Stew,
2012). Un registro de auditoría es una forma por la que el
investigador puede asegurar al lector que los métodos del estudio
se aplicaron adecuadamente. Los estudios que son confiables y
auditables se pueden considerar verdaderos, útiles o creíbles. Los
hallazgos de un estudio cualitativo no se pueden generalizar, pero
se pueden aplicar «en otros contextos o con otros participantes»
(Petty y cols., 2012, pág. 382). La medida en la que los hallazgos de
un estudio cualitativo son confiables, auditables, creíbles y
transferibles es su grado de rigor. En el capítulo 12 se ofrece más
información sobre el modo de determinar si un estudio es confiable,
auditable, creíble y transferible.

PUNTOS CLAVE
• La investigación cualitativa es un enfoque sistemático que
se utiliza para obtener datos textuales relacionados con el
fenómeno abordado por el estudio.
• Los datos cualitativos son palabras e imágenes, en lugar de
números.
• Los datos cualitativos se analizan para permitir que emerjan
los puntos de vista de los participantes y las múltiples
realidades de las personas que experimentan un fenómeno.
• En la investigación cualitativa, el rigor requiere una
valoración crítica de la coherencia del estudio con la

207
perspectiva filosófica; la adecuación de la recogida, el
análisis y la interpretación de los datos; el mantenimiento
de un registro de auditoría, y la lógica de los hallazgos
plasmados en el informe de investigación.
• El investigador fenomenológico analiza una experiencia y
proporciona interpretaciones que realzan el significado, a la
vez que se mantiene fiel a los puntos de vista de quienes
han vivido la experiencia.
• Los investigadores de teoría fundamentada exploran los
procesos sociales subyacentes a través de los símbolos del
lenguaje, de la religión, de las relaciones y de la forma de
vestir y describen el significado más profundo de un evento
como un marco teórico.
• Los investigadores etnográficos observan y entrevistan a
personas que pertenecen a una cultura para comprender el
entorno, a las personas, las relaciones de poder y los
patrones de comunicación de un entorno de trabajo, una
comunidad o un grupo étnico.
• Los estudios cualitativos exploratorios-descriptivos se
realizan para proporcionar información que aumentará la
comprensión de una experiencia desde la perspectiva de las
personas que la han vivido y posiblemente solucionará un
problema.
• La recogida de los datos en los estudios cualitativos tiene
lugar en el contexto de la relación entre el participante y el
investigador.
• En los estudios cualitativos, los datos se recogen mediante
entrevistas, grupos focales, observación y revisión de
documentos y materiales multimedia.
• El manejo, el análisis y la interpretación de los datos
requieren procesos claros para asegurar el rigor
metodológico y la credibilidad de los hallazgos.

BIBLIOGRAFÍA
Abrams, T., Ogletree, R., Ratnapradipa, D., Neumeister, M. Adult
survivors’ lived experience of burns and post-burn health: A

208
qualitative analysis. Burns. 2016; 42(1):152–162.

Bolderston, A. Conducting a research interview. Journal of Medical


Imaging and Radiation Sciences. 2012; 43(1):66–76.

Brunk, D., Taylor, A., Clark, M., Williams, I., Cox, D. A culturally
appropriate self-management program for Hispanic adults with
Type 2 diabetes and low health literacy skills. Journal of
Transcultural Nursing. 2017; 28(2):187–194.

Charmaz, K. Constructing grounded theory. London, England: Sage;


2014.

Chee, W., Lee, Y., Im, E. O., Chee, E., Tsai, H., Nishigaki, M., et al. A
culturally tailored Internet cancer support group for Asian
American breast cancer survivors: A randomized controlled pilot
intervention study. Journal of Telemedicine & Telecare. 2017;
23(6):618–626.

Converse, M. Philosophy of phenomenology: How understanding


aids research. Nurse Researcher. 2012; 20(1):28–32.

Creswell, J., Research design: Qualitative, quantitative, and mixed


methods approaches 4th ed. Sage, Thousand Oaks, CA, 2014.

Creswell, J., Poth, C. Qualitative inquiry and research design: Choosing


among five approaches, 4th ed. Thousand Oaks, CA: Sage; 2018.

Cricco-Lizza, R. Infant feeding beliefs and day-to-day feeding


practices of NICU nurses. Journal of Pediatric Nursing. 2016;
31(2):e91–e98.

Cypress, B. Qualitative research: The “what,” “why,” “who,” and


“how”!. Dimensions of Critical Care Nursing. 2015; 34(6):356–361.

209
Davenport, L. Living with the choice: A grounded theory of Iraqi
refugee resettlement to the U.S. Issues in Mental Health Nursing.
2017; 38(4):352–360.

Dowling, M., Cooney, A. Research approaches related to


phenomenology: Negotiating a complex landscape. Nurse
Researcher. 2012; 20(2):21–27.

Erikson, A., Davies, B. Maintaining integrity: How nurses navigate


the boundaries in pediatric palliative care. Journal of Pediatric
Nursing. 2017; 35(1):42–49.

Fallatah, F., Edge, D. Social support needs of families: The context


of rheumatoid arthritis. Applied Nursing Research. 2015; 28(2):180–
185.

Flood, A. Understanding phenomenology. Nurse Researcher. 2010;


17(2):2–7.

Glaser, B. G., Strauss, A. The discovery of grounded theory: Strategies


for qualitative research. Chicago, IL: Aldine; 1967.

Gray, J., Grove, S. K., Sutherland, S. The practice of nursing research:


Appraisal, synthesis, and generation of evidence, 8th ed. St. Louis, MO:
Elsevier Saunders; 2017.

Hall, H., Roussel, L. Critical appraisal of research-based evidence.


In: Hall H., Roussel L., eds. Evidence-based practice: An integrative
approach to research, administration, and practice. 2nd ed. Burlington,
MA: Jones & Bartlett; 2017:125–143.

Hatzfeld, J., Nelson, M., Waters, C., Jennings, M. Factors


influencing health behaviors among active duty Air Force

210
personnel. Nursing Outlook. 2016; 64(5):440–449.

Hennink, M., Weber, M. Quality issues of court reporters and


transcriptionists for qualitative research. Qualitative Health Research.
2013; 23(5):700–710.

Hoggan, C., Mälkki, K., Finnegan, F. Developing the theory of


perspective transformation: Continuity, intersubjectivity, and
emancipatory praxis. Adult Education Quarterly. 2017; 67(1):48–64.

Houghton, C., Hunter, A., Meskell, P. Linking aims, paradigm and


method in nursing research. Nurse Researcher. 2012; 20(2):34–39.

Im, E. O., Ko, H., Hwang, H., Chee, W., Stuifbergen, A., Walker, L.,
Brown, A. Racial/ethnic differences in midlife women’s attitudes
toward physical activity. Journal of Midwifery & Women’s Health.
2013; 58(4):440–450.

Koehn, A., Ebright, P., Draucker, C. Nurses’ experiences with errors


in nursing. Nursing Outlook. 2016; 64(6):566–574.

Leininger M.M., ed. Qualitative research methods. Orlando, FA:


Grune and Stratton, 1985.

Leininger, M. M. Leininger’s theory of nursing: Cultural care


diversity and universality. Nursing Science Quarterly. 1988; 1(4):152–
160.

Leininger, M. M. Culture care theory: A major contribution to


advance transcultural nursing knowledge and practices. Journal of
Transcultural Nursing. 2002; 13(3):189–192.

Makary, M., Daniel, M., Medical error: The third leading cause of
death in the US. British Medical Journal [BMJ] 2016; 353 i2139

211
Consultada el 18 de junio de 2017, en.
http://www.bmj.com/content/353/bmj.i2139

Marshall, C., Rossman, G. B. Designing qualitative research, 6th ed.


Los Angeles, CA: Sage; 2016.

Maxwell, J. Qualitative research design: An interactive approach, 3rd ed.


Thousand Oaks, CA: Sage; 2014.

McCready, J. Jamesian pragmatism: A framework for working


toward unified diversity in nursing knowledge development.
Nursing Philosophy. 2010; 11(3):191–203.

Mead, G. H. Mind, self and society. Chicago, IL: University of


Chicago Press; 1934.

Miles, M., Huberman, A., Saldaña, J. Qualitative data analysis: A


methods sourcebook, 3rd ed. Thousand Oaks, CA: Sage; 2014.

Morgan-Trimmer, S., Wood, F., Ethnographic methods for process


evaluations of complex health behavior interventions Trials, 17,
Article 232. Consultada el 19 de junio de 2017, en.
https://trialsjournal.biomedcentral.com/articles/10.1186/s13063-016-
1340-2, 2016

Morse, J. Underlying ethnography. Qualitative Health Research. 2016;


26(7):875–876.

Munhall P.L., ed. Nursing research: A qualitative perspective, 5th


ed., Sudbury, MA: Jones & Bartlett, 2012.

Pender, N., Murdaugh, C., Parsons, M., Health promotion in


nursing practice. Pearson Education, Upper Saddle River, NJ, 2011.

212
Petty, N., Thomson, O., Stew, G. Ready for a paradigm shift? Part 2:
Introducing qualitative research methodologies and methods.
Manual Therapy. 2012; 17(5):378–384.

Postma, J., Peterson, J., Vega, M., Ramon, C., Cortez, G. Latina
youths’ perceptions of environmental health risks in an agricultural
community. Public Health Nursing. 2014; 31(6):508–516.

Powers, B. Generating evidence through qualitative research. In:


Melnyk B.M., Fineout-Overholt E., eds. Evidence-based practice in
nursing & healthcare: A guide to best practice. 3rd ed. Philadelphia,
PA: Wolters Kluwer; 2015:476–489.

Rashid, M., Caine, V., Goez, H., The encounters and challenges of
ethnography as a methodology in health research. International
Journal of Qualitative Methods 2015; Consultada el 19 de junio de
2017, en.
http://journals.sagepub.com/doi/abs/10.1177/1609406915621421

Rasmussen, M., Amris, K., Ryadahl-Hansen, S. How can group-


based multidisciplinary rehabilitation for patients with
fibromyalgia influence patients’ self-efficacy and ability to cope
with their illness: A grounded theory approach. Journal of Clinical
Nursing. 2017; 26(7-8):931–945.

Roper, J. M., Shapiro, J. Ethnography in nursing research. Thousand


Oaks, CA: Sage; 2000.

Sandelowski, M. Whatever happened to qualitative description?


Research in Nursing & Health. 2000; 23(4):334–340.

Sandelowski, M. What’s in a name? Qualitative description


revisited. Research in Nursing & Health. 2010; 33(1):77–84.

213
Sanon, M. A., Spigner, C., McCullagh, M. Transnationalism and
hypertension self-management among Haitian immigrants. Journal
of Transcultural Nursing. 2016; 27(2):147–156.

Savage, J. Ethnographic evidence: The value of applied


ethnography in healthcare. Journal of Research in Nursing. 2006;
11(5):383–395.

Tuohy, D., Cooney, A., Dowling, M., Murphy, K., Sixmith, J. An


overview of interpretive phenomenology as a research
methodology. Nurse Researcher. 2013; 20(6):17–20.

van Manen, M. But is it phenomenology? Qualitative Health


Research. 2017; 27(6):775–779.

Weyant, R., Clukey, L., Roberts, M., Henderson, A. Show your stuff
and watch your tone: Nurses’ caring behaviors. American Journal of
Critical Care. 2017; 26(2):111–117.

Wolf, M. Ethnography: The method. In: Munhall P.L., ed. Nursing


research: A qualitative perspective. 5th ed. Sudbury, MA: Jones &
Bartlett; 2012:285–338.

Wuerst, J. Grounded theory: The method. In: Munhall P.L., ed.


Nursing research: A qualitative perspective. 5th ed. Sudbury, MA:
Jones & Bartlett; 2012:225–256.

214
CAPÍTULO 4

Análisis de la ética en
investigación en
enfermería
Jennifer R. Gray

La página web de la National Guideline Clearinghouse de la Agency for


Healthcare Research and Quality (AHRQ) se cerró en 2018. Puede
consultarse más información en https://www.ahrq.gov/.

ÍNDICE DEL CAPÍTULO

Investigación no ética: periodo de 1930 a 1989, 91


Estándares éticos para investigación, 92
Protección de los sujetos humanos, 95
Comprensión del consentimiento informado, 104
Comprensión de la revisión institucional, 108
Cuestiones actuales en la ética de la investigación, 112
Puntos clave, 115
Bibliografía, 116

215
OBJETIVOS DE APRENDIZAJE
Tras concluir este capítulo, el lector debería ser capaz de:
1. Describir el papel de los profesionales con grado de
enfermería a la hora de garantizar la investigación ética.
2. Identificar los acontecimientos históricos que han influido en el
desarrollo de los códigos éticos y las normas para la
investigación en enfermería y biomédica.
3. Describir los principios éticos y los derechos humanos que
deben protegerse en investigación.
4. Identificar los elementos esenciales del proceso de
consentimiento informado en investigación.
5. Describir los niveles de revisión que un comité de revisión
institucional (CRI) puede utilizar a la hora de revisar un estudio.
6. Describir las cuestiones actuales en investigación ética que
existen respecto a la investigación genómica, el uso de
animales en estudios y la mala praxis investigadora.
7. Valorar críticamente las secciones éticas en los informes de
investigación, haciendo hincapié en el CRI y en los procesos de
consentimiento informado.

La ética en la investigación es esencial para generar un


conocimiento creíble y de confianza para la práctica basada en la
evidencia (PBE), pero ¿qué implica una conducta ética en
investigación? Por desgracia, la comprensión de la conducta ética
de la investigación se desarrolló a medida que la comunidad
científica y la opinión pública se vieron confrontados a ejemplos de
estudios no éticos. En Estados Unidos, se han realizado estudios no
éticos que violan los derechos humanos desde que comenzó la
investigación biomédica. Cuando estos estudios salieron a la luz, se
desarrollaron códigos y normas nacionales para fomentar la
conducta ética en investigación. Estos códigos y normas han
reducido drásticamente el número de estudios no éticos, pero, por
desgracia, las violaciones de la ética y la mala praxis investigadora
persisten en la actualidad.

216
Los profesionales con grado de enfermería deben ser capaces de
valorar críticamente los aspectos éticos de los estudios publicados y
de la investigación realizada en organismos clínicos. La sección de
métodos de la mayoría de los estudios publicados incluye
información sobre la selección ética de los participantes en el
estudio y su trato durante la recogida de datos. Los CRI de
universidades y organismos clínicos se han organizado para
analizar los aspectos éticos de los estudios antes de su realización.
Puede que los profesionales de enfermería se conviertan en
miembros de un CRI y participen en la revisión de la investigación
que se va a realizar en organismos clínicos.
En este capítulo se describen los códigos éticos y normas que
guían en la actualidad la realización de la investigación biomédica y
de la conducta para proporcionar al lector unos conocimientos que
le permitan analizar los aspectos éticos de los estudios. Se
detallarán los siguientes elementos de la ética de la investigación: 1)
protección de los derechos humanos durante la investigación, 2)
comprensión del consentimiento informado, 3) comprensión de la
revisión institucional de la investigación y 4) valoración crítica de
los aspectos éticos de un estudio. El capítulo concluye con una
discusión de las cuestiones éticas actuales que rodean la
investigación genómica, el uso de animales en investigación y la
mala praxis investigadora.

INVESTIGACIÓN NO ÉTICA: PERIODO


DE 1930 A 1989
Cuatro proyectos experimentales han recibido una gran atención
pública por su trato no ético de sujetos humanos: los experimentos
médicos nazis, el estudio sobre la sífilis de Tuskegee, el estudio de
Willowbrook y el estudio del Jewish Chronic Disease Hospital
(Berger, 1990; Levine, 1986). En la realización de estos estudios
intervinieron profesionales de enfermería, aunque los
investigadores principales fueron médicos. Estos estudios carentes
de consideraciones éticas demuestran la importancia de una
conducta ética para los profesionales de enfermería cuando revisan
o participan en la investigación (Fry, Veatch y Taylor, 2011). Estos

217
estudios también influyeron en la formulación de códigos éticos y
normas que siguen dirigiendo la realización de la investigación en
la actualidad.

Experimentos médicos nazis


De 1933 a 1945, el Tercer Reich en Europa llevó a cabo actividades
médicas atroces y no éticas, incluidas investigaciones. Se realizaron
experimentos médicos con prisioneros de guerra y personas
consideradas sin valor, como judíos recluidos en campos de
concentración. Los experimentos consistían en exponer a los sujetos
a altitudes elevadas, temperaturas gélidas, venenos, infecciones,
fármacos no probados y cirugía sin anestesia. Los experimentos
nazis violaron numerosos derechos de los sujetos de investigación,
como su selección injusta, una participación involuntaria y daños
permanentes, incluida la muerte. Debido a que estos estudios
estaban mal diseñados y realizados, estas investigaciones no solo
eran poco éticas, sino que los conocimientos científicos útiles que
generaron fueron escasos o nulos (Berger, 1990; Steinfels y Levine,
1976).

Estudio sobre la sífilis de Tuskegee


En 1932, el Public Health Service estadounidense inició un estudio
sobre la historia natural de la sífilis en varones afroamericanos en la
pequeña población rural de Tuskegee, Alabama (Rothman, 1982).
Muchos de los sujetos no fueron informados sobre el propósito y los
procedimientos de la investigación. Algunos ignoraban que eran
sujetos de un estudio. En 1936, se disponía con claridad de
evidencia indicativa de que los varones con sífilis desarrollaban
más complicaciones que los del grupo control. Diez años después,
la mortalidad en los que tenían sífilis era el doble que la del grupo
control. Los sujetos se evaluaron periódicamente, pero no
recibieron tratamiento para la sífilis, aunque se había determinado
que la penicilina era un tratamiento eficaz para la enfermedad en la
década de 1940. No se proporcionó a los sujetos información sobre
el tratamiento eficaz para la sífilis y se llevaron a cabo acciones
deliberadas para privarles del tratamiento (Brandt, 1978).
En 1936, empezaron a publicarse los informes del estudio sobre la

218
sífilis de Tuskegee y se publicaron artículos adicionales cada 4-6
años. No se hizo ningún intento para detener el estudio; de hecho,
en 1969, los Centros para el Control y la Prevención de
Enfermedades revisaron el estudio y decidieron que debía
continuar. El estudio prosiguió durante un total de 40 años. En
1972, un artículo del estudio que apareció en el Washington Star
provocó la indignación pública; solo entonces fue suspendido por el
Department of Health, Education, and Welfare (DHEW)
estadounidense. El estudio se investigó y se llegó a la conclusión de
que carecía de toda justificación desde el punto de vista de la ética
(Brandt, 1978).

Estudio de Willowbrook
Desde mediados de la década de 1950 hasta principios de la de
1970, el Dr. Saul Krugman realizó una investigación sobre la
hepatitis en Willowbrook, una institución para personas con retraso
mental en Staten Island, Nueva York (Rothman, 1982). Los sujetos
eran niños que fueron infectados deliberadamente con el virus de la
hepatitis. Durante los 20 años que duró el estudio, Willowbrook
cerró sus puertas a nuevos internos debido al hacinamiento. Sin
embargo, la planta de investigación seguía admitiendo internos,
pero los padres solo podían ingresar a sus hijos si estaban
dispuestos a autorizar que participaran en el estudio.
Desde finales de la década de 1950 hasta principios de la de 1970,
el equipo de investigación de Krugman publicó varios artículos que
describían el protocolo y los resultados del estudio. En 1966,
Beecher citó el estudio de Willowbrook en el New England Journal of
Medicine como un ejemplo de investigación no ética. Los
investigadores justificaron la inyección del virus de la hepatitis en
los niños porque creían que la mayoría de ellos adquirirían la
infección poco después de ingresar en la institución. También
destacaron los beneficios de los sujetos, entre ellos: la posibilidad de
vivir en un entorno más limpio, con mejor supervisión y con una
proporción mayor entre los profesionales de enfermería por cada
paciente en la planta de investigación (Rothman, 1982). A pesar de
la controversia, este estudio no ético continuó hasta principios de la
década de 1970.

219
Estudio del Jewish Chronic Disease Hospital
En el Jewish Chronic Disease Hospital de Nueva York se realizó en
la década de 1960 otro estudio no ético que recibió mucha
publicidad. El propósito de este estudio era determinar la respuesta
de rechazo de los pacientes a las células cancerosas vivas. Se inyectó
una suspensión que contenía células cancerosas vivas que se habían
generado a partir de tejido canceroso humano en 22 pacientes
(Levine, 1986). Los investigadores no informaron a estos pacientes
de que estaban participando en un estudio ni de que las inyecciones
que recibían eran células cancerosas vivas. Esta falta de información
violó sus derechos de autodeterminación y de protección frente al
daño. Además, el estudio nunca se presentó para su revisión al
comité de investigación del Jewish Chronic Disease Hospital y los
médicos que atendían a los pacientes no sabían que se estaba
realizando.
El médico que dirigía la investigación era un empleado del Sloan-
Kettering Institute for Cancer Research; nada indicaba que esta
institución hubiera realizado alguna revisión del proyecto de
investigación (Hershey y Miller, 1976). Este estudio no ético se
realizó sin el consentimiento informado de los sujetos ni revisión
institucional y podía dañar, incapacitar o causar la muerte de
sujetos humanos. Cuando la opinión pública tuvo conocimiento del
estudio, se suspendió inmediatamente y se tomaron medidas para
garantizar la atención adecuada de los pacientes expuestos a las
células cancerosas. Además, se aplicaron precauciones para
garantizar que todas las investigaciones que se propusieran en el
futuro en esta institución fuesen revisadas y aprobadas de forma
adecuada.

ESTÁNDARES ÉTICOS PARA


INVESTIGACIÓN
La historia de la investigación no ética ha dado lugar a estándares y
leyes internacionales y estadounidenses que definen la
investigación ética en la que intervienen sujetos humanos. El
primero se desarrolló después de la Segunda Guerra Mundial.

220
Estándares internacionales
Los principios éticos para la investigación se desarrollaron por
primera vez después de los juicios de Núremberg a los criminales
de guerra alemanes. Los implicados en los experimentos nazis
fueron llevados a juicio antes de los juicios de Núremberg y sus
investigaciones no éticas recibieron atención internacional. En 1949,
tras finalizar los juicios, se publicó el Código de Núremberg
(Eastwood, 2015). En el cuadro 4.1 se presentan los principios clave
de este código. El código incluye guías que deberían ayudar a
evaluar el proceso de consentimiento, la protección de los sujetos
frente al daño y el balance entre beneficios y riesgos de un estudio
(Office of NIH History, 1949).

CUADRO 4.1 CÓDIGO DE NÚREMBERG:


CARACTERÍSTICAS DE LOS ESTUDIOS
ÉTICOS
Fundamentos para el estudio

• Realizado cuando el conocimiento necesario no se pueda


obtener de ningún otro modo.
• Basado en los resultados de estudios previos, incluidos
experimentos con animales y conocimientos de la historia
natural de la enfermedad.
• Diseñado para proporcionar resultados necesarios para la
sociedad.
• Los resultados previstos justifican la realización del estudio.

Derechos de los sujetos humanos

• Consentimiento voluntario.
• Puede abandonar el estudio en cualquier momento sin
penalización.

Evitación de riesgos

221
• No debe causarse ningún sufrimiento ni daños físicos o
mentales innecesarios.
• El estudio se finaliza si el riesgo de daño aumenta.

Recursos

• Deben existir recursos adecuados para proteger a los sujetos.

Adaptado de la US Government Printing Office. (1949). Nuremberg


Code. https://history.nih.gov/research/downloads/nuremberg.pdf.

El Código de Núremberg sentó las bases para el desarrollo de la


Declaración de Helsinki, que se adoptó en 1964. Un tema principal
de la declaración fue aclarar las diferencias entre la investigación
terapéutica y la investigación no terapéutica. La investigación
terapéutica proporciona a los pacientes la oportunidad de recibir
un tratamiento experimental que podría tener resultados
beneficiosos. La investigación no terapéutica se realiza para
generar conocimientos para la ciencia; los resultados pueden
ayudar a futuros pacientes, pero no es de esperar que beneficien a
los participantes en la investigación. Los investigadores son
responsables de proteger la salud, la privacidad y la dignidad de
los sujetos humanos y de seleccionar temas de estudio importantes
sobre los riesgos y cargas para los sujetos. La World Medical
Association (WMA, 2013)xs ha iniciado y publicado la revisión más
reciente de la Declaración.

Estándares en Estados Unidos


En Estados Unidos, la primera y más importante guía ética fue el
Informe Belmont, escrito por la National Commission for the
Protection of Human Subjects of Biomedical and Behavioral
Research (1979). La comisión se constituyó en respuesta a la
protesta popular cuando se conoció el estudio sobre la sífilis de
Tuskegee. El Informe Belmont identificó los principios éticos que
deben guiar la selección de los sujetos, su información de los riesgos
y beneficios de un estudio, así como la documentación de su
consentimiento. El informe también detallaba las diferencias entre

222
la investigación terapéutica y no terapéutica, así como la aplicación
de los hallazgos de la investigación a la práctica de la medicina
(National Commission, 1979).
El presidente Obama promulgó una orden ejecutiva para crear la
Presidential Commission for the Study of Bioethical Issues, un
grupo diverso de líderes estadounidenses encargado de asesorar a
los gobernantes sobre los aspectos éticos y sociales emergentes
derivados de los avances científicos. La Commission estuvo activa
de 2009 a 2017 y publicó recomendaciones sobre el genoma, la
neurociencia y la protección de los sujetos humanos. Los informes y
otros documentos de su trabajo están archivados como recursos
educativos relacionados con la bioética
(https://bioethicsarchive.georgetown.edu/pcsbi/node/851.html).

Normas federales para la protección de los


sujetos humanos
Después del Informe Belmont, se desarrollaron normas federales
para proteger a los sujetos humanos de investigación y se siguen
actualizando según se precisa. Su última actualización data de 2017.
Las normas forman parte del Code of Federal Regulations (CFR). Cada
departamento estadounidense implicado en la investigación
humana tiene un artículo en el CFR que guía la investigación
financiada por él. Debido a la similitud entre los artículos, el CFR se
denomina Common Rule. Los objetivos de la última revisión eran
aumentar la protección de los sujetos humanos y reducir la carga
administrativa de la regulación de la investigación en las
organizaciones sanitarias y universidades (Menikoff, Kaneshiro y
Pritchard, 2017). La versión final del código revisado se publicó en
el Federal Register en enero de 2017 y se determinó que entrase en
vigor a partir de 2018 (US Department of Health and Human
Services [DHHS], 2017a).
La Common Rule incluye requisitos relacionados con el
contenido de un documento de consentimiento informado, los
procesos para obtener dicho consentimiento, el mantenimiento de
un CRI y la implementación de precauciones especiales para los
estudios con poblaciones vulnerables (fig. 4.1). Las poblaciones
vulnerables se definen como personas que son susceptibles de una

223
influencia o coerción indebida, como niños, reclusos y personas
económica o educativamente desfavorecidas (DHHS, 2017a). Las
personas con problemas para la toma de decisiones también se
consideran vulnerables, como aquellas con enfermedad de
Alzheimer, lesión cerebral traumática y las nacidas con limitaciones
intelectuales.

FIG 4.1 Funciones de las guías de investigación


federales. CRI, Consejo de revisión institucional.

Durante la práctica clínica, puede que los profesionales de


enfermería faciliten la obtención del consentimiento de pacientes
para participar en ensayos clínicos relacionados con nuevos
fármacos y dispositivos médicos. La Food and Drug Administration
(FDA) estadounidense es responsable de gestionar los elementos de
la Common Rule que implican la evaluación de fármacos,
dispositivos médicos, productos biológicos, suplementos dietéticos
y productos electrónicos para su uso en seres humanos (FDA, 2015).
En resumen, la Common Rule, incluidas las normas de la FDA,
proporciona guías para las investigaciones financiadas por el
gobierno federal y por instituciones privadas con el fin de proteger
a los sujetos, garantizar su privacidad y mantener la
confidencialidad de la información obtenida mediante
investigación. En el cuadro 4.2 se comparan las normas aplicables a

224
la investigación en sujetos humanos.

CUADRO 4.2 ACLARACIÓN DE LAS NORMAS


FEDERALES RELACIONADAS CON LA
INVESTIGACIÓN CON SUJETOS HUMANOS
Norma: Health Insurance Portability and Accountability Act
(HIPAA) (Privacy Rule)

• Frase clave: información sanitaria protegida


• Objetivo: protección de la privacidad para la mayor parte de la
información sanitaria protegida identificable individualmente,
estableciendo condiciones para su uso y su divulgación por
ciertos profesionales sanitarios, planes de salud y centros de
información sanitaria.
• Aplicabilidad: se aplica a las entidades contempladas
definidas por la HIPAA, con independencia de la fuente de
financiación; aplicación más amplia que la investigación.

Norma: US Department of Health and Human Services (DHHS)


Protection of Human Subjects Regulationsa (Common Rule)

• Frase clave: investigación con sujetos humanos.


• Objetivo: proteger los derechos y el bienestar de los sujetos
humanos que participan en investigaciones realizadas o
apoyadas por el DHHS.
• Aplicabilidad: se aplica a las investigaciones con sujetos
humanos realizadas o respaldadas por el DHHS; la aplicación
se ha ampliado a todas las investigaciones con sujetos
humanos, con o sin financiación.

Norma: US Food and Drug Administration (FDA) Protection of


Human Subjects Regulationsb

• Frase clave: fármacos y dispositivos médicos.


• Objetivo: proteger los derechos, la seguridad y el bienestar de
los sujetos que participan en investigaciones clínicas reguladas

225
por la FDA.
• Aplicabilidad: se aplica a la investigación con productos
regulados por la FDA. No es necesario el apoyo federal para
que sean aplicables las normas de la FDA. Cuando la
investigación sujeta a la jurisdicción de la FDA está financiada
por el gobierno federal, se aplican las Protection of Human
Subjects Regulations tanto del DHHS como de la FDA.

a
US Department of Health and Human Services (DHHS). (2017a). Final
revisions to the Common Rule: Protection of human subjects.
Code of Federal Regulations, Title 45, Part 46. Consultada el 11 de
marzo de 2017, en https://www.hhs.gov/ohrp/regulations-and-
policy/regulations/finalized-revisions-common-rule/index.html.
b
Food and Drug Administration (FDA) estadounidense. (2015). FDA
fundamentals. Consultada el 5 de marzo de 2017, en
https://www.fda.gov/AboutFDA/Transparency/Basics/ucm192695.htm

En 2003, se ultimó otra ley que afectaba a la investigación, la


Health Insurance Portability and Accountability Act (HIPAA;
Public Law 104.191, 1996). La HIPAA, promulgada por primera vez
en 1996, ha pasado a conocerse como la Privacy Rule y se centra en
la protección del almacenamiento y transferencia electrónica de la
información del paciente generada por la provisión de asistencia
clínica. La Privacy Rule definió la información sanitaria protegida
(ISP) como los datos generados y recogidos para la investigación
que pueden relacionarse con una persona individual. Con la
revisión reciente de la Common Rule, la relación entre esta y la
HIPAA es menos clara de lo que era previamente. Algunos expertos
han sugerido que las normas de privacidad se integren en la
Common Rule. En la figura 4.1 se muestra un diagrama de los
objetivos actuales de la Common Rule y de la Privacy Rule. Las
normas, que se muestran en los recuadros en la parte alta de la
figura, tienen focos diferentes, pero coinciden en el objetivo de
proteger los derechos de los sujetos humanos (parte inferior de la
figura).

226
PROTECCIÓN DE LOS SUJETOS
HUMANOS
La protección de las personas que participan en la investigación
requiere algo más que estándares y leyes. Un investigador
responsable debe guiarse por principios éticos que respalden los
derechos de los sujetos de investigación.

Aplicación de los principios éticos


Los ejemplos previos de investigación no ética subrayan la
necesidad de estándares para proteger a los sujetos de
investigación. En los estándares y leyes publicados, hay tres
principios éticos que guían la ética de la investigación: respeto por
las personas, beneficencia y justicia (fig. 4.2). El principio de
respeto por las personas indica que las personas deben tratarse
como seres autónomos, con derecho a escoger si participan o no en
la investigación y a abandonar un estudio. En la figura, el principio
se relaciona con la autonomía. Debajo del círculo donde está la
autonomía hay tres formas de aplicar la autonomía en un estudio.
Las personas con autonomía reducida, como los niños, los que
tienen una enfermedad terminal o mental y los prisioneros, tienen
derecho a una mayor protección. Los sujetos de poblaciones
vulnerables también pueden necesitar que se establezcan garantías
para asegurar la protección del respeto por las personas.

227
FIG 4.2 Principios éticos y protección de los derechos
humanos.

El principio de beneficencia anima al investigador a hacer el


bien y «por encima de todo, a no causar daño». Este principio es el
fundamento para analizar los beneficios y riesgos de un estudio
específico. En la figura 4.2, el principio se relaciona con el círculo
indicado como «promover el bien». Los investigadores guiados por
este principio tratan de reducir los riesgos y garantizar que los
sujetos obtienen los beneficios. Un ejemplo específico es un estudio
de intervención en el que una mayor educación sobre la diabetes
mejora el control en el grupo de tratamiento. Al final del estudio,
un investigador guiado por la beneficencia ofrecería la intervención
a los sujetos del grupo control. La beneficencia también implica
mantener la integridad del estudio y difundir los hallazgos, de
modo que se pueda obtener el máximo beneficio científico de dicho
estudio. Los hallazgos de estudios mal diseñados e implementados
carecen de beneficios para los sujetos y la población en general.
El principio de justicia establece que los sujetos humanos tienen
el derecho a un trato justo, lo que incluye el acceso a los posibles
beneficios de un estudio y la evitación de una exposición excesiva a
sus riesgos. En la figura 4.2 se muestra el principio de justicia que
da lugar a la equidad. Mantener la justicia en la investigación
significa que los criterios de inclusión y exclusión (v. cap. 9) para los
sujetos de estudio deben tener explicaciones científicas y/o lógicas.
En resumen, el diagrama de la figura 4.2 muestra que el respeto

228
por las personas es la base para la autonomía, que la beneficencia
da lugar a que se promueva el bien mediante la investigación y que
la justicia apoya la equidad. Aunque los principios éticos pueden
ser abstractos, cada uno puede aplicarse mediante procedimientos
específicos durante un estudio, como se muestra en la figura.
En consonancia con los principios éticos, los profesionales de
enfermería que valoran críticamente los estudios publicados,
revisan las investigaciones que se realizan en sus organizaciones o
ayudan a obtener datos para un estudio tienen la obligación de
determinar si se han protegido los derechos de los participantes. En
una investigación, deben protegerse los derechos a: 1) la
autodeterminación; 2) la privacidad; 3) el anonimato y la
confidencialidad; 4) la protección frente a las molestias y los daños,
y 5) la selección y el trato justos. El American Nurses Association
(ANA) Code of Ethics for Nurses (2015) reitera estos derechos y
proporciona a los profesionales de enfermería guías para la
conducta ética en la práctica y en la investigación en enfermería.
Este código se centra en la protección de los derechos de los
pacientes y los participantes en la investigación.

Derecho a la autodeterminación
El derecho a la autodeterminación se basa en el principio ético del
respeto por las personas e indica que los seres humanos son capaces
de decidir su propio destino. Se debe conceder autonomía a las
personas, lo que significa tener libertad para dirigir sus vidas como
lo deseen, sin controles externos. Los investigadores protegen la
autonomía de los sujetos cuando les proporcionan información
sobre un estudio y les permiten decidir si participan o no. Además,
un sujeto que consiente y comienza un estudio puede abandonar el
estudio en cualquier momento, sin penalización (DHHS, 2017a). La
cultura de los sujetos es un factor que debe tenerse en cuenta al
tratar a las personas con autonomía, porque la autonomía tiene
distintas interpretaciones e implicaciones en las diversas culturas
(Roberts, Jadalla, Jones-Oyefeso, Winslow y Taylor, 2017). Se
considera que los profesionales de enfermería tienen una formación
que les prepara para defender a los posibles sujetos de
investigación de distintas procedencias, debido a que estos
profesionales conocen los valores culturales relacionados con la

229
autonomía y la toma de decisiones (Halkoaho, Pietila, Ebbesen,
Karki y Kangasniemi, 2016). Los posibles sujetos pueden mostrarse
más abiertos a otorgar el consentimiento para un estudio cuando el
responsable del reclutamiento es un miembro de su cultura o más
abiertos a comentar un estudio con un investigador que comparta
su cultura. Roberts y cols. (2017) han observado que un
investigador en otro país requiere la implicación de los miembros
de la cultura para el desarrollo del estudio con el fin de asegurar
que todas las preguntas del estudio, sus métodos y el enfoque del
reclutamiento sean aceptables para la comunidad. Roberts y cols.
(2017) han llevado a cabo investigaciones en cinco países y han
comparado sus experiencias.
El derecho de un sujeto a la autodeterminación se vulnera cuando
se utilizan la coerción, la obtención de datos encubierta y el engaño.
La coerción se produce cuando una persona intencionadamente
hace una amenaza abierta de daño u ofrece una recompensa
excesiva a otra para obtener su conformidad. Algunos sujetos se
sienten coercionados (obligados) a participar en la investigación
porque temen sufrir daños o molestias si no participan. Por
ejemplo, algunos pacientes a los que su médico les solicita que
participen en el estudio pueden temer que sus tratamientos
médicos y cuidados de enfermería se verán afectados
negativamente si no están de acuerdo en participar. Otros se sienten
coercionados a participar en estudios porque creen que no pueden
negarse a los beneficios excesivos que se les ofrecen, como grandes
sumas de dinero, privilegios especiales o acceso a tratamientos
experimentales. El estudio de Willowbrook se llevó a cabo en un
centro que estaba masificado y el único ingreso disponible en el
hospital era en la unidad de investigación (Rothman, 1982). Los
progenitores se sintieron obligados a ingresar a sus hijos para poder
recibir asistencia, a pesar de que les preocupaba la investigación
que se estaba realizando.
Mediante la obtención de datos encubierta, los sujetos no son
conscientes de que se están recopilando datos para la investigación
(Reynolds, 1979). Por ejemplo, en el Jewish Chronic Disease
Hospital Study la mayoría de los pacientes y sus médicos
desconocían el estudio. Se informó a los sujetos de que estaban
recibiendo una inyección de células, pero la palabra cáncer se

230
omitió (Beecher, 1966).
El uso del engaño, la desinformación real de los sujetos con fines
de investigación, también puede violar el derecho de un sujeto a la
autodeterminación. Un ejemplo clásico de engaño se ve en el
estudio de Milgram (1963), en el que los sujetos pensaban que
estaban administrando descargas eléctricas a otra persona, pero era
un actor profesional quien fingía sentir las descargas. El engaño
debería utilizarse solo cuando sea absolutamente necesario para
temas de estudio que puedan aportar contribuciones significativas a
la ciencia (Boynton, Portnoy y Johnson, 2013). Para que el uso del
engaño sea aceptable, no debería ser previsible que causase ningún
daño duradero. Además, los investigadores deberían explicar el
engaño a los sujetos lo antes posible. Según la revisión de la
Common Rule, el engaño solo puede utilizarse de forma ética en un
estudio cuando el investigador informa a los posibles sujetos de que
desconocerán o recibirán deliberadamente información errónea
sobre el verdadero propósito del estudio y aceptan participar a
pesar de esta condición (DHHS, 2017a).
Personas con autonomía reducida e investigación. Las personas
tienen una autonomía reducida cuando tienen alterada la toma de
decisiones debido a medicaciones, enfermedad mental o capacidad
mental. Dependiendo de la causa, la autonomía reducida puede ser
temporal o permanente. Las personas con autonomía reducida
necesitan una protección adicional de su derecho a la
autodeterminación debido a la disminución de su capacidad para
dar su consentimiento informado. Además, son vulnerables a la
coerción y el engaño.
Se puede considerar que los niños tienen una autonomía
reducida debido a su inmadurez emocional y a su desarrollo
cognitivo. Los progenitores o tutores son los representantes legales
del niño y pueden, en su nombre, otorgar el permiso para
participar en una investigación. Los investigadores no solo
obtienen el consentimiento parental, sino que también deben
solicitar el asentimiento para la participación del niño en una
investigación (Antal y cols., 2017). Este asentimiento significa que
el niño ha aceptado participar en el estudio (Oulton y cols., 2016).
Determinar la edad adecuada a la que puede implicarse al niño en
la toma de decisiones sobre la participación en la investigación es

231
complejo.
En la figura 4.3, se muestra una visión simplificada de los factores
que afectan a los métodos utilizados para obtener el permiso
parental (también denominado consentimiento parental) y el
asentimiento pediátrico. La figura muestra al niño, la familia y la
cultura como un sistema social que interactúa con otro sistema
social constituido por el estudio, el investigador y la organización
en la que se lleva a cabo la investigación. En el modelo, el círculo
interior con el término «niño» representa la comunicación y
comprensión del niño (v. fig. 4.3). La capacidad del niño de
escuchar o absorber información a través de los medios de
comunicación influye en su comprensión. La interacción de la edad
biológica, el desarrollo intelectual, el grado de conciencia, así como
la madurez psicológica y emocional influyen en la comunicación y
comprensión del niño (Oulton y cols., 2016). La «familia» rodea al
niño en el modelo, representando las percepciones del progenitor o
tutor sobre la capacidad de toma de decisiones del niño. El anillo
exterior es el papel del niño en la cultura de la familia y el grado en
el que se le permite participar en la toma de decisiones. Las
relaciones entre los progenitores y entre estos y el niño influyen
directamente en el modo en el que se tomarán las decisiones en el
sistema de la familia sobre la participación en la investigación
(Oulton y cols., 2016).

232
FIG 4.3 Participación de los niños en investigación.
(Conceptos y procesos revisados y reproducidos de Oulton, K.,
Gibson, F., Sell, D., Williams, A., Pratt, L. y Wray, J. [2016].
Assent for children’s participation in research: Why it matters and
making it meaningful. Child: Care, Health and Development,
42[4], 588-592.)

El otro lado del modelo muestra el «estudio» en el centro, con el


«investigador» rodeando el estudio (v. fig. 4.3). La etiqueta del
estudio representa los métodos de investigación previstos, incluida
la invasividad de cualquier procedimiento y la duración del
estudio. El investigador, que puede ser un equipo de
investigadores, se caracteriza por su experiencia con la
investigación y con el trabajo con niños, así como por las
herramientas y formación que han recibido.
El estudio y el investigador están rodeados por la «organización».
El propósito de la organización (asistencia clínica, tratamiento o
ambos), así como la cultura de la comunidad y de la organización,
influyen en el estudio y en el investigador (Oulton y cols., 2016).
La flecha entre los dos sistemas representa el proceso de toma de
decisiones relacionadas con la participación del niño en el estudio.
Cuando la decisión es afirmativa, el proceso culminará en una
combinación de documentos de asentimiento, consentimiento o
permiso parental (v. fig. 4.3). Oulton y cols. (2016) han

233
argumentado que, a excepción de los lactantes y niños pequeños,
los niños pueden y deberían intervenir en el proceso de otorgar el
asentimiento o consentimiento.
En 2003, el Congreso de Estados Unidos aprobó un proyecto de
ley denominado Pediatric Research Equity Act (PREA) para
motivar a las empresas farmacéuticas a incluir a sujetos pediátricos
en ensayos de fármacos y proporcionar posologías pediátricas
cuando se comercialicen nuevos fármacos. Los médicos han
expresado sus preocupaciones acerca de que la investigación sobre
fármacos pediátricos esté muy a la zaga de los estudios en adultos y
podría causar perjuicios o, al menos, la pérdida de beneficios
potenciales para los niños (Bourgeosis y Hwang, 2017). Los
fármacos contra el cáncer no se incluyeron en el PREA y se
introdujo un proyecto de ley en el Congreso en 2016 denominado
Research to Accelerate Cures and Equity Act (RACE for Children
Act). Este proyecto de ley no fue aprobado, pero, en caso de
promulgarse, habría incluido fármacos contra el cáncer en el PREA
y habría anulado las exenciones que muchas empresas
farmacéuticas han utilizado para retrasar o no cumplir la PREA
(Kids v Cancer, 2017).
Debido a las dificultades de los riesgos percibidos con la
investigación pediátrica, la obtención del asentimiento y la
documentación del consentimiento, la base de investigación para la
PBE con los niños y adolescentes es limitada. Como resultado, se
necesitan estudios adicionales con los niños y adolescentes como
sujetos. Los estudios publicados deben indicar con claridad que el
niño otorgó su asentimiento o consentimiento y que los
progenitores o tutores dieron su permiso antes de que se recogieran
los datos.

Derecho a la privacidad
La privacidad es la libertad que tienen las personas para
determinar el momento, la medida y las circunstancias generales en
las que su información privada se compartirá o no con los demás.
La información privada de una persona comprende actitudes,
creencias, conductas, opiniones y documentos. La privacidad del
sujeto de investigación está protegida si se le informa, consiente en
participar en un estudio y comparte voluntariamente información

234
privada con un investigador. Se produce una invasión de la
privacidad cuando se comparte información privada de una
persona sin su conocimiento o en contra de su voluntad. El informe
de investigación suele indicar que se ha protegido la privacidad de
los sujetos y puede incluir los detalles de cómo se llevó a cabo dicha
protección. Trimble, Nava y McFarlane (2013) realizaron un estudio
sobre la violencia por parte de la pareja en mujeres con infección
por el virus de la inmunodeficiencia humana (VIH), una población
en la que la confidencialidad era extremadamente importante. Los
investigadores indicaron en el informe sus esfuerzos para
«salvaguardar la privacidad de la información sobre la salud
personal, manteniendo todos los archivos relacionados con el
estudio guardados bajo llave…y, para proteger aún más la
privacidad, se usaron números de identificación en lugar de
nombres en todos los formularios de recogida de datos» (Trimble y
cols., 2013, pág. 333).
La HIPAA Privacy Rule amplió la protección de la privacidad de
las personas, en concreto, su información sanitaria protegida que
permite identificar al individuo. Según la Common Rule, la
información privada identificable (IPI) es la «información privada
para la que la identidad del sujeto se identifica (o puede
identificarse) con facilidad por el investigador o se asocia con la
información» (DHHS, 2017b, Section 102). Según la HIPAA Privacy
Rule, la información identificable está protegida si se relaciona con
el estado de salud previo o actual de una persona, la asistencia
recibida de profesionales sanitarios y el pago por la asistencia
sanitaria recibida. Las relaciones entre estas definiciones y otros
aspectos de la Common Rule revisada y de la HIPAA relacionados
con la investigación no están completamente desarrolladas porque
la revisión proporciona a los investigadores un amplio acceso a la
ISP para identificar a los posibles participantes del estudio.
Además, la Common Rule revisada estableció un nuevo tipo de
consentimiento denominado consentimiento amplio, mediante el
cual los posibles sujetos conceden a los investigadores permiso para
almacenar, mantener y utilizar la IPI para otros estudios (DHHS,
2017a). El consentimiento amplio requiere que los investigadores
protejan la confidencialidad de la identidad de los sujetos. Además,
el consentimiento amplio se aplica a muestras biológicas

235
identificables recogidas para otros estudios o asistencia clínica. En
el cuadro 4.3 se enumeran los puntos clave requeridos para el
consentimiento amplio.

CUADRO 4.3 COMPONENTES DEL


CONSENTIMIENTO AMPLIO
Descripción
El investigador puede almacenar, mantener y utilizar para estudios
futuros información privada y muestras biológicas identificables.
Requisitos generales
Similares a los del consentimiento informado (v. cuadro 4.4); el
consentimiento amplio incluirá:

• Riesgos y beneficios potenciales.


• Confidencialidad relacionada con la identidad del sujeto.
• Participación voluntaria.
• Derecho a abandonar el estudio en cualquier momento.

Además, el consentimiento amplio incluirá:

• Uso de muestras biológicas para beneficio comercial.


• Si se obtienen beneficios, los sujetos recibirán una parte.
• Si el análisis de la muestra incluirá una secuenciación del
genoma completo.
• Tipos de investigación para los que se pueden utilizar los
datos.
• Información suficiente para que una persona razonable tome
una decisión sobre la participación.
• Periodo de tiempo durante el cual se conservarán los datos,
que puede ser indefinido.
• Explicación a los sujetos que no se les informará sobre los
estudios específicos que se realizarán.
• Los resultados no se compartirán con los sujetos a menos que
sean clínicamente relevantes.

236
• Información de contacto que se utilizará para obtener
respuestas a preguntas.

Derecho al anonimato y a la confidencialidad


Según el derecho a la privacidad, el sujeto de investigación tiene
derecho al anonimato y a asumir que los datos recogidos serán
confidenciales. Existe el anonimato completo cuando el
investigador no puede relacionar la identidad del sujeto con sus
respuestas individuales (Gray, Grove y Sutherland, 2017). En la
mayoría de los estudios, los investigadores conocen la identidad de
los sujetos y se comprometen a mantenerla en el anonimato para los
demás y a que los datos de la investigación serán confidenciales. La
confidencialidad es el manejo seguro por parte de los
investigadores de la información o los datos compartidos por un
sujeto para garantizar que los datos se mantendrán secretos para los
demás. El investigador acuerda que no compartirá la información
de los sujetos sin su autorización. La confidencialidad se basa en
dos premisas (ANA, 2015):

1. Debido a que las personas son dueñas de su información


personal, pueden compartirla en la medida que deseen y
con quien deseen.
2. Aceptar la información personal conlleva la obligación de
mantener la confidencialidad, obligación que es aún mayor
para los investigadores y los profesionales de enfermería.

Puede producirse una violación de la confidencialidad cuando


un investigador, por accidente o por acción directa, permite que
una persona no autorizada tenga acceso a los datos sin procesar de
un estudio. La confidencialidad también puede violarse cuando se
presentan informes o se publica un estudio en el que se revela
accidentalmente la identidad de un participante, infringiendo su
derecho al anonimato. En los estudios cuantitativos, los resultados
se presentan por subgrupos o grupos, y es menos probable que se
produzca una violación de la confidencialidad. Sin embargo, en los
estudios cualitativos es más probable que se produzca una
violación de la confidencialidad porque el investigador recopila
datos de menos participantes en el estudio y publica citas largas

237
realizadas por dichos participantes. Además, los investigadores
cualitativos y los participantes suelen tener relaciones en las que
estos comparten historias detalladas de su vida, lo que requiere un
manejo cuidadoso de los datos para asegurar su confidencialidad
(Marshall y Rossman, 2016, Munhall, 2012). Las violaciones de la
confidencialidad son especialmente perjudiciales para los
participantes cuando se comparten factores como sus preferencias
religiosas, prácticas sexuales, ingresos, prejuicios raciales, consumo
de drogas o abuso de menores. La confidencialidad de los
participantes debería mantenerse durante la recogida, análisis y
comunicación de los datos (Gray y cols., 2017). Los hallazgos de la
investigación, tanto si se emplean métodos cuantitativos,
cualitativos o mixtos, deberían comunicarse de forma que un
participante o grupo de participantes no pueda ser identificado por
sus respuestas.

Derecho a la protección frente a las molestias y los


daños
El derecho a la protección frente a las molestias y los daños en un
estudio se basa en el principio ético de la beneficencia, que afirma
que las personas deben hacer el bien y, por encima de todo, no
causar ningún daño. Según este principio, los miembros de la
sociedad deben asumir un papel activo en la prevención de las
molestias y los daños, y en la promoción del bien en el mundo que
les rodea (ANA, 2015; Levine, 1986). En la investigación, las
molestias y los daños pueden ser físicos, emocionales, sociales,
económicos o cualquier combinación de estos cuatro tipos (Weijer,
2000).
Los estudios oscilan de la ausencia de molestias y daños previstos
a un riesgo elevado de molestias y daños. Los diseños de
investigación que implican una revisión de historias clínicas,
archivos de estudiantes o análisis secundario de datos
anonimizados o disociados recogidos para otro estudio no
conllevan molestias ni daños previstos. Cuando la interacción entre
el investigador y el sujeto es nula o mínima, el estudio se
considerará por lo general exento cuando lo revise un CRI.
Los estudios que causan molestias temporales se consideran
estudios de riesgo mínimo, en los que las molestias son similares a

238
las que el sujeto habría experimentado en su vida diaria y son
temporales, finalizando cuando el estudio se completa (DHHS,
2017a). Los sujetos en un estudio de riesgo mínimo pueden
completar cuestionarios o participar en entrevistas. Las molestias
físicas en los estudios de riesgo mínimo pueden consistir en fatiga,
cefalea o tensión muscular. Responder a preguntas sobre temas
delicados podría causar ansiedad o vergüenza. El único daño
económico puede consistir en los costes de viajar al sitio del
estudio.
La mayoría de los estudios clínicos de enfermería que analizan el
efecto de un tratamiento implican un riesgo mínimo. Por ejemplo,
un estudio que analiza los efectos del ejercicio sobre la glucemia de
sujetos diabéticos puede implicar la determinación de la glucemia
de los sujetos una vez adicional cada día. Las molestias o daños
físicos pueden asociarse con la obtención de sangre o la
participación en el ejercicio prescrito. Para evitar el daño
económico, el investigador puede reembolsar al sujeto el coste de
los materiales para el análisis adicional. Los sujetos diabéticos
experimentan molestias similares en sus vidas diarias. Las molestias
de una punción adicional en el dedo finalizarán cuando el estudio
termine.
Las molestias y daños durante algunos estudios pueden superar
el nivel mínimo e implicar niveles inusuales de molestias
transitorias. En estudios con niveles inusuales de molestias
temporales, los sujetos pueden experimentar dichas molestias
durante y después del estudio. Se pueden experimentar niveles
inusuales de molestias transitorias durante un estudio en el que los
sujetos han estado encamados durante 3 días para evaluar la
asociación entre la inmovilidad y la debilidad muscular. La
debilidad muscular puede continuar después del estudio hasta que
el sujeto esté totalmente recuperado.
Se pueden producir unos niveles inusuales de molestias o daño
cuando los sujetos experimentan fracaso, miedo extremo o
amenazas a su identidad como parte de un estudio. Los
investigadores cualitativos pueden plantear preguntas que hagan
que los participantes revivan una crisis vital, como ser
diagnosticados de cáncer de colon o la pérdida de la pareja. Revivir
estas experiencias o actuar de forma antinatural implica unos

239
niveles inusuales de molestias transitorias. En los estudios con
niveles inusuales de molestias o daño, el investigador describirá los
criterios de exclusión para la muestra en el protocolo del CRI. Los
criterios de exclusión se establecen para evitar el reclutamiento de
sujetos que presentan un riesgo mayor de molestias o daño a largo
plazo. En el estudio que implica estar encamado, las personas con
enfermedad pulmonar quedarían excluidas debido a su mayor
riesgo de neumonía. Un participante potencial de un estudio
cualitativo relacionado con la recuperación después de una
agresión sexual podría excluirse si estuviese recibiendo actualmente
asesoramiento de un profesional autorizado. El equipo de
investigación también debería indicar en el protocolo del CRI y en
el informe de investigación la forma en la que se evaluaron las
molestias de los participantes y los recursos que pusieron a
disposición.
Los estudios en los que existe el riesgo de un daño permanente
serán sometidos a una evaluación adicional por el CRI. El
fundamento para realizar el estudio debe establecer las razones por
las que el conocimiento obtenido a partir del estudio no puede
lograrse de otro modo y lo que se hará para evitar o minimizar el
daño. Los estudios biomédicos que implican nuevos fármacos y
dispositivos son más propensos a causar daño permanente que
aquellos habitualmente iniciados por los profesionales de
enfermería. Algunos temas investigados por los profesionales de
enfermería pueden causar daños emocionales y sociales
permanentes a los sujetos. Los estudios en los que se evalúa
información sensible, como la conducta sexual, el maltrato infantil,
el estatus del VIH/SIDA o el consumo de drogas, pueden conllevar
un riesgo muy elevado para los sujetos. Estos estudios pueden
causar daños permanentes a la personalidad o reputación de un
sujeto. También hay posibles riesgos económicos, como los
derivados de una disminución del rendimiento laboral o la pérdida
de empleo.
Los experimentos médicos nazis y el estudio sobre la sífilis de
Tuskegee son ejemplos de estudios en los que los sujetos tuvieron la
certeza de sufrir un daño permanente. La realización de
investigaciones que tienen la certeza de causar daño permanente a
los sujetos del estudio es muy cuestionable, con independencia de

240
los beneficios que se puedan obtener. Con frecuencia, los beneficios
obtenidos de estos estudios no revierten en los participantes del
estudio, sino en otros miembros de la sociedad. Los estudios que
provocan un daño permanente a los sujetos violan los principios del
Código de Núremberg y no deberían realizarse (v. cuadro 4.1).

Derecho a la selección y el trato justos


El derecho a una selección y trato justos se basa en el principio ético
de la justicia. Según este principio, las personas deben ser tratadas
de forma justa y recibir lo que se les debe o ser tratadas de forma
que sea equitativa respecto al trato de otras personas en la misma
situación. El informe de investigación debe indicar que la selección
y el tratamiento de los sujetos durante el estudio fueron justos.
Las injusticias en la selección de los sujetos han derivado de
prejuicios sociales, culturales, raciales y sexuales. Durante muchos
años, las investigaciones se realizaban con categorías de personas
que se consideraban menos útiles, como las que viven en la
pobreza, los presos, los esclavos y personas de una raza o etnia
minoritaria. Los investigadores solían tratar a estos sujetos sin
consideración respecto al daño o las molestias, sacrificando su
protección en aras de los beneficios científicos o personales (Doody
y Noonan, 2016).
Otro de los problemas es que algunos investigadores seleccionan
a los sujetos porque les gustan y quieren que reciban los beneficios
específicos de un estudio. Algunos se dejan llevar por el poder o el
dinero para garantizar que ciertos pacientes se convierten en sujetos
para que puedan recibir tratamientos potencialmente beneficiosos.
La selección aleatoria de los sujetos puede eliminar algunos de los
sesgos de los investigadores que pueden influir en la selección de
los sujetos y fortalece el diseño del estudio (v. cap. 9).
Todos los estudios deben incluir un formulario de
consentimiento que describa la función del investigador y la
participación del sujeto en el estudio (DHHS, 2017a). El formulario
de consentimiento es en realidad un acuerdo entre el sujeto y el
investigador sobre lo que cada uno hará durante el estudio.
Mientras se realiza el estudio, el investigador debe tratar a los
sujetos de forma justa y respetar el acuerdo. Por ejemplo, no deben
cambiarse las actividades o las pruebas que se van a realizar a los

241
sujetos sin la aprobación del CRI. Los participantes deben recibir los
beneficios que se les hayan prometido y deberían distribuirse
independientemente de la edad, la raza o el nivel socioeconómico.
En el informe de investigación debe indicarse que la selección y el
tratamiento de los sujetos fueron justos. Los criterios de inclusión
deberían reflejar el problema de investigación y el propósito del
estudio. Por ejemplo, la declaración del problema de investigación
podría indicar los pocos estudios que describen el estrés
relacionado con el trabajo de los profesionales de enfermería en
cuidados intensivos en los primeros años de su carrera. El propósito
del estudio fue analizar las experiencias vividas de estrés
relacionado con el trabajo en profesionales de enfermería de
cuidados intensivos en los primeros 5 años tras su graduación. Los
criterios de inclusión serían ser un profesional de enfermería con
una experiencia laboral de entre 1 y 6 años en cuidados intensivos.
Como se ha comentado, los criterios de exclusión deberían estar
justificados para proteger a los posibles sujetos que tengan un
riesgo mayor de daño o para evitar la influencia no intencionada de
las características de los participantes sobre los resultados del
estudio. Un criterio de exclusión podría ser los profesionales de
enfermería que trabajen en más de un hospital o que cursen un
grado avanzado. Cualquiera de estas condiciones podría influir en
el estrés que se experimenta en el trabajo.
El investigador responsable diseña el estudio para minimizar las
molestias y el riesgo de los posibles sujetos, así como para proteger
sus derechos de autodeterminación, privacidad, confidencialidad y
su selección y trato justos. No suelen proporcionarse detalles en el
informe de investigación sobre el modo de cumplir cada uno de
estos aspectos, pero se deberían indicar las medidas básicas
adoptadas, como mantener la confidencialidad de los datos
asignando códigos numéricos a los materiales de los sujetos. Las
siguientes guías ayudarán a evaluar de forma crítica un estudio
para garantizar la protección de los derechos humanos, a excepción
de la obtención del consentimiento informado de personas
vulnerables a una influencia o coerción indebida. Los aspectos del
consentimiento informado referentes a la protección del derecho a
la autodeterminación se abordarán en la siguiente serie de
preguntas de valoración crítica.

242
GUÍAS DE VALORACIÓN CRÍTICA
Protección de los derechos humanos

1. ¿Se protegió el derecho a la privacidad de los sujetos y se


mantuvo la confidencialidad de los datos de investigación
durante la recogida y análisis de los datos y la presentación
del informe de investigación?
2. ¿Se protegió la información sanitaria que permite identificar
al sujeto cumpliendo la Common Rule y la Privacy Rule
(DHHS, 2017a)?
3. ¿Los sujetos se seleccionaron de forma justa? ¿Los
participantes se trataron de forma equitativa?
4. ¿Qué aspectos del estudio podrían haber resultado
incómodos o derivado en daños? En tal caso, ¿qué medidas
se aplicaron para disminuir las molestias y la posibilidad de
daño (DHHS, 2017a)?

Williams, Turner-Henson, Langhinrichsen-Rohling y Azuero


(2017) realizaron un estudio de correlación predictivo de las
relaciones entre los acontecimientos vitales estresantes, el estrés
percibido, el acoso, los niveles de cortisol y la depresión en una
muestra de estudiantes de noveno curso. Después de cumplimentar
cinco instrumentos de evaluación, se indicó a los estudiantes que
recogiesen saliva dos veces al día. Los datos se analizaron para
determinar las relaciones entre las variables seleccionadas. El
extracto de la investigación del Ejemplo de investigación 4.1 incluye
los aspectos éticos del estudio relacionados con la privacidad y la
equidad.

EJEMPLO DE INVESTIGACIÓN 4.1


Protección de los derechos humanos
Extracto del estudio de investigación
Los requisitos de elegibilidad incluyeron: 1) estudiantes de noveno curso

243
de 14-16 años, 2) que aceptasen participar (asentimiento firmado), 3)
capaces de comprender, hablar y responder en inglés, 4) capaces de seguir
instrucciones para recoger saliva y 5) que tuviesen el consentimiento
parental. Los criterios de exclusión fueron: 1) no hablar inglés, 2) incapaz
de cumplimentar los instrumentos de evaluación, 3) autonotificación de
gestación, depresión clínica, trastorno bipolar y enfermedad de Cushing o
de Addison, 4) autonotificación de toma de fármacos que podrían alterar
las concentraciones de cortisol (p. ej., anticonceptivos orales, corticoides
orales o inhalados para el asma) y 5) enfermedad física con
autonotificación de fiebre… Al finalizar el estudio se proporcionó a cada
participante… información sobre asesores en salud mental que estaban
disponibles a un coste bajo o nulo… El estado puberal se midió con la
Escala de desarrollo puberal… Esta escala autonotificada proporciona una
estimación del estado puberal específico de cada sexo. Los adolescentes se
clasifican en cinco categorías (estado prepuberal, precoz, intermedio,
tardío o pospuberal) que se determinan sumando los puntos asignados a
las preguntas para los varones (crecimiento del vello corporal, cambio de
la voz y crecimiento del vello facial) y las mujeres (crecimiento del vello
corporal, desarrollo mamario y menarquia)…. (Williams y cols., 2017,
págs. 25-26)
Valoración crítica
Uno de los puntos fuertes del estudio es que los criterios de
inclusión eran congruentes con el problema de investigación y el
propósito del estudio. Los criterios de exclusión también eran
razonables, como excluir a los estudiantes con enfermedades
específicas que afectasen a la producción de corticoides que
habrían afectado a los niveles de cortisol. El estudio estaba
diseñado de modo que los sujetos pudiesen recibir un trato justo y
equitativo. Los investigadores señalaron que se proporcionó
información a los sujetos sobre servicios de salud mental,
indicando su reconocimiento de las posibles molestias y/o daño
que podrían producirse al pensar sobre el estrés, el acoso y la
depresión.
Los aspectos éticos del estudio que recibieron menos atención
fueron los derechos a la privacidad y a la confidencialidad. El
informe de investigación no incluía información sobre el modo en
el que se protegieron los derechos de los sujetos a la privacidad y la

244
confidencialidad durante la recogida y el análisis de los datos. El
informe tampoco explicaba el modo en el que se protegió la
información privada identificable. Sin embargo, todos los
resultados de la muestra se presentaron agrupados, de modo que
los individuos no podían identificarse. Los instrumentos de
evaluación del estudio también incluyeron preguntas sobre la
pubertad y la orientación sexual como covariables, pero los
investigadores no indicaron si los adolescentes podrían haberse
sentido incómodos al proporcionar esta información. Algunos de
los datos se obtuvieron en un laboratorio informático en el instituto
y no está claro el grado de privacidad proporcionado a los
estudiantes cuando cumplimentaron los instrumentos. Habría
resultado útil disponer de más información sobre las posibles
molestias y daños para determinar los posibles riesgos del estudio.
Los resultados del estudio se describirán más adelante en el
capítulo.

COMPRENSIÓN DEL
CONSENTIMIENTO INFORMADO
¿Qué es un consentimiento informado? El consentimiento
informado consiste en proporcionar información a un posible
sujeto y la oportunidad de participar en el estudio. El proceso no
termina con la firma del sujeto en un documento acordando
participar en un estudio (Farmer y Lundy, 2017). El investigador,
guiado por el principio de beneficencia y comprometido con la
protección del derecho a la autodeterminación, describe el estudio y
lo que se pedirá a los sujetos que hagan. La posible decisión del
sujeto sobre si va a participar es la parte de consentimiento del
proceso. Los investigadores deben conocer la cultura de los posibles
sujetos. Por ejemplo, las culturas colectivistas pueden considerar
que el consentimiento informado individual es inapropiado y
pueden querer la implicación de otros familiares. Pueden estar
dispuestas a compartir los datos con el investigador, pero esperar
que los sujetos conserven la propiedad de los datos (Roberts y cols.,
2017).
Si los riesgos y beneficios de la participación cambian durante el

245
estudio, el investigador mantiene la confianza compartiendo esa
información con los sujetos. Los sujetos proporcionan el
consentimiento continuo al mantener su participación en el estudio,
con la seguridad de que pueden abandonarlo en cualquier
momento.

Cuatro elementos del consentimiento


informado
El consentimiento informado está incompleto si no incluye cuatro
elementos (fig. 4.4). El investigador debe divulgar la información
esencial sobre el estudio a los sujetos potenciales de forma que la
puedan comprender. El segundo elemento es el grado en el que el
sujeto potencial comprende la información. Los elementos finales
son la competencia del sujeto potencial y la aceptación voluntaria
para participar en el estudio

FIG 4.4 Elementos necesarios de consentimiento.

246
Divulgación
La revisión de la Common Rule cambió el foco del proceso de
consentimiento, que pasó de compartir cada posible detalle del
estudio a proporcionar la información que una persona razonable
necesitaría para tomar una decisión sobre la participación (DHHS,
2017a). En el cuadro 4.4 se muestran las características del
consentimiento informado. La autorización de la HIPAA y el
consentimiento amplio para el uso futuro de las muestras de la
investigación, que se han descrito antes en el capítulo, se pueden
incluir en el consentimiento para un estudio o pueden ir por
separado.

CUADRO 4.4 COMPONENTES DEL


CONSENTIMIENTO INFORMADO
Descripción
Aceptación voluntaria de un sujeto competente para participar en
un estudio después de adquirir los conocimientos para evaluar los
beneficios y los riesgos.
Requisitos generales

• Comprensible:
• Las circunstancias proporcionan la oportunidad para
comentar y tomar una decisión deliberada y sin
presión.
• Lenguaje comprensible.
• Presentación no como hechos inconexos, sino de un
modo que tenga sentido.
• Precauciones:
• El sujeto no renuncia a ningún derecho legal ni
exime al investigador o al patrocinador en caso de
negligencia.
• Completo pero conciso:
• Información suficiente que una persona razonable
querría para tomar una decisión.

247
• Exhaustivo:
• Propósito y procedimientos del estudio de
investigación.
• Duración de la implicación del sujeto.
• Beneficios y riesgos o incomodidades.
• Compensación, en caso de existir, por las lesiones
relacionadas con la investigación.
• Información sobre los tratamientos alternativos si
están disponibles.
• Confidencialidad de los registros.
• Personas de contacto.
• Derecho a rehusar o a abandonar el estudio sin
pérdida de beneficios.

Parte de la divulgación es la documentación de la información


que se compartió, donde la firma del sujeto indica la aceptación
para participar. Un formulario de consentimiento es un
documento escrito que comprende los elementos del
consentimiento informado exigidos por la Common Rule (DHHS,
2017a). Además, puede contener otra información requerida por la
institución en la que se va a realizar el estudio o por el organismo
que lo va a financiar. Para los ensayos clínicos con financiación
federal, se debe publicar una copia del formulario de
consentimiento aprobado por el CRI en un sitio web de acceso
público (DHHS, 2017a).

Comprensión
El consentimiento informado no solo implica que se ha informado a
los posibles sujetos, sino también que estos han comprendido esa
información. El investigador debe dedicar tiempo a hablar con los
sujetos sobre el estudio. La cantidad de información que se les
revela depende del conocimiento de los sujetos sobre la
investigación y del tema de investigación específico. Los
investigadores deben comentar con detalle los beneficios y los
riesgos del estudio, poniendo ejemplos que los sujetos potenciales o
los participantes puedan entender. Los profesionales de enfermería
suelen actuar como defensores de los pacientes en los organismos
clínicos y deben evaluar si los pacientes implicados en la

248
investigación comprenden el propósito y los posibles riesgos y
beneficios de su participación en el estudio (ANA, 2015; Banner y
Zimmer, 2012; Fry y cols., 2011).

Competencia
Las personas autónomas, que son capaces de comprender los
beneficios y los riesgos de un estudio propuesto, son competentes
para dar su consentimiento. Las personas con autonomía reducida
debido a incompetencia legal o mental o confinamiento en una
institución no son legalmente competentes para dar su
consentimiento a participar en una investigación. En el informe, los
investigadores tienen que indicar la competencia de los sujetos y el
procedimiento que se utilizó para obtener el consentimiento
informado (Banner y Zimmer, 2012).

Aceptación voluntaria
La aceptación voluntaria significa que el sujeto potencial ha
decidido participar en un estudio por voluntad propia, sin coerción
ni ninguna influencia indebida (DHHS, 2017a). Los investigadores
obtienen la aceptación voluntaria después de que el posible sujeto
que es competente para tomar la decisión haya recibido la
información esencial sobre el estudio y haya demostrado que la ha
comprendido. Todos estos elementos del consentimiento informado
deben documentarse en un formulario de consentimiento y deben
comentarse en el informe de investigación.

Documentación del consentimiento


informado
La documentación del consentimiento informado depende del nivel
de riesgo del estudio y de los requisitos del CRI que aprueba dicho
estudio. La mayoría de los estudios requieren un formulario de
consentimiento por escrito con la firma del sujeto. Este también
recibe una copia del formulario de consentimiento. Hay tres
categorías de situaciones en las que el proceso de obtención y
documentación del consentimiento se modifican.
En los estudios donde participan sujetos con la autonomía

249
reducida se necesita un formulario de consentimiento firmado por
escrito, pero se modifica la persona que lo firma. Si estos sujetos
potenciales comprenden algo del estudio y acuerdan participar,
deben firmar el formulario. Además, el representante legal
autorizado del sujeto también debe firmarlo y debe indicar su
relación con el sujeto debajo de la firma. A veces se pide a los
profesionales de enfermería que firmen un formulario de
consentimiento como testigos para un estudio biomédico. Deben
conocer el propósito y la metodología del estudio, y que el sujeto lo
ha comprendido antes de firmarlo. Para garantizar la aplicación
coherente del proceso de consentimiento, los profesionales de
enfermería y las personas que participan en él son informados sobre
ello y sobre el estudio.
Para los estudios en los que los posibles sujetos puede que no
sean capaces de leer y comprender el formulario de consentimiento,
el CRI puede aprobar una presentación verbal del estudio o una
lectura de su resumen. Un testigo observa el proceso de
consentimiento y garantiza que la presentación incluya el contenido
requerido del resumen del estudio aprobado por el CRI. El sujeto
firma una declaración breve donde reconoce que le han
proporcionado el resumen de la información del estudio y acuerda
participar. El investigador y el testigo firman el formulario corto
firmado por el sujeto y el resumen escrito del estudio que se ha
presentado verbalmente. Al sujeto se le entrega una copia del
formulario corto y del resumen escrito.
Algunos estudios con un riesgo mínimo están exentos del
requisito de un consentimiento por escrito. Los estudios que
pueden estar exentos de un consentimiento firmado suelen implicar
procedimientos que a menudo no requieren una firma fuera del
contexto de investigación, como responder a preguntas sobre la
estructura familiar o las relaciones con los amigos. El CRI puede
aprobar una exención cuando el documento firmado fuera la única
conexión entre la persona y el estudio en situaciones en las que la
confidencialidad sea una preocupación fundamental. Por ejemplo,
podría aprobarse una exención para las mujeres infectadas por el
VIH que son sujetos de investigación en un estudio sobre la
revelación del estado del VIH a los amigos y familiares. También
puede haber una exención del consentimiento firmado si los sujetos

250
potenciales son miembros de una cultura o comunidad en la que la
firma de documentos no sea la norma (DHHS, 2017a). El
investigador debería trabajar con los miembros del grupo para
identificar un mecanismo alternativo dirigido a documentar el
consentimiento, como utilizar una huella dactilar en lugar de una
firma o pronunciar en voz alta la aceptación para participar.
Los estudios en los que el investigador o el encargado de recoger
los datos interactúa con los sujetos requieren la obtención del
consentimiento informado. El proceso de consentimiento debe
cumplir las normas federales para la realización de investigación
ética con sujetos humanos. Los informes de investigación suelen
discutir el proceso de consentimiento e identificar parte de la
información esencial del consentimiento que se proporcionó a los
sujetos potenciales. Se requiere algún tipo de mención del proceso
de consentimiento para ese estudio, pero la profundidad de la
discusión variará en función del propósito de la investigación y de
los tipos de participantes o sujetos incluidos en el estudio. El
proceso de consentimiento suele presentarse en la sección de
métodos bajo la discusión de los procedimientos del estudio o del
proceso de la recogida de datos. Las siguientes guías de valoración
crítica serán de ayuda para analizar el proceso de consentimiento
de un estudio publicado o de un estudio que se vaya a realizar en
un entorno clínico.

GUÍAS DE VALORACIÓN CRÍTICA


Proceso de consentimiento informado
Estas preguntas garantizan que el derecho del sujeto a la
autodeterminación está protegido. Se deben considerar las
siguientes preguntas al valorar de forma crítica el proceso de
consentimiento de un estudio:

1. ¿Cómo se obtuvo el consentimiento informado de los sujetos


o participantes?
2. ¿Tenían los sujetos una autonomía reducida debido a
incompetencia legal o mental o a confinamiento en una
institución? Si los sujetos no eran competentes para dar su

251
consentimiento, ¿sus representantes legalmente autorizados
otorgaron el consentimiento?
3. ¿Se incluyó a niños como sujetos en el estudio? ¿Se obtuvo el
asentimiento? ¿Los progenitores o tutores concedieron el
permiso o consentimiento para que el niño participase?
4. ¿Los sujetos eran vulnerables a una influencia o coerción
indebida? En caso afirmativo, ¿se tomaron precauciones para
evitar que los posibles sujetos se sintiesen presionados para
participar?
5. ¿Los sujetos comprendieron la información esencial para el
consentimiento? ¿Se tomaron medidas para asegurar que los
sujetos con un bajo nivel educativo y los que tienen una
autonomía reducida comprendiesen los requisitos del
estudio?
6. ¿Parecía que los sujetos participaban voluntariamente en el
estudio?

Como se ha descrito previamente, Williams y cols. (2017)


realizaron un estudio de los acontecimientos vitales, el estrés y el
acoso en estudiantes de noveno curso, con el propósito de evaluar
la contribución de estas variables a la depresión. Debido a que los
sujetos eran niños, se obtuvo el permiso parental y el asentimiento
de los estudiantes de forma adecuada, como se describe en el
Ejemplo de investigación 4.2. Por lo general, en un informe de
investigación, existe una mínima discusión sobre el proceso de
consentimiento informado.

EJEMPLO DE INVESTIGACIÓN 4.2


Consentimiento informado
Extracto del estudio de investigación
Los estudiantes de noveno curso suelen considerarse el nivel más bajo en
la escala de la enseñanza secundaria. Esta población a menudo puede
sentirse impotente para autodefenderse frente a conductas dirigidas,
agresivas e hirientes de estudiantes de cursos superiores, con más fuerza
física y social (Fredstrom, Adams y Gilman, 2011)… El investigador

252
principal explicó el estudio a todos los estudiantes de noveno curso y les
proporcionó paquetes con una carta para los progenitores, un formulario
de rechazo y otro de consentimiento para que lo firmasen y lo devolviesen.
Los adolescentes elegibles para participar firmaron un formulario de
asentimiento antes de que comenzase el estudio… Al final del estudio,
cada participante recibió una tarjeta de regalo de cinco dólares para un
establecimiento local de comida e información sobre asesores de salud
mental que estaban disponibles a un coste bajo o nulo. (Williams y cols.,
2017, págs. 24-25)
Valoración crítica
Los investigadores observaron que el noveno curso era un periodo
de transición difícil porque en el sistema de enseñanza secundaria,
se considera que los estudiantes de este curso tienen un nivel bajo
(Williams y cols., 2017). El investigador explicó el estudio a los
estudiantes elegibles y remitió paquetes con una carta, un
formulario de rechazo y un formulario de consentimiento al
domicilio de los estudiantes para que sus progenitores los
revisasen. Solo cuando estos firmaron y devolvieron los
formularios de consentimiento se permitió que los estudiantes
participaran en el estudio. Cuando los estudiantes cumplieron los
otros criterios de inclusión, se les proporcionaron los formularios
de asentimiento para que los firmasen. La autonomía reducida de
los posibles sujetos se reconoció en función de la edad biológica y
de la responsabilidad legal de los progenitores por el bienestar de
sus hijos. Se tomaron las precauciones apropiadas mediante la
obtención del consentimiento de los progenitores y el asentimiento
de los estudiantes. La tarjeta de regalo de cinco dólares era
razonable por la cantidad de tiempo y esfuerzo que los estudiantes
dedicaron voluntariamente, por lo que no surgieron
preocupaciones sobre la coerción.
Las preocupaciones acerca del efecto del bajo nivel educativo
sobre la capacidad de comprensión del estudio por parte de los
estudiantes se redujeron excluyendo a los que no hablaban inglés y
que eran incapaces de cumplimentar los instrumentos de
evaluación. Según la información proporcionada en el informe, la
participación de los estudiantes fue voluntaria. Los componentes
del consentimiento informado (en este caso, el permiso parental y

253
el asentimiento de los estudiantes) se obtuvieron de forma ética.
Casi el 40% de los estudiantes referían síntomas depresivos,
hasta el punto de que se les remitió al profesional de enfermería del
instituto para una evaluación adicional. Los ritmos de cortisol del
estudio eran normales en más del 90% de los estudiantes. De forma
global, el acoso autonotificado era menor que las tasas
estadounidenses, pero los estudiantes que describieron su
identidad de género como homosexual, bisexual o incierta habían
sufrido más acoso. Williams y cols. (2017) observaron que la
depresión presentaba una correlación significativa con
acontecimientos vitales estresantes, estrés percibido y acoso, pero
no con los ritmos del cortisol. Cuando se evaluaron los efectos
combinados de las variables sobre la depresión, el estrés percibido,
el acoso y la identidad de género explicaban el 59% de la varianza
de la depresión. Williams y cols. (2017) identificaron las siguientes
limitaciones: ser una investigación transversal, pocos puntos de
datos para los niveles de cortisol y la posibilidad de que un evento
reciente (muerte de un estudiante en un instituto la semana previa)
influyese en los hallazgos relacionados con la depresión (v. cap. 8).
Las implicaciones para la práctica son que los profesionales de
enfermería deberían tener una mayor concienciación acerca del
riesgo elevado de depresión de los adolescentes debido a la
identidad de género, cambios vitales, acoso y estrés. Para asegurar
la identificación de la depresión, puede que los profesionales de
enfermería quieran utilizar una herramienta de evaluación de la
depresión en su práctica con adolescentes.

COMPRENSIÓN DE LA REVISIÓN
INSTITUCIONAL
Un comité de revisión institucional (CRI) es una comisión que
revisa la investigación para garantizar que el investigador la está
realizando de forma ética. Los CRI tienen la autoridad para
aprobar, solicitar modificaciones y rechazar los estudios que
revisan. Si se producen problemas imprevistos durante un estudio,
se notifican al CRI y el estudio se interrumpe hasta que el problema
se resuelve y el CRI aprueba su continuación. Las universidades, los

254
hospitales, las empresas y otras organizaciones sanitarias tienen
CRI para promover la realización de estudios que se adhieran a los
principios éticos en investigación y proteger los derechos de los
posibles sujetos en sus instituciones (Grady, 2015; Ness y Royce,
2017; Resnik, 2015). Las normas federales proporcionan detalles
sobre la composición y las funciones de los CRI (DHHS, 2017a).

Composición y función del comité de


revisión institucional
Cada CRI tiene al menos cinco miembros de orígenes diversos
(culturales, económicos, educativos, de ambos sexos y raciales) para
promover la revisión completa, académica y justa de las
investigaciones que se realizan habitualmente en una institución
(DHHS, 2017a). Al menos un miembro tiene experiencia científica y
al menos un miembro pertenece a la comunidad y no tiene
formación científica. El mismo miembro o algún otro no está
afiliado a la institución de ningún modo. Los miembros son
sensibles a las actitudes de la comunidad a la que sirve la
institución y conocen las normas federales, las políticas
institucionales y los estándares de conducta profesional en virtud
de la cual se van a evaluar los estudios. Si una institución revisa con
regularidad los estudios con sujetos que pueden ser vulnerables a
coerción o a una influencia indebida, uno o más miembros del CRI
deberían tener experiencia en el trabajo con personas que sean
similares a los sujetos potenciales.
Los miembros del CRI no deben tener conflictos de intereses en
relación con un estudio realizado en una institución. Por ejemplo, si
un miembro del CRI propone la realización de un estudio en la
institución, el miembro solo podría participar en las deliberaciones
y decisiones sobre el estudio para proporcionar información
(DHHS, 2017a).
Para ser reconocido como CRI de una institución que solicita
financiación federal, el CRI debe registrarse en la Office of Human
Research Protection (OHRP; DHHS, sin fecha) y obtener una
garantía federal (FWA, federal-wide assurance; Grady, 2015). Una
FWA es una documentación sobre la adopción por el CRI de un
estándar ético, como el Informe Belmont (National Commission for

255
the Protection of Human Subjects of Biomedical and Behavioral
Research, 1979), y el acuerdo (garantía) de que se cumple la
Common Rule. Para recibir una FWA, un CRI debe tener políticas
por escrito sobre su composición y procesos, así como mantener
registros de todos los estudios revisados y de las decisiones
subsiguientes (DHHS, 2017a).

Niveles exento y expedito de las revisiones


realizadas por los comités de revisión
institucional
Las funciones y las actividades de un CRI suponen la revisión de la
investigación para determinar el nivel de revisión apropiado: el
presidente del CRI y/o el comité, no el investigador, deciden el nivel
de revisión necesario para cada estudio (DHHS, 2017a). La
Common Rule revisada ha ampliado los tipos de estudio que están
exentos de revisión. Los estudios que están exentos de revisión no
plantean riesgos aparentes a los sujetos de investigación. El cuadro
4.5 contiene una lista de los tipos de estudio que están exentos de
revisión. Cuando un estudio se considera exento, el CRI no requiere
una revisión continua del estudio, como sí sucede para otros niveles
de revisión (DHHS, 2017a). Los estudios realizados por
profesionales de enfermería suelen considerarse exentos de
revisión.

CUADRO 4.5 CARACTERÍSTICAS DE LOS


ESTUDIOS EXENTOS DE REVISIÓN POR EL
COMITÉ DE REVISIÓN INSTITUCIONAL,
CON EJEMPLOS

• Se realizarán en entornos educativos establecidos:


• Estudio de correlación de la relación entre la eficacia
de una estrategia docente innovadora con
características de la clase.
• Utilizará test educativos, encuestas, entrevistas o la
observación de la conducta pública sin identificar a los sujetos,
con unos riesgos mínimos y sin relación entre los datos y los

256
sujetos:
• Estudio descriptivo con recogida de datos online de
forma anónima utilizando una escala de apoyo social
y un cuestionario demográfico.
• Utilizará una intervención conductual benignaa y los datos no
estarán relacionados con los sujetos:
• Estudio cuasiexperimental que compara el
conocimiento sobre la diabetes adquirido jugando en
un juego online o mediante una presentación oral.
• Se usarán datos que estuviesen públicamente disponibles,
anonimizados o recogidos para evaluar proyectos
gubernamentales o servicios públicos:
• Estudio cualitativo exploratorio-descriptivo sobre la
evaluación escrita de los servicios de una clínica
financiada por el gobierno federal realizada por los
participantes en el programa.

a
La Common Rule describe las «intervenciones conductuales
benignas» como acciones cortas no invasivas de las que se espera
que no tengan un impacto adverso a largo plazo y que no sean
embarazosas ni ofensivas (DHHS, 2017a).
US Department of Health and Human Services (DHHS). (2017a).
Final revisions to the Common Rule: Protection of human subjects.
Code of Federal Regulations, Title 45, Part 46. Consultada el 11 de
marzo de 2017, en https://www.hhs.gov/ohrp/regulations-and-
policy/regulations/finalized-revisions-common-rule/index.html.

Los estudios pueden cumplir los criterios para recibir una


revisión expedita si conllevan algunos riesgos, pero estos son
mínimos. El presidente del CRI o uno de sus miembros más
experimentados realiza la revisión expedita. Los tipos de estudios
elegibles para la revisión expedita no varían con la revisión de la
Common Rule. En el cuadro 4.6 se enumeran los tipos de estudios
que cumplen los requisitos para una revisión expedita (DHHS,
2017a). Cuando se realizan procedimientos de revisión expedita, los
revisores pueden ejercer toda la autoridad del CRI, excepto la
desaprobación de la investigación. Una actividad de investigación

257
solo puede desaprobarse después de una revisión completa por el
CRI (DHHS, 2017a). Generalmente, los estudios descriptivos, en los
que se pide a los sujetos que respondan a cuestionarios, solo
necesitan una revisión expedita. Los estudios aprobados mediante
una revisión expedita no requieren una revisión anual.

CUADRO 4.6 CARACTERÍSTICAS DE LOS


ESTUDIOS ELEGIBLES PARA UNA REVISIÓN
EXPEDITA POR EL COMITÉ DE REVISIÓN
INSTITUCIONAL, CON EJEMPLOS
La revisión expedita se reserva para estudios con riesgos
mínimos; los datos son recogidos mediante uno de los siguientes
métodos:

• Pequeñas cantidades de sangre recogidas por venopunción o


punción en un dedo.
• Estudio cuasiexperimental en el que se comparan
mediciones de glucemia una vez a la semana en
personas con diabetes que reciben llamadas
telefónicas semanales sobre la dieta y el ejercicio con
las de personas con diabetes que reciben los cuidados
habituales.
• Muestras biológicas recogidas mediante métodos no invasivos.
• Estudio comparativo descriptivo de las estructuras de
los vasos sanguíneos de placentas obtenidas en el
parto de mujeres que han tenido hipertensión
inducida por el embarazo frente a las de mujeres que
no tuvieron hipertensión durante el embarazo.
• Mediciones no invasivas o imágenes recogidas mediante
procedimientos diagnósticos habituales.
• Estudio comparativo descriptivo de los estadios del
cáncer de pulmón basado en resonancia magnética
frente a imágenes de rayos X tradicionales de tumores
pulmonares de estadio III.
• Grabaciones de voz, de vídeo o digitales de entrevistas y
grupos focales.
• Estudio de teoría fundamentada sobre la experiencia

258
de la maternidad con niños adoptados, con recogida
de datos mediante entrevistas.
• Historias clínicas, cuando los sujetos pueden ser identificados
(si los datos se disocian, el estudio puede estar exento).
• Estudio de correlación del estatus nutricional de
pacientes con úlceras por presión adquiridas en la
comunidad frente al de pacientes con úlceras por
presión adquiridas en el hospital.
• Cuestionarios o encuestas de creencias culturales,
comunicación, percepción y conducta social.
• Estudio de correlación positiva sobre las creencias
culturales y el uso del servicio de urgencias por
personas con un seguro médico inadecuado o sin
seguro.

Revisiones completas realizadas por


comités de revisión institucionales
Los estudios que conllevan riesgos superiores a los mínimos deben
someterse a una revisión completa por un CRI. Para obtener la
aprobación del CRI, los investigadores deben describir en su
solicitud al CRI el modo en el que minimizarán los riesgos para los
sujetos, garantizarán que la selección de los sujetos sea equitativa,
protegerán la confidencialidad y la privacidad de los sujetos, y
realizarán ajustes para los posibles sujetos que sean vulnerables a la
coerción o influencia indebida (Grady, 2015; DHHS, 2017a). Los
progenitores de lactantes ingresados en unidades de cuidados
intensivos neonatales (UCIN) son ejemplos de personas que
podrían ser susceptibles a una influencia indebida por la
complejidad de las decisiones terapéuticas y su propio estrés
(Janvier y Farlow, 2015). Los procedimientos para obtener el
consentimiento deben describirse con claridad, incluida la
documentación apropiada del consentimiento.
Otra responsabilidad del investigador es tener un plan para
monitorizar los resultados durante el estudio respecto a los aspectos
de seguridad o de los resultados que podrían influir en la decisión
de una persona sobre continuar la participación en el estudio
(DHHS, 2017a). Por ejemplo, en un estudio que compare dos

259
fármacos, el investigador identifica que uno está causando mejorías
drásticas en la salud de los sujetos que lo reciben. Esto se debería
notificar a los sujetos que están en el otro grupo, que pueden optar
por retirarse del estudio, o el investigador puede interrumpir el
estudio y ofrecer los fármacos eficaces a todos los sujetos.
El que un estudio sea ético y reciba la aprobación por parte del
CRI depende en gran medida del balance entre sus riesgos y
beneficios. Esto significa que el CRI evalúa si los riesgos para los
sujetos son razonables respecto a los beneficios previstos (DHHS,
2017a). Para determinar este balance, o cociente riesgo-beneficio,
se evalúan los beneficios y los riesgos asociados al método de
muestreo del estudio, el proceso de consentimiento, la metodología
y los resultados potenciales del estudio. Cuando existen riesgos,
como un posible estrés emocional o psicológico, el investigador
puede tener un asesor que haya accedido a estar a disposición de
los sujetos.
El tipo de investigación realizada (terapéutica o no terapéutica)
influye en el posible beneficio para los sujetos. En la investigación
terapéutica, los sujetos podrían beneficiarse de las intervenciones
del estudio en áreas como el cuidado de la piel, el rango de
movimiento, el tacto u otras intervenciones de enfermería o
médicas. Los beneficios podrían incluir mejorar el estado físico, lo
que aportaría ventajas emocionales y sociales. La investigación no
terapéutica en enfermería no beneficia a los sujetos directamente,
pero es importante porque genera y mejora los conocimientos de
enfermería para futuros pacientes, la profesión de enfermería y la
sociedad. Si los riesgos superan a los beneficios, es probable que el
estudio no sea ético, por lo que no debería realizarse. Si los
beneficios superan a los riesgos, es probable que el estudio sea ético
y puede aumentar los conocimientos relacionados con la salud de
los individuos y las poblaciones.
La mayoría de los estudios publicados indican que se obtuvo la
aprobación del CRI, pero no si el estudio estaba exento de la
revisión o si se sometió a una revisión expedita o completa. El
informe de investigación debe identificar con claridad al CRI que
revisó y aprobó el estudio. Los estudios se realizan con frecuencia
en más de un centro clínico o son proyectos conjuntos entre
universidades. Los estudios con financiación federal que implican a

260
múltiples instituciones se consideran investigaciones cooperativas y
todas las instituciones están obligadas a aceptar la aprobación de un
CRI designado por los organismos de financiación (DHHS, 2017a).
En otros estudios en los que intervienen múltiples instituciones, los
CRI pueden realizar una revisión conjunta o aceptar la revisión de
otra institución. La Common Rule revisada recomienda evitar la
duplicación de los esfuerzos a la hora de revisar los estudios
(DHHS, 2017a).

GUÍAS DE VALORACIÓN CRÍTICA


Aspectos éticos globales de un estudio
Las siguientes guías pueden utilizarse para la valoración crítica
de los aspectos éticos de un estudio. Cuando se realiza un estudio,
los investigadores deben cumplir las normas del DHHS (2017a) y
las leyes estatales y locales aplicables para la realización de
investigaciones éticas con sujetos humanos. Estas guías de
valoración crítica se basan en las guías previas y su intención es
ayudar a resumir o sacar conclusiones sobre la realización ética del
estudio. Se deben considerar las siguientes preguntas al valorar de
forma crítica los aspectos éticos de un estudio:

1. ¿El estudio fue aprobado por un CRI? En función de la


evaluación, ¿qué nivel de revisión (exento, expedito o
completo) requería el estudio?
2. ¿Qué medidas tomaron los investigadores para minimizar los
riesgos y garantizar los beneficios? Hay que aplicar el
cociente riesgo-beneficio al estudio. ¿Las medidas fueron
suficientes?
3. Utilizando las guías previas sobre el consentimiento, ¿se
obtuvo el consentimiento informado de los sujetos de forma
ética?
4. Utilizando las guías previas sobre la protección de los
derechos de los sujetos, ¿se protegieron los derechos de los
sujetos durante el estudio?
5. Se deben resumir las conclusiones sobre los aspectos éticos
del estudio.

261
El estudio descrito previamente (Williams y cols., 2017) se revisó
y aprobó de forma apropiada por un CRI y por los administradores
del instituto. A título de comparación, en el Ejemplo de
investigación 4.3 se presenta un segundo ejemplo de un estudio
etnográfico en una UCIN sobre las creencias de los profesionales de
enfermería acerca de la alimentación de los lactantes y del modo en
el que realmente se alimentaban los bebés (Cricco-Lizza, 2016). Los
estudios etnográficos pueden plantear algunas dificultades
específicas debido a la observación de personas en el entorno que
pueden no participar directamente en el estudio y que no han dado
su consentimiento. Además, el investigador a menudo participa en
actividades de la cultura que se está estudiando. Durante los 14
meses del estudio, Cricco-Lizza (2016) participó en la vida diaria de
la unidad a lo largo de 128 periodos de observaciones, realizó 114
entrevistas informales a 114 informantes generales varias veces y
llevó a cabo entrevistas formales con 18 informantes clave.

EJEMPLO DE INVESTIGACIÓN 4.3


Determinación de la ética de un estudio
Extracto del estudio de investigación
Este diseño cualitativo utilizó entrevistas y observación participante, y
permitió interacciones personales integradas en la cultura de la UCIN…
Los informantes generales se seleccionaron para proporcionar una visión
amplia de las creencias y prácticas en la unidad. De este grupo, los
informantes clave se siguieron más estrechamente para obtener una visión
en profundidad… Estos informantes se observaron y se entrevistaron
formal o informalmente para obtener detalles abundantes sobre la
alimentación de los lactantes en la UCIN. La observación participante
facilitó la obtención de información acerca de sus prácticas reales de
alimentación de los lactantes, mientras que las entrevistas informales y
formales permitieron evaluar sus creencias específicas… Los directores de
enfermería y médico concedieron el permiso para la recogida de datos en
esta UCIN y se informó a los profesionales de enfermería sobre el estudio a
través de la intranet, de reuniones con el personal y de interacciones cara
a cara en la UCIN. Los comités universitario y hospitalario de sujetos

262
humanos permitieron la aprobación ética de esta investigación estipulando
que los profesionales de enfermería concedieran el consentimiento
informado por escrito para las entrevistas formales grabadas… el contacto
prolongado facilitó una evaluación más profunda de las creencias sobre
alimentación de los lactantes y de las prácticas de esta UCIN. Las
entrevistas se etiquetaron con seudónimos y se transcribieron
literalmente. Estas transcripciones incluyeron las palabras y conductas de
los profesionales de enfermería durante las entrevistas. Se comprobó su
precisión línea a línea y se compararon directamente con las grabaciones.
(Cricco-Lizza, 2016, págs. e92-e93)
Valoración crítica
Uno de los puntos fuertes del estudio desde un punto de vista ético
fue su aprobación por el CRI de la universidad de la investigadora
y del hospital donde se realizó el estudio. Debido a las dificultades
del consentimiento informado y a la observación participante, el
estudio requirió una revisión completa durante una reunión del
CRI. La investigadora minimizó los riesgos mediante la obtención
del consentimiento por escrito para las entrevistas formales,
marcando las grabaciones del estudio con seudónimos e
informando a los profesionales de enfermería y al personal de la
unidad de la realización del estudio y de la recogida de datos sobre
lo que ella observaba. Cricco-Lizza (2016) aumentó los beneficios
del estudio utilizando métodos rigurosos para garantizar la
credibilidad de los hallazgos del estudio y protegiendo los
derechos de los sujetos (profesionales de enfermería de la UCIN).
Los beneficios del estudio superaron los riesgos porque los
procedimientos éticos utilizados durante el mismo protegieron la
confidencialidad de los profesionales de enfermería todo lo posible.
El estudio se realizó de un modo ético.

CUESTIONES ACTUALES EN LA
ÉTICA DE LA INVESTIGACIÓN
Los cambios constantes en la asistencia sanitaria y la tecnología
crean nuevos desafíos en la ética de la investigación. En esta
sección, tres áreas que están en constante evolución son los aspectos

263
relacionados con la investigación genómica, el uso de animales en
los estudios y la mala praxis investigadora.

Investigación genómica
La investigación genómica es un área prometedora de la ciencia
relacionada con las enfermedades y la curación del ser humano. Los
identificadores específicos en el código genético de cada persona
hacen que la protección de los derechos de autodeterminación y de
consentimiento informado de cada sujeto sean particularmente
problemáticos. El Proyecto Genoma Humano financiado por los
National Institutes of Health (NIH) reconoció desde el principio los
dilemas éticos y legales de la investigación genómica. Como
resultado, la financiación del programa incluyó financiación
específica para el estudio de estos aspectos (McEwen, Boyer y Sun,
2013). «Ninguna otra área de la investigación biomédica ha
mantenido un compromiso tan elevado (con respaldo económico)
con la evaluación de los aspectos éticos» (McEwen y cols., 2013,
pág. 375). A pesar de esta inversión, todavía quedan cuestiones sin
resolver relacionadas con el consentimiento y el uso futuro de los
datos genéticos.
Varios casos muy difundidos han aumentado la concienciación y
el temor en la opinión pública. Henrietta Lacks, una mujer
afroamericana de 31 años, fue diagnosticada de cáncer de cuello
uterino. Fue ingresada en el John Hopkins University Hospital en
1951 para recibir el tratamiento habitual (Jones, 1997). Las muestras
tomadas fueron llevadas al laboratorio de un científico llamado Dr.
Gey, quien estaba tratando de identificar y reproducir una línea
celular con fines de investigación y proporcionó generosamente la
línea celular a otros investigadores de forma gratuita. Estos
investigadores, basados en el trabajo del Dr. Gey, desarrollaron una
línea celular a partir de esas células tumorales especialmente
resistentes, una línea celular que se utilizó con éxito en
investigación (Bledsoe y Grizzle, 2013; Skloot, 2010). Varios
tratamientos muy eficaces, como la vacuna de la poliomielitis y la
fecundación in vitro, se desarrollaron utilizando la línea celular. Los
tratamientos fueron muy rentables para los investigadores y las
instituciones con las que estaban asociados, y proporcionaron

264
literalmente miles de millones de dólares por la venta de la línea
celular a otros investigadores (McEwen y cols., 2013). La Sra. Lacks
falleció sin saber que sus células tumorales fueron utilizadas para la
investigación y su familia solo tuvo noticias de su contribución a la
ciencia en 2010. Sus familiares no han buscado represalias legales,
sino que han optado por centrarse en educar a la opinión pública y
los científicos para evitar que se repita un caso similar.
Por desgracia, se siguen produciendo estudios y prácticas de
investigación no éticos. Otro ejemplo de investigación no ética tuvo
lugar en la década de 1990. En esa época, unos investigadores
empezaron a recoger muestras de sangre de miembros de una tribu
nativa estadounidense aislada, los havasupai, que vivían en el Gran
Cañón (Caplan y Moreno, 2011). La diabetes mellitus hacía estragos
en esta tribu y los investigadores propusieron un estudio para
identificar las claves genéticas de la susceptibilidad a la
enfermedad. Sin embargo, los investigadores utilizaron las
muestras de sangre para estudiar otros temas, como la
esquizofrenia y el origen tribal (McEwen y cols., 2013). La tribu
demandó a la Arizona State University, de quien dependía el
investigador original, y se le concedió una indemnización en 2010.
Parte de la indemnización consistió en la entrega del resto de las
muestras de sangre a la tribu para que las eliminasen de un modo
acorde con su cultura.
Un caso relacionado se produjo con personas de las Naciones
Originarias de Canadá. Los investigadores recogieron muestras
genéticas para estudiar la artritis en 2006 y los sujetos después
solicitaron que se les devolviesen las muestras, basándose en
creencias culturales (Brief e Illes, 2010).
Algunas de las cuestiones no resueltas en la investigación
genómica son la disociación o anonimización de los datos, los
sujetos que abandonan un estudio, la realización de estudios
adicionales con muestras que ya se han recogido, la devolución de
la información al sujeto de investigación (si es beneficiosa para el
sujeto) y la propiedad de las muestras. Existe la preocupación de
que, debido a su propia naturaleza, los datos genómicos no se
puedan anonimizar por completo (Terry, 2015). Los datos genéticos,
incluso cuando se ha eliminado la información identificadora según
lo estipulado (Gray y cols., 2017), pueden combinarse con

265
información de bases de datos de genealogía genética y otros datos
demográficos de acceso público para reidentificar al sujeto
(McEwen y cols., 2013).
El consentimiento amplio en la Common Rule revisada se
desarrolló para abordar algunos de estos problemas (DHHS, 2017a).
Cuando las personas permiten que sus muestras biológicas se
conserven para estudios futuros, el documento de consentimiento
amplio incluirá información sobre si los investigadores contactarán
con los individuos en caso de que la investigación revele un
problema de salud. La implementación del consentimiento amplio
probablemente aumentará la capacidad de los institutos de
investigación y de las universidades para realizar investigación
genómica. La valoración crítica de la investigación genómica a
partir de un informe de investigación incluye la comprensión de las
decisiones tomadas por los investigadores, el tipo de
consentimiento que se obtuvo y la discusión de los aspectos que
rodean a la protección de las personas frente al daño.

Uso de animales en investigación


Entre los sujetos potenciales para la investigación, se incluyen seres
humanos y sus genes, así como plantas, organismos criados en
laboratorio y modelos informáticos utilizando series de datos
existentes. Si es posible, la mayoría de los investigadores prefieren
utilizar sujetos no animales, porque suelen ser más baratos. Sin
embargo, durante décadas los animales se han utilizado en la
realización de investigación biomédica y bioconductual, y han
contribuido de forma significativa a nuestra compresión de los
procesos patológicos. Debido a que los animales se consideran
sujetos valiosos para proyectos de investigación seleccionados, se
debe abordar la cuestión de su trato humano.
Los estudios han indicado que los animales experimentan una
variedad más amplia de daño, incluido el miedo y el dolor, de lo
que se pensaba previamente (Ferdowsian, 2011). Como resultado,
algunos grupos en defensa de los derechos animales se han
empoderado para convertirse en fuertes defensores en la protección
de sujetos de investigación animal. Muchos científicos, sobre todo
médicos, creen que los extremistas del movimiento de defensa de

266
los derechos animales podrían amenazar el futuro de la
investigación sanitaria. El objetivo de estos grupos es despertar la
conciencia de los investigadores y de la sociedad para garantizar
que los animales se utilizan con prudencia y que se tratan de forma
humana durante la realización de las investigaciones. En respuesta
a esto, los expertos en ética han ampliado la aplicación de los
principios éticos al uso de animales en los estudios (Beauchamp,
Ferdowsian y Gluck, 2014).
Debido a que cada vez más profesionales de enfermería están
realizando investigaciones con animales, la ética de estos estudios
se debe valorar de forma crítica. Una cuestión importante que debe
abordarse es determinar qué mecanismos garantizaron que los
animales recibieran un trato humano en la realización del estudio.
La Office of Laboratory Animal Welfare (OLAW), que pertenece a
los NIH, actúa como organismo federal de cumplimiento para este
tipo de investigación (DHHS, 2017c). La OLAW colabora con
instituciones que han recibido financiación federal para
investigaciones que implican a animales de laboratorio. Recibir la
financiación depende de que la institución obtenga una garantía,
que requiere que las políticas de la institución referentes al
bienestar de los animales de laboratorio cumplan o superen la
política de los Public Health Services (PHS) (DHHS, 2015).
Las declaraciones de garantía de las instituciones sobre el
cumplimiento de la política de los PHS respecto al uso de animales
de laboratorio han promovido el cuidado y trato humanos de los
animales en la investigación. Además, casi 1.000 instituciones han
solicitado voluntariamente y obtenido la acreditación de la
American Association for Accreditation of Laboratory Animal Care
International (AAALAC). La asociación se desarrolló para
garantizar el trato humano de los animales en investigación
(AAALAC, 2017). Cuando se realiza una investigación, cada
investigador debe seleccionar cuidadosamente el tipo de
participante necesario; si se van a utilizar animales en un estudio,
requieren un trato humano. Cuando se valoran de forma crítica los
estudios, hay que comprobar que los animales fuesen los sujetos
apropiados para el estudio y que recibieron un trato humano
durante su realización.

267
Mala praxis investigadora
El objetivo de la investigación es generar conocimientos científicos
sólidos, lo que solo es posible mediante la realización, la
elaboración de informes y la publicación de los estudios de forma
honesta. Sin embargo, desde la década de 1980, se han realizado y
publicado en prestigiosas revistas científicas varios estudios
fraudulentos. En respuesta a ello, se creó la Office of Research
Integrity (ORI) en el seno del gobierno federal.
La ORI, que forma parte del DHSS, es responsable de definir los
términos importantes utilizados en la identificación y gestión de la
mala praxis investigadora. La mala praxis investigadora se define
como la «fabricación, falsificación o plagio al elaborar, realizar o
revisar la investigación, o al presentar los resultados de la
investigación. No incluye los errores sin mala fe ni diferencias
honestas de opinión» (ORI, 2016b). La mala praxis investigadora es
un acto intencionado que implica una desviación significativa de la
práctica aceptable de la comunidad científica para mantener la
integridad del registro de investigación. Antes de que se tomen
medidas, la acusación se debe confirmar por una preponderancia
de la evidencia. La fabricación de datos en la investigación es la
elaboración de resultados y el registro o la divulgación de estos. La
falsificación de la investigación es la manipulación de los
materiales, el equipo o los procesos de investigación, o la
modificación o la omisión de los datos o los resultados, de forma
que la investigación no se representa con precisión en el registro. El
plagio es la apropiación de las ideas, los métodos, los resultados o
las palabras de otra persona sin darle el crédito apropiado, y
comprende los obtenidos mediante la revisión confidencial de
propuestas de investigación y manuscritos de otros. Se puede
encontrar más información sobre cómo evitar y abordar la mala
praxis investigadora en el sitio web de la ORI (2017;
https://ori.hhs.gov/).
Un ejemplo de mala praxis investigadora es el trabajo de
Meredyth M. Forbes, una estudiante de doctorado que realizó
estudios para comprender la reproducción celular financiados por
cinco subvenciones de los NIH. La investigadora admitió haber
falsificado o fabricado datos que se incluyeron en al menos seis
publicaciones y en ocho presentaciones en conferencias (ORI,

268
2016a). Aceptó que se la excluyese para siempre de proyectos
federales en el futuro. Para tratar de salvar la utilidad de la
investigación, sus coinvestigadores han repetido los experimentos
para obtener datos precisos, producir resultados fiables y corregir
los artículos revisados que ya se habían publicado.
Los siete casos de mala praxis investigadora descritos por la ORI
en 2016 correspondieron a estudios celulares en laboratorios. Los
investigadores de enfermería raras veces intervienen en estos
estudios. Sin embargo, la mala praxis investigadora también se
produce en la profesión de enfermería (Fierz y cols., 2014; Ward-
Smith, 2016). Habermann, Broome, Pryor y Ziner (2010) realizaron
un estudio sobre las experiencias de coordinadores de investigación
con la mala praxis científica y la integridad de la investigación, y
observaron que los coordinadores de investigación a menudo se
enteraban de la mala praxis de primera mano y el investigador
principal solía identificarse como la parte responsable. Estos
autores observaron cinco categorías principales de mala praxis:
«violaciones del protocolo, violaciones del consentimiento,
fabricación, falsificación y conflicto de intereses económico»
(Habermann y cols., 2010, pág. 51). Indicaron que podría ser
necesario extender la definición de mala praxis más allá de la
fabricación, la falsificación y el plagio.
La mala praxis investigadora ha provocado la retirada de
artículos en revistas de enfermería. Un ejemplo es el artículo
publicado por Lewis (2013), sobre el aprendizaje intraprofesional,
que fue retirado. Los datos publicados el año previo por Lewis se
habían usado sin la aprobación ni el conocimiento del equipo de
investigación. Keith (2015) publicó en Retraction Watch que se
habían retirado tres artículos publicados en revistas de enfermería,
escritos por un investigador internacional. En cada caso, el
investigador había publicado dos artículos en los que describía el
mismo estudio, sin reconocer que el estudio ya se había publicado.
La ORI informó de que otro enfermero, Scott Weber, fue encontrado
culpable de mala praxis investigadora. Se descubrió que había
plagiado porciones significativas de artículos publicados, incluido
el uso de datos de estudios previos en las gráficas y en sus
publicaciones (DHHS, 2011). También modificó los años de algunos
artículos citados en sus listas de referencias para evitar la detección

269
del plagio. Por fortuna, estos profesionales de enfermería
representan un porcentaje muy pequeño de los investigadores y
autores de enfermería. La mayoría de los investigadores de
enfermería tienen un compromiso firme para mantener la
integridad de la evidencia que producen.

PUNTOS CLAVE
• Cuatro proyectos experimentales han recibido una gran
atención pública por su trato no ético de sujetos humanos:
los experimentos médicos nazis, el estudio sobre la sífilis de
Tuskegee, el estudio de Willowbrook y el estudio del Jewish
Chronic Disease Hospital.
• Dos documentos históricos, el Código de Núremberg y la
Declaración de Helsinki, han tenido un fuerte impacto en el
desarrollo de la investigación.
• Los principios del respeto por las personas, la beneficencia y
la justicia son los estándares para la protección de los
derechos humanos.
• Los derechos humanos que requieren protección en la
investigación son los derechos a: 1) la autodeterminación; 2)
la privacidad; 3) el anonimato y la confidencialidad; 4) la
selección y el trato justos, y 5) la protección frente a las
molestias y los daños.
• Las normas de la DHHS (2017a) se han revisado con el
propósito de seguir fomentando la conducta ética en
investigación, evitar la duplicación de los esfuerzos de los
CRI y garantizar la inteligibilidad de los documentos de
consentimiento informado.
• El consentimiento informado implica la divulgación de la
información esencial del estudio, la comprensión de esa
información por un sujeto competente y la aceptación
voluntaria para participar.
• Un CRI consiste en una comisión de expertos que analizan
las cuestiones éticas de los estudios con tres niveles de
revisión: exenta, expedita y completa.
• El grado de cualquier riesgo de daño y molestias, así como

270
la vulnerabilidad de la muestra propuesta determinarán el
nivel de revisión del CRI que se requiere, ya sea
investigación exenta, revisión expedita o revisión completa
por el comité.
• La investigación genómica implica unos desafíos éticos
específicos debido a la posibilidad de que el sujeto se pueda
identificar por los datos, la capacidad de almacenar
muestras biológicas para estudios futuros y la notificación a
los sujetos cuando estudios futuros identifiquen variaciones
genéticas relacionadas con enfermedades latentes.
• Los animales son importantes para la realización de ciertos
estudios y deben tratarse de forma humana durante el
estudio.
• La mala praxis investigadora es un problema ético grave
que incluye el plagio, la falsificación y la fabricación de
datos, así como las publicación duplicada.

BIBLIOGRAFÍA
American Association for Accreditation of Laboratory Animal Care
International (AAALAC International). About AAALAC.
Consultada el 18 de marzo de 2017, en
https://aaalac.org/about/index.cfm, 2017.

American Nurses Association (ANA). Code of ethics for nurses with


interpretive statements. Washington, D.C.: Author; 2015.

Antal, H., Bunnell, H., McCahan, S., Pennington, C., Wysocki, T.,
Blake, K. A cognitive approach for design of a multimedia informed
consent video and website in pediatric research. Journal of Biomedical
Informatics. 2017; 66:248–258.

Banner, D., Zimmer, L. Informed consent in research: An overview


for nurses. Canadian Journal of Cardiovascular Nursing. 2012; 22(1):26–
30.

271
Beauchamp, T., Ferdowsian, H., Gluck, J. Rethinking the ethics of
research involving nonhuman animals: An introduction. Theoretical
Medicine and Bioethics. 2014; 35(2):91–96.

Beecher, H. K. Ethics and clinical research. New England Journal of


Medicine. 1966; 274(24):1354–1360.

Berger, R. L. Nazi science: The Dachau hypothermia experiments.


New England Journal of Medicine. 1990; 322(20):1435–1440.

Bledsoe, M., Grizzle, W. Use of human specimens in research: The


evolving United States regulatory, policy, and scientific landscape.
Diagnostic Histopathology. 2013; 15(9):322–330.

Bourgeosis, F., Hwang, T. The Pediatric Research Equity Act moves


into adolescence. Journal of the American Medication Association. 2017;
317(3):259–260.

Boynton, M., Portnoy, D., Johnson, B. Exploring the ethics and


psychological impact of deception in psychological research. IRB:
Ethics & Human Research. 2013; 35(2):7–13.

Brandt, A. M. Racism and research: The case of the Tuskegee


syphilis study. Hastings Center Report. 1978; 8(6):21–29.

Brief, E., Illes, J. Tangles of neurogenetics, neuroethics, and culture.


Neuron. 2010; 68(2):174–177.

Caplan, A., Moreno, J. The Havasu ‘Baaja tribe and informed


consent. The Lancet. 2011; 377(9766):621–622.

Cricco-Lizza, R. Infant feeding beliefs and day-to-day feeding


practices of NICU nurses. Journal of Pediatric Nursing. 2016; 31:e91–
e98.

272
Doody, O., Noonan, M. Nursing research ethics, guidance and
application in practice. British Journal of Nursing. 2016; 28(25):803–
807.

Eastwood, G. Ethical issues in gastroenterology research. Journal of


Gasteroenterology and Hepatology. 2015; 30(S1):8–11.

Farmer, L., Lundy, A. Informed consent: Legal and ethical


considerations for advanced practice nurses. Journal of Nurse
Practitioners. 2017; 13(2):124–130.

Ferdowsian, H. Human and animal research guidelines: Aligning


ethical constructs with new scientific developments. Bioethics. 2011;
25(8):472–478.

Fierz, K., Gennaro, S., Dierickx, K., Van Achterberg, T., Morin, K.,
De Geest, S., Scientific misconduct: Also an issue for nursing
science? Journal of Nursing Scholarship 46 4 2014:271–280

Fredstrom, B. K., Adams, R. E., Gilman, R. Electronic and school-


based victimization: Unique contexts for adjustment difficulties
during adolescence. Journal of Youth and Adolescence. 2011; 40(4):405–
415.

Fry, S. T., Veatch, R. M., Taylor, C. Case studies in nursing ethics, 4th
ed. Sudbury, MA: Jones & Bartlett Learning; 2011.

Grady, C. Institutional review boards: Purposes and challenges.


Chest. 2015; 148(5):1148–1155.

Gray, J. R., Grove, S. K., Sutherland, S. The practice of nursing


research: Appraisal, synthesis, and generation of evidence, 8th ed. St.
Louis, MO: Elsevier Saunders; 2017.

273
Habermann, B., Broome, M., Pryor, E. R., Ziner, K. W. Research
coordinators’ experiences with scientific misconduct and research
integrity. Nursing Research. 2010; 59(1):51–57.

Halkoaho, A., Pietila, A.-M., Ebbesen, M., Karki, S., Kangasniemi,


M. Cultural aspects related to informed consent in health research:
A systematic review. Nursing Ethics. 2016; 23(6):698–712.

Health Insurance Portability and Accountability Act of 1996. Pub. L.


No. 104.191, 110 Stat. 1936 (2003). Consultada el 8 de abril de 2017,
en https://www.gpo.gov/fdsys/pkg/PLAW-104publ191/content-
detail.html.

Hershey, N., Miller, R. D. Human experimentation and the law.


Rockville, MD: Aspen; 1976.

Janvier, A., Farlow, B. The ethics of neonatal research: An ethicist’s


and a parent’s perspective. Seminars in Fetal & Neonatal Medicine.
2015; 20(6):436–441.

Jones, H. W. Record of the first physician to see Henrietta Lacks at


the Johns Hopkins Hospital: History of the HeLa cell line. American
Journal of Obstetrics and Gynecology. 1997; 176(6):s227–s228.

Keith, R., Investigation ups nursing researcher’s retraction count to


3. Retraction Watch 2015; Consultada el 18 de marzo de 2017, en.
http://retractionwatch.com/2015/09/23/3rd-retraction-for-nursing-
researcher-after-investigation-finds-overlap

Kids v Cancer. RACE for Children Act. Consultada el 16 de marzo


de 2017, en http://www.kidsvcancer.org/race-for-children-act/, 2017.

Levine, R. J. Ethics and regulation of clinical research, 2nd ed.

274
Baltimore, MD: Urban & Schwarzenberg; 1986.

Lewis, R. Retraction notice to interprofessional learning in acute


care: Developing a theoretical framework. Nursing Education Today.
2013; 33(8):931.

Marshall, C., Rossman, G. Designing qualitative research, 6th ed.


Thousand Oaks, CA: Sage; 2016.

McEwen, J., Boyer, J., Sun, K. Evolving approaches to the ethical


management of genomic data. Trends in Genetics. 2013; 29(6):375–
382.

Menikoff, J., Kaneshiro, J., Pritchard, I. The Common Rule updated.


The New England Journal of Medicine. 2017; 376(7):613–615.

Milgram, S. Behavioral study of obedience. Journal of Abnormal and


Social Psychology. 1963; 67(4):371–378.

Munhall, P. L. Ethical considerations in qualitative research. In:


Munhall P.L., ed. Nursing research: A qualitative perspective. 5th ed.
Sudbury, MA: Jones & Bartlett Learning; 2012:491–502.

National Commission for the Protection of Human Subjects of


Biomedical and Behavioral Research, Belmont Report: Ethical
principles and guidelines for research involving human subjects.
U.S. Government Printing Office, Washington, D.C., 1979. DHEW
Publication No. (05) 78-0012. Consultada el 25 de febrero de 2017,
en. https://www.hhs.gov/ohrp/regulations-and-policy/belmont-
report/

National Research Council, Guide to the care of and use of


laboratory animals. National Academies Press, Washington, D.C.,

275
2011. Consultada el 18 de marzo de 2017, en.
https://grants.nih.gov/grants/olaw/Guide-for-the-Care-and-Use-of-
Laboratory-Animals.pdf

Ness, E., Royce, C. Clinical trials and the role of the oncology
clinical trials nurse. Nursing Clinics of North America. 2017;
52(2):133–148.

Office of NIH History, National Institute of Health, Trials of war


criminals before the Nuremberg Military Tribunals Control Council
Law No. 10 Vol. 2. U.S. Government Printing Office, Washington,
D.C., 1949. 181–182 Consultada el 25 de febrero de 2017, en.
https://history.nih.gov/research/downloads/nuremberg.pdf

Office of Research Integrity (ORI). Case summary: Forbes,


Meredyth M. Consultada el 18 de 2017, en
https://ori.hhs.gov/content/case-summary-forbes-meredyth-m,
2016.

Office of Research Integrity (ORI). Frequently asked questions.


Consultada el 18 de marzo de 2017, en
https://ori.hhs.gov/content/frequently-asked-questions#5, 2016.

Office of Research Integrity (ORI), Home page Consultada el 18 de


marzo de 2017, en. https://ori.hhs.gov/. https://ori.hhs.gov, 2017

Oulton, K., Gibson, F., Sell, D., Williams, A., Pratt, L., Wray, J.
Assent for children’s participation in research: Why it matters and
making it meaningful. Child: Care, Health and Development. 2016;
42(4):588–592.

Pediatric Research Equity Act (PREA) of 2003. Title 21. U.S.C. §§


355. Consultada el 8 de abril de 2017, en

276
https://www.fda.gov/downloads/Drugs/DevelopmentApprovalProcess/Develo

Resnik, D. Some reflections on evaluating institutional review


board effectiveness. Contemporary Clinical Trials. 2015; 45(Part
B):261–264.

Reynolds, P. D. Ethical dilemmas and social science research. San


Francisco, CA: Jossey-Bass; 1979.

Roberts, L., Jadalla, A., Jones-Oyefeso, V., Winslow, B., Taylor, E.


Researching in collectivist cultures: Reflections and
recommendations. Journal of Transcultural Nursing. 2017; 28(2):137–
143.

Rothman, D. J. Were Tuskegee and Willowbrook “studies in


nature?”. Hastings Center Report. 1982; 12(2):5–7.

Skloot, R. The immortal life of Henrietta Lacks. New York, NY: Crown
Publishers; 2010.

Steinfels, P., Levine, C. Biomedical ethics and the shadow of


Nazism. Hastings Center Report. 1976; 6(4):1–20.

Terry, N. Developments in genetic and epigenetic data protection in


behavioral and mental health spaces. Behavioral Sciences & Law.
2015; 33(5):653–661.

Trimble, D., Nava, A., McFarlane, J. Intimate partner violence and


antiretroviral adherence among women receiving care in an urban
Southeastern Texas HIV clinic. Journal of Nurses in AIDS Care. 2013;
24(4):331–340.

US Department of Health and Human Services (DHHS). About the


Office of Human Research Protection. (n.d.) Consultada el 13 de

277
marzo de 2017, en https://www.hhs.gov/ohrp/regulations-and-
policy/index.html.

US Department of Health and Human services (DHHS). Findings of


research misconduct: Scott Weber. Consultada el 2 de septiembre
de 2017, en https://grants.nih.gov/grants/guide/notice-files/NOT-
OD-12-002.html, 2011.

US Department of Health and Human Services (DHHS), National


Institutes of Health. Public Health Service Policy on the Humane
Care and Use of Laboratory Animals. Consultada el 18 de marzo de
2017, en
https://grants.nih.gov/grants/olaw/references/PHSPolicyLabAnimals.pdf
2015.

US Department of Health and Human Services (DHHS). Final


revisions to the Common Rule: Protection of human subjects. Code
of Federal Regulations, Title 45, Part 46. Consultada el 11 de marzo
de 2017, en https://www.hhs.gov/ohrp/regulations-and-
policy/regulations/finalized-revisions-common-rule/index.html,
2017.

US Department of Health and Human Services (DHHS). Guidance


regarding methods for de-identification of protected health
information in accordance with the Health Insurance Portability
and Accountability Act (HIPAA) Privacy Rule. Consultada el 5 de
marzo de 2017, en https://www.hhs.gov/hipaa/for-
professionals/privacy/special-topics/de-identification, 2017.

US Department of Health and Human Services (US DHHS). Office


of Laboratory Animal Welfare (OLAW). Consultada el 2 de
septiembre de 2017, en

278
https://grants.nih.gov/aboutoer/oer_offices/olaw.htm, 2017.

US Food and Drug Administration (FDA). FDA fundamentals.


Consultada el 5 de marzo de 2017, en
https://www.fda.gov/AboutFDA/Transparency/Basics/ucm192695.htm
2015.

Ward-Smith, P. Evidence-based nursing: When the evidence is


fraudulent. Urologic Nursing. 2016; 36(2):98–99.

Weijer, C. The ethical analysis of risk. Journal of Law, Medicine, &


Ethics. 2000; 28(4):344–361.

Williams, S., Turner-Henson, A., Langhinrichsen-Rohling, J.,


Azuero, A. Depressive symptoms in 9th graders: Stress and
physiological contributors. Applied Nursing Research. 2017; 34(4):24–
28.

World Medical Association (WMA), World Medical Association


Declaration of Helsinki: Ethical principles for medical research
involving human subjects. Journal of the American Medical Association
310 20 2013:2191–2194 Consultada el 5 de febrero de 2018, en.
https://www.wma.net/wp-content/uploads/2016/11/DoH-Oct2013-
JAMA.pdf

279
CAPÍTULO 5

Evaluación de los
problemas, los
propósitos y las
hipótesis de
investigación
Susan K. Grove

La página web de la National Guideline Clearinghouse de la Agency for


Healthcare Research and Quality (AHRQ) se cerró en 2018. Puede
consultarse más información en https://www.ahrq.gov/.

ÍNDICE DEL CAPÍTULO

¿Cuáles son los problemas y propósitos de la


investigación?, 120
Identificación del problema y del propósito en estudios
cuantitativos y cualitativos, 122

280
Determinación de la relevancia del problema y del
propósito de un estudio, 127
Análisis de la viabilidad del problema y del propósito de
un estudio, 130
Análisis de los objetivos, preguntas e hipótesis de la
investigación en los informes de investigación, 132
Comprensión de las variables del estudio y de los
conceptos de investigación, 140
Puntos clave, 146
Bibliografía, 147

OBJETIVOS DE APRENDIZAJE
Tras concluir este capítulo, el lector debería ser capaz de:
1. Identificar los temas, problemas y propósitos de investigación
en los estudios cuantitativos y cualitativos publicados.
2. Valorar de forma crítica los problemas y propósitos de
investigación en los estudios.
3. Valorar de forma crítica la viabilidad del problema y el
propósito de un estudio.
4. Diferenciar entre los tipos de hipótesis (asociativa o causal,
simple o compleja, no direccional o direccional y estadística o
de investigación).
5. Valorar de forma crítica la calidad de los objetivos, las
preguntas y las hipótesis de los estudios.
6. Diferenciar los tipos de variables incluidas en los informes de
investigación.
7. Valorar de forma crítica la definición conceptual y operacional
de las variables en los estudios.

Constantemente nos hacemos preguntas para lograr entendernos

281
mejor a nosotros mismos y el mundo que nos rodea. Esta capacidad
humana de querer saber y hacerse preguntas creativas es el primer
paso en el proceso de investigación. Al plantear preguntas, el
personal de enfermería asistencial, los investigadores y los
educadores son capaces de identificar temas y problemas de
investigación significativos que orienten la generación de
evidencias de investigación para la práctica. El tema de
investigación es un concepto o un área de interés amplia que es
importante en enfermería, como el dolor agudo, el tratamiento del
dolor crónico, el afrontamiento de la enfermedad y el fomento de la
salud. Cada tema contiene numerosos problemas de investigación
que podrían examinarse mediante estudios cuantitativos y
cualitativos. Por ejemplo, el tratamiento del dolor crónico es un
tema de investigación que abarca problemas como «¿Cómo se vive
con dolor crónico?» y «¿Qué estrategias son útiles para afrontar el
dolor crónico?». Para investigar estos problemas o áreas de interés
en enfermería, se han realizado diversos tipos de estudios
cualitativos (Creswell y Poth, 2018). Se han llevado a cabo estudios
cuantitativos para abordar problemas como «¿Cuál es una forma
exacta y concisa para valorar el dolor crónico?» y «¿Qué
intervenciones son eficaces para tratar el dolor crónico?».
El problema proporciona la base para desarrollar el propósito de
la investigación. El propósito es la meta o foco de un estudio que
orienta el desarrollo de los objetivos, preguntas o hipótesis que
centran aún más la intención del estudio (fig. 5.1). Los objetivos,
preguntas e hipótesis se pueden desarrollar para acortar distancias
entre el problema y el propósito, establecidos de forma más
abstracta, y el diseño detallado para realizar el estudio. Sin
embargo, muchos estudios no incluyen los objetivos, preguntas o
hipótesis, y se guían por el problema y propósito del estudio. El
propósito, objetivos, preguntas e hipótesis del estudio incluyen las
variables, las relaciones entre estas y, a menudo, la población que se
debe estudiar. En la investigación cualitativa, el propósito y, a
veces, preguntas u objetivos de investigación amplios guían el
estudio de los conceptos de investigación seleccionados.

282
FIG 5.1 Relación entre el problema, el propósito, los
objetivos, las preguntas o las hipótesis de
investigación.

Este capítulo incluye contenido que ayudará a identificar los


problemas y propósitos de una serie de estudios cuantitativos y
cualitativos. Se explican los objetivos, preguntas e hipótesis, y se
presentan los diferentes tipos de variables de estudio. También se
presentan las directrices que ayudarán en la valoración crítica de los
problemas, propósitos, objetivos, preguntas, hipótesis y variables o
conceptos de los estudios cuantitativos y cualitativos publicados.

¿CUÁLES SON LOS PROBLEMAS Y


PROPÓSITOS DE LA
INVESTIGACIÓN?
Un problema de investigación es un área de interés en la que existe
una laguna en el conocimiento necesario para la práctica de
enfermería. Se requiere investigación para generar los
conocimientos esenciales que aborden el problema de la práctica
con el fin último de proporcionar cuidados de enfermería basados
en la evidencia (Brown, 2018; Melnyk y Fineout-Overholt, 2015). El
problema de investigación en un estudio 1) indica la relevancia del
problema, 2) proporciona los antecedentes del problema y 3)
incluye una declaración del problema (cuadro 5.1). La relevancia de
un problema de investigación indica la importancia del problema
para la enfermería y los cuidados sanitarios y para la salud de los
individuos, las familias y las comunidades. Los antecedentes de un
problema identifican brevemente lo que sabemos acerca de esa área
de interés y la declaración del problema identifica la laguna
específica en el conocimiento necesario para la práctica. No todos
los estudios publicados incluyen un problema expresado
claramente, pero suele poder identificarse en la primera página del

283
informe.

CUADRO 5.1 ELEMENTOS DEL PROBLEMA DE


INVESTIGACIÓN

• Relevancia: importancia del problema para la enfermería y la


asistencia sanitaria.
• Antecedentes: conocimiento clave que se conoce de
investigaciones anteriores.
• Declaración del problema: laguna identificada en los
conocimientos necesarios para la práctica.

El propósito de la investigación es una declaración clara y


concisa del objetivo general o del foco específico del estudio. En los
estudios cuantitativos, el propósito del estudio podría ser
identificar y describir las variables o examinar las relaciones en una
situación, determinar la eficacia de una intervención o determinar
los resultados de la asistencia sanitaria (Shadish, Cook y Campbell,
2002). En los estudios cualitativos, el propósito podría ser describir
las percepciones de un fenómeno y darle significado, desarrollar
una teoría sobre una situación o problema sanitario, analizar los
conceptos y problemas relevantes en enfermería, o describir los
aspectos de una cultura (Creswell y Poth, 2018). El propósito
incluye las variables o conceptos, la población y a menudo el
entorno o ámbito del estudio. Un propósito de investigación
claramente establecido puede capturar la esencia de un estudio en
una única frase y es esencial para dirigir los pasos restantes del
proceso de investigación. En un informe de investigación, el
propósito suele identificarse y a menudo sigue a la declaración del
problema (v. fig. 5.1). Las guías para la valoración crítica de los
problemas y propósitos en los estudios se presentan a continuación.

GUÍAS DE VALORACIÓN CRÍTICA


Problemas y propósitos en los estudios

284
1. ¿El problema se expresa concisa y claramente de forma
precoz en el estudio?
2. ¿El problema incluye su relevancia, sus antecedentes y su
declaración (v. cuadro 5.1)?
3. ¿El propósito expresa claramente el objetivo general o meta
del estudio?
4. ¿El propósito está enfocado en la declaración del problema
que se debe estudiar?
5. ¿Están identificadas las variables y la población de estudio en
el propósito?

El problema y el propósito de investigación del estudio de Ruiz-


González y cols. (2016, pág. 13) sobre «los efectos a largo plazo de
un programa educativo intensivo-práctico sobre la diabetes en la
HbA1c y el autocuidado» se presentan en el Ejemplo de
investigación 5.1. Este ejemplo se valora de forma crítica usando las
guías identificadas.

EJEMPLO DE INVESTIGACIÓN 5.1


Problema y propósito de un estudio
cuantitativo
Extracto del estudio de investigación
Relevancia del problema

La diabetes mellitus es una enfermedad que afecta a 246 millones de


personas en todo el mundo (Steinsbekk, Rygg, Lisulo, Rise y
Fretheim, 2012) y tiene una prevalencia elevada en la población
española… Según la Organización Mundial de la Salud, un control
adecuado de la enfermedad requiere obligatoriamente educar a los
pacientes y desarrollar sus habilidades para manejar su tratamiento
y prevenir las complicaciones. (Ruiz-González y cols., 2016, pág.
13)

Antecedentes del problema

285
La educación se logra mediante programas educativos sobre diabetes
(PED)… Los PED están disponibles en varios formatos y tipos… y
se ha demostrado ampliamente su utilidad para mejorar los
parámetros biológicos, psicosociales y conductuales (Steinsbekk y
cols., 2012). Los metaanálisis recientes de estudios controlados
(Hopkins y cols., 2012)… han demostrado mejorías que oscilan
entre el 0,52% y el 0,81% en la concentración de hemoglobina
(HbA1c)… y también han demostrado una mejoría considerable en
otras áreas como la autoeficacia y el conocimiento. (Ruiz-González
y cols., 2016, pág. 13)

Declaración del problema

A pesar de que hay muchas variables importantes en educación y es


importante considerar el perfil del paciente…, pocos estudios las
han incluido en el mismo PED o han evaluado sus efectos a largo
plazo. Además, la eficacia de los PED debería determinarse por su
influencia sobre variables tanto biomédicas como psicosociales.
(Ruiz-González y cols., 2016, pág. 14)

Propósito de la investigación

El propósito de este estudio fue implementar un PED intensivo y


práctico, y evaluar sus efectos a largo plazo y su impacto sobre las
variables psicosociales. (Ruiz-González y cols., 2016, pág. 13)

Valoración crítica
Problema de investigación
Ruiz-González y cols. (2016) presentaron un problema de
investigación claro y conciso con las áreas importantes de 1)
relevancia, 2) antecedentes y 3) declaración del problema. La
diabetes es una enfermedad crónica compleja e importante que
requiere unos conocimientos extensos para tratarla de un modo
eficaz. Se mostraron de forma clara los antecedentes del problema
al citar los hallazgos de dos metaanálisis (Hopkins y cols., 2012;
Steinsbekk y cols., 2012) que resumían los estudios centrados en la
eficacia de los PED sobre el manejo de la diabetes tipo 1 y tipo 2. La

286
discusión del problema concluyó con una declaración concisa del
mismo que indicaba la laguna en los conocimientos necesarios para
la práctica y proporcionó una base para el propósito del estudio.
Propósito de la investigación
El propósito de la investigación suele reflejarse en el título del
estudio, se declara en el resumen y se reafirma en la revisión de la
bibliografía. Ruiz-González y cols. (2016) incluyeron el propósito
de su estudio en los tres apartados. Sin embargo, las declaraciones
del propósito en el artículo eran diversas, lo que puede resultar
confuso a los lectores. Los investigadores identificaron claramente
la intervención del PED (variable independiente) que se
implementó para determinar sus efectos a largo plazo sobre las
variables psicosociales (variables dependientes). El propósito
habría sido más completo si hubiese incluido las variables
dependientes biomédicas y la población estudiada, que
correspondía a adultos con diabetes tipo 1.
Ruiz-González y cols. (2016) observaron que la intervención con
PED era eficaz para mejorar las variables biomédicas y
psicológicas, pero se necesitan más estrategias psicológicas en esta
intervención para motivar a los adultos a realizar verdaderos
cambios del estilo de vida. Este tipo de estudios respalda la
competencia previa a la acreditación para ejercer de la Quality and
Safety Education for Nurses (QSEN, 2017; Sherwood y Barnsteiner,
2017) para garantizar la seguridad, la calidad y la rentabilidad de la
atención sanitaria basada en la investigación que implique
activamente a los pacientes y las familias en su proceso de
cuidados.

IDENTIFICACIÓN DEL PROBLEMA Y


DEL PROPÓSITO EN ESTUDIOS
CUANTITATIVOS Y CUALITATIVOS
Los métodos de investigación cuantitativos y cualitativos permiten
al personal de enfermería estudiar diversos problemas y propósitos
de investigación. En esta sección, se presentan ejemplos de
problemas y propósitos de investigación para diferentes tipos de

287
estudios cuantitativos y cualitativos.

Problemas y propósitos en los tipos de


estudios cuantitativos
En la tabla 5.1 se muestran ejemplos de problemas y propósitos de
investigación para los diferentes tipos de investigación cuantitativa
(descriptiva, de correlación, cuasiexperimental y experimental). Si
se conoce poco acerca de un tema, los investigadores suelen
comenzar con estudios descriptivos y de correlación, tras lo que
progresan a estudios cuasiexperimentales y experimentales a
medida que se amplía el conocimiento en un área. El examen de los
problemas y propósitos de la tabla 5.1 revelará las diferencias y
similitudes entre los tipos de investigación cuantitativa. El
propósito de la investigación suele reflejar el tipo de estudio que se
realizó (Gray, Grove y Sutherland, 2017). El propósito de la
investigación descriptiva es identificar y describir conceptos o
variables, identificar posibles relaciones entre las variables y
delimitar las diferencias entre los grupos existentes, como mujeres y
hombres o distintos grupos étnicos.

TABLA 5.1
TEMAS, PROBLEMAS Y PROPÓSITOS DE LA
INVESTIGACIÓN CUANTITATIVA

288
Buet y cols. (2013) realizaron un estudio descriptivo con el fin de
identificar las ocasiones para la higiene de manos (HM) y la
adherencia a la HM entre los cuidadores clínicos y no clínicos en
centros de cuidados prolongados pediátricos. Estos investigadores
siguieron los «Cinco momentos para la higiene de manos» de la

289
Organización Mundial de la Salud (OMS, 2009): antes de tocar a un
paciente, antes de técnicas limpias o asépticas, después de la
exposición o riesgo de exposición a fluidos corporales, después de
tocar a un paciente y después de tocar el entorno de un paciente.
Los investigadores observaron que las ocasiones para la HM eran
numerosas para los cuidadores clínicos y no clínicos, pero que la
adherencia a la HM era baja, sobre todo para individuos no clínicos.
Se deben seguir las guías basadas en la evidencia de HM para
prevenir las infecciones asociadas a la asistencia sanitaria.
El propósito de la investigación de correlación es examinar el tipo
(positivo o negativo) y la fuerza de las relaciones o asociaciones
entre variables. Las relaciones positivas (designadas por un signo
más [+]) indican que las variables cambian en la misma dirección;
aumentan o disminuyen simultáneamente. Por ejemplo, cuantos
más cigarrillos fume un adulto cada día, mayor será su riesgo de
cáncer de pulmón. Las relaciones negativas (designadas por un
signo menos [−]) indican que las variables cambian en direcciones
opuestas; cuando una aumenta, la otra disminuye. Por ejemplo,
cuantos más minutos realice ejercicio un adulto de mediana edad a
la semana, menor será su IMC. La fuerza de las relaciones varía de
−1 a 0 a +1, de modo que −1 indica una relación negativa perfecta, 0
indica la ausencia de relación y +1 indica una relación positiva
perfecta entre las variables (Grove y Cipher, 2017). Los tipos de
relaciones se comentan con más detalle en la sección sobre
hipótesis.
de Cordova, Johansen, Martinez y Cimiotti (2017, pág. 20)
realizaron un estudio de correlación para determinar si «el ingreso
en fines de semana y vacaciones se asociaba con un aumento de la
mortalidad en SU (servicios de urgencias) entre los pacientes con
IM (infarto de miocardio)». Los investigadores identificaron con
claridad el problema y el propósito para este estudio (v. tabla 5.1).
de Cordova y cols. observaron que las presentaciones de los IM en
el SU en fines de semana y vacaciones se asociaban con una mayor
mortalidad, y se necesitan más investigaciones sobre los recursos de
los SU durante la semana, el fin de semana y las vacaciones para
promover una asistencia de calidad.
Los estudios cuasiexperimentales se realizan para determinar el
efecto de un tratamiento o variable independiente sobre variables

290
dependientes o de resultado designadas (Shadish y cols., 2002).
Rogers y cols. (2017) llevaron a cabo un estudio cuasiexperimental
para evaluar la eficacia de una intervención multicomponente con
las comidas familiares denominada Simple Suppers sobre la dieta y
el peso de niños de enseñanza primaria (4-10 años). El problema y
propósito de investigación para este estudio se presentan en la tabla
5.1. Los investigadores podrían haber proporcionado más detalles
sobre la relevancia y los antecedentes del problema en el artículo.
Sin embargo, presentaron en detalle la intervención Simple Suppers
y los resultados a medir. Rogers y cols. (2017) recomendaron la
realización de más investigaciones para determinar la eficacia de
esta intervención Simple Suppers desarrollada para familias
marginadas con niños en edad de escuela primaria.
Los estudios experimentales se realizan en entornos muy
controlados usando un diseño estructurado para determinar el
efecto de una o más variables independientes sobre una o más
variables dependientes (Gray y cols., 2017). Kaya y cols. (2017, pág.
11) realizaron un «estudio experimental aleatorizado y controlado
para determinar los efectos de los cuidados orales con glutamina en
la prevención de la neumonía asociada al ventilador (NAV) en
pacientes ingresados en una unidad de cuidados intensivos [UCI]
neuroquirúrgica en New Jersey». Los autores observaron que los
cuidados orales con glutamina no tenían un efecto significativo
sobre la incidencia de NAV en pacientes de UCI neuroquirúrgica.
Kaya y cols. (2017) retomaron la realización de investigaciones
adicionales con un tamaño muestral mayor durante un periodo de
tiempo más prolongado.

Problemas y propósitos en los distintos


tipos de estudios cualitativos
Los problemas formulados para la investigación cualitativa
identifican áreas de interés que requieren investigación con el fin de
obtener nuevos conocimientos, aumentar su entendimiento y
mejorar la comprensión del conjunto. El propósito de un estudio
cualitativo indica su foco de interés, que puede ser un concepto
como el dolor, un evento como la pérdida de un hijo, o una faceta
cultural como las prácticas curativas de una tribu americana nativa

291
específica. Además, el propósito a menudo indica el método
cualitativo usado para realizar el estudio (Creswell, 2014; Creswell
y Poth, 2018; Munhall, 2012). En la tabla 5.2, se presentan ejemplos
de problemas y propósitos de investigación para los tipos de
investigación cualitativa (fenomenológica, de teoría fundamentada,
exploratoria-descriptiva y etnográfica) que se encuentran
frecuentemente en la bibliografía de enfermería y que se incluyen
en este libro.

TABLA 5.2
TEMAS, PROBLEMAS Y PROPÓSITOS DE LA
INVESTIGACIÓN CUALITATIVA

292
SU, servicio de urgencias; SG, semanas de gestación.
La investigación fenomenológica se realiza para fomentar un
entendimiento más profundo de experiencias humanas complejas,
tal y como han sido vividas por los participantes del estudio
(Creswell y Poth, 2018). Gorlin, McAlpine, Garwick y Wieling
(2016) realizaron un estudio fenomenológico para evaluar las
experiencias de las familias que tenían un hijo con autismo grave. El

293
problema y propósito de investigación para este estudio se
desarrollaron con claridad en el artículo y se presentan en la tabla
5.2. Los hallazgos del estudio de Gorlin y cols. (2016, pág. 596)
«arrojaron luz sobre las considerables dificultades y desafíos de las
familias que tienen un hijo con autismo grave, identificaron los
recursos necesarios y pusieron de relieve el modo en el que las
familias constituían familias híbridas para obtener apoyo
adicional».
En la investigación de teoría fundamentada, el problema
identifica el área de interés y el propósito indica el foco de atención
de la teoría que se va a desarrollar para explicar el patrón de
conducta de los implicados en el estudio (Charmaz, 2014). Por
ejemplo, Quinn (2016, pág. 170) realizó «un estudio de teoría
fundamentada sobre el modo en el que las enfermeras integran el
embarazo y el trabajo a tiempo completo». El problema y el
propósito se indicaron con claridad en este estudio y se presentan
en la tabla 5.2. Quinn (2016, pág. 173) observó que «El proceso
social mediante el cual las enfermeras integran el trabajo a tiempo
completo y el embarazo consistía en convertirse en alguien
diferente. El análisis de los datos permitió identificar cuatro
categorías: tener un aspecto distinto y sentirse diferente,
expectativas mientras se esperaba, conectar de forma diferente y
transición laboral.
Varios investigadores están realizando investigación cualitativa
exploratoria-descriptiva para describir conceptos, cuestiones,
problemas de salud o situaciones únicas que carecen de una
descripción o definición clara. Kim, Sefcik y Bradway (2017)
llevaron a cabo una revisión sistemática para describir las
características de los estudios cualitativos exploratorios-
descriptivos, que suelen proporcionar la base para la investigación
cualitativa y cuantitativa futura. Arslanian-Engoren y Scott (2016)
realizaron un estudio cualitativo exploratorio-descriptivo sobre «las
percepciones de las mujeres de los sesgos y barreras en su
experiencia durante la clasificación de un infarto de miocardio
(IM)». El problema y propósito de investigación para este estudio se
presentaron con claridad en el informe de investigación (v. tabla
5.2). Estos investigadores observaron que las mujeres con un IM
percibieron múltiples barreras para su diagnóstico y tratamiento

294
precoz en un SU. Por tanto, Arslanian-Engoren y Scott (2016, pág.
171) recomendaron investigaciones para «evaluar las intervenciones
dirigidas a mejorar los procesos de prestación de asistencia, a
reducir las barreras y a facilitar el tratamiento precoz y preciso de
las mujeres con un IM agudo».
En la investigación etnográfica, el problema y el propósito
identifican la cultura y los atributos culturales específicos que se
van a examinar, describir, analizar e interpretar para determinar las
acciones sociales, creencias, valores y normas de la cultura
(Creswell y Poth, 2018). Flacking y Dykes (2017, pág. 1) llevaron a
cabo un estudio etnográfico sobre las «percepciones y experiencias
en los progenitores y el personal al utilizar una pezonera… en
unidades de neonatología». En la tabla 5.2, se incluye el problema y
el propósito de investigación desarrollados de forma concisa para
este estudio etnográfico. Los investigadores concluyeron que el uso
de una pezonera tenía aspectos tanto positivos como negativos. La
pezonera facilitó que el recién nacido prematuro se agarrase al
pecho y la calidad de la ingesta nutricional, pero supuso una
barrera a la relación entre la madre y el lactante durante la
lactancia. La pezonera suele considerarse una solución a corto plazo
y los profesionales de enfermería deben tener en cuenta las
necesidades particulares de la madre y del bebé.

DETERMINACIÓN DE LA
RELEVANCIA DEL PROBLEMA Y DEL
PROPÓSITO DE UN ESTUDIO
Un problema y propósito de investigación es significativo cuando
tiene el potencial de generar o mejorar los conocimientos relevantes
que influyen directa o indirectamente en el ejercicio de la
enfermería (Gray y cols., 2017). Cuando se valora de forma crítica la
relevancia del problema y el propósito en un estudio publicado, se
debe determinar si los investigadores establecieron una relación
clara sobre el modo en el que los hallazgos: 1) podrían haberse
aplicado en la práctica de enfermería, 2) ampliaron investigaciones
previas, 3) mejoraron la comprensión de un problema
desarrollando una teoría y/o 4) añadieron conocimiento a las

295
prioridades actuales de investigación en enfermería.

Aplicación a la práctica de enfermería


Los estudios centrados en la práctica son significativos porque
abordan cuestiones clínicas y generan hallazgos para su aplicación
a la práctica de enfermería. Además, los estudios con problemas de
investigación relevantes promueven resultados saludables para el
paciente y la familia, disminuyen la morbilidad y mortalidad y
reducen los costes asistenciales. El objetivo final es proporcionar
una práctica basada en la evidencia (PBE), en la que los cuidados de
enfermería se basen en las investigaciones más actuales (Melnyk,
Gallagher-Ford, Fineout-Overholt, 2017).
Varios estudios se han centrado en los efectos de las
intervenciones de enfermería o en las formas de mejorar estas
intervenciones. Por ejemplo, en el estudio de Ruiz-González y cols.
(2016) citado previamente, se implementó un PED para mejorar
variables biomédicas (p. ej., HbA1c) y psicosociales (p. ej.,
autocuidado) en adultos con diabetes tipo 1. Rogers y cols. (2017)
desarrollaron una intervención multicomponente con las comidas
familiares para mejorar las dietas y el peso de los niños, con el
objetivo de reducir la obesidad infantil. Los estudios centrados en la
intervención pueden generar un conocimiento significativo,
práctico y creíble que se puede aplicar a la asistencia al paciente
para promover una asistencia centrada en el paciente y la familia de
calidad y segura (Brown, 2018;Sherwood y Barnsteiner, 2017).

Ampliación de investigaciones previas


Para que el conocimiento avance, los investigadores diseñan sus
estudios basados en los hallazgos de investigaciones previas. En un
artículo de investigación, las secciones de introducción y revisión
de la bibliografía incluyen los estudios relevantes que sirven de
base para el estudio actual. A menudo, el resumen de la bibliografía
actual indica lo que se sabe y lo que no se sabe en el área que se está
estudiando (v. cap. 6). Las lagunas en la base del conocimiento
actual (declaración del problema) proporcionan un apoyo para el
propósito del estudio (v. fig. 5.1). Ruiz-González y cols. (2016)
basaron su estudio en hallazgos que indicaban que los PED eran

296
eficaces para ayudar a los pacientes a manejar su diabetes tipo 1. A
continuación, centraron su estudio en lo que no se sabía acerca de
los efectos a largo plazo de los PED sobre los resultados tanto
biomédicos como psicosociales de los adultos con diabetes tipo 1.
La mayoría de problemas y propósitos de estudio se basan en
investigaciones previas, como lo indican las fuentes de
investigación en la lista de referencias del estudio. Se citan estudios
de revistas de investigación y de práctica clínica para indicar los
hallazgos en los que se basó el estudio actual. Se puede revisar la
lista de referencias del estudio de Ruiz-González y cols. (2016) para
identificar los tipos de estudios y revistas citados en este artículo.

Fomento de la prueba o desarrollo de teorías


Otra forma en la que el conocimiento aumenta es mediante el
diseño, por parte de los investigadores, de estudios para mejorar o
ampliar la comprensión teórica de un problema clínico. Los
problemas y propósitos significativos en los estudios cuantitativos
tienen el respaldo de la teoría y a menudo el eje central de estos
estudios es probar la teoría (Chinn y Kramer, 2015). El foco de un
estudio puede ser el desarrollo de una teoría (Creswell y Poth,
2018). Por ejemplo, Quinn (2016) realizó un estudio de teoría
fundamentada para desarrollar una teoría que describiese el modo
en el que las enfermeras estadounidenses integran el embarazo y el
trabajo a tiempo completo. En el capítulo 7, se presenta una
discusión detallada sobre los distintos tipos de teorías evaluadas
y/o desarrolladas a través de la investigación.

Abordaje de las prioridades de investigación


en enfermería
Hay literalmente miles de temas que un investigador de enfermería
podría estudiar. Para obtener el máximo beneficio, los
investigadores deben estudiar problemas que sean de la máxima
importancia para la enfermería. En los últimos 50 años,
investigadores expertos, organizaciones profesionales y organismos
de financiación han identificado prioridades de investigación para
estimular los estudios en las áreas importantes de la enfermería.

297
Muchas organizaciones profesionales de enfermería utilizan sitios
web para comunicar sus prioridades de investigación actuales. Por
ejemplo, las prioridades actuales de investigación de la American
Association of Critical-Care Nurses (AACN, 2017) se identifican en
su sitio web (https://www.aacn.org/nursing-
excellence/grants/research-priority-areas) como: «1) uso eficaz y
adecuado de la tecnología para conseguir una valoración, un
tratamiento y/o unos resultados óptimos del paciente; 2) creación
de un entorno humano curativo; 3) procesos y sistemas que
fomenten la contribución óptima de los profesionales de enfermería
de cuidados intensivos; 4) enfoques eficaces para el tratamiento de
los síntomas, y 5) prevención y tratamiento de las complicaciones»
(AACN, 2017).
Se pueden consultar las prioridades de investigación de la AACN
(2017) sin ser un miembro de la organización, pero algunas
organizaciones, como la Oncology Nursing Society and Society of
Pediatric Nurses, requieren registrarse en su sitio web para acceder
a las prioridades y actividades de investigación.
El National Institute of Nursing Research (NINR) es la agencia
clave para promover la investigación de enfermería en Estados
Unidos. El NINR (2017) financia investigación clínica y básica,
además de apoyar formación en investigación para promover el
desarrollo de una base científica para la práctica clínica. Una
iniciativa fundamental del NINR es el desarrollo de una agenda
nacional de investigación en enfermería que implica la
identificación de las prioridades de investigación en enfermería, la
delimitación de un programa para implementar los estudios
prioritarios y la obtención de financiación para apoyar estos
proyectos prioritarios.
El eje central del Plan Estratégico del NINR (2016) fue «hacer
avanzar la ciencia y mejorar la vida de las personas». La agenda de
investigación «se centra en áreas de la ciencia en las que las
necesidades de salud son máximas y en las que la investigación
respaldada por el NINR pueda tener el mayor impacto». Las
prioridades de investigación para el NINR incluyen cuatro áreas de
interés científico:

• Ciencia de los síntomas: fomento de estrategias de salud

298
personalizadas.
• Bienestar: promoción de la salud y prevención de las
enfermedades.
• Automanejo: mejora de la calidad de vida para las personas
con enfermedades crónicas.
• Cuidados paliativos y cuidados al final de la vida: la ciencia
de la compasión.

«En todas las áreas de los programas de investigación del NINR


se hace hincapié en otras dos áreas, la promoción de la innovación y
el desarrollo de los científicos en enfermería del siglo XXI. El plan
está destinado a ser un documento vivo que se pueda adaptar a
medida que surjan nuevas oportunidades y desafíos (NINR, 2016;
https://www.ninr.nih.gov/sites/www.ninr.nih.gov/files/NINR_StratPlan2016_re
Otro organismo federal con interés en facilitar la investigación
sanitaria es la Agency for Healthcare Research and Quality
(AHRQ). «La misión de la AHRQ es producir evidencia para hacer
que la asistencia sanitaria sea más segura, de más calidad, más
accesible, equitativa y asequible, así como trabajar en el seno del
Department of Health and Human Services estadounidense y con
otros socios para asegurarse de que la evidencia se comprende y se
utiliza» (AHRQ, 2016;
https://www.ahrq.gov/cpi/about/mission/index.html). Las
prioridades en investigación y los proyectos financiados se
presentan en el sitio web de la AHRQ (2017)
(http://www.ahrq.gov/legacy/fund/ragendix.htm).
Algunas de las prioridades de investigación identificadas por la
AHRQ son las siguientes:

• Optimización de la asistencia a personas con múltiples


enfermedades crónicas.
• Asistencia de calidad para pacientes de bajos ingresos y de
minorías raciales y étnicas.
• Investigación centrada en la traducción, implementación y
difusión de la investigación en la práctica y en políticas.
• Investigación para promover el desarrollo profesional.

El sitio web Healthy People 2020 identifica y prioriza los temas y

299
objetivos de salud de todos los grupos de edad para la próxima
década (US Department of Health and Human Services [DHHS],
2017). Estos temas y objetivos de salud dirigen la investigación
futura en las áreas de promoción de la salud, prevención de la
enfermedad, tratamiento de las enfermedades y rehabilitación. Se
pueden consultar en línea en
https://www.healthypeople.gov/2020/topics-objectives. En la
actualidad se está trabajando en el desarrollo de los temas y
objetivos para Healthy People 2030.
La OMS (2017) subraya la importancia de la investigación a la
hora de construir un futuro más sano para las personas de todo el
mundo. La OMS (2017) tiene oficinas en más de 190 países y
fomenta la identificación de prioridades para una agenda común de
investigación de enfermería en estos países. Lograr un sistema de
provisión de asistencia sanitaria de calidad y la mejora de la salud
del paciente y la familia se han convertido en objetivos globales. Se
espera que hacia 2020 la población mundial aumente en un 94% y
que la población adulta mayor se incremente en casi un 240%. Se
estima que 7 de cada 10 muertes sean causadas por enfermedades
no transmisibles, como trastornos crónicos (cardiopatía, cáncer,
depresión) y lesiones (no intencionadas e intencionadas). Las áreas
prioritarias para investigación identificadas por la OMS son:

1) mejorar la salud de las poblaciones más marginales del mundo; 2)


estudiar nuevas enfermedades que amenazan la salud pública en todo
el mundo; 3) realizar análisis comparativos de la oferta y la demanda
de mano de obra sanitaria de los diferentes países; 4) analizar la
viabilidad, eficacia y calidad de la formación y la práctica de los
profesionales de enfermería; 5) realizar investigación sobre los modos
de asistencia sanitaria, y 6) examinar los resultados para
instituciones sanitarias, profesionales de la salud y pacientes en todo
el mundo.

OMS, 2017; http://www.who.int/entity/en

En resumen, los investigadores de enfermería expertos, las


organizaciones profesionales de enfermería y los organismos y
organizaciones nacionales e internacionales han identificado

300
prioridades de investigación para orientar la conducta futura de la
investigación sanitaria con el fin de mejorar los resultados de los
pacientes y las familias, el personal de enfermería y los sistemas
sanitarios. Cuando se realiza una valoración crítica de un estudio,
se debe examinar su contribución a la práctica de la enfermería y
determinar si el problema y el objetivo del estudio se basan en la
investigación previa, la teoría y las prioridades de investigación
actuales.

ANÁLISIS DE LA VIABILIDAD DEL


PROBLEMA Y DEL PROPÓSITO DE
UN ESTUDIO
La valoración crítica de una investigación comienza determinando
la viabilidad del problema y del propósito del estudio. La
viabilidad de un estudio se determina analizando la experiencia de
los investigadores; la asignación económica; la disponibilidad de
sujetos, centros y equipamiento, y las consideraciones éticas del
estudio (Gray y cols., 2017; Rogers, 1987). La viabilidad del estudio
de Ruiz-González y cols. (2016) acerca de los efectos a largo plazo
de un PED sobre variables biológicas y psicosociales en adultos con
diabetes tipo 1 se valoró de forma crítica y se presenta como
ejemplo. Se puede revisar este problema y propósito de estudio al
comienzo de este capítulo y localizar este estudio en una biblioteca.
La valoración crítica implica la realización de las siguientes
preguntas acerca de la viabilidad del estudio.

GUÍAS DE VALORACIÓN CRÍTICA


Análisis de la viabilidad del problema y del
propósito de un estudio

1. ¿Los investigadores tenían experiencia investigadora, clínica


y formativa para realizar el estudio?
2. ¿El estudio estaba financiado por organizaciones u

301
organismos locales o nacionales? ¿Los organismos clínicos
proporcionaron apoyo para el estudio?
3. ¿Los investigadores tenían sujetos, entornos y equipamiento
adecuados para realizar su estudio?
4. ¿Fue ético el propósito del estudio?

Experiencia investigadora
El problema y el propósito de investigación deben estar dentro del
área de experiencia de los investigadores. Los informes de
investigación suelen identificar la formación de los investigadores y
su posición actual, lo que indica su experiencia para realizar el
estudio. Los grados de doctorado y de posdoctorado indican una
preparación educativa muy sólida para realizar investigaciones.
También se debe examinar la lista de referencias bibliográficas para
determinar si los investigadores han realizado estudios adicionales
en esta área. Si se necesita más información, se puede buscar en
internet sus logros y su implicación en investigación.
Ruiz-González (autor principal), Guardia-Archilla, Rodríguez-
Morales, Molina y Casares tenían todos preparación a nivel de
máster y trabajaban en las áreas de endocrinología y nutrición en
dos hospitales universitarios diferentes. Los hospitales
universitarios suelen estar muy centrados en la investigación y
realizan diversos estudios. Fernández-Alcántara también tenía
formación a nivel de máster y trabajaba en el Mind, Brain, and
Behavior Research Center vinculado con una universidad. Santos-
Roig tenía formación a nivel de doctorado y trabajaba en una
facultad de psicología. La lista bibliográfica no incluía publicaciones
previas de estos autores. Ruiz-González y cols. (2016) demostraron
una experiencia clínica muy sólida en las áreas de la diabetes,
endocrinología, nutrición y psicología. Dos autores trabajaban en
una universidad y estaban afiliados a centros de investigación. La
experiencia investigadora y la formación de estos autores eran algo
limitadas, dado que la mayoría tenía un grado de máster y ninguno
había publicado trabajos previos en esta área.

Asignación económica
El problema y el propósito del estudio están influenciados por la

302
cantidad de dinero disponible para los investigadores. El coste de
un proyecto de investigación puede oscilar desde unos pocos
dólares para un pequeño estudio realizado por un estudiante hasta
cientos de miles e incluso millones de dólares para proyectos
complejos. La valoración crítica de la viabilidad de un estudio
implica examinar los recursos económicos disponibles para que los
investigadores realicen su estudio. En el artículo suele identificarse
la financiación para el estudio.
Los estudios pueden estar financiados por subvenciones de
instituciones nacionales (p. ej., NINR, 2017; AHRQ, 2017),
organizaciones profesionales o fundaciones privadas. Los
investigadores pueden haber recibido ayuda económica de
compañías que aportan el equipamiento necesario o apoyo de los
organismos donde realizaron el estudio. El que un estudio reciba
financiación indica que ha sido revisado por colegas que eligieron
apoyar económicamente la investigación. El estudio de Ruiz-
González y cols. (2016, pág. 13) fue «financiado por la Consejería de
Salud de Andalucía, España». Estos investigadores también
recibieron apoyo a la hora de implementar la intervención del PED
y de recoger los datos esenciales para el estudio en la clínica de día
donde se realizó el estudio. Ruiz-González y cols. (2016)
identificaron con claridad la financiación regional para su estudio y
el respaldo de la institución sanitaria.

Disponibilidad de sujetos, centros y


equipamiento
Los investigadores deben tener una muestra de tamaño adecuado,
centros y equipos para llevar a cabo su estudio. La mayoría de los
estudios publicados indican el tamaño de la muestra y el ámbito o
entorno(s) en la sección de métodos del informe de investigación.
Los estudios de enfermería se realizan a menudo en entornos
naturales o parcialmente controlados, como hogares, colegios,
servicios hospitalarios o consultas. Muchas de estas localizaciones
tienen un acceso bastante fácil y los hospitales y consultas permiten
el acceso de un gran número de pacientes. En el estudio de Ruiz-
González y cols. (2016) se incluyó una muestra inicial de 115
pacientes con diabetes tipo 1 que acudieron a una consulta externa

303
de diabetes. Sin embargo, al final del estudio de 1 año de duración
la muestra final incluyó solo a 40 participantes. Los investigadores
disponían de la cantidad adecuada de participantes en la consulta
de diabetes, pero la tasa de retención del 34,7% ([40 ÷ 115] × 100% =
0,347 × 100% = 34,7%) podría haber afectado a los resultados del
estudio.
La revisión de la sección de métodos del artículo de investigación
determinará si se disponía de un equipamiento adecuado y preciso.
Los estudios de enfermería frecuentemente requieren una cantidad
limitada de equipamiento, como una grabadora o una videocámara
para entrevistas, parámetros fisiológicos, como valores de
laboratorio, signos vitales o el IMC, así como escalas basadas en
internet o impresas. Ruiz-González y cols. (2016) evaluaron todas
las variables biomédicas de los participantes (HbA1c,
concentraciones de lípidos, IMC) y las variables psicosociales
(conocimiento de la diabetes, conductas de autocuidado
autonotificadas, barreras percibidas, autoeficacia) antes y después
de implementar el PED en la consulta. Por tanto, sujetos,
equipamiento e instalaciones eran adecuados para realizar este
estudio.

Consideraciones éticas
El propósito seleccionado para la investigación debe ser ético, lo
que significa que se protegen los derechos de los sujetos y los
derechos de las demás personas del entorno (Gray y cols., 2017). Un
estudio ético conlleva más beneficios que riesgos en su realización y
generará conocimientos útiles para la práctica. En el capítulo 4 se
presenta una discusión detallada sobre la ética en la investigación
cuantitativa y cualitativa. Ruiz-González y cols. (2016, pág. 15)
proporcionaron una discusión clara de los aspectos éticos de su
estudio en la siguiente exposición: «Se informó a los pacientes de
los objetivos del estudio y se les proporcionó un consentimiento
informado por escrito antes de la realización del test. El estudio fue
aprobado por el comité de ética del Hospital Universitario San
Cecilio».

304
ANÁLISIS DE LOS OBJETIVOS,
PREGUNTAS E HIPÓTESIS DE LA
INVESTIGACIÓN EN LOS INFORMES
DE INVESTIGACIÓN
Los objetivos, preguntas e hipótesis de investigación se desarrollan
a partir del problema, el propósito, la revisión de la bibliografía y,
en ocasiones, el marco del estudio, y orientan los pasos restantes del
proceso de investigación (v. fig. 5.1). Muchos investigadores solo
identifican un problema y propósito para guiar sus estudios
cuantitativos o cualitativos. Sin embargo, algunos estudios incluyen
objetivos específicos, preguntas o hipótesis para guiar la
metodología, organizar los resultados y aclarar los hallazgos. En un
estudio publicado, los objetivos, preguntas e hipótesis
generalmente se presentan después de la sección de revisión de la
bibliografía e inmediatamente antes de la de métodos. El contenido
de esta sección ayudará a identificar y valorar de forma crítica los
objetivos, preguntas e hipótesis en los estudios.

Objetivos de investigación
Un objetivo de investigación es una afirmación declarativa clara y
concisa expresada en tiempo presente para identificar las metas o
fines del estudio. Generalmente se presentan en los estudios
cuantitativos descriptivos y de correlación. En aras de la claridad,
un objetivo suele centrarse en una o dos variables e indica si tienen
que identificarse o describirse. En ocasiones, el foco de los objetivos
es identificar las relaciones entre variables o determinar las
diferencias entre dos o más grupos existentes, como las mujeres y
los hombres, en las variables seleccionadas.
La investigación cualitativa es más adecuada cuando el foco del
estudio es obtener una perspectiva personal de una situación,
experiencia o evento (Creswell y Poth, 2018; Henson y Jeffrey,
2016). Los objetivos de investigación que se formulan en los
estudios cuantitativos y cualitativos tienen ciertas similitudes,
porque se centran en la exploración, descripción y determinación de
relaciones. Sin embargo, los objetivos que orientan los estudios

305
cualitativos suelen tener un foco más amplio y abarcan conceptos
que son más complejos y abstractos que los de los estudios
cuantitativos. Los objetivos de los estudios cualitativos se centran
en las experiencias de los participantes sobre ciertos eventos y
problemas de salud, el desarrollo de teorías, la comprensión de
culturas de grupos e instituciones, así como la descripción de
desafíos, razones para conductas y percepciones de cuidados o
intervenciones específicas en la práctica de enfermería (Creswell y
Poth, 2018; Kim y cols., 2017).
Guillaume, Crawford y Quigley (2016, pág. 65) incluyeron
objetivos para dirigir su estudio sobre «las características de las
caídas de pacientes adultos de mediana edad ingresados». Estos
investigadores demostraron el flujo lógico desde el problema y el
propósito de investigación hasta los objetivos de esta (v. fig. 5.1)
cuando publicaron su estudio descriptivo cuantitativo, que se
presenta en el Ejemplo de investigación 5.2. Las preguntas
utilizadas para realizar la valoración crítica de este estudio se
encuentran en el siguiente cuadro.

EJEMPLO DE INVESTIGACIÓN 5.2


Problema, propósito y objetivos
Extracto del estudio de investigación
Problema de investigación

Las caídas con lesiones siguen siendo uno de los tipos de eventos
adversos más notificables, graves y costosos que se producen en
hospitales de Estados Unidos y ocasionan unos resultados
desfavorables de morbilidad y mortalidad… En hospitales de
cuidados agudos, se estima que se producen 1.000 caídas anuales
por centro con independencia del tamaño. A nivel nacional, se
notifican más de un millón de caídas anuales de pacientes
ingresados [relevancia del problema]… El estudio reciente sobre
caídas de Williams y cols. (2014) también identificó que los
pacientes ingresados de mediana edad de 51-60 años (n = 5.561)
tenían las tasas más elevadas de caídas notificadas, seguidos por los

306
de 61-70 años (n = 4.699) [antecedentes del problema]… Aunque se
han estudiado factores predictivos de caídas y de lesiones en todos
los pacientes adultos ingresados…, las investigaciones no han
abordado específicamente las características de riesgo de caída en la
población de mediana edad [declaración del problema]. (Guillaume
y cols., 2016, págs. 65-66)

Propósito de la investigación

El propósito de este estudio fue describir las características de los


pacientes adultos ingresados de mediana edad [45-64 años] que se
caen, junto con sus factores de riesgo de caída y de lesiones por
caída. (Guillaume y cols., 2016, pág. 66)

Objetivos de investigación

Los objetivos fueron: a) describir los factores de riesgo de caídas y de


lesiones por caída, b) describir datos específicos de las unidades, el
número de caídas y su tipo, las lesiones por caída y las estrategias
de prevención y c) comparar la incidencia de caídas y las tasas de
lesiones por caídas de los pacientes de mediana edad (45-64 años)
con los otros grupos de pacientes adultos hospitalizados (21-44 y
65-90). (Guillaume y cols., 2016, pág. 66)

Valoración crítica
Guillaume y cols. (2016) identificaron un problema significativo
respecto a las caídas de los pacientes ingresados para los adultos de
mediana edad que no se había estudiado adecuadamente. La
declaración del problema indicó claramente lo que no se sabía y
proporcionó una base para el propósito y los objetivos de este
estudio. El propósito indicaba claramente que el foco del estudio
era describir las características de las caídas de los pacientes
adultos de mediana edad ingresados. Los objetivos del estudio se
basaron en el problema y el propósito y aportaron más claridad
respecto a los fines específicos del estudio. Estos objetivos fueron
muy útiles para organizar los resultados del estudio y para
interpretar los hallazgos. Las variables específicas descritas y

307
comparadas en relación con las caídas se identificaron en los
objetivos del estudio. Los dos primeros objetivos se centraron en la
descripción y el último en la comparación de las tasas de caídas y
lesiones por caídas de los adultos de mediana edad respecto a otros
dos grupos de edad de pacientes adultos hospitalizados.

GUÍAS DE VALORACIÓN CRÍTICA


Objetivos y preguntas de investigación

1. ¿Los objetivos o preguntas se expresan de forma clara y


concisa en el estudio?
2. ¿Los objetivos o preguntas del estudio se basan en el
propósito del estudio?
3. ¿Los objetivos o las preguntas parecen dirigir la metodología
del estudio, organizar sus resultados y facilitar la
interpretación de los hallazgos?

Preguntas de investigación
Una pregunta de investigación es una declaración interrogativa
clara y concisa redactada en tiempo presente, que incluye una o
más variables y que se expresa para guiar la puesta en marcha de
los estudios. Los focos de las preguntas de investigación en los
estudios cuantitativos son la descripción de variable(s), el examen
de las relaciones entre las variables, el uso de variables
independientes para predecir la variable dependiente y la
determinación de diferencias entre dos o más grupos en relación
con una o más variables seleccionadas. Estas preguntas de
investigación suelen centrarse de forma estricta e inclusiva en las
variables y la población del estudio. Que los investigadores
identifiquen objetivos o preguntas en su estudio es solo una
cuestión de elección, aunque lo más frecuente es que se planteen
preguntas para guiar los estudios cuantitativos descriptivos y de
correlación. Se deberían desarrollar hipótesis para dirigir los
estudios cuantitativos cuasiexperimentales y experimentales
(Shadish y cols., 2002).

308
Hernandez, Morgan y Parshall (2016, pág. 481) realizaron un
estudio de correlación descriptivo para evaluar la «resiliencia,
estrés, estigma y obstáculos a la asistencia de salud mental en el
personal de enfermería de la Fuerza Aérea de Estados Unidos
(USAF)». Estos investigadores identificaron un propósito y unas
preguntas de investigación para dirigir la implementación de su
estudio, que se presenta en el Ejemplo de Investigación 5.3. Las
directrices de valoración crítica para examinar los objetivos o
preguntas de investigación de un estudio, descritas anteriormente,
se aplicaron a este ejemplo.

EJEMPLO DE INVESTIGACIÓN 5.3


Propósito y preguntas de investigación de un
estudio cuantitativo
Extracto del estudio de investigación
Propósito de la investigación
En este estudio se evaluó el grado en el que el estigma y los obstáculos
para acceder a los servicios de SM [salud mental] tal y como son
percibidos por el personal de enfermería de la USAF se asocian con la
resiliencia, el estrés, el despliegue previo o las características
demográficas. (Hernandez y cols., 2016, pág. 481)
Preguntas de investigación

1. ¿Cuáles son los niveles de estigma y los obstáculos para acceder a


los servicios de SM, el estrés y la resiliencia del personal de
enfermería de la USAF?
2. ¿Cuáles son la magnitud y la dirección de las asociaciones entre el
estigma y los obstáculos para acceder a los servicios de SM, el
estrés y la resiliencia en el personal de enfermería de la USAF?
3. ¿Se asocian las características demográficas, el rango militar, el
despliegue previo y el acceso a los servicios de SM con estigma y
obstáculos para acceder a los servicios de SM, estrés y resiliencia en
el personal de enfermería de la USAF? (Hernandez y cols., 2016,
pág. 482)

309
Valoración crítica
Hernandez y cols. (2016) indicaron claramente el propósito de su
estudio. Las preguntas de investigación se derivaron de dicho
propósito y aclararon los objetivos del estudio. La pregunta 1 se
centró en la descripción de los niveles de estigma y los obstáculos
del personal de enfermería para acceder a los servicios de SM. Las
preguntas 2 y 3 se centraron en la evaluación de las relaciones o
asociaciones entre las variables del estudio. Estas preguntas se
abordaron en la metodología, los resultados y los hallazgos del
estudio. Hernandez y cols. (2016, pág. 481) observaron que a un
gran porcentaje del personal de enfermería de la USAF «le
preocupaba que acceder a los servicios de SM pudiese afectar
negativamente a sus carreras y al modo en que les veían los líderes
de unidad y los compañeros. Además, unos niveles mayores de
preocupación por el estigma se asociaron con niveles superiores de
estrés y unos niveles menores de resiliencia».

Las preguntas de investigación que orientan los estudios


cualitativos suelen tener un número limitado, tienen un foco amplio
y abarcan conceptos que son más complejos y abstractos que los de
los estudios cuantitativos. Marshall y Rossman (2016) indicaron que
las preguntas desarrolladas para dirigir la investigación cualitativa
podrían ser teóricas, que se pueden estudiar con distintas
poblaciones o en una variedad de sitios, o que podrían centrarse en
una población o entorno particular. Las preguntas del estudio
formuladas son muy importantes para la selección del método de
investigación cualitativa utilizado para realizar el estudio (Creswell
y Poth, 2018).
Roll y Bowers (2017) realizaron un estudio cualitativo para
describir el modo en el que se fomenta el envejecimiento saludable
para personas con discapacidades del desarrollo. Estos
investigadores desarrollaron preguntas de investigación para guiar
su estudio. El propósito y las preguntas de este estudio se presentan
en el Ejemplo de investigación 5.4.

EJEMPLO DE INVESTIGACIÓN 5.4

310
Propósito y preguntas de investigación de un
estudio cualitativo
Extracto del estudio de investigación
Propósito de la investigación
Este estudio cualitativo «trató de describir y analizar un programa
innovador de enfermería comunitaria que surgió en 2009 en
respuesta a las disparidades sanitarias observadas y a las
necesidades sanitarias no cubiertas de las personas con DI/D
(discapacidades intelectuales y del desarrollo)» (Roll y Bowers,
2017, pág. 236)
Preguntas de investigación

1. ¿Por qué surgió este programa de enfermería comunitaria (PEC)?


2. ¿Cuál es el trabajo diario de los profesionales de enfermería
comunitaria en este programa con el objetivo de promover el
envejecimiento saludable de las personas con DI/D en la
comunidad? (Roll y Bowers, 2017, pág. 237)

Valoración crítica
Roll y Bowers (2017) indicaron claramente el propósito de su
estudio. Las preguntas de investigación aclararon los objetivos del
estudio. La pregunta 1 se centró en identificar y describir por qué
surgió este PEC para las personas con DI/D y la pregunta 2 se
centró en una descripción del trabajo diario de los profesionales de
enfermería en el PEC. Estas preguntas fueron el foco de la recogida
y análisis de los datos, y organizaron la discusión de los hallazgos.
Roll y Bowers (2017, pág. 234) observaron que el PEC se
implementó para mejorar la comunicación entre los profesionales
de atención primaria y las personas con DI/D. El trabajo diario de
los profesionales de enfermería incluía «educación para la salud,
apoyo para volver a casa con seguridad,… y permitir la
participación social» de las personas con DI/D.

Hipótesis
Una hipótesis es una declaración formal de la relación o relaciones

311
esperadas entre dos o más variables en una población especificada.
La hipótesis traduce el problema y el propósito de la investigación
en una explicación o predicción clara de los resultados esperados de
estudios cuantitativos seleccionados. Una hipótesis claramente
establecida incluye las variables independientes que se han de
manipular o medir, indica los resultados propuestos o las variables
dependientes que se van a medir e identifica la población que se va
a estudiar. Los distintos tipos de variables se describen con más
detalle al final de este capítulo. Las hipótesis también influyen en el
diseño del estudio, el método de muestreo, la recogida de los datos
y el proceso de análisis, así como la interpretación de los hallazgos
(Fawcett y Garity, 2009; Grove y Cipher, 2017). Los estudios
cuantitativos cuasiexperimentales y experimentales se realizan para
probar la eficacia de un tratamiento o intervención; este tipo de
estudios deberían incluir hipótesis para predecir los resultados
esperados. Los estudios de correlación predictivos que miden
variables independientes para predecir una variable dependiente
suelen incluir hipótesis (Gray y cols., 2017). En esta sección se
describen los tipos de hipótesis y se explican los elementos de una
hipótesis demostrable, de modo que se puedan valorar las hipótesis
de forma crítica en los estudios publicados.

Tipos de hipótesis
En las hipótesis se identifican diferentes tipos de relaciones y
números de variables. Un estudio podría tener una, cuatro o más
hipótesis, dependiendo de su complejidad. El tipo de hipótesis que
se desarrolla se basa en el propósito del estudio. Las hipótesis
pueden describirse utilizando cuatro categorías que se muestran en
el cuadro 5.2 y se describen en esta sección.

CUADRO 5.2 TIPOS DE HIPÓTESIS

• Hipótesis asociativas frente a causales.


• Hipótesis simples frente a complejas.
• Hipótesis no direccionales frente a direccionales.
• Hipótesis estadísticas frente a hipótesis de investigación.

312
Hipótesis asociativas frente a causales. Las relaciones
identificadas en las hipótesis son asociativas o causales. Una
hipótesis asociativa propone relaciones entre variables que
aparecen o existen juntas en el mundo real, de modo que cuando
cambia una variable la otra también varía (Gray y cols., 2017). Las
hipótesis asociativas identifican relaciones entre variables de un
estudio, pero no indican que una variable cause un efecto sobre otra.
McKee, Long, Southward, Walker y McCown (2016) realizaron un
estudio de correlación predictivo para determinar los factores que
eran predictivos de obesidad infantil. «Plantearon la hipótesis de
que los hijos de progenitores con sobrepeso u obesos son más
propensos a ser obesos» (McKee y cols., 2016, pág. 197). Esta
hipótesis asociativa predice dos relaciones positivas entre los
progenitores con sobrepeso y los hijos obesos, así como entre los
progenitores obesos y los hijos obesos. Las relaciones en esta
hipótesis pueden representarse con el siguiente diagrama:

Las líneas que conectan las tres variables son rectas, sin flechas, lo
que indica relaciones lineales. McKee y cols. (2016, pág. 200)
observaron «que el segundo factor predictivo principal de obesidad
infantil era tener al menos un progenitor obeso y el tercero era tener
al menos un progenitor con sobrepeso».
Una hipótesis causal propone una interacción causa-efecto entre
dos o más variables, denominadas variables independiente y
dependiente. La variable independiente (tratamiento o
intervención) se manipula por parte del investigador para causar
un efecto sobre la variable dependiente o de resultado. Después, el
investigador mide la variable dependiente para examinar el efecto
producido por la variable independiente (Waltz, Strickland y Lenz,

313
2017). Un formato para declarar una hipótesis causal es el siguiente.
Los participantes del estudio incluidos en el grupo experimental,
que se exponen a la variable independiente (intervención),
experimentan un cambio mayor (medido por la variable
dependiente) que los del grupo de comparación que recibieron la
asistencia estándar.
El estudio de Ruiz-González y cols. (2016), descrito previamente,
se realizó para evaluar los efectos a largo plazo de un PED (variable
independiente) sobre los parámetros biomédicos y psicosociales
(variables dependientes). Este estudio incluyó la siguiente hipótesis
causal: «después del PED, los pacientes tendrán concentraciones
menores de hemoglobina A1c, unos conocimientos teóricos y
prácticos mayores sobre la diabetes, menos obstáculos (para el
autocuidado), un autocuidado más frecuente y una autoeficacia
mayor». Esta hipótesis incluyó siete variables: una variable
independiente (PED) que se implementó para crear un efecto sobre
las seis variables dependientes (HbA1c, conocimientos teóricos y
prácticos sobre la diabetes, obstáculos para el autocuidado,
autocuidado y autoeficacia). Esta hipótesis causal podría
representarse con el siguiente diagrama, donde una flecha (→)
indica una relación causa-efecto frente a relaciones asociativas:
Esta hipótesis causal identifica dos relaciones negativas y cuatro
positivas. Se esperaba que el PED disminuyese la concentración de
HbA1c y los obstáculos para el autocuidado, y que aumentase los
conocimientos acerca de la diabetes, la frecuencia del autocuidado y
la autoeficacia. El estudio de Ruiz-González y cols. (2016, pág. 13)
respaldó esta hipótesis porque «se mantuvieron unos cambios
significativos en el seguimiento a 1 año de la hemoglobina A1c, los
obstáculos para el autocuidado, la frecuencia del autocuidado, los
conocimientos sobre la enfermedad y la autoeficacia percibida».

314
Hipótesis simples frente a complejas. Las hipótesis pueden ser
simples o complejas (v. cuadro 5.2). Una hipótesis simple establece
la relación (asociativa o causal) entre dos variables. McKee y cols.
(2016, pág. 197) declararon una hipótesis asociativa simple en su
estudio sobre los factores predictivos de la obesidad infantil. Su
hipótesis declara que los niños cuyo estatus de peso «es percibido
de forma errónea por sus progenitores son más propensos a ser
obesos». Esta hipótesis podría representarse con el siguiente
esquema:

El estudio de McKee y cols. (2016) respaldó esta hipótesis, porque


el 86,2% de los progenitores percibieron erróneamente el peso y la
salud de su hijo cuando este presentaba en realidad sobrepeso u
obesidad. Estos investigadores observaron que la percepción
errónea de los padres sobre el estatus de peso de su hijo era el factor
predictivo más sólido de la obesidad infantil.
Una hipótesis compleja declara las relaciones (asociativas o
causales) entre tres o más variables. El estudio de Ruiz-González y
cols. (2016) incluyó la siguiente hipótesis causal compleja: «los
pacientes del PED mostrarán mejoras de los parámetros
biomédicos, sobre todo de los factores de riesgo cardiovascular,
como el colesterol (total y LDL [lipoproteína de baja densidad]) y
del índice de masa corporal [IMC]» (Ruiz-González y cols., 2016,

315
pág. 14). Esta hipótesis podría representarse con el siguiente
esquema:

Los investigadores analizaron el efecto del PED (una variable


independiente) sobre las variables dependientes del colesterol total,
LDL e IMC. Esta hipótesis no se vio respaldada, porque no se
observaron cambios del IMC ni de los valores de colesterol total y
LDL. Por tanto, el estudio de Ruiz-González y cols. (2016) tuvo
resultados mixtos, ya que una hipótesis se vio respaldada y la otra
no.
Hipótesis no direccionales frente a direccionales. Una hipótesis
no direccional declara que existe una relación, pero no predice su
naturaleza (positiva o negativa). Si la dirección de la relación que se
está estudiando no está clara en la práctica clínica o en la
bibliografía teórica o empírica, el investigador no tiene una
indicación clara de la naturaleza de la relación. En estas
circunstancias, se desarrollan hipótesis no direccionales, como «la
cantidad de horas que se pasan jugando a videojuegos se relaciona
con el índice de masa corporal en niños de edad escolar». Este es un
ejemplo de una hipótesis simple (dos variables), asociativa y no
direccional.
Una hipótesis direccional declara la naturaleza (positiva o
negativa) de la interacción entre dos o más variables. El uso de
términos como positivo, negativo, menos, más, aumento, disminución,
mayor, más alto o más bajo en una hipótesis indica la dirección de la

316
relación. Las hipótesis direccionales se desarrollan a partir de
afirmaciones teóricas (proposiciones), de los hallazgos de estudios
previos y de la experiencia clínica. A medida que aumentan los
conocimientos en los que se basa un estudio, los investigadores son
capaces de hacer una predicción acerca de la dirección de una
relación entre las variables que se estudian. Por ejemplo, McKee y
cols. (2016, pág. 197) declararon una hipótesis direccional: «los
progenitores serán más propensos a percibir de forma errónea el
estatus de peso de los niños más pequeños». La palabra en cursiva
indica la naturaleza de la relación en esta hipótesis direccional
asociativa simple. Esta hipótesis incluye una relación negativa que
podría representarse esquemáticamente del siguiente modo:

El estudio de McKee y cols. (2016) respaldó esta hipótesis porque


los progenitores percibieron de forma significativamente más
errónea que el estatus de peso de sus hijos más pequeños era
saludable cuando en realidad presentaban sobrepeso u obesidad.
Una hipótesis causal predice el efecto de una variable
independiente sobre una variable dependiente, especificando la
dirección de la relación. La variable independiente aumenta o
disminuye cada variable dependiente; por tanto, todas las hipótesis
causales son direccionales. Huang, Chang y Lai (2016) realizaron un
estudio cuasiexperimental para determinar los efectos de la música
sobre el insomnio en adultos mayores. Una de las hipótesis
analizadas en este estudio fue que «Los participantes que realizaron
un ejercicio nocturno consistente en caminar deprisa combinado
con música durante dos noches presentaron unas puntuaciones
mayores de calidad de sueño que las puntuaciones basales sin
realizar ejercicio» (Huang y cols., 2016, pág.105). La hipótesis
podría representarse con el siguiente esquema:

317
Esta hipótesis causal (como lo indican las flechas) es compleja (tres
variables), direccional (mayores puntuaciones de sueño) y positiva
(el ejercicio y la música aumentan las escalas de sueño). Los
resultados de este estudio fueron estadísticamente significativos, lo
que respalda esta hipótesis de que las intervenciones de ejercicio y
música mejoraron las puntuaciones de calidad de sueño de adultos
ancianos.
Hipótesis estadísticas frente a hipótesis de investigación. Las
hipótesis pueden ser de investigación o estadísticas (v. cuadro 5.2).
La hipótesis estadística, también denominada hipótesis nula (H0),
se usa para pruebas estadísticas y para la interpretación de
resultados estadísticos. Aunque no se establezca, la hipótesis nula
está implícita porque es la inversa de la hipótesis de investigación
(Grove y Cipher, 2017). Algunos investigadores declaran la
hipótesis nula porque se interpreta más fácilmente a partir de los
resultados de los análisis estadísticos. La hipótesis nula también se
utiliza cuando los investigadores creen que no existe relación entre
dos variables y cuando la información teórica o empírica es
inadecuada para declarar una hipótesis de investigación. Las
hipótesis nulas pueden ser simples o complejas y asociativas o
causales, pero siempre son no direccionales, porque la hipótesis
nula declara que no hay relación entre las variables ni diferencias
entre los grupos. Huang y cols. (2016, pág. 105) declararon la
siguiente hipótesis nula en su estudio: «Las puntuaciones subjetivas
de calidad de sueño no difieren entre la escucha de música relajante
y realizar ejercicio de caminar deprisa combinado con música». La
hipótesis nula se vio respaldada porque los «resultados revelaron
que tanto la música relajante como el ejercicio de caminar deprisa
combinado con música mostraron los mismos efectos sobre la
calidad subjetiva del sueño» (Huang y cols., 2016, pág. 107).
Una hipótesis de investigación es la hipótesis alternativa (H1 o

318
HA) a la hipótesis nula o estadística y declara que existe una
relación entre dos o más variables. Todas las hipótesis formuladas
previamente en este capítulo han sido hipótesis de investigación.
Las hipótesis de investigación pueden ser simples o complejas, no
direccionales o direccionales, y asociativas o causales.

GUÍAS DE VALORACIÓN CRÍTICA


Hipótesis en estudios

1. ¿Se han declarado formalmente las hipótesis en el estudio? Si


el estudio es cuasiexperimental o experimental, se necesitan
hipótesis para dirigirlo.
2. ¿Las hipótesis identifican claramente las relaciones entre las
variables del estudio?
3. ¿Las hipótesis son asociativas o causales, simples o complejas,
direccionales o no direccionales, y de investigación o nula
(estadística; v. cuadro 5.2)?
4. Si en un estudio se incluyen hipótesis, ¿se usan para organizar
los resultados de la investigación e interpretar los hallazgos
del estudio?

El estudio de Ruiz-González y cols. (2016), citado previamente, se


centró en los efectos de un PED sobre las variables biomédicas y
psicosociales en adultos con diabetes tipo 1. Estos investigadores
desarrollaron hipótesis causales para dirigir la realización de su
estudio, que se presenta en el Ejemplo de Investigación 5.5.

EJEMPLO DE INVESTIGACIÓN 5.5


Hipótesis
Extracto del estudio de investigación
Se desarrollaron las siguientes hipótesis: 1) después del PED, los pacientes
tendrán concentraciones menores de HbA1c, unos conocimientos teóricos
y prácticos mayores sobre la diabetes, menos obstáculos para el

319
autocuidado, una frecuencia mayor de autocuidado y más autoeficacia; 2)
estos cambios permanecerán estables a los seis meses y al año de
seguimiento; 3) después del PED, los pacientes mostrarán mejoras de los
parámetros biomédicos, sobre todo de los factores de riesgo cardiovascular,
como el colesterol (total y LDL) y el índice de masa corporal. (Ruiz-
González y cols., 2016, pág. 14)
Valoración crítica
Ruiz-González y cols. (2016) declararon unas hipótesis causales
apropiadas para la investigación cuasiexperimental que analiza los
efectos de una intervención sobre variables dependientes
seleccionadas. El estudio incluyó tres hipótesis de investigación
complejas, causales y direccionales. Las hipótesis 1 y 3 se
declararon con claridad e identificaron la intervención del PED y
las variables psicosociales específicas (conocimiento de la diabetes,
obstáculos, autocuidado y autoeficacia) y las variables biomédicas
(HbA1c, colesterol total, LDL e IMC) que se midieron. Estas dos
hipótesis se han representado de forma esquemática previamente
en esta sección y aclaran las relaciones entre las variables
independientes y dependientes. La hipótesis 2 se centró en la
predicción de las relaciones entre las variables a lo largo del tiempo
(seis meses y un año). La sección de resultados del artículo se
centró en las variables del estudio y no aborda con claridad si las
hipótesis se vieron respaldadas o no.

Hipótesis comprobable
El valor de una hipótesis deriva en última instancia de si es
comprobable en el mundo real. Una hipótesis comprobable es la
que predice claramente las relaciones entre las variables y contiene
variables que se pueden medir o manipular en un estudio. La
variable independiente debe estar claramente definida, a menudo
por un protocolo, de modo que pueda aplicarse de forma precisa y
constante como intervención en un estudio. La variable
dependiente debe definirse claramente para indicar cómo se medirá
de forma precisa y exacta (v. la siguiente sección sobre la definición
de las variables del estudio).
Una hipótesis comprobable también tiene que predecir una
relación que pueda «respaldarse» o «no respaldarse», según lo

320
indiquen los datos recogidos y analizados. Si la hipótesis establece
una relación asociativa, se realizan análisis de correlación de los
datos para determinar la existencia, tipo y fuerza de la relación
entre las variables estudiadas. La hipótesis que plantea una relación
causal entre las variables independientes y dependientes se evalúa
utilizando análisis estadísticos, como la prueba de la t o el análisis
de varianza (ANOVA), que analiza las diferencias entre las medias
de las variables dependientes para los grupos experimental y de
comparación o control (Grove y Cipher, 2017; v. cap. 11). La
hipótesis estadística o nula (explícita o implícita) se comprueba
para determinar si la variable independiente produce un efecto
significativo sobre la variable dependiente.
Las hipótesis son más claras sin especificar la presencia o
ausencia de una diferencia significativa porque la determinación
del nivel de significación solo es una técnica estadística aplicada a
los datos de una muestra. Además, las hipótesis no deben
identificar puntos metodológicos, como técnicas de muestreo,
medición ni análisis de datos (Grove y Cipher, 2017). Por ello, frases
como medido mediante, en una muestra aleatoria de y usando ANOVA
son inapropiadas porque limitan la hipótesis a métodos de
medición, muestras o técnicas de análisis identificadas para un
estudio. Además, las hipótesis deben reflejar las variables y la
población descritas en el propósito de la investigación.
En resumen, los objetivos, preguntas e hipótesis de investigación
deben expresarse de forma concisa y centrarse claramente en los
estudios. Tanto los objetivos como las preguntas se usan en los
estudios cualitativos y en los estudios cuantitativos descriptivos y
de correlación, pero las preguntas son más habituales. Algunos
estudios de correlación se centran en predecir relaciones y pueden
incluir hipótesis. Los estudios cuasiexperimentales y
experimentales deben estar dirigidos por hipótesis.

COMPRENSIÓN DE LAS VARIABLES


DEL ESTUDIO Y DE LOS
CONCEPTOS DE INVESTIGACIÓN
El propósito de la investigación y sus objetivos, preguntas e

321
hipótesis incluyen las variables o conceptos que se deben examinar
en un estudio. Las variables son cualidades, propiedades o
características de personas, cosas o situaciones que cambian o
varían. Las variables deben definirse de forma concisa para
fomentar su medición o manipulación en los estudios cuantitativos
o de resultados (Chinn y Kramer, 2015; Waltz y cols., 2017). Los
conceptos de investigación suelen estudiarse en investigación
cualitativa, se sitúan a niveles más altos de abstracción que las
variables y no se manipulan en los estudios (Creswell y Poth, 2018).
En esta sección, se describen los diferentes tipos de variables y se
explican las definiciones conceptual y operacional de las variables.
También se abordan los conceptos de investigación que se estudian
en investigación cualitativa.

Tipos de variables en investigación


cuantitativa
Las variables se clasifican en diversos tipos para explicar su uso en
investigación. Algunas variables se manipulan y otras se controlan.
Algunas variables se identifican, pero no se miden; otras se
determinan con sistemas de medición precisos. Los tipos de
variables que se presentan en esta sección son las variables de
investigación, independientes, dependientes y externas (Gray y
cols., 2017; Waltz y cols., 2017).

Variables de investigación
Los estudios cuantitativos descriptivos y de correlación implican la
investigación de este tipo de variable. Las variables de
investigación son las cualidades, propiedades o características
identificadas en el propósito de la investigación y en los objetivos o
preguntas que se miden en un estudio. Las variables de
investigación se incluyen en un estudio cuando la intención es
observar o medir variables según existen en un entorno natural sin
la aplicación de un tratamiento. Por tanto, no se manipula ninguna
variable independiente y no se examinan relaciones causa-efecto.
Buet y cols. (2013) describieron las variables de investigación
«ocasiones para la HM» y «adherencia a la HM» en cuidadores
clínicos (p. ej., personal de enfermería, médicos) y cuidadores no

322
clínicos (p. ej., progenitores, maestros) en centros de cuidados
extendidos pediátricos (v. el problema y propósito del estudio en la
tabla 5.1).

Variables independientes y dependientes


La relación entre las variables independientes y dependientes es la
base para la formulación de hipótesis en los estudios de correlación,
cuasiexperimentales y experimentales. En los estudios de
correlación predictivos, las variables medidas para predecir una
única variable dependiente se denominan variables independientes
(Grove y Cipher, 2017). Por ejemplo, McKee y cols. (2016) realizaron
un estudio de correlación predictivo para determinar si las
variables independientes de las percepciones erróneas de los
progenitores sobre el estatus de peso de su hijo (sano, sobrepeso,
obeso), el estatus de peso de los progenitores de sobrepeso u
obesidad, así como la edad del niño se usaban para predecir la
probabilidad de obesidad infantil (variable dependiente). Las
hipótesis de este estudio se han presentado previamente en el
capítulo y se respaldaron por los resultados del estudio.
El término variable independiente se usa con más frecuencia
para identificar una intervención que se manipula o varía por el
investigador para crear un efecto sobre la variable dependiente. La
variable independiente también se denomina intervención,
tratamiento o variable experimental. Una variable dependiente es
el resultado que el investigador quiere predecir o explicar. Se
supone que los cambios en la variable dependiente son causados
por la variable independiente. Strohfus y cols. (2017) realizaron un
estudio para analizar los efectos de la educación entre compañeros
acerca de la inmunización sobre los conocimientos del personal
sanitario y las tasas de inmunización en sus consultas médicas.
Estos investigadores declararon la siguiente hipótesis nula: «no
habría un aumento ni retención significativos del conocimiento y no
aumentarían las tasas de inmunización después de proporcionar la
educación» (pág. 132). La variable independiente era la educación
sobre la inmunización y la formación que se implementó para
determinar sus efectos sobre los conocimientos de 113 miembros
del personal sanitario y las tasas de inmunización en 28 consultas
médicas. Strohfus y cols. (2017, pág. 133) observaron que «el

323
conocimiento global aumentó un 7,8% (n = 113) a los 12 meses de la
educación» y que las tasas de inmunización aumentaron
significativamente en las consultas médicas.

Variables externas
Las variables externas existen en todos los estudios y pueden
influir en la medición de las variables del estudio y en las relaciones
entre dichas variables. Las variables externas son el problema
principal en los estudios cuantitativos que analizan los efectos de
intervenciones porque pueden interferir en la obtención de un
entendimiento claro de la dinámica relacional o causal en estos
estudios. Estas variables se clasifican en reconocidas o no
reconocidas, y en controladas o no controladas. Algunas variables
externas no se reconocen hasta que el estudio está en progreso o se
ha finalizado, pero su presencia influye en su resultado.
Los investigadores intentan reconocer y controlar el mayor
número posible de variables externas en los estudios
cuasiexperimentales y experimentales, y se han desarrollado
diseños específicos, protocolos de intervención y criterios de
muestreo para controlar la influencia de variables externas que
podrían afectar a los resultados de los estudios. Ruiz-González y
cols. (2016, pág. 14) seleccionaron un diseño cuasiexperimental
«donde cada participante es sometido a cada tratamiento individual
(incluido el control)… El hecho de que los sujetos actúen como su
propio control es una forma para reducir la cantidad de error
derivado de la varianza natural entre los individuos». Los criterios
de exclusión de la muestra garantizaron que los individuos con
discapacidades físicas y psicológicas no se incluyesen en el estudio,
lo que redujo la posibilidad adicional de error. Las escalas
utilizadas para medir el conocimiento sobre la diabetes, las
conductas de autocuidado y la autoeficacia se presentaron en
detalle. Sin embargo, la intervención (PED) no se detalló en el
artículo; haber dispuesto de un protocolo que estuviese basado en
la evidencia habría reducido la posibilidad de error. Los procesos
para medir las variables biomédicas (colesterol total, LDL e IMC) no
se describieron.
Las variables externas que no se reconocen hasta que el estudio
está en proceso, o que se reconocen antes de iniciarlo, pero no

324
pueden controlarse, se denominan variables de confusión. En
ocasiones, las variables externas pueden medirse durante el estudio
y controlarse estadísticamente durante el análisis. Sin embargo, las
variables externas que no pueden controlarse ni medirse implican
una debilidad del diseño y pueden entorpecer la interpretación de
los hallazgos (v. cap. 8). La influencia potencial de las variables de
confusión aumenta a medida que disminuye el control en los
estudios de correlación, cuasiexperimentales y experimentales.
Las variables ambientales son un tipo de variables externas que
forman parte del entorno en el que se realiza el estudio. Son
ejemplos de estas variables el clima, la familia, el sistema sanitario y
las organizaciones gubernamentales. Si un investigador está
estudiando personas en un entorno no controlado o natural, es
imposible y no deseable controlar todas las variables externas. En
los estudios cualitativos y en algunos cuantitativos (descriptivos y
de correlación) se intenta controlar poco o nada las variables
externas. La intención es estudiar a los participantes del estudio en
su entorno natural sin controlar ni alterar ese entorno o situación
(Creswell, 2014; Creswell y Poth, 2018). Las variables ambientales
en la investigación cuasiexperimental y experimental pueden
controlarse usando un entorno de laboratorio o una unidad de
investigación especialmente construida en un hospital.
El control ambiental es una parte extremadamente importante en
la realización de los estudios experimentales. Por ejemplo, Kaya y
cols. (2017) realizaron un estudio experimental en una UCI
neuroquirúrgica, que es un entorno clínico muy controlado (v. tabla
5.1). El entorno controlado, la intervención estructurada de
cuidados orales con glutamina y la medición detallada de la NAV
disminuyeron el posible impacto de las variables externas sobre los
resultados del estudio.

Definición conceptual y operacional de las


variables en investigación cuantitativa
Una variable se describe en un estudio mediante el desarrollo de
definiciones conceptuales y operacionales. La definición
conceptual aporta el significado teórico de la variable (Chinn y
Kramer, 2015) y a menudo deriva de una definición que un teórico

325
ofrece de un concepto relacionado. En un estudio publicado, el
marco incluye los conceptos y sus definiciones, y las variables se
seleccionan para representar estos conceptos (v. más detalles en el
cap. 7). Las variables se definen conceptualmente, indicando la
relación con los conceptos del marco. La definición operacional
deriva de un conjunto de procedimientos o acciones progresivas
que lleva a cabo un investigador para recibir impresiones
sensoriales (p. ej., impresiones sonoras, visuales o táctiles) que
indican la existencia o el grado de existencia de una variable (Waltz
y cols., 2017). Las definiciones operacionales han de ser
independientes del tiempo y del entorno, de modo que las variables
puedan investigarse en diferentes momentos y entornos utilizando
las mismas definiciones operacionales. Una definición operacional
se desarrolla de modo que una variable pueda medirse o
manipularse en una situación concreta; el conocimiento obtenido
del estudio de la variable aumentará la comprensión de los
conceptos teóricos que representa dicha variable.
En la tabla 5.3 se incluyen los conceptos y variables del estudio de
Ruiz-González y cols. (2016) acerca de los efectos del PED sobre el
tratamiento de la diabetes tipo 1. En la tabla se puede comprobar la
relación de cada concepto con la(s) variable(s) y se identifica el tipo
de variable. En el Ejemplo de investigación 5.6 se presentan las
definiciones conceptual y operacional para la variable
independiente (PED) y para una de las variables dependientes
(HbA1c). Para la valoración crítica de las variables y sus
definiciones en este estudio, se utilizaron las guías identificadas en
el siguiente cuadro.

EJEMPLO DE INVESTIGACIÓN 5.6


Definición conceptual y operacional de las
variables
Variable independiente: programa de educación sobre
diabetes (PED)
Definición conceptual

326
El PED se basó en el concepto del marco del estudio de la
educación terapéutica implementada con el fin de «ayudar a los
pacientes a desarrollar habilidades para llevar a cabo conductas
que mejorasen los parámetros relacionados con la salud y la
calidad de vida» (Ruiz-González y cols., 2016, pág. 13). El PED
incluyó estrategias de asesoramiento basadas en la evidencia
diseñadas para mejorar los resultados a medio y largo plazo para
personas con diabetes tipo 1 (Steinsbekk y cols., 2012)
Definición operacional
Las «sesiones del PED incluyeron una parte teórica, dedicada a
enseñar los temas considerados esenciales en la educación de los
pacientes con diabetes (enfermedad, dieta, ejercicio, insulina e
hipoglucemia, autoanálisis, automanejo, complicaciones macro- y
microvasculares). Las sesiones también incluyen una parte práctica
en la que los pacientes emplean sus habilidades (p. ej.,
automonitorización y autocuidado, inyecciones de insulina,
recuento de carbohidratos)» (Ruiz-González y cols., 2016, pág. 15)
Variable dependiente: hemoglobina (HbA1c)
Definición conceptual
La HbA1c es un parámetro biomédico del éxito de una persona a la
hora de controlar su diabetes tipo 1 (Ruiz-González y cols., 2016)
Definición operacional
La HbA1c es un parámetro de laboratorio que refleja la glucemia
promedio de un paciente en un periodo de 90 días.
Valoración crítica
Estas variables independiente y dependiente se identificaron con
claridad en el propósito y las hipótesis de investigación declarados
previamente. Las definiciones conceptuales para el PED y la
HbA1c se basaron en los conceptos del estudio (v. tabla 5.3). Las
definiciones operacionales para las variables se encontraban en la
sección de métodos del informe de investigación. Las definiciones
conceptuales para el PED y la HbA1c eran sólidas, pero las
definiciones operacionales podrían haber incluido más detalle para
dirigir la implementación de la intervención del PED y el proceso
de medición de la HbA1c en el estudio.

327
TABLA 5.3
RELACIÓN DE LOS CONCEPTOS CON LAS VARIABLES E
IDENTIFICACIÓN DE LOS TIPOS DE VARIABLES

Datos de Ruiz-González, I., Fernández-Alcántara, M., Guardia-Archilla, T.,


Rodríguez-Morales, S., Molina, A., Casares, D. y cols. (2016). Long-term
effects of an intensive-practical diabetes education program on HbA1c and
self-care. Applied Nursing Research, 31(1), 13-18.

GUÍAS DE VALORACIÓN CRÍTICA


Variables del estudio

1. ¿Las variables están claramente definidas en el propósito del


estudio y/o en los objetivos, preguntas o hipótesis de la
investigación?
2. ¿Qué tipos de variables se analizan en el estudio? ¿En el
estudio se analizan variables independientes y dependientes
o variables de investigación?
3. Si se realiza un estudio cuasiexperimental o experimental, ¿se
identifican y controlan las variables externas?
4. ¿Se definen conceptualmente las variables?
5. ¿Se definen operacionalmente con claridad las variables?

Conceptos de investigación estudiados en


investigación cualitativa
En la investigación cuasiexperimental y experimental, las variables
tienen un enfoque restringido y específico, y pueden cuantificarse

328
(convertirse en números) o manipularse utilizando pasos
específicos que a menudo se desarrollan en un protocolo. Además,
las variables se definen objetivamente para disminuir el sesgo del
investigador, como se indicó en la sección anterior. La investigación
cualitativa es más abstracta, subjetiva y holística que la cuantitativa
e implica el estudio de conceptos de investigación, en lugar de
variables de investigación. Los conceptos de investigación son
ideas, experiencias, situaciones, eventos o culturas que se estudian
en la investigación cualitativa. Por ejemplo, Gorlin y cols. (2016)
realizaron un estudio cualitativo para analizar el fenómeno de vivir
con autismo infantil grave. El problema y el propósito de este
estudio fenomenológico se presentan en la tabla 5.2 y la siguiente
pregunta de investigación dirigió el estudio: «¿Qué experiencia vive
una familia que tiene un hijo con autismo grave?». (Gorlin y cols.,
2016, pág. 582). El concepto de investigación explorado era las
«experiencias de vivir con autismo grave» percibidas por la familia.
En muchos estudios cualitativos, el foco del estudio es definir o
describir el concepto(s) que se estudia(n) (Creswell y Poth, 2018). En
este estudio, el concepto de vivir con autismo grave arrojó luz sobre
las dificultades y desafíos para las familias e identificó sus recursos
necesarios (Gorlin y cols., 2016). En el capítulo 3 se encuentran más
detalles sobre los conceptos de investigación estudiados en la
investigación cualitativa.

Variables demográficas
Las variables demográficas son atributos de los sujetos que se
recogen para describir la muestra. El investigador identifica las
variables demográficas cuando desarrolla una propuesta para
realizar un estudio. Algunas variables demográficas frecuentes son
la edad, la educación, el sexo, el origen étnico (raza), el estado civil,
los ingresos, el empleo y el diagnóstico médico. Una vez recogidos
y analizados los datos de los participantes del estudio en estas
variables demográficas, los resultados se denominan características
demográficas o de la muestra y se usan para describir la muestra
(v. cap. 9). Las características demográficas de un estudio pueden
presentarse en formato de tabla y/o narrativo. Gorlin y cols. (2016)
identificaron los tipos de familiares incluidos en el estudio en la

329
narración de su artículo y presentaron las características
demográficas en una tabla, como se observa en el Ejemplo de
investigación 5.7.

EJEMPLO DE INVESTIGACIÓN 5.7


Características demográficas
Extracto del estudio de investigación
Casi la mitad de las madres (5 de 11) identificaron a miembros ajenos a la
familia inmediata y al hogar (p. ej., abuelos, una tía o un amigo) como
parte de su familia. Los participantes incluyeron: 11 madres, 4 padres, 4
abuelas, 1 tía, 1 hermano y 1 amigo… Las características demográficas de
los 22 participantes individuales de la familia se describen en la [tabla 4].
(Gorlin y cols., 2016, pág. 584)
Valoración crítica
Las variables demográficas identificadas en la tabla 4 incluyeron la
relación con el niño, el sexo, el rango de edad, la raza, la religión y
el máximo nivel educativo. Los datos de muchas de estas variables
demográficas suelen recogerse y analizarse para describir las
muestras del estudio. Las características de la muestra de Gorlin y
cols. (2016) pueden utilizarse para comparar esta muestra con las
muestras de otros estudios. Los investigadores identificaron con
claridad a los 22 participantes en el estudio y proporcionaron una
descripción de calidad de sus características demográficas en la
tabla 4.

TABLA 5.4
Características demográficas de los participantes
individuales de las familias (N = 22)

330
a
El porcentaje puede no ser igual de 100 debido al redondeo al entero más
cercano.
Adaptada de Gorlin, J. B., McAlpine, C. P., Garwick, A. y Wieling, E.
(2016). Severe childhood autism: The family lived experience. Journal of
Pediatric Nursing, 31(6), 586.

PUNTOS CLAVE
• El problema de investigación es un área de interés en la que
existe una laguna en el conocimiento necesario para la
práctica de enfermería. El problema incluye la relevancia,
antecedentes y declaración del problema.
• El propósito de la investigación es una declaración clara y
concisa de la meta o el foco específico del estudio.
• Un problema y un propósito significativos identifican los
hallazgos para la práctica de la enfermería, amplían la
investigación previa, fomentan el desarrollo de teorías y/o
dirigen los intereses o prioridades actuales en enfermería.

331
• La viabilidad de un estudio se evalúa examinando la
experiencia de los investigadores, los costes y la
financiación, la disponibilidad de sujetos, centros y
equipamiento, así como las consideraciones éticas del
estudio.
• Los objetivos, preguntas o hipótesis de la investigación se
formulan para salvar la distancia entre el problema y el
propósito de la investigación, establecidos de forma más
abstracta, y el diseño cuantitativo detallado, los resultados y
la interpretación de los hallazgos.
• Un estudio cualitativo a menudo incluye un problema, un
propósito y preguntas u objetivos de investigación para
dirigir el estudio.
• Una hipótesis es la declaración formal de la(s) relación(es)
esperada(s) entre dos o más variables en una población
especificada en un estudio cuantitativo.
• Los estudios cuasiexperimentales y experimentales deberían
incluir hipótesis que predigan los resultados potenciales del
estudio.
• Las hipótesis pueden describirse utilizando cuatro
categorías: 1) asociativa frente a causal; 2) simple frente a
compleja; 3) no direccional frente a direccional, y 4) de
investigación frente a estadística.
• Las variables son cualidades, propiedades o características
de personas, cosas o situaciones que cambian o varían.
• Las variables de investigación son las cualidades,
propiedades o características que se observan o miden en
los estudios descriptivos y de correlación.
• Una variable independiente es la intervención o tratamiento
que el investigador manipula o modifica para causar un
efecto en la variable dependiente.
• Una variable dependiente es el resultado que el
investigador quiere predecir o explicar.
• En los estudios predictivos de correlación, las variables
independientes se miden para predecir una variable
dependiente.
• Una variable se describe en un estudio mediante el
desarrollo de definiciones conceptuales y operacionales.

332
• Una definición conceptual proporciona el significado teórico
de una variable y deriva de la definición teórica de un
concepto relacionado.
• Las definiciones operacionales indican cómo se aplicará un
tratamiento o variable independiente y cómo se medirá la
variable dependiente o resultado.
• Los conceptos de investigación son las ideas, experiencias,
situaciones, eventos o conductas que se estudian en la
investigación cualitativa.
• Los conceptos de investigación se definen y describen
durante la realización de los estudios cualitativos.
• Las variables demográficas se recogen y analizan para
determinar las características demográficas o de la muestra
que describen los sujetos o participantes del estudio.

BIBLIOGRAFÍA
Agency for Healthcare Research and Quality (AHRQ). About
AHRQ: Mission and budget. Consultada el 9 de enero de 2017, en
https://www.ahrq.gov/cpi/about/mission/index.html, 2016.

Agency for Healthcare Research and Quality (AHRQ). AHRQ


research funding priorities and special emphases notices.
Consultada el 27 de noviembre de 2017, en
https://www.ahrq.gov/funding/priorities-contacts/special-
emphasis-notices/index.html, 2017.

American Association of Critical Care Nurses (AACN). AACN’s


research priority areas. Consultada el 12 de febrero de 2017, en
https://www.aacn.org/nursing-excellence/grants/research-priority-
areas, 2017.

Arslanian-Engoren, C., Scott, L. D. Women’s perceptions of biases


and barriers in their myocardial infarction triage experience. Heart
& Lung. 2016; 45(3):166–172.

333
Brown, S. J. Evidence-based nursing: The research-practice connection,
4th ed. Sudbury, MA: Jones & Bartlett; 2018.

Buet, A., Cohen, B., Marine, M., Scully, F., Alper, P., Simpser, E., et
al. Hand hygiene opportunities in pediatric extended care facilities.
Journal of Pediatric Nursing. 2013; 28(1):72–76.

Burns, K. H., Casey, P. H., Lyle, R. E., Bird, T. M., Fussell, J. J.,
Robbins, J. M. Increasing prevalence of medically complex children
in U.S. hospitals. Pediatrics. 2010; 126(4):638–646.

Centers for Disease Control and Prevention (CDC), Prevalence of


autism spectrum disorder among children aged 8 years—Autism
and developmental disabilities monitoring network, 11 sites, United
States, 2010. Morbidity and Mortality Weekly Reports (MMWR) 2014;
Consultada el 11 de febrero de 2017, en.
https://www.cdc.gov/mmwr/pdf/ss/ss6302.pdf

Charmaz, K. Constructing grounded theory, 2nd ed. Los Angeles, CA:


Sage; 2014.

Chinn, P. L., Kramer, M. K. Knowledge development in nursing: Theory


and process, 9th ed. St. Louis, MO: Elsevier Mosby; 2015.

Creswell, J. W. Research design: Qualitative, quantitative, and mixed


methods approaches, 4th ed. Thousand Oaks, CA: Sage; 2014.

Creswell, J. W., Poth, C. N. Qualitative inquiry & research design:


Choosing among five approaches, 4th ed. Thousand Oaks, CA: Sage;
2018.

de Cordova, P. B., Johansen, M. L., Martinez, M. E., Cimiotti, J. P.


Emergency department weekend presentation and mortality in

334
patients with acute myocardial infarction. Nursing Research. 2017;
66(1):20–27.

Fawcett, J., Garity, J. Evaluating research for evidence-based nursing


practice. Philadelphia, PA: F. A. Davis; 2009.

Flacking, R., Dykes, F. Perceptions and experiences of using a


nipple shield among parents and staff: An ethnographic study in
neonatal units. BMC Pregnancy and Childbirth. 2017; 17(1):1–8.

Gorlin, J. B., McAlpine, C. P., Garwick, A., Wieling, E. Severe


childhood autism: The family lived experience. Journal of Pediatric
Nursing. 2016; 31(6):580–597.

Gray, J. R., Grove, S. K., Sutherland, S. The practice of nursing


research: Appraisal, synthesis, and generation of evidence, 8th ed. St.
Louis, MO: Elsevier Saunders; 2017.

Grove, S. K., Cipher, D. J., Statistics for nursing research: A


workbook for evidence-based practice 2nd ed. Elsevier, St. Louis,
MO, 2017.

Guillaume, D., Crawford, S., Quigley, P. Characteristics of the


middle-age adult inpatient fall. Applied Nursing Research. 2016;
31(1):65–71.

Henson, A., Jeffrey, C. Turning a clinical question into nursing


research: The benefits of a pilot study. Renal Society of Australasia
Journal. 2016; 12(3):99–105.

Hernandez, S. H., Morgan, B. J., Parshall, M. B. Resilience, stress,


stigma, and barriers to mental healthcare in U.S. Air Force nursing
personnel. Nursing Research. 2016; 65(6):481–486.

335
Hopkins, D., Lawrence, I., Mansell, P., Thompson, G., Amiel, S.,
Campbell, M., et al. Improved biomedical and psychological
outcomes 1 year after structured education in flexible insulin
therapy for people with type 1 diabetes: The UK DAFNE
experience. Diabetes Care. 2012; 35(8):1638–1642.

Huang, C., Chang, E., Lai, H. Comparing the effects of music and
exercise with music for older adults with insomnia. Applied Nursing
Research. 2016; 32(1):104–110.

Kaya, H., Turan, Y., Tunali, Y., Aydin, G., Yüce, N., Gürbüz, S.,
Tosun, K. Effects of oral care with glutamine in preventing
ventilator-associated pneumonia in neurosurgical intensive care
unit patients. Applied Nursing Research. 2017; 33(1):10–14.

Kim, H., Sefcik, J. S., Bradway, C. Characteristics of qualitative


descriptive studies; A systematic review. Research in Nursing &
Health. 2017; 40(1):23–42.

Marshall, C., Rossman, G. B. Designing qualitative research, 6th ed.


Los Angeles, CA: Sage; 2016.

McKee, C., Long, L., Southward, L. H., Walker, B., McCown, J. The
role of parental misperception of child’s body weight in childhood
obesity. Journal of Pediatric Nursing. 2016; 31(2):196–203.

Melnyk, B. M., Fineout-Overholt, E. Evidence-based practice in nursing


& healthcare: A guide to best practice, 3rd ed. Philadelphia, PA:
Wolters Kluwer; 2015.

Melnyk, B. M., Gallagher-Ford, L., Fineout-Overholt, E.


Implementing evidence-based practice competencies in health care.
Indianapolis, IN: Sigma Theta Tau International; 2017.

336
Munhall, P. L. Nursing research: A qualitative perspective, 5th ed.
Sudbury, MA: Jones & Bartlett Learning; 2012.

National Institute of Nursing Research (NINR). The NINR Strategic


Plan: Advancing science, improving lives. Consultada el 20 de
febrero de 2017, en
https://www.ninr.nih.gov/sites/www.ninr.nih.gov/files/NINR_StratPlan2016_re
2016.

National Institute of Nursing Research (NINR). About NINR.


Consultada el 27 de noviembre de 2017, en
https://www.ninr.nih.gov/aboutninr, 2017.

Quality and Safety Education for Nurses (QSEN). QSEN


competencies: Pre-licensure knowledge, skills, and attitudes
(KSAs). Consultada el 27 de noviembre de 2017, en
http://qsen.org/competencies/pre-licensure-ksas/, 2017.

Quinn, P. A grounded theory study of how nurses integrate


pregnancy and full-time employment. Nursing Research. 2016;
65(3):170–178.

Rogers, B. Research corner: Is the research project feasible?


American Association of Occupational Health Nurses Journal. 1987;
35(7):327–328.

Rogers, C., Anderson, S. E., Dollahite, J. S., Hill, T. F., Holloman, C.,
Miller, C. K., et al. Methods and design of a 10-week multi-
component family meals intervention: A two group quasi-
experimental effectiveness trial. BMC Public Health. 2017; 17(1):1–15.

Roll, A. E., Bowers, B. J. Promoting healthy aging of individuals


with developmental disabilities: A qualitative case study. Western

337
Journal of Nursing Research. 2017; 39(2):234–251.

Ruiz-González, I., Fernández-Alcántara, M., Guardia-Archilla, T.,


Rodríquez-Morales, S., Molina, A., Casares, D., et al. Long-term
effects of an intensive-practical diabetes education program on
HbA1c and self-care. Applied Nursing Research. 2016; 31(1):13–18.

Shadish, W. R., Cook, T. D., Campbell, D. T. Experimental and quasi-


experimental designs for generalized causal inference. Chicago, IL: Rand
McNally; 2002.

Sherwood, G., Barnsteiner, J. Quality and safety in nursing: A


competency approach to improving outcomes, 2nd ed. Ames, IA: Wiley-
Blackwell; 2017.

Steinsbekk, A., Rygg, L. O., Lisulo, M., Rise, M. B., Fretheim, A.,
Group based diabetes self-management education compared to
routine treatment for people with type 2 diabetes mellitus: A
systematic review with meta-analysis. BMC Health Services Research
2012; 12:213 Consultada el 30 de enero de 2018, en.
http://www.biomedcentral.com/1472-6963/12/213

Strohfus, P. K., Kim, S. C., Palma, S., Duke, R. A., Remington, R.,
Roberts, C. Immunizations challenge healthcare personnel and
affects immunization rates. Applied Nursing Research. 2017;
33(1):131–137.

US Department of Health and Human Services (U.S. DHHS),


Healthy People: 2020 Topics and objectives Consultada el 25 de
enero de 2017, en. https://www.healthypeople.gov/2020/topics-
objectives, 2017

US Department of Labor. Quick stats of women workers 2010.

338
Consultada el 12 de febrero de 2017, en
https://www.dol.gov/wb/factsheets/qs-womenwork2010.htm, 2010.

Waltz, C. F., Strickland, O. L., Lenz, E. R. Measurement in nursing


and health research, 5th ed. New York, NY: Springer Publishing
Company; 2017.

Williams, T., Szekendi, M., Thomas, S. An analysis of patient falls


and fall prevention programs across academic medical centers.
Journal of Nursing Care Quality. 2014; 29(1):19–29.

World Health Organization (WHO). Guidelines for hand hygiene in


health care. Consultada el 20 de febrero de 2017, en
http://who.int/gpsc/5may/tools/9789241597906/en, 2009.

World Health Organization (WHO). About WHO. Consultada el 25


de enero de 2017 en http://www.who.int/about/en/, 2017.

339
CAPÍTULO 6

Comprensión y
valoración crítica de
la revisión de la
literatura científica
Christy J. Bomer-Norton

La página web de la National Guideline Clearinghouse de la Agency for


Healthcare Research and Quality (AHRQ) se cerró en 2018. Puede
consultarse más información en https://www.ahrq.gov/.

ÍNDICE DEL CAPÍTULO

Propósito de la revisión de la literatura, 151


Fuentes incluidas en una revisión de la literatura, 153
Valoración crítica de la revisión de la literatura, 155
Revisión de la literatura, 160
Puntos clave, 169
Bibliografía, 169

340
OBJETIVOS DE APRENDIZAJE
Tras concluir este capítulo, el lector debería ser capaz de:
1. Analizar los propósitos de la revisión de la literatura en la
investigación cuantitativa y cualitativa.
2. Valorar críticamente el apartado de revisión de la literatura de
un estudio publicado en lo referente a fuentes de calidad
actuales, contenido relevante y síntesis del contenido
relevante.
3. Llevar a cabo una búsqueda informatizada de la bibliografía.
4. Escribir una revisión de la literatura a partir de una síntesis de
bibliografía valorada de forma crítica para facilitar el uso del
conocimiento basado en la evidencia en la práctica enfermera.

Una revisión de la literatura de alta calidad contiene el


conocimiento teórico y científico actual sobre un tema concreto. La
revisión identifica lo conocido y desconocido sobre ese tema. Los
profesionales de enfermería en la práctica clínica revisan la
literatura para sintetizar la evidencia disponible, con el fin de
encontrar una solución a un problema en la práctica o mantenerse
al día en dicha práctica. Cuando los estudiantes y profesionales de
enfermería leen los estudios, deben valorar críticamente la revisión
de la literatura, así como los demás componentes del estudio. La
valoración crítica de una revisión de la literatura existente sobre un
tema comienza con la comprensión del propósito de dicha revisión
en los estudios cuantitativos y cualitativos, y de la calidad relativa
de los diferentes tipos de referencias que se citan. Las guías para la
valoración crítica de la revisión de la literatura que figuran en este
capítulo se pueden aplicar a estudios tanto cuantitativos como
cualitativos. Además, se proporcionan ejemplos de valoraciones
críticas de revisiones de la literatura de ambos tipos de estudios.
Una revisión de la literatura es el proceso destinado a encontrar
informes de investigación relevantes y fuentes teóricas, valorar

341
críticamente esas fuentes, sintetizar los resultados y desarrollar una
lista de referencias precisa y completa. Como base de este proceso,
en este capítulo se incluye información sobre el modo de encontrar
las referencias, seleccionar las que sean relevantes, organizar lo que
se encuentre y escribir una síntesis lógica de los hallazgos.
Puede que sea necesario revisar la bibliografía existente sobre un
tema como parte de una tarea en el ámbito académico o como
proyecto en el ámbito clínico, especialmente en proyectos de
hospitales Magnet. Los profesionales de enfermería de hospitales
Magnet deben implementar la práctica basada en la evidencia
(PBE), identificar problemas y ayudar en la recogida de datos para
estudios de investigación (American Nurses Credentialing Center
[ANCC], 2017). La revisión de la literatura es un primer paso en la
implementación de la PBE y la identificación de problemas de
investigación.

PROPÓSITO DE LA REVISIÓN DE LA
LITERATURA
La revisión de la literatura en informes de investigación publicados
proporciona el estado actual o antecedentes del problema
estudiado. Esta revisión incluye: 1) la descripción del conocimiento
actual de un problema de la práctica clínica; 2) la identificación de
las lagunas existentes en el conocimiento del problema, y 3) la
explicación de cómo el estudio publicado contribuyó al desarrollo
del conocimiento en esta área. El alcance de una revisión de la
literatura debe ser lo suficientemente amplio como para permitir
que el lector se familiarice con el problema objeto de investigación y
lo suficientemente reducido como para incluir solo las fuentes más
relevantes.

Propósito de la revisión de la literatura en


investigación cuantitativa
La revisión de la literatura en la investigación cuantitativa se realiza
para orientar la planificación y la ejecución de un estudio. La
principal revisión existente sobre el tema investigado se efectúa al

342
comienzo del proceso de investigación (antes de iniciar el estudio).
Se realiza otra breve revisión al terminar el estudio para identificar
los estudios publicados desde la revisión inicial, especialmente si ha
transcurrido un año o más desde que comenzó el estudio. Pueden
encontrarse nuevos artículos con información relevante para la
interpretación de los hallazgos. Los resultados de ambas revisiones
se incluirán en el informe de investigación. El propósito de la
revisión de la literatura es similar para los diferentes tipos de
estudios cuantitativos: descriptivos, de correlación,
cuasiexperimentales y experimentales.
Los informes de investigación cuantitativa pueden incluir citas
de fuentes relevantes en todos los apartados del informe. Los
investigadores incluyen fuentes en la introducción para resumir los
antecedentes, estado actual del tema y la importancia del problema
de investigación. Pueden incluirse citas sobre el número de
pacientes afectados, el coste del tratamiento y las consecuencias en
términos de sufrimiento humano, salud física, discapacidad y
mortalidad. El apartado de revisión de la literatura puede no
etiquetarse explícitamente, pero puede incluirse en la introducción.
La revisión incluye bibliografía teórica y de investigación que
documenta el conocimiento actual sobre el problema estudiado.
Un investigador cuantitativo desarrolla el marco de investigación
de su propuesta o artículo a partir de la literatura teórica y, algunas
veces, a partir de informes de investigación, dependiendo del
enfoque del estudio. A semejanza de la revisión de la literatura, el
marco de investigación puede que no esté explícitamente
identificado, pero puede incluirse en la introducción, la revisión o
los antecedentes de un estudio. Un marco teórico es una
herramienta organizativa que ubica el estudio en un cuerpo de
conocimiento más amplio. El estudio es como una pieza de un
rompecabezas que tiene un lugar y un contexto en un
rompecabezas más amplio (el marco). Los marcos teóricos se
describen en detalle en el capítulo 7.
El apartado de métodos del informe de investigación describe el
diseño, la muestra, el proceso para la obtención de la muestra, los
métodos de medición, el tratamiento y el proceso de recogida de
datos, así como una lista de los análisis estadísticos realizados. Las
referencias bibliográficas pueden citarse en varias partes del

343
apartado de métodos en apoyo de la idoneidad de los métodos
usados en el estudio. El apartado de resultados incluye los
resultados de los análisis estadísticos y también las fuentes para
validar las técnicas analíticas que se utilizaron para abordar las
preguntas o hipótesis de investigación (Grove y Cipher, 2017).
Igualmente, podrían incluirse fuentes para comparar el análisis de
los datos del presente estudio con los resultados de estudios
previos. El apartado de discusión del informe de investigación
compara los hallazgos con los de otros estudios si no han sido
incluidos previamente en el apartado de resultados. En el apartado
de discusión también se incluyen las conclusiones, que son una
síntesis de los hallazgos de investigaciones anteriores y de los del
presente estudio.

Propósito de la revisión de la literatura en la


investigación cualitativa
En los informes de investigación cualitativa, la introducción será
similar al correspondiente apartado del informe de un estudio
cuantitativo, porque los investigadores documentan los
antecedentes y la importancia del problema de investigación. Los
investigadores a menudo incluyen citas para apoyar la necesidad
de estudiar el tema elegido (Creswell y Poth, 2018). Sin embargo, no
suele llevarse a cabo una nueva revisión de la literatura por dos
razones. Una de ellas es que los estudios cualitativos se realizan a
menudo sobre temas acerca de los cuales se sabe muy poco, así que
existe poca bibliografía disponible para revisar. La otra razón es que
algunos investigadores cualitativos deliberadamente no revisan a
fondo la literatura existente antes de realizar el estudio porque no
quieren que sus expectativas sobre el tema produzcan sesgos en la
recogida, el análisis de datos y los hallazgos (Munhall, 2012). Esto
es congruente con la expectativa que tienen algunos investigadores
cualitativos de permanecer abiertos a las perspectivas de los
participantes. En los apartados de métodos, resultados y discusión,
los investigadores cualitativos incluirán referencias bibliográficas
para apoyar el uso de métodos específicos y ubicar los hallazgos en
el contexto de lo ya conocido.
El propósito, el alcance y la duración de la revisión de la

344
literatura variarán en función de los diferentes enfoques
cualitativos (Gray, Grove y Sutherland, 2017). Los fenomenólogos
se encuentran entre quienes tienden a retrasar la revisión de la
literatura hasta después de haber terminado la recogida de datos y
el análisis inicial (Munhall, 2012). Estos investigadores revisarán la
literatura sobre el tema en las fases finales del análisis e
interpretarán los hallazgos en un contexto más amplio de
conocimientos teóricos y empíricos. Los investigadores de teoría
fundamentada incluirán una revisión mínima de los estudios
relevantes al comienzo del proceso de investigación. Esta revisión
no será más que un medio para que el investigador esté al tanto de
los estudios que se han llevado a cabo previamente y de que existe
un problema de investigación (Corbin y Strauss, 2008), pero la
información de estos estudios no se utiliza para dirigir la recogida
de datos o el desarrollo teórico del estudio actual (Walls, Pahoo y
Fleming, 2010). El investigador utiliza la bibliografía
principalmente para explicar, respaldar y difundir la teoría
elaborada en el estudio (Charmaz, 2014).
La revisión de la literatura en una investigación etnográfica es
similar a la de la investigación cuantitativa. En los primeros
estudios etnográficos con grupos desconocidos de personas de
lugares distantes, no se disponía de publicaciones específicas de la
cultura para ser revisada antes de la recogida de datos. Sin
embargo, la literatura teórica y filosófica estaba disponible y sigue
siendo utilizada para proporcionar un marco o perspectiva a través
del cual los investigadores realizan la recogida de datos. El
problema de investigación en una etnografía se basa en la revisión
de la literatura científica publicada que identifica lo poco que se
sabe acerca de la cultura de interés (Creswell y Poth, 2018). La
revisión también informa del proceso de investigación al
proporcionar una comprensión general de las características
culturales que van a estudiarse. Por ejemplo, la revisión de la
literatura de una etnografía de la enfermería de Uganda revelaría
que el sistema de salud cuenta con hospitales de referencia,
hospitales de distrito y centros de salud. Con esta información, los
investigadores pueden decidir desarrollar un plan de recogida de
datos para observar a los profesionales de enfermería en cada
entorno o reducir su estudio etnográfico a los centros de salud. Otro

345
ejemplo sería el etnógrafo que estudia las conductas de salud de los
refugiados birmanos en un barrio específico. A partir de la
literatura publicada, el investigador aprende que los miembros
mayores de la comunidad son muy respetados y, como resultado de
ello, el investigador podría buscar el apoyo de los refugiados de
mayor edad para facilitar el acceso a otros miembros en la
comunidad. Los etnógrafos regresan a la literatura durante el
análisis y la interpretación de los datos para ampliar la
comprensión de la cultura por parte de los lectores.
Los investigadores que utilizan el enfoque cualitativo
exploratorio-descriptivo pueden llevar a cabo un estudio porque
han revisado la literatura y han observado que existen pocos
conocimientos disponibles. Los investigadores de estudios
cualitativos de tipo exploratorio-descriptivo quieren entender mejor
una situación o un problema práctico para identificar las soluciones
(Gray y cols., 2017). El capítulo 3 contiene más información sobre la
revisión de la literatura en estudios cualitativos.

FUENTES INCLUIDAS EN UNA


REVISIÓN DE LA LITERATURA
La literatura o bibliografía sobre un tema está constituida por todas
las fuentes escritas relativas al tema que se haya seleccionado,
incluidos artículos publicados en publicaciones periódicas o
revistas, publicaciones en internet, monografías, enciclopedias,
comunicaciones a congresos, tesis, trabajos de fin de máster, libros
de texto y otros libros. También se pueden incluir los sitios web y
los informes elaborados por organismos estatales fiables,
organizaciones intergubernamentales, así como organizaciones
profesionales. Se cita cada fuente revisada por el autor y utilizada
para escribir la revisión. Una cita es el acto de mencionar una
fuente, parafraseando el contenido de dicha fuente, usándola como
ejemplo o presentándola como apoyo de la postura adoptada. Cada
cita debe tener su referencia correspondiente en el listado
bibliográfico. La referencia es la documentación del origen de las
ideas citadas o parafraseadas y proporciona información suficiente
para que el lector pueda localizar el material original. Esta

346
información suele contener el nombre del primer autor, el año y el
título de la publicación y, cuando sea necesario, el título de una
publicación periódica o monográfica, el volumen, las páginas y
cualquier otra información que facilite su localización según se
requiere por los manuales de estilo de escritura. El estilo
desarrollado por la American Psychological Association (APA,
2010) se utiliza frecuentemente en los programas y revistas de
educación de enfermería. Más adelante, en este capítulo, se facilita
más información sobre el estilo de la APA.

Tipos de publicaciones
Un artículo es un documento sobre un tema específico y puede
publicarse junto con otros artículos sobre temas similares en
revistas (publicación periódica), enciclopedias o libros publicados.
Cuando forman parte de un libro publicado, los artículos pueden
denominarse capítulos. Una publicación periódica, como una
revista, se edita a lo largo del tiempo y se numera secuencialmente
a lo largo de los años publicados. Esta numeración secuencial
incluye el año, el volumen, el ejemplar y la numeración de páginas
de la revista. Una monografía —como un libro sobre un tema
específico, un registro de actas de conferencias o un folleto— suele
ser una publicación puntual. Las publicaciones periódicas y las
monografías se encuentran disponibles en diferentes soportes,
incluidos online e impresos. Una enciclopedia es una recopilación
acreditada de información sobre diversos temas ordenados
alfabéticamente que puede aportar información general y conducir
a otras fuentes, pero rara vez se cita en artículos y publicaciones
académicas. Algunas enciclopedias online son publicaciones
electrónicas que han sido objeto del mismo nivel de revisión que las
enciclopedias publicadas. Otras enciclopedias online, como
Wikipedia, están en un formato editable abierto y, por tanto, la
credibilidad de su información es variable. El uso de Wikipedia
como fuente de información profesional es controvertido (Luyt,
Ally, Low e Ismail, 2010; Younger, 2010). Cuando se escriba una
revisión de la literatura, Wikipedia puede aportar ideas de otras
fuentes de información que puedan querer explorarse, pero se debe
verificar con los profesores si Wikipedia o cualquier otra

347
enciclopedia puede citarse para tareas de un curso o asignadas en el
entorno académico.
Las principales organizaciones profesionales pueden publicar
documentos seleccionados por un proceso de revisión que se hayan
presentado en su congreso; a estos documentos se les denomina
actas de conferencias. Estas publicaciones pueden ser impresas u
online. Las actas de conferencias pueden incluir los resultados de
estudios piloto y los resultados preliminares de estudios en curso.
Un trabajo de fin de máster es el informe de un proyecto de
investigación realizado por un estudiante de posgrado como parte
de los requisitos para la obtención de un título de máster. Una tesis
es un informe de un proyecto de investigación amplio, a veces
original, que se realiza como requisito final para obtener un título
de doctorado. Las tesis y trabajos de fin de máster pueden ser
citados en una revisión de la literatura. En algunos casos, puede
publicarse un artículo basado en la tesis o el trabajo de fin de máster
de un estudiante.
Las revistas académicas son publicaciones periódicas que
incluyen artículos de investigación y de temas distintos a la
investigación relacionados con una disciplina académica específica
y/o con la metodología de la investigación. Las revistas clínicas son
publicaciones periódicas que incluyen informes de investigación y
artículos no relacionados con la investigación sobre problemas de la
práctica clínica y otras cuestiones profesionales de una disciplina
específica. En la tabla 6.1 se incluyen ejemplos de revistas de
enfermería académica y clínica que publican una cantidad
considerable de investigación de enfermería.

TABLA 6.1
ALGUNAS REVISTAS DE ENFERMERÍA QUE PUBLICAN
NUMEROSAS INVESTIGACIONES

348
Adaptada de Gray, J. R., Grove, S. K. y Sutherland, S. (2017). The practice
of nursing research: Appraisal, synthesis, and generation of evidence (8.ª
ed.). San Luis, Missouri: Elsevier Saunders, pág. 81.
Los lectores estarán familiarizados con los libros de texto como
fuente de información para los cursos académicos. Otros libros
sobre teorías, métodos y eventos también se pueden citar en una
revisión de la literatura. Para valorar la calidad de un libro, se debe
tener en cuenta la cualificación del autor en relación con el tema
tratado y se debe revisar la evidencia que el autor ofrece para
sustentar las premisas y conclusiones de su libro. En los libros de
texto y de otro tipo, los capítulos publicados podrían haber sido
escritos por diferentes personas, por lo que serán citados de manera
distinta que cuando se cita el libro en su conjunto (se describe más
adelante en este capítulo). Es importante tener en cuenta esto al
comprobar las citas y al escribir la revisión de la literatura.
El acceso electrónico a artículos y libros se ha incrementado
drásticamente, de modo que una gran variedad de literatura
publicada está más disponible. Además, los sitios web son una
fuente de información fácilmente accesible. Sin embargo, no todos
los sitios web son válidos y adecuados para ser citados en una
revisión de la literatura. Los sitios web pueden contener
información que carece de solidez científica o que presenta sesgos
por intereses comerciales. Por ejemplo, el sitio web de una empresa
farmacéutica que vende diuréticos puede no ser una fuente
adecuada para obtener estadísticas sobre el tratamiento de la
hipertensión. En cambio, los sitios web creados y financiados por
agencias gubernamentales, como los Centros para el Control y la
Prevención de Enfermedades, organizaciones intergubernamentales
como la Organización Mundial de la Salud, y organizaciones
profesionales como la American Nurses Association se consideran
referencias apropiadas para ser citadas.

Contenido de las publicaciones


Las referencias citadas en las revisiones de la literatura incluyen dos
tipos principales de contenidos: teórico y empírico. La literatura
teórica incluye el análisis de conceptos, modelos, teorías y marcos
conceptuales que sustentan el problema de investigación y

349
propósito de investigación seleccionados. Las fuentes teóricas
pueden encontrarse en libros, publicaciones periódicas y
monografías. Los teóricos de la enfermería han escrito libros para
describir el desarrollo y contenido de sus teorías. Otros libros
contienen resúmenes de varias teorías. En un estudio publicado, se
describen y resumen las fuentes teóricas y conceptuales para
reflejar la comprensión actual del problema de investigación y
proporcionar un fundamento al marco de investigación.
La literatura empírica en el apartado de revisión de la literatura
de un artículo son las publicaciones que contienen los
conocimientos derivados de la investigación. En otras palabras, el
conocimiento se basa en datos obtenidos de la investigación (basada
en datos). La literatura basada en datos consta de los informes de la
investigación y los estudios publicados, presentes en revistas, en
internet o en libros, y estudios no publicados, como trabajos de fin
de máster y tesis doctorales.

Calidad de las fuentes


La mayoría de las referencias citadas en revisiones de la literatura
de calidad son fuentes primarias que están revisadas por pares. Una
fuente primaria está escrita por la persona que da origen o se
encarga de generar las ideas publicadas. Un informe de
investigación escrito por los investigadores que realizaron el
estudio es una fuente primaria. El desarrollo por un teórico de una
teoría u otro contenido conceptual es una fuente primaria. Una
fuente secundaria resume o cita el contenido de fuentes primarias.
Los autores de las fuentes secundarias parafrasean los trabajos de
los investigadores y teóricos, e interpretan lo que escribió el autor
principal. Como resultado de ello, la información derivada de
fuentes secundarias puede ser una interpretación errónea de los
pensamientos de los autores originales. Las fuentes secundarias se
utilizan solo si las fuentes primarias no pueden ser localizadas o si
la fuente secundaria ofrece ideas creativas o una organización
singular de la información que no se encontraba en una fuente
primaria. La revisión por pares significa que el autor del informe
de investigación, de la descripción clínica o de la explicación teórica
remitió un manuscrito al editor de una publicación, la cual cuenta

350
con académicos familiarizados con el tema para revisar el
manuscrito. Estos académicos proporcionan su opinión al editor
sobre si el manuscrito es adecuado en su formato actual, cumple
con los estándares de calidad y es apropiado para la revista. Un
artículo revisado por pares es objeto de un escrutinio significativo y
su contenido se considera fiable.
Una revisión de la literatura de calidad incluye fuentes relevantes
y actuales. Los estudios relevantes son los que tienen una relación
directa con el problema de interés. Las fuentes actuales son las
publicadas en los 5 años previos a la publicación del manuscrito.
Las fuentes citadas deben ser completas y actuales. Algunos
problemas se han estudiado durante décadas y la revisión de la
literatura a menudo incluye estudios iniciales y de referencia que se
realizaron hace años. Los estudios iniciales son los primeros
estudios sobre un tema particular que señalaron el comienzo de una
nueva forma de pensar sobre ese tema y, en ocasiones, se
denominan estudios clásicos. Los estudios de referencia son
proyectos de investigación importantes que han generado un
conocimiento que influye en una disciplina y, a veces, en la
sociedad en su conjunto. Estos estudios con frecuencia se replican o
sirven como base para el desarrollo de más estudios. Algunos
autores describen un estudio de referencia como un estudio
pionero. Por tanto, es adecuado citar algunos estudios significativos
más antiguos para el desarrollo del conocimiento del tema que se
está revisando. Sin embargo, la mayoría de las publicaciones citadas
deben ser actuales. Los estudios de replicación son reproducciones
o repeticiones de un estudio que los investigadores llevaron a cabo
para determinar si los resultados del estudio original se pueden
obtener de forma constante en diferentes entornos y con distintos
participantes en el estudio. Los estudios de replicación son
importantes con el fin de acumular evidencia para la práctica
clínica. Un estudio de replicación que respalda los hallazgos del
estudio original aumenta la credibilidad de dichos hallazgos y
fortalece la evidencia para la práctica. Un estudio de replicación que
no respalde los hallazgos del estudio original plantea dudas sobre
la credibilidad de dichos hallazgos.
Las síntesis de los estudios de investigación, otro tipo de
literatura basada en datos, pueden ser citadas en la revisión de la

351
literatura. Una síntesis de la investigación puede ser una revisión
sistemática de la bibliografía, un metaanálisis de estudios
cuantitativos, una metasíntesis de estudios cualitativos o una
revisión sistemática de métodos mixtos. Estas publicaciones son
valoradas por su rigor y contribución a la PBE (v. caps. 1 y 13).

VALORACIÓN CRÍTICA DE LA
REVISIÓN DE LA LITERATURA
La valoración de la revisión de la literatura de un estudio publicado
implica evaluar la calidad de su contenido y las fuentes
presentadas. Una revisión de la literatura correctamente organizada
incluye lo que se conoce y se desconoce sobre el problema de
estudio e identifica el foco de atención del estudio actual. Como
resultado de ello, la revisión sirve de base para alcanzar el
propósito del estudio y puede organizarse de acuerdo con las
variables (cuantitativas) o conceptos (cualitativos) en la declaración
del propósito. Las fuentes citadas deben ser relevantes y actuales
para el problema y el propósito del estudio. El revisor debe
localizar y revisar las fuentes o resúmenes respectivos para
determinar si estas fuentes son relevantes. Para juzgar si se citan
todas las fuentes relevantes, se debería hacer una búsqueda
exhaustiva de lo publicado sobre el tema para determinar cuáles
son las fuentes relevantes. Esto requiere mucho tiempo y no suele
hacerse al valorar un artículo. Sin embargo, puede revisarse el
listado bibliográfico y determinar el tema central de las fuentes, el
número de fuentes basadas en datos y teóricas citadas y dónde y
cuándo se publicaron dichas fuentes. Las fuentes deben ser
recientes y actualizadas hasta la fecha de aceptación del documento
para su publicación. La mayoría de los artículos indican en la
primera página del estudio cuándo fueron aceptados para su
publicación.
Aunque el objetivo de la revisión de la literatura para un estudio
cuantitativo es diferente de su finalidad para un estudio cualitativo,
las guías para la valoración crítica de la revisión de la literatura de
estudios cuantitativos y cualitativos son las mismas. Sin embargo,
debido a que los propósitos de la revisión son diferentes, el tipo de

352
fuentes y la extensión de la literatura citada pueden variar.

GUÍAS DE VALORACIÓN CRÍTICA


Revisión de la literatura

1. Fuentes de calidad
• ¿La mayoría de las fuentes o publicaciones
referenciadas han sido revisadas por pares
(Aveyard, 2014)?
• ¿Son la mayoría de las referencias fuentes
primarias?
• ¿Los autores justifican el hecho de citar referencias
que no están revisadas por pares o no fuentes
primarias?
2. Fuentes actuales
• ¿Son las referencias actuales (número y porcentaje
de fuentes publicadas en los últimos 10 años y en
los últimos 5 años)?
• ¿Las referencias más antiguas de 10 años son
estudios de referencia, iniciales o de replicación?
• ¿Las referencias más antiguas de 10 años se citan
para respaldar los métodos de medición o el
contenido teórico?
3. Contenido relevante
• ¿El contenido se relaciona directamente con los
conceptos o variables del estudio?
• ¿Los tipos de fuentes y disciplinas de los autores de
la fuente son apropiados para los conceptos o
variables del estudio?
4. Síntesis del contenido relevante
• ¿Se ha realizado una valoración crítica y síntesis de
los estudios (Aveyard, 2014; Fawcett y Garity, 2009;
Gray y cols., 2017; Hart, 2009; Machi y McEvoy,
2016)?
• ¿Se trata de un resumen, presentado de forma clara
y concisa, del conocimiento empírico y teórico

353
actual del área de estudio, incluida la identificación
de aquello que se sabe y se desconoce (Machi y
McEvoy, 2016; O’Mathuna y Fineout-Overholt,
2015)?
• ¿El estudio aborda una laguna del conocimiento en
las fuentes publicadas identificada en la revisión de
la literatura?

Valoración crítica de una revisión de la


literatura de un estudio cuantitativo
Moscou-Jackson, Allen, Kozachik y cols. (2016, pág. 38) realizaron
un análisis transversal de un estudio de cohortes prospectivo (v. los
diseños en el cap. 8) «para 1) describir la prevalencia de los
síntomas de insomnio y 2) identificar los factores predictivos
biopsicosociales en adultos que viven en la comunidad con
drepanocitosis (anemia de células falciformes)». La sección titulada
«Antecedentes» se valora críticamente como ejemplo de revisión de
la literatura en un estudio cuantitativo. Además de las referencias
incluidas en la revisión de la literatura, estos autores citaron
referencias en todo el informe de investigación. Se incluyen todas
las referencias citadas en la valoración crítica, excepto la escala no
publicada de Sanders-Phillips y Harrell (sin fecha). Dado que no se
indicaba la fecha de la fuente, su actualidad no se pudo evaluar.
Las citas del estudio cuantitativo (Moscou-Jackson, Allen,
Kozachik, y cols., 2016) y la sección de revisión de la literatura se
presentan en el Ejemplo de investigación 6.1.

EJEMPLO DE INVESTIGACIÓN 6.1


Revisión de la literatura: cuantitativa
Extracto del estudio de investigación

Antecedentes: se estima que 90.000-100.000 personas en Estados


Unidos tienen drepanocitosis, una enfermedad genética grave
debida a una anomalía del gen de la hemoglobina, HbS (National

354
Heart Lung and Blood Institute, 2015)…
Dos factores predictivos conocidos de trastornos del sueño en
pacientes con drepanocitosis son la depresión (Palermo y Kiska,
2005; Wallen y cols., 2014) y el dolor (Valrie y cols., 2007; Wallen
y cols., 2014)… Además, la gravedad y la actividad de la
enfermedad se identifican de forma constante en los estudios como
factores de riesgo de problemas del sueño en poblaciones con
enfermedades crónicas (Chandrasekhara, Jayachandran,
Rajasekhar, Thomas y Narisimulu, 2009; Frech y cols., 2011;
[Martínez-Lapiscina, Erro, Ayuso y Jericó], 2012).
Aunque algunos estudios han investigado los trastornos del sueño
en adultos con drepanocitosis (Sogutlu y cols., 2011; Wallen y
cols., 2014), hasta el momento ningún estudio ha investigado
sistemáticamente los síntomas de insomnio en esta población
(Moscou-Jackson, Allen, Kozachik, y cols., 2016).

Valoración crítica
1 Fuentes de calidad
Moscou-Jackson, Allen, Kozachik y cols. (2016) escogieron fuentes
de calidad para su revisión de la literatura. Citaron 46 referencias
en su informe de investigación, de las cuales la mayoría eran
fuentes de investigación originales y primarias. De las referencias
citadas, 39 (85%) eran de revistas académicas o clínicas, todas
revisadas por pares. Las referencias que no eran de revistas
procedían de fuentes creíbles, como una agencia federal, los
National Institutes of Health, Heart, el Lung and Blood Institute o
la American Psychiatric Association. La precisión de las referencias
citadas es fundamental; se observaron algunos errores de cita en el
texto y en la lista de referencias de Moscou-Jackson, Allen,
Kozachik y cols. (2016). Las correcciones se indican entre corchetes.
2 Fuentes actuales
Como ya se ha indicado, la escala no publicada de Sanders-Phillips
y Harrell (sin fecha) carecía de fecha, por lo que no se puede
evaluar su actualidad. En las otras 45 referencias citadas se evaluó
su actualidad. Una referencia, Moscou-Jackson, Allen, Smith y
Haywood (2016) con la fecha indicada «en prensa» en la lista de
referencias no se había publicado cuando se publicó el artículo de

355
Moscou-Jackson, Allen, Kozachik y cols. (2016), pero la fecha de
publicación de 2016 se verificó y la referencia se incluye en la
evaluación. De las referencias, 34 (76%) se publicaron en los 10
años previos (en o desde 2006) y 21 (47%) se publicaron en los
últimos 5 años (en o desde 2011). Las referencias sobre
herramientas de medición estaban entre las 11 referencias más
antiguas de 10 años que Moscou-Jackson, Allen, Kozachik y cols.
(2016) citaron y su inclusión era apropiada.
3 Contenido relevante
Moscou-Jackson, Allen, Kozachik y cols. (2016) incluyeron
referencias relacionadas directamente con las variables del estudio,
como la drepanocitosis, sueño, dolor y depresión. Se incluyeron
referencias para respaldar la fiabilidad, validez y puntuación de los
instrumentos utilizados para medir el insomnio, dolor, depresión y
estrés vital. Las revistas citadas correspondían a una amplia gama
de disciplinas apropiadas para el tema de investigación, como
enfermería, medicina, salud pública, ciencia de la conducta y
fuentes interdisciplinares. La Teoría de los Síntomas Desagradables
desarrollada por Lenz, Pugh, Milligan, Gift y Suppe (1997) se
utilizó como marco para el estudio y fue la única fuente teórica
citada.
4 Síntesis del contenido relevante
En su revisión, Moscou-Jackson, Allen, Kozachik y cols. (2016)
centraron su discusión en la relevancia de las referencias para las
variables del estudio en lugar de en los puntos fuertes de dichas
referencias. La revisión podría haberse reforzado mediante la
valoración crítica de los estudios incluidos en la revisión. La
revisión proporcionó un argumento lógico para apoyar la
metodología del estudio y su propósito. El argumento lógico, junto
con la calidad y relevancia de las fuentes, son puntos fuertes de la
revisión.
El primer párrafo de la revisión ofrecía un breve trasfondo sobre
la fisiología de la drepanocitosis y los datos numéricos de las
personas afectadas por esta enfermedad en Estados Unidos. Esta
información dotó de contexto a toda la revisión. Las revisiones de
la literatura suelen comenzar con el trasfondo y la relevancia del
problema para poner de relieve el impacto negativo del problema

356
específico y la utilidad potencial de la investigación. En el segundo
párrafo de su revisión, Moscou-Jackson, Allen, Kozachik y cols.
(2016) proporcionaban evidencia de los trastornos del sueño en las
personas con drepanocitosis.
Moscou-Jackson, Allen, Kozachik y cols. (2016) sintetizaron la
información sobre los factores predictivos identificados de los
trastornos del sueño en pacientes con drepanocitosis y
proporcionaron dos referencias para cada uno de los factores
predictivos. También sintetizaron la información y señalaron que
«la gravedad y la actividad de la enfermedad se identifican de
forma constante en los estudios como factores de riesgo de
problemas de sueño en las poblaciones con enfermedades
crónicas» (Moscou-Jackson, Allen, Kozachik y cols., 2016, pág. 39).
Los investigadores suelen resumir la información sobre lo que se
sabe en una población similar para justificar el uso de una variable
en su estudio actual cuando no se dispone de información sobre
esa variable en su población de pacientes con drepanocitosis.
Los investigadores proporcionaron una síntesis clara de la
información conocida y desconocida sobre la drepanocitosis y los
trastornos del sueño. Moscou-Jackson, Allen, Kozachik y cols.
(2016, pág. 39) identificaron claramente una laguna en la literatura
científica sobre el tema en cuestión. «Aunque algunos estudios han
investigado los trastornos del sueño en adultos con drepanocitosis
(Sogutlu y cols., 2011; Wallen y cols., 2014), hasta el momento
ningún estudio ha investigado sistemáticamente los síntomas de
insomnio en esta población». El propósito del estudio era abordar
esta laguna de la bibliografía. A menudo, en una revisión de la
literatura, como se observa en el artículo de Moscou-Jackson, Allen,
Kozachik y cols. (2016), la laguna o falta de publicaciones sobre el
tema se presenta justo antes del propósito del estudio como
justificación para el estudio actual.
Moscou-Jackson, Allen, Kozachik y cols. (2016, pág. 38)
observaron que «…una ligera mayoría (55%) de la muestra refería
sintomatología de insomnio clínicamente significativo… Aunque
los síntomas de insomnio se asociaban con varias características
biopsicosociales, los síntomas depresivos y el dolor agudo eran los
únicos factores predictivos independientes». Estos investigadores
recomendaban que en los adultos con drepanocitosis se evaluase el

357
insomnio y recibiesen el tratamiento necesario. La identificación
del dolor y la depresión, con derivación a los especialistas
oportunos, también debería ser un elemento central de la
asistencia.

Valoración crítica de una revisión de la


literatura en un estudio cualitativo
El estudio de teoría fundamentada realizado por Koehn, Ebright y
Draucker (2016) se presenta como ejemplo de valoración crítica de
una revisión de la literatura de un estudio cualitativo. El informe de
investigación de su estudio sobre «la toma de decisiones de los
profesionales de enfermería respecto a la notificación de errores
médicos» (pág. 566) no tiene una sección titulada «revisión de la
literatura». Koehn y cols. (2016) citaron referencias de publicaciones
previas sobre todo en la introducción, así como en los apartados de
discusión y recomendaciones. El apartado de «Introducción» y las
referencias se usan como ejemplo para una valoración crítica de una
revisión de la literatura de un estudio cualitativo (págs. 566-567). El
contenido clave de la revisión de la literatura en el estudio de
Koehn y cols. (2016) se presenta en el Ejemplo de investigación 6.2.

EJEMPLO DE INVESTIGACIÓN 6.2


Revisión de la literatura: cualitativa
Extracto del estudio de investigación
El informe To Err Is Human del Institute of Medicine (IOM) del año
2000 proporcionó estimaciones del número de errores médicos que se
producen en Estados Unidos y concluyó que 44.000-98.000 pacientes
fallecen anualmente debido a errores médicos evitables (Kohn, Corrigan y
Donaldson, 2000)… Es difícil obtener unas cifras precisas de
fallecimientos o lesiones atribuidas a errores médicos debido a los diversos
enfoques legales, culturales y administrativos a la hora de notificar los
errores (Anderson, Kodate, Walters y Dodds, 2013; Loeb y O’Leary,
2004)… En muchas instituciones, la cultura del lugar de trabajo sobre la
notificación de errores sigue siendo una de las culpas y los profesionales de

358
enfermería suelen estar preocupados por las repercusiones personales
asociadas con la notificación de los errores (Blair, Kable, Courtney-Pratt y
Doran, [2016]; Castel, Ginsburg, Zaheer y Tamin, 2015; Cook y cols.,
2004; Espin y cols., 2006; Jeffe y cols., 2004; Stratton, Blegen, Pepper y
Vaughn, 2004; Taylor y cols., 2004; Uribe y cols., 2002)… Una mejor
comprensión de la toma de decisiones de los profesionales de enfermería
sobre la notificación de los errores y los factores del lugar de trabajo que
influyen en sus decisiones pueden ofrecer información sobre la frecuencia
y precisión de la notificación de errores por los profesionales de enfermería
(Koehn y cols., 2016, pág. 566).
Valoración crítica
1 Fuentes de calidad
Koehn y cols. (2016) escogieron fuentes de calidad para su revisión
de la literatura. Citaron 67 referencias bibliográficas en su informe
de investigación, la mayoría de las cuales eran fuentes primarias de
investigación original. Un total de 53 (79%) de las referencias eran
de revistas académicas o clínicas, todas estaban revisadas por
pares. Por ejemplo, la siguiente referencia era una de las citadas
por Koehn y cols. (2016):

Prang, I. y Jelsness-Jørgensen, L. (2014). Should I report? A


qualitative study of barriers to incident reporting among nurses
working in nursing homes. Geriatric Nursing, 35(6), 441-447.

Prang y Jelsness-Jørgensen (2014) realizaron este estudio


cualitativo, por lo que la referencia es una fuente primaria. Se
confirmó que la revista clínica Geriatric Nursing es una revista
revisada por pares al acceder a su sitio web en
https://www.journals.elsevier.com/geriatric-nursing (Geriatric
Nursing, 2017).
2 Fuentes actuales
Koehn y cols. (2016) citaron 67 referencias bibliográficas. De estas
fuentes, 52 (78%) se publicaron en los 10 años previos (en o desde
2006) y 32 (48%) se publicaron en los últimos 5 años (en o desde
2011). Debido a que los investigadores cualitativos suelen estudiar
temas sobre los que existen pocas investigaciones, no es infrecuente

359
que la bibliografía citada corresponda a referencias más antiguas.
La referencia más antigua, Glaser y Strauss (1967), es una fuente
teórica clásica que se cita en la sección de métodos.
3 Contenido relevante
Koehn y cols. (2016) seleccionaron referencias relacionadas
directamente con los conceptos del estudio, incluidos errores
médicos, errores de la medicación, seguridad, interrupciones y
notificación. Los autores y revistas citados correspondían sobre
todo a las disciplinas de la enfermería y la medicina.
4 Síntesis del contenido relevante
Koehn y cols. (2016) proporcionaron una revisión de la literatura
sólida, sobre todo para un estudio cualitativo. No realizaron una
valoración crítica de los puntos fuertes y débiles de los estudios
citados, lo que es un punto débil de esta revisión.
El primer párrafo informó de los antecedentes y la relevancia del
problema, incluidas las estimaciones de las cifras de errores
médicos y de los fallecimientos resultantes. En los párrafos
subsiguientes, Koehn y cols. (2016) continuaron describiendo los
problemas relacionados con los errores médicos y proporcionaron
la justificación del estudio. Estos autores sintetizaron las
dificultades a la hora de medir con precisión las tasas y resultados
de los errores médicos. No se han observado mejoras de las cifras
de errores médicos a pesar de las intervenciones desarrolladas para
reducir los errores. Múltiples fuentes han indicado que la
notificación de errores aún conlleva culpa para los profesionales de
enfermería que temen por su futuro cuando notifican dichos
errores.
En el último párrafo, Koehn y cols. (2016, pág. 567) ponían de
relieve la laguna de publicaciones sobre el tema de un modo un
tanto implícito: «Una mejor comprensión de la toma de decisiones
de los profesionales de enfermería sobre la notificación de errores y
los factores del lugar de trabajo que influyen en sus decisiones
puede aportar información sobre la frecuencia y precisión de la
notificación de errores por los profesionales de enfermería». El
propósito de su estudio abordó esta laguna y la cubrió.
El estudio de Koehn y cols. (2016) dio lugar a una teoría que
describía el proceso que tenía lugar antes, durante y después de

360
que se produjese un error. «El modelo incluyó cinco etapas: Estar
descentrado, Vivir el error, Notificación o narración del error, Vivir
las consecuencias y Persistencia del recuerdo» (pág. 566).
Recomendaron «iniciativas para mejorar la notificación de errores
y para apoyar a los profesionales de enfermería que han cometido
errores» (Koehn y cols., 2016, pág. 566).

REVISIÓN DE LA LITERATURA
La revisión de la literatura existente sobre un tema es una
expectativa frecuente en los programas de educación de enfermería.
Los estudiantes pueden sentirse abrumados e intimidados por esta
expectativa, una preocupación que puede superarse con
información y una lista de verificación de los pasos que se han de
seguir en el proceso. Aquí se analizan los pasos de la revisión de la
literatura (cuadro 6.1), que proporcionarán un esquema para el
resto del capítulo. Además, en este apartado se incluirán preguntas
frecuentes de los estudiantes, con las respuestas.

CUADRO 6.1 PASOS DE LA REVISIÓN DE LA


LITERATURA

A Preparación para la revisión de la literatura


1. Explicación del objetivo de la revisión de la
literatura.
2. Selección de las bases de datos electrónicas y los
términos de búsqueda.
B Realización de la búsqueda
3. Búsqueda en las bases de datos seleccionadas.
4. Uso de una tabla para documentar los resultados de
la búsqueda.
5. Depuración de la búsqueda.
6. Revisión de los resúmenes para identificar los
estudios relevantes.
7. Obtención de copias del texto completo de los
artículos relevantes.
8. Asegurarse de recoger la información necesaria para

361
citar la fuente.
C Procesamiento de la literatura encontrada
9. Lectura de los artículos.
10. Valoración, análisis y síntesis de la literatura.
D Redacción de la revisión de la literatura
11. Elaboración de un esquema para organizar la
información de la revisión.
12. Redacción de cada apartado de la revisión.
13. Elaboración del listado de referencias bibliográficas.
14. Comprobación de la revisión y del listado
bibliográfico.

Preparación para la revisión de la literatura


La preparación antes de realizar una tarea compleja permite
estructurar el proceso y aumentar la eficiencia y eficacia de estos
esfuerzos. Este apartado incluye información sobre el objetivo de
una revisión de la literatura y una selección de las bases de datos en
las que se debe buscar (v. cuadro 6.1).

Explicación del propósito de la revisión de la literatura


El enfoque de la revisión de la literatura existente sobre un tema
variará en función del propósito de dicha revisión. La revisión para
la realización de una tarea de clase requiere la comprensión clara de
dicha tarea. Estas revisiones variarán según el nivel del programa
educativo, el objetivo de la tarea y las expectativas del profesor.
Hay que tener en cuenta que se deberá presentar una extensión
aceptable de la revisión de la literatura escrita. Por lo general, el
enfoque de la revisión de la literatura para una tarea de clase será
un resumen de la información sobre el tema seleccionado y las
implicaciones prácticas de dicha información.
Los estudiantes preguntan repetidamente: «¿Cuántos artículos
debería tener? ¿Cuántos años atrás debo retroceder para encontrar
información relevante?». La respuesta a ambas preguntas es un
rotundo «Depende». El profesorado de los cursos de pregrado
puede proporcionar las directrices sobre el número y el tipo de
artículos que se deben incluir en una tarea o proyecto. Se espera
que los estudiantes de posgrado sean capaces de llevar a cabo una

362
revisión más amplia de los artículos actuales y de realizar
propuestas de investigación para sus tesis o trabajos de fin de
máster. Hasta cuándo debe retrocederse en el tiempo para buscar la
bibliografía que sea necesaria dependerá del tema. Se deben
localizar los estudios iniciales y de referencia, y otras fuentes
relevantes en el área de interés. Un bibliotecario o miembro del
profesorado del curso puede ayudar a determinar el rango en años
de búsqueda para un tema específico.
Otra razón por la que puede llevarse a cabo una revisión de la
literatura científica es examinar la solidez de la evidencia y
sintetizar dicha evidencia relacionada con un problema de la
práctica clínica. Las directrices de la PBE se desarrollan por medio
de la síntesis de la literatura sobre un problema clínico. El propósito
de este tipo de revisión es identificar todos los estudios que
incluyen una intervención concreta, valorar críticamente la calidad
de cada estudio, sintetizar los estudios y extraer conclusiones sobre
la efectividad de una intervención determinada. Cuando estén
disponibles, los estudios de replicación, las revisiones sistemáticas,
los metaanálisis, las metasíntesis y las revisiones sistemáticas de
métodos mixtos son publicaciones importantes que deberán ser
incluidas. También es importante localizar e incluir artículos
basados en la evidencia previa que evalúen la evidencia de una
intervención concreta, debido a que las conclusiones de estos
autores son muy relevantes. En el capítulo 13 se describen otros
tipos de síntesis de la bibliografía relacionados con el fomento de la
práctica enfermera basada en la evidencia.

Selección de las bases de datos electrónicas y los


términos de búsqueda
Debido a que el acceso electrónico a la bibliografía se encuentra
fácilmente disponible, la revisión de las publicaciones puede ser
abrumadora. Los motores de búsqueda generales, como Google,
Google Académico o Yahoo, identifican las publicaciones
académicas, pero pueden incluir fuentes que no son fiables. Las
fuentes obtenidas en un motor de búsqueda general deberían
evaluarse para determinar su calidad, por ejemplo si han sido
revisadas por pares. Además, las fuentes que se identifican en un
motor de búsqueda general puede que no sean las más actuales.

363
Para encontrar bibliografía actual, hay que aprender a utilizar una
base de datos bibliográfica informatizada, como The Cumulative
Index to Nursing and Allied Health Literature (CINAHL) y Science
Direct. Estas son herramientas útiles para buscar fácilmente
literatura empírica o teórica relevante, pero las diferentes bases de
datos contienen citas de artículos de diversas disciplinas. La tabla
6.2 incluye las bases de datos electrónicas útiles para las revisiones
de la literatura en enfermería. Dependiendo del enfoque de la
revisión, se deberán seleccionar las bases de datos relevantes para la
búsqueda.

TABLA 6.2
BASES DE DATOS BIBLIOGRÁFICAS UTILIZADAS
FRECUENTEMENTE EN REVISIONES DE LA LITERATURA
EN ENFERMERÍA

NOMBRE DE LA
CONTENIDO DE LA BASE DE DATOS
BASE DE DATOS
Cumulative Index Revistas de enfermería y vinculadas a la salud que publican
to Nursing and artículos clínicos, teóricos y de investigación, e incluyen el
Allied Health texto completo de muchos artículos
Literature
(CINAHL)
Google Académico Textos académicos generales, incluidos artículos de muchas
disciplinas
MEDLINE Revistas biomédicas relevantes para los profesionales
sanitarios consideradas reputadas por la National Library of
Medicine; incluye resúmenes con enlaces al texto completo de
algunas fuentes
PubMed Acceso gratuito a MEDLINE disponible para pacientes y otros
usuarios
PsycARTICLES Revistas publicadas por la American Psychological
Association (APA) y organizaciones afiliadas
Academic Search Bases de datos multidisciplinarias que incluyen artículos de
Complete numerosas disciplinas
Health Source: Revistas publicadas para médicos, profesionales de
Nursing/Academic enfermería y otros profesionales sanitarios; incluye el texto
Edition completo de numerosos artículos y materiales educativos
sobre medicamentos para los pacientes
Psychological and Revistas de psiquiatría, psicología y salud del
Behavioral Sciences comportamiento
Collection

364
La búsqueda en bases de datos electrónicas profesionales tiene
muchas ventajas, pero una de las dificultades es que se deben
seleccionar las fuentes relevantes a partir de un número mayor de
artículos. Se puede limitar el número de artículos y recuperar
menos, pero más relevantes, utilizando palabras clave para la
búsqueda. Las palabras clave son términos que sirven para
identificar las publicaciones centradas en un tema. Por ejemplo, un
estudio cuasiexperimental centrado en el envío de avisos en
formato de mensaje de texto a los pacientes que padecen
insuficiencia cardíaca y que toman cinco o más medicamentos
puede encontrarse mediante la búsqueda de palabras clave como
comunicación electrónica, mensajería instantánea, adherencia a la
medicación, enseñanza del paciente, diseños cuasiexperimentales e
insuficiencia cardíaca. Cuando se encuentre un artículo sobre el
tema, se debe buscar al final del resumen para determinar si se
enumeran los términos de búsqueda. El uso de los términos de
búsqueda o palabras clave para hallar información es una habilidad
que se puede aprender por uno mismo, pero también se debe
recordar que un bibliotecario es un especialista en buscar
información. Consultar a un bibliotecario puede ahorrar tiempo y
hacer la búsqueda más eficaz.

Realización de la revisión de la literatura


Búsqueda en las bases de datos seleccionadas
La búsqueda real en las bases de datos puede ser el paso más fácil
del proceso. Un método para disminuir el tiempo de búsqueda es
buscar en múltiples bases de datos a la vez, una estrategia que es
posible cuando varias bases de datos están disponibles dentro de
un mismo motor de búsqueda, como en la Elton B. Stephens
Company host (EBSCOhost). Para evitar la duplicación del trabajo,
se debe guardar un listado con las búsquedas que se hayan
realizado. Esto es especialmente importante si se tiene poco tiempo
y se está realizando la búsqueda en varias sesiones cortas, en lugar
de en una más prolongada.

Uso de una tabla o de otro método para documentar


los resultados de la búsqueda

365
Una forma muy simple para documentar la búsqueda es usar una
tabla. En ella, se anotarán los términos de búsqueda, el período de
tiempo que se utilizó y los resultados. En la mayoría de las bases de
datos electrónicas, es posible registrarse en una cuenta y guardar el
historial de búsquedas online. Se puede hacer considerablemente
más fácil el seguimiento de las citas bibliográficas que se hayan
obtenido en las búsquedas con un programa de gestión de
referencias, como RefWorks (http://www.refworks.com) y
EndNotes (http://www.endnote.com). Se puede utilizar el
programa gestor de referencias bibliográficas para llevar a cabo
búsquedas y almacenar la información en todos los campos de
búsqueda de cada referencia obtenida en una búsqueda. Dentro del
programa, se pueden almacenar artículos en carpetas con otros
artículos similares. Por ejemplo, se puede tener una carpeta para las
fuentes teóricas, otra para las fuentes metodológicas y una tercera
para los temas de investigación relevantes. A medida que se lean
los artículos, también se pueden insertar comentarios en el archivo
de referencia de cada uno. Al exportar los resultados de búsqueda
de la base de datos bibliográfica al programa gestor de referencias,
toda la información y resúmenes necesarios de estas estarán
disponibles electrónicamente al escribir la revisión de la literatura.

Depuración de la búsqueda
Una búsqueda puede identificar miles de referencias bibliográficas,
muchas más de las que se pueden leer e incluir en cualquier
revisión de la literatura. Se pueden abrir algunos artículos
seleccionados y ver qué términos clave se utilizan. Se reconsidera el
tema y se determina cómo se puede concretar más la búsqueda.
Una estrategia es reducir el rango de años de la búsqueda. Algunas
bases de datos electrónicas permiten limitar la búsqueda a ciertos
tipos de artículos, como artículos académicos o revisados por pares.
Si se combinan los términos o se buscan los términos solo en los
resúmenes, se reducirá el número de los artículos identificados.
Para las tareas de cursos de pregrado, puede ser conveniente limitar
la búsqueda únicamente a los artículos de texto completo. Sin
embargo, se recomienda que los estudiantes de posgrado eviten
limitar las búsquedas a artículos de texto completo, ya que al
hacerlo podrían perder las fuentes que necesitaran. Si se restringe

366
demasiado la búsqueda, es posible que obtenga muy pocos
resultados. Cuando eso ocurre, se puede volver a intentar la
búsqueda con uno o más términos de búsqueda y eliminar las
limitaciones.

Revisión de los resúmenes para identificar los


estudios relevantes
El resumen proporciona información pertinente sobre un artículo.
Se puede determinar fácilmente si el artículo es un informe de
investigación, la descripción de un problema clínico o un artículo
teórico, como el análisis de un concepto. Se identificarán los
artículos que parecen ser los más relevantes para el tema y el
objetivo de la revisión. Si se está buscando evidencia en la que basar
la práctica clínica, habrá que localizar informes de investigación y
seleccionar los realizados en contextos similares al propio. Si está
escribiendo una revisión de la literatura para una tarea del curso, se
revisarán los resúmenes para identificar diferentes tipos de
información. Por ejemplo, es posible que se necesite información
sobre la mortalidad y la morbilidad, así como descripciones de los
tratamientos disponibles. Hay que seleccionar los resúmenes de los
estudios relevantes o guardarlos en una carpeta electrónica.

Obtención de copias del texto completo de los


artículos relevantes
Mediante el uso de los resúmenes de los artículos relevantes, se
recuperarán y guardarán en el ordenador los archivos electrónicos
de los artículos a texto completo para revisarlos posteriormente más
a fondo. Es posible que se desee cambiar el nombre del archivo
electrónico utilizando un nombre que incluya el apellido del primer
autor y el año o un nombre de archivo con una frase descriptiva.
Los artículos cuyo texto completo no esté disponible en internet se
buscarán en los fondos de la biblioteca para averiguar si allí está
disponible la revista impresa. Si la biblioteca no tiene la revista, es
posible que se pueda obtener el artículo a través de un préstamo
interbibliotecario. Hay que consultar en el sitio web de la biblioteca
o con un bibliotecario para aprender el proceso de utilización del
sistema de préstamo interbibliotecario. Si se prefieren leer los

367
documentos impresos mejor que en versión electrónica, se puede
optar por imprimir los artículos. Es importante obtener el texto
completo del artículo, porque el resumen no incluye los detalles
necesarios para una revisión de la literatura.

Asegurarse de recoger la información necesaria para


citar la fuente
A medida que se recuperen y se guarden los artículos, hay que
comprobar si incluyen toda la información necesaria para realizar la
cita. La información bibliográfica sobre una fuente debe ser
registrada de manera sistemática, de acuerdo con el formato que se
utilizará en el listado bibliográfico. El propósito de citar
correctamente las fuentes es que los lectores puedan recuperar las
referencias bibliográficas por sí mismos, confirmar la interpretación
de los hallazgos y recopilar más información sobre el tema. Para
cada referencia, se necesitarán los nombres de los autores, el año, el
título del artículo, el nombre de la revista, el volumen de esta y el
número de ejemplar, así como los números de página. Si se ha
fotocopiado o descargado de internet el capítulo de un libro, hay
que asegurarse de registrar el nombre de la editorial, el lugar y el
año de publicación. Hay que fijarse específicamente en si el capítulo
pertenece a un libro publicado y en si incluye un autor que no sea el
editor. Si se está usando un programa bibliográfico personal
electrónico como RefWorks, el programa registrará la información
de las citas.

Procesamiento de la literatura
El procesamiento de la literatura sobre un tema es una de las fases
más difíciles de la revisión. En este apartado se incluye la lectura y
la valoración de los artículos, el análisis y la síntesis bibliográfica.

Lectura de los artículos


Al mirar el montón de artículos impresos o las copias electrónicas
de los artículos escaneados, surgirá la pregunta «¿Debo leer cada
palabra de las fuentes disponibles?». La respuesta es no. La lectura
de cada palabra de todas las fuentes conllevaría estar bien instruido
e informado, pero no dejaría tiempo libre para preparar la tarea del

368
curso o artículo. La disponibilidad en internet de los textos
completos de los artículos puede hacer que se olvide fácilmente el
objetivo de la revisión. Convertirse en un revisor experto de la
bibliografía implica encontrar un equilibrio y aprender a identificar
las fuentes más pertinentes y relevantes. Por otro lado, no se puede
valorar críticamente y sintetizar lo que no se ha leído. Hay que
hojear la información proporcionada por el autor que no sea
relevante para la tarea. Hay que aprender qué suele incluirse en los
diferentes apartados de un artículo para poder leer atentamente los
apartados pertinentes a la tarea. En el capítulo 2, se proporcionan
ideas sobre el modo de realizar la lectura de las publicaciones.
La comprensión y la valoración crítica de las fuentes conllevan
entender la situación actual de los conocimientos relacionados con
un problema de investigación. Aunque se pueden hojear o leer los
apartados seleccionados de algunas de las referencias que se
encuentren, puede que se quiera leer los artículos más relevantes
del tema que se está estudiando, palabra por palabra y,
probablemente, varias veces. La comprensión en profundidad de
una fuente empieza por leer y centrarse en entender los principales
puntos del artículo o de otras fuentes. Hay que subrayar el
contenido que se considere importante o hacer anotaciones en los
márgenes. Se deben fotocopiar las notas de artículos o guardarlas
en archivos electrónicos. El tipo de información que se subraye o se
anote al margen de una fuente dependerá del tipo de estudio o
fuente. Con artículos teóricos, es posible tomar nota de los
conceptos, las definiciones y las relaciones entre los conceptos. En
un artículo de investigación se suelen subrayar el problema de
investigación, el propósito, el marco de la investigación, las
variables principales, el diseño del estudio, el tamaño de la muestra,
los métodos de medición, la recogida de datos, las técnicas de
análisis, los resultados y los hallazgos. Puede que se quieran
registrar las citas bibliográficas (incluidos los números de página)
que podrían ser utilizadas en el apartado de revisión de la
literatura. La decisión de parafrasear estas citas puede tomarse
después. También se deben tomar notas de lo que se piensa de un
artículo, por ejemplo, cómo se adecua su contenido a otra
información que se ha leído.

369
Valoración, análisis y síntesis de la literatura
Es necesario un análisis para determinar el valor de una fuente
cuando se toma la decisión de qué información se va a incluir en la
revisión. En primer lugar, es necesario valorar críticamente los
estudios individuales (v. cap. 12). Para valorar un artículo
críticamente, debe identificarse el contenido relevante de los
artículos y hacer juicios de valor sobre la validez o credibilidad de
los hallazgos. Sin embargo, la valoración crítica de los estudios
individuales es únicamente el primer paso en el desarrollo de una
revisión adecuada de la literatura.
El análisis requiere la modificación de lo que se encuentre,
convirtiéndolo literalmente en algo propio (Garrard, 2011). Pinch
(1995, 2001) fue la primera enfermera que publicó una estrategia
para sintetizar los resultados de una investigación utilizando una
tabla resumen de la literatura. En las tablas 6.3 y 6.4 se facilitan
otros ejemplos de tablas resumen de la literatura para demostrar
que los encabezados de cada columna pueden variar dependiendo
del tipo de investigación. La tabla 6.3 contiene información clave
del estudio cuantitativo de Moscou-Jackson, Allen, Kozachik y cols.
(2016) a título de ejemplo. El contenido de la tabla 6.4 es del estudio
cualitativo de Koehn y cols. (2016). Si se utiliza un programa gestor
de referencias, este puede permitir crear tablas resumen de la
información que se registra de cada estudio.

TABLA 6.3
TABLA RESUMEN DE LA LITERATURA PARA ESTUDIOS
CUANTITATIVOS

370
TABLA 6.4
TABLA RESUMEN DE LA LITERATURA PARA ESTUDIOS
CUALITATIVOS

Otra forma de modificar la información que se ha recuperado y


transformarla en conocimiento se denomina mapeo (Hart, 2009;
Machi y McEvoy, 2016). Los docentes de enfermería pueden haber
enseñado cómo mapear conceptualmente lo que se está estudiando
y cómo relacionar los hechos y los principios (Vacek, 2009). La
misma estrategia se puede aplicar a la revisión de la literatura para
clasificar las fuentes por conceptos clave y organizarlas en forma de
gráficos o diagramas (Hart, 2009; Machi y McEvoy, 2016). El mapa
permite relacionar estudios con metodologías o ideas clave
similares.

371
A medida que se continúa analizando la bibliografía encontrada,
se compararán los estudios. Hay que buscar relaciones, similitudes
y temas en la literatura. Este análisis permitirá valorar el cuerpo de
conocimiento existente en relación con el problema de
investigación. Es posible que se deseen registrar las teorías
utilizadas, los métodos usados para estudiar el problema y
cualquier error de estas teorías y métodos. Se comenzará a trabajar
resumiendo lo que se ha encontrado, describiendo lo que se sabe y
lo que se desconoce del problema. La información obtenida
utilizando las tablas que se muestran en las tablas 6.3 y 6.4, o
mostradas en un mapa conceptual puede ser útil a la hora de
realizar estas comparaciones. Hay que prestar especial atención a
los resultados contradictorios y las recomendaciones para
investigaciones futuras, ya que pueden proporcionar pistas sobre
lagunas de conocimiento que representen problemas investigables.
La síntesis de las fuentes implica pensar a fondo sobre lo que se
ha encontrado e identificar los principales temas de información
que se desea presentar. Mediante la síntesis, se agruparán y se
describirán las conexiones entre lo que se haya encontrado (Hart,
2009). A partir de los grupos de conexiones, se podrá empezar a
sacar algunas conclusiones sobre lo que se conoce y añadir más
conexiones al tema objeto de estudio. Cualquier revisión de la
literatura escrita que simplemente evalúe estudios individuales
párrafo por párrafo es inadecuada. Una revisión de la literatura
constituida por una serie de párrafos en la que cada uno es la
descripción de un único estudio sin relación con los otros estudios
que se están revisando no proporciona la evidencia de un análisis o
síntesis adecuada de la literatura (Aveyard, 2014).
Obsérvense los párrafos en la revisión de la literatura de Moscou-
Jackson, Allen, Kozachik y cols. (2016). Estos autores sintetizaron lo
que se sabe y lo que no, integrando hallazgos similares de fuentes,
en lugar de proporcionar resúmenes de artículos individuales no
relacionados. La información relacionada proporcionó una
justificación para el estudio. Los autores sintetizaron la información
de dos artículos sobre la relevancia del estudio de la depresión
como factor predictivo en esta población. De forma similar, se
citaron dos referencias sobre el dolor como factor predictivo de
problemas de sueño. Su síntesis de los posibles factores

372
relacionados con el sueño en pacientes con drepanocitosis extrajo
información de investigaciones y estudios cualitativos en una
población similar de pacientes con enfermedades crónicas, lo que
pone de relieve dos estrategias importantes usadas habitualmente
por los investigadores cuando se sabe poco sobre los posibles
factores influyentes.
Una estrategia para la síntesis es revisar las tablas o mapas
conceptuales que se han elaborado y hacer un listado con los
hallazgos que son similares y los que son diferentes. Pongamos
como ejemplo que se han leído cinco estudios de intervención sobre
cuidados terminales en niños con leucemia. Al revisar las
anotaciones, se observa que cuatro estudios se llevaron a cabo en un
entorno domiciliario con muestras de niños de edades
comprendidas entre los 7 y los 10 años, y que tuvieron resultados
estadísticamente significativos y similares al utilizar una
intervención implementada por los progenitores. El estudio
restante, con resultados no significativos, también utilizó una
intervención implementada por los progenitores, pero se llevó a
cabo con una muestra de niños más jóvenes, hospitalizados en una
unidad de cuidados paliativos. Una de las ideas principales que
puede extraerse es que la efectividad de las intervenciones
administradas por los progenitores puede variar dependiendo del
entorno y de la edad del niño. Otra estrategia para la síntesis es
hablar de los artículos que se han revisado con otro estudiante,
profesional de enfermería o amigo. Verbalizar las características de
los estudios y explicarlas a otra persona puede hacer que se piense
de una manera diferente sobre los estudios que cuando se está
simplemente leyendo las anotaciones. Mejorar la forma de pensar
puede hacer que se identifiquen las ideas principales o las
conclusiones de la revisión.

Redacción de la revisión de la literatura


Hablar sobre las principales ideas de la revisión puede servir de
preparación para los últimos pasos de la redacción de la revisión de
la literatura. El paso número 11 es organizar la información
mediante el desarrollo de un esquema antes de escribir los
apartados principales de la revisión (v. cuadro 6.1). Los últimos

373
pasos son la elaboración del listado bibliográfico y la comprobación
de que la revisión y el listado bibliográfico sean correctos.

Elaboración de un esquema para organizar la


información de la revisión
Antes de comenzar a escribir la revisión, hay que elaborar un
esquema basado en la síntesis de lo que se ha leído utilizando los
apartados de la revisión como principales epígrafes del esquema.
Dependiendo del propósito de la revisión, se deberá determinar
cuáles serán los principales apartados del documento. A menudo,
una revisión exhaustiva de la literatura tiene cuatro apartados
principales: 1) introducción; 2) discusión de la literatura teórica; 3)
discusión de la literatura empírica, y 4) resumen. La introducción y
el resumen son apartados estándar, pero la discusión de las fuentes
debe organizarse de acuerdo con las principales ideas que se hayan
identificado o los conceptos del marco teórico que se quieran incluir
en la revisión. Bajo los principales encabezamientos del esquema,
hay que tomar nota de las fuentes que se quieren mencionar en los
diferentes apartados del documento. La introducción incluirá el
enfoque o propósito de la revisión y presentará la estructura
organizativa de la revisión. En este apartado, se debe dejar claro
qué se quiere o no abarcar.
El apartado de la discusión puede subdividirse en un apartado
teórico y uno empírico o dividirse por los temas de los hallazgos de
la revisión. El apartado de la literatura teórica podría incluir los
análisis de conceptos, modelos, teorías o marcos conceptuales
relevantes para el tema. En el apartado empírico, si constituye otro
apartado, se incluyen los hallazgos de investigación de los estudios
revisados. Además de la síntesis, puede que se quieran incorporar
las fortalezas y debilidades del cuerpo general de conocimientos, en
lugar de una presentación detallada y valoración crítica de cada
estudio. En el apartado de resumen del esquema, se incluyen notas
de las conclusiones. Una conclusión es una declaración sobre el
estado del conocimiento en relación con un área temática, que
incluye lo que se sabe y no se sabe sobre el área.

Redacción de cada apartado de la revisión

374
Hay que comenzar cada párrafo con una frase central que describa
la idea principal del párrafo. Se deben presentar los estudios
relevantes en cada párrafo que apoyen la idea principal indicada en
la frase central. Hay que terminar cada párrafo con una frase
concluyente de transición para la siguiente afirmación. Cada
párrafo puede compararse con un tren, con una locomotora (una
frase principal), los vagones de carga conectados entre sí (frases con
la evidencia científica) y un furgón de cola (una frase resumen
vinculada al párrafo siguiente).
Se debe evitar el uso de citas directas de un autor. El análisis y la
síntesis de las fuentes permitirán parafrasear las ideas de los
autores. La paráfrasis implica expresar ideas con claridad y con
palabras propias. Así, el significado de estas fuentes se relaciona
con el estudio propuesto. Si la revisión escrita no es clara o
coherente, puede que se deban mirar de nuevo las anotaciones y las
fuentes para asegurarse de que se ha sintetizado adecuadamente la
bibliografía. Los defectos de un estudio o cuerpo de conocimiento
deben describirse, pero manteniendo un tono respetuoso y evitando
ser muy crítico con el trabajo de los teóricos o de los investigadores.
Al abordar el final de la revisión, se debe escribir el resumen
como una presentación concisa de la base actual del conocimiento
del problema de investigación. Los resultados de los estudios
habrán sido presentados de forma lógica en los apartados previos,
de manera que el lector pueda ver cómo se ha desarrollado el
cuerpo de conocimientos en el área de investigación. También se
pueden establecer conclusiones sobre las lagunas de la base de
conocimiento. Se debe concluir con la contribución potencial de la
revisión de la literatura al cuerpo de conocimientos de enfermería
(Aveyard, 2014).

Elaboración del listado bibliográfico


Muchas revistas e instituciones académicas utilizan el formato
desarrollado por la APA (2010). La sexta edición del APA
Publication Manual (2010) proporciona las guías revisadas para citar
las fuentes electrónicas, citar directamente a partir de fuentes
electrónicas y para elaborar un listado de referencias bibliográficas.
El estándar de la APA para citar directamente a partir de una fuente
impresa es citar el autor, el año y la página de la fuente en la que

375
aparece la cita. El listado bibliográfico en este libro se presenta
según el formato de la APA, con dos excepciones. No se han
incluido los identificadores digitales de objetos (DOI). Los DOI se
han convertido en un estándar para la International Standards
Organization (http://www.doi.org), pero aún no han recibido un
apoyo universal. El uso de los DOI parece estar ganando
credibilidad porque «proporcionan un medio de identificación
persistente para el manejo de la información en redes digitales»
(APA, 2010, pág. 188). CrossRef es un organismo de registro de DOI
para que las citas puedan relacionarse a través de las bases de datos
y entre diferentes disciplinas (http://www.crossref.org). Además,
cuando estaba disponible, se ha incluido el número del ejemplar en
el que aparece el artículo. La APA requiere que se incluya el
número del ejemplar solo cuando cada ejemplar de un volumen
(año) comienza con la página uno. Cuando el segundo ejemplar
comienza la numeración de sus páginas en base al último número
de página del ejemplar previo, la APA no requiere el número de
ejemplar.
Las fuentes incluidas en el listado de referencias bibliográficas
son solo aquellas citadas en el artículo. Cada cita del listado según
la APA tiene el formato de un párrafo con sangría francesa, lo que
significa que la primera línea se encuentra en el margen izquierdo y
las líneas siguientes se presentan con sangría (v. los ejemplos de
citas a continuación). Si no se sabe cómo formatear un párrafo de
esta manera, hay que buscar la herramienta de ayuda en el
procesador de textos para encontrar el comando correcto que se
debe utilizar. La inclusión de un artículo publicado en una revista
impresa en un listado de referencias bibliográficas debe contener el
número de la revista, el volumen, el ejemplar y las páginas. En la
mayoría de las revistas, la numeración de los volúmenes de la
revista representa todos los artículos publicados durante un año
específico. APA (2010) tiene unos requisitos para dar formato a
cada componente de la entrada en la lista de referencias
bibliográficas de un artículo de la revista. La tabla 6.5 presenta los
componentes de la bibliografía con el formato correcto.

TABLA 6.5

376
FORMATO DE LAS CITAS DE LA AMERICAN
PSYCHOLOGICAL ASSOCIATION

La entrada de un libro en el listado bibliográfico se ordena por el


autor e incluye al editor y su localización. La University Press,
ubicada en Boulder, Colorado, publicó una edición revisada de la
filosofía de los cuidados de enfermería del doctor Watson en 2008.
La entrada en el listado bibliográfico sería la siguiente:

Watson, J. (2008). Nursing. The philosophy and science of caring


(Revised ed.). Boulder, Colorado: University Press of Colorado.

Algunos capítulos son elaborados por los editores y cada capítulo


tiene su(s) propio(s) autor(es). El capítulo de Wolf sobre la
etnografía está en un libro de investigación cualitativa publicado
por Munhall (2012). El título del capítulo se escribe con el formato
del título de un artículo y se incluyen los números de página del
capítulo:

Wolf, M. (2012). Ethnography: The method. En P. L. Munhall (Ed.),


Nursing research: A qualitative perspective (5.ª ed.) (págs. 285-338).
Sudbury, Massachusetts: Jones & Bartlett.

Cuando se recupere una fuente electrónica en formato de


documento portátil (pdf, del inglés portable document format), se
cita la fuente de la misma manera que la copia de la versión
impresa del artículo. Si recupera una fuente electrónica en formato
html (del inglés (hypertext markup language), «lenguaje de marcas
de hipertexto»), no se dispondrá de los números de página para la
cita. La dirección URL (uniform resource locator, «localizador

377
uniforme de recursos») no es útil para recuperar artículos, ya que
utiliza una única ruta para encontrar artículos y refleja los motores
de búsqueda y bases de datos bibliográficas. El estándar
actualizado de la APA (2010) consiste en proporcionar la dirección
URL de la página principal de la revista en la que el lector puede
navegar y encontrar el artículo específico.

Comprobación de la revisión y del listado


bibliográfico
Una vez que se completa el primer borrador de la revisión de la
literatura, uno puede sentirse muy satisfecho. Antes de finalizar la
revisión, hay que llevar a cabo algunas tareas para asegurar la
calidad de la revisión escrita. Hay que comenzar por releer la
revisión. Es mejor retrasar este paso un día o por lo menos unas
horas para que se pueda tomar una nueva perspectiva del escrito
final. Una forma de identificar frases poco claras o párrafos
inconexos es leer la revisión en voz alta. Se puede pedir a un
compañero o colega de confianza que lea la revisión y proporcione
una opinión constructiva.
Un último paso crítico es comparar las fuentes citadas en el
documento con el listado de referencias bibliográficas. Hay que
asegurarse de que coincidan los nombres de los autores y los años
de publicación. Si faltan fuentes en el listado bibliográfico, se deben
añadir. Si hay fuentes en el listado que no se han citado, se deben
eliminar. Descargar citas directamente de una base de datos a un
sistema gestor de referencias bibliográficas y utilizar las funciones
de formateo de manuscritos del sistema reduce algunos errores,
pero no los elimina todos. Las referencias bibliográficas deben ser
precisas como reflejo de la atención al detalle y a la calidad del
trabajo.

PUNTOS CLAVE
• La revisión de la literatura de un informe de investigación
es un resumen de los conocimientos actuales sobre un
problema particular de la práctica clínica e incluye lo que se

378
conoce y lo que se desconoce sobre ese problema.
• En las revisiones de la literatura de estudios publicados
pueden valorarse críticamente las fuentes de calidad
actuales, el contenido relevante y la síntesis del contenido
relevante (v. las guías de valoración crítica).
• Puede que se necesite una revisión de la literatura para
completar la tarea de un curso o resumir el conocimiento
para su uso en la práctica.
• Un listado de verificación de una revisión de la literatura
existente incluirá la preparación, la realización de la
búsqueda, el procesamiento de la información y la
redacción de la revisión.
• Las bases de datos electrónicas permiten la identificación de
una gran cantidad de fuentes con rapidez y el uso de
palabras clave puede mejorar la búsqueda para incluir las
fuentes más relevantes.
• Se debe utilizar un programa gestor de referencias
bibliográficas para localizar la bibliografía obtenida con las
búsquedas.
• Se pueden utilizar una tabla resumen o un mapa conceptual
de la literatura para ayudar a procesar la información de
numerosos estudios e identificar las ideas principales.
• Una revisión escrita de la literatura debería ser
gramaticalmente correcta, con un flujo lógico y tendría que
contener un listado de referencias bibliográficas preciso y
completo.

BIBLIOGRAFÍA
American Nurses Credentialing Center, Magnet: Program
overview. Author, Silver Springs, MD, 2017. Consultada el 16 de
marzo de 2017, en.
http://www.nursecredentialing.org/Magnet/ProgramOverview

American Psychological Association (APA). Publication manual of the


American Psychological Association, 6th ed. Washington, D.C.:

379
Author; 2010.

Anderson, J. E., Kodate, N., Walters, R., Dodds, A. Can incident


reporting improve safety? Healthcare practitioners’ views of the
effectiveness of incident reporting. International Journal for Quality in
Health Care. 2013; 25(2):141–150.

Aveyard, H. Doing a literature review in health and social care: A


practical guide, 3rd ed. Berkshire: Open University Press; 2014.

Blair, W., Kable, A., Courtney-Pratt, H., Doran, E. Mixed method


integrative review exploring nurses’ recognition and response to
unsafe practice. Journal of Advanced Nursing. 2016; 72(3):488–500.

Castel, E. S., Ginsburg, L. R., Zaheer, S., Tamim, H., Understanding


nurses’ and physicians’ fear of repercussions for reporting errors:
Clinician characteristics, organization demographics, or leadership
factors. BMC Health Services Research 15 1 2015:326

Chandrasekhara, P. K.S., Jayachandran, N. V., Rajasekhar, L.,


Thomas, J., Narsimulu, G. The prevalence and associations of sleep
disturbances in patients with systemic lupus erythematosus.
Modern Rheumatology. 2009; 19(4):407–415.

Charmaz, K. Constructing grounded theory, 2nd ed. Los Angeles, CA:


Sage; 2014.

Cook, A. F., Hoas, H., Guttmannova, K., Joyner, J. C. An error by


any other name. American Journal of Nursing. 2004; 104(6):32–43.

Corbin, J., Strauss, A. Basics of qualitative research, 3rd ed. Thousand


Oaks, CA: Sage; 2008.

Creswell, J., Poth, C. N. Qualitative inquiry & research design:

380
Choosing among five approaches, 4th ed. Thousand Oaks, CA: Sage;
2018.

Espin, S., Lingard, L., Baker, G. R., Regehr, G. Persistence of unsafe


practice in everyday work: An exploration of organizational and
psychological factors constraining safety in the operating room.
Quality and Safety in Health Care. 2006; 15(3):165–170.

Fawcett, J., Garity, J. Evaluating research for evidence-based nursing


practice. Philadelphia, PA: F. A. Davis; 2009.

Frech, T., Hays, R. D., Maranian, P., Clements, P. J., Furst, D. E.,
Khanna, D. Prevalence and correlates of sleep disturbance in
systemic sclerosis—results from the UCLA Scleroderma Quality of
Life Study. Rheumatology. 2011; 50(7):1280–1287.

Garrard, J. Health sciences literature review made easy: The matrix


method, 3rd ed. Sudbury, Massachusetts: Jones & Bartlett; 2011.

Geriatric Nursing. Elsevier: Geriatric Nursing. Consultada el 14 de


mayo de 2017, en https://www.journals.elsevier.com/geriatric-
nursing/, 2017.

Glaser, B. G., Strauss, A. L. The discovery of grounded theory: Strategies


for qualitative theory. London: Weidenfeld and Nicolson; 1967.

Gray, J. R., Grove, S. K., Sutherland, S. The practice of nursing


research: Appraisal, synthesis, and generation of evidence, 8th ed. St.
Louis, MO: Elsevier Saunders; 2017.

Grove, S. K., Cipher, D. J. Statistics for nursing research: A workbook


for evidence-based practice, 2nd ed. St. Louis, MO: Elsevier; 2017.

Hart, C. Doing a literature review: Releasing the social science

381
imagination. Thousand Oaks, CA: Sage; 2009.

Jeffe, D. B., Dunagan, W. C., Garbutt, J., Burroughs, T. E., Gallagher,


T. H., Hill, P. R., et al. Using focus groups to understand physicians’
and nurses’ perspectives on error reporting in hospitals. Joint
Commission Journal on Quality and Safety. 2004; 30(9):471–479.

Koehn, A. R., Ebright, P. R., Draucker, C. B. Nurses’ experiences


with errors in nursing. Nursing Outlook. 2016; 64(6):566–574.

Kohn, L. T., Corrigan, J., Donaldson, M. S. To err is human: Building a


safer health system. Washington, D.C.: National Academy Press;
2000.

Lenz, E. R., Pugh, L. C., Milligan, R. A., Gift, A., Suppe, F. The
middle-range theory of unpleasant symptoms: An update. Advances
in Nursing Science. 1997; 19(3):14–27.

Loeb, J. M., O’Leary, D. S. The fallacy of the body count: Why the
interest in patient safety and why now? In: Youngberg B.J., Hatlie
M.J., eds. The patient safety handbook. Sudbury, Massachusetts: Jones
& Bartlett Learning; 2004:779.

Luyt, B., Ally, Y., Low, N., Ismail, N. Librarian perception of


Wikipedia: Threats or opportunities for librarianship? Libri. 2010;
60(1):57–64.

Machi, L., McEvoy, B. The literature review: Six steps to success, 3rd
ed. Thousand Oaks, CA: Corwin; 2016.

Martínez-Lapiscina, E. H., Erro, M. E., Ayuso, T., Jericó, I.


Myasthenia gravis: Sleep quality, quality of life, and disease
severity. Muscle & Nerve. 2012; 46(2):174–180.

382
Moscou-Jackson, G., Allen, J., Kozachik, S., Smith, M. T.,
Budhathoki, C., Haywood, C., Jr. Acute pain and depressive
symptoms: Independent predictors of insomnia symptoms among
adults with sickle cell disease. Pain Management Nursing. 2016;
17(1):38–46.

Moscou-Jackson, G., Allen, J., Smith, M. T., Haywood, C., Jr.


Psychometric validation of the Insomnia Severity Index in adults
with sickle cell disease. Journal of Health Care for the Poor and
Underserved. 2016; 27(1):209–218.

Munhall, P. L. Nursing research: A qualitative perspective, 5th ed.


Sudbury, Massachusetts: Jones & Bartlett; 2012.

National Heart Lung and Blood Institute. What is sickle cell


disease? Consultada el 17 de junio de 2015, en
http://www.nhlbi.nih.gov/health/health-topics/topics/sca, 2015.

O’Mathuna, D. P., Fineout-Overholt, E., Critically appraising


quantitative evidence for clinical decision makingMelnyk B.M.,
Fineout-Overholt E., eds. Evidence-based practice in nursing &
healthcare: A guide to best practice. 3rd ed. Lippincott Williams &
Wilkins, Philadelphia, PA, 2015. 87–138

Palermo, T. M., Kiska, R. Subjective sleep disturbances in


adolescents with chronic pain: Relationship to daily functioning
and quality of life. Journal of Pain. 2005; 6(3):201–207.

Pinch, W. J. Synthesis: Implementing a complex process. Nurse


Educator. 1995; 20(1):34–40.

Pinch, W. J. Improving patient care through use of research.


Orthopaedic Nursing. 2001; 20(4):75–81.

383
Prang, I. W., Jelsness-Jørgensen, L. P. Should I report? A qualitative
study of barriers to incident reporting among nurses working in
nursing homes. Geriatric Nursing. 2014; 35(6):441–447.

Sogutlu, A., Levenson, J. L., McClish, D. K., Rosef, S. D., Smith, W.


R. Somatic symptom burden in adults with sickle cell disease
predicts pain, depression, anxiety, health care utilization, and
quality of life: The PiSCES project. Psychosomatics. 2011; 52(3):272–
279.

Stratton, K. M., Blegen, M. A., Pepper, G., Vaughn, T. Reporting of


medication errors by pediatric nurses. Journal of Pediatric Nursing.
2004; 19(6):385–392.

Taylor, J. A., Brownstein, D., Christakis, D. A., Blackburn, S.,


Strandjord, T. P., Klein, E. J., Shafii, J. Use of incident reports by
physicians and nurses to document medical errors in pediatric
patients. Pediatrics. 2004; 114(3):729–735.

Uribe, C. L., Schweikhart, S. B., Pathak, D. S., Marsh, G. B., Fraley,


R. R. Perceived barriers to medical-error reporting: An exploratory
investigation. Journal of Healthcare Management. 2002; 47(4):263.

Vacek, J. E. Using a conceptual approach with a concept map of


psychosis as an exemplar to promote critical thinking. Journal of
Nursing Education. 2009; 48(1):49–53.

Valrie, C. R., Gil, K. M., Redding-Lallinger, R., Daeschner, C. Brief


report: Sleep in children with sickle cell disease: An analysis of
daily diaries utilizing multilevel models. Journal of Pediatric
Psychology. 2007; 32(7):857–861.

Wallen, G. R., Minniti, C. P., Krumlauf, M., Eckes, E., Allen, D.,

384
Oguhebe, A., et al. Sleep disturbance, depression and pain in adults
with sickle cell disease. BMC Psychiatry. 2014; 14(1):207.

Walls, P., Pahoo, K., Fleming, P. The role and place of knowledge
and literature in grounded theory. Nurse Researcher. 2010; 17(4):8–
17.

Watson, J. Nursing. The philosophy and science of caring, Revised ed.


Boulder, Colorado: University Press of Colorado; 2008.

Wolf, M. Ethnography: The method. In: Munhall P.L., ed. Nursing


research: A qualitative perspective. 5th ed. Sudbury, Massachusetts:
Jones & Bartlett; 2012:285–338.

Younger, P. Using wikis as an online health information resource.


Nursing Standard. 2010; 24(36):49–56.

385
CAPÍTULO 7

Comprensión de la
teoría y los marcos de
investigación
Jennifer R. Gray

La página web de la National Guideline Clearinghouse de la Agency for


Healthcare Research and Quality (AHRQ) se cerró en 2018. Puede
consultarse más información en https://www.ahrq.gov/.

ÍNDICE DEL CAPÍTULO

Comprensión de los elementos de una teoría, 173


Niveles de pensamiento teórico, 177
Ejemplos de valoración crítica de marcos de
investigación, 181
Puntos clave, 188
Bibliografía, 189

386
OBJETIVOS DE APRENDIZAJE
Tras concluir este capítulo, el lector debería ser capaz de:
1. Definir la teoría y los elementos de la teoría (conceptos,
declaraciones relacionales y proposiciones).
2. Distinguir entre los niveles de pensamiento teórico.
3. Describir el uso de las teorías de rango medio como marco
para los estudios.
4. Describir el propósito de un marco de investigación.
5. Identificar los marcos de investigación desarrollados a partir
de las teorías de enfermería y de otros campos.
6. Valorar críticamente los marcos en los estudios publicados.

Las teorías son las ideas y los conocimientos científicos. En un


curso de psicología, pueden estudiarse las teorías de la mente, los
mecanismos de defensa y el desarrollo cognitivo para explicar el
pensamiento y la conducta. A partir de las concepciones teóricas de
la mente, se han implementado distintas terapias. En enfermería
también existen teorías que proporcionan explicaciones y guían
nuestra práctica. Nuestras teorías explican las respuestas humanas
a las enfermedades y otros fenómenos importantes para la práctica
clínica. Por ejemplo, en enfermería tenemos una teoría sobre la
comodidad que va más allá del alivio del dolor e incluye la
relajación y el crecimiento personal (Kolcaba, 1994; Krinsky, Murillo
y Johnson, 2014). La teoría de la comodidad es una teoría de rango
medio. Las teorías de rango medio describen un fenómeno o
proceso individual, y son menos abstractas que las teorías que son
más globales. Los profesionales de enfermería han desarrollado una
teoría de rango medio para describir las conductas necesarias para
controlar el peso propio, así como los factores culturales,
ambientales y psicosociales que influyen en esas conductas (Pickett,
Peters y Jarosz, 2014). Otra teoría de rango medio en enfermería
describe la comunicación entre pacientes y profesionales de
enfermería para controlar los síntomas (Humphreys y cols., 2014).
En consonancia con el foco persistente en la calidad y la seguridad

387
(Olds y Dolansky, 2017; Sherwood y Barnsteiner, 2017), se ha
desarrollado una teoría para describir una cultura de seguridad en
un hospital (Groves, 2014; Groves, Meisenbach y Scott-Cawiezell,
2011). Estas y otras teorías que se describirán en este capítulo sirven
de guía para los profesionales de enfermería que realizan
investigaciones y que asisten a pacientes en entornos clínicos.
Cuando un investigador desarrolla un plan para realizar un
estudio cuantitativo, la teoría en la que se basa el estudio se
describe como el marco del estudio. Un marco de investigación es
una explicación breve de una teoría o las partes de una teoría que se
están utilizando para guiar un estudio o que se comprobarán en un
estudio. Las ideas principales del estudio, denominadas conceptos,
se incluyen en el marco. El marco, con los conceptos y sus
conexiones entre sí, se puede describir en palabras o en un
diagrama. Cuando se realiza el estudio, el investigador puede
responder a la pregunta: «¿Era correcta esta teoría a la hora de
describir la realidad?». Por tanto, los investigadores pueden
comprobar la precisión de las ideas teóricas propuestas en la teoría.
Al explicar los hallazgos del estudio, el investigador interpretará
esos hallazgos en relación con la teoría (Gray, Grove y Sutherland,
2017).
Los estudios cualitativos se pueden basar en una teoría o pueden
diseñarse para crear una teoría. Debido a que las suposiciones y la
filosofía subyacente de la investigación cualitativa (v. cap. 3) no son
iguales a las de la investigación cuantitativa, este capítulo se centra
en las teorías utilizadas para guiar los estudios cuantitativos. Para
ayudar a los lectores en el aprendizaje sobre las teorías y su uso en
investigación, se describen los elementos de la teoría, se identifican
los tipos de teorías y se discute cómo las teorías proporcionan
marcos para estudios. Puede observarse que las referencias de este
capítulo son más antiguas, porque se han citado fuentes primarias
de las teorías, muchas de las cuales se desarrollaron hace 10 años o
más. También se proporcionan guías para la valoración crítica de
los marcos de investigación y estas guías se aplican a diversos
marcos de estudios publicados.

COMPRENSIÓN DE LOS ELEMENTOS

388
DE UNA TEORÍA
Una teoría se define como una serie de conceptos y declaraciones
que presentan una perspectiva de un fenómeno. La parte inferior de
la figura 7.1 es un diagrama de la estructura de una teoría. Las ideas
centrales que guían la práctica y la investigación en el seno de una
disciplina científica se denominan teoría. Obsérvese que en la
definición de teoría se encuentran las palabras conceptos,
declaraciones y fenómenos. Los conceptos son términos que describen
de manera abstracta y dan nombre a un objeto, idea, experiencia o
fenómeno, proporcionándole así una identidad independiente o
significado (Schaffer, Sandau y Missal, 2017). Se definen de una
manera particular para presentar las ideas relevantes de una teoría
(v. fig. 7.1). Las declaraciones en una teoría describen cómo se
conectan los conceptos entre sí. Por ejemplo, Toulouse y Kodadek
(2016, pág. 328) declararon que la adherencia a los fármacos
«mejora los resultados clínicos y reduce el desarrollo de
complicaciones, el sufrimiento del paciente y los costes sanitarios».
Los conceptos son la adherencia a los fármacos, los resultados
clínicos, las complicaciones, el sufrimiento del paciente y los costes
sanitarios, y la declaración indica las relaciones entre ellos.

389
FIG 7.1 Elementos constitutivos de las teorías.
(Modificada de Gray, J. R., Grove, S. K. y Sutherland, S. [2017].
Burns and Grove’s the practice of nursing research: Appraisal,
synthesis, and generation of evidence [8.ª ed.]. San Luis,
Missouri: Elsevier.)

Un concepto, una declaración o una teoría se puede utilizar para


describir un fenómeno, que es la percepción consciente de una
experiencia que comprende las vidas de los seres humanos (van
Manen, 2017). Se puede entender el fenómeno de la ansiedad como
el resultado de administrar las primeras inyecciones o de la euforia
que uno siente al saber que le han admitido en la facultad de
enfermería. Los pacientes atendidos por los profesionales de
enfermería experimentan dolor, incertidumbre, miedo y alivio, por
nombrar algunas de las experiencias de los pacientes relacionadas
con la asistencia. Los profesionales de enfermería actúan para
aliviar el estrés y la ansiedad de las experiencias de los pacientes y
mejorar su salud.

Teoría
Las teorías son abstractas, en lugar de concretas. Cuando se escucha

390
el término apoyo social, uno se hace una idea sobre lo que significa la
frase y cómo se ha observado o experimentado dicho apoyo en
situaciones diferentes. El concepto de apoyo social es abstracto, lo
que significa que es la expresión de una idea, alejada de cualquier
ejemplo específico. Una idea abstracta se centra en la visión general
de un fenómeno. Un grupo de investigadores han definido el apoyo
social familiar como «un proceso interpersonal que se centra en el
intercambio de información… uno tiene la percepción o creencia de
estar conectado con los demás y de sentirse amado y estimado por
ellos» (Gomes y cols., 2017, pág. 69). Concreto se refiere a
realidades o casos reales; se centra en lo particular, más que en lo
general. Por ejemplo, en el estudio de Gomes y cols. (2017) el apoyo
social se facilitó por una intervención telefónica para educar y
proporcionar apoyo emocional a los cuidadores familiares de
pacientes que presentaban diabetes mellitus.

Filosofía
A nivel abstracto, también puede encontrarse una filosofía. Las
filosofías son exploraciones intelectuales racionales de verdades o
principios del ser, el conocimiento o la conducta. Describen puntos
de vista sobre lo que es la realidad, cómo se desarrolla el
conocimiento y qué valores y principios éticos deben guiar nuestra
práctica. Otros componentes abstractos de las filosofías y las teorías
son las suposiciones, que son declaraciones que se dan por
sentadas o se consideran ciertas, a pesar de que no han sido
demostradas científicamente. Por ejemplo, una suposición bastante
frecuente entre los profesionales de enfermería es que «las personas
quieren asumir el control de sus propios problemas de salud». Se
puede dudar de la verdad de esa suposición basándose en las
experiencias clínicas de cada uno. Sin embargo, los teóricos
comienzan con algunas suposiciones, explícitas o implícitas.

Conceptos
Las teorías de enfermería describen lo que se sabe sobre la persona,
el entorno, la salud y los cuidados, porque estos cuatro conceptos
son la esencia de la enfermería. La persona, el entorno, la salud y
los cuidados se denominan conceptos metaparadigmáticos de

391
nuestra disciplina (Meleis, 2012; Schaffer y cols., 2017).
El fenómeno denominado apoyo social presentado anteriormente
es un concepto. Un concepto es el elemento básico de una teoría.
Todos los conceptos de una teoría deben ser definidos por el
teórico. Esta definición puede ser detallada y completa, o vaga e
incompleta, y requerir mayor desarrollo (Chinn y Kramer, 2015).
Las teorías con conceptos claramente identificados y definidos
proporcionan una base más sólida para un marco de investigación.
Dos términos estrechamente relacionados con el concepto son
constructo y variable. En las teorías más abstractas, los conceptos
tienen significados muy generales que pueden ser una etiqueta para
una idea compleja y a veces se denominan constructos. Un
constructo es una categoría más amplia o una idea que puede
abarcar varios conceptos. Por ejemplo, un constructo para el
concepto de apoyo social podría ser recursos. Otro concepto que es
un recurso podría ser ingresos del hogar. A un nivel más concreto,
los términos se denominan variables y tienen una definición más
restringida. Por tanto, una variable es más específica que un
concepto. La palabra variable implica que el término se define de
forma que sea medible y sugiere que los valores numéricos de la
variable pueden variar (son variables) de un caso a otro. En la
figura 7.2, se ilustran los niveles de abstracción de los constructos,
los conceptos y las variables con un ejemplo. A la izquierda, se
observa una secuencia vertical de constructo, concepto y variable,
en la que el constructo es el elemento más abstracto y la variable es
el más concreto. Las otras dos secuencias verticales son ejemplos de
un constructo, concepto y variable.

392
FIG 7.2 De lo abstracto a lo concreto: constructos,
conceptos y variables. (Tomada de Gray, J. R., Grove, S. K.
y Sutherland, S. [2017]. Burns and Grove’s the practice of nursing
research: Appraisal, synthesis, and generation of evidence [8.ª
ed.]. San Luis, Missouri: Elsevier.)

Una variable relacionada con el apoyo social podría ser el apoyo


emocional y los investigadores podrían definirlo como la valoración
que realiza el participante en un estudio del grado de apoyo
emocional o de afirmación que recibe durante una época estresante.
La medición de la variable es un método específico para asignar
valores numéricos a cantidades variables de apoyo social
emocional. Los participantes en un estudio podrían responder a
preguntas en una encuesta o cuestionario sobre el apoyo emocional
y sus respuestas individuales se recogerían como puntuaciones. Por
ejemplo, el Cuestionario de Apoyo Social Funcional tiene una
subescala de tres ítems que mide el apoyo emocional percibido
(Broadhead, Gehlbach, de Gruy y Kaplan, 1988; Gonzalez-Saenz de
Tejada y cols., 2016). Uno de los tres ítems es «a la gente le importa
lo que me pasa» y los otros abordan si el encuestado se siente
querido y recibe elogios por hacer un buen trabajo (Broadhead y
cols., 1988, pág. 722). Si los investigadores utilizan el Cuestionario
de Apoyo Social Funcional en un estudio, la puntuación total es la
suma de las respuestas del participante a los tres ítems y es la

393
medición de la variable del apoyo emocional percibido. (En el
capítulo 10 se ofrece un análisis detallado de los métodos de
medición.)
Definir los conceptos permite utilizar los términos de forma
coherente. Los conceptos de las teorías tienen definiciones
conceptuales desarrolladas por el teórico que son diferentes de la
definición de una palabra en el diccionario. Una definición
conceptual es más completa que una definición denotativa (o del
diccionario) y comprende los significados asociados que la palabra
pueda tener. Se denomina connotativa porque el término trae a la
mente recuerdos, estados de ánimo o imágenes de forma sutil o
indirecta. Por ejemplo, una definición conceptual de hogar podría
comprender sentimientos de seguridad, amor y comodidad, que
suelen asociarse al hogar, mientras que la definición del diccionario
es más restringida y más específica: el hogar es una vivienda en la
que vive un grupo de personas que pueden estar relacionadas o no.
Algunas de las palabras o términos que se utilizan con frecuencia
en el lenguaje de enfermería no se han definido claramente. Los
términos que se utilizan en la teoría o la investigación necesitan
significados connotativos basados en la literatura profesional. Las
definiciones connotativas son declaraciones claras del significado
de los conceptos en una teoría o un estudio en particular.
La definición conceptual que un investigador identifica o
desarrolla para un concepto proviene de una teoría y proporciona
una base para la definición operacional. Se debe recordar que, en
los estudios cuantitativos, cada variable se asocia idealmente a un
concepto, una definición conceptual y una definición operacional.
La definición operacional es el modo en el que puede manipularse
el concepto, como una intervención o una variable independiente, o
medirse, como una variable dependiente o de resultado (v. cap. 5).
Las definiciones conceptuales pueden ser explícitas o implícitas. Es
importante que se identifiquen las definiciones conceptuales que
ofrece el investigador de las variables de estudio cuando se valore
críticamente un estudio. Coleman (2017) realizó un estudio de
correlación descriptivo sobre la depresión y la calidad de vida
relacionada con la salud (CVRS) en afroamericanos infectados por
el VIH (N = 70). Este autor identificó el modelo de Wilson Cleary
(1995) de CVRS como marco del estudio y definió la CVRS

394
conceptual y operacionalmente (tabla 7.1). Aunque Coleman (2017)
no definió conceptualmente los síntomas depresivos, la definición
operacional de una puntuación de 16 puntos o más en la Escala
Center for Epidemiologic Studies-Depression (v. la escala en el cap.
10; Radloff, 1977) era explícita.

TABLA 7.1
DEFINICIONES CONCEPTUALES Y OPERACIONALES DE
DEPRESIÓN Y CALIDAD DE VIDA RELACIONADA CON LA
SALUD

a
Coleman (2017) no ofreció una definición conceptual de los síntomas
depresivos, pero la definición de esta tabla se infirió a partir del marco del
estudio.
Basada en Coleman, C. (2017). Health-related quality of life and
depressive symptoms among seropositive African Americans. Applied
Nursing Research, 33(1), 138-141.

Declaraciones
Una declaración aclara el tipo de relación que existe entre dos o
más conceptos. Por ejemplo, en el estudio que se acaba de
mencionar, Coleman (2017) identificó varias declaraciones entre los
conceptos. Una declaración era «el funcionamiento físico, las
limitaciones de rol, el funcionamiento social, la salud general y el
agotamiento (aspectos de la CVRS) se conceptualizaron para influir
sobre la depresión» (Coleman, 2017, pág. 139).
Las declaraciones relacionales son las que se comprueban
mediante la investigación. El investigador obtiene datos de las
variables que representan los conceptos en el marco del estudio y
los analiza buscando las posibles relaciones significativas entre las

395
variables utilizando pruebas estadísticas específicas (Grove y
Cipher, 2017). Probar una teoría consiste en determinar la veracidad
de cada una de sus declaraciones. A medida que más
investigadores proporcionan evidencia sobre las relaciones entre los
conceptos, se determina la exactitud o inexactitud de las
declaraciones. Se requieren muchos estudios para validar todas las
declaraciones de una teoría.
En las teorías, las proposiciones son una etiqueta que se asigna a
las declaraciones para describir las relaciones entre conceptos. Las
teorías más abstractas contienen declaraciones relacionales que se
denominan proposiciones generales (Gray y cols., 2017). Cuando la
relación se define de una forma más restringida, la declaración es
más concreta y comprobable, y da lugar a una proposición
específica que, en los marcos menos abstractos (teorías de rango
medio), puede generar una hipótesis. Se han desarrollado hipótesis
basadas en las proposiciones de las teorías de rango alto o medio
que comprenden el marco del estudio. Las hipótesis, escritas en un
nivel más bajo de abstracción, se desarrollan para ser comprobadas
en un estudio (v. cap. 5). Las declaraciones en niveles variables de
abstracción que expresan relaciones entre las mismas ideas
conceptuales pueden organizarse de forma jerárquica, desde lo
general hasta lo específico. En la tabla 7.2 se proporcionan ejemplos
de relaciones entre dos conceptos que se escriben como
proposiciones generales, proposiciones específicas e hipótesis.

TABLA 7.2
EJEMPLOS DE UNA PROPOSICIÓN GENERAL, UNA
PROPOSICIÓN ESPECÍFICA E HIPÓTESIS

Proposición La calidad de vida relacionada con la salud se relaciona con la


general depresión
Proposición En las personas que reciben tratamiento antirretroviral para la
específica infección por el VIH, los dominios de calidad de vida relacionada con
la salud se relacionan con síntomas depresivos
Hipótesis En personas afroamericanas que reciben tratamiento antirretroviral
para la infección por el VIH, un funcionamiento físico deficiente y un
aumento de las limitaciones de rol se relacionan con una mayor
frecuencia y gravedad de los síntomas depresivos
Basada en Coleman, C. (2017). Health-related quality of life and

396
depressive symptoms among seropositive African Americans. Applied
Nursing Research, 33(1), 138-141.

NIVELES DE PENSAMIENTO
TEÓRICO
Las teorías pueden ser abstractas y amplias, o más concretas y
específicas. Entre lo abstracto y lo concreto hay varios niveles de
pensamiento teórico. Entender el grado de abstracción o el nivel del
pensamiento teórico ayudará a valorar de forma crítica si una teoría
es aplicable al problema de investigación en un estudio.

Grandes teorías de enfermería


Los primeros investigadores de enfermería clasificaban las teorías
más abstractas como modelos conceptuales o marcos conceptuales.
En la actualidad, las teorías más abstractas de enfermería se
denominan grandes teorías de enfermería, porque engloban
acciones de enfermería y respuestas de pacientes en múltiples
entornos. Por ejemplo, Roy (Roy y Andrews, 2008) desarrolló un
modelo en el que la adaptación era el fenómeno principal de interés
para la enfermería. En este modelo, se identifican los elementos que
se consideran esenciales para la adaptación y se describe cómo
interactúan para dar lugar a la adaptación y, por tanto, a la salud.
Por el contrario, Orem (Orem y Taylor, 2011) presenta sus
descripciones de los fenómenos de la salud en términos de
autocuidado, déficits de autocuidado y sistemas de enfermería. En
la tabla 7.3, se muestran cuatro grandes teorías de enfermería, con
una breve explicación de su contenido.

TABLA 7.3
GRANDES TEORÍAS DE ENFERMERÍA SELECCIONADAS

397
La construcción de un conjunto de conocimientos relacionados
con una gran teoría de enfermería en particular requiere un
programa organizado de investigación y un grupo de
investigadores. El Modelo de adaptación de Roy (MAR) se ha
utilizado como base para los estudios durante más de 25 años. La
Roy Adaptation Association es un grupo de investigadores que
«analizan, critican y sintetizan todos los estudios publicados en
inglés basados en el MAR» (Roy, 2011, pág. 312). El MAR sigue
utilizándose para guiar estudios. Un ejemplo es un estudio piloto
para evaluar la incidencia de trastorno de estrés agudo en personas
hospitalizadas después de una lesión traumática (Frank, Schroeter y
Shaw, 2017).
La Society of Rogerian Scholars sigue llevando a cabo estudios y
desarrollando conocimientos relacionados con la Martha Rogers’
Science of Unitary Human Beings. La sociedad publica una revista
online denominada Visions: The Journal of Rogerian Nursing Science.
La International Orem Society publica un ejemplar cada año de su
revista online, Self-Care, Dependent-Care, & Nursing, para difundir la
investigación y las aplicaciones clínicas de la teoría del autocuidado
de Dorothea Orem. Estos son ejemplos de investigadores que
mantienen una red para comunicarse entre sí y con otros
profesionales de enfermería sobre su trabajo con un enfoque teórico
específico.

Teorías de rango medio y prácticas


Las teorías de rango medio son menos abstractas y tienen un
alcance más restringido que las grandes teorías de enfermería, pero

398
son más abstractas que las teorías que se aplican solo a una
situación específica (Liehr y Smith, 2017). Estos tipos de teorías
describen experiencias como la incertidumbre en enfermedades
agudas o crónicas (Mishel, 1988, 1990), la autotrascendencia sobre la
propia esperanza de vida (Reed, 1991) y los síntomas desagradables
(Lenz, Pugh, Milligan, Gift y Suppe, 1997). Debido a que las teorías
de rango medio están relacionadas más estrechamente con la
práctica clínica y la investigación que las grandes teorías de
enfermería, los profesionales de enfermería encargados de la
asistencia a pacientes y los investigadores de enfermería las
encuentran útiles. Pueden surgir de un estudio de teoría
fundamentada, deducirse de una gran teoría de enfermería o
crearse sintetizando la literatura publicada sobre un tema en
particular (Liehr y Smith, 2017). Liehr y Smith (2017) identificaron
nueve teorías de rango medio sobre las que se han publicado al
menos tres artículos revisados por pares. Estas teorías de rango
medio se recogen en la tabla 7.4. Las teorías de rango medio se
denominan en ocasiones teorías sustantivas o esenciales porque
están más cerca de la esencia de la práctica clínica. Las teorías
esenciales han identificado con claridad conceptos, definiciones de
conceptos y declaraciones relacionales. Por tanto, se aplican con
más frecuencia como marcos en los estudios de enfermería.

TABLA 7.4
TEORÍAS DE RANGO MEDIO PARA ENFERMERÍAa

TEORÍA FUENTES TEÓRICAS RELEVANTES


Cuidado Swanson (1991)
Comodidad Kolcaba (1994)
Fuerza interior Roux, Dingley y Bush (2002)
Capital intelectual de enfermería Covell (2008)
Autotrascendencia Reed (1991)
Transiciones Meleis (2010)
Incertidumbre frente a la enfermedad Mishel (1988, 1990)
Síntomas desagradables Lenz y cols. (1997)
Ira de las mujeres Thomas (1991)
a
Liehr y Smith (2017) identificaron que estas nueve teorías de rango medio
se usan de forma continua.

399
Las teorías prácticas son un tipo de teorías de rango medio más
específicas. Están diseñadas para proponer enfoques determinados
para situaciones prácticas de enfermería particulares. Algunos
investigadores las denominan teorías específicas de situación. Riegel,
Dickson y Faulkner (2016) publicaron una descripción de la teoría
específica de situación del autocuidado en la insuficiencia cardiaca.
Riegel y cols. (2016) identificaron que el autocuidado incluye la
toma de fármacos según la prescripción, la monitorización de los
síntomas y la realización de acciones cuando un síntoma indique un
problema significativo. Para poder realizar estas acciones, la
persona con insuficiencia cardiaca debe comprender el propósito de
cada fármaco, los síntomas que indican un empeoramiento de la
insuficiencia cardiaca, así como el momento de contactar con el
médico. Como se ve en este ejemplo, la aplicación de una teoría de
rango medio a una situación específica identifica las acciones de
enfermería apropiadas. Por esta razón, a veces se denominan
teorías prescriptivas. Las guías de práctica basada en la evidencia
son una buena fuente para las teorías prácticas y prescriptivas (v.
cap. 13).

Marcos de investigación
Un marco de investigación es una estructura de significado lógica y
abstracta, como una parte de una teoría, que guía el desarrollo del
estudio y permite al investigador relacionar los hallazgos con el
conjunto de conocimientos de enfermería (Lor, Backonja y Lauver,
2017). Por motivos de claridad, aquí se utiliza el término marco de
investigación para referirse a los conceptos y relaciones que se
abordan en un estudio. Lor y cols. (2017) proporcionaron
orientación sobre el modo en el que las teorías pueden utilizarse
para guiar los estudios descriptivos y experimentales. Para los
estudios descriptivos, los investigadores pueden utilizar «conceptos
de la teoría para guiar la recogida de datos»; los investigadores que
realizan estudios experimentales observarán que «los conceptos de
la teoría guían el diseño global» (Lor y cols., 2017, pág. 4). Es
posible que el investigador espere que una variable produzca un
cambio en otra, como que la variable independiente de un
programa de ejercicio aeróbico afecte a la variable dependiente de

400
pérdida de peso. En un estudio cuantitativo bien desarrollado, el
investigador explica de forma abstracta en el marco por qué se
espera que una variable influya en la otra. La idea se expresa de
forma concreta como una hipótesis que se va a comprobar a través
de la metodología del estudio.
Todos los estudios cuantitativos tienen un marco implícito o
explícito. Esto es cierto tanto si el estudio tiene un foco fisiológico,
psicológico, social o cultural. Un marco expresado con claridad es
una indicación de un estudio cuantitativo bien desarrollado. El
investigador desarrolla o aplica el marco para explicar los
conceptos que contribuyen a los resultados o que los producen
parcialmente, y cita artículos y libros para apoyar la explicación.
Una estrategia para expresar una teoría o un marco de
investigación es un diagrama en el que los conceptos y relaciones se
muestran gráficamente. Estos diagramas se denominan en
ocasiones mapas o modelos conceptuales (Gray y cols., 2017). Un
modelo comprende todos los conceptos principales de un marco de
investigación. Las flechas entre los conceptos indican los vínculos
propuestos entre ellos. Cada enlace que se muestra con una flecha
es una ilustración gráfica de una declaración relacional
(proposición) de la teoría. Lor y cols. (2017) han descrito el modo en
el que escogen una teoría para guiar su investigación y han
presentado un modelo para la Teoría de la Conducta de Búsqueda
de Asistencia (fig. 7.3). En la figura, se observa que los factores
clínicos y sociodemográficos influyen en el afecto, las creencias, las
normas y los hábitos. Las conductas de búsqueda de asistencia se
ven afectadas por factores clínicos y sociodemográficos, así como
por el afecto, las creencias, las normas y los hábitos. Las relaciones
entre afectos, creencias, normas y hábitos, y la conducta de
búsqueda de asistencia se ven moderadas por condiciones externas.

401
FIG 7.3 Teoría de la conducta de búsqueda de
asistencia. (Reproducida a partir de Lor, M., Backonja, U. y
Lauver, D. [2017]. How could nurse researchers apply theory to
generate knowledge more efficiently? Journal of Advanced
Nursing, 49(5), 580-589.)

Por desgracia, en algunos estudios cuantitativos las ideas que


componen el marco son confusas y se expresan vagamente. Aunque
el investigador cree que las variables que se están estudiando se
relacionan de alguna forma, esta noción solo se expresa en términos
concretos. Puede hacer pocos intentos para explicar por qué se cree
que existen estas relaciones. Sin embargo, el rudimento de un
marco de investigación es la expectativa (que quizá no se expresa
directamente) de que una o más variables se relacionen con otras. A
veces, las ideas básicas para el marco se expresan en la introducción
o en la revisión de la literatura, y se describen como relaciones entre
variables que se han encontrado en estudios previos, pero entonces
el investigador se detiene, sin desarrollar completamente las ideas
como un marco. Esto se denomina marco implícito. En la mayoría
de los casos, un lector atento puede extraer un marco implícito del
texto del informe de investigación. Si los investigadores no
describen claramente el marco, es posible que se quiera extraer un
modelo basado en la información proporcionada. Tener un modelo

402
ayudará a visualizar el marco y el modo en el que están
relacionadas las variables del estudio. Los marcos implícitos
proporcionan una orientación limitada para el desarrollo y la
realización de un estudio y limitan la contribución de sus hallazgos
al conocimiento de enfermería.
Los marcos de investigación pueden proceder de grandes teorías
de enfermería, de teorías de rango medio de enfermería y otras
profesiones, así como de la síntesis de conceptos y relaciones de
más de una teoría y de la síntesis de los resultados de
investigaciones. En algunos estudios cuantitativos, el marco nuevo
que se propone puede llamarse teoría provisional o teoría
tentativa. La síntesis de conceptos y relaciones de más de una teoría
o de resultados de investigaciones también son ejemplos de teorías
provisionales que suelen desarrollarse para un estudio concreto.
El marco teórico y conceptual para los estudios fisiológicos suele
derivar de la fisiología, la genética, la fisiopatología y la física. Este
tipo de teoría se conoce como teoría científica y tiene una amplia
evidencia de investigación para respaldar sus afirmaciones. Los
conceptos del marco tienen una relación clara con las variables del
estudio y existen métodos válidos y fiables para medir cada
concepto, variable relacionada y las declaraciones relacionales en
las teorías científicas. Puesto que el conocimiento en estas áreas se
ha demostrado mediante la investigación, las relaciones teóricas
suelen denominarse leyes y principios. Además, las proposiciones
pueden desarrollarse y comprobarse utilizando estas leyes y
principios y, después, aplicarse a problemas de enfermería. Sin
embargo, las teorías científicas permanecen abiertas a una posible
evidencia contraria que requeriría su revisión. Por ejemplo, antes de
este siglo, los científicos creían que conocían las funciones e
interacciones de varios genes, pero han tenido que revisar algunas
de sus teorías debido a los conocimientos adquiridos a través del
Proyecto Genoma Humano (http://www.genome.gov/10001772).

EJEMPLOS DE VALORACIÓN
CRÍTICA DE MARCOS DE
INVESTIGACIÓN

403
Se debe valorar críticamente la calidad del marco de un estudio
cuantitativo con el fin de determinar su utilidad para dirigir el
estudio e interpretar los hallazgos de este. Las siguientes preguntas
se han desarrollado para ayudar a evaluar esta calidad:

GUÍAS DE VALORACIÓN CRÍTICA


Marco de un estudio

1. ¿En el estudio se identifica de forma explícita y se describe un


marco de investigación? En caso afirmativo, ¿cuál es el
nombre de la teoría y del teórico utilizados para el marco?
2. ¿Están los conceptos del marco definidos conceptualmente?
3. ¿Las definiciones operacionales de las variables son
coherentes con sus definiciones conceptuales asociadas?
4. ¿Los investigadores identifican claramente las declaraciones
relacionales o las proposiciones del marco que se está
analizando en el diseño del estudio?
5. ¿Los resultados del estudio siguen estando relacionados con
el marco?

Valorar críticamente un marco de un estudio cuantitativo


requiere ir más allá del propio marco para analizar su relación con
otros componentes del estudio, como el diseño, la medición de las
variables y la aplicación de una intervención, si procede. Hay que
comenzar por identificar los conceptos y definiciones conceptuales
del texto en la introducción, la revisión de la literatura o la
discusión del marco. Después, debe juzgarse la idoneidad de las
relaciones entre los conceptos y las variables, la medición de la
investigación o las variables dependientes, y la aplicación de las
variables independientes. También se debe determinar si los
hallazgos del estudio siguen estando relacionados con el marco de
la investigación. Los investigadores suelen relacionar los resultados
de nuevo con el marco y otras publicaciones citadas en el apartado
de discusión del informe. En este apartado se aplican las guías de
valoración crítica a marcos que se han derivado de una gran teoría
de enfermería, una teoría de rango medio, una teoría provisional y

404
una teoría científica (fisiológica).

Marco de una gran teoría de enfermería


Una de las dificultades con las grandes teorías de enfermería es que
son abstractas y es difícil determinar sus conceptos. Algunos
investigadores han deducido teorías de rango medio a partir de
grandes teorías de enfermería y han utilizado teorías de rango
medio para guiar sus estudios. Otros han utilizado una gran teoría
de enfermería como marco global, pero no han relacionado
directamente las variables con los constructos de la teoría.
La modificación de la conducta después de un infarto de
miocardio agudo (IMA) es crucial para reducir el riesgo cardiaco y
evitar una recidiva. Después de un IMA, los hallazgos de la
investigación han sido «prometedores, pero heterogéneos» en
relación con la motivación del cambio de conducta para reducir los
riesgos cardiacos mediante la adaptación de las conductas
saludables. Park, Song y Jeong (2017) realizaron un estudio
experimental aleatorizado para evaluar los efectos de una
intervención basada en una teoría sobre los resultados después de
un primer IMA. La intervención se basaba en una propuesta de la
Teoría del Logro de Metas de King (King, 1992), una de las grandes
teorías de la enfermería. Park y cols. (2017) señalaron que «las
estrategias aplicada para motivar a los individuos a desarrollar y
mantener conductas de salud están muy lejos de ser óptimas» (Park
y cols., 2017, pág. 9). Los investigadores utilizaron la gran teoría
explícita en el Ejemplo de investigación 7.1.

EJEMPLO DE INVESTIGACIÓN 7.1


Gran teoría de enfermería como marco de
investigación
Extracto del estudio de investigación
Según el marco de King, se pueden aplicar estrategias orientadas al
logro de objetivos para… garantizar una modificación conductual

405
eficaz mediante el proceso de interacción, donde el paciente y el
profesional de la salud identifican mutuamente los riesgos
cardiovasculares específicos que tiene el individuo y acuerdan
perseguir la meta de gestión del riesgo juntos. Basándose en la teoría
del logro de metas, el presente estudio aplicó un programa educativo
orientado por objetivos a individuos con un primer episodio de infarto
de miocardio para evaluar los efectos del programa sobre los riesgos
cardiovasculares, las conductas de salud y la calidad de vida a lo largo
de 6 meses…

Los pacientes que se asignaron al grupo experimental recibieron el


programa educativo basado en la teoría del logro de metas por parte de
un educador de enfermería del equipo de investigación antes de su
alta para fijar los objetivos acordados mutuamente de manejo del
riesgo y para obtener información sobre el modo de modificar sus
conductas de salud con el fin de lograr las metas. Los pacientes que
fueron asignados al grupo control recibieron la educación formal de
20 min sobre el control del riesgo cardiovascular y la modificación del
estilo de vida por el coordinador de enfermería. Esta educación formal
estaba disponible como una asistencia rutinaria para todos los
pacientes con IMA ingresados en las unidades cardiacas del hospital
universitario en el que se llevó a cabo el estudio…

Nuestros hallazgos mostraron que un programa personalizado de


control del riesgo dirigido por un profesional de enfermería en el que
cada individuo fija los objetivos puede lograr un control eficaz del
riesgo cardiovascular mediante modificación del estilo de vida tanto
inicialmente como a largo plazo, lo que mejora la calidad de vida (CV)
relacionada con la salud…

Se deberían tener en cuenta ciertas limitaciones al interpretar los


hallazgos de este estudio. En primer lugar, los participantes de ambos
grupos recibieron orientación rutinaria sobre la modificación del estilo
de vida junto con un tratamiento farmacológico agresivo tras su
primer episodio de IMA. Esto puede haber reducido el tamaño del
efecto del programa y, junto con el pequeño tamaño de la muestra,

406
habría causado un error tipo II… no se aplicó enmascaramiento
durante las evaluaciones de seguimiento debido a las características
del programa educativo, lo que hace posible la existencia de sesgos en
la evaluación. Los hallazgos deberían considerarse sugestivos, puesto
que la mayoría de los cambios entre los grupos correspondieron a
parámetros autonotificados… El programa educativo dirigido por
profesionales de enfermería con un enfoque individualizado orientado
por metas puede integrarse con facilidad en el sistema actual de
tratamiento médico para dar lugar a una modificación más eficaz del
estilo de vida (Park y cols., 2017, págs. 9, 10-11, 15).

Valoración crítica
La Teoría del logro de metas de King (1992) se identificó de forma
explícita como marco teórico del estudio. La intervención se basaba
en una de las proposiciones teóricas de King, según la cual las
metas mutuamente acordadas desarrolladas mediante la
interacción darán lugar a un cambio conductual (Park y cols.,
2017). Sin embargo, los investigadores no indicaban que la
declaración era una proposición de la teoría. La intervención se
definió conceptualmente basándose en la teoría de King (1992) y se
operacionalizó, determinando el procedimiento y permitiendo su
medición, utilizando un protocolo. Las definiciones conceptual y
operacional eran congruentes. Otros conceptos de la teoría no se
definieron ni se midieron en el estudio. Park y cols. (2017) no
relacionaron los hallazgos del estudio con el marco en el apartado
de discusión de su informe. El uso de la gran teoría para guiar la
intervención era apropiado y aumentó la solidez del estudio, pero
debía relacionarse con las variables dependientes y los hallazgos
del estudio.
Basándose en un análisis de potencia, se reclutaron para el
estudio 64 participantes que recibían rehabilitación cardiaca
hospitalaria y se asignaron de forma aleatoria a los grupos de
intervención o de asistencia habitual. Los ayudantes de la
investigación entrevistaron a los participantes en los primeros 2
días tras el ingreso para recoger datos sobre las variables de
resultado de calidad de vida, factores de riesgo y conductas de
salud (Park y cols., 2017). También recogieron información

407
demográfica y médica de las historias clínicas. Los ayudantes de la
investigación ignoraban cuál era la asignación a los grupos.
No se observaron diferencias significativas en las variables de
resultado entre los grupos de intervención y de asistencia habitual
en el momento basal. Los participantes de ambos grupos redujeron
sus riesgos cardiovasculares en los primeros 6 meses tras el IMA,
sin que se observasen diferencias significativas relacionadas con la
intervención (Park y cols., 2017). Sin embargo, la intervención tuvo
un efecto sobre las conductas de salud, el componente mental de
calidad de vida (CV) y el control de la glucemia. El grupo
intervención refirió puntuaciones más altas en esos parámetros a
los 6 meses.
Los investigadores plantearon la necesidad de estudios futuros
sobre los efectos a largo plazo de una intervención basada en una
teoría. La fijación mutua de objetivos (uno de los conceptos
principales de la teoría de King) requiere su estudio en otras
poblaciones, con la necesidad de realizar cambios a largo plazo en
las conductas de salud.

Marco basado en una teoría de rango medio


Muchos marcos para los estudios de enfermería se han basado en
teorías de rango medio. Estos estudios comprueban la validez de la
teoría de rango medio y analizan los parámetros dentro de los que
puede aplicarse dicha teoría. Algunos investigadores de enfermería
han utilizado las teorías de rango medio desarrolladas por
profesionales de campos distintos a la enfermería. Otros han
utilizado las teorías de rango medio que ellos u otros profesionales
de enfermería habían desarrollado para explicar un fenómeno de
enfermería. En cualquier caso, estas teorías deben comprobarse
antes de aplicarlas a la práctica.
Reinoso (2016) utilizó la teoría de rango medio de enfermería de
Mishel, la Teoría de Incertidumbre frente a la Enfermedad Aguda y
Crónica (1988), como marco para un estudio del estrés psicológico
en personas que tenían hepatitis C crónica. Reinoso (2016, pág. 445)
señaló que la incertidumbre sobre el grado y el pronóstico de la
infección es el «factor estresante definitivo». La laguna del
conocimiento, que es la declaración del problema de investigación,

408
no se identificó con claridad, pero puede inferirse de la revisión de
la literatura de los estudios en los que la incertidumbre era una
variable. Reinoso (2016) señaló que los estudios previos que tenían
resultados inesperados relacionados con la incertidumbre no
incluían las condiciones que contribuyen a la incertidumbre. En la
descripción de la teoría de rango medio, el concepto principal de
incertidumbre se definió como «el estado cognitivo que el
individuo crea cuando no es capaz de estructurar o categorizar
adecuadamente un evento debido a la falta de pistas suficientes»
(Reinoso, 2016, pág. 446). Reinoso relacionó la incertidumbre con el
estrés psicológico y describió el marco de estudio en el Ejemplo de
investigación 7.2.

EJEMPLO DE INVESTIGACIÓN 7.2


Teoría de rango medio como marco
Extracto del estudio de investigación
La Teoría de la Incertidumbre frente a la Enfermedad de Mishel
proporciona una teoría esencial en la que enmarcar un estudio sobre
las incertidumbres a las que se enfrentan los individuos
diagnosticados de hepatitis C crónica… El fin de este estudio de
investigación fue analizar la correlación (tanto su dirección como su
fuerza) entre la incertidumbre y los antecedentes de la incertidumbre
en la teoría de la enfermedad. La pregunta de investigación que guió
el estudio fue: ¿Cuál es la relación entre los antecedentes de la teoría
de Mishel (es decir, figuras de autoridad de asistencia sanitaria, años
desde el diagnóstico, experiencia terapéutica y red social) y la
percepción de incertidumbre por parte del individuo sobre la hepatitis
C crónica? Se utilizó un diseño de correlación transversal para
evaluar la dirección y la fuerza de las relaciones entre las variables…
La incertidumbre como variable dependiente se correlacionó con otras
variables para evaluar el grado de relación que comparten estas
variables… Unas puntuaciones mayores a la hora de evaluar las
figuras de autoridad de asistencia sanitaria se asociaron con una

409
incertidumbre percibida mayor… unos niveles superiores de red
social se asociaron con una incertidumbre percibida menor… Los
años desde el diagnóstico y la experiencia con el tratamiento no se
relacionaban con la incertidumbre… la conexión de las personas
diagnosticadas con hepatitis C con recursos de la comunidad puede
ser una ayuda adicional para quienes se enfrentan a eventos de
enfermedad… quienes tienen una red social expandida tienen menos
incertidumbre y viceversa… Los hallazgos se pueden utilizar para
ayudar a crear intervenciones dirigidas hacia esta población para
disminuir la incertidumbre y para desarrollar una comprensión
coherente de eventos de enfermedad (Reinoso, 2016, págs. 445, 446,
450, 451).

Valoración crítica
La Teoría de la incertidumbre frente a la enfermedad (Mishel, 1988)
se identificó explícitamente como el marco de investigación para el
estudio (Reinoso, 2016). Se proporcionó una definición conceptual
de la incertidumbre, pero no se encontraron definiciones
conceptuales de los antecedentes de incertidumbre en el informe.
Las definiciones operacionales de cada variable se hicieron
explícitas. Las definiciones conceptuales y operacional de la
incertidumbre eran congruentes. Las relaciones entre los
antecedentes de incertidumbre y la propia incertidumbre se
identificaron como las relaciones que se estaban estudiando.
Reinoso (2016) relacionó los hallazgos con la teoría y describió
una posible aplicación a la práctica clínica. Las puntuaciones más
elevadas relacionadas con las figuras de autoridad sanitaria
indicaron una mayor desconfianza o insatisfacción con el médico,
los profesionales de enfermería y otros profesionales (Reinoso,
2016). Cuando el paciente percibía conflictos o discrepancias en la
información proporcionada por estas personas, la incertidumbre
era mayor. Reinoso (2016, pág. 451) identificó que la relación
negativa entre las redes sociales y la incertidumbre tenía
implicaciones al hacer recaer la responsabilidad en los
profesionales sanitarios «para comprender la importancia que las
redes sociales desempeñan en la interpretación de los eventos
patológicos y conectar a los pacientes con esas redes».

410
Marco de una teoría provisional
Los hallazgos de los estudios recogidos en la bibliografía pueden
ser una fuente rica de marcos cuando se sintetizan en un conjunto
coherente y lógico de relaciones. Dichos hallazgos, especialmente
cuando se combinan con conceptos y relaciones de teorías de rango
medio o que no son de enfermería, pueden sintetizarse en una
teoría provisional que proporciona un marco para un estudio en
concreto.
Duarte y Pinto-Gouveia (2017) realizaron un estudio descriptivo
transversal de correlación con profesionales de enfermería
hospitalarios (n = 298) para comprobar un modelo teórico basado en
los hallazgos de investigación relacionados con la empatía, la culpa
patógena basada en la empatía y la calidad de vida profesional.
Estos autores observaron que la empatía se había asociado con
resultados positivos para los pacientes, como el cumplimiento
terapéutico y con un cuidado eficaz y menos desgaste para los
profesionales sanitarios. La empatía también se asociaba con
sentimientos de culpa que pueden volverse patógenos cuando son
excesivos o desviarse y afectar a la calidad de vida profesional. La
calidad de vida profesional se definía como constituida por el
desgaste y la fatiga por compasión. Estas relaciones complejas se
medían y se analizaban utilizando una muestra no probabilística
(Ejemplo de investigación 7.3).

EJEMPLO DE INVESTIGACIÓN 7.3


Teoría provisional como marco
Extracto del estudio de investigación
La empatía está en el centro de la práctica de enfermería… La
preocupación empática se definió como sentimientos de preocupación
acerca del bienestar de los demás y sentimientos desagradables por sus
desgracias. La angustia personal se definió como sentimientos de
malestar y ansiedad cuando se presencia el estado negativo de otra
persona. Estas dos dimensiones se consideran los componentes

411
afectivos de la empatía. A diferencia de los efectos prosociales del
hecho de tomar perspectiva y de la preocupación empática, la angustia
personal no parece tener efectos positivos sobre las relaciones
personales… la empatía se relaciona estrechamente con la culpa, por
lo que las personas más empáticas son más propensas a experimentar
culpa que las menos empáticas… Nosotros nos centramos
particularmente en la culpa del superviviente y en la culpa de la
omnipotencia. Ambas implican un sentimiento exagerado de
responsabilidad por los demás… La culpa por responsabilidad
omnipotente también surge de la empatía e implica un sentido
exagerado de responsabilidad y preocupación por la felicidad y el
bienestar de los demás… En algunos trabajos en los que se es
responsable de las vidas y el bienestar de los demás, como la
enfermería, la culpa puede ser especialmente aguda cuando las cosas
salen mal. Sin embargo, hasta el momento pocos estudios han
evaluado el impacto de los sentimientos de culpa en el bienestar de los
profesionales de enfermería… Se utilizaron cuestionarios
autonotificados para comprobar los objetivos del estudio… y
comprobar un modelo teórico de las relaciones entre las dimensiones
de la empatía (preocupación empática y hecho de tomar perspectiva),
la culpa patógena basada en la empatía y la calidad de vida
profesional. Planteamos la hipótesis de que cuando la empatía se
asocia con culpa patógena (es decir, culpa por supervivencia y por
omnipotencia), puede contribuir al malestar profesional (síntomas de
fatiga por compasión y de desgaste). Puesto que el hecho de tomar
perspectiva no se asoció de forma significativa con la fatiga por
compasión, no pudimos probar un modelo de mediación. En la figura
1 se presenta un diagrama conceptual de los modelos de mediación
(Duarte y Pinto-Gouveia, 2017, págs. 42-44).

412
FIG 1 Diagrama conceptual de los efectos directos e
indirectos de la empatía sobre la calidad de vida
profesional. (Tomada de Duarte, J. y Pinto-Gouveia, J. [2017].
Empathy and feelings of guilt experienced by nurses: A cross-
sectional study of their role in burnout and compassion fatigue
symptoms. Applied Nursing Research, 35[1], 42-47.)

Valoración crítica
El marco de investigación provisional se propuso basándose en
hallazgos y conclusiones de estudios previos. Los conceptos se
definieron y se relacionaron con las variables y los instrumentos
apropiados para su medición. Las definiciones conceptual y
operacional inferidas eran congruentes. Las declaraciones de las
relaciones provisionales entre los conceptos eran complejas, hecho
que se ve respaldado por los efectos directos e indirectos entre los
conceptos. En el apartado de discusión, Duarte y Pinto-Gouveia
(2017) reconocieron las limitaciones del estudio e identificaron las
implicaciones apropiadas para sus resultados. Se recomendaron
estudios futuros para «replicar estos hallazgos, en muestras más
amplias, utilizando diseños experimentales y longitudinales para
comprobar hipótesis particulares basadas en los hallazgos actuales,
y con formas alternativas de medir estos procesos» (Duarte y Pinto-
Gouveia, 2017).

Marco para los estudios fisiológicos


El desarrollo de un marco fisiológico para expresar la lógica en la
que se basa el estudio es claramente útil para el investigador y los
lectores. La valoración crítica de un marco fisiológico no es
diferente de la de otros marcos. Sin embargo, los conceptos y las

413
definiciones conceptuales pueden ser menos abstractos en los
marcos fisiológicos que en los estudios psicosociales. Los conceptos
en los estudios fisiológicos podrían ser términos como gasto
cardiaco, disnea, cicatrización de las heridas, presión arterial, hipoxia
tisular, metabolismo y estado funcional.
Amiri y Turner-Henson (2017) realizaron un estudio transversal
con una muestra de 88 mujeres gestantes en su segundo trimestre
para determinar los efectos de la exposición al formaldehído (FA)
sobre el crecimiento fetal intrauterino. Los conceptos incluyen
crecimiento intrauterino retardado, estrés oxidativo y exposiciones
al FA. En el Ejemplo de investigación 7.4, se puede observar que se
usó un modelo biológico como marco del estudio. Además, la
figura 7.4 muestra las tres relaciones primarias en el modelo que
eran el foco del estudio. El diagrama se ha simplificado para aclarar
las relaciones primarias del modelo. Amiri y Turner-Henson (2017)
no tenían definiciones conceptuales y operacionales explícitas. En la
tabla 7.5 se muestran las definiciones conceptuales y operacionales
que hemos desarrollado a partir del artículo.

EJEMPLO DE INVESTIGACIÓN 7.4


Teoría fisiológica como marco
Extracto del estudio de investigación
Existe una evidencia empírica limitada sobre los niveles de exposición
al FA en mujeres embarazadas y su relación con el crecimiento fetal.
Hemos adoptado un modelo biológico de Kannan, Misra, Dvonch y
Krishnakumar (2006), quienes demostraron la relación entre las
partículas, como contaminante atmosférico de exteriores, y los
resultados del embarazo, teniendo en cuenta el efecto del estrés
oxidativo como una vía biológica en esta relación. Hemos analizado la
relación entre la exposición al FA y el crecimiento fetal en el segundo
trimestre y el posible papel de mediación del estrés oxidativo en dicha
relación… Hemos utilizado un diseño transversal en el que las
participantes se reclutaron de consultas de obstetricia y ginecología

414
urbanas (una pública, dos privadas) en el sudeste de Estados
Unidos… Después de obtener el consentimiento informado, el primer
autor, como única persona encargada de recoger los datos, entrevistó
a las participantes respecto a las características demográficas,
antecedentes obstétricos y características de su vivienda de
residencia… Se instruyó a las participantes para que llevaran el
detector de FA durante 24 horas mientras estaban en su domicilio, en
el trabajo, el colegio y otras localizaciones. Pedimos a las participantes
que colocasen el detector en una silla o soporte cerca de su cabeza
mientras durmiesen y se duchasen… Estas mediciones se obtuvieron
mediante la revisión de los informes ecográficos de las participantes a
partir de la historia clínica electrónica. Las mediciones ecográficas las
notificaron técnicos ecografistas certificados en cada consulta…

No se observaron correlaciones significativas entre la edad materna,


nivel educativo, estado civil, ingresos anuales familiares y mediciones
ecográficas de la biometría fetal… Había una diferencia significativa
en cuanto a las medianas de percentiles de peso fetal estimado, de
modo que el grupo de raza blanca tenía la mediana más elevada… No
había una relación significativa entre el número de embarazos, el
estatus de tabaquismo materno o el intervalo entre embarazos y
mediciones ecográficas de la biometría fetal… se observó que una
mayor exposición al FA (>0,3 ppm) se asociaba significativamente con
el diámetro biparietal (DBP)… una mayor exposición al FA se
asociaba con una longitud femoral corta… el papel mediador del
estrés oxidativo en la relación entre el nivel de exposición al FA y el
DBP… no se vio respaldado en este estudio (Amiri y Turner-Henson,
2017, págs. 53-54, 56-58).

Valoración crítica
Amiri y Turner-Henson (2017) identificaron el modelo biológico de
Kannan y cols. (2006) como marco de investigación, pero no
proporcionaron definiciones conceptuales explícitas de las
variables del estudio. Las definiciones conceptuales se elaboraron a
partir de la información proporcionada en los apartados de
introducción y antecedentes del artículo (v. tabla 7.5) y las

415
definiciones operacionales se extrajeron del apartado de
procedimientos del estudio del artículo. Las definiciones
conceptuales y operacionales inferidas tal y como se extrajeron del
estudio parecían concordantes entre sí, pero unos conceptos
definidos explícitamente habrían fortalecido el uso del modelo. Se
identificaron relaciones hipotéticas entre las variables para el
diseño de correlación descriptivo.
Los investigadores indicaron las implicaciones para la educación,
la práctica y la investigación de enfermería, pero no discutieron las
implicaciones para el modelo biológico que era el marco de
investigación. En la sección de discusión, los investigadores
señalan que la información acerca de los efectos de exposición al
FA sobre el crecimiento fetal ha sido muy limitada, por lo que los
resultados de este estudio son significativos a pesar del desgaste de
la muestra. Otros investigadores han mostrado que el efecto
oxidativo tiene un efecto mediador en la relación entre la
exposición al FA y el diámetro biparietal; sin embargo, en este
estudio no se observó un efecto significativo y los investigadores
consideran que varias dificultades de medición pueden haber
afectado a los resultados. Las implicaciones clínicas son que los
profesionales de enfermería deben aprender más sobre las
exposiciones ambientales. Amiri y Turner-Henson (2017, pág. 59)
afirman que «La evaluación de los riesgos ambientales durante el
embarazo debería ser un componente estándar de la asistencia
prenatal. Los profesionales de enfermería deberían educar a las
mujeres… sobre estrategias de reducción del riesgo para evitar las
exposiciones a sustancias tóxicas».

TABLA 7.5
DEFINICIONES CONCEPTUALES Y OPERACIONALES DE
LAS VARIABLES

DEFINICIÓN
VARIABLE DEFINICIÓN OPERACIONAL
CONCEPTUAL
Crecimiento «Cualquier desviación Diámetro biparietal, perímetro cefálico,
intrauterino del crecimiento fetal o perímetro abdominal, longitud femoral y
retardado fracaso para alcanzar el proporción perímetro
potencial de abdominal/longitud femoral obtenidos

416
crecimiento… asociado en el informe de la ecografía del segundo
con una mortalidad y trimestre en la historia clínica electrónica
morbilidad prenatales de cada participante. Los parámetros se
mayores» (Amiri y convirtieron en percentiles biométricos
Turner-Henson, 2017, basados en el sexo y la raza fetales
pág. 51)
Exposición al Contaminante del aire Se mide mediante análisis de
formaldehído peligroso que es un cromatografía líquida de alto
(FA) carcinógeno humano rendimiento de una placa de
conocido y que aumenta monitorización del vapor que llevan los
el estrés oxidativo participantes. Se informa en partes por
millón y se compara con estándares
ambientales
Cotinina Biomarcador del humo Se mide mediante un análisis de ELISA.
urinaria del tabaco, una fuente de El mínimo nivel de detección fiable es de
exposición al FA en 2 mg ml; análisis realizado por el
interiores investigador principal
Estrés El desequilibrio de la El 15-isoprostano F21 se midió utilizando
oxidativo «producción de kits de ELISA para isoprostano urinario
moléculas oxidantes
reactivas supera la
capacidad de los
mecanismos de defensa
antioxidantes de la
célula» (pág. 53), lo que
se asocia con resultados
desfavorables del
embarazo
Creatinina Producto del catabolismo Concentración de la sustancia
proteico en la orina que determinada por un método de análisis
es un indicador de la colorimétrico según lo indicado por un
función renal e influye en servicio del laboratorio nacional
lagravedad específica de
la orina;se puede utilizar
para estandarizar otras
pruebas urinarias
Basada en Amiri, A. y Turner-Henson, A. (2017). The roles of formaldehyde
exposure and oxidative stress in fetal growth in the second trimester.
Journal of Gynecological, Obstetrics, and Neonatal Nurses (JOGNN),
46(1), 51-62. ELISA, análisis de inmunoabsorción ligada a enzimas.

417
FIG 7.4 Modelo propuesto de las relaciones entre el
nivel de exposición al formaldehído, el estrés oxidativo
y el crecimiento fetal intrauterino. (Basada en Amiri, A. y
Turner-Henson, A. [2017]. The roles of formaldehyde exposure
and oxidative stress in fetal growth in the second trimester.
Journal of Gynecological, Obstetrics, and Neonatal Nurses
[JOGNN], 46[1], 51-62.)

PUNTOS CLAVE
• La teoría es esencial para la investigación porque
proporciona el marco para el desarrollo de un estudio y
relaciona los resultados con los conocimientos de la
disciplina.
• Una teoría es un conjunto integrado de conceptos,
definiciones y declaraciones que presenta una visión de un
fenómeno.
• Los elementos de las teorías son los conceptos y las
declaraciones relacionales.
• Las grandes teorías de enfermería son muy abstractas y
explican el fenómeno de interés en términos generales.
• Las teorías de rango medio y provisionales son menos
abstractas y tienen un alcance más restringido que las
grandes teorías de enfermería.
• Todos los estudios tienen un marco teórico, aunque algunos

418
marcos están poco expresados o son implícitos.
• Un marco de investigación es una estructura lógica y
abstracta de significado, como una parte de una teoría, que
guía el desarrollo del estudio y permite al investigador
relacionar los resultados con el conjunto de conocimientos
de enfermería.
• Para utilizarse con eficacia, el marco del estudio debe incluir
los conceptos y sus definiciones conceptuales y
operacionales. Las declaraciones relacionales o las
proposiciones que se están analizando deben ser claras y
representarse en un modelo o mapa.
• Los marcos para los estudios pueden provenir de grandes
teorías de enfermería, teorías de rango medio, resultados de
investigaciones, teorías que no son de enfermería, teorías
provisionales y teorías científicas.
• Las teorías científicas derivan de la fisiología, la genética, la
fisiopatología y la física, y están apoyadas por una extensa
evidencia.
• Valorar críticamente un marco requiere identificar y evaluar
los conceptos, sus definiciones y las declaraciones
relacionadas con los conceptos. Los hallazgos del estudio
deberían relacionarse con el marco de investigación con el
fin de determinar su utilidad para describir la realidad.

BIBLIOGRAFÍA
Amiri, A., Turner-Henson, A. The roles of formaldehyde exposure
and oxidative stress in fetal growth in the second trimester. Journal
of Gynecological, Obstetrics, and Neonatal Nurses (JOGNN). 2017;
46(1):51–62.

Broadhead, W. E., Gehlbach, S. H., de Gruy, F., Kaplan, B. H. The


Duke-UNC Functional Social Support Questionnaire: Measurement
of social support in family medicine patients. Medical Care. 1988;
26(7):709–723.

419
Chinn, P. L., Kramer, M. K. Integrated theory and knowledge
development in nursing, 9th ed. St. Louis, MO: Elsevier Mosby; 2015.

Coleman, C. Health-related quality of life and depressive symptoms


among seropositive African Americans. Applied Nursing Research.
2017; 33(1):138–141.

Covell, C. L. The middle-range theory of nursing intellectual


capital. Journal of Advanced Nursing. 2008; 63(1):94–103.

Duarte, J., Pinto-Gouveia, J. Empathy and feelings of guilt


experienced by nurses: A cross-sectional study of their role in
burnout and compassion fatigue symptoms. Applied Nursing
Research. 2017; 35(1):42–47.

Frank, C., Schroeter, K., Shaw, C. Addressing traumatic stress in the


acute traumatically injured patient. Journal of Trauma Nursing. 2017;
24(2):78–84.

Gomes, L., Coelho, A., dos Santos Gomides, D., Foss-Freitas, M.,
Foss, M., Pace, A. Contribution of family social support to the
metabolic control of people with diabetes mellitus: A randomized
controlled clinical trial. Applied Nursing Research. 2017; 36(1):68–76.

Gonzalez-Saenz de Tejada, M., Bilbao, A., Baré, M., Briones, E.,


Sarasqueta, C., Quintana, J., Escobar, A. Association of social
support, functional status, and psychological variables with
changes in health-related quality of life outcomes in patients with
colorectal cancer. Psycho-Oncology. 2016; 25(8):891–897.

Gray, J., Grove, S., Sutherland, S. The practice of nursing research:


Appraisal, synthesis, and generation of evidence, 8th ed. St. Louis, MO:
Elsevier Saunders; 2017.

420
Grove, S. K., Cipher, D. J. Statistics for nursing research: A workbook
for evidence-based practice, 2nd ed. St. Louis, MO: Elsevier; 2017.

Groves, P. The relationship between safety culture and patient


outcomes: Results from pilot meta-analysis. Western Journal of
Nursing Research. 2014; 36(1):66–83.

Groves, P., Meisenbach, R., Scott-Cawiezell, J. Keeping patients safe


in healthcare organizations: A structuration theory of safety culture.
Journal of Advanced Nursing. 2011; 67(8):1846–1855.

Humphreys, J., Janson, S., Donesky, D., Dracup, K., Lee, K. A.,
Puntillo, K., et al. Theory of symptom management. In: Smith M.J.,
Liehr P.R., eds. Middle range theory for nursing. 3rd ed. New York,
NY: Springer Publishing; 2014:141–164.

Kannan, S., Misra, D., Dvonch, J., Krishnakumar, A. Exposures to


airborne particulate matter and adverse perinatal outcomes: A
biologically plausible mechanistic framework for exploring
potential effect modification by nutrition. Environmental Health
Perspectives. 2006; 114(11):1636–1642.

King, I. Interpersonal relations: A theoretical framework for


application in nursing practice. Nursing Science Quarterly. 1992;
5(1):13–18.

Kolcaba, K. A theory of comfort for nursing. Journal of Advanced


Nursing. 1994; 19(6):1178–1184.

Krinsky, R., Murillo, I., Johnson, J. A practical application of


Katharine Kolcaba’s comfort theory to cardiac patients. Applied
Nursing Research. 2014; 27(1):147–150.

421
Lenz, E. R., Pugh, L. C., Milligan, R., Gift, A., Suppe, F., The middle
range theory of unpleasant symptoms: An update. Advances in
Nursing Science 19 3 1997:14–27

Liehr, P., Smith, M. Middle range theory: A perspective on


development and use. Advances in Nursing Science. 2017; 40(1):51–
63.

Lor, M., Backonja, U., Lauver, D. How could nurse researchers


apply theory to generate knowledge more efficiently? Journal of
Nursing Scholarship. 2017; 49(5):580–589.

Meleis, A. I. Transitions theory: Middle range and situation specific


theories in nursing research and practice. New York, NY: Springer
Publishing; 2010.

Meleis, A. I. Theoretical nursing: Development and progress, 5th ed.


Philadelphia, PA: Wolters Kluwer/Lippincott Williams & Wilkins;
2012.

Mishel, M. H. Uncertainty in illness. Journal of Nursing Scholarship.


1988; 20(4):225–232.

Mishel, M. H. Reconceptualization of the uncertainty in illness


theory. Journal of Nursing Scholarship. 1990; 22(3):256–262.

Olds, D., Dolansky, M. Quality and safety research:


Recommendations from the Quality and Safety Education for
Nurses (QSEN) Institute. Applied Nursing Research. 2017; 35:126–127.

Orem, D. E. Nursing: Concepts of practice, 6th ed. St. Louis, MO:


Mosby; 2001.

Orem, D. E., Taylor, S. G. Reflections on nursing practice science:

422
The nature, the structure, and the foundation of nursing science.
Nursing Science Quarterly. 2011; 24(1):35–41.

Park, M., Song, R., Jeong, J. O. Effect of goal attainment theory


based education program on cardiovascular risks, behavioral
modification, and quality of life among patients with first episode
of acute myocardial infarction: Randomized study. International
Journal of Nursing Studies. 2017; 71(1):8–16.

Pickett, S., Peters, R., Jarosz, P. Toward a middle-range theory of


weight management. Nursing Science Quarterly. 2014; 27(3):242–247.

Radloff, L. S. The CES-D Scale: A self-report depression scale for


research in the general population. Applied Psychological
Measurement. 1977; 1(3):385–401.

Reed, P. Toward a nursing theory of self-transcendence: Deductive


reformulation using developmental theories. Advances in Nursing
Science. 1991; 13(4):64–77.

Reinoso, H. Uncertainty and the treatment experience of


individuals with chronic hepatitis C. Journal of Nurse Practitioners.
2016; 12(7):445–451.

Riegel, B., Dickson, V., Faulkner, K. The situation-specific theory of


heart failure self-care: Revised and updated. Journal of
Cardiovascular Nursing. 2016; 31(3):226–235.

Rogers, M. E. An introduction to the theoretical basis of nursing.


Philadelphia, PA: F. A. Davis; 1970.

Roux, G., Dingley, C., Bush, H. Inner strength in women:


Metasynthesis of qualitative findings in theory development.

423
Journal of Theory Construction and Testing. 2002; 6(1):86–93.

Roy, C. Research based on the Roy Adaptation Model: Last 25


years. Nursing Science Quarterly. 2011; 24(4):312–320.

Roy, C., Andrews, H. A. Roy Adaptation Model, 3rd ed. Upper


Saddle River, NJ: Prentice Hall Health; 2008.

Schaffer, M., Sandau, K., Missal, B. Demystifying nursing theory: A


Christian nursing perspective. Journal of Christian Nursing. 2017;
34(2):102–107.

Sherwood, G., Barnsteiner, J. Quality and safety in nursing: A


competency approach to improving outcomes, 2nd ed. Ames, IA: Wiley-
Blackwell; 2017.

Swanson, K. M. Empirical development of a middle range theory of


caring. Nursing Research. 1991; 40(3):161–166.

Thomas, S. Toward a new conceptualization of women’s anger.


Issues in Mental Health Nursing. 1991; 12(1):31–49.

Toulouse, C., Kodadek, M. Continuous access to medications and


health outcomes in uninsured adults with type 2 diabetes. Journal of
the American Association of Nurse Practitioners. 2016; 28(6):327–334.

van Manen, M. Phenomenology in its original sense. Qualitative


Health Research. 2017; 27(6):810–825.

Ware, J. E., Sherbourne, C. D. The MOS 36-item Short-Form Health


Survey (SF-36): I. Conceptual framework and item selection. Medical
Care. 1992; 30(6):473–483.

Wilson, J., Cleary, P. Linking clinical variables with health-related

424
quality of life: A conceptual model of patient outcomes. The Journal
of the American Medical Association. 1995; 273(1):59–65.

425
CAPÍTULO 8

Introducción a los
diseños de
investigación
cuantitativa
Susan K. Grove

La página web de la National Guideline Clearinghouse de la Agency for


Healthcare Research and Quality (AHRQ) se cerró en 2018. Puede
consultarse más información en https://www.ahrq.gov/.

ÍNDICE DEL CAPÍTULO

Identificación de los diseños de investigación


cuantitativa en estudios de enfermería, 192
Comprensión de los conceptos relevantes para los
diseños de investigación cuantitativa, 194
Análisis de la validez del diseño de estudios
cuantitativos, 196
Diseños descriptivos, 202

426
Diseños de correlación, 206
Elementos de los diseños que analizan la causalidad,
211
Diseños cuasiexperimentales, 214
Diseños experimentales, 218
Puntos clave, 226
Bibliografía, 226

OBJETIVOS DE APRENDIZAJE
Tras concluir este capítulo, el lector debería ser capaz de:
1. Identificar los diseños no intervencionales o no experimentales
(descriptivo y de correlación) y los diseños de intervención o
experimentales (cuasiexperimental y experimental) que se
utilizan habitualmente en los estudios de enfermería
cuantitativos.
2. Describir los conceptos relevantes para los diseños de
investigación cuantitativa.
3. Analizar los diseños del estudio para evaluar los puntos
fuertes y las amenazas para su validez.
4. Valorar críticamente los diseños descriptivos y de correlación
de los estudios.
5. Describir los elementos de los diseños que analizan la
causalidad.
6. Valorar críticamente las intervenciones aplicadas en los
estudios.
7. Valorar críticamente los diseños cuasiexperimental y
experimental en los estudios.
8. Analizar la calidad de los estudios controlados aleatorizados
realizados en enfermería.

427
Un diseño de investigación es un modelo para hacer un estudio.
A lo largo de los años se han desarrollado varios diseños de
investigación cuantitativa para la realización de estudios
descriptivos, de correlación, cuasiexperimentales y experimentales.
Los diseños descriptivos y de correlación se centran en describir y
analizar las relaciones de las variables en entornos naturales. Los
diseños cuasiexperimentales y experimentales se han desarrollado
para analizar la causalidad o las relaciones de causa y efecto entre
las intervenciones y los resultados. Los diseños centrados en la
causalidad se crearon para maximizar el control sobre los factores
que podrían interferir en la validez del diseño del estudio o ponerla
en peligro. Los puntos fuertes de la validez del diseño aumentan la
probabilidad de que los resultados del estudio sean un fiel reflejo
de la realidad. Los estudios bien diseñados, especialmente los que
se centran en comprobar los efectos de las intervenciones de
enfermería, son esenciales con el fin de obtener evidencias de
investigación sólidas para la práctica (Melnyk, Gallagher-Ford y
Fineout-Overholt, 2017).
La capacidad para identificar un diseño de estudio y evaluar sus
puntos fuertes y débiles es una parte importante de la valoración
crítica de un estudio. Por tanto, este capítulo es una introducción a
los diferentes tipos de diseño de los estudios cuantitativos y
proporciona un algoritmo para determinar si el diseño de un
estudio es descriptivo, de correlación, cuasiexperimental o
experimental. También contiene algoritmos para que se puedan
identificar los tipos específicos de diseños en los estudios
publicados. Se definen los conceptos relevantes para la
comprensión de los diseños de investigación cuantitativa. Se
describen los diferentes tipos de validez (de constructo, interna,
externa y estadística). Se proporcionan guías para la valoración
crítica de los diseños de los estudios cuantitativos. El capítulo
concluye con una introducción a los ensayos controlados
aleatorizados (ECA), donde se proporciona un diagrama de flujo
para analizar la calidad de estos ensayos realizados en enfermería.

IDENTIFICACIÓN DE LOS DISEÑOS


DE INVESTIGACIÓN CUANTITATIVA
428
EN ESTUDIOS DE ENFERMERÍA
En los estudios de enfermería se utilizan varios diseños de
investigación; los cuatro tipos más frecuentes son descriptivo, de
correlación, cuasiexperimental y experimental. Se clasifican de
formas distintas en los libros de texto (Kerlinger y Lee, 2000;
Shadish, Cook y Campbell, 2002). A veces, los diseños descriptivo y
de correlación se denominan diseños no intervencionales o no
experimentales porque se centran en el análisis de las variables que
se producen de forma natural en los entornos y no en la aplicación
de una intervención por el investigador.
Algunos de los diseños no intervencionales incluyen un elemento
temporal, como el diseño transversal, que implica la recogida de
datos sobre las variables en un punto temporal. Por ejemplo, los
diseños transversales podrían implicar el análisis de un grupo de
participantes en el estudio de forma simultánea en diversas etapas
de desarrollo, niveles educativos, gravedad de la enfermedad o
etapas de recuperación para describir los cambios en un fenómeno
a través de las distintas etapas, que se supone que son parte de un
proceso que va a progresar a lo largo del tiempo. Seleccionar
participantes en varios momentos del proceso proporciona
información importante sobre su totalidad, aunque no se haga el
seguimiento de los mismos sujetos a lo largo de todo el proceso
(Gray, Grove y Sutherland, 2017). Por ejemplo, los investigadores
podrían describir los niveles de depresión de tres grupos diferentes
de mujeres con cáncer de mama antes, durante y después del
tratamiento con quimioterapia para comprender los niveles de
depresión basándose en la fase de tratamiento. El diseño
longitudinal supone obtener datos de los mismos participantes en
múltiples momentos a lo largo del tiempo y también podría
denominarse de repetición de medidas o de seguimiento. Esta
repetición de las medidas puede incluirse en los diseños de estudios
descriptivos, de correlación, cuasiexperimentales o experimentales.
En el diseño longitudinal, se podría monitorizar una muestra de
mujeres con cáncer de mama para evaluar la depresión antes,
durante y después de su tratamiento con quimioterapia.
Los estudios cuasiexperimentales y experimentales se han
diseñado para analizar la causalidad o la relación causa y efecto

429
entre una intervención aplicada por el investigador y los resultados
del estudio seleccionados. Estos diseños se llaman a veces
intervencionales o experimentales, porque se centran en analizar las
diferencias de las variables dependientes que se cree que están
causadas por las variables independientes o por las intervenciones.
Por ejemplo, la intervención aplicada por el investigador podría ser
un programa de seguimiento domiciliario para pacientes a los que
se había diagnosticado inicialmente hipertensión y la variable
dependiente o de resultado podría ser la cifra de presión arterial
sistólica y diastólica medida al cabo de 1 semana, 1 mes y 6 meses.
Este capítulo es una introducción a los diseños intervencionales
seleccionados y proporciona ejemplos de estos diseños en estudios
de enfermería publicados. Puede encontrarse más información
sobre otros diseños de estudio en varias fuentes de metodología
(Campbell y Stanley, 1963; Creswell, 2014; Gray y cols., 2017;
Kerlinger y Lee, 2000; Shadish y cols., 2002).
El algoritmo que se muestra en la figura 8.1 puede utilizarse para
determinar el tipo de diseño (descriptivo, de correlación,
cuasiexperimental y experimental) utilizado en un estudio. Incluye
una serie de respuestas de tipo sí o no para cuestiones específicas
sobre el diseño. El algoritmo comienza con la pregunta «¿Hay una
intervención?». La respuesta conduce a la siguiente pregunta y los
cuatro tipos de diseño se identifican en el algoritmo. Por ejemplo, si
los investigadores realizasen un estudio para identificar las
características de los profesionales de enfermería que aprobaron o
suspendieron su examen de acreditación al primer intento, la figura
8.1 indica que se utilizaría un diseño descriptivo. Si los
investigadores analizasen las relaciones entre las características de
los profesionales de enfermería y su puntuación en el examen de
acreditación de enfermería, se implementaría un diseño de
correlación. Si los investigadores evaluasen la eficacia de una
intervención de relajación sobre las puntuaciones de acreditación de
enfermería, se implementaría un diseño cuasiexperimental o
experimental. Los diseños experimentales tienen el máximo control
porque 1) se implementa una intervención muy controlada y 2) los
participantes en el estudio se asignan de forma aleatoria al grupo de
intervención o control (v. fig. 8.1).

430
431
FIG 8.1 Algoritmo para determinar el tipo de diseño de
un estudio cuantitativo.

COMPRENSIÓN DE LOS CONCEPTOS


RELEVANTES PARA LOS DISEÑOS
DE INVESTIGACIÓN CUANTITATIVA
Los conceptos relevantes para los diseños de investigación
cuantitativa incluyen causalidad, multicausalidad, probabilidad,
sesgo, prospectivo, retrospectivo, control y manipulación. Estos
conceptos se describen para proporcionar unos antecedentes que
permitan comprender los diseños de investigación no
intervencional e intervencional.

432
Causalidad
Causalidad significa básicamente que las cosas tienen causas y las
causas dan lugar a efectos. En una valoración crítica, es necesario
determinar si el propósito del estudio es analizar causalidad,
evaluar relaciones entre variables (diseños de correlación) o
describir variables (diseños descriptivos). Se puede determinar si el
propósito de un estudio es analizar causalidad leyendo la
declaración del propósito y las proposiciones del marco (v. cap. 7).
Por ejemplo, es posible que el propósito de un estudio causal sea
analizar el efecto de un programa de deambulación precoz después
de la cirugía sobre la duración de la estancia hospitalaria. La
proposición del marco puede afirmar que la actividad física precoz
después de la cirugía mejora el tiempo de recuperación. Sin
embargo, el programa de deambulación precoz no es el único factor
que afecta a la duración de la estancia hospitalaria. Otros factores o
variables externas importantes que afectan a la duración de la
estancia hospitalaria son el diagnóstico, el tipo de cirugía, la edad
del paciente, la condición física del paciente antes de la cirugía y las
complicaciones que se produjeron después de la cirugía. Los
investigadores suelen diseñar estudios cuasiexperimentales y
experimentales para evaluar la causalidad o el efecto de una
intervención (variable independiente) sobre un resultado
seleccionado (variable dependiente), utilizando un diseño que
controle las variables externas relevantes.

Multicausalidad
Muy pocos fenómenos en enfermería se pueden relacionar
claramente con una única causa y un único efecto. Diversas
variables interrelacionadas pueden intervenir para producir un
efecto particular. Por tanto, los estudios desarrollados a partir de
una perspectiva multicausal incluirán más variables que las que
utilizan una orientación estrictamente causal. La presencia de
causas múltiples para un efecto se denomina multicausalidad. Por
ejemplo, el diagnóstico, edad, estado prequirúrgico y
complicaciones tras la cirugía del paciente son causas
interrelacionadas de la duración de la estancia hospitalaria de un
paciente. Debido a la complejidad de las relaciones causales, es

433
improbable que una teoría identifique todos los elementos que
intervienen a la hora de causar un resultado particular. Sin
embargo, cuanto mayor es la proporción de factores causales que
pueden identificarse y analizarse, o controlarse en un único estudio,
más clara será la comprensión del fenómeno global. Es previsible
que esta mayor comprensión aumente la capacidad de predecir y
controlar los efectos de las intervenciones del estudio.

Probabilidad
La probabilidad aborda la causalidad relativa en lugar de la
absoluta. Es posible que una causa no produzca un efecto específico
cada vez que se produzca una causa particular y los investigadores
reconocen que una causa particular probablemente producirá un
efecto específico. Los investigadores utilizan una orientación
probabilística cuando diseñan estudios para analizar la
probabilidad de que se produzca un efecto dado bajo una serie
definida de circunstancias. Las circunstancias pueden ser
variaciones de múltiples variables. Por ejemplo, mientras se evalúa
el efecto de múltiples variables sobre la duración de la estancia
hospitalaria, los investigadores pueden escoger analizar la
probabilidad de una duración dada de la estancia hospitalaria bajo
diversas series específicas de circunstancias. Una serie específica de
circunstancias puede consistir en que el paciente se haya sometido a
una artroplastia de rodilla, que no tenga enfermedades crónicas y
que no haya tenido complicaciones después de la cirugía. Se
podrían desarrollar criterios de muestreo para controlar la mayoría
de estas variables externas. Sería previsible que la probabilidad de
una duración dada de la estancia hospitalaria variase a medida que
la serie de circunstancias se modificase o se controlase en el diseño
del estudio.

Sesgo
El término sesgo significa una inclinación o desviación respecto a la
verdad o lo previsible. El sesgo en un estudio distorsiona los
hallazgos respecto a lo que habrían sido los resultados sin dicho
sesgo. Puesto que los estudios se realizan para determinar lo real y
la verdad, los investigadores cuantitativos valoran mucho la

434
identificación y eliminación de las fuentes de sesgo en su estudio y
el control de sus efectos sobre los hallazgos del estudio. Cualquier
componente de un estudio que desvíe o provoque una desviación
respecto a una medición real de las variables del estudio contribuye
a una distorsión de los hallazgos. Muchos factores relacionados con
la investigación pueden estar sesgados, como las actitudes o
motivaciones del investigador (conscientes o inconscientes), los
componentes del entorno en el que se realiza el estudio, la selección
de los participantes en el estudio, la composición de la muestra, los
grupos formados, los métodos de medición, el proceso de recogida
de datos y los análisis estadísticos (Gray y cols., 2017; Grove y
Cipher, 2017). Por ejemplo, algunos de los participantes en el
estudio podrían tomarse de una unidad del hospital en la que los
pacientes participen en otro estudio sobre la calidad de los cuidados
de enfermería; al seleccionar a los pacientes para un estudio
podrían incluirse solo los que mostrasen interés en el estudio (Gray
y cols., 2017). Los investigadores podrían utilizar una escala con
una fiabilidad y validez limitadas para medir una variable del
estudio (Waltz, Strickland y Lenz, 2017). Todas estas situaciones
introducen sesgo en los estudios no intervencionales e
intervencionales.
Un foco importante en la valoración crítica de un estudio es
identificar posibles fuentes de sesgo. Esto requiere un análisis
cuidadoso del apartado de métodos en el informe de investigación,
incluidas las estrategias para obtener participantes del estudio,
métodos de medición, implementación de una intervención de
estudio y proceso de recogida de datos. Sin embargo, no todos los
sesgos pueden identificarse en el informe del estudio publicado. Es
posible que el artículo no proporcione detalles suficientes sobre los
métodos del estudio para detectar los posibles sesgos.

Prospectivo frente a retrospectivo


El término prospectivo significa que se refiere al futuro, mientras
que retrospectivo significa que se refiere al pasado, habitualmente
en relación con el tiempo. En investigación, estos términos suelen
utilizarse con más frecuencia para referirse a la secuencia temporal
de la recogida de datos. ¿Los datos se obtienen en tiempo real y las

435
mediciones las realiza el equipo de investigación, o los datos del
estudio se obtienen a partir de información recogida con
anterioridad? La recogida de datos en la investigación no
intervencional puede ser prospectiva o retrospectiva porque, por
definición, en ella no existe intervención del investigador. Muchos
estudios no intervencionales en asistencia sanitaria utilizan datos
retrospectivos obtenidos de bases de datos electrónicas nacionales,
así como bases de datos clínicas y administrativas de organismos
sanitarios. El análisis secundario de los datos de un estudio previo
para abordar un propósito de estudio recién desarrollado también
se considera retrospectivo. Sin embargo, la recogida prospectiva de
datos suele ser más precisa que su recogida retrospectiva, sobre
todo cuando los investigadores están muy interesados en su
fenómeno de estudio y son rigurosos en la medición de variables de
estudio y la implementación del proceso de recogida de datos.
Sin embargo, la recogida de datos en la investigación
intervencional debe ser prospectiva porque el investigador
implementa una intervención en tiempo real. Esto no quiere decir
que el equipo de investigación no acceda a los datos actuales a
partir de la historia clínica para los estudios en tiempo real. Un
investigador que recoja datos de presión arterial en lactantes en
estado crítico podría recoger datos a lo largo de un periodo de 24
horas durante varios días. Los profesionales de enfermería en los
diversos turnos medirían la presión arterial al menos cada hora,
como es habitual, y el equipo de investigación recuperaría esa
información durante la recogida diaria de los datos. Aunque la
recuperación de los datos de la historia electrónica de los lactantes
mira hacia atrás en el tiempo en el periodo de 24 horas previas, este
estudio se consideraría prospectivo porque los datos se generan y
se registran en el mismo momento en el que los lactantes son
hospitalizados.

Control
Un método para reducir el sesgo es aumentar la cantidad de control
del diseño de un estudio. El control significa tener el poder para
dirigir o manipular factores con el fin de conseguir un resultado
deseado. Por ejemplo, en un estudio de un programa de

436
deambulación precoz, los participantes en el estudio pueden
seleccionarse de forma aleatoria y después asignarse al azar al
grupo de intervención o al grupo control. El investigador
controlaría la duración del programa de deambulación y la ayuda
durante este programa o durante la intervención. El momento en el
que se realiza la deambulación en relación con la cirugía también se
controlaría, así como el entorno en el que el paciente deambulaba.
La medición de la duración de la estancia hospitalaria podría
controlarse asegurando que se calcula el número de días, horas y
minutos de dicha estancia exactamente de la misma manera para
todos los participantes. Limitar las características de los
participantes en el estudio, como el diagnóstico, la edad, el tipo de
cirugía y la incidencia de complicaciones, también sería una forma
de control. Cuanto mayor es el control del investigador sobre la
situación de estudio, más creíbles (o válidos) son los hallazgos del
estudio.

Manipulación
La manipulación es una forma de control que suele utilizarse en
estudios cuasiexperimentales y experimentales. El control de una
intervención es la manipulación más frecuente en estos estudios. En
los estudios descriptivos y de correlación, se hacen pocos intentos o
ninguno para manipular los factores referentes a las circunstancias
del estudio, ya que el propósito es analizar el fenómeno y sus
características tal y como se producen en un entorno o contexto
natural. Sin embargo, cuando se utilizan diseños
cuasiexperimentales y experimentales, los investigadores deben
manipular la intervención que se va a estudiar. Estos deben
desarrollar intervenciones de calidad que se apliquen de forma
coherente por personas capacitadas (Eymard y Altmiller, 2016). Esta
manipulación controlada de la intervención de un estudio
disminuye el potencial de sesgo y aumenta la validez de los
hallazgos del estudio.

ANÁLISIS DE LA VALIDEZ DEL


DISEÑO DE ESTUDIOS
437
CUANTITATIVOS
La validez del estudio es una medida de la veracidad o exactitud
de los hallazgos obtenidos en un estudio. La validez del diseño de
un estudio es clave para obtener resultados y hallazgos fiables y
precisos de ese estudio. La validez del diseño engloba los puntos
fuertes y amenazas para la calidad del diseño de un estudio. La
valoración crítica de los estudios requiere que se identifiquen los
puntos fuertes del diseño y que se tengan en cuenta las amenazas a
la validez o los posibles puntos débiles del diseño de un estudio.
Cuatro tipos de validez del diseño relevantes para la investigación
de enfermería son la validez de constructo, validez interna, validez
externa y validez de la conclusión estadística (Gray y cols., 2017;
Kerlinger y Lee, 2000; Shadish y cols., 2002). En la tabla 8.1, se
describen estos cuatro tipos de validez del diseño y se resumen las
amenazas comunes a cada uno. La comprensión de estos tipos de
validez y de sus posibles amenazas es importante para valorar
críticamente los diseños de estudios cuantitativos.

TABLA 8.1
TIPOS DE VALIDEZ DE DISEÑO SOMETIDA A VALORACIÓN
CRÍTICA EN LOS ESTUDIOS

438
Validez de constructo
La validez de constructo analiza cómo se corresponden las
definiciones conceptuales y operacionales de las variables. Los
constructos o los conceptos teóricos se definen en el marco de
estudio cuando se identifica un marco. Cuando los investigadores
no identifican un marco específico, las variables pueden definirse
en función del modo en el que se han definido en otros estudios.
Estas declaraciones abstractas sobre las variables son las
definiciones conceptuales, que constituyen la base de las

439
definiciones operacionales de las variables. Las definiciones
operacionales (métodos de medición) deben reflejar con precisión
los constructos o conceptos teóricos. La validez de constructo es el
grado de congruencia o consistencia entre las definiciones
conceptual y operacional (v. cap. 5). El proceso de desarrollo de la
validez de constructo de un instrumento suele requerir años de
trabajo científico y los investigadores deben discutir dicha validez
de los instrumentos que utilizan en su estudio (v. cap. 10; Shadish y
cols., 2002; Waltz y cols., 2017). Las amenazas para la validez de
constructo se relacionan con el desarrollo previo del instrumento y
con el desarrollo de las técnicas de medición, como parte de la
metodología de un estudio en particular. Estas amenazas se
describen aquí y se resumen en la tabla 8.1.

Definiciones inadecuadas de los constructos


La medición de un constructo deriva lógicamente de un análisis del
concepto del constructo por el teórico que lo desarrolló o por el
investigador. Lo ideal es que la definición conceptual surja del
análisis del concepto, que es un estudio en profundidad de los
significados del constructo o del concepto proporcionados por los
teóricos e investigadores. El método de medición (definición
operacional) debe reflejar claramente tanto el concepto del marco
como la variable del estudio. Una deficiencia de la definición
conceptual u operacional da lugar a una validez baja del constructo.

Sesgo monooperación
El sesgo monooperación se produce cuando solo se utiliza un
método de medición para evaluar un constructo. En tal caso, se
miden menos dimensiones del constructo. La validez de este mejora
mucho si el investigador utiliza más de un instrumento (Waltz y
cols., 2017). Por ejemplo, si el dolor fuera una variable dependiente,
podría utilizarse más de una medida de este, como una escala de
valoración del dolor, informes verbales, respuestas físicas (p. ej.,
aumento del pulso, de la presión arterial y de las respiraciones) y
observaciones de las conductas que reflejan dolor (llorar, gestos de
dolor, defensa del área dolorosa, retirada). A veces es posible
realizar más de una medición de la variable dependiente sin
aumentar mucho el tiempo, los esfuerzos o el coste. El uso de

440
múltiples métodos de medición de un constructo aumenta su
validez (v. cap. 10).

Expectativas del experimentador (efecto Rosenthal)


Las expectativas del investigador pueden sesgar los datos. Por
ejemplo, existe expectativa del experimentador si un investigador
espera que una intervención determinada alivie el dolor. Los datos
que recoge pueden estar sesgados para reflejar esta expectativa. Si
otro investigador que no cree que la intervención vaya a ser eficaz
recoge los datos, los resultados podrían ser diferentes. No se conoce
en qué medida influye realmente este efecto en los estudios. La
preocupación por la expectativa del experimentador hace que
algunos investigadores no participen en el proceso de recogida de
datos. En otros estudios, quienes recogen los datos no saben qué
participantes en el estudio se asignaron a los grupos de
intervención y control, lo que significa que para ellos la asignación
es ciega. El uso de responsables de recogida de datos no sesgados o
de una asignación ciega a los grupos aumenta la validez de
constructo del diseño de un estudio.

Validez interna
La validez interna es el grado en que los efectos detectados en el
estudio son un verdadero reflejo de la realidad y no el resultado de
las variables externas. Aunque hay que tenerla en cuenta en todos
los estudios, suele ser un aspecto fundamental en los que analizan
causalidad. Cuando se analiza causalidad, el investigador debe
determinar si las variables dependientes pueden haber estado
influenciadas por una tercera variable (externa), con frecuencia no
medida. La posibilidad de una explicación alternativa de la causa se
denomina a veces hipótesis rival (Shadish y cols., 2002). Cualquier
estudio puede contener amenazas para la validez interna del
diseño, que pueden dar lugar a conclusiones falsas positivas o
falsas negativas (v. tabla 8.1). El investigador debe preguntarse
«¿Existe otra explicación razonable (válida) (hipótesis rival) para el
resultado, además de la que he propuesto?» En esta sección, se
analizan algunas de las amenazas para la validez interna, como la
selección de los participantes y la asignación a los grupos, el

441
abandono de los participantes, la historia y la maduración.

Selección de los participantes y asignación a los


grupos
La selección se refiere al proceso por el que se eligen los
participantes de un estudio y el modo en el que se agrupan dentro
de él. Es más probable que se produzca una amenaza para la
selección cuando no es posible hacerla de forma aleatoria (Gray y
cols., 2017; Shadish y cols., 2002). En algunos estudios, las personas
seleccionadas pueden ser muy diferentes de las no seleccionadas.
En otros, la amenaza se debe a las diferencias de los participantes
asignados a los grupos de estudio. Por ejemplo, las personas del
grupo control podrían tener algún rasgo importante diferente de las
del grupo intervención. Esta diferencia en la selección podría hacer
que los dos grupos reaccionaran de forma distinta a la intervención;
en este caso, la intervención no habría causado las diferencias de los
resultados, sino que estas se deberían a disparidades en los
individuos seleccionados para ambos grupos. Con frecuencia, no es
posible la selección aleatoria de participantes en los estudios de
enfermería y el número de participantes disponibles es limitado. La
asignación aleatoria de participantes a los grupos disminuye la
posibilidad de que su selección sea una amenaza para la validez
interna.

Abandono de los participantes


El abandono significa que los participantes dejan el estudio antes de
que se haya terminado. Se convierte en una amenaza cuando 1) los
que abandonan el estudio son un tipo diferente de personas de las
que permanecen en él o 2) existen diferencias entre el número y
tipos de personas que abandonan el grupo intervención y los que
abandonan el grupo control o de comparación (v. cap. 9). Si el
abandono en un estudio es elevado (>25%), podría afectar a la
precisión de los resultados del estudio (Cohen, 1988; Gray y cols.,
2017).

Historia
La historia es un suceso que no está relacionado con el estudio

442
planificado, pero que se produce durante el momento del estudio.
Puede influir en la respuesta de un participante a la intervención o
en las variables que se están midiendo y alterar el resultado del
estudio. Por ejemplo, si está estudiando el efecto de una
intervención de apoyo emocional sobre el hecho de que los
participantes terminen un programa de rehabilitación cardiaca y
varios profesionales de enfermería dejan de trabajar en el centro
durante el estudio, este evento histórico podría crear una amenaza
para la validez interna del diseño. Los participantes en el estudio
que habían trabajado estrechamente con profesionales de
enfermería que se marchan pueden decidir abandonar el estudio o
el hecho de trabajar con distintos profesionales podría cambiar los
resultados del estudio.

Maduración
En investigación, la maduración se define como el aumento de
edad, de sabiduría o de fortaleza y con tener más hambre, cansarse
o adquirir experiencia durante el estudio. Estos cambios no
planificados y no reconocidos son una amenaza para la validez
interna del estudio y pueden influir en sus hallazgos. La
maduración es más probable que se produzca en estudios
longitudinales con mediciones repetidas de las variables de estudio.

Validez externa
La validez externa hace referencia al grado en que los hallazgos del
estudio pueden generalizarse más allá de la muestra usada en el
estudio (Gray y cols., 2017). La amenaza más grave es que los
hallazgos solo sean válidos para el grupo estudiado. Hasta cierto
punto, la relevancia del estudio depende del número de tipos de
personas y situaciones a las que puedan aplicarse los resultados. A
veces, los factores que influyen en la validez externa son sutiles y es
posible que no se reflejen en los informes de investigación, pero el
investigador debe responsabilizarse de ellos. La generalización
suele ser más restringida para un estudio único que para los
estudios que se repiten varias veces utilizando muestras diferentes,
tal vez de distintas poblaciones en diversos entornos. Aquí se
describen algunas de las amenazas para la capacidad de generalizar

443
los resultados (validez externa) en términos de diseño de estudio y
se resumen en la tabla 8.1.

Interacción entre la selección y la intervención


Buscar sujetos que estén dispuestos a participar en un estudio
puede ser difícil, sobre todo si requiere dedicar mucho tiempo y
energía. Los investigadores deben informar del número de
personas a las que propusieron participar en el estudio y lo
rechazaron (tasa de rechazo), de modo que quien analice el estudio
pueda identificar cualquier amenaza para la validez externa. Si la
tasa de rechazo de un estudio es alta, existe una posibilidad elevada
de que haya amenazas a la validez externa del diseño. Por ejemplo,
si el 39% de las personas a las que se les pidió que participaran en
un estudio rechazan hacerlo, la muestra seleccionada en realidad
estará limitada de formas que podrían no ser evidentes a primera
vista a los investigadores. Solo el investigador conoce bien a los
participantes, que pueden ser voluntarios, «bienhechores» o
personas que no tienen nada mejor que hacer. En este caso, no es
fácil justificar la generalización de los resultados a todos los
miembros de una población, como a todos los profesionales de
enfermería, a todos los pacientes hospitalizados o a todos los
diabéticos.
Los estudios deben planificarse para limitar las demandas de
contribución de los sujetos y mejorar así su interés en la
participación. Por ejemplo, los investigadores podrían seleccionar
instrumentos válidos y fiables, pero con menos ítems, para
disminuir la carga para los participantes. La intervención del
estudio debe desarrollarse hábilmente y comunicarse con claridad a
los individuos para aumentar su participación en el estudio. Es
necesario recoger suficientes datos sobre los participantes para que
el investigador pueda familiarizarse con sus características y, en la
mayor medida posible, con las de los que han rechazado participar
(v. cap. 9).

Interacción entre el entorno y la intervención


Existe sesgo respecto a los tipos de entornos y organizaciones que
aceptan participar en los estudios. Este sesgo ha sido especialmente
evidente en los estudios de enfermería. Por ejemplo, algunos

444
hospitales, como los que solicitan una designación Magnet, dan la
bienvenida a los estudios de enfermería y animan a los
profesionales de enfermería a realizar estudios. Otros se resisten a
ello. Estos dos tipos de hospitales pueden tener diferencias
importantes; por tanto, puede haber una interacción entre el
entorno y la intervención que limita la generalización de los
hallazgos.
Los distintos entornos también pueden servir a distintos tipos de
pacientes o de posibles participantes en el estudio. Por ejemplo, una
clínica de pacientes con bajos ingresos económicos puede tener
pacientes con menor nivel educativo, mientras que una que solo
acepte a pacientes con seguro médico podría tener mayor
proporción de pacientes universitarios. La intervención y los
métodos de medición que se van a implementar pueden interactuar
con la capacidad de leer y comprender los materiales escritos por
los pacientes en distintos entornos y causar variaciones en los
resultados del estudio. Los investigadores deben considerar las
características de los entornos y de los pacientes a quienes atienden
al hacer declaraciones sobre la población en la que pueden
generalizarse sus hallazgos.

Interacción entre la historia y la intervención


Las circunstancias que se producen cuando se lleva a cabo un
estudio pueden influir en la intervención implementada o en los
resultados medidos, lo que podría afectar a la generalización de los
hallazgos. Por ejemplo, los participantes del estudio que reciben
una intervención de apoyo para facilitar su proceso de diálisis
probablemente tendrán una alteración de los resultados si tres
pacientes fallecen de repente debido a un fallo del equipo de diálisis
(evento histórico) durante el estudio. Lógicamente, nunca se puede
generalizar para el futuro; sin embargo, repetir el estudio durante
diversos periodos de tiempo refuerza la utilidad de los hallazgos en
el tiempo. Para valorar críticamente un estudio hay que considerar
los efectos de la práctica enfermera y los eventos sociales que se
producen durante el periodo en que se recogieron los hallazgos
notificados.

445
Validez de conclusión estadística
El primer paso para deducir la causa es determinar si las variables
independientes y dependientes están relacionadas. Esta relación
puede determinarse mediante el análisis estadístico. La validez de
la conclusión estadística se refiere a si las conclusiones sobre las
relaciones o las diferencias extraídas del análisis estadístico reflejan
con precisión el mundo real (Grove y Cipher, 2017). El segundo
paso es identificar las diferencias entre los grupos. Existen razones
por las que pueden extraerse conclusiones falsas sobre la presencia
o ausencia de una relación o una diferencia, que se denominan
amenazas a la validez de conclusión estadística (v. tabla 8.1). En
este texto se analizan algunas de las más frecuentes que pueden
identificarse en los estudios, como potencia estadística baja,
métodos de medición no fiables, fidelidad limitada de la
intervención y variaciones externas del entorno del estudio. Shadish
y cols. (2002) han proporcionado un análisis más detallado de la
validez de conclusión estadística.

Potencia estadística baja


La potencia estadística baja aumenta la probabilidad de llegar a la
conclusión de que no existe una relación significativa entre las
variables ni diferencias significativas entre los grupos cuando
realmente sí existen (error de tipo II). Es más probable que se
produzca un error de tipo II cuando el tamaño de la muestra es
pequeño o cuando la potencia de la prueba estadística para
determinar las diferencias es baja (Cohen, 1988; Grove y Cipher,
2017). Es necesario asegurarse de que el tamaño de la muestra es
adecuado y el estudio tiene potencia para detectar las relaciones y
las diferencias. Los conceptos de tamaño de la muestra, potencia
estadística y error de tipo II se describen con detalle en los capítulos
9 y 11.

Fiabilidad o precisión de los métodos de medición


La técnica para medir las variables debe ser fiable para mostrar las
diferencias reales. Una medida es fiable si se obtiene el mismo
resultado siempre que se mide la misma situación o variable. Si una
escala utilizada para medir la depresión es fiable, deben obtenerse

446
puntuaciones similares cuando se mide repetidamente la depresión
a lo largo de un periodo de tiempo corto (Waltz y cols., 2017). Las
mediciones fisiológicas que miden consistentemente las variables
fisiológicas se consideran precisas. Por ejemplo, un termómetro será
preciso si muestra la misma lectura cuando se comprueba
repetidamente en el mismo paciente dentro de un periodo limitado
(v. cap. 10). Es necesario analizar los métodos de medición en un
estudio y determinar si son fiables.

Fidelidad de la aplicación de la intervención


La fidelidad de la intervención asegura que la intervención de la
investigación está estandarizada y se aplica coherentemente
siempre que se implementa en un estudio (Bova y cols., 2017;
Eymard y Altmiller, 2016). Si el método de administrar una
intervención de investigación varía de una persona a otra, la
probabilidad de detectar diferencias reales disminuye. Por ejemplo,
un encargado de recoger datos podría implementar la intervención
del estudio a los primeros 20 participantes y dedicar más tiempo
con ellos de lo que estaba designado por el protocolo de la
intervención; otro encargado de recoger datos podría implementar
a continuación el protocolo de la intervención exactamente como
estaba planeado a los siguientes 20 participantes. Los responsables
de la recogida de datos deben recibir formación para garantizar una
implementación congruente o fiable de una intervención de estudio
para evitar amenazas a la validez de conclusión estadística.

Variaciones externas del entorno del estudio


Las variables externas en entornos complejos (p. ej., unidades
clínicas) pueden influir en las puntuaciones de la variable
dependiente. Estas variables aumentan la dificultad para detectar
diferencias entre los grupos experimental y control. Se puede poner
como ejemplo las actividades que tienen lugar en una unidad de
enfermería. El número y la diversidad del personal, los pacientes,
las crisis sanitarias y los patrones de trabajo se funden en un
sistema complejo para realizar un estudio. Cualquiera de las
dinámicas de la unidad puede influir en la manipulación de la
variable independiente o la medición de la variable dependiente.
Puede revisarse la sección de metodología del estudio y determinar

447
cómo se controlaron las variables externas en el entorno del estudio.
La validez del diseño se ha presentado aquí para ayudar en la
valoración crítica de los diseños en los estudios cuantitativos que se
ponen como ejemplos en las siguientes secciones.

DISEÑOS DESCRIPTIVOS
Los estudios descriptivos se han diseñado para obtener más
información sobre los conceptos, variables o elementos en un
campo de estudio en particular. El propósito de estos estudios es
proporcionar una imagen de una situación que se produce de forma
natural. Un diseño descriptivo puede utilizarse para desarrollar
teorías, identificar problemas de la práctica actual, hacer juicios
sobre la práctica o identificar las tendencias de las enfermedades,
prevenir enfermedades y fomentar la salud en grupos
seleccionados. No se manipulan las variables. La protección contra
el sesgo en un diseño descriptivo se consigue a través de: 1) las
definiciones conceptuales y operacionales de las variables; 2) la
selección y el tamaño de la muestra; 3) unos métodos de medición
válidos y fiables, y 4) unos procedimientos para recoger datos que
podrían controlar parcialmente el entorno o contexto. Estos
estudios difieren en cuanto a su nivel de complejidad. Algunos
contienen solo dos variables; otros pueden incluir múltiples
variables, que se estudian a lo largo del tiempo. Se puede utilizar el
algoritmo que se muestra en la figura 8.2 para determinar el tipo de
diseño descriptivo utilizado en un estudio publicado. En este
capítulo se analizan los diseños descriptivos simples y descriptivos
comparativos. Gray y cols. (2017) han proporcionado información
detallada sobre otros diseños descriptivos.

448
FIG 8.2 Algoritmo para determinar el tipo de diseño de
un estudio descriptivo.

449
GUÍAS DE VALORACIÓN CRÍTICA
Diseños descriptivo y de correlación
Las guías de valoración crítica que se presentan en esta sección
se aplicarán a ejemplos de diseños de estudios descriptivo y de
correlación. Cuando se realiza la valoración crítica de diseños de
estudios descriptivo y de correlación, es necesario responder las
siguientes preguntas:

1. ¿El diseño del estudio es descriptivo o de correlación? Se debe


revisar el algoritmo de la figura 8.1 para determinar el tipo
de diseño del estudio.
2. Si el diseño del estudio es descriptivo, se debe utilizar el
algoritmo de la figura 8.2 para identificar el tipo específico
de diseño descriptivo aplicado en el estudio.
3. Si el diseño del estudio es de correlación, hay que utilizar el
algoritmo de la figura 8.5 para identificar el tipo específico
de diseño de correlación aplicado en el estudio.

FIG 8.5 Algoritmo para determinar el tipo de diseño de


correlación.

4. ¿El diseño del estudio aborda el propósito y/o los objetivos o


preguntas del estudio?
5. ¿La muestra era adecuada para el estudio?
6. ¿Las variables del estudio se midieron con métodos de
medición de calidad (fiables y válidos) (v. cap. 10)?

450
7. ¿El proceso de recogida de datos se implementó de forma
homogénea y sin sesgos?

Diseño descriptivo simple


Un diseño descriptivo simple se utiliza para analizar variables en
una muestra única (fig. 8.3). Este diseño descriptivo comprende
identificar las variables de un fenómeno de interés, medirlas y
describirlas. La descripción de las variables da lugar a una
interpretación del significado teórico de los resultados y al
desarrollo de las relaciones posibles o las hipótesis que podrían
guiar estudios de correlación o cuasiexperimentales en el futuro.

FIG 8.3 Diseño descriptivo simple.

Spratling (2017, pág. 62) realizó un estudio descriptivo para


aumentar la comprensión de la utilización de la asistencia sanitaria
por los niños con traqueostomías que requerían tecnología médica.
Este estudio incluyó un diseño descriptivo simple; los aspectos
clave de este diseño de estudio se presentan en el Ejemplo de
investigación 8.1.

EJEMPLO DE INVESTIGACIÓN 8.1

451
Diseño descriptivo simple
Extracto del estudio de investigación
Métodos
En este estudio, se realizó una revisión retrospectiva de historias
clínicas electrónicas (HCE) para identificar los problemas de salud
frecuentes que motivaban la consulta en el SU (servicio de urgencias)
y la hospitalización, así como para crear un formulario de obtención
de datos… Las historias fueron revisadas por el investigador y por
ayudantes de investigación graduados (AIG)…; todos tenían
experiencias con HCE y con la terminología médica. El formulario de
obtención de datos estructurado se creó para la revisión de HCE y fue
revisado antes de su uso por un experto en niños dependientes de
tecnología y por un experto en medición (Spratling y Powers, 2017)

La muestra del estudio incluyó las HCE de 171 niños que requieren
tecnología médica en un centro neumológico ambulatorio dependiente
de tecnología que se revisaron a lo largo de un periodo de tres años (de
enero de 2010 a diciembre de 2012). Los criterios de inclusión fueron
ser pacientes activos del centro (de recién nacidos a 21 años) que
habían consultado al menos una vez en el centro desde el alta
hospitalaria con una traqueostomía…

El estudio identificó problemas de salud frecuentes que motivaron


consultas en el SU y hospitalizaciones, utilizó una revisión experta
para clasificar estas consultas en el SU y hospitalizaciones como
evitables o inevitables mediante la revisión de los expertos, y analizó
las características sociodemográficas y clínicas que influían en las
consultas en el SU y hospitalizaciones de los niños. La revisión por
expertos incluyó… un profesional de enfermería clínica con 15 años
de experiencia y el investigador, que tiene experiencia tanto clínica
como de investigación con niños que requieren tecnología médica
(Spratling, 2017, pág. 63).

452
Valoración crítica
Spratling (2017) identificó con precisión su estudio como de tipo
descriptivo, con un diseño retrospectivo que implicó una revisión
de HCE. Este diseño descriptivo simple fue apropiado para
abordar el propósito y las preguntas de investigación de este
estudio. Los criterios de la muestra eran relevantes para reducir la
influencia de las variables externas. El tamaño de la muestra
obtenida a lo largo de 3 años fue amplio (n = 171 niños) y sin
abandono, lo que aumenta la representatividad de la muestra y la
validez interna del diseño. Sin embargo, el entorno se limitó a un
único centro neumológico en el sur de Estados Unidos, lo que
disminuye la capacidad de generalizar los hallazgos. La
homogeneidad de la recogida de datos se vio facilitada por la
formación de los AIG que usaron un formulario de obtención de
datos de calidad desarrollado y revisado por expertos. La recogida
de datos no sesgada y estructurada aumentó la solidez de
constructo y la validez de conclusión estadística del diseño de este
estudio. Los expertos operacionalizaron la determinación de si las
consultas al SU y las hospitalizaciones eran evitables o inevitables
en la investigación y en la asistencia de los niños que requerían
tecnología médica, lo que reforzó la validez de constructo (Shadish
y cols., 2002).
«Los hallazgos de este estudio indicaron una mayor utilización
de la asistencia sanitaria por estos niños e identificaron los
síntomas comunes y las tecnologías médicas para los que los
cuidadores pueden necesitar intervenciones, centrándose en la
educación del control de los síntomas y la tecnología médica antes
de acudir al SU o al hospital» (Spratling, 2017, pág. 62).

Diseño descriptivo comparativo


El diseño descriptivo comparativo se utiliza para describir las
variables y analizar sus diferencias en dos o más grupos que se
producen de forma natural en un entorno. Los grupos podrían
haberse formado utilizando el sexo, la edad, la etnicidad y la raza,
el nivel educativo, los diagnósticos médicos y/o la gravedad de la
enfermedad (Gray y cols., 2017). En la figura 8.4 se muestra un
diagrama de esta estructura del diseño.

453
FIG 8.4 Diseño descriptivo comparativo.

Mosleh, Eshah y Almalik (2017, pág. 418) realizaron un estudio


descriptivo «para identificar las diferencias de necesidades de
aprendizaje percibidas entre pacientes cardiológicos que habían
sido sometidos a intervenciones coronarias mayores y sus
profesionales de enfermería». Los participantes en el estudio se
obtuvieron mediante un muestreo por conveniencia e incluyeron
365 pacientes cardiológicos a quienes se había realizado una
angioplastia coronaria percutánea (ACP) o una cirugía de
derivación de arterias coronarias (CDAC) y 166 profesionales de
enfermería cardiológica. En el Ejemplo de investigación 8.2 se
muestran los elementos clave de este diseño descriptivo
comparativo.

EJEMPLO DE INVESTIGACIÓN 8.2


Diseño descriptivo comparativo
Extracto del estudio de investigación
Métodos
Se utilizó un diseño descriptivo comparativo para analizar la
diferencia de las necesidades de aprendizaje percibidas entre pacientes
cardiológicos sometidos a procedimientos intervencionistas coronarios
mayores y los profesionales de enfermería que cuidaban de ellos. Los
datos de la encuesta se recogieron de tres hospitales principales…

Los ayudantes de investigación proporcionaron el cuestionario


autonotificado junto con la información verbal sobre el propósito del

454
estudio… Para garantizar la precisión y la homogeneidad entre los
seis ayudantes de investigación, los investigadores principales
organizaron una reunión, donde se ofreció una explicación completa
del estudio. Los pasos de la recogida de datos se comentaron con los
ayudantes y se les formó sobre las preguntas de los pacientes durante
el proceso de recogida de datos…

Se utilizó la Patient Learning Needs Scale (PLNS) para identificar las


necesidades de aprendizaje de los pacientes que habían sido sometidos
a ACP o CDAC… La PLNS consta de 40 ítems puntuados en una
escala de Likert de cinco puntos que oscila entre 1 (no importante) y 5
(extremadamente importante). Esta escala consta de varias subescalas
correspondientes a distintos tipos de necesidades de aprendizaje, como
cuidados de la herida, fármacos, actividades físicas diarias, dieta,
complicaciones postintervención, cuidados postintervención y control
de los factores de riesgo… El alfa de Cronbach para la PLNS en este
estudio fue de 0,85 y el alfa de Cronbach para las subescalas osciló de
0,72 a 0,94… Se realizó un estudio piloto que incluyó diez pacientes y
cinco profesionales de enfermería cardiológica para confirmar la
estabilidad y claridad de los ítems de la escala (Mosleh y cols., 2017,
págs. 420-421).

Valoración crítica
Mosleh y cols. (2017) identificaron con claridad el diseño de su
estudio, que abordó su propósito y preguntas de investigación. Los
tamaños de las muestras tenían una solidez adecuada tanto para
los pacientes como para los profesionales de enfermería, e
incluyeron unos criterios relevantes de la muestra para estas
poblaciones. Los investigadores optaron porque los ayudantes de
investigación recogieran los datos, lo que redujo el potencial de
sesgo y aumentó la validez de constructo (Shadish y cols., 2002). La
formación de los ayudantes de investigación mejoró la
homogeneidad de los datos recogidos, lo que aumentó la validez
de conclusión estadística. Las necesidades de aprendizaje se
midieron con la PLNS, cuya validez se había descrito en
investigaciones previas y era fiable para la población de este
estudio, lo que respalda la validez de la conclusión estadística

455
(Gray y cols., 2017). Además, el estudio piloto respaldó el uso de
esta escala con estos participantes. En resumen, este diseño
descriptivo comparativo incluyó varios puntos fuertes que
aumentaron la confiabilidad de los resultados y hallazgos del
estudio.
Mosleh y cols. (2017) observaron una disparidad entre las
percepciones de los pacientes y los profesionales de enfermería
sobre las necesidades de aprendizaje esenciales después de una
intervención cardiaca. Los investigadores recomendaban que los
profesionales de enfermería se centren en la información sobre los
cuidados de la herida, los fármacos y las complicaciones
postintervención antes del alta, porque esas eran las necesidades
prioritarias de los pacientes. La educación sobre la dieta y las
actividades físicas debe proporcionarse más adelante en el proceso
de recuperación de los pacientes.

DISEÑOS DE CORRELACIÓN
El objetivo de un diseño de correlación es analizar las relaciones
entre dos o más variables de un único grupo en estudio. Este
análisis puede realizarse en varios niveles: correlacional
descriptivo, en el que el investigador puede intentar describir una
relación; correlacional predictivo, en el que el investigador puede
predecir relaciones entre las variables, o el diseño de comprobación
de modelos, en el que se comprueban simultáneamente todas las
relaciones propuestas por una teoría.
En los diseños correlacionales, es necesario un rango amplio de
las puntuaciones de la variable para determinar la existencia de una
relación. Por tanto, la muestra debe ser amplia para reflejar todo el
rango de valores posibles de las variables que se están midiendo
(Grove y Cipher, 2017). Algunos participantes en el estudio
deberían tener puntuaciones muy altas y otros muy bajas, y las del
resto deberían distribuirse en el rango posible.
El algoritmo de la figura 8.5 se puede utilizar para identificar el
diseño de correlación específico incluido en un estudio. En
ocasiones, los investigadores combinan elementos de distintos
diseños para lograr el propósito de su estudio. Por ejemplo, los
investigadores podrían realizar un diseño de estudio de correlación

456
descriptivo transversal para analizar la relación entre el índice de
masa corporal (IMC) y la concentración sanguínea de lípidos al
principio de la adolescencia (13-16 años) y al final de esta (17-19
años). Es importante que los investigadores identifiquen con
claridad el diseño específico que utilizan en su informe de
investigación. Se dispone de más detalles sobre diseños de
correlación en otras fuentes de investigación (Gray y cols., 2017;
Kerlinger y Lee, 2000).

Diseño de correlación descriptivo


El propósito de un diseño de correlación descriptivo es describir
las variables y analizar las relaciones entre ellas. Su uso facilita la
identificación de muchas interrelaciones en una situación. El
estudio puede analizar las variables en una situación que ya se ha
producido o que se está produciendo en la actualidad. Los
investigadores no intentan controlar ni manipular la situación.
Como en los estudios descriptivos, las variables deben identificarse
con claridad y deben definirse conceptual y operacionalmente (v.
cap. 5). Como se muestra en la figura 8.6, las variables se miden, se
describen y se analizan en busca de relaciones. Los hallazgos de los
estudios de correlación descriptivos se interpretan y proporcionan
las bases para más investigaciones.

FIG 8.6 Diseño de correlación descriptivo.

Branson, Loftin, Hadley, Hartin y Devkota (2016, pág. 185)


realizaron un estudio de correlación para «analizar la relación entre

457
la asistencia y la calificación del curso en un curso de
preenfermería. La muestra incluía 445 expedientes de estudiantes
de preenfermería matriculados en un curso de habilidades
requeridas y seguridad en la universidad de Texas. En el Ejemplo
de investigación 8.3 se incluyen los elementos clave de este diseño
de correlación descriptivo.

EJEMPLO DE INVESTIGACIÓN 8.3


Diseño de correlación descriptivo
Extracto del estudio de investigación
Métodos
Para este proyecto, se utilizó un diseño de correlación descriptivo. Se
efectuó un análisis retrospectivo de las hojas de asistencia de los
estudiantes de preenfermería recopiladas a lo largo de un periodo de 4
años, lo que permitió analizar la relación entre el resultado final del
curso y la asistencia a este. A efectos de este estudio, el resultado del
curso se operacionalizó mediante su calificación final y la asistencia al
curso se operacionalizó mediante el porcentaje de clases a las que se
había asistido durante el semestre en el que se presentó contenido del
curso. En esta universidad, cada semestre consta de 15 semanas y el
contenido del curso se impartía mediante diversos métodos durante
13 de las 15 semanas. La primera semana de cada semestre solía
considerarse un periodo introductorio sin que se presentase contenido
del curso, y la semana final se dedicaba al examen final del curso…
Por tanto, se analizaron 13 hojas de asistencia al curso por clase para
cada semestre y se incluyeron en este estudio… Este curso está
disponible para estudiantes de preenfermería de segundo año. Ni la
asistencia ni la participación durante la clase se consideraban
obligatorias para este curso, ni se tenían en cuenta con fines de
calificación (Branson y cols., 2016, pág. 186).

Valoración crítica

458
Branson y cols. (2016) identificaron el diseño específico de su
estudio, que era relevante para el propósito y las preguntas de
investigación de dicho estudio. Se usó una muestra por
conveniencia no aleatoria (estudiantes en un curso de
preenfermería), que es frecuente para los estudios descriptivos y de
correlación (Gray y cols., 2017). Los métodos de muestreo no
aleatorios disminuyen la representatividad de la muestra respecto
a la población; sin embargo, el tamaño de la muestra era amplio (n
= 445) y produjo unos resultados significativos (ausencia de error
tipo II; Grove y Cipher, 2017). Las variables de la calificación final y
de la asistencia al curso se operacionalizaron claramente, lo que
favoreció la validez de constructo (Shadish y cols., 2002). La
calificación del curso se consultó en el expediente del estudiante y
el proceso para obtener la asistencia al curso se utilizó de forma
sistemática para un curso a lo largo de 4 años, lo que respaldó la
validez de conclusión estadística. El estudio se limitó a un entorno,
pero la recogida a lo largo de varios años aumentó la validez
interna del diseño. El potencial de que se produjese un sesgo se
redujo al no requerir la asistencia al curso ni incluirla como parte
de la calificación del estudiante. El diseño de este estudio era sólido
y los resultados y hallazgos generados parecen ser representativos
de la población del estudio.
Branson y cols. (2016) observaron una relación positiva
significativa entre la calificación del curso y la asistencia a clase
(r443 = 0,54; p <0,001; Grove y Cipher, 2017). Estos resultados del
estudio respaldan la creencia arraigada entre los profesores de que
la asistencia a clase tiene un impacto positivo en las calificaciones
finales del curso. Estos investigadores recomendaban que los
asesores y profesores de enfermería hiciesen hincapié en la
importancia de la asistencia a clase para las calificaciones finales
del curso y para una progresión satisfactoria del programa.

Diseño de correlación predictivo


El propósito de un diseño de correlación predictivo es predecir el
valor de una variable basándose en los valores obtenidos de otra u
otras variables. La predicción es un enfoque para analizar las
relaciones causales entre las variables. Puesto que se analizan

459
fenómenos causales, se utilizan los términos dependiente e
independiente para describir las variables. La que se va a predecir se
clasifica como dependiente y las otras son independientes o de
predicción. En un estudio de este tipo, se intenta predecir el nivel
de una variable dependiente a partir de los valores medidos de las
variables independientes. Por ejemplo, la variable dependiente de
la adherencia a la medicación podría predecirse utilizando las
variables independientes de la edad, el número de fármacos y el
conocimiento de los fármacos de los pacientes con insuficiencia
cardiaca. Las variables independientes más eficaces para la
predicción presentan una correlación significativa con la variable
dependiente, pero no con otras variables independientes utilizadas
en el estudio (Grove y Cipher, 2017). En la figura 8.7 se presenta la
estructura del diseño de correlación predictivo. Este diseño requiere
el desarrollo de una hipótesis basada en una teoría que proponga
las variables que se espera que predigan con eficacia la variable
dependiente. A continuación, los investigadores utilizan el análisis
de regresión para comprobar la hipótesis (v. cap. 11).

FIG 8.7 Diseño de correlación predictivo.

De Santis, Hauglum, Deleon, Provencio-Vasquez y Rodriguez


(2017) realizaron un estudio de correlación para determinar si la
percepción del riesgo del virus de la inmunodeficiencia humana
(VIH) y los conocimientos sobre el VIH son predictivos de
conductas sexuales de riesgo en mujeres transgénero. En el Ejemplo
de investigación 8.4 se muestran los elementos principales de este
diseño correlacional predictivo.

EJEMPLO DE INVESTIGACIÓN 8.4


Diseño de correlación predictivo

460
Extracto del estudio de investigación
Métodos
Diseño y muestra
Este estudio piloto utilizó un diseño de correlación descriptivo para
estudiar los problemas de salud en una muestra de mujeres transgénero
HAM (hombre a mujer) que vivían en el sur de Florida (n = 50), un área
con una amplia población de lesbianas, gays, bisexuales y transgénero
(LGBT)… Los participantes fueron reclutados de organismos de ayuda a
mujeres transgénero como centros de análisis y asesoramiento sobre VIH,
centros de asesoramiento de salud mental y una clínica universitaria de
cirugía de reasignación de sexo… Después de obtener el consentimiento
informado, se entregó a las participantes los instrumentos
autoadministrados para completarlos en papel…
Mediciones
La percepción del riesgo de VIH se midió utilizando la escala Perceived
Risk for HIV Infection… Aunque el instrumento no se ha utilizado
previamente con mujeres transgénero, tiene un coeficiente de fiabilidad
global de 0,78… El conocimiento sobre el VIH se midió utilizando el
cuestionario HIV knowledge Questionnaire-18, que consta de 18 ítems…
Aunque el instrumento no se ha utilizado previamente con mujeres
transgénero, se han descrito coeficientes de fiabilidad de 0,76-0,94… Las
conductas sexuales de riesgo se midieron utilizando la Behavior Risk
Assessment Tool (BRAT), una herramienta clínica que evalúa el riesgo de
infección por VIH de un individuo… Este instrumento no se ha utilizado
en investigaciones con mujeres transgénero…
Estrategia analítica
Los coeficientes de correlación se utilizaron para analizar la relación entre
las variables continuas de percepción del riesgo de VIH, conocimientos
sobre el VIH y conductas sexuales de riesgo. Se utilizó un análisis de
regresión para determinar las variables asociadas con las conductas
sexuales de riesgo. (De Santis y cols., 2017, págs. 211-212)
Valoración crítica
De Santis y cols. (2017) no identificaron que el diseño de su estudio
fuese de correlación. Sin embargo, el foco de este estudio era
predecir las conductas sexuales de riesgo de las mujeres
transgénero y los resultados se generaron mediante un análisis de

461
regresión (Grove y Cipher, 2017). El tamaño muestral era pequeño
para un estudio de correlación, lo que produjo una potencia
estadística baja y contribuyó a los hallazgos no significativos (error
de tipo II; Gray y cols., 2017). Puesto que el tamaño muestral suele
ser menor en los estudios piloto, se necesitan más investigaciones
para esta población no estudiada. Los métodos de medición fueron
una amenaza para la validez de constructo, porque no se habían
usado con una población transgénero, y una amenaza para la
validez de conclusión estadística, porque los investigadores no
proporcionaron los coeficientes de fiabilidad para las escalas de
este estudio. La coherencia en la recogida de datos se desconoce,
porque los participantes autocumplimentaron los cuestionarios del
estudio, lo que amenazó la validez de constructo. De Santis y cols.
(2017) observaron que la percepción del riesgo de VIH y el
conocimiento sobre el VIH no se correlacionaban de forma
significativa ni eran predictivos de las conductas sexuales de riesgo
en las mujeres transgénero. Los investigadores recomendaron más
estudios con un tamaño muestral mayor para analizar los factores
que contribuyen a las conductas sexuales de riesgo en esta
población. La validez del diseño debe reforzarse en futuros
estudios.

Diseño de comprobación de modelos


Algunos estudios están diseñados específicamente para comprobar
la precisión de un modelo causal hipotético (v. cap. 7). El diseño de
comprobación de modelos requiere que se midan todos los
conceptos relevantes para el modelo y que se analicen las relaciones
entre esos conceptos. Se requiere una amplia muestra heterogénea.
Los análisis de correlación y el modelado de ecuaciones
estructurales se realizan para determinar las relaciones entre los
conceptos del modelo y los resultados se presentan en el modelo
del marco para el estudio. Este tipo de diseño es muy complejo; este
texto proporciona solo una introducción a un diseño de
comprobación de modelos implementado por Battistelli,
Portoghese, Galletta y Pohl (2013).
Battistelli y cols. (2013) desarrollaron y evaluaron un modelo
teórico para analizar las intenciones de rotación de los profesionales

462
de enfermería que trabajaban en hospitales. Los conceptos de
conflicto entre el trabajo y la familia, la satisfacción con el trabajo, el
arraigo en la comunidad y el compromiso afectivo con la
organización se identificaron como factores predictivos de la
intención de rotación de dichos profesionales. Los investigadores
recogieron datos sobre estos conceptos utilizando una muestra de
440 profesionales de enfermería de un hospital público. El análisis
de los datos del estudio mostró unas relaciones significativas entre
todos los conceptos del modelo. Los resultados de este estudio se
muestran en la figura 8.8 e indican la importancia de estos
conceptos a la hora de predecir la intención de rotación de los
profesionales de enfermería.

FIG 8.8 Resultados del análisis de modelado de


ecuaciones estructurales del modelo hipotético de la
intención de rotación en la muestra de validación
transversal (n = 440, cargas de la trayectoria
estandarizadas; P <0,05; dos colas). (Tomada de
Battistelli, A., Portoghese, I., Galletta, M. y Pohl, S. [2013].
Beyond the tradition: Test of an integrative conceptual model on
nurse turnover. International Nursing Review, 60[1], 109.)

ELEMENTOS DE LOS DISEÑOS QUE

463
ANALIZAN LA CAUSALIDAD
Los diseños cuasiexperimental y experimental se utilizan en los
estudios para obtener una representación precisa de la causa y el
efecto por los medios más eficaces. Es decir, el diseño debe
proporcionar la máxima cantidad de control con el mínimo error
posible. Los efectos de algunas variables externas se controlan en
un estudio utilizando criterios de muestreo específicos, una variable
independiente o intervención estructurada y un entorno muy
controlado. Un ECA es un tipo de diseño experimental que suele
considerarse uno de los diseños más sólidos para analizar la
relación causa-efecto (Schulz, Altman y Moher, 2010). Los ECA se
describen más adelante en este capítulo. Los elementos esenciales
de la investigación para analizar causalidad son:

• La asignación aleatoria de los participantes del estudio a los


grupos.
• La definición precisa de la variable independiente o la
intervención.
• La manipulación de la intervención controlada por el
investigador.
• El control del investigador de la situación experimental y el
entorno.
• La inclusión de un grupo control o de comparación en el
estudio.
• La identificación clara de los criterios de muestreo (v. cap.
9).
• La medición cuidadosa de las variables dependientes o de
resultados (v. cap. 10; Waltz y cols., 2017).

Análisis de la intervención en estudios de


enfermería
En los estudios que analizan causalidad, los investigadores
desarrollan una intervención que se espera que dé lugar a
diferencias en las mediciones postest entre los grupos de
tratamiento y control. Las intervenciones pueden ser fisiológicas,
psicosociales, educativas o una combinación de estas. La

464
intervención terapéutica que se aplica en un estudio de enfermería
tiene que diseñarse cuidadosamente, describirse con claridad y
relacionarse de forma adecuada con los resultados (variables
dependientes) del estudio. Debe aplicarse de forma coherente a
todos los participantes del estudio. El informe de investigación
debería documentar la fidelidad de la intervención, que
comprende una descripción detallada de sus elementos esenciales y
su aplicación coherente durante el estudio (Bova y cols., 2017;
Eymard y Altmiller, 2016). En ocasiones, los investigadores
proporcionan una tabla del contenido de la intervención y/o el
protocolo utilizado para aplicarla a cada participante de forma
coherente. Los investigadores también deberían indicar quién
aplicó la intervención y qué formación se realizó para garantizar su
aplicación coherente. En algunos estudios se documenta el
seguimiento de la fidelidad de la intervención (integridad y
consistencia de su aplicación) durante su realización (Carpenter y
cols., 2013). Por ejemplo, Bova y cols. (2017, pág. 54) analizaron la
fidelidad de la intervención de su estudio de 191 progenitores de
niños pequeños recién diagnosticados de diabetes tipo 2, tal y como
se indica en la siguiente cita: «La fidelidad de la intervención se
midió tanto para la intervención como para la condición de control
mediante observación directa, autonotificación de la prestación de
la intervención y recepción de información educativa por el
progenitor participante. Los datos de fidelidad de la intervención se
analizaron después de que se había reclutado el 50, el 75 y el 100%
de los participantes y se compararon por grupo (tratamiento y
control) y por sitio de la investigación». Esta monitorización de la
intervención permitió a Bova y cols. (2017) realizar correcciones
según fue preciso en su estudio multicéntrico.
Spiva y cols. (2017) realizaron un estudio cuasiexperimental para
analizar la eficacia que un programa de formación para tutores de
enfermería de práctica basada en la evidencia (PBE) tenía sobre la
prestación de PBE por profesionales de enfermería clínica. Estos
investigadores implementaron una intervención multifacética para
formar a los tutores de enfermería de PBE con el fin de preparar a
los profesionales de enfermería clínica para incorporar la
investigación a su práctica clínica. Los componentes de su
programa educativo formal (intervención) se detallan en el Ejemplo

465
de investigación 8.5.

EJEMPLO DE INVESTIGACIÓN 8.5


Intervención de enfermería
Extracto del estudio de investigación
Intervenciones
Se creó una carta del proyecto y un currículum educativo por parte de los
investigadores del estudio, el director de enfermería y el director de
docencia; todos tenían conocimientos de los principios de PBE y de
desarrollo de liderazgo… Los líderes de enfermería clínica, los especialistas
en enfermería clínica y los educadores recibieron formación para
prepararles con el fin de actuar como tutores de PBE. La formación de los
tutores incluyó una instrucción y discusión didácticas, formación en
persona y seminarios web online interactivos (tabla 1) para preparar los
cimientos en los que basar y fomentar la PBE… La formación de los
profesionales de enfermería clínica incluyó cuatro módulos online de 30
minutos diseñados para proporcionarles las herramientas y recursos
necesarios para llevar la evidencia a la práctica e implementar un proyecto
de PBE (tabla 2) (Spiva y cols., 2017, págs. 186-187).
Valoración crítica
Los programas educativos se desarrollaron e implementaron por
expertos en el área de la PBE y el liderazgo. En las tablas 1 y 2 se
detalla el contenido y el protocolo para formar a los tutores de
enfermería y a los profesionales de enfermería clínica. La
implementación de los programas educativos se estructuró y se
implementó de forma homogénea por expertos. La estructura de la
formación de los tutores de enfermería y de los módulos
informatizados para los profesionales de enfermería clínica
fomentó la fidelidad de la intervención. Spiva y cols. (2017)
utilizaron un diseño cuasiexperimental, que se presenta como
ejemplo más adelante en este capítulo.

Grupos experimental y control o de

466
comparación
El grupo de participantes que reciben la intervención del estudio se
denomina grupo de intervención, de tratamiento o experimental.
El grupo que no se expone a la intervención se denomina grupo
control o de comparación. En algunas disciplinas, los grupos
control no reciben asistencia o acción, pero esto no es posible en la
mayoría de los estudios de enfermería, porque los pacientes deben
recibir asistencia. Por ejemplo, no sería ético no proporcionar las
indicaciones preoperatorias a un paciente en el grupo control de un
estudio. Además, en muchos estudios, el simple hecho de pasar
tiempo con los pacientes o hacer que participen en actividades que
se consideran beneficiosas puede provocar un cambio en la variable
dependiente. Por tanto, los estudios de enfermería suelen incluir un
grupo de comparación que recibe una acción de enfermería para
que ambos grupos (de intervención y de comparación) reciban
tiempo y atención. Esta estructura de diseño permite que los
investigadores distingan entre el efecto del tiempo y la atención y el
de la intervención (Gray y cols., 2017).
La acción de enfermería estándar consiste en los cuidados que
recibirían los pacientes si no se estuviera realizando un estudio. Los
investigadores deben describir con detalle los cuidados estándar de
enfermería que recibe el grupo control o de comparación para que
el estudio pueda valorarse de forma adecuada. Puesto que es
posible que la calidad de estos cuidados varíe considerablemente
entre los participantes del estudio, es probable que la varianza sea
alta en el grupo control o de comparación y se debe tener en cuenta
en el análisis de los hallazgos. Algunos investigadores
proporcionan la intervención y los cuidados estándar de enfermería
al grupo experimental para controlar el efecto de estos cuidados en
el estudio.

DISEÑOS CUASIEXPERIMENTALES
El uso de un diseño cuasiexperimental facilita la búsqueda del
conocimiento y el análisis de la causalidad en situaciones en las que
el control total no es posible. Este tipo de diseño se desarrolló para
controlar el mayor número posible de amenazas a la validez (v.

467
tabla 8.1) en una situación en la que faltaban algunos de los
componentes del diseño experimental verdadero (Shadish y cols.,
2002). En la mayoría de los estudios con diseños
cuasiexperimentales, la muestra no se selecciona de forma
aleatorizada y hay menos control sobre la intervención, las
variables externas y el entorno del estudio. La mayoría de los
estudios cuasiexperimentales incluyen un muestreo por
conveniencia, en el que los participantes se incluyen en el estudio
porque están en el lugar correcto en el momento adecuado (v. cap.
9). Los participantes seleccionados suelen asignarse al azar para
recibir la intervención experimental o los cuidados estándar. El
grupo que recibe los cuidados estándar suele denominarse grupo
de comparación, frente al grupo control, que no recibe ningún
tratamiento ni los cuidados estándar (Shadish y cols., 2002). Sin
embargo, en los estudios de enfermería se utilizan los términos
grupo control y grupo de comparación indistintamente con frecuencia.
La asignación aleatoria de los participantes de la muestra original
al grupo de intervención o de comparación favorece la validez
interna del diseño. En ocasiones, los grupos de comparación y de
intervención pueden evolucionar de forma natural. Por ejemplo,
pueden incluir participantes que eligen estar en el grupo de
intervención y otros que optan por no recibir la intervención como
el grupo de comparación. Estos grupos no pueden considerarse
equivalentes, porque es probable que existan diferencias
importantes entre los participantes que se seleccionaron para estar
en un grupo o en el otro. Por ejemplo, si los investigadores estaban
aplicando una intervención que consiste en un programa
estructurado de ejercicios para fomentar la pérdida de peso, no
debe permitirse a los participantes que elijan si estar en el grupo de
intervención y hacer el programa de ejercicios o en el grupo de
comparación que recibe la asistencia estándar. La autoselección de
los participantes para estar en uno de los grupos es una amenaza
para la validez interna del diseño de un estudio.
Los diseños cuasiexperimentales tienen niveles variables de
control del proceso de muestreo, de asignación a los grupos, de
intervención, de entorno y de las variables externas. El algoritmo de
la figura 8.9 muestra varios diseños cuasiexperimentales para que
se pueda identificar el tipo de diseño cuasiexperimental en un

468
estudio. Se dispone de más detalles sobre los diseños específicos
mostrados en este algoritmo en otras fuentes (Gray y cols., 2017;
Shadish y cols., 2002).

469
FIG 8.9 Algoritmo para determinar el tipo de diseño
cuasiexperimental.

Diseños pretest y postest con grupo de


comparación
Los diseños de los estudios cuasiexperimentales son muy variables.
El más utilizado en investigación en ciencias sociales es el diseño

470
con grupo de comparación sin tratamiento, con pretest y postest
(fig. 8.10), en el que el investigador tiene un grupo de participantes
que recibieron la intervención experimental y un grupo de
comparación de participantes que recibieron los cuidados estándar.

FIG 8.10 Diseño cuasiexperimental pretest y postest


con un grupo de comparación.

Otro diseño que se utiliza con frecuencia es el diseño solo postest


con un grupo de comparación, que se muestra en la figura 8.11. Se
utiliza en situaciones en las que no es posible emplear el diseño
pretest. Por ejemplo, si el investigador está analizando las
diferencias de la cantidad de dolor que siente un participante en el
estudio durante un procedimiento doloroso y se utiliza una
intervención de enfermería para reducir el dolor en los
participantes del grupo experimental, tal vez no sea posible (o
significativo) medir el dolor antes del procedimiento. Este diseño
incorpora una serie de amenazas para la validez debido a la falta de
pretest (Shadish y cols., 2002).

471
FIG 8.11 Diseño cuasiexperimental solo postest con
un grupo de comparación.

Spiva y cols. (2017) realizaron un estudio cuasiexperimental para


analizar los efectos de un programa de formación para tutores de
enfermería de PBE (v. tabla 1) y una intervención de un módulo de
enfermería clínica (v. tabla 2) sobre los resultados relacionados con
la PBE. Estas dos intervenciones se han presentado en la sección
anterior y animamos al lector a buscar el artículo en el sitio web de
este libro y a valorar críticamente el diseño de este estudio. La
valoración crítica de este estudio se realizó utilizando las guías de
valoración crítica para los diseños cuasiexperimental y
experimental.

TABLA 1
Objetivos de intervención educativa para la formación de
tutores de enfermería

472
MC, mejora de la calidad; PBE, práctica basada en la evidencia.
Tomada de Spiva, L., Hart, P. L., Patrick, S., Waggoner, J., Jackson, C. y
Threatt, J. L. (2017). Effectiveness of an evidence-based practice nurse
mentor training program. Worldviews on Evidence-Based Nursing, 14(3),
185.

TABLA 2
Objetivos de intervención de un módulo de aprendizaje
informatizado para la formación en enfermería clínica

MC, mejora de la calidad; PBE, práctica basada en la evidencia.


Tomada de Spiva, L., Hart, P. L., Patrick, S., Waggoner, J., Jackson, C. y
Threatt, J. L. (2017). Effectiveness of an evidence-based practice nurse
mentor training program. Worldviews on Evidence-Based Nursing, 14(3),
185.

473
GUÍAS DE VALORACIÓN CRÍTICA
Diseños cuasiexperimental y experimental
Cuando se valora críticamente el diseño de un estudio
cuasiexperimental o experimental, se deben responder las
siguientes preguntas:

1. ¿El diseño del estudio es cuasiexperimental o experimental?


Se debe revisar el algoritmo de la figura 8.1 para determinar
el tipo de diseño del estudio.
2. Se debe identificar el tipo específico de diseño
cuasiexperimental o experimental utilizado en el estudio. El
algoritmo de la figura 8.9 muestra los tipos de diseños
cuasiexperimentales y el algoritmo de la figura 8.12, los tipos
de diseños experimentales.

474
FIG 8.12 Algoritmo para determinar el tipo de diseño
experimental.

3. ¿Cuáles fueron los puntos fuertes y las amenazas para la


validez (de constructo, interna, externa y de conclusión
estadística) en el estudio (v. tabla 8.1)? Se puede revisar el
apartado de métodos y las limitaciones identificadas en el
apartado de discusión del estudio para obtener ideas.
4. ¿Qué elementos se controlaron y cuáles podrían haberse
controlado para mejorar el diseño del estudio? Se deben
revisar los criterios de muestreo, el tamaño de la muestra, la

475
asignación de los participantes a los grupos y el entorno del
estudio.
5. ¿Se describió detalladamente la intervención del estudio? ¿Se
desarrolló un protocolo para garantizar una aplicación
coherente y fiable de la intervención a todos los participantes
durante todo el estudio? ¿En el informe del estudio se indica
quién aplicó la intervención? Si la intervención fue aplicada
por varias personas, ¿cómo fueron preparadas para asegurar
la homogeneidad a la hora de aplicar el tratamiento? ¿Se
logró la fidelidad de la intervención en el estudio (Bova y
cols., 2017; Eymard y Altmiller, 2016; Murphy y Gutman,
2012)?
6. ¿Las variables dependientes del estudio se midieron con
métodos de medición fiables y válidos (Waltz y cols., 2017)?

El diseño del estudio de Spiva y cols. (2017) era muy complejo,


por lo que en el Ejemplo de investigación 8.6 solo se presenta una
parte del contenido del apartado de métodos.

EJEMPLO DE INVESTIGACIÓN 8.6


Diseño cuasiexperimental pretest y postest con
grupo de comparación
Extracto del estudio de investigación
Métodos
Diseño
Se utilizó un diseño de dos grupos pretest-postest, cuasiexperimental,
intervencional…
Mediciones
Se utilizó el Evidence-Based Nursing Questionnaire para medir las
condiciones que impiden o mantienen la enfermería basada en la
evidencia. El cuestionario se ha evaluado en cuanto a su validez y
fiabilidad. En nuestra muestra, las subescalas usadas incluyeron unos
coeficientes alfa de Cronbach de 0,87 para la escala total, 0,80 para el
apoyo organizativo (disposición), 0,92 para las creencias y actitudes de

476
evidencia de investigación de los profesionales de enfermería, 0,79 para las
habilidades de PBE y 0,80 para el conocimiento de los profesionales de
enfermería sobre el lenguaje y la estadística en investigación enfermera…
Se utilizó una escala de confianza… para medir la confianza percibida
por los profesionales de enfermería en su conocimiento y capacidad para
implementar la PBE. Unas puntuaciones medias mayores indican una
percepción más alta de confianza. La validez del contenido fue establecida
por cinco profesionales de enfermería expertos con conocimientos en el
campo de la PBE y la educación del personal… El índice de validez de
contenido fue de 0,90. En un estudio piloto previo, el coeficiente alfa de
Cronbach fue de 0,94 y en esta muestra fue de 0,96.…
Se usó la escala Barriers to Research Utilization Scale para medir las
barreras percibidas al uso de la investigación… Esta escala se ha evaluado
ampliamente y se considera fiable y válida. En nuestro estudio, los
coeficientes alfa de Cronbach fueron de 0,96 para la escala total, 0,85 para
la comunicación, 0,90 para innovador, 0,89 para la organización y 0,87
para la innovación (Spiva y cols., 2017, pág. 184).
Muestreo y reclutamiento
Se reclutó una muestra por conveniencia de profesionales de enfermería y
tutores de enfermería que trabajaban en un sistema sanitario integrado sin
ánimo de lucro constituido por cinco hospitales localizado en el sudeste de
Estados Unidos. El reclutamiento global incluyó 1.916 profesionales de
enfermería… Sesenta y seis (66) tutores participaron y completaron las
encuestas… Inicialmente, 793 (profesionales de enfermería clínica)
completaron la encuesta previa y el módulo uno. La muestra final incluyó
367 que completaron las escalas previa y posterior, y todos los módulos
(Spiva y cols., 2017, pág. 187).
Valoración crítica
Spiva y cols. (2017) identificaron el diseño cuasiexperimental
específico utilizado en su estudio, que abordó los objetivos de este.
Sin embargo, el estudio habría tenido más solidez si se hubiese
elaborado una hipótesis para dirigir el estudio. La muestra de
conveniencia disminuyó la representatividad de la población, pero
el entorno incluyó cinco hospitales, lo que incrementó la
representatividad. Los criterios de muestreo no se abordaron
claramente en el estudio y los profesionales de enfermería no se
asignaron de forma aleatoria a los grupos, lo que supuso una

477
amenaza para la validez interna del diseño. No se produjeron
abandonos en el grupo de tutores de enfermería, pero 426 (54%) de
los profesionales de enfermería clínica abandonaron el estudio
después del primer módulo, lo que dio lugar a posibles amenazas
para la validez interna y de conclusión estadística.
Los instrumentos usados en este estudio tenían fiabilidad y
validez de las investigaciones previas y presentaban una fiabilidad
sólida (la mayoría de las alfas de Cronbach eran >0,8) en este
estudio, lo que conllevaba una validez de constructo y de la
conclusión estadística de la investigación. Las intervenciones
estructuradas para los tutores de enfermería y los profesionales de
enfermería clínica fueron desarrolladas por expertos y se
documentaron en el informe de investigación (v. tablas 1 y 2). Un
evento histórico de la implementación de una nueva historia clínica
electrónica durante el estudio retrasó la formación de los tutores de
enfermería, lo que a su vez retardó la formación de los
profesionales de enfermería clínica. En opinión de Spiva y cols.
(2017), este retraso probablemente provocó la alta tasa de
abandono de los profesionales de enfermería clínica. Los
investigadores señalaron que las amenazas para la validez del
diseño podrían haber alterado los efectos verdaderos de las
intervenciones y se necesitan más estudios. Sin embargo, Spiva y
cols. (2017, pág. 183) concluyeron que «los tutores de PBE son
eficaces para educar y apoyar a los profesionales de enfermería en
la asistencia basada en la evidencia. Los líderes deberían utilizar un
enfoque multifacético para instituir y mantener la PBE, incluido el
desarrollo de una masa crítica de tutores de PBE para trabajar con
el personal de cada centro». Este tipo de estudio promueve la PBE
en enfermería para garantizar la calidad y la seguridad de la
asistencia (Quality and Safety Education for Nurses [QSEN, 2014];
Sherwood y Barnsteiner, 2017).

DISEÑOS EXPERIMENTALES
Se han desarrollado diversos diseños experimentales, algunos
relativamente simples y otros muy complejos, para los estudios
centrados en el análisis de la causalidad. En algunos casos, los
investigadores pueden combinar características de más de un

478
diseño para cumplir las necesidades de su estudio. Los nombres de
los diseños varían de un texto a otro. Cuando se lee y se valora
críticamente un estudio publicado, hay que determinar el nombre
que le da el autor al diseño (algunos autores no lo nombran) y/o
leer la descripción para determinar qué tipo se ha usado en el
estudio. Se puede utilizar el algoritmo que se muestra en la figura
8.12 para determinar el tipo de diseño experimental usado en un
estudio. Se dispone de más detalles sobre los diseños específicos
mostrados en la figura 8.12 en otras fuentes (Gray y cols., 2017;
Shadish y cols., 2002).

Diseños experimentales clásicos pretest y


postest con grupos experimental y control
Un diseño experimental que se utiliza con frecuencia en los estudios
sanitarios es el diseño pretest-postest con grupos experimental y
control (Campbell y Stanley, 1963; Shadish y cols., 2002). Este
diseño se muestra en la figura 8.13; es similar al diseño
cuasiexperimental de la figura 8.10, excepto que en el estudio
experimental se controlan más estrechamente las áreas de la
intervención, el entorno, la medición y/o las variables externas, por
lo que hay menos amenazas para la validez del diseño. El diseño
experimental es más sólido si la muestra inicial se selecciona al azar;
sin embargo, la mayoría de los estudios en el ámbito sanitario no
contienen una muestra aleatoria, sino que los participantes se
asignan aleatoriamente a los grupos experimental y control. La
mayoría de los estudios de enfermería utilizan el diseño
cuasiexperimental que se muestra en la figura 8.9, debido a la
incapacidad para controlar las variables externas y del entorno
seleccionadas.

479
FIG 8.13 Diseño experimental pretest-postest con
grupo control.

Pueden utilizarse varios grupos (tanto de intervención como


control) para aumentar las ventajas de los diseños experimentales.
Por ejemplo, un grupo control podría no recibir ningún tratamiento,
otro grupo control podría recibir los cuidados estándar y otro
podría recibir un placebo o una intervención sin ningún efecto,
como una pastilla de azúcar en un estudio sobre fármacos. Cada
uno de los grupos experimentales puede recibir una variación de la
intervención, como cuidados de enfermería con frecuencias,
intensidades o duraciones diferentes. Por ejemplo, en un estudio
podrían realizarse masajes con frecuencias, intensidades o
duraciones distintas para determinar su(s) efecto(s) sobre el dolor
de espalda de los pacientes. Esto aumenta en gran medida la
posibilidad de generalizar los hallazgos del estudio cuando la
muestra es representativa de la población diana y su tamaño es
adecuado.

Diseño solo postest con grupo control


El diseño experimental solo postest con grupo control también se
utiliza con frecuencia en los estudios sanitarios cuando no es
posible o no es conveniente realizar el componente pretest. Es

480
similar al diseño de la figura 8.13, pero se omite el componente
pretest. Las características de los grupos experimental y control se
suelen analizar al inicio del estudio para asegurarse de que los
grupos son similares. Sin embargo, la falta del componente pretest
aumenta el potencial de error que puede afectar a los hallazgos. Se
recomienda realizar más investigaciones antes de generalizar los
hallazgos.
McWilliams, Malecha, Langford y Clutter (2017, pág. 154)
realizaron un estudio experimental para analizar «la eficacia del
aprendizaje en equipo cooperativo comparado con el aprendizaje
independiente cuando se utilizaba con estudiantes de enfermería
que están aprendiendo la inserción de un catéter intravenoso (i.v.)
utilizando un simulador i.v. háptico». Dos muestras de
conveniencia (n = 180) de estudiantes de primeros cursos de
enfermería matriculados en el semestre de otoño y primavera (2015-
2016) en una universidad del sudeste de Texas se distribuyeron de
forma aleatoria en cuatro grupos (A, B, C y D). Los participantes de
los grupos A, B y C constituyeron cada grupo de aprendizaje
cooperativo y los del grupo D se asignaron al grupo de aprendizaje
independiente. La tasa de abandono del estudio fue baja (n = 6;
3,3%). Los investigadores realizaron su estudio con un diseño
experimental solo postest, que se muestra en el Ejemplo de
investigación 8.7.

EJEMPLO DE INVESTIGACIÓN 8.7


Diseño experimental solo postest con grupo
control
Extracto del estudio de investigación
Metodología
Se utilizó un diseño de investigación experimental solo postest para
evaluar la eficacia del aprendizaje en equipo cooperativo comparado
con el aprendizaje independiente en los estudiantes de enfermería que
utilizaban el simulador i.v. háptico. Se utilizaron la puntuación de la

481
ejecución inicial y el número de intentos hasta lograr una puntuación
de aprobado de la ejecución en el simulador i.v. háptico (puntuación
de 85 o mejor) para analizar las diferencias entre los cuatro grupos de
estudiantes.

Para aumentar la fiabilidad del estudio, se utilizó una lista de


comprobación del procedimiento diseñada por el investigador, que
incluyó un guion. El objetivo de la lista de comprobación era
garantizar que el investigador principal (IP) fuese coherente en todas
las interacciones con los estudiantes desde la asignación aleatoria y
secuenciación hasta las instrucciones sobre los procedimientos, el uso
de los nombres de usuarios/contraseñas asignados, la reiteración de
que las calificaciones obtenidas en el simulador no se relacionaban con
las del curso y en el lenguaje necesario para describir el modo en el
que los equipos de aprendizaje cooperativo iban a trabajar juntos.

El simulador intravenoso virtual de la empresa Laerdal Corporation


tenía la finalidad de ayudar al aprendizaje de la inserción del catéter
i.v. El simulador consta de un conjunto de catéter i.v./conector y una
interfaz que permite a los estudiantes palpar una vena, estirar la piel
y percibir resistencia durante la punción venosa. Además, durante la
canulación simulada, un monitor de ordenador proporciona
retroalimentación inmediata respecto a la hemorragia, hematoma y
tumefacción (McWilliams y cols., 2017, pág. 156).

Procedimiento
El día de su simulación i.v. háptica, el grupo de simulación i.v. iba al
laboratorio de habilidades de enfermería y cada estudiante recibía un
sobre con una asignación de grupo (A, B, C o D) indicada en el
exterior… Un estudiante del grupo de aprendizaje independiente
(asignación de grupo D) era llevado al primer simulador i.v. háptico.
Después de iniciar sesión en el simulador i.v., se indicaba al
estudiante de aprendizaje independiente que siguiese las instrucciones
de su sobre y que viese el tutorial del procedimiento i.v. El tutorial
informaba al estudiante sobre el modo de utilizar el simulador i.v.…

482
El equipo cooperativo de estudiantes (asignaciones de grupo A, B, C)
era llevado al segundo simulador i.v. háptico. El IP revisó las
instrucciones del sobre del equipo y presentó información sobre el
modo en el que el equipo debe trabajar junto en el simulador i.v. hasta
que todos sus miembros hayan completado la tarea…

Para este estudio, la puntuación de la ejecución inicial que obtuvo


cada estudiante en el simulador i.v. háptico y el número de intentos
para obtener una puntuación de aprobado en la ejecución se
registraron como variables dependientes. Las puntuaciones de la
ejecución inicial se obtuvieron a partir del registro impreso
informático del simulador i.v. háptico. El número de intentos
necesarios para lograr una puntuación de aprobado de la ejecución se
obtuvo iniciando sesión en el sistema informático del simulador y
contando el número de intentos requerido por cada estudiante
(McWilliams y cols., 2017, pág. 157).

Valoración crítica
McWilliams y cols. (2017) identificaron su diseño experimental
específico, que abordó el propósito y las hipótesis del estudio. La
muestra de conveniencia y el uso de una única universidad para el
entorno del estudio disminuyeron la representatividad de la
muestra de la población de estudiantes de enfermería. Sin
embargo, el tamaño de la muestra fue amplio, la tasa de abandono
fue baja (3,3%) y los resultados fueron significativos, lo que indica
que la validez interna y de conclusión estadística era sólida. La
asignación aleatoria de los participantes a los grupos de
aprendizaje cooperativo e independiente se presentó en detalle, lo
que fortaleció la validez interna y externa del diseño (v. tabla 8.1;
Shadish y cols., 2002).
Los investigadores fomentaron la fidelidad de la intervención
utilizando una lista de comprobación y un guion del
procedimiento (validez de conclusión estadística; Eymard y
Altmiller, 2016), e implementaron la intervención usando un
simulador i.v. de calidad (validez externa). McWilliams y cols.
(2017) operacionalizaron claramente sus variables dependientes del
estudio (puntuación de ejecución obtenida y número de intentos

483
para lograr una puntuación de aprobado) que se midieron
utilizando el ordenador del simulador. Estas mediciones generadas
por ordenador garantizaron la precisión de los datos recogidos y la
validez de constructo del diseño. El control detallado de la
intervención, el entorno y el proceso de recogida de datos son
coherentes con la aplicación de un diseño del estudio experimental
de calidad (Gray y cols., 2017; Shadish y cols., 2002).
McWilliams y cols. (2017, pág. 154) observaron que los
«miembros del equipo cooperativo obtuvieron mejores
puntuaciones con menos intentos que los estudiantes del grupo de
aprendizaje independiente cuando usaron un simulador i.v.… Este
estudio proporcionó evidencia empírica que respalda la eficacia de
la simulación como un método para aprender una habilidad
psicométrica».

Ensayos controlados aleatorizados


Actualmente, en enfermería y medicina, se ha observado que el
estudio controlado aleatorizado (ECA) es la metodología más
sólida para probar la eficacia de una intervención debido a los
elementos del diseño que limitan la posibilidad de sesgo y error.
Los participantes son asignados al azar a los grupos de intervención
y control para reducir el sesgo de selección (Carpenter y cols., 2013;
Schulz y cols., 2010). Además, el enmascaramiento, que consiste en
ocultar la información del estudio a quienes recogen los datos, a los
participantes y a los profesionales sanitarios que los atienden,
puede reducir la posibilidad de sesgo. Cuando los ECA se realizan
correctamente, se consideran el patrón oro para determinar la
eficacia de las intervenciones sanitarias. Pueden realizarse en un
entorno único o en varias ubicaciones geográficas para aumentar el
tamaño de la muestra y que sea más representativa.
Los primeros ECA que se realizaron en medicina tenían
inconsistencias y sesgos, por lo que un grupo de expertos
(investigadores de ensayos clínicos, editores de revistas médicas,
epidemiólogos y metodólogos) desarrolló guías para evaluar la
calidad de los informes de los ECA. Este grupo inició la declaración
Standardized Reporting of Trials (SORT), que fue revisada y se
convirtió en los CONsolidated Standards for Reporting Trials

484
(CONSORT). Esta guía actual comprende una lista de
comprobación y un diagrama de flujo que pueden utilizarse para
desarrollar y elaborar informes, así como para valorar críticamente
los ECA publicados (CONSORT, 2010). Los investigadores de
enfermería deben seguir las recomendaciones de la declaración
CONSORT 2010 cuando realizan ECA y elaboran los informes
(Schulz y cols., 2010). Se puede utilizar el diagrama de flujo de la
figura 8.14 para valorar críticamente los informes de los ECA que
aparecen en las revistas de enfermería. Un ECA debe contener los
siguientes elementos:

485
FIG 8.14 Declaración CONSORT 2010 que muestra
un diagrama de flujo de los procesos a través de las
fases de un ensayo aleatorizado paralelo de dos
grupos: reclutamiento, asignación de la intervención,
seguimiento y análisis de los datos. (Tomada de
CONSORT. [2010]. The CONSORT flow diagram. Consultada el
26 de junio de 2017, en http://www.consort-statement.org/consort-
statement/flow-diagram; y de Schulz, K. F., Altman, D. G. y
Moher, D. [2010]. CONSORT 2010 statement: Updated guidelines
for reporting parallel group randomized trials. Annals of Internal
Medicine, 152[11], 726-733.)

1. El estudio fue diseñado para ser una prueba definitiva de la


hipótesis según la cual la intervención causó las variables
dependientes o los resultados definidos.
2. La intervención se describió claramente y se implementó de

486
forma congruente para garantizar su fidelidad (Bova y cols.,
2017; CONSORT, 2010; Schulz y cols., 2010; Yamada,
Stevens, Sidani, Watt-Watson y De Silva, 2010).
3. El estudio se realizó en un entorno clínico, no en un
laboratorio.
4. El diseño cumple los criterios de un estudio experimental
(Schulz y cols., 2010).
5. Los participantes en el estudio se han reclutado de una
población de referencia utilizando criterios claramente
definidos. Los valores basales son comparables en todos los
grupos incluidos en el estudio. Los participantes
seleccionados se han asignado al azar a los grupos
tratamiento y de comparación (v. fig. 8.14), lo que explica el
término ensayo controlado aleatorizado (CONSORT, 2010;
Schulz y cols., 2010).
6. El estudio tiene una gran validez interna. El diseño es
riguroso e implica un alto nivel de control de las fuentes
potenciales de sesgo que descarta las posibles causas
alternativas del efecto (Shadish y cols., 2002). Puede incluir
el enmascaramiento para conseguir este objetivo. De esta
forma, el paciente, los profesionales sanitarios que le
atienden y/o los que recogen los datos no saben si el
participante está en el grupo experimental o en el control.
7. Las variables dependientes o los resultados se miden
coherentemente con métodos de medición de calidad (Waltz
y cols., 2017).
8. La intervención se define con el suficiente detalle para que
pueda aplicarse clínicamente (Schulz y cols., 2010).
9. Se identifican los participantes que se pierden durante el
seguimiento, así como sus motivos para no continuar el
estudio. Debe abordarse el abandono de los grupos
experimental y control, así como el abandono total de la
muestra.
10. El estudio ha recibido financiación externa suficiente para
permitir un diseño riguroso con un tamaño muestral
adecuado para proporcionar una prueba definitiva de la
intervención.

487
Hallas, Koslap-Petraco y Fletcher (2017, pág. 33) realizaron un
ECA «para analizar la eficacia de un programa educativo en la
consulta dirigido a mejorar la confianza materna y el desarrollo
social y emocional de los niños pequeños». La muestra por
conveniencia incluyó díadas de madre y niño pequeño obtenidas de
cinco consultas de atención primaria pediátrica y clínicas de Nueva
York. Los detalles del tamaño muestral, la asignación aleatoria a los
grupos y la tasa de abandono se presentan en la figura 4 en el
Ejemplo de investigación 8.8. Este estudio estaba financiado por
una subvención del New York University Research Fund. En el
Ejemplo de investigación 8.8 se presenta brevemente el diseño
experimental de este estudio.

EJEMPLO DE INVESTIGACIÓN 8.8


Ensayo controlado aleatorizado (ECA)
Extracto del estudio de investigación
Métodos
Diseño del ensayo

Se utilizó un ensayo prospectivo, doble ciego, controlado y


aleatorizado, con un diseño experimental de tipo pretest/postest para
evaluar la eficacia de una intervención de habilidades parentales
grabadas en DVD sobre el desarrollo social-emocional de los niños
pequeños y sobre la confianza materna de las madres que los
cuidaban… Se diseñaron dos DVD de intervención: uno para las
madres adolescentes y otro para todas las demás madres… La
intervención del grupo control fue un DVD estandarizado sobre la
nutrición del niño pequeño… Los DVD estaban disponibles en inglés
y en español. La carátula del DVD era igual que la del DVD de
intervención, por lo que la identificación de los contenidos del DVD
(tratamiento y control) se ocultó a las madres, los profesionales de
enfermería y los ayudantes de la investigación…

Después de la inclusión, cada díada de madre-niño pequeño recibió

488
una carpeta que se había distribuido de forma aleatoria al grupo de
tratamiento o control utilizando una lista de números aleatorios
generada por ordenador… Todos los profesionales de enfermería y los
ayudantes de la investigación desconocían los contenidos de la
carpeta, pues todas las carpetas eran idénticas y todos los DVD
estaban etiquetados con un código…

Evaluación de los resultados…

El cuestionario Toddler Care Questionnaire (TCQ) mide la confianza


materna de todas las madres de niños pequeños de 12-36 meses… La
fiabilidad del instrumento TCQ es de 0,91-0,96 y la fiabilidad test-
retest es de 0,87… Se usó el Brigance Toddler Screen en los niños
pequeños de 12-33 meses… para medir sus habilidades sociales-
emocionales… Todos los participantes cumplimentaron los mismos
instrumentos de estudio, por lo que los profesionales de enfermería y
los ayudantes de la investigación no tenían información sobre las
asignaciones de los grupos. Dado que todos los participantes vieron el
DVD en privado, no sabían si habían sido asignados al grupo
tratamiento o grupo control (fig. 4). (Hallas y cols., 2017, págs. 35-
36)

Valoración crítica
Hallas y cols. (2017) identificaron el diseño específico del ECA que
utilizaron para abordar el propósito y las hipótesis de su estudio.
El proceso de muestreo, la asignación aleatoria a los grupos y la
tasa de abandono limitada se detallan en la figura 4 y sirven de
apoyo de la validez interna, externa y de conclusión estadística del
diseño (Shadish y cols., 2002). Los investigadores detallaron la
intervención de su estudio (DVD de habilidades parentales) y
controlaron su implementación utilizando listas de comprobación
y guiones (Bova y cols., 2017; Yamada y cols., 2010). Los pasos
adoptados para fomentar la fidelidad de la intervención mediante
el enmascaramiento de las madres, profesionales de enfermería y
ayudantes de la investigación respecto a la asignación a los grupos
redujeron la posibilidad de sesgo y aumentó la validez interna y
externa del diseño. Las escalas utilizadas fueron fiables en

489
investigaciones previas y se utilizaron de forma homogénea en este
estudio. Sin embargo, no se proporcionaron los valores de
fidelidad de las escalas en este estudio, lo que supuso una amenaza
para la validez de la conclusión estadística. En resumen, Hallas y
cols. (2017) siguieron estrechamente las guías CONSORT (2010) en
la realización y elaboración del informe de su ECA, lo que redujo la
posibilidad de sesgo y fomentó la confianza de los resultados del
estudio. Los investigadores concluyeron que los DVD fueron una
forma significativa y eficaz para educar a las madres de los niños
pequeños en las salas de espera de la consulta para mejorar el
desarrollo social-emocional de sus niños pequeños.

490
FIG 4 Participantes. (Tomada de Hallas, D., Koslap-Petraco,
M. y Fletcher, J. [2017]. Social-emotional development of

491
toddlers: Randomized controlled trial of an office-based
intervention. Journal of Pediatric Nursing, 33[1], 37.)

PUNTOS CLAVE
• Un diseño de investigación es un proyecto para la
realización de un estudio cuantitativo que maximiza el
control sobre los factores que podrían interferir en la
validez de los hallazgos.
• En enfermería, se han utilizado cuatro tipos frecuentes de
diseños cuantitativos: descriptivo, de correlación,
cuasiexperimental y experimental.
• Los conceptos relevantes para comprender los diseños de
investigación cuantitativa incluyen causalidad,
multicausalidad, probabilidad, sesgo, prospectivo,
retrospectivo, control y manipulación.
• Entre los elementos centrales del estudio, se incluyen la
presencia o ausencia de una intervención, el método de
muestreo, el número de grupos de la muestra, el número y
secuencia temporal de las mediciones que se van a realizar,
el marco temporal de la recogida de datos, las
comparaciones previstas y el control de las variables
externas.
• La validez del estudio es una medida de la veracidad o
exactitud de los hallazgos obtenidos en un estudio. En este
texto se han descrito cuatro tipos de validez: de constructo,
interna, externa y de conclusión estadística.
• Los diseños descriptivos y de correlación, denominados
diseños no experimentales o no intervencionales, se centran
en la descripción y análisis de las relaciones entre las
variables.
• El diseño transversal supone analizar un grupo de
participantes simultáneamente en diversas etapas de
desarrollo, con distintos niveles educativos, gravedad de la
enfermedad o etapas de recuperación, para describir los
cambios de un fenómeno a través de las fases.
• El diseño longitudinal supone recoger datos de los mismos

492
participantes en distintos momentos a lo largo del tiempo y
también podría denominarse repetición de las medidas.
• Los diseños de correlación son de tres tipos diferentes: 1) de
correlación descriptivo, en el que el investigador puede
intentar describir una relación, 2) de correlación predictivo,
en el que el investigador puede predecir relaciones entre las
variables y 3) diseño de comprobación de modelos, en el
que todas las relaciones propuestas por una teoría se
prueban simultáneamente.
• En los estudios cuasiexperimentales y experimentales, se
aplican intervenciones o tratamientos para determinar su
efecto sobre las variables dependientes seleccionadas. Las
intervenciones pueden ser fisiológicas, psicosociales,
educativas o una combinación de estas.
• Los elementos esenciales de la investigación experimental
son: 1) la asignación aleatoria de los participantes a los
grupos, 2) la manipulación por el investigador de la
variable independiente y 3) el control por el investigador de
la situación experimental y del entorno, incluido el control
del grupo de comparación.
• Valorar críticamente un diseño supone analizar el entorno
del estudio, la muestra, la intervención o el tratamiento, la
medición de las variables y los métodos de obtención de
datos.
• Se ha observado que el diseño del ECA es la metodología
más sólida para probar la eficacia de una intervención
puesto que los elementos del diseño limitan las
posibilidades de sesgo.

BIBLIOGRAFÍA
Battistelli, A., Portoghese, I., Galletta, M., Pohl, S. Beyond the
tradition: Test of an integrative conceptual model on nurse
turnover. International Nursing Review. 2013; 60(1):103–111.

Bova, C., Jaffarian, C., Crawford, S., Quintos, J. B., Lee, M., Sullivan-
Bolyal, S. Intervention fidelity: Monitoring drift, providing

493
feedback, and assessing the control condition. Nursing Research.
2017; 66(1):54–59.

Branson, M., Loftin, C., Hadley, L., Hartin, V., Devkota, S. Impact of
attendance on academic performance in prenursing students. Nurse
Educator. 2016; 41(4):185–188.

Campbell, D. T., Stanley, J. C. Experimental and quasi-experimental


designs for research. Chicago, IL: Rand McNally; 1963.

Carpenter, J. S., Burns, D. S., Wu, J., Yu, M., Ryker, K., Tallman, E.,
et al. Methods: Strategies used and data obtained during treatment
fidelity monitoring. Nursing Research. 2013; 62(1):59–65.

Cohen, J. Statistical power analysis for the behavioral sciences, 2nd ed.
New York, NY: Academic Press; 1988.

CONSORT, The CONSORT statement Consultada el 26 de junio de


2017, en. http://www.consort-statement.org/consort-2010, 2010

Creswell, J. W. Research design: Qualitative, quantitative and mixed


methods approaches, 4th ed. Thousand Oaks, CA: Sage; 2014.

De Santis, J. P., Hauglum, S. D., Deleon, D. A., Provencio-Vasquez,


E., Rodriguez, A. E. HIV risk perception, HIV knowledge, and
sexual risk behaviors among transgender women in south Florida.
Public Health Nursing. 2017; 34(3):210–218.

Eymard, A. S., Altmiller, G. Teaching nursing students the


importance of treatment fidelity in intervention research: Students
as interventionists. Journal of Nursing Education. 2016; 55(5):288–291.

Gray, J. R., Grove, S. K., Sutherland, S. The practice of nursing


research: Appraisal, synthesis, and generation of evidence, 8th ed. St.

494
Louis, MO: Elsevier; 2017.

Grove, S. K., Cipher, D. J. Statistics for nursing research: A workbook


for evidence-based practice, 2nd ed. St. Louis, MO: Elsevier; 2017.

Hallas, D., Koslap-Petraco, M., Fletcher, J. Social-emotional


development of toddlers: Randomized controlled trial of an office-
based intervention. Journal of Pediatric Nursing. 2017; 33(1):33–40.

Kerlinger, F. N., Lee, H. B. Foundations of behavioral research, 4th ed.


Fort Worth, TX: Harcourt College Publishers; 2000.

McWilliams, L. A., Malecha, A., Langford, R., Clutter, P.


Comparisons of cooperative-based versus independent learning
while using a haptic intravenous simulator. Clinical Simulation in
Nursing. 2017; 13(4):154–160.

Melnyk, B. M., Gallagher-Ford, E., Fineout-Overholt, L. E.


Implementing evidence-based practice competencies in healthcare: A
practical guide for improving quality, safety, & outcomes. Indianapolis,
IN: Sigma Theta Tau International; 2017.

Mosleh, S. M., Eshah, N. F., Almalik, M. Perceived learning needs


according to patients who have undergone major coronary
interventions and their nurses. Journal of Clinical Nursing. 2017;
26(3/4):418–426.

Murphy, S. L., Gutman, S. A. Intervention fidelity: A necessary


aspect of intervention effectiveness studies. American Journal of
Occupational Therapy. 2012; 66(4):387–388.

Quality and Safety Education for Nurses (QSEN). Pre-licensure


knowledge, skills, and attitudes (KSAs). Consultada el 15 de mayo

495
de 2017, en http://qsen.org/competencies/pre-licensure-sas/, 2014.

Schulz, K. F., Altman, D. G., Moher, D. CONSORT 2010 statement:


Updated guidelines for reporting parallel group randomized trials.
Annals of Internal Medicine. 2010; 152(11):726–733.

Shadish, W. R., Cook, T. D., Campbell, D. T. Experimental and quasi-


experimental designs for generalized causal inference. Chicago, IL: Rand
McNally; 2002.

Sherwood, G., Barnsteiner, J. Quality and safety in nursing: A


competency approach to improving outcomes, 2nd ed. Ames, IA: Wiley-
Blackwell; 2017.

Spiva, L., Hart, P. L., Patrick, S., Waggoner, J., Jackson, C., Threatt, J.
L. Effectiveness of an evidence-based practice nurse mentor
training program. Worldviews on Evidence-Based Nursing. 2017;
14(3):183–191.

Spratling, R. Understanding the health care utilization of children


who require medical technology: A descriptive study of children
who require tracheostomies. Applied Nursing Research. 2017;
34(1):62–65.

Spratling, R., Powers, E. Development of a data abstraction form:


Getting what you need from the electronic health record. Journal of
Pediatric Health Care. 2017; 31(1):126–130.

Waltz, C. F., Strickland, O. L., Lenz, E. R. Measurement in nursing


and health research, 5th ed. New York, NY: Springer Publishing
Company; 2017.

Yamada, J., Stevens, B., Sidani, S., Watt-Watson, J., De Silva, N.

496
Content validity of a process evaluation checklist to measure
intervention implementation fidelity of the EPIC Intervention.
Worldviews of Evidence- Based Nursing. 2010; 7(3):158–164.

497
CAPÍTULO 9

Análisis de
poblaciones y
muestras en
investigación
Susan K. Grove

La página web de la National Guideline Clearinghouse de la Agency for


Healthcare Research and Quality (AHRQ) se cerró en 2018. Puede
consultarse más información en https://www.ahrq.gov/.

ÍNDICE DEL CAPÍTULO

Comprensión de los conceptos clave de la teoría del


muestreo, 229
Representatividad de una muestra en investigación
cuantitativa, 231
Métodos de muestreo probabilístico, 237
Métodos de muestreo no probabilístico más utilizados en
investigación cuantitativa, 242

498
Tamaño de la muestra en estudios cuantitativos, 244
Muestreo en investigación cualitativa, 248
Tamaño de la muestra en estudios cualitativos, 251
Entornos de investigación, 254
Puntos clave, 256
Bibliografía, 257

OBJETIVOS DE APRENDIZAJE
Tras concluir este capítulo, el lector debería ser capaz de:
1. Describir la teoría del muestreo con sus conceptos relevantes.
2. Valorar críticamente los criterios de muestreo en los estudios
publicados.
3. Identificar el tipo(s) concreto(s) de métodos de muestreo
probabilístico y no probabilístico usados en estudios
cuantitativos y cualitativos.
4. Describir los aspectos del análisis de la potencia utilizado para
determinar el tamaño de la muestra en los estudios
seleccionados.
5. Valorar críticamente el tamaño de la muestra de estudios
cuantitativos y cualitativos.
6. Valorar críticamente los procesos de muestreo implementados
en estudios cuantitativos y cualitativos.
7. Valorar críticamente los entornos utilizados en estudios
cuantitativos y cualitativos.

Muchos de nosotros tenemos nociones preconcebidas sobre


muestra y muestreo, nociones adquiridas de anuncios de televisión,
encuestas de opinión pública, encuestas de internet e informes de
hallazgos de investigación. Un anunciante se jacta de que cuatro de
cada cinco médicos recomiendan un medicamento concreto, un

499
locutor anuncia que John Jones ganará las elecciones para el Senado
por un margen del 5%, una encuesta online informa de la
satisfacción de los pacientes con los profesionales de enfermería y
los investigadores concluyen que el tratamiento agresivo de la
hipertensión reduce significativamente el riesgo de cardiopatía
isquémica y de accidente cerebrovascular.
Todos estos ejemplos incluyen una técnica o método de muestreo.
Algunos de los resultados de estos métodos de muestreo son más
válidos que otros, según el método de muestreo utilizado y el
tamaño de la muestra obtenida. Este capítulo se ha elaborado para
ayudar a comprender y valorar críticamente los procesos de
muestreo aplicados en estudios cuantitativos y cualitativos.
Inicialmente, se presentan los conceptos de teoría del muestreo,
seguidos de los métodos de muestreo no probabilísticos y
probabilísticos usados con frecuencia en los estudios de enfermería.
Se detallan los tamaños de las muestras de estudios cuantitativos y
cualitativos. El capítulo concluye con un análisis de los entornos
naturales, de los parcialmente controlados y de los altamente
controlados utilizados en la realización de investigaciones.

COMPRENSIÓN DE LOS CONCEPTOS


CLAVE DE LA TEORÍA DEL
MUESTREO
El muestreo consiste en seleccionar un grupo de personas, eventos,
objetos u otros elementos con los que llevar a cabo un estudio. Un
método o plan de muestreo define el proceso de selección, y la
muestra define el grupo seleccionado de personas (o elementos). La
muestra seleccionada para un estudio debería representar a una
población identificada de personas. La población podría ser las
personas que tienen diabetes tipo 2, los pacientes que han sido
hospitalizados por neumonía o las personas que reciben atención
por un profesional de enfermería colegiado. Sin embargo, en la
mayoría de los casos sería imposible que los investigadores
estudien a toda una población. La teoría del muestreo fue elaborada
para determinar la forma más eficaz de adquirir una muestra que
refleje con exactitud la población en estudio. Los conceptos clave de

500
la teoría del muestreo se describen en las siguientes secciones, que
incluyen ejemplos relevantes de estudios publicados.

Poblaciones y elementos
La población es un grupo particular de personas o elementos que
se van a estudiar, como pacientes con insuficiencia cardiaca o
catéteres intravenosos. La población diana es todo el conjunto de
individuos o elementos que cumplen los criterios del muestreo
(definidos en la siguiente sección), como varones adultos de 18 años
o mayores con diagnóstico de diabetes tipo 2 y hospitalizados con
una infección de una extremidad inferior. La figura 9.1 muestra la
relación entre la población, la población diana y la población
accesible en un estudio. Una población accesible es la parte de la
población diana a la que el investigador tiene un acceso razonable.
La población accesible podría incluir individuos en un estado,
ciudad, hospital o unidades de enfermería, como pacientes con
diabetes ingresados en un hospital de cuidados agudos en Dallas,
Texas. Los investigadores obtienen la muestra de una población
accesible mediante el uso de un método o plan de muestreo
particular, como el muestreo aleatorio simple. Las unidades
individuales de población y de una muestra se denominan
elementos. Un elemento puede ser una persona, evento, objeto o
cualquier otra unidad individual en estudio. Cuando los elementos
de un estudio son personas, se denominan participantes o sujetos.
El término participantes suele utilizarse en investigación de
enfermería.

501
FIG 9.1 Relación entre la población, la muestra y los
elementos de un estudio.

La generalización extiende los hallazgos de la muestra estudiada


a una población mayor. En estudios cuantitativos, los
investigadores obtienen una muestra de la población accesible para
generalizar los hallazgos obtenidos de la muestra a la población
accesible y, luego, de forma abstracta a la población diana (v. fig.
9.1). La calidad del estudio y la coherencia de los resultados de este
con los hallazgos de investigaciones previas en esta área influyen en
la magnitud de la generalización. Si un estudio es de alta calidad y
tiene resultados coherentes con investigaciones previas, entonces
los investigadores pueden confiar en la generalización de los
hallazgos a la población diana. Por ejemplo, los hallazgos del
estudio de los pacientes varones con diagnóstico de diabetes tipo 2

502
y hospitalizados por una infección en Dallas pueden generalizarse a
la población diana de varones con diabetes tipo 2 ingresados en
hospitales urbanos de Texas o, de forma más generalizada, a
hospitales urbanos del sur de Estados Unidos. Con esta
información, se puede decidir si es adecuado utilizar esta evidencia
en el cuidado del mismo tipo de pacientes en la práctica clínica, con
el objetivo de avanzar hacia la práctica basada en la evidencia (PBE;
Brown, 2018; Melnyk, Gallagher-Ford, y Fineout-Overholt, 2017).

Criterios de muestreo o elegibilidad


Los criterios de muestreo o de elegibilidad incluyen la lista de las
características básicas para la elegibilidad o la pertenencia a la
población diana. Por ejemplo, los investigadores pueden optar por
estudiar el efecto de la enseñanza preoperatoria de la deambulación
precoz sobre los resultados de la duración de la estancia
hospitalaria en adultos sometidos a una artroplastia de rodilla. En
este estudio, los criterios de muestreo pueden incluir a adultos a
partir de 60 años, capaces de hablar y leer en inglés, y que se van a
someter a una artroplastia de rodilla. Los pacientes con
antecedentes de artroplastia de rodilla, con diagnóstico de
demencia o con enfermedades musculares crónicas debilitantes se
excluirán.
Los criterios de inclusión en la muestra son las características
que el participante o elemento del estudio debe poseer para formar
parte de la población diana. En el ejemplo previo, los criterios de
inclusión son los adultos a partir de 60 años, capaces de hablar y
leer en inglés, y que van a someterse a una artroplastia de rodilla.
Los criterios de exclusión en la muestra son aquellas características
que pueden hacer que una persona que cumple los criterios de
inclusión sea excluida o eliminada de la población diana. Por
ejemplo, cualquier participante del estudio con antecedentes de
artroplastia previa, un diagnóstico de demencia y una enfermedad
muscular crónica debilitante fue excluido del estudio de enseñanza
preoperatoria. Los investigadores debían establecer un criterio de la
muestra una sola vez y no debían usarlo como criterio tanto de
inclusión como de exclusión. Por ejemplo, los investigadores no
deberían considerar un criterio de inclusión el no tener diagnóstico

503
de demencia y un criterio de exclusión sí tenerlo.
Cuando se ha finalizado un estudio cuantitativo, los hallazgos
suelen generalizarse de la muestra a la población diana que reúne
los criterios de muestreo (Gray, Grove y Sutherland, 2017). Los
investigadores pueden definir estrechamente los criterios de
muestreo para hacer la muestra tan homogénea (o similar) como
sea posible para el control de variables externas. Por el contrario, el
investigador puede definir ampliamente los criterios para asegurar
que la muestra del estudio sea heterogénea, con un rango amplio
de los valores o puntuaciones de las variables en estudio. Si los
criterios de muestreo son demasiado estrechos y restrictivos, los
investigadores pueden tener dificultades para obtener una muestra
de tamaño adecuado de la población accesible, lo que puede limitar
la generalización de los hallazgos.
Los investigadores generalizan a veces los hallazgos de su
estudio más allá de los criterios de muestreo. Utilizando el ejemplo
del estudio de la enseñanza preoperatoria de la deambulación
precoz, la muestra tiene que limitarse a los participantes que hablen
y lean inglés, porque dicha enseñanza es en inglés y uno de los
instrumentos de medición requiere ser capaz de leer en dicho
idioma. Sin embargo, los investigadores pueden creer que los
resultados pueden generalizarse a personas que no hablen inglés.
Al leer los estudios, se deben considerar cuidadosamente las
implicaciones de utilizar estos resultados en una población de habla
no inglesa. Tal vez estas personas, puesto que proceden de otra
cultura, no respondan a la enseñanza de la misma forma que la
observada en la población del estudio. Al valorar críticamente un
estudio, se deben evaluar los criterios de inclusión y exclusión en la
muestra y determinar si la generalización de los hallazgos del
estudio es adecuada en función de estos criterios.

REPRESENTATIVIDAD DE UNA
MUESTRA EN INVESTIGACIÓN
CUANTITATIVA
Representatividad significa que la muestra, la población accesible y
la población diana son iguales en tantos aspectos como sea posible

504
(v. fig. 9.1). En investigación cuantitativa, se necesitará evaluar la
representatividad en relación con el entorno, las características de
los participantes y la distribución de los valores de las variables
medidas en el estudio. Las personas que buscan atención sanitaria
en un entorno concreto pueden ser diferentes de las que buscan
atención por el mismo problema en otros entornos o de las que
optan por utilizar el autocuidado para sobrellevar sus problemas.
Los estudios realizados en hospitales privados suelen ser menos
propensos a reclutar pacientes con bajos ingresos. Otros entornos
pueden tener menos ancianos o menos personas con menor nivel
académico. Las personas que no tienen acceso a la atención suelen
excluirse de los estudios. Los participantes atendidos en centros de
investigación y el tipo de atención que reciben son diferentes de los
pacientes y la atención que reciben en hospitales comunitarios,
hospitales públicos, hospitales de veteranos u hospitales rurales.
Las personas que viven en entornos rurales pueden responder de
forma diferente a un estado de salud a como lo harían las que viven
en entornos urbanos. Por tanto, el entorno identificado en un
estudio influye en la representatividad de la muestra. Los
investigadores que reúnen datos de participantes a través de
diversos entornos tienen una muestra más representativa de la
población diana que aquellos que limitan el estudio a un solo
entorno.
Una muestra debe ser representativa en términos de
características como la edad, el sexo, la etnicidad, los ingresos y el
nivel educativo, que a menudo influyen en las variables del estudio.
Estos son ejemplos de variables demográficas o atributos que
pueden ser seleccionados por los investigadores para su evaluación
en el estudio. Los investigadores analizan los datos recogidos de las
variables demográficas para crear las características de la muestra
(características utilizadas para proporcionar una imagen de la
muestra). Estas características de la muestra deben ser
razonablemente representativas de las características de la
población. Si el estudio incluye grupos, los participantes de los
grupos deben tener características demográficas comparables. El
capítulo 5 incluye más detalles sobre las variables demográficas y
las características de la muestra.
Los estudios que obtienen información de amplias bases de datos

505
tienen muestras más representativas. Por ejemplo, Muroi, Shen y
Angosta (2017, pág. 180) estaban preocupados por los errores de los
profesionales de enfermería relacionados con fármacos y analizaron
la «asociación de los errores de fármacos con las clasificaciones
farmacológicas, las unidades clínicas y las consecuencias de los
errores». La muestra incluyó informes de incidencia de errores
médicos (EM) que se extrajeron de una base de datos existente
desarrollada durante una investigación previa. La base de datos de
investigación incluyó información de «cinco hospitales de la región
del sudoeste de Estados Unidos (EE.UU.) desde noviembre de 2011
hasta julio de 2014… Se recogió un total de 2.336 observaciones (n =
1.276 en el grupo de casos de EM, n = 1.060 en el grupo control).
Nuestro estudio se centró en los 1.276 casos de EM en el grupo de
casos y excluyó el grupo control que no estaba relacionado con los
EM» (Muroi y cols., 2017, pág. 181).
Este estudio incluyó una muestra muy grande (n = 1.276
observaciones de EM) de varios hospitales del sudoeste de Estados
Unidos. Esta muestra de estudio era representativa de la población
accesible (informes de EM de cinco hospitales) y parecía
representativa de la población diana de informes de incidentes de
EM en la región del sudoeste de EE.UU. Muroi y cols. (2017)
observaron que los EM se asociaban con las clasificaciones
farmacológicas, las unidades clínicas y la consecuencia de los
errores. El máximo número de errores se produjo con los
anticoagulantes y la segunda causa más frecuente de errores
correspondió a los antimicrobianos. Las unidades
medicoquirúrgicas y de cuidados intensivos tenían la máxima
incidencia de EM y el 10% de los errores provocaban daños a los
pacientes.

Variación aleatoria y sistemática de los


valores de los participantes en los estudios
Los valores de medición también deben ser representativos. Estos
valores en un estudio suelen variar aleatoriamente entre los
participantes. La variación aleatoria es la diferencia esperada en los
valores que se produce cuando se examinan distintos participantes
de la misma muestra. La diferencia es aleatoria puesto que algunos

506
valores serán mayores y otros menores que el valor promedio
(media) de la población. A medida que aumenta el tamaño de la
muestra, la variación aleatoria disminuye, de modo que más
valores están más cerca de la media, lo que mejora la
representatividad.
La variación sistemática o sesgo sistemático es un problema
grave en el muestreo y se debe a la selección de participantes en el
estudio cuyos valores de medición difieren de alguna forma
específica de los de la población. Esta diferencia suele expresarse
como una diferencia en los valores promedio (o media) entre la
muestra y la población. Puesto que los participantes tienen algo en
común, sus valores tienden a ser similares a los de otros en la
muestra, pero diferentes de alguna forma a los de la población
general. Estos valores no varían aleatoriamente alrededor de la
media de la población. La mayor parte de la variación de la media
va en una misma dirección: es sistemática. Así, la media de la
muestra puede ser mayor o menor que la media de la población
diana. El aumento del tamaño de la muestra no afecta a la variación
sistemática. Por ejemplo, si todos los participantes en un estudio
que examina un determinado grado de nivel de conocimiento
tienen un cociente intelectual (CI) mayor de 120, entonces todos los
resultados de las pruebas en estudio probablemente sean superiores
a los de la media poblacional, que incluye a personas con una
amplia variación de sus puntuaciones de CI (pero con un CI medio
de 100). Los CI de los participantes en el estudio introducirán un
sesgo sistemático. Cuando se produce un sesgo sistemático en los
estudios cuasiexperimentales o experimentales, el investigador
puede concluir que el tratamiento ha producido una diferencia,
cuando en realidad los valores habrían sido distintos incluso sin
tratamiento.

Tasas de aceptación y de rechazo en los


estudios
La probabilidad de variación sistemática aumenta cuando el
proceso de muestreo no es aleatorio. Sin embargo, incluso en una
muestra aleatoria, puede producirse variación sistemática cuando
muchos participantes posibles rechazan participar. A medida que

507
aumenta el número de individuos que rechazan participar, también
lo hace la posibilidad de que exista un sesgo sistemático en el
estudio. En los estudios publicados, los investigadores pueden
identificar una tasa de rechazo, que es el porcentaje de personas
que rechazaron participar en el estudio y sus razones para no
participar (Grove y Cipher, 2017). La fórmula para calcular la tasa
de rechazo en un estudio es la siguiente:

Tasa de rechazo = (número de quienes rechazan


participar + número de quienes reúnen los criterios de
muestreo planteados) × 100%

Tasa de rechazo = (número de quienes rechazan


participar + número de quienes reúnen los criterios de
muestreo planteados) × 100%
Por ejemplo, si a 80 participantes posibles que reúnen los criterios
de muestreo se les ofrece participar en el hipotético estudio acerca
de los efectos de la enseñanza preoperatoria de una deambulación
precoz sobre la duración de la estancia hospitalaria y cuatro
pacientes se niegan, entonces la tasa de rechazo sería:

Tasa de rechazo = (4 ÷ 80) × 100% = 0,05 × 100% = 5%

Tasa de rechazo = (4 ÷ 80) × 100% = 0,05 × 100% = 5%


Otros estudios recogen la tasa de aceptación, que es el porcentaje
de participantes que reúnen los criterios de muestreo que
consienten participar en un estudio. Sin embargo, los
investigadores comunicarán la tasa de rechazo o de aceptación,
pero no ambas. La fórmula para calcular la tasa de aceptación en un
estudio es la siguiente:

Tasa de aceptación = (número de quienes rechazan


participar + número de quienes reúnen los criterios de
muestreo planteados) × 100%

508
Tasa de aceptación = (número de quienes rechazan
participar + número de quienes reúnen los criterios de
muestreo planteados) × 100%
En el hipotético estudio de la enseñanza preoperatoria, 4 de 80 de
los posibles participantes se negaron a participar, de modo que 80 –
4 = 76 aceptaron. Introduciendo los siguientes números en la
fórmula indicada, el resultado sería:

Tasa de aceptación = (76 ÷ 80) × 100% = 0,95 × 100% =


95%

Tasa de aceptación = (76 ÷ 80) × 100% = 0,95 × 100% =


95%
También pueden calcularse las tasas de aceptación y rechazo de
la siguiente manera:

Tasa de aceptación = 100% – tasa de rechazo

Tasa de aceptación = 100% – tasa de rechazo


o

Tasa de rechazo = 100% – tasa de aceptación

Tasa de rechazo = 100% – tasa de aceptación


En este ejemplo, la tasa de aceptación fue del 100% – 5% (tasa de
rechazo) = 95%, que es un punto fuerte del estudio. En los estudios
con una tasa de aceptación alta o una tasa de rechazo baja, la
posibilidad de variación sistemática es menor y es más probable
que la muestra sea más representativa de la población diana. Los
investigadores suelen indicar la tasa de rechazo y lo mejor sería
proporcionar las razones por las que las personas se niegan a
participar.

Tasas de abandono y de retención de la

509
muestra en estudios
La variación sistemática también puede producirse en estudios con
un alto abandono de la muestra. El abandono de la muestra es la
retirada o pérdida de participantes de un estudio que puede
expresarse como el número de participantes retirados del estudio o
como un porcentaje. El porcentaje es la tasa de reducción de la
muestra y sería conveniente que los investigadores incluyesen tanto
el número de participantes retirados como la tasa de abandono. La
fórmula para calcular la tasa de abandono en un estudio es la
siguiente:

Tasa de abandono de la muestra = (número de


participantes que abandonan el estudio ÷ tamaño de
la muestra del estudio) × 100%

Tasa de abandono de la muestra = (número de


participantes que abandonan el estudio ÷ tamaño de
la muestra del estudio) × 100%
Por ejemplo, en el hipotético estudio de la enseñanza
preoperatoria (n = 76), 31 sujetos (12 del grupo de tratamiento y 19
del grupo de comparación) abandonaron por diversas razones. La
pérdida de 31 sujetos significa una tasa de abandono del 41%:

Tasa de abandono de la muestra = (31÷76) × 100% =


0,408 × 100% = 40,8% = 41%

Tasa de abandono de la muestra = (31÷76) × 100% =


0,408 × 100% = 40,8% = 41%
En este ejemplo, la tasa total de abandono de la muestra fue
considerable (41%) y las tasas diferían entre los dos grupos a los
que fueron asignados los participantes. También se pueden calcular
las tasas de abandono de los grupos. Si los dos grupos fueron
iguales al inicio del estudio y cada uno incluyó 38 participantes,
entonces la tasa de abandono para el grupo de tratamiento fue de
(12 ÷ 38) × 100% = 0,316 × 100% = 31,6% = 32%. El abandono en el

510
grupo de comparación fue de (19 ÷ 38) × 100% = 0,50 × 100% = 50%.
La variación sistemática será máxima cuando un gran número de
participantes abandone el estudio antes de completarse la recogida
de datos o cuando un gran número de participantes abandone un
grupo del estudio, pero no el otro u otros. En estudios que incluyen
un tratamiento, los participantes en el grupo de comparación que
no reciben el tratamiento pueden ser más propensos a abandonar el
estudio. Sin embargo, a veces el abandono es mayor en el grupo de
tratamiento si la intervención es compleja y/o requiere mucho
tiempo (Gray y cols., 2017). En el ejemplo previo de la enseñanza
preoperatoria de la deambulación precoz, hay una alta posibilidad
de variación sistemática debido a que la tasa de abandono de la
muestra fue elevada (41%) y la tasa de abandono en el grupo de
comparación (50%) fue mayor que la del grupo de tratamiento
(32%). La mayor posibilidad de variación sistemática produce una
muestra menos representativa de la población diana.
Lo contrario del abandono de la muestra es la retención de la
muestra, que es el número de participantes que permanecen en un
estudio y lo completan. Se puede calcular la tasa de retención de la
muestra de dos formas:

Tasa de retención de la muestra = (número de


participantes que completan el estudio ÷ tamaño de la
muestra) × 100%

Tasa de retención de la muestra = (número de


participantes que completan el estudio ÷ tamaño de la
muestra) × 100%
o

Tasa de retención de la muestra = 100% – tasa de


abandono de la muestra

Tasa de retención de la muestra = 100% – tasa de


abandono de la muestra
En el ejemplo, el estudio de la enseñanza preoperatoria de la

511
deambulación precoz que tenía una muestra original de 76
participantes, 45 participantes permanecieron en el estudio:

Tasa de retención de la muestra = (45 ÷ 76) × 100% =


0,592 × 100% = 59,2% = 59%

Tasa de retención de la muestra = (45 ÷ 76) × 100% =


0,592 × 100% = 59,2% = 59%
o

Tasa de retención de la muestra = 100% – 41% = 59%

Tasa de retención de la muestra = 100% – 41% = 59%


Cuanto mayor sea la tasa de retención, más representativa será la
muestra de la población diana y habrá una probabilidad mayor de
que los resultados del estudio sean un fiel reflejo de la realidad. A
menudo, los investigadores comunicarán la tasa de abandono o de
retención, pero no ambas. Es mejor proporcionar la tasa y el
número de participantes que abandonaron el estudio, así como las
razones de su abandono. Además, los investigadores deben
proporcionar las explicaciones del abandono de los participantes
para determinar el impacto sobre los hallazgos del estudio.

GUÍAS DE VALORACIÓN CRÍTICA


Adecuación de las poblaciones, criterios de
muestreo, tasas de rechazo y tasas de
abandono en los estudios cuantitativos
Cuando se realice una valoración crítica inicial del proceso de
muestreo en los estudios cuantitativos, se deben plantear las
siguientes preguntas:

1. ¿Ha definido el investigador las poblaciones diana y accesible


del estudio?
2. ¿Se identifican claramente y son adecuados para el estudio los

512
criterios de inclusión, de exclusión o ambos?
3. ¿Está bien identificada en el estudio la tasa de rechazo o la de
aceptación? ¿Se explica la tasa de abandono o de retención
de la muestra? ¿Se proporcionan las razones para las tasas de
rechazo y de abandono?

Newnam y cols. (2015) implementaron un diseño de estudio


experimental aleatorizado para identificar las diferencias de
frecuencia y gravedad de las lesiones nasales en recién nacidos de
muy bajo peso al nacer que recibían tratamiento con presión
positiva continua en la vía aérea (CPAP, continuous positive airway
pressure). El estudio incluyó a 78 recién nacidos (tamaño muestral)
en una unidad de cuidados intensivos neonatales (UCIN) de nivel
III con 70 camas, que recibían CPAP nasal y que fueron
«distribuidos de forma aleatoria en tres grupos: cánula nasal
continua, mascarilla nasal continua o alternancia de mascarilla y
cánula cada 4 horas» (Newnam y cols., 2015, pág. 37). Estos
investigadores proporcionaron una descripción de los criterios de
muestreo del estudio y documentaron los participantes
seleccionados en el estudio usando un diagrama de flujo (v. fig. 1 en
el Ejemplo de investigación 9.1). Este diagrama de flujo se basa en
la declaración CONsolidated Standards of Reporting Trials
(CONSORT), que constituye el estándar internacional para
comunicar el proceso de muestreo de los ensayos controlados
aleatorizados (ECA; CONSORT Group, 2010). La población, los
criterios de inclusión y exclusión, las tasas de rechazo y de
abandono, así como la representatividad de esta muestra se
describen en el Ejemplo de investigación 9.1. Los aspectos
particulares de la muestra se han identificado entre [corchetes] por
razones de claridad. El método de muestreo, el tamaño de la
muestra y el entorno del estudio de Newnam y cols. (2015) se
describen más adelante en este capítulo.

EJEMPLO DE INVESTIGACIÓN 9.1


Adecuación del proceso de muestreo en los
estudios cuantitativos

513
Extracto del estudio de investigación
Todos los lactantes ingresados en la UCIN entre abril de 2012 y enero
de 2013 se evaluaron para ver si cumplían los criterios de inclusión,
consistentes en ser un lactante prematuro con un peso al nacer (PN)
de 500-1.500 gramos que requiriese tratamiento de CPAP nasal. Los
criterios de exclusión fueron: lactantes nacidos con anomalías de la
vía aérea o físicas que influyesen en su capacidad de ser extubados y
pasar a la CPAP nasal, lactantes en quien no pudo obtenerse el
consentimiento en las primeras 8 horas tras el inicio de la CPAP
nasal, lactantes no tratados con CPAP nasal o lactantes que tuviesen
lesiones de la piel nasal en el momento de la inclusión [población
diana]…

Un total de 377 ingresos [población accesible] en la UCIN [entorno]


se evaluaron para determinar su elegibilidad durante el periodo del
estudio. De ellos, 140 pacientes cumplieron los criterios de PN de
500-1.500 g. En dos pacientes se diagnosticó una deformidad de la vía
aérea, por lo que fueron excluidos. El consentimiento parental se
obtuvo en 90 lactantes (65%). Dos progenitores rechazaron que su
lactante participase en el estudio (1%). Catorce (10%) fallecieron
antes de que se obtuviese el consentimiento y 32 (23%) se perdieron.
Por lo general, se trataba de lactantes que fueron ingresados con
CPAP nasal o rápidamente extubados, con una capacidad limitada
para obtener el consentimiento en el límite temporal de 8 horas (v. fig.
1). (Newnam y cols., 2015, págs. 37-38)

Valoración crítica
Newnam y cols. (2015) describieron con claridad los criterios de
inclusión y exclusión que se habían utilizado en la muestra para
identificar la población diana de este estudio. La selección de los
recién nacidos con estos criterios de muestreo se detalla en la figura
1. Se evaluaron muchos recién nacidos (n = 377) y un número
adecuado de ellos (n = 138) cumplió los criterios de inclusión y
exclusión. Los criterios de muestreo fueron adecuados para el
propósito de este estudio con el objeto de reducir los efectos de las

514
posibles variables externas que pudiesen afectar a los métodos de
aplicación del tratamiento de CPAP (mascarilla o cánula nasal) y a
la medición de las variables dependientes (frecuencia y gravedad
de las lesiones nasales). Los estrictos controles impuestos por los
criterios de muestreo fortalecieron la probabilidad de que los
resultados del estudio fueran debidos al tratamiento y no a
variables externas o a error de muestreo.
La tasa de rechazo fue mínima (1%) y las otras razones para no
incluir a recién nacidos en el estudio se describieron con claridad y
fueron adecuadas. La muestra final incluyó a 78 recién nacidos que
se distribuyeron de forma aleatoria al grupo de mascarilla (n = 35),
al grupo de cánula (n = 21) y al grupo de alternancia entre
mascarilla y cánula (n = 22; v. fig. 1). El estudio no tuvo abandono
de participantes porque los tamaños de los grupos no variaron
durante su realización. Los sólidos criterios de muestreo y las bajas
tasas de rechazo y de abandono aumentaron la representatividad
de esta muestra. Newnam y cols. (2015) observaron que los recién
nacidos del grupo de alternancia de la CPAP entre mascarilla y
cánula nasales tenían una incidencia significativamente menor de
lesiones cutáneas que los que recibían CPAP por mascarilla o
cánula solo.

515
FIG 1 Tabla CONSORT para la selección y el
reclutamiento de un estudio. CPAP, presión positiva
continua en la vía aérea; UCIN, unidad de cuidados

516
intensivos neonatales. (Adaptada de Newnam, K. M.,
McGrath, J. M., Salyer, J., Estes, T., Jallo, N. y Bass, T. [2015]. A
comparative effectiveness study of continuous positive airway
pressure-related skin breakdown when using different nasal
interfaces in the extremely low birth weight neonate. Applied
Nursing Research, 28[1], 37.)

Marco de muestreo
Desde la perspectiva de la teoría del muestreo, cada persona o
elemento de la población debe tener la oportunidad de ser
seleccionado para una muestra. Un método que ofrece esta
oportunidad se denomina muestreo aleatorio. Para que todos los
miembros de la población accesible puedan tener la oportunidad de
ser seleccionados en una muestra, cada persona de la población
debe estar identificada. Para lograr este objetivo, el investigador
debe adquirir una lista de todos los miembros de la población,
utilizando los criterios de muestreo para definir la elegibilidad. Esta
lista se denomina marco de muestreo. En algunos estudios, el
marco de muestreo completo no puede ser identificado porque no
es posible enumerar a todos los miembros de la población. La
Health Insurance Portability and Accountability Act (HIPAA)
también ha aumentado la dificultad para obtener el marco de
muestreo completo de muchos estudios debido a sus requisitos
para proteger la información de la salud de las personas (v. más
información sobre la HIPAA en el cap. 4). Una vez que se identifica
un marco de muestreo, los investigadores seleccionan a los
participantes para sus estudios utilizando un plan o método de
muestreo.

Método o plan de muestreo


Los métodos o planes de muestreo describen las estrategias
utilizadas para obtener las muestras para los estudios. Al igual que
un diseño, un plan de muestreo no es específico de un estudio. El
plan de muestreo puede ser probabilístico (aleatorio) o no
probabilístico (no aleatorio). Los métodos de muestreo
probabilísticos están diseñados para aumentar la representatividad

517
y disminuir la variación o sesgo sistemático en estudios
cuantitativos. Al valorar críticamente un estudio, hay que
identificar si su plan de muestreo es probabilístico o no
probabilístico, y determinar el método o métodos específicos
utilizados para seleccionar la muestra. A continuación, se presentan
los diferentes tipos de métodos de muestreo probabilístico y no
probabilístico.

MÉTODOS DE MUESTREO
PROBABILÍSTICO
En el muestreo probabilístico, cada persona o elemento de una
población tiene la misma posibilidad de ser seleccionado para una
muestra, que se consigue con un muestreo aleatorio. Los métodos
de muestreo probabilístico o aleatorio aumentan la
representatividad de la muestra de la población diana. Todos los
subgrupos de población, que pueden diferir entre sí, pero que
contribuyen en la medición de los parámetros (p. ej., medias y
desviaciones estándar) de la población, tienen posibilidad de estar
representados en la muestra. La posibilidad de producirse un sesgo
sistemático es menor cuando los participantes se seleccionan
aleatoriamente, aunque puede que se produzca un sesgo
sistemático.
Sin las estrategias de muestreo aleatorio, los investigadores, que
están muy interesados en el estudio, podrían tender (consciente o
inconscientemente) a seleccionar individuos cuyas condiciones o
conductas sean coherentes con las hipótesis del estudio. Por
ejemplo, los investigadores pueden excluir a participantes
potenciales porque estén demasiado enfermos o no lo suficiente,
que afronten muy bien la enfermedad o no la afronten de manera
adecuada, que no cooperen o que no cumplan las normas. Sin
embargo, mediante el uso de un muestreo aleatorio, los
investigadores dejan la selección al azar, aumentando así la validez
de los hallazgos de su estudio.
En este libro se presentan cuatro diseños de muestreo que
permiten un muestreo probabilístico: muestreo aleatorio simple,
muestreo aleatorio estratificado, muestreo por conglomerados y

518
muestreo sistemático. La tabla 9.1 presenta los métodos de
muestreo probabilísticos y no probabilísticos más utilizados en
estudios de enfermería, sus aplicaciones y su representatividad
para el estudio. Los métodos de muestreo probabilísticos y no
probabilísticos se emplean en estudios cuantitativos (Kerlinger y
Lee, 2000), y los métodos de muestreo no probabilístico se utilizan
en estudios cualitativos (Creswell y Poth, 2018).

TABLA 9.1
MÉTODOS DE MUESTREO PROBABILÍSTICO Y NO
PROBABILÍSTICO

Muestreo aleatorio simple


El muestreo aleatorio simple es el más básico de los métodos de
muestreo probabilístico. Se obtiene seleccionando aleatoriamente
los elementos del marco de muestreo. Los investigadores pueden

519
realizar la selección aleatoria de muchas maneras, solo limitadas
por su imaginación. Si el marco de muestreo es pequeño, los
investigadores pueden escribir nombres en papelitos, colocarlos en
un recipiente, mezclarlos bien y luego sacarlos de uno en uno hasta
que hayan alcanzado el tamaño muestral deseado. El método más
frecuente para la selección aleatoria de los participantes de un
estudio es el uso de un programa informático. El investigador
puede introducir el marco de muestreo (lista de participantes
posibles) en un ordenador, para que luego este seleccione
aleatoriamente a los participantes hasta lograr el tamaño de la
muestra deseado.
Otro método para seleccionar aleatoriamente la muestra de un
estudio es el uso de una tabla de números aleatorios. La tabla 9.2
muestra una sección de una tabla de números aleatorios. Para
utilizar una tabla de números aleatorios, el investigador pondrá un
lápiz o su dedo sobre la tabla con los ojos cerrados. El número
obtenido será el punto de partida. Luego, moviendo el lápiz o el
dedo hacia arriba, abajo, a la derecha o a la izquierda, se ordenan
los números hasta que se obtiene el tamaño de la muestra deseado.
Por ejemplo, si se desea seleccionar a cinco participantes de una
población de 100 y el número 58 fue seleccionado inicialmente
como un punto de partida (cuarta columna de la izquierda, cuarta
fila hacia abajo), los números de los participantes serían 58, 25, 15,
55 y 38. La tabla 9.2 es útil solo cuando el número de la población
sea inferior a 100. Se pueden crear tablas de números aleatorios
online con una opción para seleccionar una muestra aleatoria a
partir de la tabla usando un programa como QuickCalcs (v.
http://graphpad.com/quickcalcs/randomN2/).

TABLA 9.2
SECCIÓN DE UNA TABLA DE NÚMEROS ALEATORIOS

Lee, Faucett, Gillen, Krause y Landry (2013) realizaron un estudio

520
de correlación predictivo para determinar la percepción del riesgo
de lesión musculoesquelética (MEQ) en profesionales de enfermería
de unidades de cuidados críticos. Los investigadores seleccionaron
aleatoriamente a 1.000 profesionales de enfermería que trabajaban
en dichas unidades de la lista de miembros (marco de muestreo) de
la American Association of Critical-Care (AACN) de 2005. Los
investigadores describieron su método de muestreo en el Ejemplo
de investigación 9.2.

EJEMPLO DE INVESTIGACIÓN 9.2


Muestreo aleatorio simple
Extracto del estudio de investigación
Un total de 412 profesionales de enfermería devolvieron los cuestionarios
rellenos (tasa de respuesta = 41,5%, excluyendo ocho cuyas direcciones
postales fueron incorrectas). De estos, 47 profesionales de enfermería no
cumplieron los criterios de inclusión y fueron excluidos: no trabajaban
actualmente (n = 5); no trabajaban en un hospital (n = 1); no trabajaban
en cuidados críticos (n = 8); no trabajaban como profesionales de
enfermería (n = 28), o no realizaban tareas de manipulación de pacientes
(n = 5). Además, cuatro profesionales de enfermería empleados en una
UCI neonatal (UCIN) fueron excluidos debido a la diferente naturaleza de
su carga de trabajo físico. La muestra final para el análisis de datos estaba
compuesta por 361 [tamaño de la muestra] profesionales de enfermería
que trabajaban en cuidados críticos. (Lee y cols., 2013, pág. 38)
Valoración crítica
Lee y cols. (2013) identificaron claramente el método de muestreo
aleatorio que utilizaron para seleccionar a los participantes del
estudio de una población de profesionales de enfermería que
trabajaban en cuidados críticos. La tasa de respuesta del 41,5% a los
cuestionarios enviados por correo se considera adecuada, debido a
que la tasa media de respuesta a cuestionarios es del 25-50% (Gray
y cols., 2017). Fueron excluidos 47 profesionales de enfermería que
no cumplían los criterios de la muestra y cuatro que trabajaban en
una UCIN, lo que garantizó una muestra más homogénea y

521
disminuyó el posible efecto de variables externas. Estas actividades
de muestreo limitan la posibilidad de variación o sesgo sistemático
y aumentan la probabilidad de que la muestra del estudio sea
representativa de las poblaciones accesible y diana. El estudio se
habría fortalecido si los investigadores hubieran indicado cómo
fueron seleccionados aleatoriamente los profesionales de
enfermería de la lista de miembros de la AACN, aunque
probablemente fue una selección aleatoria realizada por un
ordenador.
Lee y cols. (2013, pág. 43) llegaron con su estudio a las siguientes
conclusiones: «La mejora del entorno de trabajo físico y psicosocial
permite hacer más seguros los trabajos de enfermería, reducir el
riesgo de lesiones MEQ y mejorar la percepción de seguridad en el
trabajo de los profesionales de enfermería. En última instancia,
estos esfuerzos contribuirán a mejorar la seguridad en el entorno
de trabajo y a mantener un personal de enfermería saludable.

Muestreo aleatorio estratificado


El muestreo aleatorio estratificado se usa en situaciones en las que
el investigador conoce algunas de las variables de la población que
son críticas para lograr la representatividad. Las variables
empleadas con frecuencia en la estratificación son la edad, el sexo,
la raza y el origen étnico, el nivel socioeconómico, el diagnóstico, la
región geográfica, el tipo de cuidados de enfermería, así como el
lugar de la atención. La estratificación asegura que todos los niveles
de las variables identificadas estén adecuadamente representados
en la muestra. Con la estratificación, los investigadores pueden usar
un tamaño muestral menor para obtener el mismo grado de
representatividad en relación con la variable estratificada que el que
se obtiene mediante el uso de una muestra mayor adquirida por un
muestreo aleatorio simple.
Si los investigadores han utilizado la estratificación, deben definir
las categorías (estratos) de las variables seleccionadas para la
estratificación en el informe publicado. Por ejemplo, si se emplea la
raza y la etnicidad para la estratificación, el investigador puede
definir cuatro estratos: blancos no hispanos, afroamericanos,
hispanos y otros. El 60% de la población puede ser blanca no

522
hispana; el 20%, afroamericana; el 15%, hispana, y el 5%, de otro
origen. Los investigadores pueden seleccionar una muestra
aleatoria de cada estrato, equivalente a las proporciones de la
población diana de ese estrato. Por tanto, una muestra de 100
participantes necesitaría incluir alrededor de 60 blancos no
hispanos, 20 afroamericanos, 15 hispanos y 5 de otros orígenes. Por
otra parte, se puede seleccionar el mismo número de participantes
aleatoriamente para cada estrato. Por ejemplo, si la edad se utiliza
para estratificar una muestra de 100 participantes adultos, el
investigador puede obtener 25 sujetos de 18-34 años, 25 de 35-50
años, 25 de 51-66 años y 25 mayores de 66 años. Si los números de
los participantes en el estudio en cada grupo fuesen iguales, los
grupos más pequeños estarían sobrerrepresentados, lo que puede
crear un error de muestreo.
Lee y cols. (2016, pág. 84) realizaron un estudio de correlación
predictivo «para aclarar la asociación de la combinación de comer
deprisa (CD), cenar tarde (CT) y saltarse el desayuno (SD) con el
hecho de tener sobrepeso». Las variables independientes de CD, CT
y SD se usaron para predecir la variable dependiente de tener
sobrepeso. Este estudio incluyó una muestra aleatoria estratificada
que se describe en el Ejemplo de investigación 9.3.

EJEMPLO DE INVESTIGACIÓN 9.3


Muestreo aleatorio estratificado
Extracto del estudio de investigación
Se realizó una encuesta transversal en octubre de 2011… Se utilizó
un método de muestreo aleatorio estratificado entre los residentes de
20-80 años por estratos de sexo y de grupos de edad de 5 años, para
seleccionar a 5.002 residentes (5,0%) a partir del Basic Resident
Register el 31 de marzo de 2010… Se remitió por correo una carta y
un cuestionario a los residentes. La carta incluía la presentación del
estudio y sus fines, la garantía del anonimato y la solicitud para la
participación. Después de 2 semanas, unos voluntarios visitaron cada
domicilio para recoger los sobres cerrados; 4.570 personas (91,4%)

523
devolvieron los cuestionarios. (Lee y cols., 2016, pág. 85)

Valoración crítica
Lee y cols. (2016) identificaron claramente que su población eran
individuos del Basic Resident Register, que es una base de datos
nacional. El estudio incluyó una muestra amplia (n = 5.002) y el
cuestionario utilizado para medir las variables tuvo una tasa de
respuesta muy elevada (91,4%). La estratificación por sexo y
grupos de edad cada 5 años parecía importante en este estudio
para controlar variables externas que podrían afectar al peso de los
individuos. Sin embargo, los investigadores debían proporcionar
más detalles sobre el proceso de estratificación y los números de
participantes en los estratos de edad y sexo. Una encuesta
transversal también aumentó la representatividad de la muestra (v.
cap. 8 sobre el diseño). En resumen, este estudio incluyó un
método de muestreo aleatorio estratificado sólido, un tamaño
muestral amplio y una tasa de respuesta alta de los cuestionarios,
que aumentó la representatividad de la muestra y disminuyó la
posibilidad de error o de sesgo sistemático.
Lee y cols. (2016) observaron que solo CD o CD junto con CT y
SD eran predictivos de tener sobrepeso. CT y SD de forma aislada
no aumentaban el riesgo de tener sobrepeso. Se necesitan más
investigaciones en esta área, pero los pacientes podrían
beneficiarse de la educación sobre comer despacio para reducir su
riesgo de tener sobrepeso.

Muestreo por conglomerados


En el muestreo por conglomerados, el investigador desarrolla un
marco de muestreo que incluye una lista de todos los estados,
ciudades, instituciones o clínicos con los que pueden relacionarse
los elementos de la población identificada. Puede utilizarse en el
estudio una muestra aleatoria de estos estados, ciudades,
instituciones o clínicos. En algunos casos, esta selección aleatoria
continúa con varias etapas y se denomina entonces muestreo de
etapas múltiples. Por ejemplo, el investigador puede primero
seleccionar aleatoriamente los estados y luego seleccionar
aleatoriamente ciudades dentro de los estados incluidos en la

524
muestra. A continuación, el investigador puede seleccionar
aleatoriamente los hospitales dentro de las ciudades escogidas al
azar. Dentro de los hospitales, se pueden seleccionar aleatoriamente
las unidades de enfermería. A este nivel, todos los pacientes de la
unidad de enfermería que se ajustan a los criterios del estudio
pueden ser incluidos o los pacientes pueden ser seleccionados
aleatoriamente.
El muestreo por conglomerados se utiliza frecuentemente en dos
situaciones de investigación. En la primera, el investigador
considera que es necesario obtener una muestra geográficamente
dispersa, pero reconoce que la obtención de una muestra aleatoria
simple requerirá mucho tiempo y gastos de viaje. En la segunda, el
investigador no puede identificar los elementos individuales que
componen la población y, por tanto, no puede desarrollar un marco
de muestreo. Por ejemplo, no existe una lista completa de todas las
personas de Estados Unidos que hayan sido sometidas a una
cirugía a corazón abierto. Sin embargo, a menudo es posible
obtener una lista de las instituciones u organizaciones con las que
los elementos de interés estén asociados (en este ejemplo, tal vez los
grandes centros médicos, hospitales universitarios con
departamentos de cirugía cardiaca y grandes clínicas de cirugía
cardiaca) y después seleccionar aleatoriamente las instituciones de
las que el investigador pueda incluir los participantes.
Reinke y cols. (2017, pág. 30) utilizaron el muestreo por
conglomerados en su estudio del «impacto a largo plazo de una
intervención de comunicación con pacientes terminales en
veteranos con EPOC [enfermedad pulmonar obstructiva crónica]».
Estos investigadores describieron su método de muestreo en el
Ejemplo de investigación 9.4 y los aspectos particulares de la
muestra se han identificado entre [corchetes].

EJEMPLO DE INVESTIGACIÓN 9.4


Muestreo por conglomerados
Extracto del estudio de investigación

525
Realizamos un ensayo aleatorizado por conglomerados para evaluar
las conversaciones sobre la planificación anticipada de la atención y
los objetivos asistenciales… La unidad de aleatorización estaba a nivel
del clínico y los pacientes se agruparon por función del mismo clínico
[muestreo por conglomerados]… El estudio se realizó en el Puget
Sound Health Care System de la AV [entorno]… Los subgrupos
incluyeron a pacientes con EPOC [población]… que participaron en
el ensayo End-of-Life Communication (comunicación al final de la
vida) y que fallecieron después de la finalización del estudio (n = 157)
[tamaño muestral]… Analizamos si la intervención de comunicación
dio lugar a más conversaciones y a más documentación de planes de
cuidados anticipados en la historia clínica antes del fallecimiento.
(Reinke y cols., 2017, pág. 31)

Valoración crítica
Reinke y cols. (2017) indicaron que utilizaron un método de
muestreo por conglomerados aleatorizado para identificar a los
participantes en el estudio. La población de veteranos con EPOC
era apropiada para el propósito de este estudio. El estudio se
realizó en un sistema sanitario de la Veterans’ Administration
(VA), lo que indica que fue multicéntrico. El tamaño de la muestra
podría haber sido inadecuado, porque los hallazgos no fueron
significativos. Los investigadores observaron que la intervención
no aumentó la documentación de las conversaciones en pacientes
terminales, «ni mejoró la documentación de las directivas
avanzadas» (Reinke y cols., 2017, pág. 30). Se necesitan más
investigaciones en esta área con muestras más amplias y más
representativas con el fin de determinar la eficacia de esta
intervención en pacientes terminales.

Muestreo sistemático
El muestreo sistemático se utiliza cuando existe una lista ordenada
de todos los miembros de la población. El proceso implica la
selección de cada k.° individuo de la lista, utilizando un punto de
partida seleccionado aleatoriamente. Si el punto de partida inicial
no es aleatorio, la muestra es no aleatoria o no probabilística. Para

526
utilizar este diseño, el investigador debe conocer el número de
elementos de la población y el tamaño de la muestra deseado. El
tamaño de la población se divide entre el tamaño de la muestra
deseado, siendo k el tamaño del intervalo entre los elementos
seleccionados de la lista. Por ejemplo, si el tamaño de la población
es N = 1.200 y el tamaño de la muestra deseado es n = 100, entonces
k = 12. De esta manera, el investigador debería incluir cada
duodécima persona de la lista en la muestra. Este valor puede
obtenerse utilizando la siguiente fórmula:

k = tamaño de la población ÷ tamaño de la muestra


deseado

k = tamaño de la población ÷ tamaño de la muestra


deseado
Por ejemplo,

k = 1.200 participantes en la población ÷ tamaño de la


muestra deseado de 100 = 12

k = 1.200 participantes en la población ÷ tamaño de la


muestra deseado de 100 = 12
Hay quien ha argumentado que este procedimiento en realidad
no da a todos los elementos de la población la misma posibilidad de
ser incluidos en la muestra y no proporciona una muestra más
representativa que la del muestreo aleatorio simple y el muestreo
aleatorio estratificado. El muestreo sistemático proporciona una
posibilidad aleatoria, pero no igual, de inclusión de participantes en
un estudio (v. tabla 9.1; Kerlinger y Lee, 2000).
De Silva, Hanwella y de Silva (2012) utilizaron el muestreo
sistemático en su estudio sobre los costes directos e indirectos de la
atención que reciben los pacientes con esquizofrenia (población) en
una unidad psiquiátrica de tercer nivel. El Ejemplo de investigación
9.5 describe su proceso de muestreo.

527
EJEMPLO DE INVESTIGACIÓN 9.5
Muestreo sistemático
Extracto del estudio de investigación
El muestreo sistemático [método de muestreo] seleccionó cada segundo
paciente con un diagnóstico clínico CIE-10 [Clasificación Internacional de
Enfermedades 10] de esquizofrenia [población diana] asistido en la clínica
durante un periodo de 2 meses [marco de muestreo]…. La muestra
incluyó a 91 pacientes [tamaño de la muestra]. El coste directo se definió
como el coste originado por el paciente (gastos de bolsillo) para su atención
ambulatoria. (De Silva, y cols., 2012, pág. 14)
Valoración crítica
De Silva y cols. (2012) identificaron claramente que su proceso de
muestreo era sistemático. La población y la población diana fueron
adecuadas para este estudio. La utilización del muestreo
sistemático aumentó la representatividad de la muestra y el
tamaño de la muestra de 91 pacientes esquizofrénicos pareció
adecuado para el enfoque de este estudio. Sin embargo, en el
marco de muestreo se incluyó solo a los pacientes que fueron
asistidos durante más de 2 meses y la k fue pequeña en este estudio
(cada segundo paciente), lo que limita la representatividad de la
muestra. Los investigadores podrían haber proporcionado más
detalles sobre la forma en que aplicaron el método de muestreo
sistemático para asegurar que el inicio del proceso de muestreo
fuese aleatorio (Gray y cols., 2017).
De Silva y cols. (2012, pág. 14) llegaron a la conclusión de que «a
pesar del bajo coste directo de la atención, los costes indirectos y el
coste del tratamiento informal ocasionaban un impacto económico
importante para los pacientes y sus familias. Se recomienda que
debería proporcionarse apoyo económico a pacientes con
enfermedades incapacitantes, como la esquizofrenia, especialmente
cuando los pacientes no pueden desempeñar un trabajo a tiempo
completo».

528
MÉTODOS DE MUESTREO NO
PROBABILÍSTICO MÁS UTILIZADOS
EN INVESTIGACIÓN CUANTITATIVA
En el muestreo no probabilístico, no todos los elementos de una
población tienen la oportunidad de ser seleccionados para la
muestra de un estudio. Aunque este enfoque disminuye la
representatividad de una muestra obtenida de una población diana,
se utiliza frecuentemente en estudios de enfermería debido al
número limitado de pacientes disponibles para la investigación.
Hay que ser capaces de discriminar los métodos frecuentes de
muestreo no probabilístico utilizados en los estudios de enfermería,
que incluyen el muestreo por conveniencia, el muestreo por cuotas,
el muestreo deliberado o intencional, el muestreo por redes y el
muestreo teórico. El muestreo por conveniencia se utiliza sobre
todo en estudios cuantitativos y cualitativos. El muestreo por cuotas
se emplea ocasionalmente en estudios cuantitativos. Los muestreos
intencional, por redes y teórico se utilizan con más frecuencia en la
investigación cualitativa y se analizan posteriormente en este
capítulo. La tabla 9.1 proporciona una lista de las aplicaciones
frecuentes de estos métodos de muestreo, la representatividad
alcanzada en los estudios cuantitativos, así como la profundidad y
la abundancia de los hallazgos en los estudios cualitativos.

Muestreo por conveniencia


El muestreo por conveniencia, también denominado muestreo
accidental, es un método relativamente débil, ya que proporciona
pocas posibilidades para controlar los sesgos; los participantes se
incluyen en el estudio por el mero hecho de encontrarse en el lugar
correcto en el momento adecuado (Gray y cols., 2017). Un aula de
estudiantes, pacientes que acuden a una clínica específica, personas
que asisten a un grupo de apoyo y pacientes hospitalizados con
diagnósticos médicos particulares son ejemplos de muestras de
conveniencia. El investigador simplemente introduce a los
participantes disponibles en el estudio hasta que alcanza el tamaño
muestral deseado. Pueden existir múltiples sesgos en la muestra,

529
algunos de los cuales pueden ser sutiles y no reconocibles. Sin
embargo, los sesgos graves no siempre están presentes en las
muestras de conveniencia. Según Kerlinger y Lee (2000), una
muestra de conveniencia es aceptable cuando se usa con un
conocimiento y cuidado razonables al aplicarse en un estudio.
Las muestras de conveniencia son baratas y accesibles y, por lo
general, se invierte menos tiempo en obtener este tipo de muestras
que otros. Este tipo de muestreo proporciona un medio para llevar
a cabo estudios sobre intervenciones de enfermería cuando los
investigadores no pueden utilizar métodos de muestreo
probabilísticos. El muestreo probabilístico o aleatorio no es posible
cuando el grupo de pacientes potenciales es limitado. Los
investigadores a menudo piensan que lo mejor es incluir a todos los
pacientes que cumplen los criterios de la muestra, para aumentar su
tamaño.
Muchos investigadores están llevando a cabo estudios
cuasiexperimentales y ECA en enfermería y medicina que incluyen
un método de muestreo por conveniencia. El diseño del estudio se
refuerza cuando los participantes obtenidos mediante muestreo por
conveniencia se asignan al azar a los grupos (v. cap. 8). La
asignación aleatoria a un grupo, que no es un método de muestreo
sino una estrategia de diseño, no altera el riesgo de sesgos
resultantes del muestreo por conveniencia, pero fortalece la
equivalencia de los grupos de estudio. Para fortalecer la
representatividad de una muestra, los investigadores a menudo
aumentan su tamaño para los ensayos clínicos (Ruffano, Dinnes,
Sitch, Hyde y Deeks, 2017).
Rew, Powell, Brown, Becker y Slesnick (2017) realizaron un
estudio cuasiexperimental para determinar los efectos de una
intervención callejera breve sobre el capital psicológico
(autoeficacia, esperanza y resiliencia) y los resultados de salud
(conducta sexual de riesgo y consumo de sustancias) en mujeres
jóvenes sin hogar. El estudio duró dos meses, con cuatro semanas
de intervención y cuatro de seguimiento. En el Ejemplo de
investigación 9.6 se describe su proceso de muestreo con los
elementos de muestreo clave entre [corchetes].

530
EJEMPLO DE INVESTIGACIÓN 9.6
Muestreo por conveniencia
Extracto del estudio de investigación
El entorno de este estudio fue un centro social de asistencia en la calle
y un centro de alojamiento temporal para mujeres embarazadas o
madres recientes y sus bebés sin hogar en la zona central de Texas
[criterios de muestreo]. La muestra constó de 80 mujeres [tamaño
muestral] de 18-23 años que recibieron servicios de estos centros
[criterios de muestreo]. El personal empleado en el centro social y en
el centro de alojamiento para madres recientes informó a las mujeres
jóvenes del estudio. Las jóvenes interesadas fueron dirigidas a
continuación a los miembros del equipo de investigación [muestreo
por conveniencia]. (Rew y cols., 2017, pág. 359)

Valoración crítica
Rew y cols. (2017) describieron los criterios de muestreo que fueron
apropiados para el propósito del estudio. El tamaño inicial de la
muestra de 80 mujeres jóvenes pareció adecuado. Los
investigadores indicaron que solo 40 mujeres asistieron a la última
sesión de intervención, los análisis de los datos indicaron que los
tamaños del grupo de intervención oscilaron entre 17 y 27 mujeres
en función de la variable que se analizaba, y los tamaños del grupo
de control oscilaron entre 11 y 20 mujeres. Los investigadores
reconocieron que el abandono de la muestra era una limitación del
estudio y señalaron que en estudios previos la tasa de abandono
era alta en esta población de mujeres jóvenes embarazadas sin
hogar. El estudio duró 2 meses, lo que también aumentó la tasa de
abandono. El método de muestreo no se identificó con claridad,
pero parece que fue un muestreo por conveniencia porque se pidió
a las mujeres de los entornos seleccionados que participasen y se
les incluyó en el estudio si otorgaban su consentimiento. El
apartado de la muestra habría sido más sólido si los investigadores
hubiesen identificado con claridad las tasas de rechazo y de
abandono, así como el método de muestreo. El tamaño final de la

531
muestra era pequeño (<47 mujeres), con una tasa elevada de
abandono, lo que disminuyó la representatividad de la muestra y
aumentó la posibilidad de sesgo.
Rew y cols. (2017, pág. 356) observaron que la intervención
callejera era factible y eficaz porque «los participantes en la
intervención tuvieron mejoras significativas del capital psicológico,
la esperanza, la resiliencia y la autoeficacia para rechazar el
alcohol, la conectividad social y el consumo de sustancias». Sin
embargo, recomendaban más investigaciones con la intervención, a
lo largo de un período más largo de tiempo y una muestra mayor
de mujeres adolescentes.

Muestreo por cuotas


El muestreo por cuotas utiliza una técnica de muestreo por
conveniencia con una característica añadida: una estrategia para
asegurar la inclusión de participantes susceptibles de encontrarse
infrarrepresentados en la muestra de conveniencia, como mujeres,
grupos minoritarios, ancianos, pobres, ricos y personas sin
formación académica. El objetivo del muestreo por cuotas es
replicar las proporciones de los subgrupos presentes en la
población diana. Esta técnica es similar a la utilizada en el muestreo
aleatorio estratificado. El muestreo por cuotas requiere que el
investigador sea capaz de identificar los subgrupos y sus
proporciones en la población diana para lograr la representatividad
para el problema en estudio. El muestreo por cuotas mejora la
representatividad respecto al muestreo por conveniencia (v. tabla
9.1).
Campbell, Kero y Templin (2017, pág. 14) utilizaron el muestreo
por cuotas para determinar «los puntos de corte de intensidad leve,
moderada y grave para la escala Respiratory Distress Observational
Scale [RDOS]». La RDOS es un método para evaluar la dificultad
respiratoria en pacientes, pero se necesitan puntos de corte para la
dificultad leve, moderada y grave con el fin de guiar el uso de esta
escala en la práctica clínica. El Ejemplo de investigación 9.7 describe
su proceso de muestreo.

532
EJEMPLO DE INVESTIGACIÓN 9.7
Muestreo por cuotas
Extracto del estudio de investigación
… Los pacientes se estratificaron por el nivel de dificultad respiratoria
estimada [muestreo estratificado] por dos profesionales de enfermería
[PE] expertos en cuidados paliativos… Se usaron cuatro niveles de
dificultad respiratoria: ninguna, leve, moderada y grave…

Los pacientes adultos ingresados se reclutaron de un hospital urbano


en el Medio Oeste de Estados Unidos [entorno]. Los pacientes con
respiración espontánea que presentaban un riesgo de disnea y uno o
más de los siguientes diagnósticos: cáncer de pulmón, insuficiencia
cardiaca, enfermedad pulmonar obstructiva crónica (EPOC) o
neumonía [población accesible] se incluyeron hasta que se logró el
tamaño muestral deseado [muestreo por conveniencia]… El PE y el
ayudante de investigación [AI] de enfermería observaron
simultáneamente al paciente; los PE se enmascararon para
[ignoraban] la estratificación del reclutamiento y la puntuación
RDOS con el fin de minimizar el sesgo; el AI se enmascaró para la
calificación otorgada por el PE… Los participantes fueron 84
pacientes adultos ingresados [tamaño muestral] de 21-102 años.
(Campbell y cols., 2017, pág. 15)

Valoración crítica
La muestra original de Campbell y cols. (2017) era de conveniencia
porque los pacientes ingresados se reclutaron hasta que se logró el
tamaño muestral. Los investigadores identificaron claramente el
modo en el que se estratificó a los pacientes por la dificultad
respiratoria, lo que fue esencial para determinar los puntos de corte
de intensidad para la RDOS. El muestreo por cuotas aumentó la
representatividad de esta muestra. El entorno era apropiado y
proporcionó suficientes participantes para el estudio. Los
investigadores utilizaron el enmascaramiento para algunos

533
aspectos del estudio para el PE y el AI con el fin de reducir la
posibilidad de sesgo. El apartado de muestreo habría sido más
sólido si Campbell y cols. (2017) hubiesen identificado con claridad
sus métodos de muestreo como por conveniencia y por cuotas.
Campbell y cols. (2017) observaron que las puntuaciones de
dificultad respiratoria otorgadas por los PE en estos pacientes
adultos ingresados se correlacionaron significativamente con los
valores de la escala RDOS. Los puntos de corte de intensidad leve,
moderada y grave se identificaron con claridad para la RDOS, lo
que aumenta su utilidad en la práctica.

TAMAÑO DE LA MUESTRA EN
ESTUDIOS CUANTITATIVOS
Una de las cuestiones más problemáticas que surgen durante la
valoración crítica de un estudio es si el tamaño de la muestra fue
adecuado. Si el estudio fue diseñado para hacer comparaciones y se
encontraron diferencias significativas, el tamaño de la muestra, o
número de participantes en el estudio, fue adecuado. Las preguntas
sobre la adecuación del tamaño de la muestra surgen solo cuando
no se encuentra ninguna diferencia significativa. Al valorar
críticamente un estudio cuantitativo en el que no se encontraron
diferencias significativas para al menos una de las hipótesis o
preguntas de investigación, hay que asegurarse de valorar si el
tamaño de la muestra es adecuado. ¿Realmente no hay diferencias?
¿O había una diferencia real que no se encontró debido a
deficiencias en los métodos de investigación, como un tamaño
muestral pequeño?
Actualmente, la adecuación del tamaño de la muestra en estudios
cuantitativos se evalúa utilizando un análisis de la potencia (Grove
y Cipher, 2017). La potencia es la capacidad del estudio para
detectar diferencias o ver realmente las relaciones existentes en la
población. Dicho de otro modo, es la capacidad de rechazar la
hipótesis nula correctamente (v. cap. 5). El nivel mínimo aceptable
de la potencia de un estudio es de 0,8 o del 80% (Aberson, 2010;
Cohen, 1988). Este nivel de potencia da lugar a una probabilidad
del 20% de error de tipo II, en el cual el estudio no puede detectar

534
los efectos existentes (diferencias o relaciones). El valor de alfa (a), o
nivel de significación, suele fijarse en 0,05 en los estudios de
enfermería. Los resultados del análisis de la potencia deberían
incluirse en el apartado de muestra del estudio. Los investigadores
también deben realizar un análisis de la potencia para evaluar la
adecuación del tamaño de su muestra en todos los resultados no
significativos y deberían incluirlo en el apartado de discusión de su
estudio.
Ruffano y cols. (2017) realizaron una revisión de la calidad
metodológica de 103 ECA. Los análisis de potencia se describieron
en 81 (79%) de los ECA, pero 24 (30%) de estos estudios no
incluyeron el número requerido de participantes indicado por los
cálculos de potencia. Un tamaño muestral inadecuado es
especialmente preocupante en los ECA debido a que estos estudios
están diseñados para probar los efectos de intervenciones. Las
muestras que son demasiado pequeñas pueden dar lugar a estudios
que carezcan de la potencia necesaria para identificar relaciones
significativas entre variables o diferencias entre los grupos. Los
estudios de baja potencia aumentan el riesgo de un error de tipo II,
al afirmar que algo no es significativo cuando realmente sí lo es
(Grove y Cipher, 2017).
Entre los factores que influyen en la adecuación de tamaño de la
muestra (ya que afectan a la potencia) se encuentran el tamaño del
efecto, el tipo de estudio cuantitativo, el número de variables
estudiadas, la sensibilidad de los métodos de medición y las
técnicas de análisis de datos. La valoración crítica de la adecuación
del tamaño de la muestra debe tener en cuenta la influencia de estos
factores, que se analizan en las siguientes secciones.

Tamaño del efecto


El efecto es la presencia del fenómeno examinado en un estudio. El
tamaño del efecto es el grado en que la hipótesis nula o estadística
es falsa o, en otras palabras, la fuerza de la relación esperada entre
dos variables o diferencias entre dos grupos. En un estudio en el
que los investigadores estén comparando dos poblaciones, la
hipótesis nula establece que la diferencia entre las dos poblaciones
es cero. Sin embargo, si la hipótesis nula es falsa, hay un efecto

535
identificable: existe una diferencia entre los dos grupos. Si la
hipótesis nula es falsa, lo es hasta cierto punto; este es el tamaño del
efecto (Cohen, 1988). La prueba estadística indica si hay una
diferencia entre los grupos o si las variables se relacionan
significativamente. El tamaño del efecto indica la magnitud de la
diferencia entre los grupos o la fuerza de la relación entre dos
variables (Grove y Cipher, 2017).
Cuando el tamaño del efecto es grande (p. ej., una diferencia
considerable entre los grupos o una relación muy fuerte entre dos
variables), detectarlo es más fácil y se puede hacer con una muestra
menor. Cuando el tamaño del efecto es pequeño (p. ej., solo una
diferencia escasa entre los grupos o una relación débil entre dos
variables), detectarlo es más difícil y se requiere una muestra
mayor. Hay diferentes tipos de mediciones del tamaño del efecto y
cada uno corresponde al tipo de estadístico calculado. Los tamaños
del efecto pueden ser positivos o negativos en función del tipo de
relación (positiva o negativa) entre dos variables o de las diferencias
entre grupos (la variable dependiente aumenta o disminuye). A
continuación, se presentan las guías para la categorización de la
calidad del tamaño del efecto según el coeficiente de correlación de
Pearson de producto-momento (r; Grove y Cipher, 2017):

Tamaño del efecto pequeño <0,30 o <–0,30

Tamaño del efecto pequeño <0,30 o <–0,30

Tamaño del efecto medio = 0,30 a 0,50 o –0,30 a –0,50

Tamaño del efecto medio = 0,30 a 0,50 o –0,30 a –0,50

Tamaño del efecto grande >0,50 o >–0,50

Tamaño del efecto grande >0,50 o >–0,50


El tamaño del efecto es más pequeño con una muestra pequeña,
por lo que los efectos son más difíciles de detectar. El aumento de la
dimensión de la muestra también aumenta el tamaño del efecto, por

536
lo que es más probable que el efecto sea detectado y los resultados
del estudio sean significativos. Cuando se valora críticamente un
estudio, hay que determinar si el tamaño de su muestra es
adecuado observando si se realizó un análisis de la potencia y qué
potencia se alcanzó. Hay que analizar la tasa de abandono del
estudio para determinar el tamaño final de la muestra para el
análisis de datos. ¿Era la muestra final mayor que el tamaño
muestral mínimo recomendado por el análisis de la potencia?
Además, hay que comprobar si los investigadores calcularon el
nivel de la potencia del estudio cuando los resultados no fueron
significativos. Cuando se realiza un cálculo a posteriori, se puede
determinar con más exactitud si el tamaño de la muestra era
adecuado (Grove y Cipher, 2017).

Tipos de estudios cuantitativos


Los estudios descriptivos (en particular los que utilizan
cuestionarios de tipo encuesta) y los estudios de correlación a
menudo requieren muestras muy grandes. En estos estudios, los
investigadores pueden evaluar múltiples variables y las variables
externas pueden afectar a la(s) respuesta(s) del participante y a las
variables en estudio. Los investigadores a menudo realizan
comparaciones estadísticas entre varios subgrupos en una muestra,
como los grupos formados por el sexo, la edad o la etnicidad,
requiriendo la disponibilidad de una muestra adecuada para
analizar cada subgrupo. Los estudios cuasiexperimentales y
experimentales utilizan muestras más pequeñas con mayor
frecuencia que los estudios descriptivos y de correlación. A medida
que aumenta el control del estudio, puede reducirse el tamaño de la
muestra y aún así aproximarse a la población diana. Los
instrumentos en estos estudios tienden a ser más precisos, con una
fiabilidad y validez mayores. El tipo de diseño del estudio puede
influir en el tamaño de la muestra, como el uso de participantes
emparejados, lo que aumenta la potencia para identificar
diferencias de grupo y disminuye el tamaño de la muestra
requerido (v. cap. 8).

Número de variables

537
A medida que el número de variables en estudio aumenta, el
tamaño de la muestra necesario puede incrementarse. Por ejemplo,
la inclusión de múltiples variables dependientes en un estudio
aumenta el tamaño requerido de la muestra. Cuando se incluyen
variables como la edad, el sexo, la etnicidad y la formación
académica en los análisis de datos, para responder a las preguntas
de investigación o comprobar las hipótesis, el tamaño de la muestra
debe aumentarse para detectar diferencias entre los grupos. El uso
de variables demográficas solo para describir la muestra no afecta a
la potencia del estudio.

Sensibilidad de la medición
Unos instrumentos fisiológicos de calidad miden los fenómenos con
exactitud y precisión. Un termómetro, por ejemplo, mide la
temperatura corporal con exactitud y precisión. Las herramientas
que miden variables psicosociales tienden a ser menos precisas. Sin
embargo, una herramienta que es fiable y válida mide con mayor
precisión que una menos elaborada. La varianza tiende a ser mayor
con una herramienta menos elaborada que con una que está bien
diseñada (Waltz, Strickland y Lenz, 2017). Por ejemplo, si se mide la
ansiedad y la puntuación real de la ansiedad de varios participantes
es de 80, es posible obtener medidas que van de 70 a 90 con una
herramienta menos elaborada. Se produce una variación mucho
mayor de la puntuación verdadera con escalas nuevas o menos
perfeccionadas que cuando se utiliza una escala bien elaborada, que
tenderá a mostrar una puntuación más cercana a la puntuación real
de 80 de cada participante. A medida que aumentan las
puntuaciones del instrumento, se incrementa el tamaño de la
muestra necesario para obtener significación (v. cap. 10).

Técnicas de análisis de datos


Las técnicas de análisis de datos difieren en su capacidad de
detectar diferencias en los datos. Los estadísticos se refieren a esto
como la «potencia del análisis estadístico». También se produce una
interacción entre la sensibilidad de la medición y la potencia de la
técnica de análisis de datos. La potencia de la técnica de análisis
aumenta a medida que se incrementa la precisión de la medición.

538
Debido a esto, las técnicas para el análisis de las variables medidas
con niveles de intervalos y de razón son más potentes para la
detección de relaciones y diferencias que las utilizadas para analizar
las variables medidas con niveles nominales y ordinales (v. más
detalles sobre los niveles de medición en el cap. 10). Se necesitan
muestras más grandes cuando la potencia del análisis estadístico
planeado es débil.
Para algunos procedimientos estadísticos, como la prueba de la t
de Student y el análisis de la varianza (ANOVA), unos tamaños de
grupo iguales aumentarán la potencia porque con ellos se maximiza
el tamaño del efecto. Cuanto más desequilibrados son los tamaños
de los grupos, más pequeño es el tamaño del efecto. Por tanto, en
grupos desequilibrados, el tamaño total de la muestra debe ser
mayor (Kraemer y Theimann, 1987). La prueba de la χ2 es la prueba
estadística más débil y requiere tamaños muestrales grandes para
alcanzar niveles de potencia aceptables (v. más detalles sobre
técnicas de análisis estadístico en el cap. 11).

GUÍAS DE VALORACIÓN CRÍTICA


Adecuación del tamaño de la muestra y del
método de muestreo, y representatividad de
la muestra en los estudios cuantitativos
Las guías de valoración crítica iniciales para los procesos de
muestreo utilizadas en los estudios cuantitativos se introdujeron
previamente en este capítulo. Esta sección se centrará solo en las
cuestiones relativas a la adecuación del tamaño muestral y del
método de muestreo, así como en la representatividad de la
muestra.

1. ¿El método de muestreo es probabilístico o no probabilístico?


El método de muestreo específico utilizado en el estudio
para obtener la muestra se ha identificado y es apropiado
(Gray y cols., 2017)?
2. ¿Se identifica el tamaño de la muestra? ¿Se comunica el
análisis de la potencia? ¿Es adecuado el tamaño de la

539
muestra, según lo indicado por el análisis de la potencia? Si
se incluyeran grupos en el estudio, ¿es el tamaño de la
muestra para cada grupo igual y apropiado (Grove y Cipher,
2017)?
3. ¿Es el proceso de muestreo adecuado para lograr una muestra
representativa? ¿Es la muestra representativa de las
poblaciones accesible y diana?

El estudio de Newnam y cols. (2015), que se ha valorado


críticamente antes en lo que respecta a los criterios de muestreo y a
las tasas de rechazo y abandono, se presenta como ejemplo para
comentar el tamaño muestral, el método de muestreo y la
representatividad de la muestra. Estos investigadores realizaron un
ECA para identificar las diferencias en cuanto a la frecuencia y
gravedad de las lesiones nasales en recién nacidos de muy bajo PN
que recibían tratamientos con CPAP. En el Ejemplo de investigación
9.8, se describe el análisis de la potencia realizado para determinar
los tamaños de la muestra y de los grupos, así como el método de
muestreo.

EJEMPLO DE INVESTIGACIÓN 9.8


Muestra de un estudio cuantitativo
Extracto del estudio de investigación
Se calculó una estimación a priori del tamaño muestral utilizando
una potencia del 80%, a = 0,05 con pruebas F como base estadística
del cálculo utilizando el programa G*Power 3.0. El tamaño calculado
de 72 sujetos en total, con 24 en cada uno de los tres grupos se
consideró adecuado para determinar una diferencia significativa entre
los grupos.

Los recién nacidos [población] se extubaron y se trataron con CPAP


nasal. Se distribuyeron de forma aleatoria a uno de los tres grupos: 1)
cánula nasal continua, 2) mascarilla nasal continua o 3) alternancia
de mascarilla y cánula cada 4 horas. El momento específico de la

540
extubación se basó en la preparación clínica demostrada… Los
participantes se estratificaron por bloques según el PN en cuatro
categorías: <750 g; 750-1.000 g; 1.001-1.250 g, y 1.251-1.500 g
[muestreo por cuotas]. Se han demostrado diferencias conocidas de
integridad cutánea. Los lactantes con menor PN se consideraron los
más vulnerables; por tanto, se usó la estratificación para mantener
una mayor homogeneidad de los grupos, dado que se esperaba que el
grupo <750 g contuviese el menor número de pacientes. (Newnam y
cols., 2015, págs. 37-38)

Valoración crítica
Newnam y cols. (2015) detallaron el análisis de la potencia
realizado para determinar el tamaño de la muestra de su estudio.
Se incluyeron tres elementos del análisis de la potencia: 1) potencia
estándar del 80%, 2) a = 0,05 y 3) prueba estadística (prueba F para
el análisis de la varianza [ANOVA]). Sin embargo, los
investigadores no indicaron el tamaño del efecto utilizado en el
cálculo. El estudio se centró en determinar las diferencias entre los
tres grupos de recién nacidos que recibían CPAP mediante los
siguientes medios: CPAP con mascarilla, n = 35; CPAP con cánula
nasal, n = 21, y alternancia de CPAP mediante mascarilla y cánula
nasal, n = 22 (v. fig. 1). El tamaño total de la muestra fue de 78, que
es mayor que los 72 participantes recomendados por el análisis de
potencia. Sin embargo, el estudio habría sido más sólido si los
tamaños de los grupos hubiesen sido más iguales y cada grupo
hubiese incluido al menos 24 recién nacidos, como lo indicó el
análisis de potencia. Newnam y cols. (2015) observaron una
cantidad significativamente menor de lesiones cutáneas en el
grupo de alternancia entre mascarilla y cánula. Los resultados
significativos indican que el estudio tenía un tamaño muestral
adecuado para determinar las diferencias entre los tres grupos
utilizando el ANOVA. Los recién nacidos ingresados en esta UCIN
se evaluaron y los que cumplieron los criterios de muestreo se
ingresaron con el consentimiento parental, lo que supone un
muestreo por conveniencia. El muestreo por cuotas implicó la
estratificación de la muestra según el PN, lo que redujo la
posibilidad de error por las variables externas. El muestreo por

541
cuotas y las bajas tasas de rechazo y de abandono aumentaron la
representatividad de la muestra respecto a la población diana. Sin
embargo, la muestra se seleccionó solo de una UCIN, y los tamaños
de los grupos eran pequeños (n = 21, 22 y 35), lo que disminuye la
representatividad de la muestra y aumenta la posibilidad de sesgo.

MUESTREO EN INVESTIGACIÓN
CUALITATIVA
La investigación cualitativa se lleva a cabo para obtener
información y descubrir el significado de un fenómeno, situación,
evento o elemento cultural particular (Creswell y Poth, 2018;
Munhall, 2012). La intención es lograr una comprensión detallada
obtenida a partir de una muestra seleccionada y no la
generalización a una población diana de los resultados de una
muestra seleccionada aleatoriamente, como en la investigación
cuantitativa. El muestreo en la investigación cualitativa se centra
más en las experiencias, eventos, incidentes y entornos que en las
personas. En los estudios de etnografía, los investigadores
cualitativos a menudo seleccionan el entorno y el sitio y, después, la
población y el fenómeno de interés (Marshall y Rossman, 2016). En
la investigación fenomenológica, los investigadores suelen
seleccionar el fenómeno o la población de interés e identifican a los
posibles participantes de sus estudios. Los participantes deben
tener experiencia o conocimientos en el área de estudio y estar
dispuestos a compartir una información rica y detallada sobre el
fenómeno, situación, cultura o evento que se está estudiando. Por
ejemplo, si el objetivo del estudio es describir el fenómeno de vivir
con dolor crónico, el investigador seleccionará individuos que sean
elocuentes y reflexivos, que tengan antecedentes de dolor crónico y
que estén dispuestos a compartir su experiencia con esta dolencia
(Creswell, 2014; Creswell y Poth, 2018).
Los métodos de muestreo frecuentes utilizados en la
investigación cualitativa en enfermería son el muestreo intencional,
en red o en bola de nieve, teórico y por conveniencia (descrito
anteriormente). Estos métodos de muestreo se resumen en la tabla
9.1 y permiten a los investigadores seleccionar casos o participantes

542
muy informativos que crean que les proporcionarán los mejores
datos para sus estudios. El proceso de selección de la muestra
puede tener un profundo efecto en la calidad del estudio; los
investigadores deben describir este proceso con detalle para
favorecer la interpretación de los hallazgos.

Muestreo intencional
Con el muestreo intencional o deliberado, a veces denominado
muestreo crítico o selectivo, el investigador selecciona
conscientemente ciertos participantes, elementos, eventos o
incidentes que incluirá en el estudio. Los investigadores pueden
tratar de incluir participantes típicos o atípicos, o situaciones
similares o diversas. Los investigadores cualitativos pueden
seleccionar participantes de diferentes categorías de edad, que
tengan distintos diagnósticos o gravedad de la enfermedad o
aquellos que reciban un tratamiento ineficaz en lugar de uno eficaz
para su enfermedad. Por ejemplo, unos investigadores que estudien
el duelo tras la pérdida de un hijo podrían incluir a progenitores
que hayan perdido a un hijo en los 6, 12 y 24 meses previos y las
distintas edades de los niños a los que perdieron (<5, 5-10 y >10
años). El objetivo final del muestreo intencional es seleccionar casos
con abundante información de los que los investigadores puedan
obtener unos datos detallados para sus estudios.
Algunos autores han criticado el método de muestreo intencional,
ya que es difícil evaluar la exactitud o la relevancia del criterio del
investigador. Para contrarrestar esta percepción, los investigadores
deben indicar las características que desean en los participantes del
estudio y proporcionar la razón para la selección de estos tipos de
individuos para obtener datos esenciales de su estudio. En los
estudios cualitativos, el muestreo intencional parece ser la mejor
manera de obtener conocimientos en una nueva área de estudio,
descubrir un nuevo significado u obtener una comprensión
detallada de una experiencia, situación o evento complejo (Marshall
y Rossman, 2016).
Sadeghi, Hasanpour, Heidarzadeh, Alamolhoda y Waldman
(2016) realizaron un estudio cualitativo exploratorio-descriptivo
para analizar las necesidades espirituales de las familias que

543
experimentaron la pérdida de un lactante en una UCIN. Los
investigadores utilizaron un muestreo intencional en cinco centros
médicos para reclutar los participantes de su estudio, tal y como se
describe en el Ejemplo de investigación 9.9.

EJEMPLO DE INVESTIGACIÓN 9.9


Muestreo intencional
Extracto del estudio de investigación
El entorno de investigación fue las UCIN de cinco centros médicos
docentes y no docentes… El muestreo se realizó con un método de
muestreo intencional y teniendo en cuenta la máxima variación. En
este método, el investigador para lograr la diversidad selecciona un
pequeño número de unidades o casos con la máxima variación
relevantes para la pregunta de investigación. En la máxima variación,
la heterogeneidad de los casos es importante… Los criterios de
inclusión para las familias, profesionales de enfermería y médicos eran
haber experimentado al menos el fallecimiento de un recién nacido en
los últimos 6 meses en la UCIN. Los datos del estudio se recogieron
de junio de 2013 a marzo de 2014, con entrevistas en persona,
semiestructuradas y en profundidad… En este estudio, se entrevistó a
24 participantes (madre, padre, abuela, profesional de enfermería y
médico), que cumplieron los criterios de inclusión. (Sadeghi y cols.,
2016, págs. 36-37)

Valoración crítica
Sadeghi y cols. (2016) usaron un muestreo intencional para
seleccionar a los 24 participantes de su estudio. Los participantes
eran diversos familiares, profesionales de enfermería y médicos de
múltiples entornos variados, de cinco centros médicos docentes y
no docentes. Los participantes se seleccionaron con la máxima
variación en cuanto a la edad, nivel educativo y empleo para
obtener unos datos detallados y profusos. Los participantes tenían
que haber experimentado la muerte de un recién nacido y los datos

544
se recogieron a lo largo de un período de tiempo significativo.
Además, el tamaño de la muestra parecía adecuado para
proporcionar numerosos datos de calidad para este estudio.
Sadeghi y cols. (2016, pág. 35) señalaron que «el análisis de los
datos reveló tres temas principales: creencia espiritual en un poder
sobrenatural, necesidad de reconfortar el alma y dignidad humana
del recién nacido».

Muestreo por redes


El muestreo por redes, a veces denominado muestreo de «bola de
nieve», «cadena» o «nominado», puede ayudar a localizar
participantes que sería difícil o imposible obtener por otros medios
o que no han sido previamente identificados para el estudio
(Marshall y Rossman, 2016; Munhall, 2012). El muestreo por redes
aprovecha las redes sociales y el hecho de que los amigos tienden a
tener características en común. Esta estrategia también es
particularmente útil para la búsqueda de participantes en
poblaciones socialmente desprestigiadas, como personas
alcohólicas, maltratadores infantiles, personas que hayan cometido
abusos sexuales, adictos a drogas o que hayan delinquido. Estas
personas rara vez están dispuestas a darse a conocer. Otros grupos,
como personas viudas, hermanos en duelo o personas que hayan
tenido éxito al cambiar su estilo de vida, también pueden ser
localizados mediante el muestreo por redes. Por lo general, se
encuentran fuera del sistema sanitario existente y son difíciles de
encontrar de otro modo. Cuando los investigadores encuentran
algunos participantes que cumplen los criterios de muestreo,
solicitan su ayuda para encontrar a otros con características
similares.
Los investigadores a menudo obtienen los primeros participantes
del estudio a través de un método de muestreo intencional o por
conveniencia, y amplían el tamaño de la muestra mediante un
muestreo por redes. En la investigación cualitativa, el muestreo por
redes es una estrategia eficaz para identificar participantes que
pueden proporcionar un mayor conocimiento e información
fundamental sobre la experiencia o evento que se está estudiando.
Por ejemplo, si se está llevando a cabo un estudio para describir las

545
vidas de los adolescentes que consumen sustancias, el muestreo por
redes permitiría a los investigadores encontrar participantes que
tengan antecedentes previos de consumo de sustancias y que
podrían proporcionar abundante información sobre sus vidas en
una entrevista.
Quinn (2016) realizó un estudio de teoría fundamentada para
analizar el modo en el que las enfermeras estadounidenses
integraban el embarazo y el trabajo a tiempo completo. La muestra
incluyó a 20 profesionales de enfermería «que estaban embarazadas
y que tuvieron su primer hijo cuando estaban trabajando a tiempo
completo en turnos de 12 horas de trabajo» (Quinn, 2016, pág. 170).
Se usaron métodos de muestreo por conveniencia y de bola de
nieve para reclutar a los participantes en el estudio, tal y como se
describe en el Ejemplo de investigación 9.10, con los elementos
clave del muestreo entre [corchetes].

EJEMPLO DE INVESTIGACIÓN 9.10


Muestreo por redes
Extracto del estudio de investigación
El diseño de investigación incluyó el reclutamiento de los
participantes en el estudio de dos hospitales de cuidados agudos
[entorno] que atendían al área triestatal que rodea la ciudad de Nueva
York. Se creó un folleto de reclutamiento en el que se invitaba a las
enfermeras colegiadas [muestreo por conveniencia], que trabajasen a
tiempo completo en una unidad medicoquirúrgica de cuidados
progresivos/intermedios o de cuidados críticos, y que hubiesen tenido
recientemente a su primer hijo [criterios de muestreo], a que
contactasen con el investigador por correo electrónico o teléfono…
Una segunda estrategia de reclutamiento consistió en la red de
enfermeras que trabajaban en el área triestatal que habían respondido
al folleto de reclutamiento y que podían remitir al investigador a
amigas, compañeras o colegas [muestreo por redes] que cumpliesen
los criterios del estudio para su posible inclusión en el estudio. Por

546
tanto, se utilizaron métodos de muestreo por conveniencia y por
redes. (Quinn, 2016, pág. 172)

Valoración crítica
Quinn (2016) identificó con claridad que para reclutar a las
participantes en el estudio se usaron los métodos de muestreo por
conveniencia y por redes. Los métodos de muestreo parecieron
apropiados para obtener los datos necesarios para abordar el
propósito del estudio. Se obtuvo una muestra suficiente de 20
enfermeras de múltiples unidades en dos hospitales de cuidados
agudos. Las participantes conocían bien la situación y podían
proporcionar información detallada de primera mano sobre estar
embarazadas y contratadas a tiempo completo. Este estudio
ejemplifica un proceso de muestreo de calidad para seleccionar a
las participantes apropiadas, que proporcionasen abundantes datos
para el estudio. Quinn (2016) describió el proceso social de las
enfermeras como «convertirse en alguien diferente» cuando
integraban el embarazo y el trabajo a tiempo completo. Las cuatro
categorías que surgieron fueron: «a) ‘tener un aspecto distinto y
sentirse diferente’, b) ‘expectativas mientras se esperaba’, c)
‘conectar de forma diferente’ y d) ‘transición laboral’» (Quinn,
2016, pág. 170).

Muestreo teórico
El muestreo teórico se utiliza en la investigación cualitativa para
desarrollar una teoría concreta a través del proceso de
investigación. Este tipo de estrategia de muestreo se usa más
frecuentemente en la investigación de la teoría fundamentada. El
investigador recoge los datos de cualquier persona o grupo de
personas que sean capaces de proporcionar información relevante,
variada y rica para la elaboración de una teoría. Los datos se
consideran relevantes y productivos si incluyen información que
crea, delimita y satura los códigos teóricos del estudio necesarios
para la elaboración de la teoría (Charmaz, 2014; Creswell y Poth,
2018). Un código está saturado si está completo y el investigador
puede ver cómo encaja en la teoría. Cuando un código o concepto
no está claro, el investigador sigue buscando participantes y reúne

547
datos. El proceso continúa hasta que los códigos estén saturados y
la teoría se desarrolla a partir de los códigos y los datos. Se fomenta
la diversidad en la muestra para que la teoría desarrollada cubra
una amplia gama de comportamientos en situaciones y entornos
diversos.
Chase, McMahon y Winch (2016, pág. 116) realizaron un estudio
de teoría fundamentada «para comprender los facilitadores y los
obstáculos frente a la solicitud de asistencia en los veteranos
expuestos a una onda expansiva y los miembros del servicio que
prestaban asistencia antes de la implementación de la detección
sistemática de traumatismos craneoencefálicos (TCE)». Los métodos
de muestreo teórico y de bola de nieve utilizados para reclutar a los
participantes en el estudio se describen en el Ejemplo de
investigación 9.11.

EJEMPLO DE INVESTIGACIÓN 9.11


Muestreo teórico
Extracto del estudio de investigación
Este estudio se basó en la metodología de la teoría fundamentada. De
forma específica, utilizamos una recogida y análisis de datos, una
comparación constante, un muestreo teórico y una revisión diferida
de la bibliografía para comprender los conceptos y procesos más
destacados para los veteranos y sus familias respecto a la búsqueda de
asistencia en los años posteriores a un despliegue en combate de alta
intensidad… Utilizamos unos criterios de elegibilidad amplios para
este estudio (haber estado desplegado en Irak o en Afganistán con el
ejército de EE.UU. y haber estado expuesto a un combate
potencialmente lesivo) y un muestreo de bola de nieve para recoger las
perspectivas de los veteranos con una amplia gama de experiencias
relacionadas con la exposición al combate, el ajuste posterior al
despliegue y la búsqueda de asistencia potencialmente relacionada con
un TCE. (Chase y cols., 2016, págs. 116-117)

548
Valoración crítica
Los métodos de muestreo de Chase y cols. (2016) fueron adecuados
para un estudio realizado con la metodología de la teoría
fundamentada. Se aplicaron métodos de muestreo tanto de bola de
nieve como teórico, ya que los investigadores querían que un
número adecuado de veteranos y de familiares con experiencias
diversas participasen en el estudio. Los métodos de muestreo
proporcionaron una muestra de calidad de 15 veteranos y 10
familiares. El número de participantes permitió una visión más
amplia de los facilitadores y los obstáculos para la búsqueda de
asistencia en los sistemas de salud militares. Se presentan más
detalles de este estudio en la siguiente sección en la discusión del
tamaño de la muestra en estudios cualitativos.

TAMAÑO DE LA MUESTRA EN
ESTUDIOS CUALITATIVOS
En la investigación cuantitativa, el tamaño de la muestra debe ser lo
bastante grande para identificar las relaciones entre las variables o
determinar las diferencias entre los grupos. Cuanto mayor sea el
tamaño de la muestra y el tamaño del efecto, mayor será la potencia
para detectar las relaciones y diferencias en los estudios
cuantitativos. Sin embargo, la investigación cualitativa se centra en
la calidad de la información obtenida de la persona, situación o
evento muestreado en lugar de en el tamaño de la muestra
(Creswell y Poth, 2018; Munhall, 2012).
El propósito del estudio determina el plan de muestreo y el
tamaño inicial de la muestra. La profundidad de la información que
se obtiene y que se necesita para comprender mejor un fenómeno,
describir un elemento cultural, desarrollar una teoría o describir un
concepto o asunto importante de atención sanitaria determina el
número final de personas, lugares y objetos de la muestra. Los
investigadores siguen obteniendo participantes adicionales durante
la recogida y análisis de los datos para favorecer la elaboración de
unos hallazgos de calidad del estudio. El tamaño de la muestra
puede ser demasiado pequeño cuando los datos recogidos carecen
de la profundidad o abundancia adecuadas, y un tamaño

549
inadecuado de la muestra puede reducir la calidad y la credibilidad
de los hallazgos del estudio.
El número de participantes en un estudio cualitativo es adecuado
cuando se produce la saturación. La saturación ocurre cuando los
datos recién recogidos comienzan a ser los mismos que los que ya
se han recogido. Los conceptos son comprensibles y están bien
descritos, los detalles de la cultura están disponibles y los patrones
o temas de una teoría surgen. El investigador tiene datos suficientes
para responder a la pregunta de investigación mientras implementa
de forma apropiada el diseño del estudio (Gray y cols., 2017). Los
factores importantes que deben tenerse en cuenta para determinar
el tamaño de la muestra son: 1) el ámbito del estudio, 2) la
naturaleza del tema, 3) la calidad de los datos y 4) el diseño del
estudio (Charmaz, 2014; Creswell y Poth, 2018; Munhall, 2012).

Ámbito del estudio


Si el ámbito del estudio es amplio, los investigadores necesitarán
muchos datos para hacer frente a los propósitos del estudio y puede
que se requieran más participantes u observaciones para alcanzar la
saturación. Un estudio con un ámbito amplio requiere una muestra
de participantes mayor que la que se necesita si el ámbito es
limitado. Por ejemplo, un estudio cualitativo de la experiencia vital
de ancianos con una enfermedad crónica requeriría una muestra
grande debido al ámbito amplio del problema. Un estudio que tiene
un propósito claro y que favorece la recogida de datos centrada
suele tener hallazgos más detallados y creíbles. A diferencia del
estudio de la experiencia de ancianos con enfermedades crónicas,
los investigadores que analizan la experiencia vivida por ancianos
mayores de 60 años con enfermedad de Parkinson podrían obtener
hallazgos creíbles con una muestra más pequeña. Cuando se realice
la valoración crítica de un estudio cualitativo, hay que determinar si
el tamaño de la muestra era adecuado para el ámbito identificado
del estudio.

Naturaleza del tema


Si el tema del estudio es claro y fácil de comentar por los
participantes del estudio, se necesitarán menos participantes para

550
obtener los datos esenciales. Si el tema es difícil de definir y de
analizar, a menudo son necesarios más participantes para lograr la
saturación de los datos (Creswell y Poth, 2018). Mansour (2011)
realizó un estudio cualitativo exploratorio-descriptivo sobre las
experiencias de los profesionales de enfermería con los errores de
administración de medicación. Debido a los problemas delicados y
éticos que conlleva el hecho de notificar los errores de medicación,
el investigador señaló la necesidad de reclutar una muestra mayor.
Los temas como la identidad sexual, la pérdida de un hijo y los
antecedentes de abuso sexual en la infancia son muy sensibles y
complejos de investigar. Este tipo de temas probablemente
requerirá más participantes y más tiempo de la entrevista para
recoger datos básicos. Cuando se valoran críticamente los estudios
publicados, hay que asegurarse de considerar si el tamaño de la
muestra era adecuado para la complejidad y sensibilidad del tema
estudiado.

Calidad de la información
La calidad de la información obtenida con una entrevista o
mediante observaciones influye en el tamaño de la muestra.
Cuando la calidad de los datos es elevada, con mucho contenido, se
necesitan pocos participantes para lograr la saturación de los datos
en el área de estudio. Los datos de calidad se obtienen mejor de
participantes organizados, bien informados y comunicativos
(Creswell y Poth, 2018; Munhall, 2012). Dichos participantes son
capaces de compartir datos más ricos, tanto en contenido como en
abundancia, de manera clara y concisa. Además, los participantes a
los que se dedica más tiempo para entrevistarlos suelen
proporcionar más datos y más detallados. Los investigadores
continuarán el muestreo hasta lograr la saturación y la verificación
de los datos para obtener los mejores resultados del estudio.

Diseño del estudio


Algunos estudios están diseñados para aumentar el número de
entrevistas con cada participante. Cuando los investigadores llevan
a cabo varias entrevistas con una persona, es probable que recojan
datos de mayor calidad y más detallados. Por ejemplo, con un

551
diseño de estudio que incluya una entrevista antes y otra después
de un evento se suelen generar datos de más calidad que con el
diseño de entrevista única. En un diseño con múltiples entrevistas a
los participantes, estos pueden haber pensado sobre el tema y
obtener información adicional entre las entrevistas o ser más
abiertos con el investigador en entrevistas posteriores. Los diseños
que implican entrevistar a familias suelen dar lugar a más datos que
los diseños con entrevistas de un solo participante (Marshall y
Rossman, 2016).

GUÍAS DE VALORACIÓN CRÍTICA


Adecuación de los procesos de muestreo en
los estudios cualitativos
Cuando se realiza la valoración crítica de los procesos de
muestreo de estudios cualitativos, se deben plantear las siguientes
preguntas:

1. ¿El plan de muestreo es adecuado para abordar el propósito


del estudio? Si se utiliza el muestreo intencional, ¿el
investigador proporciona un motivo para el proceso de
selección de la muestra? Si se utiliza el muestreo por redes o
en bola de nieve, ¿el investigador ha identificado las redes
utilizadas para obtener la muestra y proporciona una
justificación para su selección? Si se utiliza el muestreo
teórico, ¿el investigador indica cómo se seleccionaron los
participantes para favorecer la elaboración de una teoría?
2. ¿Se identifican los criterios de muestreo y son apropiados
para el estudio?
3. ¿El investigador identifica el entorno del estudio y describe la
entrada en ese entorno?
4. ¿El investigador analiza la calidad de los datos facilitados por
los participantes del estudio? ¿Están los participantes
organizados, bien informados y dispuestos a compartir la
información relevante del tema del estudio?
5. ¿El proceso de muestreo produce la saturación y la
verificación de datos en el área de estudio?

552
6. ¿Es el tamaño de la muestra adecuado para el ámbito, la
naturaleza del tema, la calidad de los datos y el diseño del
estudio?

Chase y cols. (2016) llevaron a cabo un estudio de teoría


fundamentada que se citó anteriormente en el análisis del muestreo
teórico. Este estudio se centró en la comprensión de las experiencias
de los veteranos de EE.UU. y sus familiares con el sistema sanitario.
Se utilizaron métodos teóricos y de bola de nieve para reclutar una
muestra de 25 participantes. En el Ejemplo de investigación 9.12 se
proporciona la justificación de los investigadores para el tamaño
final de la muestra de su estudio.

EJEMPLO DE INVESTIGACIÓN 9.12


Muestra de un estudio cualitativo
Extracto del estudio de investigación
Al final, la muestra incluyó a veteranos con y sin diagnósticos de
TCE, a los que solicitaban y a los que no solicitaban asistencia, así
como a los que habían sufrido una exposición a una onda expansiva
subconmocional y conmocional durante el combate. Los familiares de
los veteranos también podían ser elegibles para participar si un
participante refería que desempeñaban un papel en las experiencias
pertinentes para el estudio. Un total de 15 veteranos y 10 familiares
participaron… Los participantes tenían distintos rangos (soldados y
oficiales), edades (20-50 años entre los veteranos, 20-70 años entre los
familiares) y sexos (varones y mujeres tanto los veteranos como los
familiares)… Tres veteranos elegibles con los que se contactó para el
estudio no participaron…

Todas las entrevistas se guiaron por un cuestionario


semiestructurado… y se siguieron de preguntas abiertas relacionadas
con las experiencias del combate, los signos y síntomas, así como la
búsqueda de asistencia. La mayoría de las preguntas de la entrevista

553
retomaron respuestas previas (p. ej., «¿Puede decirme algo más
sobre…?») y temas emergentes… Una codificación abierta sobre un
subgrupo de transcripciones con abundante información sirvió para
preparar las entrevistas subsiguientes… Tratamos de encontrar
variación en nuestras últimas cuatro entrevistas para cuestionar
nuestra comprensión de los temas, pero fueron congruentes con los
hallazgos previos. La recogida de datos para este estudio concluyó
cuando se alcanzó la saturación. Cerca del final de la recogida de
datos, los autores realizaron una revisión de la bibliografía, en la que
los resultados del estudio se compararon con otros y las relaciones
entre los códigos se reevaluaron a la luz de los hallazgos existentes y
del marco. (Chase y cols., 2016, pág. 117)

Valoración crítica
El estudio de Chase y cols. (2016) tiene muchos puntos fuertes en el
área del muestreo, incluidos unos métodos de muestreo de calidad
(teórico y de bola de nieve), participantes meticulosos que aportan
mucha información y un tamaño muestral consistente (n = 25) que
permitió múltiples perspectivas profundas de los veteranos y los
familiares sobre los facilitadores y los obstáculos que encontraban
los veteranos para acceder al sistema sanitario. La tasa de rechazo
del estudio fue limitada ([3 ÷ 25] = 0,12 × 100% = 12%) y no se
indicó que hubiese abandono de los participantes. Los
investigadores proporcionaron muchos detalles del muestreo
teórico llevado a cabo para asegurar que se alcanzase la saturación.
Chase y cols. (2016) proporcionaron una justificación clara para el
tamaño final de la muestra, porque realizaron cuatro entrevistas
finales para cuestionar su comprensión de los temas teóricos,
encontraron que sus hallazgos eran congruentes y concluyeron que
la saturación de datos se alcanzó con 25 participantes. El estudio se
habría visto reforzado si se hubiese conocido cuántos participantes
del estudio fueron obtenidos por cada uno de los métodos de
muestreo (teórico y de bola de nieve). Además, el entorno de este
estudio no se definió con claridad. Los investigadores describieron
que las entrevistas se realizaron en persona o por teléfono, por lo
que el entorno podría haber sido los domicilios de los
participantes. Conocer el entorno del estudio aumenta la fortaleza

554
de los hallazgos.
Chase y cols. (2016) observaron que la inmensa mayoría de los
participantes del estudio describieron que los sistemas sanitarios
de los veteranos y militar son inadecuados para satisfacer sus
necesidades. La mayoría de los profesionales solían ser indiferentes
o insensibles a las numerosas necesidades sanitarias de los
veteranos, pero otros eran excepcionales a la hora de proporcionar
asistencia. Los autores esperan que esta investigación sirva para
recobrar la confianza entre los veteranos que están en situaciones
difíciles y su sistema sanitario.

ENTORNOS DE INVESTIGACIÓN
El entorno de investigación es el sitio o lugar utilizado para llevar a
cabo un estudio. Tres entornos frecuentes para la realización de
estudios de enfermería son los naturales, los parcialmente
controlados y los altamente controlados (Gray y cols., 2017). En el
capítulo 2 se presentaron inicialmente los tipos de entornos para la
investigación cuantitativa. Algunos estudios se fortalecen al tener
más de un entorno, lo que hace que la muestra sea más
representativa de la población diana. La selección de un entorno en
la investigación cuantitativa y cualitativa se basa en el propósito del
estudio, la accesibilidad del entorno o de los sitios, así como el
número y el tipo de participantes disponibles en dicho entorno. El
entorno debe describirse claramente en el informe de investigación,
con una justificación de su selección. Si el entorno está parcial o
altamente controlado, los investigadores deben incluir un análisis
de cómo controlaron el entorno. En las siguientes secciones se
describen los tres tipos de entornos de investigación y se
proporcionan ejemplos de algunos de los estudios analizados
previamente.

Entorno natural
Un entorno natural o de campo es una situación o un entorno de la
vida real no controlado. La realización de un estudio en un entorno
natural significa que el investigador no manipula ni modifica el
entorno para el estudio. Tanto los estudios cuantitativos

555
descriptivos y de correlación como los cualitativos suelen realizarse
en entornos naturales.
Quinn (2016) realizó un estudio de teoría fundamentada para
fomentar el modo en el que las enfermeras estadounidenses
integraban el embarazo y el trabajo a tiempo completo. Este estudio
se citó previamente en la sección sobre muestreo por bola de nieve,
donde se describió el reclutamiento de 20 profesionales de
enfermería de dos hospitales de cuidados agudos en los alrededores
de la ciudad de Nueva York. Quinn realizó este estudio en un
entorno natural, el domicilio de los participantes, como se describe
en el Ejemplo de investigación 9.13.

EJEMPLO DE INVESTIGACIÓN 9.13


Entorno natural
Extracto del estudio de investigación
El investigador trató de realizar entrevistas individuales y
semiestructuradas con las enfermeras que hubiesen dado a luz
recientemente a su primer hijo y que estuviesen de baja maternal…
Una vez que las posibles participantes proporcionaban la información
de contacto al investigador, la información sobre el estudio y el
documento de consentimiento informado se remitían por correo a sus
domicilios o se enviaban por correo electrónico (dependiendo de las
preferencias de cada participante)… Se realizaron entrevistas
personales individuales semiestructurada para recoger los datos…
Todas las participantes recibieron un seudónimo que solo conocía el
investigador y no se recogió ni se usó ningún dato identificador sobre
el lugar de trabajo. (Quinn, 2016, pág. 172)

Valoración crítica
Quinn (2016) realizó las entrevistas del estudio durante la baja
maternal en lugares cómodos para las participantes. Este es un
entorno natural del estudio, porque dicho entorno no fue
controlado ni modificado por el investigador durante la realización

556
del estudio. Para proteger la privacidad de las participantes se les
asignó un seudónimo y no se recogieron datos de identificación
sobre su lugar de trabajo. Debido a la naturaleza sensible del tema,
fue importante que los participantes estuviesen lo más cómodos
posible durante el estudio en un entorno práctico y natural.

Entorno parcialmente controlado


Un entorno parcialmente controlado es un entorno manipulado o
modificado de alguna manera por el investigador. Un número
creciente de estudios de enfermería, generalmente estudios de
correlación, cuasiexperimentales y experimentales, se están
llevando a cabo en entornos parcialmente controlados. El control
del entorno de un estudio es muy poco frecuente en la investigación
cualitativa; sin embargo, los investigadores cualitativos pueden
adaptar un entorno para fomentar el entorno más útil con el fin de
obtener la información que necesitan. Por ejemplo, un investigador
cualitativo podría recoger datos en una sala de conferencias privada
en un hospital, pero programar las entrevistas durante los fines de
semana o después del horario clínico para minimizar las
interrupciones y el ruido.
Campbell y cols. (2017) realizaron un estudio descriptivo para
determinar los puntos de corte de la dificultad respiratoria leve,
moderada y grave con la escala RDOS. Este estudio se ha citado
previamente en la sección del muestreo por cuotas. El estudio
incluyó a 84 participantes en un entorno parcialmente controlado
de un hospital urbano, tal y como se describe en el Ejemplo de
investigación 9.14.

EJEMPLO DE INVESTIGACIÓN 9.14


Entorno parcialmente controlado
Extracto del estudio de investigación
Los pacientes ingresados adultos fueron reclutados de un hospital
urbano en el Medio Oeste de EE.UU.… Se identificaron a partir de

557
un grupo de pacientes ingresados que tenían una estimación de 2
semanas de vida según la Palliative Performance Scale… Los
pacientes elegibles fueron identificados por el AI [ayudante de
investigación] mediante la revisión de las historias de enfermería de
cuidados paliativos de los pacientes derivados y a partir de los pases
de planta del hospital. (Campbell y cols., 2017, pág. 15)

Valoración crítica
Este entorno hospitalario parcialmente controlado permitió al AI y
al PE observar y calificar la disnea de todos los pacientes del
estudio simultáneamente. La gravedad de la enfermedad de los
pacientes se controló con la Palliative Performance Scale para
identificar a los pacientes que estuviesen en las últimas 2 semanas
de vida. Este hospital urbano proporcionó un entorno viable y
apropiado para la realización de este estudio.

Entorno altamente controlado


Un entorno altamente controlado es un entorno estructurado con el
propósito de llevar a cabo la investigación. Los laboratorios, los
centros de investigación o experimentales y las unidades de
investigación de los hospitales u otros entornos sanitarios son
entornos altamente controlados en los que a menudo se llevan a
cabo estudios experimentales. Este tipo de entornos reduce la
influencia de variables externas, lo que permite a los investigadores
examinar con precisión los efectos de las variables independientes
sobre las variables dependientes.
Newnam y cols. (2015) realizaron un estudio experimental para
determinar la eficacia de la CPAP sobre la lesión cutánea
relacionada cuando se usaban distintas interfases nasales en recién
nacidos de PN extremadamente bajo. Este estudio, citado
previamente, tenía unos criterios sólidos de inclusión y exclusión en
la muestra con el fin de garantizar la selección de una muestra
homogénea. El tamaño muestral era grande (78 recién nacidos), con
una tasa de rechazo mínima (1%) y sin abandonos (v. fig. 1). El
entorno altamente controlado utilizado en este estudio se describe
en el Ejemplo de investigación 9.15.

558
EJEMPLO DE INVESTIGACIÓN 9.15
Entorno altamente controlado
Extracto del estudio de investigación
Se utilizó un diseño de estudio experimental aleatorizado prospectivo
con tres grupos en una unidad de cuidados intensivos neonatales
(UCIN) de nivel III de 70 camas en el sureste de Estados Unidos… El
equipo de expertos en cuidados cutáneos, denominado Equipo de
investigación central (EIC), estaba constituido por el investigador
principal y tres profesionales de enfermería de práctica avanzada. El
EIC se encargaba de obtener el consentimiento parental y de realizar
evaluaciones seriadas de los cuidados cutáneos en los pacientes
incluidos durante los cuidados rutinarios en un intento para proteger
el entorno tranquilo del lactante. La evaluación cutánea inicial se
realizaba en las ocho horas posteriores a la extubación y a intervalos
de 10-12 horas mientras se utilizaba la CPAP nasal. (Newnam y
cols., 2015, págs. 37-38)

Valoración crítica
El entorno del estudio de Newnam y cols. (2015) estaba altamente
controlado debido a la estructura de la UCIN y a la organización y
el tipo de cuidados proporcionados en este entorno. Los
investigadores también se aseguraron de que los tratamientos con
CPAP se implementasen de forma continua con un dispositivo
nasal seleccionado (mascarilla, cánula, o mascarilla y cánula). Las
evaluaciones de la piel nasal se realizaron de forma precisa y
exacta por expertos (el EIC). Este entorno controlado fue apropiado
para este estudio con el fin de reducir los efectos de las variables
externas y para aumentar la credibilidad de los hallazgos.

PUNTOS CLAVE
• El muestreo consiste en seleccionar un grupo de personas,

559
eventos, conductas u otros elementos para estudiarlos.
• La teoría del muestreo fue elaborada para determinar la
forma más eficaz de adquirir una muestra que refleje con
exactitud la población en estudio.
• Los conceptos más importantes de la teoría del muestreo
son los de población, criterios de muestreo, población
diana, población accesible, elementos de estudio,
representatividad, aleatorización, marco de muestreo y
método o plan de muestreo.
• En la investigación cuantitativa, se desarrolla un plan de
muestreo para aumentar la representatividad de la
población diana y disminuir el sesgo sistemático y el error
de muestreo.
• En la investigación cualitativa, se desarrolla un plan de
muestreo para aumentar la profundidad y profusión de los
hallazgos relacionados con el fenómeno, situación, procesos
o elementos culturales que se están estudiando.
• Los dos tipos principales de planes de muestreo son el
probabilístico y el no probabilístico.
• Entre los métodos de muestreo probabilístico frecuentes
utilizados en la investigación en enfermería, están el
muestreo aleatorio simple, el muestreo aleatorio
estratificado, el muestreo por conglomerados y el muestreo
sistemático.
• Los cinco métodos de muestreo no probabilísticos
analizados en este capítulo son el muestreo por
conveniencia, el muestreo por cuotas, el muestreo
intencional, el muestreo por redes y el muestreo teórico.
• El muestreo por conveniencia se utiliza a menudo en
estudios cuantitativos.
• El muestro intencional, el muestreo por redes y el teórico se
utilizan con más frecuencia en la investigación cualitativa.
• Entre los factores que se deben considerar en la toma de
decisiones sobre el tamaño de la muestra en estudios
cuantitativos están el tipo de estudio, el número de
variables estudiadas, la sensibilidad de los métodos de
medición, las técnicas de análisis de datos y el tamaño del
efecto esperado.

560
• El análisis de la potencia es una forma eficaz de determinar
el tamaño muestral adecuado en estudios cuantitativos. En
el análisis de la potencia, se utilizan el tamaño del efecto, el
nivel de significación (α = 0,05) y la potencia estándar (0,8 o
el 80%) para determinar el tamaño de la muestra de un
estudio prospectivo y evaluar el tamaño de la muestra de
un estudio finalizado.
• El número de participantes en un estudio cualitativo es
adecuado cuando se alcanza la saturación y la verificación
de los datos sobre el tema de estudio.
• Los factores importantes que se han de considerar en la
determinación del tamaño de la muestra en los estudios
cualitativos son: 1) ámbito del estudio, 2) naturaleza del
tema, 3) calidad de los datos recogidos y 4) diseño del
estudio.
• Tres entornos frecuentes para la realización de estudios de
enfermería son los naturales, los parcialmente controlados y
los altamente controlados.

BIBLIOGRAFÍA
Aberson, C. L. Applied power analysis for the behavioral sciences. New
York, NY: Routledge Taylor & Francis Group; 2010.

Brown, S. J. Evidence-based nursing: The research-practice connection,


4th ed. Sudbury, MA: Jones & Bartlett; 2018.

Campbell, M. L., Kero, K. K., Templin, T. N. Mild, moderate, and


severe intensity cut-points for the Respiratory Distress Observation
Scale. Heart & Lung. 2017; 46(1):14–17.

Charmaz, K. Constructing grounded theory, 2nd ed. Los Angeles, CA:


Sage; 2014.

Chase, R. P., McMahon, S. A., Winch, P. J. “Tell me what you don’t


remember”; Care-seeking facilitators and barriers in the decade

561
following repetitive blast exposure among army combat veterans.
Military Medicine. 2016; 181(2):116–122.

Cohen, J. Statistical power analysis for the behavioral sciences, 2nd ed.
New York, NY: Academic Press; 1988.

CONSORT Group. Welcome to the CONSORT Website. Consultada


el 20 de marzo de 2017, en http://www.consort-statement.org, 2010.

Creswell, J. W. Research design: Qualitative, quantitative and mixed


methods approaches, 4th ed. Thousand Oaks, CA: Sage; 2014.

Creswell, J. W., Poth, C. N. Qualitative inquiry & research design:


Choosing among five approaches, 4th ed. Thousand Oaks, CA: Sage;
2018.

De Silva, J., Hanwella, R., de Silva, V. A. Direct and indirect cost of


schizophrenia in outpatients treated in a tertiary care psychiatry
unit. Ceylon Medical Journal. 2012; 57(1):14–18.

Gray, J. R., Grove, S. K., Sutherland, S. The practice of nursing


research: Appraisal, synthesis, and generation of evidence, 8th ed. St.
Louis, MO: Elsevier Saunders; 2017.

Grove, S. K., Cipher, D. J. Statistics for nursing research: A workbook


for evidence-based practice, 2nd ed. St. Louis: MO: Elsevier; 2017.

Kerlinger, F. N., Lee, H. B. Foundations of behavioral research. New


York, NY: Harcourt Brace; 2000.

Kraemer, H. C., Theimann, S. How many subjects? Statistical power


analysis in research. Newbury Park, CA: Sage; 1987.

Lee, J. S., Mishra, G., Hayashi, K., Watanabe, E., Mori, K.,

562
Kawakubo, K. Combined eating behaviors and overweight: Eating
quickly, late evening meals, and skipping breakfast. Eating
Behaviors. 2016; 21(1):84–88.

Lee, S., Faucett, J., Gillen, M., Krause, N., Landry, L. Risk perception
of musculoskeletal injury among critical-care nurses. Nursing
Research. 2013; 62(1):36–44.

Mansour, M. Methodological and ethical challenges in investigating


the safety of medication administration. Nurse Researcher. 2011;
18(4):28–32.

Marshall, C., Rossman, G. B. Designing qualitative research, 6th ed.


Thousand Oaks, CA: Sage; 2016.

Melnyk, B. M., Gallagher-Ford, E., Fineout-Overholt. Implementing


evidence-based practice competencies in healthcare: A practical guide for
improving quality, safety, & outcomes. Indianapolis, IN: Sigma Theta
Tau International; 2017.

Munhall, P. L. Nursing research: A qualitative perspective, 5th ed.


Sudbury, MA: Jones & Bartlett Learning; 2012.

Muroi, M., Shen, J. J., Angosta, A. Association of medication errors


with drug classifications, clinical units, and consequence of errors:
Are they related? Applied Nursing Research. 2017; 33(1):180–185.

Newnam, K. M., McGrath, J. M., Salyer, J., Estes, T., Jallo, N., Bass,
T. A comparative effectiveness study of continuous positive airway
pressure-related skin breakdown when using different nasal
interfaces in the extremely low birth weight neonate. Applied
Nursing Research. 2015; 28(1):36–41.

563
Quinn, P. A grounded theory study of how nurses integrate
pregnancy and full-time employment. Nursing Research. 2016;
65(3):170–178.

Reinke, L. F., Feemster, L. C., McDowell, J., Gunnink, E.,


Tartaglione, E. V., Udris, E., et al, The long term impact of an end-
of-life communication intervention among veterans with COPD.
Heart & Lung 46 1 2017:30–34

Rew, L., Powell, T., Brown, A., Becker, H., Slesnick, N. An


intervention to enhance psychological capital and health outcomes
in homeless female youths. Western Journal of Nursing Research. 2017;
39(3):356–373.

Ruffano, L. F., Dinnes, J., Sitch, A. J., Hyde, C., Deeks, J. H. Test-
treatment RCTs are susceptible to bias: A review of the
methodological quality of randomized trials that evaluate
diagnostic tests. BMC Medical Research Methodology. 2017; 17(1):1–12.

Sadeghi, N., Hasanpour, M., Heidarzadeh, M., Alamolhoda, A.,


Waldman, E. Spiritual needs of families with bereavement and loss
of an infant in the neonatal intensive care unit: A qualitative study.
Journal of Pain and Symptom Management. 2016; 52(1):35–42.

Waltz, C. F., Strickland, O. L., Lenz, E. R. Measurement in nursing


and health research, 5th ed. New York, NY: Springer Publishing
Company; 2017.

564
CAPÍTULO 10

Clarificación de la
medición y la
recogida de datos en
investigación
cuantitativa
Susan K. Grove

La página web de la National Guideline Clearinghouse de la Agency for


Healthcare Research and Quality (AHRQ) se cerró en 2018. Puede
consultarse más información en https://www.ahrq.gov/.

ÍNDICE DEL CAPÍTULO

Conceptos de la teoría de la medición, 260


Exactitud, precisión y error de las medidas fisiológicas,
269
Uso de la sensibilidad, la especificidad y los cocientes

565
de verosimilitudes para determinar la calidad de las
pruebas diagnósticas, 272
Estrategias de medición en enfermería, 276
Proceso de recogida de datos, 286
Puntos clave, 289
Bibliografía, 290

OBJETIVOS DE APRENDIZAJE
Tras concluir este capítulo, el lector debería ser capaz de:
1. Describir la teoría de la medición y sus conceptos relevantes
de inmediatez de la medición, niveles de medición, errores de
medición, fiabilidad y validez.
2. Determinar los niveles de medición (nominal, ordinal, de
intervalo y de razón) conseguidos mediante los métodos de
medición en los estudios.
3. Valorar de forma crítica la fiabilidad y validez de los métodos
de medición en los estudios.
4. Valorar de forma crítica la exactitud, precisión y error de las
medidas fisiológicas utilizadas en los estudios.
5. Valorar de forma crítica la sensibilidad, especificidad, valor
predictivo negativo y cocientes de verosimilitudes de las
pruebas diagnósticas utilizadas en investigación y la práctica
clínica.
6. Valorar de forma crítica las estrategias de medición (medidas
fisiológicas, observaciones, entrevistas, cuestionarios y
escalas) usadas en estudios cuantitativos.
7. Valorar de forma crítica la calidad de la sección de recogida de
datos en los estudios cuantitativos.

La medición de calidad de las funciones y emociones humanas es

566
esencial en investigación y en la práctica clínica. La medición es el
proceso de asignar cifras o valores a conceptos, objetos, eventos o
situaciones usando un conjunto de reglas (Kaplan, 1963). Las reglas
de medición establecidas para la investigación son similares a las
usadas en la práctica enfermera. Por ejemplo, la presión arterial
(PA) de un paciente se mide con instrumentos fisiológicos (p. ej.,
estetoscopio, manguito, esfigmomanómetro). Medir la PA requiere
que el paciente descanse 5 minutos y después debe sentarse sin
cruzar las piernas, con el brazo relajado en la mesa a la altura del
corazón, colocando el manguito de PA del tamaño adecuado en el
lugar correcto en el brazo libre de ropa apretada. Además, el
fonendoscopio debe estar situado correctamente sobre la arteria
braquial en la flexura del codo (Weber y cols., 2014). Seguir estas
normas garantiza que la PA del paciente se mide de forma exacta y
precisa, y que cualquier cambio en la lectura de la PA puede
atribuirse a una variación de PA y no a un error inadvertido en la
técnica de medición. En investigación, las variables se miden con el
método de medición de la máxima calidad disponible con el fin de
producir unos datos fiables para el análisis estadístico, que son
esenciales si se quiere que los hallazgos del estudio sean creíbles
para guiar la práctica enfermera (Waltz, Strickland y Lenz, 2017).
Para la valoración crítica de la idoneidad de los métodos de
medición en los estudios de enfermería, es importante entender la
lógica de la medición. Este capítulo incluye un análisis de los
conceptos clave de la teoría de la medición con ejemplos de
estudios de enfermería. Se abordan las valoraciones críticas de la
exactitud y precisión de las medidas fisiológicas y la sensibilidad y
especificidad de las pruebas diagnósticas. Se describen brevemente
los métodos o estrategias de medición más frecuentes que se usan
en la investigación en enfermería. El capítulo concluye con las
directrices para la valoración crítica del proceso de recogida de
datos en los estudios.

CONCEPTOS DE LA TEORÍA DE LA
MEDICIÓN
La teoría de la medición fue desarrollada hace muchos años por

567
matemáticos, estadísticos y otros investigadores para guiar el modo
en el que se miden las cosas (Kaplan, 1963). Las reglas de medición
fomentan la consistencia en el modo en el que los individuos
realizan las mediciones, de modo que un método de medición
usado por una persona producirá resultados similares de forma
constante cuando lo use otra persona. Esta sección trata algunos de
los conceptos y reglas básicas de la teoría de la medición, como la
inmediatez de la medición, los niveles de medición, el error de
medición, así como la fiabilidad y la validez.

Inmediatez de la medición
Los investigadores primero deben identificar el objeto,
característica, elemento, evento o situación que se va a medir en su
estudio. En algunos casos, identificar el objeto que se va a medir y
determinar cómo medirlo es bastante sencillo, como al medir el
peso y altura de una persona. Estas se denominan medidas directas.
Las medidas directas implican determinar el valor de factores
concretos, como peso, circunferencia de la cintura, temperatura,
frecuencia cardiaca y PA. Se dispone de tecnología para medir
muchas funciones corporales, indicadores biológicos y
características químicas (Stone y Frazier, 2017). El enfoque de la
medición en estos casos está en la exactitud del método y la
precisión del proceso de medición. Si la PA de un paciente tiene que
ser exacta, debe medirse con un fonendoscopio, un manguito y un
esfigmomanómetro de calidad y debe determinarse de forma
precisa y constante, como se comentó anteriormente. En
investigación suelen realizarse tres mediciones de PA y se hace la
media para determinar la lectura más exacta y precisa de PA
(Weber y cols., 2014). Los investigadores de enfermería también
tienen experiencia en reunir medidas directas de variables
demográficas, como edad, nivel educativo, número de cirugías y
días de hospitalización.
En enfermería, a menudo lo que se mide no es un objeto concreto
sino una idea, característica o concepto abstracto, como dolor,
afrontamiento, depresión y adherencia. Los investigadores no
pueden medir directamente una idea abstracta, pero pueden
capturar alguno de sus elementos para su medición, que se

568
denominan medidas indirectas o indicadores de los conceptos. Es
infrecuente, si no imposible, que una única estrategia de medición
pueda medir todos los aspectos de un concepto abstracto. Por tanto,
se necesitan múltiples métodos o indicadores de medición, e incluso
no puede esperarse que estos midan todos los elementos de un
concepto abstracto. Por ejemplo, para describir el dolor en un
estudio podrían usarse múltiples métodos de medición, lo que
disminuye el error de medición y aumenta la comprensión del
dolor. Los métodos de medición del dolor podrían ser la FACES
Pain Rating Scale, la observación (frotamiento y/o defensa del área
dolorosa, gestos faciales y llanto) y medidas fisiológicas como el
pulso, la PA y la respiración.
La figura 10-1 muestra cómo múltiples medidas del dolor
aumentan la comprensión del concepto. La circunferencia más
grande negra representa el concepto de dolor y los círculos más
pequeños de color claro representan los métodos de medición. El
círculo más grande está representado por las medidas fisiológicas
(pulso, PA y respiraciones), que proporcionan una medición más
objetiva del dolor. El concepto completo de dolor no se mide
totalmente incluso con los tres tipos diferentes de métodos de
medición usados, como indican las áreas blancas dentro de la
circunferencia negra.

FIG 10.1 Múltiples medidas del concepto de dolor.

569
Niveles de medición
Diversos instrumentos y escalas de medición dan lugar a datos que
están a diferentes niveles. Los niveles de medición tradicionales
fueron desarrollados por Stevens (1946), quien organizó las reglas
para asignar cifras a los objetos, de modo que se estableciera una
jerarquía en las mediciones. Los niveles de medición, de menor a
mayor, son nominal, ordinal, de intervalo y de razón.

Nivel de medición nominal


El nivel de medición nominal es la categoría más baja de las
cuatro. Se utiliza cuando los datos pueden organizarse en categorías
de una propiedad definida, pero no pueden ordenarse por rango.
Por ejemplo, los investigadores en ocasiones clasifican a los
participantes de un estudio por su diagnóstico médico. Sin
embargo, la categoría cálculo renal no puede clasificarse como más
alta que la categoría úlcera gástrica; de forma similar, dentro de las
categorías, quiste ovárico no está más próximo a cálculo renal que a
úlcera gástrica. Las categorías difieren en calidad, pero no en
cantidad. Por tanto, no es posible decir que un participante A del
estudio posee más cantidad de la propiedad usada para la
clasificación que el participante B. (Regla: las categorías no pueden
ordenarse.) Las categorías deben establecerse de modo que cada
dato entre solo en una de ellas. (Regla: las categorías deben ser
excluyentes.) Por ejemplo, un participante del estudio puede haber
enviudado en el pasado, pero se ha vuelto a casar. Si el cuestionario
demográfico incluyese «Estado civil» y las categorías «Viudo» y
«Casado», ¿qué habría seleccionado el individuo? En esta situación,
el investigador debería redefinir la variable para que fuese «Estado
civil actual», de modo que las categorías sean excluyentes. Todos
los datos deben ajustarse a las categorías establecidas. (Regla: las
categorías deben ser exhaustivas.) El cuestionario demográfico
puede incluir una variable denominada «Diagnósticos médicos
cardiacos», con las opciones de «Hipertensión», «Insuficiencia
cardiaca» e «Infarto de miocardio». Estas opciones no son
exhaustivas, porque las personas con miocardiopatía no sabrían
qué marcar. Los investigadores podrían añadir una categoría de
«Otros», para que los «Diagnósticos médicos cardiacos» fuesen

570
exhaustivos, pero estos datos son difíciles de analizar e interpretar.
Son ejemplos de datos nominales el sexo, la raza y la etnicidad, el
estado civil y los diagnósticos. Las reglas para los cuatro niveles de
medición se resumen en la figura 10.2 (Grove y Cipher, 2017).

FIG 10.2 Resumen de las reglas para los niveles de


medición.

Nivel de medición ordinal


Con el nivel de medición ordinal, los datos se asignan a categorías
que pueden ordenarse. (Regla: las categorías pueden ordenarse.)
Para ordenar los datos, se juzga (se ordena) si una categoría es
mayor o menor, o mejor o peor que otra. Las reglas determinan
cómo se ordenan los datos. Al igual que con los datos nominales,
las categorías deben ser excluyentes (cada dato encaja solo en una
categoría) y exhaustivas (todos los datos encajan al menos en una
categoría; v. fig. 10.2). En los datos ordinales, también puede
identificarse la cantidad (Stevens, 1946). Por ejemplo, si se está
midiendo la intensidad del dolor, se pueden identificar diferentes
niveles de este. Probablemente se desarrollarán categorías que
ordenen estos diferentes niveles de dolor, como insoportable,
intenso, moderado, leve y ausente. Sin embargo, al usar categorías

571
de medición ordinales, no se puede saber con certeza si los
intervalos entre las categorías ordenadas son iguales. Puede existir
una diferencia mayor entre dolor leve y moderado, por ejemplo,
que entre dolor insoportable e intenso. Por ello, se considera que los
datos ordinales tienen intervalos desiguales.
Muchas escalas utilizadas en investigación de enfermería tienen
niveles ordinales de medición. Por ejemplo, es posible ordenar en
una escala ordinal los niveles de movilidad, la capacidad para el
autocuidado o los niveles de disnea. Para la disnea con las
actividades de la vida diaria (AVD), la escala podría ser:

0 = ausencia de disnea con las AVD.


1 = disnea mínima con las AVD.
2 = disnea moderada con las AVD.
3 = disnea extrema con las AVD.
4 = disnea tan intensa que la persona es incapaz de realizar las
AVD sin ayuda.

La medición es ordinal porque no es posible pedir que exista una


distancia igual entre las clasificaciones. Puede existir una diferencia
menor entre las clasificaciones 1 y 2 que entre la 3 y la 4.

Nivel de medición de intervalo


El nivel de medición de intervalo usa escalas que tienen la misma
distancia numérica entre los intervalos. Estas escalas siguen las
reglas de las categorías mutuamente excluyentes, exhaustivas y
ordenadas, y se asume que representan un continuum de valores.
(Regla: las categorías deben tener intervalos iguales entre ellas.) Por
tanto, la magnitud del atributo puede definirse de forma más
precisa. Sin embargo, no es posible aportar la cantidad absoluta de
este porque la escala de intervalo carece de punto cero. La
temperatura es el ejemplo más usado de una escala de intervalo. La
diferencia entre las temperaturas de 70 y 80 °C es la misma que
entre las temperaturas de 30 y 40 °C. Los cambios de temperatura
pueden medirse con precisión. Sin embargo, una temperatura de 0
°C no indica ausencia de temperatura.

Nivel de medición de razón

572
El nivel de medición de razón es el más alto de los niveles y
cumple todas las reglas de las demás formas de medición:
categorías mutuamente excluyentes, exhaustivas, ordenadas,
intervalos igualmente espaciados y un continuum de valores. Los
datos a nivel de intervalo y de razón pueden sumarse, restarse,
multiplicarse y dividirse debido a los intervalos iguales y al
continuum de valores de estos datos. Por tanto, los datos de
intervalo y de razón pueden analizarse con técnicas estadísticas de
mayor potencia para determinar relaciones y diferencias
significativas en los estudios (Grove y Cipher, 2017). Además, las
mediciones a nivel de razón tienen un punto cero absoluto. (Regla:
los datos deben tener un cero absoluto [v. fig. 10.2].) El peso, la
longitud y el volumen se usan frecuentemente como ejemplos de
escalas de razón. Las tres tienen cero absoluto, en el cual el valor
cero indica la ausencia de la propiedad que se mide; un peso cero
significa la ausencia de peso. Debido a la presencia de cero
absoluto, pueden justificarse afirmaciones como «El participante A
pesa 10 kg más que el participante B» o «El envase de medicación A
tiene el doble que el envase B» (Stevens, 1946). En la valoración
crítica de un estudio debe determinarse el nivel de medición
logrado para cada método.

Error de medición
La medida perfecta ideal se denomina medida o puntuación
verdadera. Sin embargo, en cualquier estrategia de medición
siempre existe cierto error. El error de medición es la diferencia
entre la medición verdadera y la que se mide realmente (Gray,
Grove y Sutherland, 2017). La cantidad de error de una medición
varía desde un error considerable en una medición hasta un error
muy pequeño en otra. Las mediciones directas, que generalmente se
espera que sean muy exactas, están sujetas a error. Por ejemplo, una
báscula puede tener una inexactitud de 225 g, un equipo de PA con
calibración precisa podría disminuir de precisión con el uso o una
cinta métrica puede no mantenerse con la misma tensión al medir la
cintura de cada paciente. Un participante en un estudio puede tener
65 años, pero puede escribirlo de forma ilegible en el formulario
demográfico. Como consecuencia, la edad puede introducirse de

573
forma inexacta en la base de datos del estudio.
En las mediciones indirectas, el elemento que se mide no puede
verse de forma directa. Por ejemplo, el dolor no puede verse.
Pueden observarse conductas u oírse palabras que se piensa que
representan dolor, pero es una sensación que no siempre se
reconoce o se expresa claramente por la persona que lo
experimenta. La medición del dolor suele realizarse con una escala,
pero también puede incluir la observación y medidas fisiológicas.
En ocasiones, las mediciones pueden identificar algunos aspectos
del concepto, pero pueden incluir otros elementos que no son parte
de él. En la figura 10.1, los métodos de medición de la escala, la
observación y las medidas fisiológicas incluyen factores diferentes
al dolor, como indican las partes de los círculos coloreados que
están fuera de la circunferencia negra del concepto de dolor. Por
ejemplo, los métodos de medición para el dolor podrían estar
midiendo aspectos de la ansiedad y el temor añadidos. Sin
embargo, la medición de un concepto con múltiples métodos suele
reducir el error de medición y aumenta la comprensión del
concepto que se mide.
Hay dos tipos de error importantes en medición: el error aleatorio
y el error sistemático. La diferencia entre ambos está en la dirección
del error. En el error de medición aleatorio, la diferencia entre el
valor medido y el valor verdadero no tiene un patrón o dirección
(aleatorio). En una medición, el valor real obtenido puede ser
menor que el valor verdadero, mientras que en la siguiente
medición puede ser mayor. Durante el proceso de medición pueden
producirse una serie de situaciones o factores casuales que pueden
dar lugar a un error aleatorio (Waltz y cols., 2017). Por ejemplo, la
persona que toma las mediciones puede no usar el mismo método
todas las veces, un participante en el estudio que rellena una escala
a mano puede marcar accidentalmente la columna errónea o una
persona que introduce los datos en un ordenador puede pulsar la
tecla equivocada. El propósito de la medición es calcular el valor
verdadero, generalmente combinando una serie de valores y
calculando la media. Un valor promedio, como la media, es una
estimación más cercana a la medición verdadera. A medida que
aumenta el número de errores aleatorios, disminuye la precisión de
la estimación.

574
El error de medición que no es aleatorio se denomina error
sistemático. En el error de medición sistemático, la variación en los
valores de medición a partir de la media calculada es
principalmente en la misma dirección. Por ejemplo, la mayor parte
de la variación puede ser más alta o más baja que la media que se
calculó. El error sistemático ocurre porque se está midiendo algo
más que el concepto. Por ejemplo, una escala de clasificación a
mano diseñada para medir la esperanza realmente puede estar
midiendo también el apoyo percibido. Cuando se mide el peso de
los participantes, una báscula que muestre que el peso es 1 kg por
encima del peso verdadero dará las mediciones con un error
sistemático. Todos los pesos medidos serán altos y, como resultado,
la media será más alta que si se utilizara una báscula exacta.
En la valoración crítica de un estudio, no se podrá juzgar
directamente la extensión del error de medición. Sin embargo,
pueden encontrarse claves acerca de la cantidad del error de
medición en el informe publicado. Por ejemplo, si los
investigadores han descrito el método de medición con gran detalle
y han aportado pruebas de la exactitud y precisión de la medición,
la probabilidad de error suele reducirse. Los errores de medición en
las lecturas de PA pueden minimizarse comprobando la exactitud
del esfigmomanómetro y recalibrándolo periódicamente durante la
recogida de los datos, obteniendo tres lecturas de PA y hallando la
media para determinar un valor para cada participante, y teniendo
personal de enfermería capacitado que use un protocolo para tomar
las lecturas de PA. Si se desarrolla una lista de comprobación de las
conductas del dolor para su observación, se produce menos error
que si las observaciones del dolor no son estructuradas. La
medición también será más precisa si los investigadores realizan la
descripción usando una escala válida, fiable y bien desarrollada
como la FACES Pain Scale, en lugar de desarrollar una escala nueva
para su estudio. Se debe realizar una valoración crítica de los pasos
que los investigadores han dado para disminuir el error de
medición en sus estudios.

Fiabilidad
La fiabilidad se centra en la consistencia de un método de

575
medición. Por ejemplo, si se está usando una escala de múltiples
ítems para medir la depresión, la escala debería indicar
puntuaciones de depresión similares siempre que una persona la
cumplimente en un corto periodo de tiempo. Una escala que no
proporciona puntuaciones similares cuando se repite la evaluación
de una persona se considera poco fiable y da lugar a un mayor error
de medición (Waltz y cols., 2017). Por ejemplo, la escala Center for
Epidemiologic Studies-Depression (CES-D) se desarrolló mediante
investigaciones para diagnosticar la depresión en pacientes de
salud mental (Radloff, 1977). La escala CES-D se ha usado durante
los últimos 40 años y ha demostrado ser una medida de calidad de
la depresión en la práctica clínica. La figura 10-3 ilustra esta escala
de Likert de 20 ítems. Si los ítems de esta escala miden de forma
coherente aquello para lo que se desarrolló, la depresión, entonces
esta escala se considera fiable y válida. Los diferentes tipos de
pruebas de fiabilidad y validez que se muestran en la tabla 10.1 se
describen en las siguientes secciones.

TABLA 10.1
DETERMINACIÓN DE LA CALIDAD DE LOS MÉTODOS DE
MEDICIÓN

576
577
FIG 10.3 Escala Center for Epidemiologic Studies-
Depression (CES-D). (Adaptada de Radloff, L. S. [1977]. The
CES-D scale: A self-report depression scale for research in the
general population. Applied Psychological Measures, 1[3], 385-
394.)

Prueba de fiabilidad
Las prueba de fiabilidad determina el error de medición en un
instrumento o escala que se utiliza en un estudio (Waltz y cols.,

578
2017). Puesto que todos los métodos de medición contienen cierto
error, existen grados de fiabilidad que generalmente se expresan
como un coeficiente de correlación. Las estimaciones de fiabilidad son
específicas para la muestra que se está evaluando. Los valores altos de
fiabilidad comunicados para un instrumento dado no garantizan
que la fiabilidad sea satisfactoria en otra muestra o con una
población diferente. Los investigadores deben realizar pruebas de
fiabilidad en cada instrumento usado en un estudio para asegurarse
de que es fiable para ese estudio (Bialocerkowski, Klupp y Bragge,
2010; DeVon y cols., 2007).
Las pruebas de fiabilidad se centran en los aspectos siguientes:
estabilidad, equivalencia y homogeneidad (v. tabla 10.1). La
fiabilidad de la estabilidad se relaciona con la reproducibilidad de
las puntuaciones cuando se repiten las medidas del mismo
concepto o atributo con la misma escala o instrumento a lo largo del
tiempo. La estabilidad del instrumento suele determinarse usando
la fiabilidad test-retest. Esta medida de fiabilidad suele usarse con
las medidas físicas, medidas tecnológicas y escalas. Una suposición
de la fiabilidad test-retest es que el atributo que se ha de medir
sigue siendo igual en los dos momentos de evaluación y que
cualquier cambio en el valor o puntuación se debe al error aleatorio.
Por ejemplo, una medida fisiológica como la determinación de la
PA, puede probarse y volver a probarse inmediatamente, o bien
puede usarse una vez el equipo y después volver a probarlo para
determinar la frecuencia de recalibración necesaria. Los
investigadores deben incluir los resultados de la fiabilidad test-
retest en sus estudios publicados para documentar la fiabilidad de
sus métodos de medición. Por ejemplo, la escala CES-D (v. fig. 10.3)
se ha usado frecuentemente en estudios de enfermería y ha
demostrado unos valores de fiabilidad test-retest que varían de r =
0,51 a r = 0,67 en intervalos de 2 a 8 semanas. Esta es una fiabilidad
test-retest muy sólida para la CES-D, lo que indica que mide la
depresión de forma coherente con pruebas repetidas y que reconoce
que los niveles de depresión de los sujetos varían en cierto modo
con el tiempo (Armenta, Hartshorn, Whitbeck, Crawford y Hoyt,
2014; Sharp y Lipsky, 2002).
Las pruebas de fiabilidad también incluyen la equivalencia, que
implica la comparación de dos versiones del mismo instrumento

579
manual o de dos observadores que miden el mismo evento. La
comparación de dos observadores o dos jueces en un estudio se
denomina fiabilidad interobservador (Polit y Yang, 2016). Los
estudios que realizan una recogida de datos observacionales o la
realización de juicios por dos o más recopiladores de datos
requieren la comunicación de la fiabilidad interobservador. No
existe un valor absoluto por debajo del cual sea inaceptable la
fiabilidad interobservador. Sin embargo, cualquier valor menor de
0,80 debería suscitar una preocupación seria sobre la fiabilidad de
los datos, el recopilador de los datos o ambos. El mejor valor de la
fiabilidad interobservador es de 0,90 o del 90%, lo que significa que
los encargados de recoger los datos son equivalentes durante el
estudio.
La comparación de dos instrumentos manuales o escalas se
denomina fiabilidad de formas alternativas o fiabilidad de formas
paralelas (Waltz y cols., 2017). Las formas alternativas de los
instrumentos tienen interés en el desarrollo de pruebas de
conocimiento normativo como el Scholastic Aptitude Test (SAT),
que se usa como requerimiento para la entrada en la universidad. El
SAT se ha utilizado durante décadas y hay muchas formas de la
prueba con diversos ítems en cada una. Estas formas alternativas
del SAT se desarrollaron para medir de forma coherente el
conocimiento de los estudiantes y para proteger la integridad de la
prueba.
La consistencia interna también se denomina prueba de la
fiabilidad de la homogeneidad y se usa sobre todo con escalas de
múltiples ítems, en las que cada ítem de la escala se correlaciona
con todos sus demás ítems para determinar la consistencia (v. tabla
10.1). El principio es que cada ítem debería medir de forma
homogénea un concepto, como depresión, y debería presentar una
correlación elevada con los otros ítems de la escala. El coeficiente α
de Cronbach es la medida más usada de fiabilidad interna para
escalas con múltiples ítems. Este coeficiente solo se puede calcular
para datos a nivel de intervalo y de razón. Un coeficiente de 1,00
indica una fiabilidad perfecta y un coeficiente de 0,00 indica
ausencia de fiabilidad (Waltzy cols., 2017). Una fiabilidad de 0,80 se
suele considerar un coeficiente potente para una escala que se ha
usado en varios estudios. Por ejemplo, la escala CES-D tiene una

580
alta fiabilidad de la consistencia interna, con valores α de Cronbach
que oscilan entre 0,84 y 0,90 en estudios de campo (Armenta y cols.,
2014; Locke y Putnam, 2002; Sharp y Lipsky, 2002). Para escalas
relativamente nuevas, una fiabilidad de 0,70 se considera aceptable,
porque la escala se está mejorando y se usa con diversas muestras.
Los coeficientes de correlación más potentes, que están más
cercanos a 1,0, indican menos error aleatorio y una escala más
fiable. Si los datos son dicotómicos (respuestas sí o no), se usa la
fórmula de Kuder-Richardson (K-R 20) para estimar la consistencia
interna (Waltz y cols., 2017). Un informe de investigación debería
incluir los resultados de las pruebas de fiabilidad, de estabilidad,
equivalencia y/o homogeneidad realizadas a un método de
medición en la investigación previa y en el estudio actual (Gray y
cols., 2017).

Validez
La validez de un instrumento es la determinación de lo bien que
dicho instrumento mide el concepto abstracto que se examina. La
validez, como la fiabilidad, no es un fenómeno de todo o nada; se
mide en un continuum. Ningún instrumento es totalmente válido,
de modo que los investigadores determinan el grado de validez de
un instrumento, en lugar de si existe validez (DeVon y cols., 2007;
Waltz y cols., 2017). La validez variará de una muestra a otra y de
una situación a otra; por tanto, las pruebas de validez evalúan el
uso de un instrumento para un grupo o propósito específico, más
que el propio instrumento. Un instrumento puede ser válido en una
situación, pero no en otra. Por ejemplo, la escala CES-D se
desarrolló para medir la depresión en pacientes en centros de salud
mental. ¿Será válida la misma escala como medida de la depresión
en pacientes con cáncer? Los investigadores determinan esto con
pruebas piloto de la escala para examinar la validez del
instrumento en una población nueva. La CES-D original (v. fig. 10-
3) se desarrolló para adultos, pero se han probado distintas
versiones de la escala en niños pequeños (4-6 años), niños de edad
escolar, adolescentes y adultos mayores. Se observó que estas
versiones de la CES-D son válidas en estos distintos grupos de edad
(Armenta y cols., 2014; Locke y Putnam, 2002; Sharp y Lipsky,

581
2002).
Existen muchos tipos de validez, pero este capítulo se centrará en
los tipos más descritos en los estudios de enfermería, que incluyen
la validez del contenido, la validez del constructo y la validez del
criterio (v. tabla 10.1; Bannigan y Watson, 2009; Polit y Yang, 2016).
La validez de contenido examina el grado en que el método o
escala de medición incluye todos los elementos o ítems principales
relevantes para el constructo que se mide. La evidencia de la
validez de contenido de una escala incluye lo siguiente: 1) en qué
medida los ítems de la escala reflejan la descripción del concepto en
la literatura (o validez aparente), 2) la evaluación de la relevancia
de los ítems de la escala por expertos del concepto, que podría
comunicarse como un índice, y 3) las respuestas potenciales de los
participantes a los ítems de la escala (Gray y cols., 2017).
La validez de constructo se centra en determinar si el
instrumento mide en realidad el constructo teórico que pretende
medir; esto implica examinar la concordancia entre las definiciones
conceptual y operacional de una variable (v. cap. 5). Tres tipos
frecuentes de validez de constructo que se presentan en los estudios
publicados son la evidencia de validez a partir de: 1) grupos de
contraste, 2) convergencia y 3) divergencia. La evidencia de la
validez de grupos de contraste de un instrumento puede probarse
identificando los grupos que se espera (o se sabe) que tienen
puntuaciones opuestas en un instrumento. Por ejemplo, los
investigadores seleccionan muestras de un grupo de individuos con
un diagnóstico de depresión y de un grupo que no tiene este
diagnóstico. Sería de esperar que estos dos grupos de individuos
tuvieran puntuaciones opuestas en la escala CES-D y también que
el grupo con el diagnóstico de depresión tuviera puntuaciones más
altas que aquellos sin ese diagnóstico, lo que respalda la validez del
constructo de esta escala.
La evidencia de validez por convergencia se determina cuando
se compara un instrumento relativamente nuevo con uno o varios
instrumentos existentes que miden el mismo constructo. Los
instrumentos (nuevos y existentes) se administran a una muestra al
mismo tiempo y los resultados se evalúan con análisis de
correlación. Si las mediciones tienen una correlación fuertemente
positiva, se refuerza la validez de cada instrumento. Por ejemplo, la

582
escala CES-D ha demostrado correlaciones positivas que oscilan de
0,40 a 0,80 con la escala de Hamilton para la depresión, lo que
apoya la validez de convergencia de ambas escalas (Locke y
Putnam, 2002; Sharp y Lipsky, 2002).
En ocasiones, puede establecerse que los instrumentos miden un
concepto opuesto al medido por el instrumento desarrollado de
novo. Por ejemplo, si el instrumento desarrollado de novo es una
medida de la esperanza, podría hacerse una búsqueda de un
instrumento que mida la desesperanza o la desesperación. Hacer
que los participantes de un estudio cumplimenten ambas escalas,
que miden conceptos opuestos, al mismo tiempo es una forma de
examinar la evidencia de validez por divergencia. Con las medidas
de los dos conceptos se realizan procedimientos de correlación. Si la
medición divergente (escala de desesperanza) se correlaciona
negativamente (de −0,4 a −0,8) con el otro instrumento (escala de
esperanza), se refuerza la validez de constructo de los instrumentos
(Waltz y cols., 2017).
La validez de criterio se refuerza cuando la puntuación del
participante en un estudio determinada con un instrumento se
puede utilizar para inferir su puntuación en otra variable o criterio.
Los dos tipos de validez de criterio son la validez predictiva y la
validez concurrente. La validez predictiva es el grado en el que la
puntuación de un individuo en una escala o instrumento puede
usarse para predecir su resultado o conducta futura en un criterio
(Waltz y cols., 2017). Por ejemplo, los investigadores de enfermería
podrían querer determinar la capacidad de una escala desarrollada
con el fin de medir las conductas de promoción de la salud para
predecir los valores futuros de PA, índice de masa corporal y
minutos de ejercicio diarios de los individuos.
La validez concurrente se centra en el grado en el que una
puntuación de un individuo en un instrumento o escala se puede
utilizar para estimar su rendimiento actual o concurrente en otra
variable o criterio. Por ejemplo, la validez concurrente podría
examinarse si se midiese la autoestima de un individuo y se usase
la puntuación para estimar su resultado en una escala de
afrontamiento de la enfermedad. Sería de esperar que los
individuos con puntuaciones de autoestima alta también tuviesen
puntuaciones de afrontamiento elevadas. La diferencia entre la

583
validez concurrente y la validez predictiva es el momento en el que
se mide el otro criterio. La validez concurrente se evalúa en un
periodo de tiempo corto, mientras que la validez predictiva se
evalúa en términos de resultado futuro.
La evidencia de la validez de un instrumento a partir de la
investigación previa y del estudio actual debe incluirse en el
informe publicado. Cuando se realiza la valoración crítica de un
estudio, se debe juzgar la validez de los métodos de medición que
se usaron. Sin embargo, no puede considerarse la validez separada
de la fiabilidad (v. tabla 10.1). Si un método de medición no tiene
una fiabilidad aceptable, no es válido.

Grado de legibilidad de los métodos de


medición
El grado de legibilidad se centra en la capacidad de los
participantes del estudio para leer y comprender el contenido de un
instrumento o escala. La legibilidad es esencial para considerar que
un instrumento es válido y fiable para una muestra (v. tabla 10.1).
La valoración del grado de legibilidad de un instrumento es
relativamente simple y requiere unos 10-15 minutos. Se dispone de
más de 30 fórmulas de legibilidad. Estas fórmulas utilizan
recuentos de elementos del lenguaje para proporcionar un índice
del grado probable de dificultad de comprensión de los ítems de
una escala (Gray y cols., 2017). Las fórmulas de legibilidad son
actualmente una parte estándar de los programas de procesamiento
de textos. Los investigadores deberían describir el nivel de lectura o
el nivel educativo que los participantes en el estudio necesitan para
cumplimentar un instrumento.

EXACTITUD, PRECISIÓN Y ERROR


DE LAS MEDIDAS FISIOLÓGICAS
Las medidas fisiológicas son métodos de medición que se usan
para cuantificar el nivel de funcionamiento de los seres humanos
(Ryan-Wenger, 2017). Se utilizan pruebas de laboratorio y
dispositivos biomédicos para medir constructos biofísicos como el

584
estado cardiaco en investigación y en la práctica. La precisión, la
exactitud y el error de las medidas fisiológicas y bioquímicas
tienden a no comunicarse o a describirse mínimamente en los
estudios publicados. Se asume que estas medidas fisiológicas de
rutina son exactas y precisas, pero esta suposición no siempre es
correcta. Algunas de las medidas fisiológicas más utilizadas en los
estudios de enfermería son la PA, la frecuencia cardiaca, el peso, el
índice de masa corporal y los valores de laboratorio. En ocasiones,
los investigadores obtienen estas medidas de la historia del
paciente, sin considerar su exactitud. Por ejemplo, ¿cuántas veces el
personal de enfermería pregunta al paciente su altura o su peso, en
lugar de medir o pesar al paciente? Los investigadores que utilizan
medidas fisiológicas deben aportar evidencias de la exactitud,
precisión y potencial de error de las medidas (v. tabla 10.1; Gift y
Soeken, 1988; Ryan-Wenger, 2017).

Exactitud
La exactitud es comparable con la validez en que aborda el grado
en que el instrumento mide lo que se supone que se mide en un
estudio (Ryan-Wenger, 2017). Por ejemplo, las mediciones de la
saturación de oxígeno con pulsioximetría se consideran
comparables a las mediciones de la misma mediante gasometría
arterial. Puesto que la pulsioximetría es una medición exacta de la
saturación de oxígeno, se ha usado en los estudios porque es más
sencilla, menos cara, menos dolorosa y menos invasiva para los
participantes en la investigación. Los investigadores deben
documentar que se han realizado investigaciones previas para
determinar la exactitud de la pulsioximetría para la medición de los
niveles de saturación de oxígeno de los individuos en su estudio.

Precisión
La precisión es el grado de consistencia o reproducibilidad de las
mediciones realizadas con instrumentos fisiológicos. La precisión es
comparable a la fiabilidad. La precisión de la mayoría de los
equipos fisiológicos depende de seguir las instrucciones del
fabricante para su cuidado y comprobaciones rutinarias. La
fiabilidad test-retest es adecuada para las variables fisiológicas que

585
tienen fluctuaciones mínimas, como los niveles de lípidos, la
densidad mineral ósea o el peso en los adultos (Ryan-Wenger,
2017). La fiabilidad test-retest puede ser inadecuada si los valores
de las variables fluctúan frecuentemente con diversas actividades,
como el pulso, las respiraciones y la PA. Sin embargo, el método de
test-retest es una buena medida de la precisión si las mediciones se
realizan en sucesión rápida. Por ejemplo, las guías estadounidenses
para la PA recomiendan tomar tres lecturas de PA separadas 1-2
min y después hacer la media entre ellas para obtener la medición
más precisa y exacta de la PA (Weber y cols., 2014).

Error
Las fuentes de error en las medidas fisiológicas pueden agruparse
en cinco categorías: entorno, usuario, sujeto, equipo e
interpretación. El entorno influye en el equipo y en el participante
del estudio. Los factores del entorno podrían incluir la temperatura,
la presión barométrica y la electricidad estática. Los errores del
usuario están causados por la persona que utiliza el equipo y
pueden asociarse con variaciones del mismo usuario, diferentes
usuarios o cambios en los suministros o las técnicas utilizadas para
manejar el equipo. Los errores del sujeto se producen cuando el
participante altera el equipo o cuando el equipo altera al
participante. En algunos casos, puede no usarse la capacidad
completa del equipo. El error del equipo puede relacionarse con su
calibración o estabilidad. Las señales que transmite el equipo
también son una fuente de error y pueden dar lugar a una mala
interpretación. Los investigadores deben comunicar los protocolos
seguidos o los pasos dados para prevenir errores en sus medidas
fisiológicas y bioquímicas en sus estudios publicados (Ryan-
Wenger, 2017; Stone y Frazier, 2017).

GUÍAS DE VALORACIÓN CRÍTICA


Fiabilidad y validez de las escalas, y
exactitud, precisión y error de las medidas
fisiológicas

586
En la valoración crítica de un estudio, se debe determinar la
inmediatez y el nivel de la medición, la fiabilidad y validez de las
escalas, la exactitud y precisión de las medidas fisiológicas y los
posibles errores de medición para los diferentes métodos de
medición utilizados en el estudio. En la mayoría de los estudios, el
apartado de métodos consta de una explicación de los métodos de
medición y, para evaluarlos, se pueden utilizar las siguientes
preguntas:

1. ¿Qué método o métodos de medición se usaron para cada


variable del estudio?
2. ¿El tipo de medición fue directo o indirecto?
3. ¿Qué nivel de medición se consiguió para cada variable del
estudio?
4. ¿Se proporcionó información de la fiabilidad a partir de los
estudios previos y para este estudio?
5. ¿Se describió adecuadamente la validez de cada método de
medición? En algunos estudios los investigadores
simplemente afirman que el método de medición tiene una
validez aceptable basándose en la investigación previa. Esta
afirmación proporciona una información insuficiente para
juzgar la validez de un instrumento.
6. ¿Los investigadores abordaron la exactitud, la precisión y el
potencial de errores de las medidas fisiológicas?
7. ¿Se describió el proceso de obtención, puntuación y/o registro
de los datos?
8. ¿Los investigadores proporcionaron una descripción
adecuada de los métodos de medición para juzgar el grado
de error de medición?

Schmitt y cols. (2017) estudiaron las relaciones entre los


conceptos de depresión, automanejo e hiperglucemia en 430 adultos
con diabetes (57,7%, tipo 1, 42,3%, tipo 2). El Ejemplo de
investigación 10.1 describe algunos de los métodos de medición
usados en este estudio.

587
EJEMPLO DE INVESTIGACIÓN 10.1
Fiabilidad y validez de las escalas, y exactitud,
precisión y error de las medidas fisiológicas
Extracto del estudio de investigación
Síntomas depresivos
Los síntomas depresivos se midieron utilizando la escala Center for
Epidemiologic Studies-Depression (CES-D). La CES-D aborda las
frecuencias de 20 síntomas frecuentes de depresión durante la semana
previa. Las respuestas se proporcionan en una escala de Likert de
cuatro puntos que oscila entre 0 (pocas veces o nunca) y 3 (la mayoría
de las veces). Las puntuaciones totales oscilan entre 0 y 60. Los
valores más altos indican más síntomas depresivos. La CES-D tiene
una fiabilidad y validez muy buenas para evaluar la depresión… que
también se han confirmado para las personas con diabetes… En el
presente estudio, el α (alfa) de Cronbach fue de 0,88, lo que indica una
fiabilidad adecuada.

Control glucémico
Para estimar el control glucémico, se evaluó la hemoglobina
glucosilada (HbA 1c). Todas las muestras de sangre se analizaron en
un laboratorio central a la vez que se realizaron las evaluaciones
psicométricas. Los valores de HbA1c se determinaron utilizando
cromatografía líquida de alto rendimiento, realizada con el analizador
Bio-ad Variant II Turbo (que cumplía los estándares de medición de
HbA1c; estándar DCCT). El rango normal de laboratorio es de 4,3-
6,1% (24-43 mmol/mol). (Schmitt y cols., 2017, págs. 18-19)

Valoración crítica
Schmitt y cols. (2017) describieron la estructura y el proceso de
puntuación de la escala CES-D. La escala es una medida indirecta
de depresión que produce datos a nivel de intervalo. Una

588
puntuación de 16 en la CES-D se asocia con depresión. La CES-D se
ha utilizado mucho en diversos tipos de estudios y con pacientes
diabéticos, lo que aumenta la validez del constructo de la escala.
Los investigadores también identificaron la escala de 20 ítems que
medía los síntomas depresivos, lo que aborda la validez del
contenido. Se comunicó que la escala tenía «muy buena fiabilidad y
validez para valorar la depresión», pero no se aportó información
específica para sostener esta afirmación. El α de Cronbach para este
estudio fue de r = 0,88, lo que indica una consistencia interna
aceptable de la escala en este estudio. Los investigadores deberían
haber ofrecido información de la fiabilidad y validez de los
estudios previos para apoyar el uso de la escala CES-D en este
estudio (Gray y cols., 2017).
El control glucémico de los participantes se midió directamente
con la prueba de laboratorio de HbA1c, que proporciona una
glucemia promedio de los últimos 90 días en cada individuo. Las
muestras de sangre se recogieron en el mismo momento en el
estudio para todos los participantes y se analizaron en un
laboratorio central. Se siguieron los estándares actuales para el
análisis de sangre y se identificaron los resultados normales para la
HbA1c. Estas acciones aumentaron la precisión y exactitud de las
mediciones de HbA1c. Sin embargo, los investigadores deberían
haber proporcionado más detalles sobre la recogida,
almacenamiento y traslado de las muestras de sangre al
laboratorio. También deberían comentar la certificación del
laboratorio y el proceso para proporcionar los resultados a los
investigadores. Esta información es necesaria para determinar la
posibilidad de error de medición en este estudio (Ryan-Wenger,
2017).
Schmitt y cols. (2017) observaron que la depresión se relacionaba
con la hiperglucemia en las personas con diabetes de tipo tanto 1
como 2. Estos investigadores concluyeron que el tratamiento de la
depresión podría disminuir la hiperglucemia y fomentar un
autotratamiento mejor por parte de los pacientes con diabetes.

USO DE LA SENSIBILIDAD, LA

589
ESPECIFICIDAD Y LOS COCIENTES
DE VEROSIMILITUDES PARA
DETERMINAR LA CALIDAD DE LAS
PRUEBAS DIAGNÓSTICAS
Sensibilidad, especificidad y valores
predictivos de las pruebas diagnósticas
Una parte importante de la práctica basada en la evidencia (PBE)
es el uso de pruebas diagnósticas o de herramientas de detección
sistemática de calidad para determinar la presencia o ausencia de
enfermedad (Straus, Glasziou, Richardson, Rosenberg y Haynes,
2011). Los profesionales de enfermería deben saber qué pruebas de
laboratorio o de imagen son mejores para el diagnóstico de
enfermedades específicas. Cuando se realiza la prueba, ¿los
resultados son exactos? La exactitud de una prueba de cribado o de
una prueba utilizada para confirmar un diagnóstico se evalúa en
términos de su capacidad de valorar la presencia o ausencia de una
enfermedad o trastorno de forma correcta cuando se compara con el
patrón oro. El patrón oro es el método más exacto de diagnosticar
en la actualidad una enfermedad particular o la mejor práctica
actual (Umberger, Hatfield y Speck, 2017) y sirve de base para la
comparación con las pruebas diagnósticas o de cribado recién
desarrolladas. Si la prueba es positiva, ¿cuál es la probabilidad de
que esté presente la enfermedad? Si la prueba es negativa, ¿cuál es
la probabilidad de que la enfermedad no esté presente? Cuando el
personal de enfermería y los médicos comentan a sus pacientes los
resultados de sus pruebas, ¿qué seguridad tienen de que el paciente
tenga o no la enfermedad? Sensibilidad y especificidad son
términos que se usan con frecuencia para describir la exactitud de
una prueba diagnóstica (Grove y Cipher, 2017). Estos términos se
utilizan en estudios y otro tipo de literatura sanitaria, y queremos
que el lector sea capaz de comprenderlos y de apreciar su utilidad
para la práctica y la investigación.
Los posibles resultados de una prueba de cribado para una
enfermedad son: 1) verdadero positivo, que es una identificación

590
exacta de la presencia de una enfermedad, 2) falso positivo, que
indica que una enfermedad está presente cuando no lo está, 3) falso
negativo, que indica que una enfermedad no está presente cuando
sí lo está o 4) verdadero negativo, que indica con exactitud que una
enfermedad no está presente. La tabla 10.2 se usa frecuentemente
para visualizar estos cuatro resultados (Grove y Cipher, 2017;
Straus y cols., 2011).

TABLA 10.2
RESULTADOS POSIBLES DE LAS PRUEBAS
DIAGNÓSTICAS O DE CRIBADO

a, número de personas que tienen la enfermedad y en las que la prueba es


positiva (verdaderos positivos).
b, número de personas que no tienen la enfermedad y en las que la prueba
es positiva (falsos positivos).
c, número de personas que tienen la enfermedad y en las que la prueba es
negativa (falsos negativos).
d, número de personas que no tienen la enfermedad y en las que la prueba
es negativa (verdaderos negativos).
Tomada de Grove, S. K. y Cipher, D. J. (2017). Statistics for nursing
research: A workbook for evidence-based practice (2.ª ed.) (pág. 393). San
Luis, Missouri: Elsevier.
Se puede calcular la sensibilidad y la especificidad basándose en
los hallazgos de la investigación y en los resultados de la práctica
clínica para determinar la herramienta diagnóstica o de cribado más
exacta que utilizar cuando se identifica la presencia o ausencia de
una enfermedad en una población de pacientes. Más recientemente,
Umberger y cols. (2017, pág. 22) han recomendado calcular el valor
predictivo negativo (VPN) para «prevenir, detectar y descartar una
enfermedad, cuando el valor predictivo positivo (VPP) puede que
no sea relevante para ese propósito». Una prueba con un VPN alto
significa que el paciente probablemente no tiene la enfermedad, lo

591
que reduce el número de tratamientos incómodos y caros que
podrían realizarse al paciente. Las fórmulas para calcular la
sensibilidad, especificidad, VPN y VPP son las siguientes:

Cálculo de sensibilidad = probabilidad de


enfermedad =

× 100% = tasa de verdaderos positivos

Cálculo de especificidad = probabilidad de ausencia


de enfermedad =

× 100%

= tasa de verdaderos negativos

Valor predictivo negativo (VPN) = porcentaje de


verdaderos negativos entre todos los que tienen una
prueba negativa = d/(c+d) × 100%

Valor predictivo positivo (VPP) = porcentaje de


verdaderos positivos entre todos los que tienen una

592
prueba positiva = a/(a+b) × 100%
La sensibilidad es la proporción de pacientes con la enfermedad
que obtienen un resultado positivo en la prueba o verdadero
positivo. Una puntuación de 15 o mayor que esta en la escala CES-D
(v. fig. 10.3) tiene una sensibilidad del 89% para el diagnóstico de
depresión en adultos y del 92% en adultos mayores. El investigador
o el clínico podrían referirse a la sensibilidad de la prueba de las
siguientes formas:

• Una prueba muy sensible es muy buena para identificar la


enfermedad en un paciente.
• Si una prueba es muy sensible, tiene un bajo porcentaje de
falsos negativos, que varía en función del foco de la prueba
y de las puntuaciones de los participantes en ella.

La especificidad es la proporción de pacientes sin la enfermedad


que obtienen un resultado negativo en la prueba o verdadero
negativo. Se debe saber que, a medida que aumenta la sensibilidad
de una prueba, su especificidad suele disminuir (Umberger y cols.,
2017). Una puntuación de 15 o mayor en la escala CES-D tiene una
especificidad del 70% para el diagnóstico de depresión en adultos y
del 87% en adultos mayores. El investigador o el clínico podrían
referirse a la especificidad de la prueba de las siguientes formas:

• Una prueba muy específica es muy buena para identificar a


los pacientes sin la enfermedad.
• Si una prueba es muy específica, tiene un bajo porcentaje de
falsos positivos.

GUÍAS DE VALORACIÓN CRÍTICA


Sensibilidad, especificidad y valores
predictivos de las pruebas diagnósticas
Cuando se valora de forma crítica un estudio, se debe juzgar la
sensibilidad, la especificidad y el VPN de las pruebas diagnósticas
utilizadas en él.

593
1. ¿En el estudio se utilizó una prueba diagnóstica?
2. ¿Se ofrecen los valores de sensibilidad y especificidad que
aporta la prueba diagnóstica en estudios previos y para esta
población de estudio (Grove y Cipher, 2017)?
3. ¿Los investigadores comentaron el VPN y lo que significa
para la exactitud de la prueba (Umberger y cols., 2017)?

Ballard y cols. (2017) realizaron un estudio para determinar la


sensibilidad y especificidad de la herramienta Ask Suicide
Screening Questions (ASQ) en un servicio de urgencias (SU)
pediátrico. El suicidio es actualmente la segunda causa de muerte
en los niños y adolescentes de 10-19 años. En el Ejemplo de
investigación 10.2 se describe la exactitud de la herramienta ASQ en
investigación.

EJEMPLO DE INVESTIGACIÓN 10.2


Sensibilidad, especificidad y valor predictivo
negativo
Extracto del estudio de investigación
La herramienta Ask Suicide Screening Questions (ASQ) es un
instrumento no patentado de cuatro ítems para el cribado del suicidio
que se puede administrar a pacientes de 12-21 años que están en el
SU por motivos psiquiátricos o no psiquiátricos, por parte de
profesionales de enfermería con independencia de su formación
psiquiátrica (Horowitz y cols., 2012). Todas las preguntas se realizan
al paciente y una respuesta «sí» a cualquiera de los cuatro ítems se
considera un resultado positivo. Los cuatro ítems son los siguientes:
«En las cuatro últimas semanas, ¿ha deseado estar muerto?» «En las
últimas semanas, ¿ha sentido que usted o su familia estaría mejor si
estuviese muerto?», «En la última semana, ¿ha tenido pensamientos
sobre suicidarse?» y «¿Ha intentado suicidarse alguna vez?». La
ASQ se desarrolló a partir de un estudio de 524 pacientes en tres SU
pediátricos utilizando el Suicide Ideation Questionnaire (SIQ) como

594
patrón oro… En el estudio de desarrollo inicial, para pacientes
psiquiátricos, se observó que la ASQ tenía una sensibilidad del
97,6%, una especificidad del 65,6% y un valor predictivo negativo del
96,9% en comparación con el SIQ.

La ASQ se implementó con una tasa de cumplimiento del 79%. El


53% de los pacientes con un resultado positivo (237/448) no
acudieron al SU con síntomas relacionados con el suicidio. Estos
pacientes identificados eran más propensos a ser varones,
afroamericanos y a tener diagnósticos de conducta externalizante. El
ASQ demostró una sensibilidad del 93% y una especificidad del 43%
para predecir la repetición de las visitas al SU con motivos de
consulta relacionados con el suicidio en los 6 meses posteriores a la
visita índice. (Ballard y cols., 2017, págs. 174-176)

Los resultados del estudio de Ballard y cols. (2017) se muestran


en la tabla 10.3, para poder comprender los cálculos de
sensibilidad, especificidad y VPN de este estudio.

TABLA 10.3
Resultados de la herramienta ASQ para las visitas repetidas
al servicio de urgencias a los 6 meses de seguimiento

a, número de personas con visitas repetidas al SU con motivo de consulta


relacionado con el suicidio que tenían una ASQ positiva (verdaderos
positivos).
b, número de personas sin visitas repetidas al SU con motivo de consulta
relacionado con el suicidio que tenían una ASQ positiva (falsos positivos).
c, número de personas con visitas repetidas al SU con motivo de consulta
relacionado con el suicidio que tenían una ASQ negativa (falsos
negativos).
d, número de personas sin visitas repetidas al SU con motivo de consulta
relacionado con el suicidio que tenían una ASQ negativa (verdaderos

595
negativos).
ASQ, Ask Suicide Screening Questions; SU, servicio de urgencias.

Valor predictivo negativo (VPN) = porcentaje de personas que


probablemente no tienen la enfermedad cuando la prueba es negativa =
d/(c+d) × 100%
VPN = 194/(2 + 194) × 100% = 0,9898 × 100% = 98,98%
Datos tomados de Ballard, E. D., Cwik, M., Van Eck, K., Goldstein, M.,
Alfes, C., Wilson, M. E. y cols. (2017). Identification of at-risk youth by
suicide screening in a pediatric emergency department. Prevention
Science, 18(2), 174-182.
La sensibilidad del 93,3% indica el porcentaje de pacientes con
una ASQ positiva que acudieron al SU con síntoma(s) suicida(s)
(tasa de verdaderos positivos) en un plazo de 6 meses. La
especificidad del 43,3% indica el porcentaje de pacientes con una
ASQ negativa que no acudieron al SU con síntoma(s) suicida(s)
(tasa de verdaderos negativos) en un plazo de 6 meses. El VPN
mostró una gran solidez (98,98%) para identificar a los niños y
adolescentes con una ASQ negativa, que probablemente no tenían
síntomas suicidas. Estos niños y adolescentes no necesitarían
evaluación ni tratamiento adicional por tendencias suicidas.
Valoración crítica
Ballard y cols. (2017) describieron el proceso de desarrollo de la
ASQ a partir del SIQ, que se había considerado el patrón oro. La
puntuación de la ASQ se describió y los profesionales de
enfermería lo utilizaban con facilidad. La ASQ tenía unos valores
elevados de sensibilidad (97,6%), especificidad (65,6%) y VPN
(96,9%) en comparación con el SIQ durante el desarrollo. En este
estudio, la ASQ también mostró unas cifras elevadas de
sensibilidad (93,3%) y especificidad (43,7%), tal y como se deduce

596
de los cálculos relacionados con los datos de la tabla 10.3. El VPN
no se citó en el estudio, pero su valor calculado fue del 98,98%, que
es muy elevado para determinar los niños y adolescentes que no
tenían intenciones suicidas.
Ballard y cols. (2017) recomendaron a los profesionales de
enfermería que incorporasen la ASQ en la asistencia estándar de
los entornos de SU pediátricos. Este instrumento de cribado breve
«puede identificar a los pacientes que no refieren directamente
motivos de consulta relacionados con el suicidio en la clasificación
y que pueden tener un riesgo particular de conductas suicidas en el
futuro» (Ballard y cols., 2017, pág. 174).

Cocientes de verosimilitudes
Los cocientes de verosimilitudes (CV) son cálculos adicionales que
pueden ayudar a los investigadores a determinar la exactitud de las
pruebas diagnósticas o de cribado, y se basan en los resultados de
sensibilidad y especificidad. Los CV se calculan para determinar la
probabilidad de que el resultado positivo de una prueba sea un
verdadero positivo y de que el resultado negativo sea un verdadero
negativo. El cociente de los resultados verdaderos positivos entre
los resultados falsos positivos se denomina CV positivo (Campo,
Shiyko y Lichtman, 2010; Straus y cols., 2011). Usando los datos del
estudio de Ballard y cols. (2017), el CV positivo se calcula del
siguiente modo:

CV positivo = sensibilidad ÷ (100% – especificidad)

CV positivo para síntomas suicidas = 93,3% ÷ (100% –


43,7%) = 93,3% ÷ 56,3%

= 1,657 = 1,66
El CV negativo es el cociente entre los resultados verdaderos

597
negativos y los resultados falsos negativos y se calcula del siguiente
modo:

CV negativo = (100% – sensibilidad) ÷ especificidad

CV negativo para síntomas suicidas = (100% – 93,3%)


÷ 43,7% = 6,7% ÷ 43,7% = 0,153 = 0,15
Los CV muy altos (o > 10) confirman la enfermedad o indican que
el paciente tiene la enfermedad. Los CV muy bajos (o < 0,1) casi
descartan la posibilidad de que el paciente tenga la enfermedad
(Campo y cols., 2010; Straus y cols., 2011). Comprender la
sensibilidad, la especificidad, el VPN y el CV aumenta la capacidad
para la lectura de estudios clínicos y determina la prueba
diagnóstica más exacta que usar en la práctica clínica (Straus y cols.,
2011; Umberger y cols., 2017).

ESTRATEGIAS DE MEDICIÓN EN
ENFERMERÍA
Puesto que los estudios de enfermería examinan una gran variedad
de fenómenos, se requiere un extenso surtido de métodos de
medición para realizarlos. Algunos fenómenos de enfermería no se
han examinado porque nadie ha pensado en una forma de
medirlos, lo que tiene implicaciones en la práctica clínica y la
investigación. En esta sección se describen algunos de los métodos
de medición más frecuentes utilizados en la investigación en
enfermería, como medidas fisiológicas, mediciones observacionales,
entrevistas, cuestionarios y escalas.

Medidas fisiológicas
Para obtener medidas fisiológicas, se pueden emplear diversas
técnicas. Algunas medidas se obtienen de forma relativamente
sencilla y son una extensión de los métodos de medición utilizados

598
en la práctica enfermera, como los que se utilizan para determinar
el peso y la PA. Otras medidas son más complejas, caras y en
ocasiones requieren un enfoque imaginativo. Por ejemplo, algunas
medidas fisiológicas se obtienen usando la autonotificación con
diarios, escalas o listas de control de observación, y otras medidas
fisiológicas se recogen utilizando pruebas de laboratorio y
monitorización electrónica.
La disponibilidad de equipos de monitorización electrónica ha
aumentado mucho las posibilidades de medición fisiológica en los
estudios de enfermería, particularmente en el contexto de cuidados
intensivos (Stone y Frazier, 2017). La monitorización electrónica
requiere la colocación de sensores sobre el participante en el estudio
o en su interior, como electrodos de electrocardiograma y vías
arteriales. Los sensores miden cambios en las funciones corporales,
como la energía eléctrica. Algunos equipos electrónicos
proporcionan un registro simultáneo de múltiples medidas
fisiológicas que se muestran en un monitor, como los que registran
el pulso, el ritmo cardiaco y la presión arterial. El equipo suele estar
unido a un ordenador, que permite la recuperación, la revisión y el
análisis de los datos complejos.
Lu, Lin, Chen, Tsang y Su (2013) realizaron un estudio
cuasiexperimental para determinar el efecto de la acupresión sobre
la calidad del sueño en pacientes psicogeriátricos hospitalizados. La
acupresión se llevó a cabo en cada participante del estudio en la
sala de exploración del hospital psiquiátrico. La calidad del sueño
se midió mediante la autonotificación de los pacientes de su sueño,
y usando la actigrafía, un método que emplea un dispositivo
electrónico para detectar y registrar el movimiento. El Ejemplo de
investigación 10.3 describe estos dos tipos de medidas fisiológicas
que se valoraron de forma crítica utilizando las guías citadas con
anterioridad.

EJEMPLO DE INVESTIGACIÓN 10.3


Medidas fisiológicas
Extracto del estudio de investigación

599
La calidad del sueño se valoró subjetiva y objetivamente. Los datos
subjetivos se midieron mediante el PSQI [Pittsburg Sleep Quality
Index], desarrollado por Buysse, Reynolds, Monk, Berman y Kupfer
(1989). El PSQI es un cuestionario de 19 ítems que se utiliza para
medir la calidad y los trastornos del sueño durante las 4 semanas
previas a su realización. Se generan puntuaciones de siete
componentes (latencia del sueño, duración del sueño, eficacia del
sueño habitual, trastornos del sueño, uso de hipnóticos, disfunción
diurna y calidad percibida del sueño) y se suman para obtener una
puntuación global. Cuanto mayor es la puntuación, peor es la calidad
del sueño. La sensibilidad y especificidad de una puntuación global
por encima de 5 (los que peor duermen) son del 90 y del 87%,
respectivamente (Buysse y cols., 1989).

La información objetiva se midió utilizando la actigrafía, (licencia n.°


019678), un dispositivo ambulatorio no invasivo y estandarizado,
equipado con un sensor (acelerómetro piezoeléctrico), que llevaban los
participantes para monitorizar y registrar continuamente la actividad
motora gruesa durante un periodo de tiempo prolongado. La
actigrafía es útil para valorar los ciclos sueño-vigilia y los ritmos
circadianos y ofrece resultados fiables con una exactitud media mayor
del 90%, que se aproxima a la de la polisomnografía… Los
participantes llevaban el dispositivo durante todo el día, todos los días
durante 4 semanas, excepto en la ducha. El participante elegía si
llevarlo en la muñeca no dominante o en el tobillo. Para aumentar la
exactitud de los datos y evitar el desplazamiento accidental del
dispositivo, se usó una envoltura externa mientras se llevaba. Los
datos se leyeron, transfirieron, almacenaron y analizaron usando el
software ActiWeb… Los datos de la actigrafía se tradujeron en
información con significado que se usó para valorar en los
participantes la latencia del sueño, el tiempo total de sueño, la eficacia
del sueño, su número de interrupciones (episodios de despertar) y los
minutos de tiempo despiertos después del inicio del sueño. (Lu y cols.,
2013, págs. 132-133)

Valoración crítica

600
Lu y cols. (2013) usaron dos medidas fisiológicas potentes, la
autonotificación (PSQI) y la monitorización electrónica (actigrafía),
para determinar su variable dependiente de calidad del sueño. El
PSQI tiene una elevada sensibilidad (90%) y especificidad (87%)
para determinar problemas del sueño y fue fiable en esta muestra
(α de Cronbach = 0,87). El análisis de esta escala se habría
reforzado aportando información sobre la fiabilidad y validez en
estudios previos (Waltz y cols., 2017). La actigrafía usada para
monitorizar electrónicamente la actividad del sueño se describió en
detalle. Los investigadores compararon este dispositivo con la
polisomnografía e indicaron que tenía un 90% de exactitud.
Cuando llevaban el aparato, los participantes realizaban acciones
para fomentar la exactitud y precisión de los datos. También se
detallaron los procesos de transferencia y análisis de los datos,
indicando que los resultados eran sólidos para describir la calidad
del sueño, con un potencial limitado de error de medición.
Lu y cols. (2013) observaron que la calidad del sueño, medida
con el PSQI y actigrafía, mejoraba significativamente después de la
acupresión. Dado que la acupresión es una técnica no invasiva, de
bajo riesgo y barata, los investigadores recomendaron que podría
ser una intervención eficaz para tratar el insomnio en esta
población.

Medición observacional
La medición observacional implica una interacción entre los
participantes del estudio y el observador(es), en la que este tiene la
oportunidad de contemplar el desempeño del participante en un
entorno específico (Waltz y cols., 2017). La observación no
estructurada suele utilizarse para recoger datos en estudios
cualitativos (v. cap. 3). Las observaciones no estructuradas
consisten en observar y registrar espontáneamente en palabras lo
que se observa. El análisis de estos datos puede llevar a una
observación más estructurada y a la elaboración de una lista de
comprobación observacional (Creswell, 2014; Creswell y Poth, 2018;
Marshall y Rossman, 2016).
En la medición observacional estructurada, el investigador
define cuidadosamente lo que observará y cómo se harán,

601
registrarán y codificarán numéricamente las observaciones (Waltz y
cols., 2017). Para que las observaciones sean estructuradas, los
investigadores desarrollarán un sistema de clasificación para
organizar y ordenar las conductas o eventos que se observan. A
menudo se usan listas de comprobación para indicar si se produce
una conducta. Las escalas de clasificación permiten al observador
clasificar la conducta o evento. Esto aporta más información para el
análisis que los datos dicotómicos, que solo indican si la conducta
ocurre o no. Puesto que la observación tiende a ser más subjetiva
que otros tipos de medición, a menudo se considera menos creíble.
En muchos casos, la observación puede ser el único método para la
obtención de datos importantes para el conjunto de conocimientos
de enfermería. Al igual que con cualquier método de medición, la
consistencia es muy importante. Como consecuencia, es esencial
notificar la fiabilidad interobservador de quienes realizan las
observaciones.

GUÍAS DE VALORACIÓN CRÍTICA


Medición observacional
Cuando se valoran de forma crítica las medidas observacionales,
se deben plantear las siguientes preguntas:

1. ¿Está claramente identificado y definido el objeto de


observación?
2. ¿Se describen las técnicas de registro de las observaciones?
3. ¿Se describe la fiabilidad interobservador?

McLellan, Gauvreau y Connor (2017) realizaron un estudio para


validar la escala Children’s Hospital Early Warning Score (CHEWS)
recién desarrollada con la Brighton Pediatric Early Warning Score
(PEWS) validada previamente. La PEWS se desarrolló
originalmente para la detección precoz del deterioro crítico de
todos los pacientes pediátricos no cardiacos. La CHEWS era una
versión modificada de la herramienta observacional PEWS que se
desarrolló para identificar a los pacientes cardiacos pediátricos con
riesgo de deterioro crítico, a fin de permitir la intervención precoz

602
de los clínicos y evitar un mayor deterioro. En el Ejemplo de
investigación 10.4 se incluye parte de la descripción de los
investigadores de la validez y fiabilidad de su herramienta
observacional.

EJEMPLO DE INVESTIGACIÓN 10.4


Medición observacional
Extracto del estudio de investigación
La herramienta final revisada (fig. 2), denominada Cardiac Children’s
Hospital Earl Warning Score (C-CHEWS)… se puso a prueba con
éxito, se implementó de forma completa y, después, se validó
formalmente (… sensibilidad 95,3%, especificidad 76,2%) en la
población cardiaca pediátrica en un estudio previo (McLellan,
Gauvreau y Connor, 2014). En este estudio, la herramienta mostró
una discriminación excelente para identificar el deterioro crítico en
niños con cardiopatía y fue mucho más eficaz que la PEWS para
identificar el deterioro crítico (McLellan y cols., 2014). Para
optimizar la seguridad y mejorar la claridad, la dirección del hospital
decidió implementar la herramienta cardiaca en toda el área de
pacientes hospitalizados en lugar de tener herramientas similares,
pero diferentes, utilizándose en el mismo centro. La C-CHEWS se
rebautizó como Children’s Hospital early Warning Score (CHEWS) y
se incorporó a la historia clínica electrónica….

…La fiabilidad interevaluador entre profesionales de enfermería de


todos los niveles de experiencia se había determinado previamente
para la herramienta CHEWS (100% para puntuación ≥3, estadístico
kappa 1,00) durante el estudio de validación inicial y no se repitió.
(McLellan y cols., 2017, págs. 53-54)

La sensibilidad para puntuaciones ≥3 fue del 91,4% para la CHEWS


y del 73,6% para la PEWS con una especificidad del 67,8% para la
CHEWS y del 88,5% para la PEWS. La sensibilidad para

603
puntuaciones ≥5 fue del 75,6% para la CHEWS y del 38,9% para la
PEWS con una especificidad del 88,5% para la CHEWS y del 93,9%
para la PEWS. El plazo de alerta precoz desde una puntuación crítica
(≥5) hasta un deterioro crítico fue de 3,8 h para la CHEWS frente a
0,6 h para la PEWS (p <0,001)… El sistema CHEWS demostró una
discriminación y sensibilidad mayores, así como un plazo de alerta
precoz más largo que la PEWS a la hora de identificar a niños con
riesgo de deterioro crítico. (McLellan y cols., 2017, pág. 52)

Valoración crítica
McLellan y cols. (2017) proporcionan información extensa sobre el
desarrollo de la CHEWS a partir de la PEWS. En la figura 2 se
detallan las conductas que deben observarse, el proceso de
puntuación y la puntuación crítica que indica un posible deterioro.
La validez y la fiabilidad interobservador de la CHEWS a partir de
la investigación previa (McLellan y cols., 2014) eran elevadas. Sin
embargo, la fiabilidad interobservador debía haberse indicado en
este estudio, porque muchos profesionales de enfermería de
distintos niveles intervinieron en el proceso de recogida de datos.
Se observó que la CHEWS es una herramienta significativamente
más sólida para su uso en la práctica clínica que la PEWS, con una
validez convergente. La CHEWS también predijo de forma más
precoz el deterioro crítico en niños que la PEWS, lo que indicó una
validez de criterio predictiva. La CHEWS tuvo una sensibilidad
muy elevada para identificar a los niños con riesgo de deterioro
crítico y una especificidad aceptable para determinar los niños que
no tenían riesgo de deterioro (Grove y Cipher, 2017).

Entrevistas
Una entrevista implica la comunicación verbal entre el investigador
y el participante en el estudio, durante la cual se proporciona
información al investigador. Aunque esta estrategia de recogida de
datos se usa más en estudios cualitativos y descriptivos, también
puede utilizarse en otros tipos de estudios cuantitativos. Para
realizar una entrevista, pueden usarse diversos enfoques que varían
desde una entrevista no estructurada totalmente (v. cap. 3), en la
que el participante en el estudio controla el contenido (Creswell y

604
Poth, 2018), hasta una entrevista estructurada, en la que el
contenido es similar al de un cuestionario, y las posibles respuestas
a las preguntas están diseñadas cuidadosamente por el investigador
(Waltz y cols., 2017). Durante las entrevistas estructuradas, los
investigadores usan estrategias para controlar el contenido de la
entrevista. Los investigadores suelen plantear preguntas específicas
e introducen las respuestas del participante en una escala de
clasificación o un instrumento manual durante la entrevista. Por
ejemplo, los investigadores podrían usar una entrevista en persona
o por teléfono para obtener respuestas para un instrumento.
También podrían introducir las respuestas en una base de datos
electrónica.
Puesto que el personal de enfermería frecuentemente usa la
técnica de la entrevista para la valoración de enfermería, la
dinámica de entrevistar resulta familiar. Sin embargo, el uso de la
técnica para la medición en investigación requiere mayor
sofisticación y debe explicarse en la sección de métodos del estudio.
La frecuencia de respuesta para las entrevistas es más alta que para
los cuestionarios, lo que suele permitir obtener una muestra más
representativa. La entrevista también permite recoger datos de
participantes que son incapaces o tienen pocas posibilidades de
completar cuestionarios, como los que están muy enfermos o tienen
capacidades limitadas para leer, escribir y expresarse. Las
entrevistas son una forma de autonotificación y debe asumirse que
la información que proporcionan es exacta. Debido al tiempo y el
coste, el tamaño de la muestra suele ser limitado. El sesgo del
participante siempre es una amenaza para la validez de los
hallazgos, así como la inconsistencia en la recogida de los datos de
un participante a otro (Waltz y cols., 2017).

GUÍAS DE VALORACIÓN CRÍTICA


Entrevistas estructuradas
Cuando se valoran de forma crítica las entrevistas realizadas en
estudios, se deben considerar las siguientes preguntas:

1. En las entrevistas estructuradas, ¿qué guio el proceso de la

605
entrevista?
2. ¿Son las preguntas de la entrevista relevantes para el
propósito de la investigación?
3. ¿Los métodos indican el proceso para la realización de las
entrevistas?
4. Si se usan múltiples entrevistadores para reunir los datos,
¿cómo se entrenaron estos individuos, en qué medida y qué
consistencia se consiguió para el proceso de la entrevista?
5. ¿Las preguntas tendían a sesgar las respuestas de los
participantes en el estudio?

Dickson, Buck y Riegel (2013) usaron un formato de entrevista


estructurada para determinar las enfermedades concurrentes de
una muestra de pacientes con insuficiencia cardiaca (IC). El enfoque
del estudio era examinar cómo las múltiples enfermedades
concurrentes dificultan el autocuidado de los pacientes con IC. El
Ejemplo de investigación 10.5 describe el proceso de entrevista
estructurada usado en este estudio.

EJEMPLO DE INVESTIGACIÓN 10.5


Entrevistas estructuradas
Extracto del estudio de investigación
Para reunir los datos sobre enfermedades concurrentes, se usó el
formato de entrevista del Charlson Comorbidity Index (CCI)
(Charlson, Pompei, Ales y MacKenzie, 1987). Se preguntó a los
participantes sobre enfermedades preexistentes (p. ej., diabetes), la
mayoría de las cuales puntuaban como 1, aunque a algunas (p. ej.,
cirrosis) se les asignó >1 punto. Las puntuaciones en el CCI pueden
variar de 0 a 34, y cada participante del estudio tenía una puntuación
≥1 debido a la IC. Las respuestas se sumaron, se ponderaron y se
indexaron en una de las tres categorías: 0-1 = bajo, 2-3 = moderado y
≥ 4 = alto, de acuerdo con los métodos publicados… La capacidad del
CCI para predecir la mortalidad, las complicaciones, el uso de

606
cuidados agudos, la duración del ingreso hospitalario, la disposición
para el alta y el coste (Charlson y cols., 1987) aportan evidencia para
la validez relacionada con el criterio. (Dickson y cols., 2013, pág. 4)

Valoración crítica
Dickson y cols. (2013) identificaron el CCI como la estructura para
sus entrevistas y detallaron el proceso de puntuación en pacientes
con IC. El CCI parecía recoger datos que eran relevantes para el
propósito del estudio. Los investigadores necesitaban proporcionar
más detalles sobre el proceso para implementar el CCI con el fin de
indicar si las entrevistas se realizaron de forma consistente. El CCI
tenía validez de criterio e incluía preguntas no sesgadas, pero se
podría haber proporcionado más información sobre la validez del
contenido y del constructo del CCI.
Dickson y cols. (2013) hallaron que las enfermedades
concurrentes múltiples disminuían la autoeficacia de los pacientes
con IC, lo que reducía su capacidad para realizar autocuidados.
Los investigadores subrayaron la importancia de impartir
educación sobre autocuidados que integrara las enfermedades
concurrentes de los pacientes. Además, es necesario desarrollar
estudios y probar intervenciones que fomenten la autoeficacia y se
centren en el autocuidado de los pacientes sobre múltiples
trastornos crónicos.

Cuestionarios
Un cuestionario es un formulario de autonotificación diseñado
para obtener información a través de respuestas escritas, verbales o
electrónicas del participante en el estudio. Los cuestionarios pueden
imprimirse y distribuirse en persona o por correo, y pueden estar
disponibles en un ordenador u online. En ocasiones, los
cuestionarios reciben el nombre de encuestas y un estudio que
utiliza un cuestionario puede denominarse investigación mediante
encuesta. La información obtenida en los cuestionarios es similar a
la que se consigue mediante una entrevista, pero las preguntas
tienden a tener menos profundidad. No se permite al participante
en el estudio elaborar las respuestas ni preguntar para clarificar los
comentarios y quien recoge los datos no puede usar estrategias de

607
sondeo. Sin embargo, las preguntas se presentan de forma
consistente a cada participante y la posibilidad de sesgo es menor
que en una entrevista.
Los cuestionarios se usan a menudo en estudios descriptivos para
reunir un amplio espectro de información de los participantes,
como hechos acerca del participante o de personas, eventos o
situaciones conocidas por él. También se usan para recoger
información acerca de las creencias, actitudes, opiniones,
conocimientos o intenciones de los participantes. Los cuestionarios
suelen desarrollarse para un estudio particular con el fin de
permitir que los investigadores reúnan datos de una población
seleccionada en una nueva área de estudio. Al igual que las
entrevistas, los cuestionarios pueden tener diversas estructuras.
Algunos cuestionarios tienen preguntas abiertas que requieren
respuestas escritas (datos cualitativos) del participante. Otros
cuestionarios tienen preguntas cerradas, que tienen opciones
limitadas entre las cuales los participantes pueden seleccionar su
respuesta.
Aunque los cuestionarios pueden distribuirse a muestras muy
grandes en persona, a través del correo o por internet, la frecuencia
de respuesta a estos suele ser más baja que en las otras formas de
autonotificación, sobre todo si los cuestionarios se envían por
correo. Si la tasa de respuesta es menor del 50%, la
representatividad de la muestra es cuestionable. La tasa de
respuesta para los cuestionarios por correo suele ser baja (25-40%),
de modo que los investigadores a menudo son incapaces de obtener
una muestra representativa, incluso con métodos de muestreo
aleatorios. Los cuestionarios distribuidos a través de internet son
los más prácticos para los participantes en el estudio y pueden dar
lugar a una tasa de respuesta más alta que los cuestionarios por
correo. Muchos investigadores eligen el formato de internet cuando
tienen acceso a la dirección de correo electrónico de los posibles
participantes (Waltz y cols., 2017).
Algunos encuestados no marcan las respuestas a todas las
preguntas, especialmente en los cuestionarios largos. La naturaleza
incompleta de los datos puede amenazar la validez del
instrumento. Por ello, los investigadores deben describir cómo
trataron la pérdida de datos en el informe de su estudio. En la

608
mayoría de los cuestionarios, los investigadores analizan los datos a
nivel de ítems individuales, en lugar de sumar los ítems y analizar
las puntuaciones totales. Las respuestas a los ítems suelen medirse a
nivel nominal u ordinal.

GUÍAS DE VALORACIÓN CRÍTICA


Cuestionarios
Cuando se valore de forma crítica un cuestionario en un estudio
publicado, se deben plantear las siguientes cuestiones:

1. ¿El cuestionario aborda el enfoque del estudio delimitado en


el propósito y/o el objetivo, sus preguntas o sus hipótesis?
2. Debe analizarse la descripción de los contenidos del
cuestionario en la sección de medición del estudio. ¿El
estudio aporta información sobre la validez relacionada con
el contenido para el cuestionario?
3. ¿Se realizó una prueba piloto del cuestionario o se usó en
estudios previos? ¿Qué tipo de información sobre la validez
y la fiabilidad se proporcionó en relación con el cuestionario?
4. ¿El cuestionario se utilizó de forma consistente en los diversos
participantes en el estudio?

Musiello y cols. (2017) realizaron un estudio de correlación


descriptivo para analizar la angustia de las personas que recibían
asistencia en un centro oncológico ambulatorio. Se utilizaron el
Distress Thermometer (DT) de la National Comprehensive Cancer
Network (NCCN) y el cuestionario Problem List (PL) para recoger
datos, tal y como se describe en el Ejemplo de investigación 10.6.

EJEMPLO DE INVESTIGACIÓN 10.6


Cuestionarios
Extracto del estudio de investigación

609
El Distress Thermometer (DT) de 2005 de la NCCN y el cuestionario
Problem List (PL) se utilizaron para evaluar en los pacientes los
niveles autonotificados de angustia y los problemas que estaban
experimentando. El DT mide la angustia en una escala de 0 (ausencia
de angustia) a 10 (angustia grave). Los valores de corte recomendados
para identificar una angustia clínicamente significativa en el DT
varían según el entorno y los objetivos de evaluación… Boyes y cols.
(2013) sugieren que es mejor usar puntuación de corte en el DT de ≥2
para el uso clínico, ≥3 para detectar los casos de ansiedad, depresión y
ansiedad/depresión concurrentes y ≥4 para su uso en investigación.
Una puntuación de corte ≥4 para identificar a los pacientes con
angustia significativa se seleccionó como apropiada. Las puntuaciones
≤ 3 se consideraron un nivel «normal» de angustia para este estudio
(Boyes y cols., 2013). El PL incluye los problemas físicos (p. ej.,
estreñimiento, dolor, fatiga), emocionales (p. ej., preocupación,
tristeza), prácticos (p. ej., cuidado de los niños, transporte), familia
(p. ej., encargarse de la familia/hijos) y los problemas
espirituales/existenciales. Bajo cada dominio de problema existe una
lista que los pacientes pueden marcar para identificar qué problemas
contribuyen a su angustia. (Musiello y cols., 2017, pág. 16)

Valoración crítica
Musiello y cols. (2017) observaron que el DT era una escala
nacional utilizada para evaluar la angustia en entornos clínicos y
de investigación. Las puntuaciones de corte del DT del NCCN para
la práctica clínica y la investigación se determinaron a partir de
investigaciones previas (Boyes y cols., 2013). La validez del
contenido del PL se abordó enumerando los problemas que los
pacientes podrían identificar como elementos contribuyentes a su
angustia. Los investigadores debían describir la elaboración y el
uso previo del PL en los estudios. En resumen, se necesita
información adicional para determinar la fiabilidad y validez del
DT y del cuestionario PL utilizados en este estudio.

Escalas
La escala, una forma de autonotificación, es un medio más preciso

610
de medir fenómenos que un cuestionario. La mayoría de las escalas
se desarrollan para medir variables psicosociales, pero los
investigadores también usan las técnicas de escalamiento para
obtener autonotificaciones de variables fisiológicas como dolor,
náuseas o capacidad funcional. Los diversos ítems en la mayoría de
las escalas se suman para obtener una puntuación única. Estas se
denominan escalas sumadas. Cuando se usa la puntuación total de
una escala, se producen menos errores aleatorios y sistemáticos
(Nunnally y Bernstein, 1994). Los diversos ítems de una escala
aumentan las dimensiones del concepto que mide el instrumento.
Las escalas que se utilizan frecuentemente en investigación de
enfermería son las de calificación, las de Likert y las escalas visuales
analógicas.

Escala de calificación
Las escalas de calificación son la forma más tosca de medición
entre las técnicas de escalamiento. Una escala de calificación
enumera una serie ordenada de categorías de una variable que se
asume que está basada en un continuum subyacente. A cada
categoría se le asigna un valor numérico y la finura de las
distinciones entre las categorías varía con la escala. Las escalas de
calificación las usa frecuentemente el público general. En las
conversaciones pueden oírse afirmaciones como: «En una escala del
1 al 10, yo lo calificaría...». Las escalas de calificación son bastante
fáciles de desarrollar, pero los investigadores deben ser cuidadosos
para evitar afirmaciones finales que sean tan extremas que ningún
participante en el estudio las seleccione. Una escala de calificación
puede usarse para ordenar el grado de cooperación del paciente o el
valor dado por el participante en el estudio a las interacciones entre
el personal de enfermería y el paciente. Las escalas de calificación
también se usan en medición observacional para orientar la
recogida de los datos (v. fig. 2 de la escala Children’s Hospital Early
Warning Score desarrollada por McLellan y cols., 2017).

611
FIG 2 Escala Children’s Hospital Early Warning Score.
CN, cánula nasal; FC, frecuencia cardiaca; FR,
frecuencia respiratoria; l, litros; TR, trabajo respiratorio.
(Tomada de McLellan, M. C., Gauvreau, K. y Connor, J. A. [2017].
Validation of the Children’s Hospital Early Warning System for
critical deterioration recognition. Journal of Pediatric Nursing,
32[1], pág. 54.)

Algunas escalas de calificación son más válidas que otras porque


se construyeron de forma estructurada y se usaron en diversos
estudios con diferentes poblaciones. Por ejemplo, la FACES Pain
Scale de Wong Baker tiene una fiabilidad y validez documentadas
mediante investigación y suele utilizarse en la práctica clínica para
valorar el dolor en los niños (fig. 10.4; Wong-Baker FACES
Foundation, 2017). El personal de enfermería a menudo valora el

612
dolor en los adultos con una escala de calificación numérica (ECN)
similar a la de la figura 10.5. Usar la ECN es más válido y fiable que
pedir al paciente que califique su dolor en una escala del 1 al 10.

FIG 10.4 FACES Pain Rating Scale de Wong-Baker.


Indique en cada cara las palabras que describen la
intensidad del dolor. Pida al niño que elija la cara que
mejor describe su dolor y anote el número señalado.
(Tomada de Wong-Baker FACES Foundation [2017]. Wong-Baker
FACES® Pain Rating Scale. Consultada el 25 de abril de 2017,
en http://www.wongbakerfaces.org.)

FIG 10.5 Escala de calificación numérica.

Escala de Likert
La escala de Likert se diseñó para determinar las opiniones o
actitudes de los sujetos de estudio. Contiene una serie de
afirmaciones declarativas con una escala después de cada una. La
escala de Likert es la técnica de escalamiento más utilizada. La
versión original de la escala contenía cinco categorías de respuestas.
A cada una de ellas se le asignaba un valor de 0 o 1 para la
respuesta más negativa y un valor de 4 o 5 para la respuesta más
positiva (Ho, 2017; Nunnally y Bernstein, 1994). La elección de la

613
respuesta en la escala de Likert generalmente aborda el acuerdo, la
evaluación o la frecuencia. Las opciones de acuerdo pueden incluir
afirmaciones como muy en desacuerdo, en desacuerdo, neutral, de
acuerdo y muy de acuerdo. Las respuestas de evaluación preguntan al
encuestado por una calificación evaluadora a lo largo de una
dimensión de malo a bueno, como de negativo a positivo o de
terrible a excelente. Las respuestas de frecuencia pueden incluir
afirmaciones como nunca, infrecuentemente, a veces, frecuentemente y
siempre. Los términos usados son versátiles y se seleccionan
basándose en el contenido de las preguntas o ítems de la escala. Por
ejemplo, una cuestión como «Describa los cuidados de enfermería
que recibió durante su hospitalización» podría tener una escala de
respuesta de no satisfactorios, por debajo de la media, en la media, por
encima de la media y excelentes.
En ocasiones, se dan siete opciones en la escala de respuesta; en
otras, solo cuatro. Cuando la escala de respuesta tiene un número
impar de opciones, la opción central suele ser una categoría dudosa
o neutral. El uso de una escala de respuesta con un número impar
de opciones es controvertido, porque permite que el participante en
el estudio evite hacer una elección clara de afirmaciones positivas o
negativas. Para evitar esto, los investigadores pueden elegir
proporcionar solo cuatro o seis opciones, sin un punto medio o
categoría dudosa. Este tipo de escala se denomina versión de elección
forzada (Nunnally y Bernstein, 1994). Ho (2017) ha proporcionado
una descripción excelente de los puntos fuertes y las limitaciones de
las escalas de Likert.
La escala de Likert suele constar de 10 a 20 ítems y cada uno de
ellos aborda un elemento del concepto que se mide. Por lo general,
los valores obtenidos de cada ítem del instrumento se suman para
obtener una puntuación única para cada participante. Aunque los
valores de cada ítem son técnicamente datos a nivel ordinal, la
puntuación sumada a menudo se analiza como datos a nivel de
intervalo. La escala CES-D es una escala de Likert, descrita
previamente y mostrada en la figura 10.3, que se usa para valorar el
nivel de depresión en pacientes en la práctica clínica y en la
investigación. Schmitt y cols. (2017) usaron la escala CES-D en su
estudio presentado previamente. Los participantes en el estudio
reciben las siguientes instrucciones para utilizar la escala: «A

614
continuación tiene una lista de la forma en que puede haberse
sentido o actuado. Por favor, dígame con qué frecuencia se ha
sentido de esta forma durante la semana pasada» (v. fig. 10.3;
Radloff, 1977). Esta escala tiene cuatro opciones de respuesta:
Infrecuentemente o nunca (menos de 1 día) = 0; alguna vez o un poco de
tiempo (1-2 días) = 1; ocasionalmente o una cantidad moderada de tiempo
(3-4 días) = 2, y la mayor parte del tiempo o siempre (5-7 días) = 3. Como
se ha indicado previamente, las puntuaciones en la escala pueden
variar desde 0 hasta 60 y las más altas indican la presencia de más
síntomas depresivos. Una puntuación de 16 o superior se ha usado
extensamente como punto de corte para la depresión. La escala
tiene una fiabilidad, validez, sensibilidad y especificidad elevadas
(Armenta y cols., 2014; Locke y Putnam, 2002; Sharp y Lipsky,
2002).

Escala visual analógica


La escala visual analógica (EVA) suele usarse para medir la fuerza,
magnitud o intensidad de los sentimientos subjetivos, sensaciones o
actitudes de los individuos acerca de sus síntomas o su situación.
La EVA suele ser una línea de unos 100 mm de longitud con
«topes» en ángulo recto en ambos extremos. Los investigadores
pueden presentar la línea horizontal o verticalmente, con anclajes o
descriptores bipolares más allá de cada extremo de la línea (Waltz y
cols., 2017). Estos anclajes de los extremos deben incluir todo el
rango de sensaciones posibles para el fenómeno que se va a medir
(p. ej., todo y nada, mejor y peor, ausencia de dolor y dolor
intolerable). En la figura 10.6 se muestra un ejemplo de una EVA
para medir el dolor.

FIG 10.6 Ejemplo de escala visual analógica.

Se pide a los participantes que coloquen una marca a lo largo de


la línea para indicar la intensidad de la sensación o sentimiento. A
continuación, los investigadores miden con una regla la distancia
entre el extremo izquierdo de la línea (en una escala horizontal) y la

615
marca del participante. Esta medida es el valor de la sensación. La
EVA se ha usado para medir el dolor, el estado de ánimo, la
ansiedad, el nivel de alerta, el ansia de cigarrillos, la calidad del
sueño, la actitud hacia las condiciones del entorno, las capacidades
funcionales y la gravedad de los síntomas clínicos.
La fiabilidad de la EVA suele determinarse por el método de test-
retest. Las correlaciones entre las dos administraciones de la escala
deben ser moderadas o intensas para apoyar la fiabilidad de la
escala (Wewers y Lowe, 1990). Puesto que estas escalas se usan para
medir fenómenos que son dinámicos o cambiantes con el tiempo, la
fiabilidad test-retest a veces no es adecuada porque la baja
correlación se debe a los cambios en la sensación frente a un
problema con la escala. Dado que la EVA contiene un único ítem,
no pueden usarse otros métodos de determinación de la fiabilidad
como la homogeneidad. La validez de la EVA suele determinarse
correlacionando sus puntuaciones con otras medidas, como escalas
de calificación o de Likert, que miden el mismo fenómeno, como el
dolor (Waltz y cols., 2017).

GUÍAS DE VALORACIÓN CRÍTICA


Escalas
Cuando se valore de forma crítica una escala de calificación, una
escala de Likert o una EVA en un estudio, deben plantearse las
siguientes preguntas:

1. ¿La escala de calificación, la escala de Likert o la EVA se


describen claramente en el informe de investigación?
2. ¿Se proporcionan las técnicas usadas para administrar y
puntuar la escala?
3. ¿Se describe la información acerca de la validez y fiabilidad
de la escala en estudios previos y en este estudio?

Williams, Turner-Henson, Langhinrichsen-Rohling y Azuero


(2017) realizaron un estudio de correlación predictivo para
determinar si los acontecimientos vitales estresantes, el estrés
percibido y el acoso eran predictivos de síntomas depresivos en

616
estudiantes de noveno curso. Los métodos de medición para los
síntomas depresivos y el acoso se presentan en el Ejemplo de
investigación 10.7.

EJEMPLO DE INVESTIGACIÓN 10.7


Escalas
Extracto del estudio de investigación
Los síntomas depresivos se midieron con la escala Center for
Epidemiologic Studies-Depression Survey (CESD-10) que se ha
utilizado para medir cuatro factores relacionados con síntomas
depresivos, entre los que se incluyen el afecto positivo/negativo,
síntomas somáticos, actividad retardada y problemas interpersonales.
Las puntuaciones de la escala CESD-10 oscilan entre 0 y 30, con
valores de 0 a 3 en cada ítem: 0 (pocas veces), 1 (algunas veces), 2
(ocasionalmente o cantidad moderada) y 3 (siempre). Una puntuación
de 10 o más indica la necesidad de derivación (clínicamente
significativa). Se escogió la escala CESD-10 debido a la aplicabilidad
para las poblaciones adolescentes y la longitud de la medida (10
preguntas). En un estudio de n = 156 adolescentes, la fiabilidad de la
CESD-10 resultó ser de a = 0,85 (Bradley, Bagnell y Brannen, 2010).
La fiabilidad del estudio actual fue de a = 0,86…

El acoso se midió utilizando la escala Personal Experiences Checklist


(PECK), una escala de Likert de 32 ítems que se había utilizado
previamente en adolescentes de 8-15 años (Hunt, Peters y Rapee,
2012). Este instrumento de autonotificación se puntúa de 0 a 4: 0
(nunca), 1 (pocas veces), 2 (a veces), 3 (la mayoría de los días) y 4
(todos los días). Las conductas de acoso incluyeron el siguiente
número de ítems, consistencia interna y coeficientes de test/retest:
acoso verbal/relacional (11 ítems, a = 0,90, r = 0,75); acoso físico (9
ítems, a = 0,91, r = 0,61); ciberacoso (8 ítems, a = 0,90, r = 0,86; y
acoso cultural (4 ítems, a = 0,78, r = 0,77). Unas puntuaciones
elevadas indican más acoso. La fiabilidad de la escala global fue de a =

617
0,94 en el estudio actual. (Williams y cols., 2017, pág. 25)

Valoración crítica
Williams y cols. (2017) seleccionaron escalas de Likert (CESD-10 y
PECK) que se habían desarrollado para poblaciones adolescentes y
que habían sido fiables en estudios previos. La validez del
contenido y del constructo para las escalas CESD-10 y PECK se
describieron, indicando las subescalas para ambas escalas. Los
ítems de ambas escalas y los procesos de puntuación se
describieron con claridad. Se identificó una puntuación
clínicamente significativa de 10 para determinar la depresión en los
adolescentes. Sin embargo, no se indicó ninguna puntuación crítica
para la PECK, salvo que unas puntuaciones elevadas indicaban
más acoso. Las escalas tenían una fiabilidad elevada en este estudio
(CESD-10 tenía un a = 0,86 y PECK tenía un a = 0,94). Los valores a
de consistencia interna y los de la fiabilidad test-retest también
eran elevados para las subescalas de la PECK. Los investigadores
documentaron la fiabilidad de la CESD-10 y de la PECK a partir de
las investigaciones previas y para este estudio, pero
proporcionaron muy poca información sobre la validez de las
escalas.
Williams y cols. (2017, pág. 27) observaron que «la percepción
del estrés, el acoso y la orientación sexual de los alumnos de 9.º
curso explicó el 59% de la varianza de los síntomas depresivos» en
esta muestra de 143 adolescentes. El 39,2% de los adolescentes
autonotificaron síntomas depresivos clínicamente significativos
(CESD-10 >9). Las autonotificaciones de acoso fueron bajas (20%)
en esta muestra en comparación con las tasas estadounidenses del
26-28% de acoso adolescente. Se recomienda a los profesionales de
enfermería que evalúen los síntomas depresivos en los
adolescentes y los remitan si se requiere tratamiento.

PROCESO DE RECOGIDA DE DATOS


La recogida de datos es el proceso de seleccionar participantes del
estudio y recoger los datos para un estudio. Los pasos reales para la
recogida de datos son específicos de cada estudio y dependen del
diseño de la investigación, de la muestra y de las técnicas de

618
medición. Durante el proceso de recogida de datos, los
investigadores forman a quienes recogen los datos, seleccionan a los
participantes del estudio, llevan a cabo la intervención del estudio
(si es de aplicación), recogen los datos de forma consistente y
protegen la integridad (o validez) del estudio.
Los investigadores han de describir claramente el proceso de
recogida de datos en su informe de investigación. A menudo, el
proceso de recogida de los datos se aborda en la sección de métodos
del informe, en una subsección titulada «Procedimiento». Deben
describirse las estrategias usadas para dirigirse a los participantes
potenciales que cumplen los criterios de muestreo (v. cap. 9). Los
investigadores también deberían especificar el número y las
características de los sujetos que rechazan participar en el estudio.
Si el estudio incluye una intervención, deberían describirse los
detalles acerca de esta y cómo se aplicó (v. cap. 8). También se
deberían describir los métodos utilizados para realizar las
mediciones y el momento y el entorno para efectuarlas. El resultado
deseado es una descripción paso a paso de exactamente cómo,
dónde y en qué secuencia los investigadores recogieron los datos
del estudio. En las siguientes secciones se explican algunas de las
tareas habituales de recogida de datos descritas en los informes de
investigación, como el reclutamiento de participantes del estudio, la
consistencia de la recogida de datos y el control en la aplicación del
diseño del estudio. Los investigadores de enfermería también
realizan estudios a partir de bases de datos existentes y es
importante valorar de forma crítica los datos obtenidos de ellas.

Reclutamiento de participantes del estudio


La comunicación de la investigación ha de describir el proceso de
reclutamiento de los participantes en el estudio. Los participantes
del estudio pueden reclutarse solo al inicio o durante el periodo de
la recogida de datos. El diseño del estudio determina el método de
selección de los participantes. El reclutamiento del número de
participantes planificado originalmente es crucial, porque el análisis
de los datos y la interpretación de los hallazgos dependen de que la
muestra tenga un tamaño adecuado.

619
Consistencia en la recogida de datos
La clave para una recogida de datos exacta en cualquier estudio es
la consistencia. Esta implica mantener el patrón de recogida de
datos en cada fase de recogida según se planificó en el programa de
investigación. Una buena planificación facilitará la coherencia y
mantendrá la validez del estudio. Los investigadores deberían notar
desviaciones, incluso aunque sean mínimas, y comunicar su
impacto sobre la interpretación de los hallazgos en el informe final
de su estudio. Si un estudio utiliza recopiladores de datos, los
investigadores han de comunicar el proceso de formación y la
fiabilidad interobservador conseguida durante el entrenamiento y
la recogida de los datos.

Control del diseño del estudio


Los investigadores incorporan controles en su planificación del
estudio para minimizar la influencia de fuerzas que intervengan
sobre los hallazgos. El control es muy importante en los estudios
cuasiexperimentales y experimentales para asegurarse de que la
intervención se lleva a cabo de forma consistente (Shadish, Cook y
Campbell, 2002). El informe de investigación ha de reflejar los
controles aplicados en un estudio y cualquier problema que
necesite resolverse durante el estudio. Además, para mantener los
controles identificados en la planificación, los investigadores
buscan continuamente variables externas no identificadas que
podrían tener influencia sobre los datos que se están recogiendo.
Una variable externa a menudo es específica para un estudio, tiende
a hacerse evidente durante el periodo de recogida de datos y debe
explicarse en el informe de investigación. Por ejemplo, Lu y cols.
(2013) examinaron los efectos de la acupresión sobre la calidad del
sueño y controlaron el entorno donde se llevó a cabo la
intervención para disminuir los efectos de cualquier variable
externa, como ruido, temperatura o iluminación, que pudiera
influir en los hallazgos del estudio. Los participantes no recibieron
fármacos hipnóticos durante este estudio para evitar la influencia
de esta variable externa. Los investigadores deben considerar las
variables externas identificadas durante la recogida de datos, el
análisis de los datos y la interpretación. Deberían tener en cuenta

620
estas variables en el informe de investigación para que los futuros
investigadores puedan ser conscientes de ellas e intenten
controlarlas.

Estudios que obtienen datos de bases de


datos existentes
Los investigadores de enfermería utilizan bases de datos existentes
para abordar el problema de investigación y el propósito de su
estudio. Las razones para obtener datos de bases de datos existentes
para un estudio son diversas. Con la informatización de la
información sanitaria, se han desarrollado más bases de datos a
escala internacional, nacional, regional y estatal, así como en los
centros clínicos. Estas bases de datos contienen gran cantidad de
información importante para desarrollar evidencia de investigación
necesaria para la práctica (Brown, 2018; Melnyk, Gallagher-Ford y
Fineout-Overholt, 2017). Los costes y la tecnología para el
almacenamiento de los datos han mejorado en los últimos 10 años,
haciendo que estas bases de datos sean más fiables y accesibles. El
uso de las bases de datos permite realizar análisis complejos para
ampliar nuestra comprensión de los resultados de salud. Otra razón
es que la recogida primaria de datos en un estudio está limitada por
la disponibilidad de participantes en la investigación y por el gasto
del proceso de dicha recogida. Al usar estas bases de datos, los
investigadores pueden tener muestras más grandes, realizar más
estudios longitudinales, tener menos costes durante el proceso de
recogida de datos y limitar la carga sobre los participantes del
estudio (Johantgen, 2010).
Los datos sanitarios existentes que suelen utilizarse en
investigación son secundarios y administrativos. Los datos
recogidos para un estudio en particular se consideran datos
primarios. Los datos recogidos de investigaciones previas y
almacenados en una base de datos se consideran datos secundarios
cuando son usados por otros investigadores para abordar los
propósitos de su estudio. Puesto que estos datos se recogieron como
parte de la investigación, pueden obtenerse detalles acerca de los
procesos de recogida y almacenamiento de los datos, incluida
cualquier publicación previa basada en los datos. Los

621
investigadores suelen indicar en la sección de metodología de su
informe de investigación cuándo usaron análisis de datos
secundarios en su estudio (Johantgen, 2010).
Los datos recogidos por razones diferentes a la investigación se
consideran datos administrativos. Los datos administrativos se
recogen en los centros clínicos, se obtienen en organizaciones
profesionales nacionales, estatales y locales, y se recogen por
organismos federales, estatales y locales. Los procesos de recogida y
almacenamiento de datos administrativos son más complejos y a
menudo menos claros que el proceso de recogida de datos para
investigación (Johantgen, 2010). Los datos de las bases de datos
administrativas son recogidos por personas diferentes en distintos
lugares usando métodos diversos. Sin embargo, los elementos de
los datos recogidos para la mayoría de las bases de datos
administrativas incluyen demografía, características organizativas,
diagnóstico y tratamiento clínicos, e información geográfica. Los
elementos de estas bases de datos se han estandarizado según la
Health Insurance Portability and Accountability Act (HIPAA), lo
que mejoró la calidad de las bases de datos (v. cap. 4).
Debe describirse claramente el tipo de base de datos utilizada en
un estudio. Los datos de la base han de abordar el propósito del
estudio de los investigadores y sus objetivos, preguntas o hipótesis.
La validez y la fiabilidad de los datos de la base de datos existente
han de describirse en el informe de investigación.

GUÍAS DE VALORACIÓN CRÍTICA


Recogida de datos
Cuando se valora de forma crítica el proceso de recogida de
datos, se deben plantear las siguientes preguntas:

1. ¿El reclutamiento y la selección de los participantes del


estudio se describieron claramente y eran adecuados?
2. ¿Los datos se recogieron de forma consistente?
3. ¿Los controles del estudio se mantuvieron como indicaba el
diseño? ¿El diseño incluía una intervención que se llevó a
cabo de forma consistente?

622
4. ¿Se protegió la integridad del estudio? ¿Cómo se resolvieron
los problemas?
5. ¿Los investigadores obtuvieron los datos de una base de
datos existente? Si es así, ¿los datos obtenidos abordaban el
propósito y los objetivos, preguntas o hipótesis del estudio?
¿Se abordaron la fiabilidad y validez de la base de datos en el
informe de investigación?

El estudio de Williams y cols. (2017) (citado previamente) evaluó


el estrés y el acoso como factores predictivos de síntomas
depresivos en adolescentes. Los elementos del proceso de recogida
de datos para este estudio se presentan en el Ejemplo de
investigación 10.8.

EJEMPLO DE INVESTIGACIÓN 10.8


Recogida de datos
Extracto del estudio de investigación
Se utilizó un método de muestreo de conveniencia no probabilístico; la
muestra resultante constaba de 143 estudiantes de 9.º curso de dos
institutos públicos suburbanos del sureste de Estados Unidos. Los
requisitos de elegibilidad incluyeron: 1) estudiantes de 9.º curso de
14-16 años… y 5) que tuviesen el consentimiento parental. Los
criterios de exclusión incluyeron: 1) personas que no hablasen
inglés… y 5) enfermedad física con autonotificación de fiebre…

El estudio fue revisado y aprobado por el comité de revisión


institucional (CRI) de la universidad, así como por los dos
superintendentes, directores y profesionales de enfermería de los
centros educativos. El investigador principal explicó el estudio a todos
los estudiantes de 9.º curso y entregó paquetes con una carta a los
progenitores, un formulario de rechazo y un formulario de
consentimiento para que lo firmasen y lo devolviesen. Los
adolescentes que eran elegibles para participar firmaron un

623
formulario de asentimiento antes de comenzar el estudio. Los
participantes en el estudio se programaron de 8 a 11 a.m. para
completar los cuatro cuestionarios de autonotificación (demografía,
estrés percibido, acoso y síntomas depresivos) durante una clase
optativa de 50 minutos en el laboratorio de informática del centro
educativo… Al finalizar el estudio, se entregó una tarjeta regalo de 5
dólares a cada participante para un restaurante local y se ofreció
información sobre asesores de salud mental que estaban disponibles a
bajo coste o gratis. Las medidas del estudio se seleccionaron en
función del marco conceptual, la fiabilidad, la validez y la
factibilidad…

Se utilizó el programa Statistical Package for Social Sciences (SPSS),


2011, v20.0 para Windows para todos los análisis estadísticos.
(Williams y cols., 2017, pág. 25)

Valoración crítica
Williams y cols. (2017) implementaron unos criterios de muestreo
detallados para fomentar una muestra homogénea y reducir los
efectos de las variables externas. El tamaño de la muestra era
elevado (n = 143) y los hallazgos fueron significativos, lo que indica
que no había error de tipo II. Los investigadores programaron la
recogida de datos durante las clases optativas de los estudiantes
para no interrumpir sus asignaturas obligatorias. Se ofreció una
tarjeta de regalo para aumentar la participación, pero es probable
que no sesgase las respuestas de los estudiantes en los métodos de
medición. La ética del estudio se documentó, con la aprobación del
CRI de la universidad, la aprobación en los centros educativos, el
consentimiento de los progenitores y el asentimiento de los
adolescentes. Los valores de fiabilidad de las escalas usadas eran
altos, pero los investigadores podrían haberse extendido en la
descripción de su validez (v. descripción previa de los
instrumentos). Los análisis estadísticos eran apropiados para los
datos del estudio y los resultados indicaron que el 59% de la
varianza de los síntomas depresivos en los adolescentes se predecía
por la percepción del estrés, el acoso y la orientación sexual. La
solidez de los criterios de muestreo y del tamaño muestral, la

624
inclusión de dos entornos, el uso de métodos de medición
apropiados para adolescentes y el proceso de recogida de datos
estructurado aumentaron la probabilidad de que los hallazgos del
estudio fueran un reflejo exacto de la realidad.

PUNTOS CLAVE
• El propósito de la medición es obtener datos o pruebas
fiables que puedan utilizarse para abordar el propósito,
objetivos, preguntas o hipótesis de la investigación.
• Las reglas de la medición aseguran que la asignación de los
valores o categorías se realice de forma consistente de un
participante en el estudio (o situación) a otro y, finalmente,
si la estrategia de medición es significativa, de un estudio a
otro.
• Los niveles de medición, de menor a mayor, son nominal,
ordinal, de intervalo y de razón.
• La fiabilidad en la medición se relaciona con la consistencia
de la técnica de medición; las pruebas de fiabilidad se
centran en la estabilidad, la equivalencia y la consistencia
interna.
• La validez de un instrumento es una determinación del
grado en el que dicho instrumento refleja el concepto
abstracto que se examina. Los tipos de validez descritos en
este capítulo son la validez de contenido, la validez de
constructo y la validez de criterio.
• El grado de legibilidad se centra en la capacidad de los
participantes del estudio para leer y comprender el
contenido de un instrumento, lo que se añade a su
fiabilidad y validez.
• En los informes de investigación, se examinan las medidas
fisiológicas en busca de su precisión, exactitud y error.
• Las pruebas diagnósticas y de cribado se examinan en busca
de su sensibilidad, especificidad, valor predictivo negativo
y cocientes de verosimilitudes.
• Entre los enfoques de medición utilizados habitualmente en
investigación de enfermería, se incluyen medidas

625
fisiológicas, observación, entrevistas, cuestionarios y
escalas.
• Se ha descrito el uso en la práctica de las escalas de
calificación, de Likert y visual analógica.
• Si una base de datos existente se utiliza para realizar
estudios, la calidad de dicha base debería abordarse en el
informe de investigación.
• Las tareas de recogida de datos que deben valorarse de
forma crítica en un estudio son: 1) reclutamiento de los
participantes del estudio; 2) consistencia de la recogida de
datos, y 3) mantenimiento de controles en el diseño del
estudio.

BIBLIOGRAFÍA
Armenta, B. E., Hartshorn, K. J., Whitbeck, L. B., Crawford, D. M.,
Hoyt, D. R. A longitudinal examination of the measurement
properties and predictive utility of the Center for Epidemiologic
Studies Depression Scale among North American indigenous
adolescents. Psychological Assessment. 2014; 26(4):1347–1355.

Ballard, E. D., Cwik, M., Van Eck, K., Goldstein, M., Alfes, C.,
Wilson, M. E., et al. Identification of at-risk youth by suicide
screening in a pediatric emergency department. Prevention Science.
2017; 18(2):174–182.

Bannigan, K., Watson, R. Reliability and validity in a nutshell.


Journal of Clinical Nursing. 2009; 18(23):3237–3243.

Bialocerkowski, A., Klupp, N., Bragge, P. Research methodology


series: How to read and critically appraise a reliability article.
International Journal of Therapy and Rehabilitation. 2010; 17(3):114–120.

Boyes, A. D., Carey, M., Lecathelinais, C., Girgis, A., How does the
Distress Thermometer compare to the Hospital Anxiety and

626
Depression Scale for detecting possible cases of psychological
morbidity among cancer survivors? Supportive Care in Cancer 21 1
2013:119–127. https://www.ncbi.nlm.nih.gov/pubmed/22618735

Bradley, K. L., Bagnell, A. L., Brannen, C. L. Factorial validity of the


Center for Epidemiological Studies Depression-10 in adolescents.
Issues in Mental Health Nursing. 2010; 31(6):408–412.

Brown, S. J. Evidence-based nursing: The research-practice connection,


4th ed. Sudbury, MA: Jones & Bartlett; 2018.

Buysse, D. L., Reynolds, C. F., 3rd., Monk, T. H., Berman, S. R.,


Kupfer, D. J. The Pittsburgh Sleep Quality Index: A new instrument
for psychiatric practice and research. Psychiatry Research. 1989;
28(2):193–213.

Campo, M., Shiyko, M. P., Lichtman, S. W. Sensitivity and


specificity: A review of related statistics and controversies in the
context of physical therapist education. Journal of Physical Therapy
Education. 2010; 24(3):69–78.

Charlson, M. E., Pompei, P., Ales, K. L., MacKenzie, C. R. A new


method of classifying prognostic comorbidity in longitudinal
studies: Development and validation. Journal of Chronic Diseases.
1987; 40(5):373–383.

Creswell, J. W. Research design: Qualitative, quantitative and mixed


methods approaches, 4th ed. Thousand Oaks, CA: Sage; 2014.

Creswell, J. W., Poth, C. N. Qualitative inquiry & research design:


Choosing among five approaches, 4th ed. Thousand Oaks, CA: Sage;
2018.

627
DeVon, H. A., Block, M. E., Moyle-Wright, P., Ernst, D. M., Hayden,
S. J., Lazzara, D. J., et al. A psychometric toolbox for testing validity
and reliability. Journal of Nursing Scholarship. 2007; 39(2):155–164.

Dickson, V. V., Buck, H., Riegel, B. Multiple comorbid conditions


challenge heart failure self-care by decreasing self-efficacy. Nursing
Research. 2013; 62(1):2–9.

Gift, A. G., Soeken, K. L. Assessment of physiologic instruments.


Heart & Lung. 1988; 17(2):128–133.

Gray, J. R., Grove, S. K., Sutherland, S. The practice of nursing


research: Appraisal, synthesis, and generation of evidence, 8th ed. St.
Louis, MO: Elsevier Saunders; 2017.

Grove, S. K., Cipher, D. J. Statistics for nursing research: A workbook


for evidence-based practice, 2nd ed. St. Louis, MO: Elsevier; 2017.

Ho, G. W.K. Examining perceptions and attitudes: A review of


Likert-type scales versus Q-methodology. Western Journal of Nursing
Research. 2017; 39(5):674–689.

Horowitz, L. M., Bridge, J. A., Teach, S. J., Ballard, E., Klima, J.,
Rosenstein, D. L., et al. Ask Suicide-Screening Questions (ASQ); A
brief instrument for the pediatric emergency department. Achieves
of Pediatric and Adolescent Medicine. 2012; 166(12):1170–1176.

Hunt, C., Peters, L., Rapee, R. M. Development of a measure of


being bullied in youth. Psychological Assessment. 2012; 24(1):156–165.

Johantgen, M. Using existing administrative and national


databases. In: Waltz C.F., Strickland O.L., Lenz E.R., eds.
Measurement in nursing and health research. 4th ed. New York, NY:

628
Springer; 2010:241–250.

Kaplan, A. The conduct of inquiry: Methodology for behavioral science.


New York, NY: Harper & Row; 1963.

Locke, B. Z., Putnam, P. Center for Epidemiologic Studies Depression


Scale (CES-D Scale). Bethesda, MD: National Institute of Mental
Health; 2002.

Lu, M., Lin, S., Chen, K., Tsang, H., Su, S., Acupressure improves
sleep quality of psychogeriatric inpatients. Nursing Research 62 2
2013:130–137

Marshall, C., Rossman, G. B. Designing qualitative research, 6th ed.


Thousand Oaks, CA: Sage; 2016.

McLellan, M. C., Gauvreau, K., Connor, J. A. Validation of the


Cardiac Children’s Hospital Early Warning Score: An early
warning scoring tool to prevent cardiopulmonary arrests in
children with heart disease. Congenital Heart Disease. 2014; 9(3):194–
202.

McLellan, M. C., Gauvreau, K., Connor, J. A. Validation of the


Children’s Hospital Early Warning System for critical deterioration
recognition. Journal of Pediatric Nursing. 2017; 32(1):52–58.

Melnyk, B. M., Gallagher-Ford, E., Fineout-Overholt. Implementing


evidence-based practice competencies in healthcare: A practical guide for
improving quality, safety, & outcomes. Indianapolis, IN: Sigma Theta
Tau International; 2017.

Musiello, T., Dixon, G., O’Connor, M., Cook, D., Miller, L.,
Petterson, A., et al. A pilot study of routine screening for distress by

629
a nurse and psychologist in an outpatient hematological oncology
clinic. Applied Nursing Research. 2017; 33(1):15–18.

Nunnally, J. C., Bernstein, I. H. Psychometric theory, 3rd ed. New


York, NY: McGraw-Hill; 1994.

Polit, D. F., Yang, F. M. Measurement and the measurement of change.


Philadelphia, PA: Wolters Kluwer; 2016.

Radloff, L. S. The CES-D scale: A self-report depression scale for


research in the general population. Applied Psychological
Measurement. 1977; 1:385–394.

Ryan-Wenger, N. A. Precision, accuracy, and uncertainty of


biophysical measurements for research and practice. In: Waltz C.F.,
Strickland O.L., Lenz E.R., eds. Measurement in nursing and health
research. 5th ed. New York, NY: Springer; 2017:427–445.

Schmitt, A., Reimer, A., Hermanns, N., Kulzer, B., Ehrmann, D.,
Krichbaum, M., et al. Depression is linked to hyperglycemia via
suboptimal diabetes self-management: A cross-sectional mediation
analysis. Journal of Psychosomatic Research. 2017; 94(1):17–23.

Shadish, W. R., Cook, T. D., Campbell, D. T. Experimental and quasi-


experimental designs for generalized causal inference. Chicago, IL: Rand
McNally; 2002.

Sharp, L. K., Lipsky, M. S. Screening for depression across the


lifespan: A review of measures for use in primary care settings.
American Family Physician. 2002; 66(6):1001–1008.

Stevens, S. S. On the theory of scales of measurement. Science. 1946;


103(2684):677–680.

630
Stone, K. S., Frazier, S. K. Measurement of physiological variables
using biomedical instrumentation. In: Waltz C.F., Strickland O.L.,
Lenz E.R., eds. Measurement in nursing and health research. 5th ed.
New York, NY: Springer; 2017:379–425.

Straus, S. E., Glasziou, P., Richardson, W. S., Rosenberg, W.,


Haynes, R. B. Evidence-based medicine: How to practice and teach EBM,
5th ed. Edinburgh: Churchill Livingstone Elsevier; 2011.

Umberger, R. A., Hatfield, L. A., Speck, P. M. Understanding


negative predictive value of diagnostic tests used in clinical
practice. Dimensions of Critical care Nursing. 2017; 36(1):22–29.

Waltz, C. F., Strickland, O. L., Lenz, E. R. Measurement in nursing


and health research, 5th ed. New York, NY: Springer Publishing
Company; 2017.

Weber, M. A., Schiffrin, E. L., White, W. B., Mann, S., Lindholm, L.


H., Kenerson, J. G., et al. Clinical practice guidelines for the
management of hypertension in the community: A statement by the
American Society of Hypertension and the International Society of
Hypertension. Journal of Hypertension. 2014; 32(1):3–15.

Wewers, M. E., Lowe, N. K. A critical review of visual analogue


scales in the measurement of clinical phenomena. Research in
Nursing & Health. 1990; 13(4):227–236.

Williams, S. G., Turner-Henson, A., Langhinrichsen-Rohling, J.,


Azuero, A. Depressive symptoms in 9th graders: Stress and
physiological contributors. Applied Nursing Research. 2017; 34(1):24–
28.

Wong-Baker FACES Foundation. Wong-Baker FACES® Pain Rating

631
Scale. Consultada el 25 de abril de 2017, en
http://www.wongbakerfaces.org/, 2017.

632
C A P Í T U L O 11

Consideraciones
sobre la estadística en
investigación
Susan K. Grove

La página web de la National Guideline Clearinghouse de la Agency for


Healthcare Research and Quality (AHRQ) se cerró en 2018. Puede
consultarse más información en https://www.ahrq.gov/.

ÍNDICE DEL CAPÍTULO

Comprensión de teorías y conceptos del proceso de


análisis estadístico, 293
Identificación de los pasos del proceso de análisis de
datos, 299
Uso de la estadística para describir variables, 301
Determinación de la idoneidad de la estadística
inferencial en los estudios, 309
Uso de la estadística para examinar relaciones, 312
Uso de la estadística para predecir resultados, 317
Uso de la estadística para examinar diferencias, 319

633
Interpretación de los resultados de investigación, 326
Puntos clave, 330
Bibliografía, 331

OBJETIVOS DE APRENDIZAJE
Tras concluir este capítulo, el lector debería ser capaz de:
1. Describir la teoría de la probabilidad y la teoría de la decisión
que dirigen el análisis estadístico de los datos.
2. Describir el proceso de inferencia de una muestra a una
población.
3. Comparar y diferenciar los errores de tipos I y II que se
producen en los estudios.
4. Identificar los pasos del proceso de análisis de los datos: a)
gestión de los datos perdidos; b) descripción de la muestra; c)
fiabilidad de los métodos de medición; d) análisis exploratorio
de los datos, y e) uso de análisis estadísticos inferenciales
guiados por objetivos, preguntas o hipótesis del estudio.
5. Identificar los análisis descriptivos, tales como distribución de
frecuencias, porcentajes, medidas de tendencia central y
medidas de dispersión, realizados para describir la muestra y
estudiar las variables en informes de investigación.
6. Describir los resultados obtenidos en los análisis estadísticos
inferenciales realizados para examinar relaciones (análisis de
correlación de producto-momento de Pearson y análisis
factorial) y establecer predicciones (análisis de regresión lineal
y análisis de regresión múltiple).
7. Describir los resultados obtenidos en los análisis estadísticos
inferenciales realizados para examinar diferencias, como
prueba de χ2, prueba t, análisis de la varianza y análisis de la
covarianza.
8. Describir los cinco tipos de resultados obtenidos en estudios
cuasiexperimentales y experimentales interpretados en un

634
marco teórico de decisión: a) resultados significativos y
predichos, b) resultados no significativos, c) resultados
significativos no predichos, d) resultados mixtos y e) resultados
inesperados.
9. Comparar y contrastar la significación estadística y la
importancia clínica de los resultados.
10. Realizar una valoración crítica de los resultados estadísticos,
hallazgos, limitaciones, conclusiones, generalización de los
hallazgos, implicaciones para enfermería y sugerencias
respecto a futuras investigaciones en un estudio publicado.

La expectativa de que la práctica enfermera se base en evidencias


de investigación ha otorgado importancia a que los estudiantes y
profesionales de enfermería adquieran competencias en la lectura y
evaluación de los resultados de análisis estadísticos (Gray, Grove, y
Sutherland, 2017). Probablemente los profesionales de enfermería
sientan más inquietud por el análisis de datos y los resultados
estadísticos que por cualquier otro aspecto del proceso de
investigación. Esperamos que este capítulo acabe con parte de esa
inquietud y facilite la valoración crítica de los resultados de los
informes de investigación. La información estadística de este
capítulo está organizada desde la perspectiva de la lectura,
comprensión y valoración crítica de la sección de resultados de los
estudios cuantitativos, más que desde la selección de técnicas
estadísticas para el análisis de datos o la realización de análisis
estadísticos.
Se describen las teorías y los conceptos relevantes con el fin de
aportar el conocimiento básico necesario para comprender los
resultados de los informes de investigación. Se introducen
brevemente los pasos del análisis de los datos. Se comentan algunas
de las técnicas estadísticas habituales empleadas para describir
variables, examinar las relaciones entre las variables, predecir
resultados y poner a prueba hipótesis causales. Se proporcionan
estrategias para determinar la idoneidad de los análisis estadísticos
realizados para obtener resultados de los estudios y se
proporcionan guías para la valoración crítica de los resultados. El

635
capítulo termina con guías para la valoración crítica referentes a los
siguientes resultados de estudios: hallazgos, limitaciones,
conclusiones, generalizaciones, implicaciones para la práctica
enfermera y recomendaciones sobre futuros estudios. En todo el
capítulo se presentan ejemplos de estudios actuales para favorecer
la comprensión del contenido.

COMPRENSIÓN DE TEORÍAS Y
CONCEPTOS DEL PROCESO DE
ANÁLISIS ESTADÍSTICO
Un motivo por el que los profesionales de enfermería suelen evitar
la estadística es que a muchos solo les enseñaron las operaciones
matemáticas del cálculo de ecuaciones estadísticas, sin apenas
explicar la lógica inherente a esas operaciones ni el significado de
los resultados. El cálculo es un proceso mecánico que suele realizar
un ordenador y la información sobre la técnica de cálculo no es
necesaria para empezar a comprender los resultados estadísticos.
Aquí se presenta un enfoque del análisis de datos que mejorará la
comprensión del proceso de análisis estadístico. Este conocimiento
se puede utilizar para la valoración crítica de las técnicas de análisis
y los resultados de los informes de investigación.
Se proporciona una breve explicación de algunas de las teorías y
los conceptos importantes para comprender el proceso de análisis
estadístico. Se comenta la teoría de la probabilidad y de la decisión,
y se describen los conceptos de comprobación de hipótesis, nivel de
significación, inferencia, generalización, curva normal, número de
colas, errores de tipos I y II, potencia y grados de libertad. Otros
textos contienen una descripción más detallada de estos temas, por
lo que recomendamos nuestros propios manuales (Gray y cols.,
2017; Grove y Cipher, 2017) y otros textos de estadística de calidad
(Plichta y Kelvin, 2013; Polit, 2010).

Teoría de la probabilidad
La teoría de la probabilidad se emplea para explicar la magnitud
de una relación, la probabilidad de que suceda un evento en una

636
situación determinada o la probabilidad de que un evento pueda
predecirse con exactitud. El investigador desearía conocer la
probabilidad de que un resultado particular se deba a una
intervención de enfermería. Por ejemplo, el investigador puede
querer saber con cuánta probabilidad el sondaje vesical durante un
ingreso provocará una infección del tracto urinario (ITU) tras el alta
hospitalaria. Es posible que el investigador también desee conocer
la probabilidad de que los participantes del estudio del grupo
experimental sean miembros de la misma población más amplia de
la que se obtuvieron los participantes del grupo de comparación o
control. La probabilidad se indica por la letra p minúscula, con sus
valores expresados como porcentajes o decimales, de 0 a 1. Por
ejemplo, si la probabilidad es 0,23, se expresa como p = 0,23. Esto
significa que hay una probabilidad del 23% de que se produzca un
resultado determinado (p. ej., una ITU). Los valores de
probabilidad también se reseñan como menos de una cifra
específica, por ejemplo 0,05, expresada en forma de p <0,05. Un
estudio podría indicar la probabilidad de que los participantes del
grupo experimental fueran miembros de la misma población más
grande que los participantes del grupo de comparación, menor o
igual al 5% (p ≤0,05). En otras palabras, no es muy probable que el
grupo de comparación y el experimental provengan de la misma
población. Dicho de otra forma, hay un 5% de probabilidad de que
los dos grupos provengan de la misma población y una
probabilidad del 95% de que no provengan de la misma población.
La inferencia es que el grupo experimental es diferente al grupo de
comparación por el efecto de la intervención del estudio. Los
valores de probabilidad suelen reseñarse con los resultados de los
análisis estadísticos inferenciales.

Teoría de la decisión, comprobación de


hipótesis y nivel de significación
La teoría de la decisión asume que todos los grupos de un estudio
(p. ej., experimental y de comparación) usados para poner a prueba
una hipótesis particular son componentes de la misma población en
lo que respecta a las variables en estudio. Esta expectativa (o
suposición) suele expresarse como hipótesis nula, que declara que

637
no hay diferencia entre los grupos de un estudio en lo que respecta
a las variables incluidas en la hipótesis (v. más detalles de las
hipótesis en el cap. 5). Es misión del investigador aportar evidencias
de una diferencia genuina entre los grupos. Por ejemplo, el
investigador puede formular la hipótesis de que la frecuencia de
ITU producidas tras el alta hospitalaria en pacientes sometidos a
sondaje urinario durante el ingreso no es distinta de la frecuencia
de esas infecciones en los que no fueron sondados. Con el fin de
poner a prueba esta hipótesis nula, se selecciona un punto de corte
antes de la recogida de los datos. El punto de corte, denominado α
o nivel de significación estadística, es el grado de probabilidad con
el que se juzga que los resultados del análisis estadístico indican
una diferencia estadísticamente significativa entre los grupos. El
nivel de significación elegido para la mayoría de los estudios de
enfermería es 0,05. Si el valor de p encontrado en el análisis
estadístico es ≤0,05, se considera que los grupos experimental y de
comparación son significativamente diferentes (miembros de
distintas poblaciones).
La teoría de la decisión requiere que el punto de corte
seleccionado para un estudio sea un absoluto. Absoluto significa
que, aunque el valor obtenido solo sea mínimamente mayor que el
punto de corte, las muestras se consideren de la misma población y
no es posible atribuir un significado a las diferencias. No es
correcto, si se usa la teoría de la decisión, reseñar que los hallazgos
alcanzaron la significación con p = 0,051 si el valor de α se había
fijado en 0,05. De acuerdo con las reglas de la teoría de la decisión,
este hallazgo indica que los grupos estudiados no son
significativamente diferentes y se acepta la hipótesis nula. Por otra
parte, una vez que el nivel de significación se ha fijado en 0,05 por
el investigador, si el análisis revela una diferencia significativa de
0,001, este resultado no se considera más significativo que el 0,05
propuesto originalmente (Slakter, Wu y Suzaki-Slakter, 1991). El
nivel de significación es dicotómico, lo que implica que la diferencia
es significativa o no significativa; no hay «grados» de significación.
Sin embargo, algunas personas, sin darse cuenta de que su
razonamiento ha pasado de la teoría de la decisión a la teoría de la
probabilidad, indican en su informe de investigación que el
resultado de 0,001 convierte los hallazgos en más significativos que

638
si hubieran obtenido un valor de p = 0,05.
Desde la perspectiva de la teoría de la probabilidad, hay una
diferencia considerable en el riesgo de que tenga lugar un error de
tipo I (decir que algo es significativo cuando no lo es) si la
probabilidad está entre 0,05 y 0,001. Si p = 0,001, la probabilidad de
que los dos grupos sean componentes de la misma población es 1
entre 1.000; si p = 0,05, la probabilidad de que los grupos
pertenezcan a la misma población es de 5 entre 100. En otras
palabras, si p = 0,05, 5 veces de cada 100 los grupos con valores
estadísticos como los encontrados en los análisis estadísticos
realmente serán miembros de la misma población, y la conclusión
de que los grupos son diferentes es errónea.
En el análisis informático, el valor de probabilidad obtenido de
cada análisis de los datos (p. ej., p = 0,03 o p = 0,07) a menudo se
proporciona con los resultados y suele ser reseñado por el
investigador en el estudio publicado, junto con el nivel de
significación que se fijó antes de realizar el análisis de los datos. En
resumen, el valor de probabilidad (p) revela el riesgo de error de
tipo I en un estudio particular. El valor de α, fijado antes del
estudio, por lo general en α = 0,05, revela si el valor de probabilidad
para un análisis determinado en un estudio cumplió con el punto
de corte de una diferencia significativa entre los grupos o una
relación significativa entre las variables.

Inferencia y generalización
Una inferencia es una conclusión o juicio basado en la evidencia.
Las inferencias estadísticas se establecen con sumo cuidado y
cautela. Las reglas de la teoría de la decisión usadas para interpretar
los resultados de las técnicas estadísticas aumentan la probabilidad
de que las inferencias sean exactas. Una generalización es la
aplicación de una información obtenida en un caso particular a una
situación general. Generalizar supone realizar una inferencia; en
ambos casos se requiere el uso del razonamiento inductivo. Una
inferencia se establece desde un caso específico y se amplía a una
verdad general, de la parte al todo, de lo concreto a lo abstracto y
de lo conocido a lo desconocido. En la investigación, la inferencia se
establece a partir de los hallazgos obtenidos en el estudio con una

639
muestra específica y se aplica a una población diana más general,
usando los resultados de los análisis estadísticos. Por ejemplo, un
investigador puede concluir en su informe de investigación que
encontró una diferencia significativa en el número de ITU entre dos
muestras, una cuyos participantes habían sido sondados durante el
ingreso y otra cuyos participantes no lo fueron. El investigador
puede concluir, asimismo, que esta diferencia puede esperarse en
todos los pacientes que han sido atendidos en hospitales. Los
hallazgos se generalizan de la muestra del estudio a todos los
pacientes ingresados previamente. Los investigadores y estadísticos
nunca pueden probar algo usando la inferencia; jamás estarán
seguros de si sus inferencias y generalizaciones son correctas. Es
posible que la generalización del investigador sobre la incidencia de
ITU no se haya planteado meticulosamente; los hallazgos quizá se
han generalizado a una población excesivamente amplia. Es posible
que en la población más general no haya diferencias en la
incidencia de ITU según si el paciente fue sondado o no. La
generalización de los hallazgos de un estudio forma parte de la
sección de discusión de un informe de investigación que se describe
más adelante en este capítulo.

Curva normal
La curva normal es una distribución de frecuencias teórica de todos
los valores posibles en una población; sin embargo, ninguna
distribución real encaja exactamente en la curva normal (fig. 11.1).
La idea de la curva normal fue desarrollada en 1795 por un
matemático de 18 años, Johan Gauss, quien encontró que los
resultados del análisis de los datos de variables (p. ej., media de
cada muestra) medidos repetidamente en muchas muestras de la
misma población pueden combinarse en una muestra grande. A
partir de esta muestra grande, se desarrolla una representación más
exacta del patrón de la curva en esa población de lo que sería
posible con solo una muestra. Curiosamente, en la mayoría de los
casos, la curva es similar, con independencia de las variables
específicas examinadas o la población estudiada.

640
FIG 11.1 Curva normal.

Los niveles de significación y probabilidad se basan en la lógica


de la curva normal. La curva normal de la figura 11.1 muestra la
distribución de valores de una sola población. Obsérvese que el
95,5% de los valores están a 2 desviaciones estándar (DE) de
distancia de la media, oscilando de −2 a +2 DE. (La DE se describe
más adelante en este capítulo.) Hay una probabilidad de alrededor
del 95% de que un valor medido determinado (p. ej., la media de un
grupo) se sitúe en un intervalo de ±2 DE de la media de la
población y hay un 5% de probabilidad de que el valor esté en las
colas de la curva normal (fig. 11.2). Las colas son los extremos de la
curva normal, que incluyen por debajo de −2 (−1,96 exactamente)
DE (2,5%) o por encima de +2 (+1,96 exactamente) DE (2,5%). Si los

641
grupos que se están comparando son de la misma población (no
significativamente diferentes), cabría esperar que los valores (p. ej.,
las medias) de cada grupo estuvieran dentro del intervalo del 95%
de los valores en la curva normal. Si los grupos son de poblaciones
(significativamente) diferentes, cabría esperar que uno de los
valores del grupo estuviera fuera del intervalo del 95% de los
valores. Un análisis estadístico inferencial realizado para
determinar diferencias entre los grupos, usando un nivel de
significación (α) fijado en 0,05 pondría a prueba ese supuesto. Si la
prueba estadística demuestra una diferencia significativa (el valor
de un grupo no está dentro del intervalo del 95% de los valores), se
considera que los grupos pertenecen a poblaciones diferentes. No
obstante, en el 5% de las pruebas estadísticas cabe esperar que el
valor de uno de los grupos se sitúe fuera del intervalo del 95% de
los valores, pero aun así pertenecen a la misma población (error de
tipo I).

FIG 11.2 Prueba de significación de dos colas.

Número de colas

642
Con las hipótesis no direccionales, los investigadores asumen que
un valor extremo (obtenido porque el grupo con ese valor extremo
no pertenecía a la misma población) puede tener lugar en
cualquiera de las colas de la curva normal (v. fig. 11.2). El análisis
de una hipótesis no direccional se denomina prueba de
significación de dos colas. En una prueba de significación de una
cola, la hipótesis es direccional y los valores estadísticos extremos
que tienen lugar en una sola cola de la curva resultan de interés (v.
la descripción de hipótesis direccionales y no direccionales en el
cap. 5). La hipótesis establece que el valor extremo es mayor o
menor que el correspondiente al 95% de la población, lo cual indica
que la muestra con el valor extremo no es un componente de la
misma población. En este caso, el 5% de los valores estadísticos que
se consideran significativos estarán en una cola, en vez de en dos.
Los valores estadísticos extremos situados en la otra cola de la
curva no se consideran significativamente diferentes.
En la figura 11.3 se muestra una prueba de significación de una
cola, en la que los valores estadísticos que se consideran para la
significación están en la cola derecha. El desarrollo de una hipótesis
de una cola exige que el investigador tenga suficiente conocimiento
de las variables como para predecir si la diferencia estará en la cola
por encima de la media o en la cola por debajo de la media. Por
ejemplo, McKee, Long, Southward, Walker y McCown (2016, pág.
197) «plantearon la hipótesis de que los hijos de progenitores con
sobrepeso u obesos son más propensos a ser obesos». La hipótesis
direccional predice que el área de significación está en la cola
derecha de la curva normal, como se muestra en la figura 11.3. Los
investigadores observaron que tener un progenitor obeso era un
factor predictivo significativo de obesidad infantil. Las pruebas
estadísticas de una cola son siempre más potentes que las de dos
colas, reduciéndose la posibilidad del error de tipo II.

643
FIG 11.3 Prueba de significación de una cola.

Errores de tipo I y II
Según la teoría de la decisión, puede haber dos tipos de error
cuando un investigador está decidiendo lo que significa el resultado
de una prueba estadística: errores de tipos I y tipo II (tabla 11.1). El
error de tipo I tiene lugar cuando se rechaza la hipótesis nula y es
cierta (p. ej., cuando los resultados indican que existe una diferencia
significativa, pero en realidad no la hay). El riesgo de error de tipo I
está indicado por el nivel de significación. Hay un mayor riesgo de
error de tipo I con un nivel de significación de 0,05 (5 posibilidades
de error entre 100) que con otro de 0,01 (1 posibilidad de error entre
100).

TABLA 11.1
ERRORES DE TIPO I Y II

644
a
La hipótesis nula afirma que no existe diferencia o relación en la muestra
del estudio.
El error de tipo II, o beta (β), se produce cuando la hipótesis nula
se considera verdadera, pero en realidad es falsa. Por ejemplo, los
análisis estadísticos pueden indicar que no hay una relación
significativa entre las variables o diferencia entre los grupos,
cuando en realidad hay una relación o diferencia significativa (v.
tabla 11.1). Hay un riesgo mayor de error de tipo II cuando el nivel
de significación es 0,01 que cuando es 0,05. No obstante, los errores
de tipo II están causados a menudo por defectos de los métodos de
investigación. En la investigación de enfermería, se realizan muchos
estudios con muestras pequeñas y con instrumentos que no miden
con exactitud y precisión las variables estudiadas (Gray y cols.,
2017; Polit y Yang, 2016; Waltz, Strickland y Lenz, 2017). En muchas
situaciones de enfermería, múltiples variables interaccionan
causando diferencias en las poblaciones. Si solo se examinan unas
pocas de las variables que interaccionan, es posible pasar por alto
pequeñas diferencias entre los grupos. Esto da lugar a resultados no
significativos del estudio que pueden hacer que los investigadores
concluyan erróneamente que no hay diferencias entre las muestras
cuando en realidad sí las hay. Por este motivo, el riesgo de error de
tipo II suele ser elevado en los estudios de enfermería.

Potencia: control del riesgo de error de tipo


II
La potencia es la probabilidad de que una prueba estadística
detecte una diferencia significativa que sí existe (v. tabla 11.1). El
riesgo de error de tipo II puede determinarse mediante el análisis
de potencia. Cohen (1988) ha identificado los cuatro parámetros de
un análisis de potencia: 1) potencia; 2) nivel de significación; 3)
tamaño del efecto, y 4) tamaño de la muestra. Si se conocen tres de
los cuatro, es posible calcular el cuarto usando las fórmulas del
análisis de potencia que varían según el tipo de análisis que se va a

645
realizar. El nivel mínimo aceptable de potencia es de 0,80 (80%). El
investigador establece el nivel de significación (habitualmente
fijado en α = 0,05; v. cap. 9). El tamaño del efecto es «el grado en
que el fenómeno está presente en la población o el grado en que la
hipótesis nula es falsa» (Cohen, 1988, págs. 9-10). El tamaño del
efecto se puede calcular a partir de resultados de estudios previos.
Por ejemplo, si se miden las variaciones en el nivel de ansiedad en
un grupo de pacientes justo antes de la cirugía, el tamaño del efecto
será grande si se produce una gran variación de la ansiedad en el
grupo antes y después de la cirugía. Si se mide el efecto de un
programa de formación preoperatoria sobre el nivel de ansiedad, el
tamaño del efecto será la diferencia en el nivel de ansiedad postest
en el grupo experimental comparado con el del grupo de
comparación. Si se prevé tan solo un cambio discreto en el nivel de
ansiedad, el tamaño del efecto será pequeño. En muchos estudios
de enfermería únicamente se pueden esperar tamaños del efecto
pequeños. En un estudio así, suele ser necesaria una muestra de 200
o más para detectar una diferencia significativa (Cohen, 1988). Los
tamaños pequeños del efecto tienen lugar en estudios de enfermería
con muestras de escaso tamaño, diseños del estudio débiles e
instrumentos que solo miden variaciones grandes. Los
investigadores utilizan el valor de potencia (80%), el nivel de
significación (α = 0,05) y el tamaño del efecto para calcular el
tamaño muestral necesario para un estudio (Cohen, 1988; v. cap. 9).
El nivel de potencia debería describirse en los estudios que no
logran rechazar la hipótesis nula (hallazgos no significativos). Si el
nivel de potencia está por debajo de 0,80, tendrá que cuestionarse la
validez de los hallazgos no significativos.

Grados de libertad
El concepto de grados de libertad (gl) es importante para calcular
los análisis estadísticos e interpretar los resultados. Los grados de
libertad suponen la libertad del valor de un índice de variar dados
los demás valores de los índices existentes y la suma establecida de
esos índices (Gray y cols., 2017). Los grados de libertad suelen
reseñarse con los resultados estadísticos.

646
IDENTIFICACIÓN DE LOS PASOS DEL
PROCESO DE ANÁLISIS DE LOS
DATOS
El proceso de análisis de datos en investigación cuantitativa
implica el manejo de datos numéricos y el análisis estadístico de
estos datos para obtener los resultados del estudio. Los análisis
estadísticos son técnicas o procedimientos usados para examinar,
reducir y aportar significado a los datos numéricos recogidos en un
estudio. En este manual, la estadística se divide en dos grandes
categorías: descriptiva e inferencial. La estadística descriptiva está
compuesta por datos estadísticos de resumen que permiten al
investigador organizar los datos de tal forma que proporcionen
significado y faciliten el conocimiento. Los datos estadísticos
descriptivos se calculan para describir la muestra y las variables
clave del estudio. La estadística inferencial está diseñada para
abordar objetivos, preguntas e hipótesis de los estudios que
permitan realizar inferencias desde la muestra estudiada hasta la
población diana. Los análisis inferenciales se realizan con el fin de
identificar relaciones, examinar predicciones y determinar
diferencias de grupos en los estudios.
En la valoración crítica de un estudio, es útil comprender los
siguientes pasos que los investigadores implementan durante el
análisis de datos: 1) gestión de los datos perdidos, 2) descripción de
la muestra, 3) examen de la fiabilidad de los métodos de medición,
4) realización de análisis exploratorios de los datos del estudio y 5)
realización de análisis inferenciales dirigidos por las hipótesis,
preguntas y objetivos del estudio (cuadro 11.1). Aunque no todas
estas fases quedan reflejadas por igual en el informe final del
estudio, sí contribuyen al conocimiento que se puede adquirir del
análisis de los datos del estudio.

C U A D R O 11 . 1 PASOS DEL PROCESO DE


ANÁLISIS DE DATOS

1. Gestión de los datos perdidos.

647
2. Descripción de la muestra.
3. Análisis de la fiabilidad de los métodos de medición.
4. Realización del análisis exploratorio de los datos.
5. Realización de los análisis estadísticos inferenciales guiados
por los objetivos, preguntas o hipótesis del estudio.

Gestión de los datos perdidos


Excepto en estudios muy pequeños, los investigadores casi siempre
utilizan ordenadores para los análisis de datos. El primer paso del
proceso consiste en introducir los datos en el ordenador usando un
plan sistemático diseñado para reducir errores. Los datos perdidos
se identifican durante la introducción de datos. Si faltan suficientes
datos de ciertas variables, es posible que los investigadores tengan
que determinar si los datos son suficientes para realizar un análisis
usando esas variables. En algunos casos, algunos participantes del
estudio se deben descartar de un análisis porque faltan datos
considerados esenciales para dicho análisis. A la hora de examinar
los resultados de un estudio publicado, es posible observar que el
número de participantes incluidos en el análisis final es menor que
la muestra original; esto podría deberse al abandono de la muestra
y/o exclusión del análisis de participantes con datos perdidos. Es
importante que los investigadores comenten los datos perdidos y su
gestión en el estudio.

Descripción de la muestra
Los investigadores presentan un cuadro de la muestra tan completo
como sea posible en el informe de investigación. Las variables
relevantes para la muestra se denominan variables demográficas y
pueden incluir edad, sexo, grupo étnico, nivel educativo y
diagnóstico. El análisis de las variables demográficas proporciona
las características de la muestra para los participantes en el estudio
(v. cap. 5). Cuando un estudio incluye más de un grupo (p. ej.,
grupo de tratamiento y grupo control o de comparación), los
investigadores suelen comparar los grupos en relación con las
variables demográficas. Por ejemplo, podría ser importante saber si
las distribuciones de edad y de niveles educativos de los grupos
eran similares. Cuando las variables demográficas son similares

648
para los grupos de tratamiento (intervención) y de comparación, el
estudio es más sólido, porque es más probable que los resultados
estén causados por la intervención en lugar de por las diferencias
de grupo al comienzo del estudio.

Fiabilidad de los métodos de medición


Los investigadores deben reseñar la fiabilidad de los métodos de
medición utilizados en su estudio. La fiabilidad de las medidas
observacionales o fisiológicas suele determinarse en la fase de
recogida de datos y debe indicarse en el informe de investigación.
Si se usó una escala de múltiples ítems para recoger datos en el
estudio, hay que incluir el valor α de Cronbach en el informe de
investigación (Waltz y cols., 2017). Un valor de 0,70 se considera
aceptable, especialmente para las escalas nuevas. Un coeficiente α
de Cronbach de 0,80-0,90 proveniente de investigaciones previas
indica que una escala tiene la fiabilidad suficiente para emplearse
en un estudio. Es posible utilizar la prueba t o la estadística de
correlación de Pearson para determinar la fiabilidad test-retest. A la
hora de valorar críticamente un estudio, se debe examinar la
fiabilidad de los métodos de medición y las técnicas estadísticas
utilizadas para determinar esos valores. En ocasiones, los
investigadores examinan la validez de los métodos de medición
usados en sus estudios y este aspecto también debe incluirse en el
informe de investigación (v. cap. 10).

Análisis exploratorios
El siguiente paso, los análisis exploratorios, se usa para examinar
descriptivamente todos los datos. Este paso se aborda con mayor
detalle posteriormente en este capítulo. Los datos correspondientes
a todas las variables del estudio se analizan utilizando medidas de
tendencia central y dispersión, con el fin de determinar la
naturaleza de la variación de los datos e identificar los valores
atípicos. Los valores atípicos son participantes en el estudio o
puntos de datos con valores extremos (valores que se alejan mucho
de los demás puntos representados en un gráfico) que parecen
diferentes al resto de la muestra. Los investigadores suelen indicar
si han identificado valores atípicos durante el análisis de datos y

649
cómo los trataron. A la hora de valorar críticamente los resultados
de un estudio, hay que fijarse en cualquier comentario sobre los
valores atípicos y determinar cómo fueron tratados y si podrían
haber afectado a los resultados del estudio.

Análisis estadísticos inferenciales


La fase final del análisis de datos consiste en realizar análisis
estadísticos inferenciales con el fin de generalizar los hallazgos de la
muestra estudiada a las poblaciones accesible y diana apropiadas.
Para justificar la generalización de los resultados de los análisis
estadísticos inferenciales, es necesaria una metodología de
investigación estricta, incluidos un diseño sólido de la investigación
(Shadish, Cook y Campbell, 2002), métodos de medición fiables y
válidos (Polit y Yang, 2016; Waltz y cols., 2017) y un gran tamaño
muestral (Cohen, 1988).
La mayoría de los investigadores incluyen una sección en su
informe de investigación que identifica las técnicas de análisis
estadísticos realizados con los datos del estudio y el programa
usado para calcularlos. Esta discusión incluye las técnicas de los
análisis inferenciales (p. ej., los centrados en relaciones, la
predicción y las diferencias) y en ocasiones las técnicas de los
análisis descriptivos (p. ej., frecuencias, porcentajes y medidas de
tendencia central y dispersión) realizados en el estudio. Las técnicas
de los análisis de datos empleadas en un estudio se suelen describir
inmediatamente antes de la sección de resultados.

USO DE LA ESTADÍSTICA PARA


DESCRIBIR VARIABLES
La estadística descriptiva, introducida anteriormente, permite a los
investigadores organizar los datos numéricos de formas tales que
proporcionen significado y faciliten el conocimiento. En cualquier
estudio con datos numéricos, el análisis de datos comienza por la
estadística descriptiva. Para algunos estudios descriptivos, los
investigadores limitan los análisis de datos a la estadística
descriptiva. En otros estudios, los investigadores emplean la

650
estadística descriptiva fundamentalmente para describir las
características de la muestra y los valores obtenidos en la medición
de las variables dependientes o de la investigación. La estadística
descriptiva presentada en este libro incluye distribuciones de
frecuencias, porcentajes, medidas de tendencia central, medidas de
dispersión y puntuaciones estandarizadas.

Distribución de frecuencias
La distribución de frecuencias describe la presencia de valores o
categorías en un estudio. Por ejemplo, la distribución de frecuencias
para el sexo en un estudio podría ser 42 varones y 58 mujeres. Una
distribución de frecuencias suele ser el primer método usado para
organizar los datos con vistas a su examen. Hay dos tipos de
distribuciones de frecuencias: no agrupadas y agrupadas.

Distribuciones de frecuencias no agrupadas


La mayoría de los estudios tienen datos categóricos que se
presentan en forma de distribución de frecuencias no agrupadas,
en una tabla creada con el fin de mostrar todos los valores
numéricos obtenidos para una variable particular. Esta estrategia
suele utilizarse con datos discretos, más que con los continuos.
Ejemplos de datos organizados habitualmente de esta forma son el
sexo, el grupo étnico, el estado civil, los diagnósticos de los
participantes en el estudio y los valores obtenidos en la medición de
ciertas variables dependientes y de la investigación. La tabla 11.2 es
un ejemplo creado para este texto; incluye nueve valores diferentes
obtenidos por 50 participantes. Es un ejemplo de frecuencias no
agrupadas porque cada valor se representa en la tabla con el
número de personas que reciben dicho valor.

TABLA 11.2
EJEMPLO DE TABLA DE FRECUENCIAS NO AGRUPADAS
(N = 50)

651
Distribuciones de frecuencias agrupadas
Las distribuciones de frecuencias agrupadas se utilizan para
examinar variables continuas. Muchos parámetros determinados
durante la recogida de datos, como la temperatura corporal, la
capacidad pulmonar vital, el peso, la edad, las puntuaciones en
escalas y el tiempo se miden usando una escala continua. Cualquier
método de agrupamiento produce una pérdida de información. Por
ejemplo, si se agrupa la edad, una distinción entre dos grupos,
menores de 65 y mayores de 65 años, proporciona menos
información sobre los datos que las agrupaciones con intervalos de
10 años. Al igual que sucede con los niveles de medición, se han
establecido normas para guiar los sistemas de clasificación. Debe
haber como mínimo 5 grupos, pero no más de 20. Las categorías
establecidas han de ser exhaustivas; todos los datos deben encajar
en una de las categorías identificadas. Las categorías deben ser
excluyentes; cada dato encajará solo en una (Grove y Cipher, 2017).
Se produce un error frecuente cuando los intervalos se solapan de
tal modo que un dato pertenece a más de una clase. Por ejemplo, un
investigador clasifica los intervalos de edad en 20-30, 30-40, 40-50,
etc. Según esta definición, los participantes de 30, 40, etc., pueden
clasificarse en más de una categoría. Los intervalos de las categorías
deben ser equivalentes. Por ejemplo, si el intervalo de edad es de 10
años, cada categoría tiene que incluir 10 años de edad. Esta norma
se incumple en algunos casos para permitir que la primera y la
última categoría sean abiertas y se formulen de modo que incluyan
todos los valores por encima o por debajo de un punto especificado.
La tabla 11.3 muestra un ejemplo de distribución de frecuencias
agrupadas de los ingresos de profesionales de enfermería titulados
(ET), en el que las categorías son exhaustivas y mutuamente
excluyentes.

652
TABLA 11.3
INGRESOS DE PROFESIONALES DE ENFERMERÍA
TITULADOS TRABAJANDO A TIEMPO COMPLETO (N = 100)

Distribuciones de porcentajes
Una distribución de porcentajes indica el porcentaje de
participantes de un estudio en una muestra cuyos valores
pertenecen a un grupo específico y el número de valores en ese
grupo. Las distribuciones de porcentajes resultan especialmente
útiles para comparar los datos presentes con hallazgos de otros
estudios que tienen tamaños muestrales distintos. Una distribución
acumulada es un tipo de distribución de porcentajes en la que los
porcentajes y frecuencias de las puntuaciones se suman a medida
que se pasa de la parte superior de la tabla a la inferior. En
consecuencia, la categoría situada más abajo tendrá una frecuencia
acumulada equivalente al tamaño de la muestra y un porcentaje
acumulado de 100 (v. tabla 11.2). Las distribuciones de frecuencia
también se presentan en tablas o gráficas (p. ej., diagrama de
sectores, diagrama de barras, gráfica lineal). Las representaciones
gráficas de la distribución de frecuencias de los datos de la tabla
11.2 se ilustran en la figura 11.4. En los gráficos de barras y lineal se
puede observar que la distribución de datos forma una curva
normal.

653
FIG 11.4 Representaciones gráficas de distribución de
frecuencias usadas habitualmente.

654
Medidas de tendencia central
Las medidas de tendencia central se denominan con frecuencia
punto medio de los datos o promedio de los datos. Estas medidas
son el resumen más conciso de la naturaleza de los datos en un
estudio. Las tres medidas de tendencia central que suelen usarse en
los análisis estadísticos son la moda, la mediana y la media. Para los
conjuntos de datos que siguen una distribución normal perfecta,
estos valores son iguales (v. fig. 11.1); no obstante, suelen ser algo
diferentes en los datos obtenidos de muestras reales.

Moda
La moda es el valor numérico o índice que aparece con más
frecuencia; no indica necesariamente el centro del grupo de datos.
La moda se determina examinando una distribución de frecuencias
no agrupadas de los datos. En la tabla 11.2, la moda es el valor 5,
presente 14 veces en el grupo de datos. La moda puede utilizarse
para describir al participante del estudio prototípico o para
identificar el valor que más se repite en un ítem de una escala (v.
fig. 11.4). La moda es la medida de tendencia central adecuada para
datos nominales. Un conjunto de datos puede tener más de una
moda. Si hay dos modas, el grupo de datos se denomina
distribución bimodal (fig. 11.5). Los grupos de datos con más de
dos modas se denominan multimodales.

FIG 11.5 Distribución bimodal.

Mediana
La mediana es el punto medio o valor que ocupa el centro exacto de
la distribución de frecuencias no agrupadas, es decir, el percentil 50.

655
La mediana se obtiene ordenando jerárquicamente los valores. Si el
número de valores es impar, exactamente el 50% de ellos estará por
encima de la mediana y el otro 50%, por debajo de esta. Si el
número de valores es par, la mediana es el promedio de los dos
valores que ocupan el medio; así pues, es posible que la mediana no
coincida con ninguno de los valores del grupo de datos. A
diferencia de la media, la mediana no se ve afectada por los valores
atípicos de datos (outliers). La mediana es la medida de tendencia
central más adecuada para datos ordinales. La mediana de los datos
de la tabla 11.2 es 5.

Media
La medida de tendencia central más usada es la media. La media es
la suma de los valores dividida entre el número de valores que se
suman. Al igual que la mediana, la media no siempre es uno de los
valores del grupo de datos. La media es la medida de tendencia
central apropiada para datos a nivel racional y de intervalo. Sin
embargo, si el estudio tiene valores atípicos, la media es la que más
se ve afectada por estos y la mediana podría ser la medida de
tendencia central incluida en el informe de investigación. La
mediana de los datos de la tabla 11.2 es 5,28.

Medidas de dispersión
Las medidas de dispersión, o variabilidad, son medidas de las
diferencias individuales de los elementos de la muestra. Dan cierta
indicación de cómo los valores de una muestra se dispersan o
extienden alrededor de la media. Estas medidas aportan
información sobre los datos que no puede obtenerse de las medidas
de tendencia central. Las medidas de dispersión indican cuán
diferentes son los valores o en qué grado se desvían los valores
individuales entre sí. Si los valores individuales son similares, las
medidas de variabilidad son pequeñas y la muestra será
relativamente homogénea, o similar, en lo que respecta a esas
variables. Una muestra heterogénea tiene una gran variación en sus
valores. Las medidas de dispersión usadas habitualmente son el
rango, la varianza y la desviación estándar (DE). Las puntuaciones
estandarizadas se pueden utilizar para expresar medidas de

656
dispersión. A menudo se emplean diagramas de dispersión
(descritos más adelante) para ilustrar la dispersión de los datos.

Rango
La medida de dispersión más sencilla es el rango, que se obtiene
restando el valor más pequeño del más grande. El rango de los
datos de la tabla 11.2 es 9 − 1 = 8. El rango es un valor de diferencia,
que solo usa los dos valores más extremos para la comparación. Se
trata de una medida de dispersión muy poco refinada, pero es
sensible a los valores atípicos. El rango también puede expresarse
como intervalo del valor más bajo al más alto. Para los datos de la
tabla 11.2, la otra forma de expresar el rango sería de 1 a 9.

Varianza
La varianza de los valores de un estudio se calcula con una
ecuación matemática e indica la extensión o dispersión de los
valores (v. la ecuación y el cálculo en Grove y Cipher, 2017). La
varianza solo puede calcularse con datos medidos a nivel racional o
de intervalo. El valor numérico obtenido del cálculo depende de la
escala de medición empleada, como la determinación de laboratorio
de las cifras de glucemia en ayunas o la medición de pesos en una
balanza. La cifra calculada de varianza no tiene un valor absoluto y
solo puede compararse con datos obtenidos utilizando medidas
similares. Por lo general, no obstante, cuanto mayor sea la varianza,
mayor será la dispersión de los valores. La varianza de los datos de
la tabla 11.2 es 4,94.

Desviación estándar
La DE es la raíz cuadrada de la varianza. Del mismo modo que la
media es el valor promedio, la DE es el valor medio de la diferencia
(desviación). La DE supone una medida del promedio de la
desviación de un valor respecto a la media en esa muestra concreta.
Indica el grado de error que resultaría si solo se utilizara la media
para interpretar los datos. En la curva normal, el 68% de los valores
está en el intervalo comprendido entre 1 DE por encima y por
debajo de la media, el 95% se situará a 1,96 DE por encima o por
debajo de la media y el 99% se encuentra a 2,58 DE por encima o

657
por debajo de la media (v. fig. 11.1; Grove y Cipher, 2017).
La DE de los datos del ejemplo mostrado en la tabla 11.2 es 2,22.
La media es 5,28, de modo que el valor de un participante en el
estudio que se encuentre a 1 DE por debajo de la media será 5,28 –
2,22, es decir, 3,06. El valor de un participante a 1 DE por encima de
la media sería 5,28 + 2,22 o 7,5. Por tanto, cabe esperar que
alrededor del 68% de la muestra (y quizá de la población de la que
se extrajo) tenga valores en el intervalo de 3,06 a 7,50, expresado
como (3,06-7,50). Si se amplía este cálculo, el valor de un
participante a 2 DE por debajo de la media sería 5,28 – 2,22 – 2,22 =
0,84; y el correspondiente a otro a 2 DE por encima de la media
sería 5,28 + 2,22 + 2,22 = 9,72. Los valores de 2 DE por debajo y por
encima de la media se expresarían (0,84-9,72). Con esta estrategia,
es posible estimar toda la distribución de los valores (Grove y
Cipher, 2017). El valor de un individuo concreto puede compararse
con el valor calculado para la media total (p. ej., media, mediana o
moda). La DE es una medida importante para conocer la dispersión
de una distribución e interpretar la relación de un valor
determinado con la distribución. En un estudio publicado, la DE
suele escribirse como la media ± (más o menos) la DE (p. ej., 5,28 ±
2,22).

Intervalo de confianza
Cuando se conoce la probabilidad de incluir el valor de la población
en un intervalo estimado, se denomina intervalo de confianza (IC).
El cálculo del IC supone utilizar dos fórmulas para identificar el
extremo superior y el inferior del intervalo (v. las fórmulas y los
cálculos en Grove y Cipher, 2017). Por ejemplo, el IC de un estudio
podría incluir un valor inferior de 15,34 y un valor superior de 20,56
y se expresaría como (15,34-20,56). Los IC suelen calcularse para los
intervalos del 95 y 99%. El IC del 95% indica que el 95% de las veces
la media de la población se situaría dentro de este intervalo. En
teoría, se puede obtener un IC para cualquier valor de una
población o parámetro de una distribución. Se trata de una técnica
estadística genérica. Por ejemplo, también es posible desarrollar IC
alrededor de coeficientes de correlación y valores de la prueba t. Se
puede usar la estimación para una sola población o múltiples
poblaciones. El uso de los IC se verá en la lectura de la sección de

658
resultados de los estudios.

Puntuaciones estandarizadas
Debido a las diferencias en las características de las distintas
distribuciones, resulta difícil comparar un valor de una distribución
con un valor de otra. Por ejemplo, quizá se desee comparar las
puntuaciones en los exámenes de dos clases. La puntuación
máxima en un examen es 100 y en el otro, 70; será difícil comparar
las notas. Para facilitar esta comparación, se desarrolló un
mecanismo para transformar los valores en crudo en puntuaciones
estandarizadas. Los números que solo tienen sentido dentro del
marco de mediciones usado en un estudio específico se transforman
en cifras (puntuaciones estandarizadas) con un significado más
general. La transformación en puntuaciones estandarizadas permite
una comprensión conceptual sencilla del significado del valor. Una
puntuación estandarizada frecuente es la puntuación z. Expresa las
desviaciones respecto a la media (puntuaciones de diferencia) en
unidades de la DE (v. fig. 11.1). Un valor que esté por encima de la
media tendrá una puntuación z positiva, mientras que otro situado
por debajo de la media tendrá una puntuación z negativa. La media
expresada como puntuación z es cero. La DE es igual a la
puntuación z. Por tanto, una puntuación z de 2 indica que el valor
del cual se obtuvo está a 2 DE por encima de la media. Una
puntuación z de –0,5 indica que el valor está a 0,5 DE por debajo de
la media.

Diagramas de dispersión
Un diagrama o gráfica de dispersión tiene dos escalas: una vertical
y otra horizontal. Cada escala se denomina eje. La escala vertical
recibe el nombre de eje de ordenadas; la horizontal es el eje de
abscisas. Se puede usar un diagrama de dispersión para ilustrar la
diseminación de los valores de una variable. En este caso, el eje de
abscisas representa los posibles valores de la variable. El eje de
ordenadas representa el número de veces que tuvo lugar en la
muestra cada valor de la variable. Los diagramas de dispersión
también se pueden utilizar para ilustrar la relación entre los valores
de una variable y los de otra. En ese caso, cada eje representará una
variable. Por ejemplo, si se elabora una gráfica que represente la

659
relación entre las puntuaciones de ansiedad y depresión de los
participantes medidas con escalas de Likert, el eje horizontal podría
representar la ansiedad y el vertical, la depresión. Para cada unidad
o participante, hay un valor de X y un valor de Y. El punto en el
que se produce la intersección de los valores de X e Y para un
participante se marca en la gráfica (fig. 11.6). Una vez señalados los
valores de todos los participantes de la muestra, será patente el
grado de relación entre las variables (fig. 11.7). Si el diagrama de
dispersión de la figura 11.7 fuera un ejemplo de la relación entre
ansiedad y depresión, el diagrama es positivo e indica que la
ansiedad aumenta en paralelo a la depresión en los participantes
del estudio. Los puntos representados en una relación positiva se
extienden desde la esquina inferior izquierda hasta la esquina
superior derecha del diagrama de dispersión, como en la figura
11.7. Cuando existe una relación negativa, los puntos representados
se extienden desde la esquina superior izquierda hasta la inferior
derecha de la gráfica. Cuanto más se acerquen los puntos
representados a una línea recta, más sólida será la relación entre las
dos variables.

660
FIG 11.6 Estructura de una gráfica.

661
FIG 11.7 Ejemplo de diagrama de dispersión.

Comprensión de los resultados estadísticos


descriptivos
Los investigadores comunican los datos estadísticos descriptivos en
tablas y texto en la sección de resultados de su estudio. La
estadística descriptiva se utiliza para describir la muestra y las
variables del estudio. Por lo general, se calculan las medidas de
tendencia central (moda, mediana y media) y de dispersión (rango
y DE) con el fin de describir las variables del estudio. Además, es
posible que se presenten los datos estadísticos descriptivos junto
con los inferenciales para describir las diferencias o similitudes

662
entre los grupos al inicio del estudio. Cuando un estudio se centra
en determinar si una intervención aplicada a un grupo ha
provocado una diferencia, es importante saber si los grupos eran
diferentes desde el principio del estudio. Si los grupos son
diferentes desde el principio, el efecto de la intervención sobre el
resultado puede exagerarse o atenuarse. Las técnicas estadísticas
inferenciales usadas habitualmente con este fin son la prueba de χ2
para datos nominales y la prueba t para los datos a nivel racional y
de intervalo (se describe después). Desde la perspectiva de los
análisis descriptivos, el propósito no es comprobar la causalidad,
sino describir las diferencias o similitudes entre los grupos de un
estudio.
Valiee, Razavi, Aghajani y Bashiri (2017) realizaron un ensayo
controlado aleatorizado (ECA) para analizar la eficacia de un
programa psicoeducativo (PPE) sobre la calidad de vida (CV) de los
pacientes con cardiopatía isquémica (CI). El estudio incluyó un
grupo de intervención y uno de control. Los 70 participantes se
distribuyeron de forma aleatoria por igual a ambos grupos. El PPE
(intervención) consistió en ocho sesiones que se describen en el
artículo. La CV se midió con el Cuestionario de calidad de vida de
MacNew en cardiopatías. Esta escala proporcionó una puntuación
global de CV para los participantes en el estudio y las puntuaciones
de las tres subescalas (salud emocional, salud física y
funcionamiento social). Las variables demográficas y dependientes
(en el momento basal o pretest) para los grupos de intervención y
control se describieron y examinaron en cuanto a sus diferencias, tal
y como se presenta en el Ejemplo de investigación 11.1.

EJEMPLO DE INVESTIGACIÓN 11.1


Descripción de las variables del estudio
Extracto del estudio de investigación
El análisis de los datos se realizó utilizando el programa SPSS
[Statistical Package for Social Sciences] versión 13 (SPSS Inc.,
Chicago, IL, USA) y se calcularon los parámetros estadísticos

663
descriptivos. Se usó una prueba de Kolmogorov-Smirnov para
analizar la distribución normal de las variables y se utilizó la prueba
de χ2 para comparar la distribución de las variables sociodemográficas
en los dos grupos. Se usó una prueba t de muestras independientes
con el fin de analizar la diferencia entre los promedios de edad de los
dos grupos. La prueba t de muestras independientes también se usó
para analizar las diferencias entre las puntuaciones promedio de CV
global y las puntuaciones promedio de las subescalas en los dos
grupos al comienzo del estudio… Un valor p <0,05 se consideró
significativo para todas las pruebas.

Resultados
De los 70 participantes, tres del grupo de intervención se excluyeron
del análisis debido a una asistencia irregular. Además, dos
participantes del grupo control fallecieron durante el periodo de
estudio y otro fue excluido del análisis debido a respuestas
incompletas en el cuestionario postest. En total, se analizaron los
datos de 64 pacientes.

No se observaron diferencias significativas entre las variables


clínicas-demográficas de ambos grupos (tabla 1). Se usó una prueba t
de muestras independientes con el fin de analizar las diferencias entre
las puntuaciones promedio de CV de los dos grupos (96,34 ± 19,01
para el grupo de intervención y 94,75 ± 17,61 para el grupo control) y
las puntuaciones medias de las subescalas de CV al comienzo del
estudio, sin que se observasen diferencias significativas en estas
puntuaciones (p >0,05) (tabla 2). (Valiee y cols., 2017, pág. 39).

Valoración crítica
Valiee y cols. (2017) presentaron su proceso de análisis de los datos
y sus resultados de forma clara y concisa. Explicaron las razones
del abandono del estudio y los análisis finales se realizaron con
datos de 64 participantes (32 grupos en cada grupo). La mayoría de
las variables demográficas se midieron a nivel nominal y se
describieron apropiadamente con frecuencias y porcentajes (v. la

664
tabla 1 del estudio). Los datos presentaban una distribución normal
(como lo indicó la prueba de Kolmogorov-Smirnov), por lo que la
determinación de las medias y las DE para los datos de edad fue
apropiada. La CV se midió con una escala de tipo Likert y los
totales de estas escalas y subescalas se consideran datos a nivel de
intervalo (Grove y Cipher, 2017; Waltz y cols., 2017). Estos
resultados descriptivos se presentan de forma adecuada en tablas y
son argumentados en la sección de resultados. No obstante, habría
resultado útil incluir el rango de estas variables para examinar la
presencia de valores atípicos.
Las diferencias entre los grupos fueron analizadas
adecuadamente con pruebas de χ2 o pruebas t para muestras
independientes basadas en los niveles de medición de las variables.
Debido a que los grupos control y de intervención no tenían
diferencias significativas para las variables demográficas o
dependientes al inicio del estudio, estos grupos se consideran
homogéneos o similares respecto a estas variables. Estos resultados
reforzaron el estudio porque los grupos tienen que ser tan
parecidos como sea posible para estas variables al inicio del
estudio. Por tanto, todas las posibles diferencias significativas
observadas al final del estudio se deberán con más probabilidad a
la intervención del estudio que a un error. En la sección sobre las
pruebas t se presentan más resultados de este estudio.

DETERMINACIÓN DE LA IDONEIDAD
DE LA ESTADÍSTICA INFERENCIAL
EN LOS ESTUDIOS
Múltiples factores intervienen a la hora de determinar la idoneidad
o la pertinencia de las técnicas estadísticas inferenciales realizadas
en un estudio. La estadística inferencial se lleva a cabo con el fin de
examinar relaciones, establecer predicciones y determinar la
causalidad o las diferencias en los estudios. La evaluación de las
técnicas estadísticas exige plantear ciertos juicios sobre la
naturaleza de los datos y lo que deseaba conocer el investigador. Se
debe determinar: 1) la naturaleza de la pregunta o hipótesis de

665
investigación, 2) si los datos para el análisis se trataron como
nominales, ordinales o de intervalos/racionales (v. fig. 10.2 del cap.
10), 3) cuántos grupos conformaban el estudio y 4) si los grupos
estaban emparejados (dependientes) o eran independientes.
Las técnicas estadísticas se podrían identificar como paramétricas
o no paramétricas, según el nivel de medición de las variables del
estudio. Si las variables se miden a nivel nominal y ordinal, se
realizan análisis no paramétricos. Si las variables se miden a nivel
de intervalos o racional, y los valores de los participantes en el
estudio para la variable siguen una distribución normal, se llevan a
cabo análisis paramétricos (Grove y Cipher, 2017). Los
investigadores utilizan un programa informático para determinar si
los datos de las variables siguen una distribución normal e incluyen
los resultados en su estudio, tal y como el resultado de la prueba de
Kolmogorov-Smirnov se incluyó en el extracto del estudio de Valiee
y cols. (2017). Los niveles de intervalos y racional de los datos
suelen incluirse juntos porque las técnicas de análisis son las
mismas para ambos tipos de datos.
En los grupos independientes, la selección de un participante en
el estudio no se relaciona con la selección de otros participantes. Por
ejemplo, si los participantes se asignan aleatoriamente al grupo de
tratamiento o de control, los grupos son independientes. En los
grupos emparejados o grupos dependientes, los participantes o las
observaciones seleccionadas para la recogida de datos están
relacionados de alguna manera con la selección de los demás
participantes u observaciones. Por ejemplo, si los participantes del
estudio actúan como su propio control utilizando la situación
pretest como grupo control, las mediciones (y, por tanto, los
grupos) están emparejadas. Además, si se utilizan parejas
equiparables de participantes para los grupos de comparación y de
intervención, las observaciones están emparejadas (v. cap. 8). En
ocasiones, los investigadores emparejan los grupos respecto a la
edad y la gravedad de la enfermedad para controlar el efecto de
estas variables demográficas en un estudio. En un estudio de
gemelos, por ejemplo, un gemelo podría ser asignado al grupo
control y el otro, al grupo experimental. Como son gemelos, estarán
emparejados respecto a distintas variables.
Una estrategia para juzgar la idoneidad de una técnica de análisis

666
de un estudio consiste en usar un árbol de decisión o algoritmo. El
algoritmo dirige al investigador al reducir gradualmente el número
de técnicas estadísticas apropiadas a medida que se establecen
juicios sobre la naturaleza del estudio y los datos. El algoritmo de la
figura 11.8 identifica cuatro factores relacionados con la idoneidad
de una técnica de análisis: naturaleza de la pregunta o hipótesis
investigada, nivel de medición de las variables dependientes y de
investigación, número de grupos en el estudio y diseño de la
investigación. Para usar el árbol de decisión o algoritmo de la figura
11.8, se deberá: 1) determinar si la pregunta o hipótesis de
investigación se centra en diferencias o asociaciones (similitudes), 2)
determinar el nivel de medición (nominal, ordinal o de
intervalos/racional) de las variables del estudio, 3) seleccionar el
número de grupos incluidos en el estudio y 4) determinar el diseño,
con muestras independientes o emparejadas (dependientes), que
encaje mejor con el estudio que se está valorando críticamente. Hay
que seguir las líneas del algoritmo en cada selección para identificar
la técnica estadística idónea reseñada en la columna de la derecha
en la figura.

667
FIG 11.8 Árbol de decisión estadístico o algoritmo
para identificar la técnica de análisis correcta. (Tomada

668
de Gray, J. R., Grove, S. K. y Sutherland, S. [2017]. The practice
of nursing research: Appraisal, synthesis, and generation of
evidence [8.ª ed.]. San Luis, Missouri: Elsevier; 532.)

Guías de valoración crítica para los análisis


de datos y resultados presentados en
estudios
A la hora de realizar la valoración crítica de la sección de resultados
de los estudios cuantitativos, hay que ser capaz de: 1) identificar las
técnicas estadísticas realizadas, 2) juzgar si estos procedimientos
fueron apropiados para el propósito y las hipótesis, preguntas u
objetivos del estudio y los datos recogidos y 3) determinar si la
presentación e interpretaciones de los resultados por parte de los
investigadores fueron exactas. Cuando se valoren críticamente las
técnicas de análisis utilizadas en un estudio, no solo hay que estar
familiarizado con los análisis realizados, sino que también hay que
ser capaz de comparar esas técnicas con otras que podrían haberse
utilizado, quizá con más ventajas.

GUÍAS DE VALORACIÓN CRÍTICA


Análisis de los datos y resultados
presentados en los estudios
Las siguientes guías de valoración crítica ayudarán a determinar
la calidad del análisis de los datos y los resultados presentados en
los estudios. Las valoraciones críticas de las técnicas de análisis
descritas en este capítulo están guiadas por las siguientes
preguntas:

1. ¿Se realizaron los análisis apropiados para abordar el


propósito y/o los objetivos, preguntas o hipótesis del
estudio? ¿El estudio se centró en analizar las relaciones,
realizar predicciones y/o determinar diferencias entre los
grupos?
2. ¿Fue correcta la técnica de análisis para el nivel de medición

669
de los datos (nominal, ordinal o intervalos/racional) y el
diseño del estudio? La figura 11.8 ayuda a determinar si se
emplearon las técnicas de análisis apropiadas.
3. ¿Los resultados de los análisis se presentaron con claridad y
se interpretaron de forma apropiada? La American
Psychological Association (APA, 2010) y Grove y Cipher
(2017) han ofrecido indicaciones para la comunicación de
resultados de un estudio en tablas, figuras y texto.
4. ¿Han reseñado los investigadores el nivel de significación o α
utilizado en el estudio? ¿Eran los resultados estadísticamente
significativos?
5. ¿Se han presentado el tamaño del efecto y la potencia para
todos los hallazgos no significativos? ¿Era la potencia
correcta para el estudio, como mínimo 0,80 o más, o había un
potencial de error tipo II? (V. la discusión previa sobre los
errores tipo I y II y la tabla 11.1.)
6. ¿Deberían haberse realizado más análisis? Hay que razonar la
respuesta (Grove y Cipher, 2017; Hoare y Hoe, 2013; Hoe y
Hoare, 2012; Plichta y Kelvin, 2013; Polit, 2010).

USO DE LA ESTADÍSTICA PARA


EXAMINAR RELACIONES
Los investigadores utilizan análisis de correlación para identificar
relaciones entre variables. El propósito de estos análisis podría ser
describir las relaciones entre variables, clarificar las relaciones entre
conceptos teóricos o ayudar a identificar posibles relaciones
causales mediante análisis que examinan las diferencias entre
grupos. Todos los datos del análisis deben provenir de una sola
población de la cual existen valores sobre todas las variables que se
examinarán en el análisis de correlación. Los datos medidos a nivel
de intervalos o racional aportan la mejor información sobre la
naturaleza de una relación. No obstante, existen técnicas de análisis
de correlación para los distintos niveles de medición. Los datos de
un análisis de correlación también deben abarcar todo el intervalo
de posibles valores en cada variable incluida en el análisis. Por
ejemplo, si los valores de una variable particular pueden oscilar

670
entre 1 y 9, probablemente se encontrarán todos los valores de ese
intervalo en el grupo de datos. Si todos o la mayoría de los valores
están en la parte media de ese intervalo (4, 5 y 6) y pocos o ninguno
tienen valores extremos, no será posible conocer plenamente la
relación a partir del análisis. Por tanto, para los análisis de
correlación son preferibles muestras grandes con valores diversos
(Grove y Cipher, 2017).

Correlación del producto-momento de


Pearson
La correlación del producto-momento de Pearson es una técnica de
análisis inferencial que se realiza para analizar correlaciones
bivariantes en los estudios. La correlación bivariante mide el grado
de la relación entre dos variables. Se recogen datos de una sola
muestra y deben existir medidas de las dos variables examinadas
para cada participante del estudio en el grupo de datos. Con menos
frecuencia, los datos se obtienen de dos participantes relacionados,
como incidencia de cáncer de mama en madres e hijas. El análisis
de correlación proporciona dos tipos de información sobre los
datos: la naturaleza de la relación (positiva o negativa) entre las dos
variables y la magnitud (o fortaleza) de la relación. En ocasiones, se
realizan diagramas de dispersión para ilustrar gráficamente la
relación (v. fig. 11.7). Los resultados de los análisis de correlación
son simétricos, en vez de asimétricos. Simétrico significa que el
análisis no da ninguna indicación sobre la dirección de la relación.
No es posible establecer a partir del análisis de correlación si la
variable A conduce o causa la variable B, o viceversa. Las técnicas
del análisis de correlación se centran en examinar relaciones, no en
determinar la causa y el efecto.

Interpretación de los resultados del análisis de


correlación del producto-momento de Pearson
El resultado del análisis de correlación de Pearson es un coeficiente
de correlación (r) cuyo valor oscila entre –1 y +1. Este valor de r
indica el grado de relación entre las dos variables. Un valor de 0
indica una ausencia de relación. Si r = –1, hay una correlación
negativa (inversa) perfecta. En una relación negativa, un valor

671
elevado de una variable se correlaciona con un valor bajo de la otra
variable. Cuando r = +1, existe una relación positiva perfecta. En
una relación positiva, un valor elevado de una variable se
correlaciona con un valor elevado de la otra variable. También
existe una correlación positiva cuando un valor bajo de una variable
se correlaciona con un valor bajo de la otra variable. Las variables
cambian o varían en la misma dirección, aumentando o
disminuyendo a la vez. Cuando los valores positivos o negativos de
r se acercan a 0, la fortaleza de la relación decrece (Grove y Cipher,
2017).
Por lo general, un valor de r inferior a 0,3 o –0,3 se considera una
relación débil y entre 0,3 y 0,5 o –0,3 y –0,5 indica una relación
moderada; si r está por encima de 0,5 o –0,5 se considera una
relación fuerte (Gray y cols., 2017). No obstante, esta interpretación
del valor de r depende en gran medida de las variables examinadas
y de la situación en la que se midieron. Por tanto, la interpretación
exige cierto juicio por parte del investigador.
Cuando el coeficiente de correlación de Pearson se eleva al
cuadrado (r2) el número resultante es el porcentaje de la varianza
explicado por la relación. Incluso si dos variables están
relacionadas, los valores de ambas no serán una pareja perfecta. Por
ejemplo, si dos variables muestran una relación positiva fuerte, cabe
esperar que un valor elevado en una variable se asocie con un valor
elevado de la otra variable. Sin embargo, un participante en un
estudio que obtenga el valor más alto en una variable no tendrá
necesariamente el valor más alto en la otra. Así pues, r2 indica la
varianza que se conoce al correlacionar dos variables (Grove y
Cipher, 2017).
Habrá cierta variación en la relación entre valores de las dos
variables para participantes individuales. Parte de la variación de
los valores se explica por la relación entre las dos variables y se
denomina varianza explicada, indicada por r2 y se expresa como
porcentaje. Por ejemplo, los investigadores pueden indicar que la
relación de las dos variables, ansiedad y depresión, en su estudio
era r = 0,6, y r2 = 0,36 × 100% = 36%. La varianza explicada es del
36% para las variables ansiedad y depresión, lo que significa que las
puntuaciones de ansiedad de los pacientes pueden explicar el 36%
de la varianza en sus puntuaciones de depresión (fig. 11.9). No

672
obstante, parte de la variación se debe a factores distintos a la
relación y se denomina varianza no explicada. En el ejemplo
anterior, 100% – 36% (varianza explicada) = 64% (varianza no
explicada; v. fig. 11.9). Por tanto, el 64% de la variación en las
puntuaciones se debe a otros factores distintos a la relación
estudiada, quizá de variables no examinadas en el estudio. Una
correlación fuerte tiene una varianza inexplicada menor que una
correlación débil.

FIG 11.9 Porcentajes de las varianzas explicadas y no


explicadas entre la ansiedad y la depresión.

En la investigación de enfermería se tiende, por lo general, a


despreciar las correlaciones débiles. Este enfoque puede hacer que
se pase por alto una relación que tal vez tenga realmente cierto
significado en el conocimiento de enfermería si la relación se
examinara en el contexto de otras variables. Se han identificado tres
razones frecuentes de esta situación, que es similar a la del error de
tipo II. En primer lugar, muchas mediciones de enfermería carecen
de la potencia necesaria para detectar discriminaciones finas. Es
posible que algunos instrumentos no detecten valores extremos y
una relación sería mayor que la indicada por las medidas en crudo
existentes. En segundo lugar, los estudios de correlación deben

673
contar con un amplio intervalo de valores para detectar relaciones.
Si los valores del estudio son homogéneos o la muestra es pequeña,
las relaciones que existen en la población no siempre aparecen tan
claramente en la muestra. En tercer lugar, en muchos casos, un
análisis bivariante no aporta una imagen nítida de la dinámica en la
situación. Algunas variables pueden estar unidas por correlaciones
débiles, pero en conjunto mejoran nuestro conocimiento sobre
situaciones de interés. Existen técnicas estadísticas (p. ej., análisis de
regresión [v. más adelante]) para examinar las relaciones entre
múltiples variables simultáneamente (Plichta y Kelvin, 2013).

Comprobación de la relevancia de un coeficiente de


correlación
Antes de inferir que el coeficiente de correlación de la muestra se
aplica a la población de la cual se extrajo la muestra, hay que
realizar un análisis estadístico para determinar si el coeficiente es
significativamente distinto de cero (ausencia de correlación). Con
una muestra pequeña, un coeficiente de correlación elevado puede
resultar no significativo. Con una muestra muy grande, es posible
que el coeficiente de correlación sea estadísticamente significativo
cuando el grado de asociación es demasiado pequeño para ser
clínicamente importante. Por tanto, a la hora de juzgar la relevancia
del coeficiente, hay que tener en cuenta tanto su tamaño como su
significación estadística.
Walker (2017) realizó un estudio de correlación para analizar las
relaciones entre las variables identificadas en la literatura sobre las
respuestas emocionales de los niños en edad escolar al asma. Las
variables del estudio analizadas para evaluar las relaciones fueron
el total de conductas problema infantiles, el subgrupo de conductas
problema exteriorizantes infantiles, la CV dependiente del
funcionamiento emocional del cuidador, la gravedad del asma y la
CV dependiente del funcionamiento emocional infantil. La
gravedad del asma se midió con la escala Severity of Chronic
Asthma (SCA), las conductas problema infantiles se midieron con la
escala Behavior Problem Index (BPI) y la CV dependiente del
funcionamiento emocional tanto infantil como del cuidador se
midieron con escalas desarrolladas por Juniper y cols. (1996). Todas
estas eran escalas de Likert que se describían en detalle en el

674
artículo. El análisis de los datos y los resultados de este estudio se
presentan en el Ejemplo de investigación 11.2.

EJEMPLO DE INVESTIGACIÓN 11.2


Resultados de la correlación del producto-
momento de Pearson
Extracto del estudio de investigación
Análisis de los datos
Se utilizó el programa Package for the Social Science (SPSS Statistic
20) para analizar los datos recogidos en este estudio. El nivel de
significación que se seleccionó para este estudio fue de α = 0,05. Antes
de realizar el análisis estadístico, se evaluaron los datos para analizar
si tenían errores de entrada, valores perdidos y valores atípicos con
una influencia indebida. Los errores de entrada se comprobaron y se
corrigieron volviendo a los instrumentos de la encuesta original si
había una entrada dudosa. Las comprobaciones de los datos
incluyeron comprobar las suposiciones de linealidad, la distribución
normal… Se realizaron comprobaciones de fiabilidad de todos los
instrumentos de la encuesta utilizando el α de Cronbach… Se
efectuaron correlaciones bivariantes utilizando el coeficiente r de
Pearson para todas las variables excepto para la variable dicotómica
días de ausencia escolar, que se evaluó con la rho de Spearman (v.
tabla 4)…

Los parámetros estadísticos descriptivos se muestran en la tabla 3. La


CV dependiente del funcionamiento emocional infantil relacionado
con el asma presentaba una correlación negativa significativa con la
gravedad del asma, las conductas problema exteriorizantes infantiles
y las conductas problema interiorizantes infantiles. Una mayor
gravedad del asma se asoció con un peor funcionamiento emocional en
los niños relacionado con el asma r = −0,30, p <0,01. Se notificaron
más conductas problema infantiles, tanto exteriorizantes como

675
interiorizantes cuando los niños referían más sentimientos negativos
relacionados con su asma r = −0,43, p <0,001 y r = −0,26, p <0,05
respectivamente [v. tabla 4]…

TABLA 3
Estadística descriptiva de las variables

CV, calidad de vida; DE, desviación estándar.


Tomada de Walker, V. G. (2017). Exploration of the influence of factors
identified in the literature on school-aged children’s emotional responses to
asthma. Journal of Pediatric Nursing, 33(1), 58.

Una mayor gravedad del asma se correlacionó con más sentimientos


negativos del cuidador respecto al asma de su hijo, r = −0,39, p
<0,001. Unas conductas problema exteriorizantes e interiorizantes
más marcadas en los niños se asociaron con una menor CV
dependiente del funcionamiento emocional del cuidador, r = −0,25; r =
−0,22, p <0,05 respectivamente [v. tabla 4]. (Walker, 2017, págs. 57-
58)

Valoración crítica
Walker (2017) detalló los pasos del proceso de análisis de los datos:
1) manejo de los datos perdidos y de los errores de entrada de
datos, 2) análisis de los datos en busca de valores atípicos, 3)
selección del nivel de significación en α = 0,05, 4) comprobación de
la linealidad y la distribución normal de los datos y 5) análisis de la
fiabilidad (α de Cronbach) de las escalas de Likert usadas para la
recogida de datos. Las puntuaciones sumadas de las escalas de
Likert proporcionaron datos a nivel de intervalo que se
describieron de forma adecuada con medias y DE. El intervalo, así
como las puntuaciones mínima y máxima de cada variable
permitieron que el investigador analizara la presencia de valores

676
atípicos. Los intervalos de las variables indicaron una amplia
dispersión de los valores, que es importante a la hora de analizar
las relaciones entre las variables. El coeficiente r de Pearson fue el
estadístico apropiado para correlacionar las variables medidas con
escalas de Likert y la variable días de ausencia escolar proporcionó
datos ordinales que se correlacionaron correctamente con la rho de
Spearman, una prueba estadística no paramétrica (v. fig. 11.8). Los
valores de correlación bivariante para las variables del estudio se
presentaron de forma clara en una tabla de matriz de correlación
(v. la tabla 4 del estudio). Los valores de correlación significativa se
comentaron en el texto del estudio y se identificaron
apropiadamente con asteriscos en la tabla 4 (v. la leyenda debajo de
la tabla).

Análisis factorial
En este apartado se proporcionan nociones para comprender el
significado del análisis factorial cuando aparece en los informes de
investigación. El análisis factorial suele realizarse para examinar
las relaciones entre un gran número de ítems en una escala y
esclarece esas relaciones para identificar agrupaciones de ítems que
están vinculados más estrechamente. Intelectualmente, el lector
podría hacer lo mismo identificando categorías y clasificando los
ítems de acuerdo con su criterio en la categoría más adecuada. El
análisis factorial clasifica los ítems en categorías según lo
estrechamente que estén relacionadas con las demás variables. Las
variables estrechamente relacionadas se agrupan juntas en un
factor. Es posible identificar varios factores en un grupo de datos.
Una vez identificados matemáticamente los factores, el investigador
debe interpretar los resultados explicando por qué el análisis
agrupó los ítems de una forma específica. Los resultados
estadísticos indicarán la cantidad de varianza en el grupo de datos
que puede explicarse por un factor particular y la cantidad de
varianza en el factor que se explica por un ítem particular.
El análisis factorial se usa con frecuencia en el proceso de
desarrollo de instrumentos de medición, en particular los
relacionados con variables psicológicas, como actitudes, creencias,
valores y opiniones (Gray y cols., 2017). El análisis factorial ayuda a

677
identificar constructos teóricos; también se usa para confirmar la
precisión de un constructo desarrollado teóricamente. Por ejemplo,
un teórico podría plantear que el concepto de la «esperanza» está
compuesto por los siguientes elementos: 1) anticipación del futuro,
2) creer en que las cosas saldrán bien y 3) optimismo. Es posible
desarrollar métodos para medir estos tres elementos, a menudo con
una escala de múltiples ítems. La escala hace operativo ese concepto
teórico, como la esperanza, relacionando los ítems que la componen
con una de las tres subescalas que miden los tres elementos de la
esperanza. Se puede realizar un análisis factorial sobre los datos
para determinar si las respuestas de los participantes agrupadas en
esos tres factores (subescalas) identifican el concepto de esperanza.
De este modo, el análisis factorial se realiza para examinar la
validez del constructo de una escala en la población estudiada (v.
cap. 10).

USO DE LA ESTADÍSTICA PARA


PREDECIR RESULTADOS
La capacidad de predecir eventos futuros cada vez es más
importante en todo el mundo. A la gente le interesa predecir quién
ganará cierto partido de fútbol, qué tiempo hará la semana que
viene o qué acciones bursátiles aumentarán probablemente de valor
en el futuro cercano. En la práctica enfermera, como en el resto de la
sociedad, la capacidad de predecir resulta crucial. Por ejemplo, los
investigadores de enfermería querrían ser capaces de predecir la
duración del ingreso hospitalario de pacientes con enfermedades de
distinta gravedad, así como las respuestas de los pacientes con
características variadas (p. ej., edad, sexo, nivel educativo) a las
intervenciones de enfermería. Los profesionales de enfermería
deben saber qué variables son importantes a la hora de predecir
resultados de salud en pacientes y familias. Por ejemplo, se han
usado las variables de horas de sueño nocturno, minutos de
ejercicio semanales, calorías consumidas al día e índice de masa
corporal para predecir las puntuaciones de salud física de las
personas en una escala de calidad de vida. Los análisis predictivos
se basan en la teoría de la probabilidad, no en la teoría de la

678
decisión (v. descripción previa). La predicción es un método para
analizar las relaciones causales entre las variables.

Análisis de regresión
El análisis de regresión se usa para predecir el valor de una
variable cuando se conoce el valor de una o más variables
diferentes. La variable que se va a predecir en un análisis de
regresión se denomina variable dependiente o de resultado. La
variable dependiente suele medirse a nivel de intervalos o racional.
El objetivo del análisis es explicar tanta parte de la varianza de la
variable dependiente como sea posible. En el análisis de regresión,
las variables usadas para predecir los valores de la variable
dependiente se denominan variables independientes. Cuando se
emplea una variable independiente con el fin de predecir una
variable dependiente, la técnica analítica usada es la regresión
lineal simple. Por ejemplo, los investigadores podrían utilizar la
regresión lineal simple para predecir la depresión (variable
dependiente) analizando la influencia del promedio de horas de
sueño semanales (variable independiente).
La regresión múltiple se utiliza para analizar los datos de
estudios que incluyan dos o más variables independientes.
Mediante un análisis de regresión múltiple, los investigadores
podrían medir la influencia del promedio de horas de sueño
semanales, apoyo social percibido y antecedentes familiares de
depresión (variables independientes) sobre la depresión (variable
dependiente). En los análisis de regresión, el símbolo de la variable
dependiente es Y, y el símbolo de la(s) variable(s) independiente(s),
X. A menudo se construyen diagramas de dispersión y una matriz
de correlación bivariante antes de realizar el análisis de regresión
con el fin de examinar las relaciones entre las variables. El propósito
del análisis de regresión es crear la línea de tendencia que mejor
refleje los valores en el diagrama de dispersión. La línea de
tendencia suele mostrarse como una línea sobreañadida al
diagrama de dispersión (fig. 11.10). Se han desarrollado muchas
técnicas de análisis de regresión para analizar distintos tipos de
datos. Una de ellas, la regresión logística, se creó para predecir los
valores de una variable dependiente medida a nivel nominal. La

679
regresión logística cada vez se usa más en los estudios de
enfermería. Este tipo de regresión es capaz de evaluar si un
paciente responde o no responde a la intervención (Grove y Cipher,
2017; Plichta y Kelvin, 2013; Polit, 2010).

FIG 11.10 Diagrama de dispersión con la línea de


tendencia superpuesta.

Interpretación de los resultados del análisis de


regresión
El resultado de un análisis de regresión es el coeficiente de
regresión, R. Cuando R se eleva al cuadrado (R2), indica la cantidad

680
de varianza en los datos que queda explicada por la ecuación
(Grove y Cipher, 2017). Si se usa más de una variable independiente
para predecir los valores de la variable dependiente, R2 se
denomina en ocasiones coeficiente de determinación múltiple. La
prueba estadística usada para determinar la significación de un
coeficiente de regresión puede ser la t (de la prueba t) o la F (del
análisis de la varianza [ANOVA]). Las muestras pequeñas
disminuyen la posibilidad de obtener significación estadística. Los
valores de R2 y de t o F se reseñan con los resultados de un análisis
de regresión. Muchos estudios que utilizan análisis de regresión son
complejos, con múltiples variables independientes y con más de
una técnica de regresión. Comprender la discusión de resultados
complejos supone leer cada frase cuidadosamente hasta entenderla,
buscar términos no conocidos y determinar la significación
estadística de los resultados.
El estudio de Walker (2017) se citó previamente en el apartado de
los análisis de correlación. Recomendamos que se revisen los
resultados de correlación presentados en la tabla 4 del estudio del
Ejemplo de investigación 11.2. Estos resultados sirvieron de
orientación para las variables incluidas en el análisis de regresión.
Las variables independientes (CV dependiente del funcionamiento
emocional del cuidador, gravedad del asma, conductas problema
exteriorizantes infantiles y conductas problema interiorizantes
infantiles) se usaron para predecir la variable dependiente, que era
la CV dependiente del funcionamiento emocional infantil. Walker
(2017) evaluó los datos del estudio con análisis de regresión
múltiple, cuyos resultados se presentan en el Ejemplo de
investigación 11.3.

EJEMPLO DE INVESTIGACIÓN 11.3


Análisis de regresión
Extracto del estudio de investigación
Se realizó una regresión múltiple para abordar la segunda pregunta
de investigación que examinó el grado de influencia de la gravedad del

681
asma, la CV dependiente del funcionamiento emocional del cuidador,
así como las conductas problema interiorizantes y exteriorizantes
infantiles sobre la CV dependiente del funcionamiento emocional
infantil relacionado con el asma. La variable que se eliminó del modelo
debido a sus relaciones no significativas con todas las demás variables
del modelo correspondió a los días de ausencia escolar. El modelo
explicó el 26% de la varianza en el funcionamiento emocional infantil
relacionado con el asma. El ajuste del modelo fue bueno, F (4,79) =
7,051, p <0,001). Los factores predictivos significativos del asma
relacionado con la CV dependiente del funcionamiento emocional
infantil fueron la gravedad del asma (β = −0,31, p <0,01) y las
conductas problema exteriorizantes infantiles (β = −0,43, p <0,001).
Los resultados de los análisis de regresión se muestran en la tabla 5.
(Walker, 2017, pág. 58)

TABLA 5
Calidad de vida dependiente del funcionamiento emocional
en niños de edad escolar

B, coeficiente no estandarizado; β, coeficiente estandarizado; CV, calidad


de vida; EE, error estándar; R2, coeficiente de determinación o varianza.
Tomada de Walker, V. G. (2017). Exploration of the influence of factors
identified in the literature on school-aged children’s emotional responses to
asthma. Journal of Pediatric Nursing, 33(1), 59.

Valoración crítica
Walker (2017) realizó de forma apropiada un análisis de regresión
múltiple para responder a la pregunta de investigación del estudio.
Los valores de la rho de Spearman (presentados previamente en la
tabla 4 en el Ejemplo de investigación 11.2) respaldaron que se
omitiera la variable días de ausencia escolar de la regresión, porque

682
los valores de correlación fueron bajos y no significativos con todas
las demás variables. Los valores del coeficiente de correlación r de
Pearson respaldaron la inclusión de cuatro variables
independientes en el análisis para predecir la variable dependiente,
CV dependiente del funcionamiento emocional infantil. Los
resultados de los análisis de regresión múltiple se presentan de
forma concisa en la tabla 5 y se comentan en el texto del artículo. El
estudio identificó que dos variables independientes, la gravedad
del asma y las conductas problema exteriorizantes infantiles (v. los
valores de p en la tabla 5) eran factores predictivos significativos de
la variable dependiente (CV dependiente del funcionamiento
emocional infantil). Walker (2017) presentó un valor de p correcto,
pero incongruente para la gravedad del asma en el texto (p <0,01)
frente al de la tabla 5 (p = 0,004) que podría ser confuso para los
lectores. Walker realizó apropiadamente un ANOVA (F [4,79] =
7,051, p <0,001) para determinar la significación del modelo de
regresión. Los resultados de la regresión explicaron el 26% (R2 ×
100% = 0,26 × 100%) de la varianza en la CV dependiente del
funcionamiento emocional infantil para los niños con asma. Walker
(2017, pág. 54) «recomendó que la investigación sobre el asma
debería considerar las conductas problema de los niños de edad
escolar cuando se abordase la CV dependiente del funcionamiento
emocional relacionado con el asma».

TABLA 4
Calidad de vida dependiente del funcionamiento emocional
en niños de edad escolar

Nota:
se usó el coeficiente r de Pearson para todas las correlaciones
excepto para días de ausencia escolar.
CV, calidad de vida.

683
a
≤0,05.
b
≤0,01.
c
≤0,001.
d
rho de Spearman
Tomada de Walker, V. G. (2017). Exploration of the influence of factors
identified in the literature on school-aged children’s emotional responses to
asthma. Journal of Pediatric Nursing, 33(1), 59.

USO DE LA ESTADÍSTICA PARA


EXAMINAR DIFERENCIAS
La estadística inferencial se emplea para examinar diferencias entre
grupos, como las diferencias entre el grupo de intervención y el de
control respecto a ciertas variables demográficas (v. tabla 1 en el
Ejemplo de investigación 11.1). También se analizan las diferencias
entre otros tipos de grupo, como diferencias de las cifras de lípidos
sanguíneos en varones y mujeres o de las concentraciones de
glucemia en ayunas y hemoglobina A1c (HbA1c) en grupos raciales
y étnicos blancos, afroamericanos, nativos americanos e hispanos.
Las técnicas estadísticas empleadas para examinar diferencias
también se llevan a cabo con el fin de examinar la causalidad de la
variable independiente sobre la dependiente. La causalidad es una
forma de conocer si un evento causa otro. Las técnicas de análisis
utilizadas para analizar la causalidad son esenciales para
determinar los efectos de las intervenciones sobre los resultados del
paciente y la familia. Estas pruebas estadísticas examinan la
causalidad buscando las diferencias significativas de resultados
entre los grupos de intervención y control. Las técnicas estadísticas
usadas para examinar diferencias que se describen en este texto son
la prueba de independencia de χ2, prueba t, ANOVA y análisis de
la covarianza (ANCOVA). La prueba t se emplea para examinar
diferencias entre dos grupos y las pruebas de χ2, ANOVA y
ANCOVA pueden usarse para hacer lo propio con tres o más
grupos. La prueba de χ2 se utiliza para analizar datos a nivel
ordinal o nominal, y la prueba t, ANOVA y ANCOVA se usan para
analizar datos con un nivel de medición de razón y de intervalo

684
(Grove y Cipher, 2017; Plichta y Kelvin, 2013).

TABLA 1
Características demográficas de los grupos de intervención
y control

DE, desviación estándar.


a
Prueba t.
b
Prueba de Fisher.
c
Prueba de χ2.
Tomada de Valiee, S., Razavi, N. S., Aghajani, M. y Bashiri, Z. (2017).
Effectiveness of a psychoeducation program on the quality of life in patients
with coronary heart disease: A clinical trial. Applied Nursing Research,
33(1), 40.
Cuando se examinan diferencias entre tres grupos, se realizan
análisis post hoc para determinar cuáles de los grupos son
significativamente diferentes. La prueba de χ2 y ANOVA indican
diferencias significativas entre los grupos, pero no especifican qué
grupos son diferentes. Por ejemplo, un estudio analizó cuatro
grupos de trabajadores que consumen alcohol y determinó que eran
significativamente diferentes respecto a la cantidad de alcohol

685
consumida. Se necesitan análisis post hoc para identificar cuál(es) de
los cuatro grupos es (son) significativamente diferente(s). Cuando
se realizan análisis post hoc en un estudio, los investigadores suelen
identificar el tipo de análisis post hoc y los resultados.

Prueba de independencia de χ2
La prueba de independencia de χ2 determina si dos variables son
independientes o están relacionadas; esta prueba se puede utilizar
con datos ordinales o nominales (v. fig. 11.8). La técnica examina las
frecuencias de los valores observados y los compara con las
frecuencias que serían esperables si las categorías de datos fueran
independientes entre sí. No es muy potente, por lo que el riesgo de
un error de tipo II es elevado (el resultado del estudio no es
significativo cuando realmente sí hay diferencias significativas). Se
necesitan grandes tamaños muestrales para reducir el riesgo de un
error de tipo II (Plichta y Kelvin, 2013). La mayoría de los estudios
que emplean esta técnica asignan poca importancia a los resultados
en los que no encuentran diferencias. Con frecuencia, los
investigadores realizan múltiples pruebas de χ2 en una muestra. No
obstante, los resultados solo suelen presentarse si un análisis de χ2
muestra una diferencia significativa.

Interpretación de los resultados de la prueba de χ2


Con frecuencia, la primera reacción ante una frase sobre
«diferencias significativas» por parte de quienes no están
familiarizados con la lectura de resultados estadísticos es el pánico.
No obstante, una frase que parece impenetrable por la estadística
aporta una gran cantidad de información en muy poco espacio. Por
ejemplo, en los resultados χ2 (1) = 18,10, p = 0,001 el autor está
utilizando el análisis de χ2 para comparar dos grupos respecto a
una variable seleccionada, como la presencia o ausencia de
enfermedad crónica. El autor señala los grados de libertad (gl = 1),
de modo que el lector pueda validar la exactitud de los resultados
utilizando una tabla estadística de χ2 (v. tabla estadística de χ2 en el
texto de Grove y Cipher, 2017, pág. 445). El valor numérico de 18,1,
es el valor de χ2 obtenido del cálculo de la ecuación de χ2

686
(probablemente con un ordenador). El programa SPSS y otros
programas de análisis de datos calculan y proporcionan
automáticamente el nivel de significación de los resultados de χ2
que se pueden validar utilizando una tabla estadística de χ2. Como
se ha señalado anteriormente, el símbolo p es la abreviatura de
probabilidad. Los grupos eran significativamente diferentes,
porque p = 0,001, que está por debajo del nivel de significación
fijado en α = 0,05. La frase también indica que la probabilidad de
que estos grupos provengan de la misma población es de 1 entre
1.000. Los dos grupos se describen como significativamente
diferentes porque solo hay 1 probabilidad entre 1.000 de que los
resultados del estudio sean erróneos.
Si una variable de estudio tiene solo dos categorías, como
presencia o ausencia de enfermedad crónica, los investigadores
conocen qué es significativamente diferente. Sin embargo, la
localización exacta de diferencias específicas entre más de dos
categorías de variables no se puede determinar con el análisis de χ2
exclusivamente. La prueba de χ2 detecta la presencia de una
diferencia significativa y se realizan análisis post hoc para identificar
las categorías en las que se producen las diferencias significativas.
Park y cols. (2016) analizaron el efecto de un programa de gestión
de la infiltración intravenosa (i.v.) en niños hospitalizados. El grupo
de comparación recibió la asistencia rutinaria para evitar las
infiltraciones i.v. y el programa de gestión de la infiltración i.v. se
aplicó al grupo experimental. La muestra incluyó 2.894 inserciones
de catéteres i.v. en el grupo de comparación y 3.651 inserciones de
catéteres i.v. en el grupo experimental. El estudio tuvo un diseño
cuasiexperimental, porque los datos del grupo de comparación se
obtuvieron históricamente antes de que se implementase el
programa de gestión de la infiltración i.v. La infiltración i.v. se
midió en una escala de 0 a 4, donde el 0 indica la ausencia de
infiltración i.v. y los valores de 1 a 4 indican el grado de
extravasación de líquidos. El análisis de los datos y los resultados
de este estudio se presentan en el Ejemplo de investigación 11.4.

EJEMPLO DE INVESTIGACIÓN 11.4

687
χ2
Extracto del estudio de investigación
Análisis de los datos
Se utilizó el programa SPSS Win (versión 18.0) para el análisis de los
datos y se realizó una prueba de dos colas con un nivel de
significación (α) de 0,05. 1) El ritmo de infiltración i.v. se calculó
según el método estándar de la Infusion Nurses Society (2006). Se
realizó una prueba de χ2 o una prueba exacta de Fisher para evaluar
las diferencias de tasa de infiltración i.v. entre los dos grupos. Tasa de
infiltración (%) = (número de casos de infiltración i.v./número total
de inserciones i.v.) × 100…

Resultados
Tasas de infiltración i.v.

Para el grupo de comparación, el número total de inserciones i.v. fue


de 2.894, el de casos de infiltración i.v. de 127 y la tasa de infiltración
i.v. fue del 4,4%. Para el grupo experimental, el número total de
inserciones i.v. fue de 3.651, el de casos de infiltración i.v. de 34 y la
tasa de infiltración i.v. fue del 0,9%. Se observó una diferencia
estadísticamente significativa en la tasa de infiltración i.v. entre
ambos grupos (χ2 = 80,42, p <0,001; tabla 2). (Park y cols., 2016,
págs. 174-175)

Valoración crítica
El análisis de χ2 es apropiado para analizar las diferencias entre los
grupos de comparación y experimental en este estudio. La prueba
exacta de Fisher es la prueba de χ2 realizada habitualmente en
investigación de enfermería (Grove y Cipher, 2017). Los datos
sobre la infiltración i.v. se analizaron a nivel nominal. El 0 indicó la
ausencia de infiltración y los valores de 1 a 4 indican el grado de
infiltración según un estándar designado. El número de inserciones
de catéteres i.v. en los grupos fue muy elevado, lo que reduce el
potencial de error tipo II. En la tabla 2 se presenta con claridad la

688
frecuencia y la tasa de infiltración en ambos grupos, así como los
resultados de la prueba de χ2. Dado que el estudio solo incluyó dos
grupos, no se requirieron análisis post hoc. Debido a la gran
muestra y a los hallazgos significativos, Park y cols. (2016)
recomendaron el uso generalizado de este programa de gestión de
la extravasación i.v. en entornos clínicos.

Prueba t
Uno de los análisis más usados para comprobar si existen
diferencias significativas entre dos muestras es la prueba t, que se
emplea con el fin de examinar diferencias de grupos cuando las
variables se miden a nivel de intervalo o de razón. Se han
desarrollado distintas pruebas t para varios tipos de muestras. Por
ejemplo, cuando se comparan grupos independientes, se usa la
prueba t de muestras independientes. En los grupos emparejados o
dependientes, se realiza la prueba t de muestras emparejadas (v.
fig. 11.8).
En ocasiones, los investigadores emplean erróneamente la prueba
t realizando múltiples pruebas t para examinar diferencias respecto
a distintos aspectos de los datos recogidos en un estudio. Esta
aplicación incorrecta producirá un aumento de la significación, que
incrementa el riesgo de error de tipo I (decir que algo es
significativo cuando no lo es). La técnica de Bonferroni, que
controla el aumento de la significación, puede utilizarse cuando hay
que realizar múltiples pruebas t sobre distintos aspectos del mismo
grupo de datos. Este procedimiento hace que el nivel de
significación sea más estricto en función del número de
comparaciones realizadas. Por ejemplo, si se realizan cinco pruebas
t, el nivel de significación debería fijarse en 0,01 (0,05 ÷ 5 = 0,01).

Interpretación de los resultados de la prueba t


El resultado del análisis es un estadístico t y el valor y la
significación de este resultado se describen en los estudios. Los
resultados de la prueba t en los estudios publicados pueden
validarse comparándolos con los valores de t en una tabla
estadística (v. Grove y Cipher, 2017, págs. 439-440). La tabla se usa
para identificar el valor crítico de t. Si el dato estadístico calculado

689
es mayor o igual que el valor crítico, los grupos son
significativamente diferentes.
El estudio de Valiee y cols. (2017), citado previamente, se realizó
para determinar los efectos de un programa psicoeducativo (PPE)
sobre la salud emocional y física, el funcionamiento social y la CV
de los pacientes con CI. Estos investigadores realizaron pruebas t
para determinar diferencias entre los grupos intervención y control
de su estudio. Este estudio fue un ECA con un diseño experimental
pretest-postest (v. cap. 8). Los participantes del estudio se asignaron
aleatoriamente al grupo de intervención o control, lo que dio como
resultado grupos independientes. Los dos grupos no eran
significativamente diferentes en el pretest, lo cual indica que los
grupos eran similares respecto a las variables dependientes al inicio
del estudio (v. tabla 2 en el Ejemplo de investigación 11.1). El grupo
intervención siguió ocho sesiones grupales del PPE y a
continuación se realizaron los postests. Los resultados de las
pruebas t se presentaron en tablas y en el texto, como se indica en el
Ejemplo de investigación 11.5.

EJEMPLO DE INVESTIGACIÓN 11.5


Resultados de la prueba t
Extracto del estudio de investigación
Se usó una prueba t para muestras independientes con el fin de
analizar las diferencias entre las puntuaciones promedio de CV de los
dos grupos (96,34 ± 19,01 para el grupo de intervención y 94,75 ±
17,61 para el grupo control) y las puntuaciones medias de las
subescalas de CV al comienzo del estudio, sin que se observasen
diferencias significativas en estas puntuaciones (p >0,05) (tabla 2) [en
el Ejemplo de investigación 11.1]. Sin embargo, tanto los valores
promedio de CV global (157,97 ± 25,51 para el grupo de intervención
y 105,03 ± 8,38 para el grupo control) como los valores promedio de
las subescalas de CV eran significativamente mayores después de la
intervención para el grupo intervención. Las diferencias entre ambos

690
grupos eran estadísticamente significativas tanto en los valores de CV
global como en todas las subescalas (p <0,05) (tabla 3).

…Utilizando la prueba t para muestras emparejadas, se observó una


diferencia significativa entre los valores promedio de CV global del
grupo de intervención antes y después de la intervención con PPE
(96,34 ± 19,01 frente a 157,97 ± 25,51) (p <0,0001). Sin embargo, no
se observaron cambios significativos en los valores del grupo control
cuando se compararon antes y después del estudio (94,75 ± 17,61
frente a 105,03 ± 8,38) (p = 0,07) (tabla 4). (Valiee y cols., 2017, pág.
39)

TABLA 4
Comparación de la calidad de vida pretest y postest entre
dos grupos

CV, calidad de vida; DE, desviación estándar.


Tomada de Valiee, S., Razavi, N. S., Aghajani, M. y Bashiri, Z. (2017).
Effectiveness of a psychoeducation program on the quality of life in patients
with coronary heart disease: A clinical trial. Applied Nursing Research,
33(1), 40.

Valoración crítica
Valiee y cols. (2017) realizaron pruebas t para muestras
independientes con el fin de determinar las diferencias entre los
grupos intervención y control en los postests para las variables
independientes (salud emocional, salud física, funcionamiento
social y CV; v. tabla 3). La técnica de análisis con pruebas t para
muestras independientes fue adecuada, porque el estudio se centró
en determinar diferencias entre los grupos intervención y control
asignados al azar respecto a las variables dependientes medidas a
nivel de intervalos o de razón (Grove y Cipher, 2017). Se
encontraron diferencias significativas entre los dos grupos para

691
todas las variables dependientes, como lo indica una p <0,0001, que
es menor que α = 0,05. Los hallazgos significativos indicaron que la
potencia es adecuada para detectar diferencias entre grupos; no
hay errores tipo II. Los hallazgos significativos respaldan la eficacia
del PPE sobre la CV de los pacientes con CI. No obstante, la
realización de múltiples pruebas t sin la técnica de Bonferroni u
otra prueba post hoc suscita dudas acerca de un mayor riesgo de
error tipo I. Los resultados del estudio se habrían visto fortalecidos
con la inclusión de la corrección de Bonferroni para pruebas t
múltiples.

TABLA 3
Comparación de la puntuación media en la escala de
conflicto conyugal de las parejasa

ANOVA-MR, análisis de la varianza de medidas repetidas; DE, desviación


estándar.
a
Antes, después y 1 mes después del fin de la intervención en ambos
grupos y entre los grupos evaluados.
b
Prueba t independiente
Tomada de Yektatalab, S., Oskouee, S. y Sodani, M. (2017). Efficacy of
Bowen theory on marital conflict in the family nursing practice: A
randomized controlled trial. Issues in Mental Health Nursing, 38(3), 258.
Valiee y cols. (2017) también analizaron las diferencias de CV
entre el pretest y el postest para los grupos intervención y control.
Las pruebas t emparejadas o dependientes fueron apropiadas,
porque las diferencias se analizaron en el mismo grupo utilizando
los valores pretest y postest (usados como su propio control). El
grupo de intervención tenía una diferencia significativa entre el
pretest y el postest, lo que indica que el PPE cambió
significativamente los valores de CV de los participantes. Como era
de esperar, el grupo control que recibió la asistencia estándar tenía

692
valores no significativos entre el pretest y el postest. Valiee y cols.
(2017, pág. 36) concluyeron que «En función de los hallazgos, el
PPE ayudó a los pacientes con CI a mejorar su calidad de vida
mediante la reducción de la tensión, aliviando sus emociones
negativas y mejorando sus relaciones sociales».

TABLA 2
Comparación de la calidad de vida basal entre dos grupos

DE, desviación estándar.


Tomada de Valiee, S., Razavi, N. S., Aghajani, M. y Bashiri, Z. (2017).
Effectiveness of a psychoeducation program on the quality of life in patients
with coronary heart disease: A clinical trial. Applied Nursing Research,
33(1), 40.

TABLA 2
Incidencia de infiltración entre los grupos de comparación y
experimental

Tomada de Park, S. M., Jeong, I. S., Kim, K. L., Park, K. J., Jung, M. J. y
Jun, S. S. (2016). The effect of intravenous infiltration management
program for hospitalized children. Journal of Pediatric Nursing, 31(2), 174.

Análisis de la varianza
El análisis de la varianza (ANOVA) es una técnica estadística
paramétrica que se realiza para examinar diferencias entre tres o
más grupos. Como se trata de un análisis paramétrico, las variables
tienen que estar medidas a nivel de intervalo o de razón. Hay

693
muchos tipos de ANOVA; algunos fueron creados para el análisis
de datos provenientes de diseños experimentales complejos (Grove
y Cipher, 2017; Plichta y Kelvin, 2013). En vez de centrarse solo en
las diferencias entre las medias, el ANOVA busca las diferencias de
la varianza. Una fuente de varianza es la varianza de cada grupo,
porque los valores individuales en el grupo serán distintos a la
media del grupo. Esta varianza se denomina varianza intragrupal.
Otra fuente de varianza es la variación de las medias del grupo
respecto a la media total, denominada varianza intergrupal. La
suposición es que si todas las muestras están extraídas de la misma
población, estas dos fuentes de varianza mostrarán poca diferencia.
Si se combinan estos dos tipos de varianza, se obtiene la varianza
total.

Interpretación de resultados del análisis de la varianza


Los resultados de un ANOVA se reseñan como estadístico F. La
tabla de distribución de F se puede usar para validar la
significación de los valores de F en los estudios (v. Grove y Cipher,
2017, págs. 443-444). Si el valor de F es mayor o igual que el valor
apropiado de la tabla, hay una diferencia estadísticamente
significativa entre los grupos. Si solo se están examinando dos
grupos, la localización de la diferencia significativa está clara. Sin
embargo, si se estudian más de dos grupos, no es posible
determinar a partir del ANOVA dónde están teniendo lugar las
diferencias significativas. Por tanto, se realizan análisis post hoc con
el fin de identificar la localización de las diferencias entre los
grupos. Las pruebas post hoc más usadas son la corrección de
Bonferroni y las pruebas de Newman-Keuls, la diferencia
significativa honesta (DSH) de Tukey, de Scheffé y Dunnett (Grove
y Cipher, 2017; Plichta y Kelvin, 2013).
Yektatalab, Oskouee y Sodani (2017) realizaron un ECA para
determinar la eficacia de una intervención de asesoramiento basada
en la teoría de sistemas de Bowen del conflicto conyugal de parejas
en una consulta de enfermería de familia. El conflicto conyugal se
midió con una escala de Likert de 42 ítems que tenía un α de
Cronbach = 0,95 para este estudio. Las parejas se asignaron a los
grupos de intervención o de control usando una tabla de números
aleatorios. El grupo intervención recibió las ocho sesiones de

694
asesoramiento familiar y el grupo control recibió la asistencia
estándar. El diseño incluyó la medición del conflicto conyugal en el
pretest y en dos postests, uno justo después de la intervención y el
otro, un mes después. El análisis de la potencia indicó que se
necesitaba una muestra de 24 parejas, pero los investigadores
usaron 42 parejas debido a un posible abandono elevado durante el
estudio. Se perdió una pareja tanto en el grupo de intervención
como en el control, por lo que la muestra constó de 40 parejas (80
participantes). El análisis de los datos y los resultados se muestran
en el Ejemplo de investigación 11.6.

EJEMPLO DE INVESTIGACIÓN 11.6


ANOVA
Extracto del estudio de investigación
Análisis de los datos
Los datos del estudio fueron recogidos por el ayudante del
investigador (que no había recibido información sobre la intervención)
antes, justo después y un mes después del fin de la intervención. La
información demográfica y los cuestionarios sobre conflicto conyugal
también se cumplimentaron con la colaboración del ayudante del
investigador. La información demográfica incluyó la edad, el sexo y el
nivel educativo… Los datos se introdujeron en el programa
estadístico SPSS… y se analizaron utilizando una prueba t
independiente y emparejada, una prueba de χ2, el coeficiente de
correlación de Pearson y una prueba ANOVA de medidas repetidas.
Además, un valor de p <0,05 se consideró estadísticamente
significativo…

Resultados
Conflicto

Los resultados del estudio no mostraron diferencias estadísticamente


significativas entre los grupos del estudio en lo que respecta a los

695
valores de conflicto conyugal (t = 2,8, p = 0,93)… antes de la
intervención (p >0,05) (tabla 3). Sin embargo, se observó una
diferencia significativa entre ambos grupos a este respecto justo
después y un mes después de la intervención (p <0,05) (tabla 3).

Se usó una prueba de medidas repetidas [ANOVA] para investigar


los cambios de los valores promedio de conflicto de las parejas en tres
fases sucesivas. Los resultados demostraron una diferencia
significativa entre los grupos de intervención y control respecto a los
valores de conflicto… durante los tres períodos y grupos de estudio (p
<0,001) (tabla 3). Por tanto, los resultados respaldaron la hipótesis del
estudio. (Yektatalab y cols., 2017, pág. 257)

TABLA 3
Comparación de la calidad de vida al final del estudio entre
dos grupos

DE, desviación estándar.


Tomada de Valiee, S., Razavi, N. S., Aghajani, M. y Bashiri, Z. (2017).
Effectiveness of a psychoeducation program on the quality of life in patients
with coronary heart disease: A clinical trial. Applied Nursing Research,
33(1), 40.

Valoración crítica
Yektatalab y cols. (2017) realizaron un estudio longitudinal para
determinar las diferencias entre los grupos de intervención y de
control en tres puntos temporales (pretest, postest, un mes de
seguimiento). El conflicto conyugal se midió con una escala de
Likert que tenía una fiabilidad elevada en este estudio. La muestra
final de 40 parejas era amplia, según los resultados del análisis de
potencia. El abandono fue solo del 5%, con la pérdida de una
pareja de cada grupo, lo que dio lugar a grupos iguales para el

696
análisis. Los datos fueron recogidos por el ayudante de
investigación, que desconocía la intervención. El ANOVA de
medidas repetidas es la técnica de análisis correcta para dos o más
grupos de estudio y variables medidas como mínimo a nivel de
intervalo y medidas postest repetidas. Los autores presentaron
claramente los resultados de su ANOVA en formato de tabla y
argumentaron sus resultados en el artículo. En resumen, este
estudio tenía un diseño, tamaño muestral y proceso de recogida de
datos sólidos, con unos resultados significativos que respaldan la
eficacia de la intervención de asesoramiento sobre el conflicto
conyugal. Estos investigadores recomendaron la realización de
estudios adicionales con muestras más amplias y períodos de
seguimiento más prolongados. Una de las implicaciones para la
práctica consiste en garantizar que las parejas con conflicto
conyugal reciban asesoramiento familiar.

Análisis de la covarianza
El análisis de la covarianza (ANCOVA) permite al investigador
examinar el efecto de un tratamiento aparte del efecto de una o más
variables potencialmente de confusión (v. cap. 5). Las variables
potencialmente de confusión que resultan más importantes son
valores pretest, edad, educación, clase social y nivel de ansiedad. Si
las variables de confusión no se miden, sus efectos sobre las
variables del estudio pueden eliminarse estadísticamente
realizando análisis de regresión antes de llevar a cabo el ANOVA.
Una vez eliminado este efecto, es posible estudiar con más precisión
el efecto del tratamiento. A veces, esta técnica se usa como método
de control estadístico cuando no es posible diseñar el estudio de tal
modo que se controlen las variables de confusión potenciales. No
obstante, el control mediante una planificación meticulosa del
diseño es más eficaz que el control estadístico.
El ANCOVA puede emplearse en diseños pretest-postest en los
que se producen diferencias en los grupos en el pretest. Por
ejemplo, las personas que alcanzan puntuaciones bajas en el pretest
tienden a presentar puntuaciones más bajas en el postest que
aquellos cuyas puntuaciones pretest eran mayores, aunque el
tratamiento tuviera un efecto significativo sobre las puntuaciones

697
postest. Por el contrario, si una persona obtiene una puntuación
pretest elevada, es dudoso que el postest indique una variación
importante como resultado del tratamiento. El análisis ANCOVA
maximiza la capacidad de detectar diferencias en esos casos (Plichta
y Kelvin, 2013). Esta información ayudará a entender por qué se
realiza el ANCOVA y puede colaborar a identificar las variables de
confusión en un estudio.

INTERPRETACIÓN DE LOS
RESULTADOS DE INVESTIGACIÓN
La interpretación de los resultados de investigación implica
analizar todo el proceso de investigación para determinar los
puntos fuertes y débiles, organizar el significado de los resultados y
predecir la utilidad de los hallazgos para la práctica de enfermería
basada en la evidencia (Gray y cols., 2017; Melnyk, Gallagher-Ford
y Fineout-Overholt, 2017). Los resultados en investigación engloban
los siguientes elementos: hallazgos, relevancia de los hallazgos,
limitaciones, conclusiones, generalización de los hallazgos,
implicaciones para enfermería y recomendaciones de estudios
adicionales. Estos elementos se incluyen en la sección final de los
estudios, titulada «Discusión».

Tipos de resultados
La interpretación de resultados de los estudios cuasiexperimentales
y experimentales se ha basado clásicamente en la teoría de la
decisión, con cinco resultados posibles: 1) resultados significativos
acordes con los predichos por el investigador, 2) resultados no
significativos, 3) resultados significativos que son contrarios a los
predichos por el investigador, 4) resultados mixtos y 5) resultados
inesperados (Gray y cols., 2017; Shadish y cols., 2002). En la
valoración crítica de un estudio, se debe identificar qué tipo de
resultados se presentan en dicho estudio.

Resultados significativos y predichos


Los resultados significativos son acordes a los predichos por el

698
investigador y respaldan las conexiones lógicas creadas por él entre
el marco, el propósito, las preguntas del estudio, las hipótesis, las
variables y las herramientas de medición. Sin embargo, a la hora de
examinar los resultados, se debe considerar la posibilidad de
explicaciones alternativas para los hallazgos positivos. ¿Qué otros
elementos podrían haber llevado posiblemente a los resultados
significativos?

Resultados no significativos
Los resultados no significativos (o inconcluyentes), a menudo
denominados resultados «negativos», pueden ser un auténtico
reflejo de la realidad. En ese caso, el razonamiento del investigador
o la teoría usada por él para desarrollar la hipótesis incurre en un
error. En este caso, los hallazgos negativos son una adición
importante al cuerpo del conocimiento. No obstante, es posible que
los hallazgos surjan de un error de tipo II debido a una metodología
incorrecta, una muestra pequeña o sesgada, amenazas para la
validez del diseño (v. cap. 8), métodos inapropiados de medición,
técnicas estadísticas débiles o análisis defectuosos. En esos casos,
los resultados comunicados podrían introducir una información
errónea en el cuerpo de conocimiento (Angell, 1989). Los resultados
negativos no significan que no haya relaciones entre las variables.
Los resultados negativos tan solo indican que el estudio no logró
encontrar ninguna. Los resultados no significativos no aportan
evidencia sobre la verdad o falsedad de la hipótesis.

Resultados significativos no predichos


Los resultados significativos no predichos son lo contrario de los
predichos por el investigador e indican la presencia de fallos en la
lógica del investigador y la teoría puesta a prueba. No obstante, si
los resultados son válidos, constituyen una adición importante al
cuerpo del conocimiento. Por ejemplo, un investigador puede
proponer que el apoyo social y la fortaleza del ego se correlacionan
positivamente. Si el estudio en cuestión muestra más bien que un
apoyo social elevado se correlaciona con una fortaleza baja del ego,
el resultado es el contrario al predicho.

Resultados mixtos

699
Los resultados mixtos son probablemente los que se obtienen con
más frecuencia en los estudios. En este caso, una variable puede
respaldar las características predichas, mientras que otra no lo hace,
o dos medidas dependientes de la misma variable pueden mostrar
resultados diferentes. Estas diferencias pueden estar causadas por
problemas metodológicos, como distinta fiabilidad o sensibilidad
de los dos métodos de medir variables. Los resultados mixtos
también indican a veces que la teoría existente debe ser modificada.

Resultados inesperados
Los resultados inesperados suelen ser relaciones encontradas entre
variables que no formaban parte de la hipótesis y no fueron
predichas a partir del marco del estudio. La mayoría de los
investigadores examinan tantos elementos de los datos como sea
posible, además de los dirigidos por las preguntas. Estos hallazgos
pueden resultar útiles en la modificación de la teoría presente y el
desarrollo de nuevas teorías y futuros estudios. Asimismo, los
resultados inesperados o fortuitos son indicios importantes para
desarrollar las implicaciones del estudio. No obstante, los
resultados fortuitos deben interpretarse con cautela, porque el
estudio no había sido diseñado para examinar esos resultados.

Hallazgos
Los resultados de un estudio son traducidos e interpretados para
convertirse en los hallazgos del estudio. Aunque buena parte del
proceso de desarrollo de los hallazgos a partir de los resultados
tiene lugar en la mente del investigador, es posible encontrar
indicios de esos procesos mentales en los informes de investigación
publicados.

Exploración de la relevancia de los hallazgos


La relevancia de los hallazgos de un estudio se asocia con su
importancia a la hora de contribuir al cuerpo de conocimiento de
enfermería. La relevancia de los hallazgos de un estudio no es una
característica dicotómica (relevante o no relevante) porque los
estudios contribuyen en distinta medida al cuerpo de conocimiento.
La relevancia de los hallazgos de un estudio puede estar asociada

700
con la cantidad de varianza explicada, el grado de control en el
diseño del estudio dirigido a eliminar la varianza no explicada y/o
la capacidad de detectar diferencias o relaciones estadísticamente
significativas. Hasta donde sea posible en el momento en que se
publica el estudio, se espera que los investigadores aclaren la
relevancia de los hallazgos del estudio.
La verdadera importancia de un estudio particular puede no ser
obvia hasta años después de su publicación. Sin embargo, ciertas
características se asocian con la relevancia de los estudios: los
estudios relevantes cambian la vida de las personas. Es posible
generalizar sus hallazgos a un conjunto mucho mayor que la
muestra del estudio, de modo que los hallazgos tienen el potencial
de afectar a un gran número de personas. Las implicaciones de los
estudios relevantes van de hechos concretos a abstracciones y
conducen a la génesis de teoría o revisiones de la teoría existente
(Chinn y Kramer, 2015). Un estudio muy relevante tiene
implicaciones para una o más disciplinas, además de la enfermería.
El estudio es aceptado por otros en la disciplina y citado a menudo
en la literatura. Con el tiempo, la relevancia de un estudio se mide
por el número de estudios adicionales que genera. Por ejemplo, la
Braden Scale for Predicting Pressure Ulcer Risk ha sido el foco de
numerosas investigaciones y muchos profesionales de enfermería la
utilizan ahora para evitar y manejar las úlceras en la práctica
clínica.

Importancia clínica de los hallazgos


Los hallazgos más sólidos de un estudio son aquellos que poseen
tanto significación estadística como importancia clínica. La
importancia clínica se relaciona con la relevancia práctica de los
hallazgos. No hay un consenso habitual en enfermería sobre el
modo de evaluar la importancia clínica de un hallazgo, pero el
tamaño del efecto ha sido relevante para determinar esta
importancia. Por ejemplo, un grupo de pacientes puede tener una
temperatura corporal 0,05 °C mayor que la de otro grupo. El
análisis de datos tal vez indique que los dos grupos son
significativamente diferentes desde el punto de vista estadístico,
pero los hallazgos carecen de importancia clínica. El tamaño del
efecto o las diferencias entre dos grupos no tiene la relevancia

701
clínica necesaria como para que sea preciso modificar los cuidados
del paciente. En muchos estudios, sin embargo, resulta difícil juzgar
cuánto cambio constituiría la importancia clínica (Straus, Glasziou,
Richardson y Haynes, 2011). En estudios que evalúan la eficacia de
una intervención, la importancia clínica se puede manifestar por la
proporción de participantes en el estudio que mostraron mejoría o
el grado en que dichos participantes volvieron al funcionamiento
normal, pero ¿cuánta mejoría deben presentar las personas para
que los hallazgos se consideren clínicamente importantes? También
surgen preguntas sobre quién debe juzgar la importancia clínica:
pacientes y sus familias, clínicos, investigadores o la sociedad en su
conjunto. En este momento del desarrollo del conocimiento de
enfermería, la importancia o relevancia clínica es en último término
un juicio de valor (Gray y cols., 2017; LeFort, 1993).

Limitaciones
Las limitaciones son restricciones o problemas en un estudio que
pueden reducir la capacidad de generalizar los hallazgos. Las
limitaciones del estudio suelen consistir en una combinación de
puntos débiles teóricos y metodológicos. Los puntos débiles
teóricos de un estudio podrían ser un marco de investigación
incorrectamente desarrollado o conectado, y definiciones
conceptuales de las variables poco claras. Las definiciones
conceptuales limitadas de las variables podrían reducir la validez
de la operacionalización o medición de las variables del estudio.
Las limitaciones metodológicas se deben a factores tales como
muestras no representativas, diseños débiles, entorno único, control
limitado sobre la aplicación del tratamiento (intervención),
instrumentos cuya fiabilidad y validez son limitadas, control
restringido respecto a la recogida de datos y uso incorrecto de los
análisis estadísticos. Las limitaciones del estudio pueden disminuir
la credibilidad de los hallazgos y las conclusiones, y restringen la
población a la que pueden generalizarse los hallazgos. La mayoría
de los investigadores identifican las limitaciones de su estudio e
indican cómo esas limitaciones podrían haber afectado a los
hallazgos y las conclusiones del estudio. La identificación de las
limitaciones del estudio es necesaria, pero si esas limitaciones son

702
graves y múltiples hay que poner en duda la credibilidad de los
hallazgos.

Conclusiones
Las conclusiones son una síntesis de los hallazgos. Para establecer
conclusiones, el investigador emplea el razonamiento lógico, genera
un todo con significado a partir de fragmentos de información
obtenidos del análisis de los datos y los hallazgos de estudios
previos y considera otras explicaciones posibles de los datos. Uno
de los riesgos de establecer conclusiones es sobrepasar los
resultados del estudio o sacar conclusiones que no están justificadas
por los hallazgos.

Generalización de los hallazgos


La generalización extiende las implicaciones de los hallazgos de la
muestra estudiada a una población de mayor tamaño (v. la sección
previa sobre Inferencia y generalización). Por ejemplo, si el estudio
se realizó en pacientes con artrosis, sería posible generalizar los
hallazgos desde la muestra hasta la población en cuestión de mayor
tamaño formada por pacientes con artrosis o con otros tipos de
artritis.

Implicaciones para enfermería


Las implicaciones para enfermería son los significados de las
conclusiones procedentes de la investigación científica para el
cuerpo de conocimiento, teoría y práctica de enfermería (Chinn y
Kramer, 2015; Melnyk y cols., 2017). Las implicaciones se basan en
las conclusiones, pero son más específicas que estas; proporcionan
indicaciones específicas para aplicar los hallazgos en enfermería.
Por ejemplo, un investigador puede sugerir cómo debería
modificarse la práctica enfermera. Si un estudio indica que una
solución específica es eficaz para reducir las úlceras por presión en
pacientes ancianos ingresados, las implicaciones plantearán cómo
tiene que modificarse el cuidado de los pacientes ancianos para
prevenir úlceras por presión. Las intervenciones con un gran
respaldo de la investigación constituyen la base para desarrollar

703
guías de práctica basada en la evidencia (PBE) y asegurar la calidad
y la seguridad en la práctica enfermera (v. cap. 13).

Recomendaciones para futuros estudios


En todos los estudios, el investigador obtiene conocimientos y
experiencia que pueden usarse para diseñar un estudio mejor en la
próxima ocasión. Por tanto, los investigadores plantearán a menudo
sugerencias para estudios adicionales que nacen lógicamente del
estudio presente. Las recomendaciones para futuros estudios
pueden consistir en replicaciones o repeticiones del diseño con
muestras distintas o mayores, uso de métodos de medición
diferentes o evaluación de una intervención modificada o nueva.
Las recomendaciones pueden incluir también la generación de
hipótesis para seguir evaluando el marco de investigación en uso.
Esta sección aporta a otros investigadores ideas sobre estudios
adicionales dirigidos a desarrollar el conocimiento necesario de la
PBE (Brown, 2018; Melnyk y cols., 2017).

GUÍAS DE VALORACIÓN CRÍTICA


Resultados de investigación
Cuando se realice una valoración crítica de los resultados de
investigación de un estudio, hay que examinar la sección de
discusión del informe de investigación y abordar las siguientes
preguntas:

1. ¿Cuáles fueron los hallazgos del estudio? ¿Resultaron


correctos considerando los resultados estadísticos?
2. ¿Estaban relacionados los hallazgos del estudio con los de
investigaciones anteriores? ¿Se abordó la relevancia de los
hallazgos?
3. ¿Fueron clínicamente importantes los hallazgos?
4. ¿Los investigadores identificaron las limitaciones del estudio?
¿Qué otras limitaciones puede haber? ¿Cómo podrían haber
afectado las limitaciones del estudio a las conclusiones?
5. ¿Fueron correctas las conclusiones según los resultados,

704
hallazgos y limitaciones del estudio?
6. ¿A qué población(es) han generalizado los hallazgos del
estudio los investigadores? ¿Fueron correctas las
generalizaciones?
7. ¿Qué implicaciones se identificaron para el conocimiento, la
teoría y la práctica enfermera?
8. ¿Fueron correctas las implicaciones para la práctica de
enfermería según los hallazgos y las conclusiones del
estudio?
9. ¿Establecieron recomendaciones para futuros estudios los
investigadores? ¿Esas recomendaciones estaban basadas en
los resultados, hallazgos, limitaciones y conclusiones del
estudio?

Los resultados de la investigación del estudio de Valiee y cols.


(2017), citado previamente, se presentan y se valoran críticamente
en el Ejemplo de investigación 11.7. El propósito de este estudio era
determinar la eficacia de un programa psicoeducativo (PPE) sobre
la CV para pacientes con CI. El siguiente extracto del estudio
incluye información de la sección de discusión de este estudio; los
elementos clave de esta sección se identifican entre corchetes.

EJEMPLO DE INVESTIGACIÓN 11.7


Resultados de investigación
Extracto del estudio de investigación
Discusión
Los hallazgos de este estudio demostraron que el PPE mejoró la
calidad de vida en todas las dimensiones en los pacientes con CI,
incluida la salud emocional, la salud física y el funcionamiento social
[hallazgos]. Estos hallazgos fueron congruentes con los resultados de
Martina-Carrasco y cols., quienes publicaron que la formación sobre
el PPE aumentaba la calidad de vida de pacientes con enfermedad de
Alzheimer y sus familias (Martina-Carrasco y cols., 2009)….

705
Omranifard, Esmailinejad, Maracy y Jazi (2009) también observaron
que la formación sobre el PPE era un factor positivo eficaz en los
valores de CV de pacientes bipolares… Algunos estudios, incluido el
de D’Souza y cols. (2010), también usaron la formación psicológica y
afirmaron que este método fue eficaz no solo para reducir la gravedad
de la ansiedad y de los síntomas depresivos, sino también para
disminuir la tasa de recidiva de enfermedades… Otro estudio también
describió que el PPE mejoró la función física, la salud general y el
autocuidado en el control y la reducción del dolor anginoso de la
cardiopatía [relación con los hallazgos de estudios previos, relevancia
de los hallazgos, importancia clínica]…

Sin embargo, en algunos estudios que utilizaron PPE no se observó


ningún efecto significativo (Lenz y Perkins, 2000; Tofighian y cols.,
2009). Esos resultados podrían atribuirse a diferencias en el contenido
y las técnicas usadas, o a diferencias en los métodos y secuencias
temporales de las sesiones. Por ejemplo, varios estudios
implementaron métodos de formación psicológica mediante contacto
telefónico, correo electrónico o CD.… Los PPE tenían un impacto
positivo significativo sobre la calidad de vida del paciente, en
particular si los PPE se aplicaban en persona y se adaptaban a la
cultura y estilo de vida del individuo.

En general, los PPE cambiaron los marcos mentales de los pacientes,


aumentaron su conciencia del momento presente y mejoraron sus
sistemas cognitivos y de procesamiento de la información. Además,
los PPE en sesiones de grupo mostraron beneficios adicionales para
facilitar el proceso de tratamiento, porque permitieron a los pacientes
reunirse en un lugar para comentar sus problemas y apoyarse entre
sí…. Por tanto, los programas de PPE fueron más eficaces junto con
tratamientos en grupo [conclusiones].

Limitaciones y sugerencias

Este estudio tenía algunas limitaciones, como su diseño no


enmascarado y un periodo de seguimiento corto. Además, el estatus

706
psicológico de los pacientes cuando respondieron al cuestionario, así
como el nivel de información o de apoyo que recibieron de fuentes
distintas a los investigadores, que podrían afectar a los resultados del
estudio, no estaban bajo el control de los investigadores [limitaciones].
Se sugirió la realización de más estudios, usando tamaños muestrales
más grandes y periodos de seguimiento más largos o diferentes a
varios intervalos de tiempo. También se sugirió la realización de
estudios que analizasen los obstáculos para la implementación de PPE
y los facilitadores que usan PPE en la práctica [recomendaciones de
estudios adicionales].

Conclusión

Según estos hallazgos, los PPE mejoraron la calidad de vida de los


pacientes con CI [conclusión]. Los profesionales de enfermería
cardiológica deberían considerar este método cognitivo-educativo
como un apoyo y una asistencia de seguimiento rutinarios para los
pacientes con CI, haciendo hincapié en la mejora de la calidad de vida
de los pacientes. Además, teniendo en cuenta las necesidades de ayuda
de los pacientes con CI para mejorar la calidad de vida, las
intervenciones de PPE deberían añadirse a los currículos de
educación en enfermería e integrarse de forma rutinaria en los planes
de cuidados cardiacos [implicaciones para la enfermería]. (Valiee y
cols., 2017, págs. 39-40)

Valoración crítica
Valiee y cols. (2017) presentaron de forma concisa sus hallazgos
significativos, que eran concordantes con los resultados de su
estudio. Los hallazgos también eran congruentes con los de otros
estudios que incluyeron poblaciones diversas de pacientes con
enfermedades crónicas. En dos estudios no se observó que los PPE
tuviesen un efecto significativo sobre la CV de los pacientes, pero
Valiee y cols. (2017) proporcionaron una justificación para explicar
que los hallazgos de estos estudios no fuesen significativos. Los
hallazgos son clínicamente importantes, porque la intervención de
PPE fue eficaz para mejorar la CV de los pacientes con CI y el
mejor modo de implementarla fueron las sesiones de grupo.

707
Valiee y cols. (2017) identificaron las limitaciones de su estudio
que podrían haber restringido la generalización de los hallazgos.
Sin embargo, no limitaron la generalización de sus hallazgos y
recomendaron que se implementasen en los currículos de
formación en enfermería, lo que parece estar más allá de los
hallazgos de este estudio. La integración de los PPE en los planes
de cuidados cardiacos parece apropiada, con la realización de
investigaciones adicionales sobre la eficacia de esta intervención en
distintos entornos de práctica. Los investigadores sugirieron la
realización de estudios adicionales para aumentar el conocimiento
sobre la intervención con PPE.
Valiee y cols. (2017) ofrecieron conclusiones específicas de su
estudio al final de su informe de investigación que fueron
congruentes con los resultados, hallazgos y limitaciones de su
estudio. Las conclusiones de los investigadores proporcionaron
una base para las implicaciones de la práctica de enfermería y
recomendaciones respecto a futuras investigaciones. Sin embargo,
los investigadores ampliaron la generalización de sus hallazgos a
los currículos de educación de enfermería, lo que parecía estar más
allá del foco de este estudio.

PUNTOS CLAVE
• La comprensión de las teorías estadísticas y los conceptos
relevantes ayudará a valorar los resultados de los estudios
cuantitativos.
• La teoría de la probabilidad se usa para explicar relaciones,
la probabilidad de que suceda un evento en una situación
determinada o la probabilidad de predecir con precisión un
evento.
• La teoría de la decisión asume que todos los grupos de un
estudio dirigido a poner a prueba una hipótesis particular
son componentes de la misma población en lo que respecta
a las variables del estudio.
• El error de tipo I tiene lugar cuando se rechaza la hipótesis
nula cuando es verdadera. Los investigadores concluyen
que hay resultados significativos en estudio y en realidad

708
no existen. El riesgo de error de tipo I queda indicado por el
nivel de significación (α).
• El error de tipo II se produce cuando se acepta la hipótesis
nula y esta es falsa. Los investigadores concluyen que los
resultados del estudio no son significativos, pero realmente
sí lo son. Los errores de tipo II aparecen con frecuencia
debido a errores en los métodos de investigación y es
posible examinar su riesgo mediante el análisis de potencia.
• El análisis de datos cuantitativos tiene varias fases: 1)
gestión de los datos perdidos, 2) descripción de la muestra
del estudio, 3) examen de la fiabilidad de los métodos de
medición, 4) realización de análisis exploratorios de los
datos y 5) realización de análisis inferenciales dirigidos por
las hipótesis, preguntas u objetivos.
• Los datos estadísticos descriptivos o de resumen explicados
en este texto son las distribuciones de frecuencias, los
porcentajes, las medidas de tendencia central, las medidas
de dispersión y el diagrama de dispersión.
• Los análisis estadísticos realizados para examinar relaciones
que se describen en este texto son la correlación de
producto-momento de Pearson y el análisis factorial.
• El análisis de regresión se lleva a cabo para predecir el valor
de una variable dependiente utilizando una o más variables
independientes.
• Los análisis estadísticos realizados con el fin de examinar las
diferencias entre grupos y determinar la causalidad que se
han descrito en este texto son la prueba de χ2, la prueba t, el
ANOVA y el ANCOVA.
• La interpretación de resultados de los estudios
cuasiexperimentales y experimentales se basa clásicamente
en la teoría de la decisión, con cinco resultados posibles: 1)
resultados significativos predichos por el investigador, 2)
resultados no significativos, 3) resultados significativos que
son lo contrario de los predichos por el investigador, 4)
resultados mixtos y 5) resultados inesperados.
• Los resultados de la investigación suelen incluir hallazgos,
relevancia de los hallazgos, limitaciones, conclusiones,
generalización de los hallazgos, implicaciones para

709
enfermería y recomendaciones para estudios adicionales.
• En la valoración crítica de un estudio, se debería evaluar la
idoneidad y la plenitud de las secciones de resultados, así
como la discusión de los investigadores.

BIBLIOGRAFÍA
American Psychological Association (APA). Publication manual of the
American Psychological Association, 6th ed. Washington, D.C.:
Author; 2010.

Angell, M. Negative studies. New England Journal of Medicine. 1989;


321(7):464–466.

Brown, S. J. Evidence-based nursing: The research-practice connection,


4th ed. Sudbury, MA: Jones & Bartlett; 2018.

Chinn, P. L., Kramer, M. K. Integrated theory and knowledge


development in nursing, 9th ed. St. Louis, MO: Elsevier Mosby; 2015.

Cohen, J. Statistical power analysis for the behavioral sciences, 2nd ed.
New York, NY: Academic Press; 1988.

D’Souza, R., Piskulic, D., Sundram, S. A brief dyadic group based


on psychoeducation program: A pilot randomized controlled trial.
Journal of Affective Disorders. 2010; 120(1-3):272–276.

Gray, J. R., Grove, S. K., Sutherland, S. The practice of nursing


research: Appraisal, synthesis, and generation of evidence, 8th ed. St.
Louis, MO: Elsevier Saunders; 2017.

Grove, S. K., Cipher, D. J. Statistics for nursing research: A workbook


for evidence-based practice, 2nd ed. St. Louis, MO: Elsevier; 2017.

710
Hoare, Z., Hoe, J. Understanding quantitative research: Part 2.
Nursing Standard (Royal College of Nursing [Great Britain]). 2013;
27(18):48–55.

Hoe, J., Hoare, Z. Understanding quantitative research: Part 1.


Nursing Standard (Royal College of Nursing [Great Britain]). 2012;
27(15–17):52–57.

Infusion Nurses Society. Infusion nursing standards of practice.


Journal of Infusion Nursing. 2006; 29(supp):S1–S92.

Juniper, E. F., Guyatt, G. H., Feeny, D. H., Ferrie, P. J., Griffith, L. E.,
Townsend, M. Measuring quality of life in children with asthma.
Quality of Life Research. 1996; 5(1):35–46.

Lenz, E. R., Perkins, S., Coronary artery bypass graft surgery


patients and their family member caregivers: Outcomes of a family-
focused staged psychoeducation intervention. Applied Nursing
Research 13 3 2000:142–150

LeFort, S. M. The statistical versus clinical significance debate. Image


—The Journal of Nursing Scholarship. 1993; 25(1):57–62.

Martina-Carrasco, M., Martin, M. F., Valero, C. P., Millan, P. R.,


Garcia, C. I., Montalban, S. R., et al. Effectiveness of a
psychoeducational intervention program in the reduction of
caregiver burden in Alzheimer’s disease patients’ caregivers.
International Journal of Geriatric Psychiatry. 2009; 24(5):489–499.

McKee, C., Long, L., Southward, L. H., Walker, B., McCown, J. The
role of parental misperception of child’s body weight in childhood
obesity. Journal of Pediatric Nursing. 2016; 31(2):196–203.

711
Melnyk, B. M., Gallagher-Ford, E., Fineout-Overholt, E.
Implementing evidence-based practice competencies in healthcare: A
practical guide for improving quality, safety, & outcomes. Indianapolis,
IN: Sigma Theta Tau International; 2017.

Omranifard, V., Esmailinejad, Y., Maracy, M. R., Jazi, A. H.D. The


effects of modified family psychoeducation on the relative’s quality
of life and family burden in patients with bipolar type 1 disorder.
Journal of Isfahan Medical School. 2009; 27(100):563–574.

Park, S. M., Jeong, I. S., Kim, K. L., Park, K. J., Jung, M. J., Jun, S. S.
The effect of intravenous infiltration management program for
hospitalized children. Journal of Pediatric Nursing. 2016; 31(2):172–
178.

Plichta, S. B., Kelvin, E. Munro’s statistical methods for health care


research, 6th ed. Philadelphia, PA: Lippincott Williams & Wilkins;
2013.

Polit, D. F. Statistics and data analysis for nursing research, 2nd ed.
Boston, MA: Pearson; 2010.

Polit, D. F., Yang, F. M. Measurement and the measurement of change.


Philadelphia, PA: Wolters Kluwer; 2016.

Shadish, W. R., Cook, T. D., Campbell, D. T. Experimental and quasi-


experimental designs for generalized causal inference. Chicago, IL: Rand
McNally; 2002.

Slakter, M. J., Wu, Y. B., Suzaki-Slakter, N. S. *, and Statistical


nonsense at the.00000 level. Nursing Research. 1991; 40(4):248–249.

Straus, S. E., Glasziou, P., Richardson, W. S., Haynes, R. B. Evidence-

712
based medicine: How to practice and teach it. Edinburgh: Churchill
Livingstone Elsevier; 2011.

Tofighian, T., Najjar, L., Akabery, A., Nakhaee, M. R.S. Effect of


individual counseling on quality of life in patients with myocardial
infarction. Journal of Sabzevar University of Medical Sciences. 2009;
16(4):206–212.

Valiee, S., Razavi, N. S., Aghajani, M., Bashiri, Z. Effectiveness of a


psychoeducation program on the quality of life in patients with
coronary heart disease: A clinical trial. Applied Nursing Research.
2017; 33(1):36–42.

Walker, V. G. Exploration of the influence of factors identified in


the literature on school-aged children’s emotional responses to
asthma. Journal of Pediatric Nursing. 2017; 33(1):54–62.

Waltz, C. F., Strickland, O. L., Lenz, E. R. Measurement in nursing


and health research, 5th ed. New York, NY: Springer Publishing
Company; 2017.

Yektatalab, S., Oskouee, S., Sodani, M. Efficacy of Bowen theory on


marital conflict in the family nursing practice: A randomized
controlled trial. Issues in Mental Health Nursing. 2017; 38(3):253–260.

713
CAPÍTULO 12

Valoración crítica de
la investigación
cuantitativa y
cualitativa para la
práctica enfermera
Christy J. Bomer-Norton

La página web de la National Guideline Clearinghouse de la Agency for


Healthcare Research and Quality (AHRQ) se cerró en 2018. Puede
consultarse más información en https://www.ahrq.gov/.

ÍNDICE DEL CAPÍTULO

Propósito de la realización de valoraciones críticas de


los estudios en enfermería, 334
Principios clave para realizar valoraciones críticas
intelectuales de los estudios cuantitativos y cualitativos,
336

714
Comprensión del proceso de valoración crítica de
investigaciones cuantitativas, 338
Ejemplo de una valoración crítica de un estudio
cuantitativo, 344
Comprensión del proceso de valoración crítica de
investigaciones cualitativas, 357
Ejemplo de una valoración crítica de un estudio
cualitativo, 362
Puntos clave, 384
Bibliografía, 385

OBJETIVOS DE APRENDIZAJE
Tras concluir este capítulo, el lector debería ser capaz de:
1. Describir el propósito de las valoraciones críticas intelectuales
de los estudios en enfermería.
2. Describir los tres pasos para valorar ríticamente un estudio: 1)
identificación de los pasos o elementos del proceso de
investigación en el estudio, 2) determinación de los puntos
fuertes y débiles del estudio y 3) evaluación de la credibilidad y
el significado de los hallazgos del estudio.
3. Realizar una valoración crítica de un informe de investigación
tanto cuantitativa como cualitativa.

La profesión de enfermería se esfuerza continuamente en aplicar


la práctica basada en la evidencia (PBE), que comprende la
valoración crítica de los estudios, la síntesis de los hallazgos, la
aplicación de la evidencia científica en la práctica y la
determinación de los resultados prácticos (Brown, 2018; Melnyk,
Gallagher-Ford y Fineout-Overholt, 2017; Moorhead, Johnson, Maas
y Swanson, 2013). La valoración crítica es un paso esencial para
basar la práctica en los hallazgos de la investigación actuales. El

715
término valoración crítica o crítica es un análisis de la calidad de
un estudio para determinar la credibilidad y el significado de los
resultados para la enfermería. Crítica suele asociarse a criticar, una
palabra que con frecuencia se percibe como negativa. Sin embargo,
en las artes y las ciencias la crítica se asocia al pensamiento y la
evaluación críticos, tareas que requieren habilidades intelectuales
cuidadosamente desarrolladas. Este tipo de crítica se denomina
valoración crítica intelectual y se dirige al producto que se ha
creado, como un estudio, más que al creador, y consiste en evaluar
la calidad de ese producto.
La idea de la valoración crítica intelectual de la investigación se
introdujo al principio de este libro y se ha ido tejiendo a lo largo de
los capítulos. A medida que se ha ido presentando cada paso del
proceso de investigación, se han proporcionado guías para orientar
la valoración crítica de ese aspecto de los informes de investigación.
En este capítulo, se hace un resumen, se desarrolla el contenido
anterior y se proporciona orientación para realizar valoraciones
críticas de los estudios cuantitativos y cualitativos. El contenido
sirve como base para la valoración crítica de las síntesis de la
investigación (revisiones sistemáticas, metaanálisis, metasíntesis y
revisiones sistemáticas de métodos mixtos), que se presentan en el
capítulo 13.
Se describen las valoraciones críticas realizadas en enfermería por
los estudiantes, los profesionales de enfermería en activo, los
docentes y los investigadores. Se describen los principios clave para
realizar valoraciones críticas intelectuales de los estudios
cuantitativos y cualitativos para proporcionar una visión general
del proceso. Se detallan los pasos para la valoración crítica de los
estudios cuantitativos y cualitativos, centrándose en el rigor, la
calidad y el significado de los hallazgos. También se ofrecen
ejemplos de valoraciones críticas de estudios cuantitativos y
cualitativos publicados.

PROPÓSITO DE LA REALIZACIÓN DE
VALORACIONES CRÍTICAS DE LOS
ESTUDIOS EN ENFERMERÍA

716
Una valoración crítica intelectual de un estudio consiste en un
análisis cuidadoso y completo del estudio para evaluar sus puntos
fuertes y débiles, su credibilidad, su significado y la importancia
para la práctica. Un estudio de alta calidad se centra en un
problema significativo, demuestra una metodología sólida, produce
resultados creíbles, indica implicaciones para la práctica y sirve de
base para otros estudios (Gray, Grove y Sutherland, 2017; Hoare y
Hoe, 2013; Hoe y Hoare, 2012). Por último, los resultados de varios
estudios de calidad pueden sintetizarse para proporcionar una
evidencia empírica para su uso en la práctica (O’Mathúna y
Fineout-Overholt, 2015). Para realizar una valoración crítica hay
que seguir tres pasos, que se tratan con detalle en este capítulo: 1)
identificar los pasos o los elementos del estudio, 2) determinar los
puntos fuertes y las limitaciones del estudio y 3) evaluar la
credibilidad y el significado de sus hallazgos. Al valorar
críticamente los estudios, se ampliará la capacidad de análisis, se
fortalecerá la base de conocimientos y se aumentará el uso de la
evidencia de la investigación en la práctica.
En general, los estudios se valoran críticamente para aumentar la
comprensión, resumir los conocimientos para la práctica y
proporcionar una base de conocimientos para las investigaciones
futuras, así como para determinar la evidencia de investigación lista
para su uso en la práctica. Además, las valoraciones críticas suelen
realizarse para un proyecto de clase, después de las presentaciones
verbales de los estudios, después de la publicación de un informe
de investigación, para seleccionar los resúmenes cuando los
estudios se presentan en conferencias, para seleccionar artículos
para su publicación y para evaluar las propuestas de investigación
para su realización o su financiación. Por tanto, los estudiantes, los
profesionales, los docentes y los investigadores de enfermería
participan en la valoración crítica de los estudios.

Valoración crítica de los estudios por parte


de los estudiantes
Un aspecto del aprendizaje del proceso de investigación es ser
capaz de leer y comprender los informes de investigación
publicados. Sin embargo, realizar una valoración crítica de un

717
estudio no es una habilidad básica y el contenido que se presenta en
los capítulos anteriores es esencial para este proceso. Los
estudiantes suelen adquirir conocimientos básicos sobre los
procesos de investigación y de valoración crítica a lo largo de su
programa universitario. Esforzarse por lograr una PBE es una de las
competencias identificadas por el proyecto Quality and Safety
Education for Nurses (QSEN, 2018) para los estudiantes
pregraduados de enfermería y la PBE requiere una valoración
crítica y una síntesis de los hallazgos de un estudio para la práctica
(Sherwood y Barnsteiner, 2017). En los niveles de máster y de
doctorado suelen enseñarse habilidades analíticas más avanzadas.
Por tanto, la valoración crítica de los estudios es una parte
importante de la enseñanza y la práctica de los profesionales de
enfermería.

Valoración crítica de los estudios por los


profesionales, docentes e investigadores de
enfermería
Los profesionales de enfermería en activo deben valorar
críticamente los estudios para basar su práctica en la evidencia de
investigación actualizada y no en la tradición o en el ensayo y error
(Brown, 2018; Craig y Smyth, 2012). Es necesario actualizar las
actividades de enfermería en respuesta a las evidencias que surgen
de la investigación y el desarrollo de teorías. Es importante que los
profesionales de enfermería en activo diseñen estrategias para que
se mantengan al día en sus áreas de trabajo. La lectura de revistas
de investigación y de estudios recientes publicados o enviados por
correo electrónico en su trabajo puede aumentar sus conocimientos
sobre los hallazgos de los estudios, pero no es suficiente para
realizar una valoración crítica. Los profesionales de enfermería
deben cuestionar la calidad de los estudios, la credibilidad de los
hallazgos y su significado para la práctica. Por ejemplo, podrían
formar un club de revistas de investigación en el que se presentaran
los estudios y fueran valorados críticamente por los miembros del
grupo (Gloeckner y Robinson, 2010). Las habilidades para la
valoración crítica de la investigación permiten a los profesionales
de enfermería en activo sintetizar la evidencia más creíble,

718
significativa y apropiada para usarla en su práctica. La PBE es
esencial en los organismos que buscan o intentan mantener el
estatus Magnet (American Nurses Credentialing Center [ANCC],
2017).
Los miembros del profesorado y los docentes de enfermería en
los contextos clínicos valoran críticamente las investigaciones para
ampliar su base de conocimientos clínicos y desarrollar y mejorar el
proceso educativo en enfermería. El análisis cuidadoso de los
estudios de enfermería actuales proporciona una base para
actualizar los contenidos curriculares para su uso en el ámbito
clínico y en las aulas. Los profesores sirven como modelos del rol
para sus estudiantes al analizar los nuevos estudios, evaluar la
información obtenida de la investigación e indicar qué evidencia
utilizar en la práctica. Por ejemplo, pueden valorar críticamente y
presentar la evidencia más reciente sobre el cuidado de las personas
con hipertensión en clase y enseñar mediante modelo de roles el
tratamiento de estos pacientes en contextos clínicos (James y cols.,
2013).
Los investigadores de enfermería valoran críticamente las
investigaciones previas para planificar y realizar su siguiente
estudio. Muchos tienen un programa de investigación en un área
seleccionada y actualizan su base de conocimientos mediante la
valoración crítica de los nuevos estudios en esa área seleccionada.
Por ejemplo, un equipo de investigadores de enfermería podría
tener un programa para identificar intervenciones eficaces con el fin
de ayudar a los pacientes a sobrellevar su hipertensión y a reducir
sus factores de riesgo cardiovascular. A medida que se publican
nuevos estudios sobre la prevención y el tratamiento de la
hipertensión, los investigadores valoran los estudios y consideran el
efecto de los hallazgos para su propia investigación.

Valoración crítica de la investigación


después de la presentación y la publicación
Cuando los profesionales de enfermería asisten a conferencias de
investigación, observan que después de la presentación de los
estudios suelen hacerse valoraciones críticas y preguntas. Estas
valoraciones ayudan a los investigadores a identificar los puntos

719
fuertes y débiles de sus estudios y a generar ideas para futuras
investigaciones. Los participantes que escuchan las críticas a los
estudios pueden comprender mejor cómo se realiza la
investigación. Además, experimentar el proceso de la valoración
crítica puede aumentar la capacidad de los participantes en la
conferencia para evaluar los estudios y juzgar la importancia de la
evidencia de la investigación para la práctica.
Se han publicado valoraciones críticas después de algunos
estudios en revistas científicas. Por ejemplo, las revistas de
investigación Scholarly Inquiry for Nursing Practice: An International
Journal y Western Journal of Nursing Research incluyen comentarios
después de los artículos de investigación, en los que otros
investigadores valoran críticamente los estudios de los autores, que
tienen la oportunidad de responder a estos comentarios. Las
valoraciones críticas de la investigación publicada suelen aumentar
la comprensión del lector del estudio y de la calidad de sus
hallazgos (American Psychological Association [APA], 2010). En las
cartas al editor podría aparecer una valoración crítica más informal
de un estudio publicado, en la que un lector comenta los puntos
fuertes y débiles de estos estudios escribiendo al editor de la revista.

Valoración crítica de la investigación para la


presentación y la publicación
Los organizadores de conferencias profesionales suelen pedir a los
investigadores que les envíen un resumen del estudio que están
realizando o que han terminado para su posible presentación en la
conferencia. La cantidad de información disponible suele ser
limitada, porque muchos resúmenes deben tener entre 100 y 250
palabras. Sin embargo, los colaboradores deben seleccionar los
estudios mejor diseñados con los resultados más significativos para
su presentación en los congresos de enfermería. Este proceso
requiere un investigador experimentado que necesite pocas claves
para determinar la calidad de un estudio. La valoración crítica de
un resumen suele abordar los siguientes criterios: 1) la idoneidad
del estudio para el programa de la conferencia, 2) la exhaustividad
del proyecto de investigación, 3) la calidad global del problema, el
propósito, la metodología y los resultados, 4) la contribución del

720
estudio a la base de conocimientos de enfermería, 5) la contribución
del estudio a la teoría de enfermería, 6) la originalidad del trabajo
(que no se haya publicado antes), 7) las implicaciones prácticas de
los hallazgos y 8) la claridad, la concisión y la exhaustividad del
resumen (APA, 2010; Gray y cols., 2017).
Algunos investigadores de enfermería trabajan como revisores
expertos para revistas profesionales evaluando la calidad de los
artículos de investigación remitidos para su publicación. Su función
es asegurar que los estudios aceptados para su publicación están
bien diseñados y contribuyen al cuerpo de conocimientos. Las
revistas con artículos valorados críticamente por revisores expertos
se denominan revistas revisadas por pares o revistas con revisores
externos (Pyrczak, 2008). Los comentarios de los revisores o los
resúmenes de los comentarios se envían a los investigadores para
guiar su revisión de los manuscritos para su publicación. Las
revistas con revisores externos suelen tener estudios y artículos de
mayor calidad y proporcionan estudios excelentes para la revisión
de la práctica enfermera.

Valoración crítica de las propuestas de


investigación
La valoración crítica de las propuestas de investigación se realiza
para aprobar los proyectos de investigación de los estudiantes,
permitir la recogida de datos en una institución y seleccionar los
mejores estudios para la financiación por parte de las instituciones
y los organismos locales, estatales, nacionales e internacionales. Se
puede colaborar en la revisión de una propuesta si se está
participando en la recogida de datos como parte de un proyecto de
clase o de estudios realizados en una institución clínica.
Las propuestas de investigación se revisan para la financiación
por organismos gubernamentales, empresas y fundaciones
seleccionados. Las empresas y fundaciones desarrollan su propio
formato para la revisión y la financiación de los proyectos de
investigación (Gray y cols., 2017). El proceso de revisión por pares
en las instituciones federales de financiación implica una valoración
crítica extremadamente compleja. Los profesionales de enfermería
participan en este nivel de la revisión de la investigación a través de

721
instituciones nacionales de financiación, como el National Institute
of Nursing Research (NINR, 2017) y la Agency for Healthcare
Research and Quality (AHRQ, 2017).

PRINCIPIOS CLAVE PARA REALIZAR


VALORACIONES CRÍTICAS
INTELECTUALES DE LOS ESTUDIOS
CUANTITATIVOS Y CUALITATIVOS
Dado que el enfoque principal de este capítulo es realizar
valoraciones críticas de estudios cuantitativos y cualitativos, los
principios clave para la realización de las valoraciones críticas
intelectuales de estos estudios se describen en el cuadro 12.1. Todos
los estudios tienen puntos débiles o fallos; si se descartaran todos
los estudios con defectos, no habría evidencias científicas
disponibles para su uso en la práctica. De hecho, la ciencia misma
es defectuosa, pues no describe, explica, predice o controla la
realidad por completo o perfectamente. Sin embargo, comprender
mejor y aumentar la capacidad para predecir y controlar los
fenómenos depende de que se reconozcan los defectos de los
estudios y de la ciencia. Entonces pueden planificarse otros estudios
para minimizar los puntos débiles de los anteriores. También es
necesario reconocer los puntos fuertes de un estudio para
determinar su calidad y la credibilidad de sus hallazgos. Cuando se
identifican los puntos fuertes y débiles de un estudio, es necesario
proporcionar ejemplos y justificar los juicios que se han
documentado con la literatura actual.

CUADRO 12.1 PRINCIPIOS CLAVE PARA LA


VALORACIÓN CRÍTICA DE ESTUDIOS
CUANTITATIVOS Y CUALITATIVOS

1. Leer y valorar críticamente todo el estudio. Una valoración


crítica de la investigación implica el análisis de la calidad de
todos los aspectos de su informe.

722
2. Analizar la organización y la presentación del informe de
investigación. Un informe bien preparado es completo y
conciso, y tiene una presentación clara y una organización
lógica. No contiene jerga excesiva que dificulte su lectura.
Las referencias deben ser actuales, completas y presentarse
en un formato coherente.
3. Analizar la relevancia del problema estudiado para la
práctica enfermera. Los estudios de enfermería deben
dirigirse a los problemas importantes de la práctica si se va a
desarrollar una base de conocimientos sólida para la práctica
enfermera basada en la evidencia.
4. Indicar el tipo de estudio realizado e identificar sus pasos o
sus elementos. Esto podría hacerse como una valoración
crítica inicial de un estudio; indica el conocimiento del lector
de los diferentes tipos de estudios cuantitativos y
cualitativos, así como los pasos o elementos que comprenden
estos estudios.
5. Identificar los puntos fuertes y débiles de un estudio. Todos
los estudios tienen puntos fuertes y débiles, por lo que se
debe prestar atención a todos los aspectos del estudio.
6. Ser objetivo y realista en la identificación de los puntos
fuertes y débiles del estudio. Hay que ser equilibrado en la
valoración crítica de un estudio. Se debe intentar no ser
demasiado crítico al identificar los puntos débiles o
excesivamente halagador al identificar los puntos fuertes.
7. Proporcionar ejemplos específicos de los puntos fuertes y
débiles de un estudio. Los ejemplos facilitan pruebas de la
valoración crítica de los puntos fuertes y débiles de un
estudio.
8. Justificar los comentarios de la valoración crítica. Hay que
incluir justificaciones de la valoración crítica y documentar
las opiniones con fuentes de la literatura actualizadas. Esto
fortalece la calidad de la valoración crítica y documenta el
uso de las habilidades de pensamiento crítico.
9. Evaluar la calidad del estudio. Hay que describir la
credibilidad de los hallazgos, su coherencia con los de otros
estudios y la calidad de las conclusiones del estudio.
10. Analizar la utilidad de los resultados para la práctica. Los

723
hallazgos del estudio deben estar relacionados con los de
estudios anteriores y deben analizarse para su uso en la
práctica clínica.

Además de los 10 principios que se recogen en el cuadro 12.1, se


siguen tres pasos para la valoración crítica de los estudios tanto
cuantitativos como cualitativos y sirven como resumen para las
guías más detalladas presentes en cuadros posteriores de este
capítulo. Estas guías subrayan la importancia de analizar la
experiencia de los autores, revisar todo el estudio, abordar sus
puntos fuertes y débiles, y evaluar la credibilidad de sus hallazgos
(Fawcett y Garity, 2009; O’Mathúna y Fineout-Overholt, 2015;
Powers, 2015). Las preguntas detalladas en los cuadros son
específicas del tipo de estudio y proporcionan los criterios para una
evaluación final, con el fin de determinar la credibilidad de los
hallazgos del estudio, cualquier implicación para la práctica, así
como ideas para investigaciones adicionales. La suma de los puntos
fuertes de múltiples estudios construye lentamente una base sólida
de evidencia para la práctica. Estas guías proporcionan una base
para el proceso de valoración crítica de la investigación cuantitativa
que se analiza en la sección siguiente y para la investigación
cualitativa que se comenta después.

COMPRENSIÓN DEL PROCESO DE


VALORACIÓN CRÍTICA DE
INVESTIGACIONES CUANTITATIVAS
El proceso de valoración crítica de investigaciones cuantitativas
comprende tres pasos básicos: 1) identificar los pasos del proceso de
investigación en los estudios, 2) determinar los puntos fuertes y
débiles del estudio y 3) evaluar la credibilidad y el significado de
sus hallazgos. Estos tres pasos se presentan junto con preguntas
detalladas para la valoración crítica de la investigación cuantitativa
en el cuadro 12.2. Como los lectores pueden ser nuevos en la
valoración crítica de investigaciones, probablemente se centren en
el paso 1 de la identificación de los pasos del proceso de
investigación. A medida que se gana experiencia en la valoración

724
crítica, se pueden realizar dos o tres pasos de este proceso
simultáneamente.

CUADRO 12.2 GUÍAS DE VALORACIÓN


CRÍTICA
Estudios cuantitativos

Paso 1: identificación de los pasos o elementos del


estudio; y Paso 2: determinación de los puntos
fuertes y de las limitaciones del estudio
1. Calidad de redacción
a. ¿El estilo de redacción del
informe es claro y conciso y se
han definido los términos
relevantes?
2. Título
a. ¿El título tiene un enfoque claro?
b. ¿El título incluye las variables
clave y la población del estudio?
c. ¿El título indica el tipo de
estudio realizado (descriptivo,
de correlación,
cuasiexperimental o
experimental) y las variables
(Gray y cols., 2017; Shadish,
Cook y Campbell, 2002)?
3. Autores
a. ¿Los autores tienen acreditación,
como un título de doctorado,
que les cualifique para realizar
el estudio presentado?

725
b. ¿Los autores tienen experiencia
previa de investigación o clínica
que les cualifique para realizar
el estudio presentado?
c. ¿Alguno de los autores tiene un
conflicto de intereses
relacionado con el estudio,
como un interés económico en
la compañía que produjo la
intervención implementada en
el estudio?
4. Resumen
a. ¿Se ha presentado el resumen
con claridad?
b. ¿El resumen incluye el
propósito, puntos destacados
del diseño, muestra,
intervención (si es aplicable) y
resultados clave (APA, 2010)?
5. Problema de investigación (v. cap. 5)
a. ¿Se ha proporcionado una
declaración del problema? Si no
se ha proporcionado una
declaración del problema, ¿se
puede inferir el problema o la
laguna en la literatura?
b. ¿Es el problema significativo
para la enfermería y la práctica
clínica (Brown, 2018)?
6. Propósito

726
a. Se debe indicar el propósito del
estudio.
b. ¿El propósito restringe y aclara
el foco del estudio (Fawcett y
Garity, 2009; O’Mathúna y
Fineout-Overholt, 2015)?
7. Revisión de la literatura (v. cap. 6)
a. Se debe analizar la revisión de la
literatura.
b. ¿Son la mayoría de las
referencias fuentes primarias
revisadas por pares? ¿Los
autores justifican las referencias
que no son fuentes primarias
revisadas por pares?
c. ¿Son las referencias actuales
(número y porcentaje de fuentes
publicadas en los últimos 5 y 10
años)? ¿Las referencias más
antiguas de 10 años son fuentes
de medición o teóricas, o bien
estudios de referencia, iniciales
o de replicación?
d. ¿El contenido se relaciona directamente
con los conceptos o variables del estudio?
¿Los tipos de fuentes y disciplinas de los
autores de la fuente son apropiados para
los conceptos o variables del estudio?
e. ¿Se ha realizado una valoración crítica y
síntesis de los estudios (Gray y cols., 2017;

727
Hart, 2009)? ¿Se trata de un resumen,
presentado de forma clara y concisa, del
conocimiento empírico y teórico actual del
área de estudio, incluyendo la
identificación de aquello que se sabe y se
desconoce (O’Mathúna y Fineout-
Overholt, 2015)? ¿El estudio aborda una
laguna en el conocimiento identificada en
la revisión de la literatura?
8. Marco o perspectiva teórica (v. cap. 7)
a. ¿Se ha expresado el marco de forma explícita o se
debe deducir a partir de las declaraciones en la
introducción, revisión de la literatura u otra(s)
sección(es) del estudio?
b. ¿El marco identifica, define y describe las relaciones
entre los conceptos de interés? Si existe un modelo o
mapa conceptual del marco, ¿es adecuado para
explicar el fenómeno de interés (Gray y cols., 2017)?
c. ¿Cómo se relaciona el marco con el cuerpo de
conocimiento de enfermería (Alligood, 2014; Smith
y Liehr, 2014)?
d. Si se va a poner a prueba una proposición de una
teoría, ¿la proposición está claramente identificada
y relacionada con la hipótesis del estudio (Fawcett y
Garity, 2009; Smith y Liehr, 2014)?
9. Objetivos, preguntas o hipótesis de investigación (v. cap. 5)
a. Se deben enumerar todos los objetivos, preguntas o
hipótesis de investigación.
b. ¿Se expresan con claridad los objetivos, preguntas o
hipótesis y tienen una relación lógica con el
propósito de la investigación?
c. ¿Existe una relación lógica entre los objetivos,
preguntas o hipótesis y los conceptos y relaciones
(proposiciones) del marco (Chinn y Kramer, 2015;
O’Mathúna y Fineout-Overholt, 2015; Smith y
Liehr, 2014)?

728
d. ¿Se plantean hipótesis para guiar la realización de
investigación cuasiexperimental y experimental
(Shadish y cols., 2002)?
10. Variables (v. cap. 5)
a. Hay que identificar las variables o conceptos del
estudio. Se deberían proporcionar las variables de
atributo o demográficas. Un estudio suele incluir
variables independientes y dependientes o variables
de investigación, pero no los tres tipos de variables.
i. Variables demográficas
ii. Variables independientes
iii. Variables dependientes
iv. Variables o conceptos de investigación
b. Hay que identificar las definiciones conceptuales y
operacionales para las variables independientes y
dependientes.
c. ¿Se definen con claridad las variables (de forma
conceptual y operacional) y se basan en
investigaciones o teorías previas (Chinn y Kramer,
2015; Gray y cols., 2017; Smith y Liehr, 2014)?
d. ¿Las variables reflejan los conceptos identificados en
el marco?
11. Diseño de investigación (v. cap. 8)
a. Hay que identificar el diseño específico del estudio.
b. ¿El diseño proporciona una forma de analizar todos
los objetivos, preguntas e hipótesis?
c. ¿El diseño utilizado en el estudio es el más
apropiado para obtener los datos requeridos (Gray y
cols., 2017)?
d. Tratamiento
i. ¿El estudio incluye un tratamiento o
intervención?
ii. ¿Se describe el tratamiento con claridad
(Eymard y Altmiller, 2016)?
iii. ¿Es el tratamiento apropiado para analizar el
propósito e hipótesis del estudio?
iv. ¿Se ha desarrollado un protocolo para
fomentar la implementación homogénea

729
del tratamiento con el fin de garantizar la
fidelidad de la intervención (Eymard y
Altmiller, 2016)?
v. ¿El investigador monitorizó la
implementación del tratamiento para
garantizar la consistencia?
vi. Si el tratamiento no se implementó de
forma consistente, ¿cuál podría haber sido
el impacto sobre los hallazgos?
e. Grupos
i. ¿El estudio tenía más de un grupo?
ii. Si el estudio tenía más de un grupo, ¿cómo
se asignaron los participantes del estudio a
dichos grupos?
iii. Si se implementó un tratamiento con más de un
grupo, ¿los participantes se asignaron de forma
aleatoria al grupo de tratamiento o se
emparejaron los grupos de tratamiento y de
comparación? ¿Las asignaciones a los grupos de
tratamiento y de comparación fueron
apropiadas para el propósito del estudio?
iv. Si se utilizó más de un grupo, ¿parecían
equivalentes los grupos?
f. ¿Se usaron hallazgos de un estudio piloto para el
diseño de este estudio? En caso afirmativo, se debe
comentar el estudio piloto y los cambios realizados
en este estudio basados en el piloto (Gray y cols.,
2017; Shadish y cols., 2002).
g. ¿El investigador identificó las amenazas para la
validez del diseño (validez de conclusión estadística,
validez interna, validez de constructo y validez
externa) y las minimizó todo lo posible (Gray y cols.,
2017; Shadish y cols., 2002)?
12. Muestra (v. cap. 9)
a. ¿El método de muestreo es probabilístico o no
probabilístico? ¿El método de muestreo específico
utilizado en el estudio para obtener la muestra se ha
identificado y es apropiado (Gray y cols., 2017)?

730
b. ¿Cuáles son los criterios de inclusión y exclusión en
la muestra? ¿Se identificaron ambos claramente y
fueron apropiados para el estudio (O’Mathúna y
Fineout-Overholt, 2015)?
c. ¿Se identifica el tamaño de la muestra (Aberson,
2010)?
d. ¿Están bien identificadas la tasa de rechazo o la de
aceptación? ¿Se explica la tasa de abandono o de
retención de la muestra? ¿Se proporcionan las
razones para las tasas de rechazo y de abandono?
e. ¿Se comunica el análisis de la potencia? ¿Es
adecuado el tamaño de la muestra, según lo
indicado por el análisis de la potencia? Si se
incluyeran grupos en el estudio, ¿es el tamaño de la
muestra para cada grupo igual y apropiado (Grove y
Cipher, 2017)?
f. ¿Es el proceso de muestreo adecuado para lograr una
muestra representativa? ¿Es la muestra
representativa de las poblaciones accesible y diana?
g. ¿Ha definido el investigador las poblaciones diana y
accesible del estudio?
h. ¿Cómo se obtuvo el consentimiento/asentimiento
informado?
i. ¿El proceso usado para el
consentimiento/asentimiento informado fue
apropiado para la población del estudio?
13. Entorno (v. cap. 9)
a. ¿Cuál es el entorno del estudio?
b. ¿Es el entorno apropiado para el propósito del
estudio?
14. Medición (v. cap. 10)
a. Se debe completar la tabla 12.1 para abarcar el
contenido de medición esencial para un estudio
(Waltz, Strickland y Lenz, 2017).

TABLA 12.1

Estrategias de medición

731
i. Hay que identificar todas las variables del
estudio que se midieron.
ii. Se debe identificar el nombre y el autor de
cada estrategia de medición.
iii. Hay que identificar el tipo de cada estrategia de
medición (p. ej., escala de Likert, escala visual
analógica, medida fisiológica o base de datos
existente).
iv. Se debe identificar el nivel de medición (p.
ej., nominal, ordinal, de intervalo o
racional) logrado por cada método de
medición utilizado en el estudio (Grove y
Cipher, 2017).
v. Hay que describir la fiabilidad de cada
escala en los estudios previos y en este
estudio. Se debe identificar la precisión
de cada medida fisiológica
(Bialocerkowski, Klupp y Bragge, 2010;
DeVon y cols., 2007).
vi. Hay que identificar la validez de cada
escala y la exactitud de las medidas
fisiológicas (DeVon y cols., 2007; Ryan-
Wenger, 2017).
b. Escalas y cuestionarios
i. ¿Se describen los instrumentos con
claridad?
ii. ¿Se proporcionan las técnicas para
completar y puntuar los instrumentos?
iii. ¿El investigador volvió a analizar la validez y
la fiabilidad de los instrumentos para la
muestra actual?
iv. Si el instrumento se desarrolló para el
estudio, ¿se describe el proceso de
desarrollo del instrumento (Gray y cols.,
2017; Waltz y cols., 2017)?
c. Observación

732
i. ¿Se ha identificado y definido con claridad
lo que se debe observar?
ii. ¿Se describen las técnicas de registro de las
observaciones (Waltz y cols., 2017)?
iii. ¿Se describe la fiabilidad interobservador?
d. Entrevistas
i. ¿Las preguntas de la entrevista abordan
las inquietudes expresadas en el
problema de investigación?
ii. ¿Son las preguntas de la entrevista
relevantes para el propósito y objetivos,
preguntas o hipótesis de la investigación
(Gray y cols., 2017; Waltz y cols., 2017)?
e. Medidas fisiológicas
i. ¿Se describen con claridad las medidas
fisiológicas o instrumentos (Ryan-
Wenger, 2017)? Si es apropiado, ¿se
identifican los nombres comerciales de
los instrumentos?
ii. ¿Se describen la exactitud, la precisión y el
error de los instrumentos fisiológicos
(Ryan-Wenger, 2017)?
iii. ¿Son las medidas fisiológicas apropiadas para
el propósito y objetivos, preguntas o hipótesis
de la investigación?
iv. ¿Se describen con claridad los métodos
para registrar los datos de las medidas
fisiológicas? ¿El registro de los datos es
consistente?
f. ¿Los métodos de medición seleccionados para el
estudio miden adecuadamente las variables del
estudio? ¿Deberían haberse utilizado métodos de
medición adicionales para mejorar la calidad de los
resultados del estudio (Waltz y cols., 2017)?
g. ¿Los métodos de medición usados en el estudio
tienen una validez y fiabilidad adecuadas? ¿Qué
comprobación adicional de la fiabilidad o validez se
necesita para mejorar la calidad de los métodos de

733
medición (Bialocerkowski y cols., 2010; DeVon y
cols., 2007; Waltz y cols., 2017)?
15. Recogida de datos (v. cap. 10)
a. ¿Se describe con claridad el proceso de recogida de
datos? (Fawcett y Garity, 2009; Gray y cols., 2017)?
b. ¿Los datos recogidos abordan los objetivos,
preguntas o hipótesis de la investigación?
c. ¿Cómo garantizó la investigación que el proceso de
recogida de datos se realizara de un modo exacto y
homogéneo?
i. ¿Quién recogió los datos del estudio?
ii. ¿La formación de los encargados de la
recogida de datos se describe con claridad
y es adecuada?
iii. ¿Se utilizaron métodos de estandarización,
como formularios estandarizados o datos
computarizados?
d. ¿Se obtuvo la aprobación del CRI antes de la
recogida de datos?
e. ¿La recogida de datos fue ética?
f. ¿Se produjo algún evento adverso durante la
recogida de datos y se manejaron de forma
apropiada?
16. Análisis de los datos (v. cap. 11)
a. Se debe completar la tabla 12.2 con las técnicas de
análisis utilizadas en el estudio (Gray y cols., 2017;
Grove y Cipher, 2017; Hoare y Hoe, 2013, Plichta y
Kelvin, 2013).

TABLA 12.2

Análisis estadísticos y resultados

i. Se debe identificar el propósito


(descripción, relaciones o diferencias)
para cada técnica de análisis.
ii. Hay que enumerar la técnica de análisis
estadístico realizada.

734
iii. Se deben enumerar los estadísticos.
iv. Hay que proporcionar los resultados
específicos.
v. Se debe identificar la probabilidad (p) de
la significación estadística lograda por el
resultado.
b. ¿Se han descrito con claridad los procedimientos de
análisis de los datos?
c. ¿Las técnicas de análisis de datos abordan el
propósito del estudio y los objetivos, preguntas o
hipótesis de la investigación (Gray y cols., 2017;
Grove y Cipher, 2017)?
d. ¿Los procedimientos de análisis de los datos son
apropiados para el tipo de datos recogidos (Grove y
Cipher, 2017; Plichta y Kelvin, 2013)?
e. ¿El investigador abordó cualquier problema de datos
perdidos y explicó cómo se manejó este problema?
f. Significación estadística.
i. ¿Se identificó el nivel de significación o α?
En caso afirmativo, ¿cuál era el nivel de
significación (0,05, 0,01 o 0,001)?
ii. ¿El tamaño muestral es suficiente para
detectar diferencias significativas si están
presentes?
iii. ¿Se realizó un análisis de la potencia para los
resultados no significativos (Aberson, 2010)?
g. ¿Se presentan los resultados de forma comprensible
mediante el texto, tablas, figuras o una combinación
de métodos (APA, 2010; Grove y Cipher, 2017)?
h. ¿La interpretación de los resultados es apropiada?
Paso 3: evaluación de la credibilidad y significado
de los hallazgos del estudio
17. Interpretación de los hallazgos
a. ¿Son los hallazgos congruentes
con los hallazgos de
investigaciones previas (Gray y

735
cols., 2017; O’Mathúna y Fineout-
Overholt, 2015)?
b. ¿Se comentan los hallazgos en
relación con cada objetivo,
pregunta o hipótesis?
c. ¿Se analizan varias explicaciones
para los hallazgos significativos y
no significativos?
d. ¿Son los hallazgos clínicamente
importantes (O’Mathúna y
Fineout-Overholt, 2015)?
e. ¿Se relacionan los hallazgos con el
marco del estudio (Smith y Liehr,
2014)? En caso afirmativo, ¿los
hallazgos respaldan el marco del
estudio?
f. ¿Qué preguntas surgen de los
hallazgos? ¿Los investigadores
las identifican?
18. Limitaciones
a. ¿Qué limitaciones del estudio
identificaron los investigadores?
b. ¿Tiene el estudio limitaciones no
identificadas por el investigador?
c. ¿Podría el investigador haber
evitado o controlado las
limitaciones del estudio?
19. Conclusiones
a. ¿Qué conclusiones identificaron
los investigadores en función de

736
su interpretación de los hallazgos
del estudio?
b. ¿Las conclusiones encajan con los
hallazgos de este estudio y de
estudios previos?
c. ¿Cómo generalizó los hallazgos el
investigador? ¿El investigador
generalizó los hallazgos de forma
apropiada?
20. Implicaciones para enfermería
a. ¿Qué implicaciones tienen los
hallazgos para la práctica
enfermera (Melnyk y cols., 2017;
O’Mathúna y Fineout-Overholt,
2015)?
b. ¿Las implicaciones para la
práctica identificadas eran
apropiadas en función de los
hallazgos del estudio y de los
hallazgos de investigaciones
previas (Melnyk y Fineout-
Overholt, 2015)?
21. Investigaciones futuras
a. ¿Qué sugerencias para estudios
futuros se identificaron?
b. ¿Se hicieron sugerencias de
calidad para investigaciones
futuras (O’Mathúna y Fineout-
Overholt, 2015)?
c. ¿La descripción del estudio es lo

737
bastante clara para su
replicación?
d. ¿La realización del estudio era
inviable por motivos económicos,
compromiso, experiencia de los
investigadores, disponibilidad de
sujetos, centros, equipo y/o ética
(Gray y cols., 2017)?
22. Resumen crítico:
a. Se deben revisar los componentes
de la crítica que se acaba de
realizar. Hay que considerar los
siguientes aspectos para
formular el resumen crítico.
i. ¿Se abordaron todos
los componentes
relevantes con un
detalle y claridad
adecuados?
ii. ¿Cuáles eran los
mayores puntos
fuertes y débiles del
estudio?
iii. ¿Se protegieron los derechos
de los sujetos humanos
(Creswell, 2014; Gray y cols.,
2017)?
iv. ¿Se cree que los
hallazgos del estudio
son válidos? ¿Qué

738
confianza puede
concederse a los
hallazgos del
estudio?
v. La evaluación de un
informe de
investigación
también debe incluir
una discusión final
de su calidad. La
discusión debería
incluir una opinión
de un experto sobre
la calidad del estudio
y su contribución al
conocimiento y la
práctica enfermera
(Melnyk y cols.,
2017; O’Mathúna y
Fineout-Overholt,
2015).

Paso 1: identificación de los pasos del


proceso de investigación en los estudios
Los primeros intentos para comprender los artículos de
investigación suelen ser frustrantes, porque la terminología y el
estilo no resultan familiares. La identificación de los pasos del
proceso de investigación en un estudio cuantitativo es el primer
paso de la valoración crítica. Consiste en comprender los términos y
conceptos del informe, así como identificar los elementos del
estudio y captar la naturaleza, relevancia y significado de dichos
elementos.

739
Se comienza por revisar el resumen y leer el estudio de principio
a fin, destacando o subrayando los pasos del proceso de
investigación cuantitativa que se identificaron previamente. Un
resumen de estos pasos se presenta en el capítulo 2. Después se
relee el artículo, se subrayan los términos que no se comprendan y
se determina su significado utilizando el glosario que aparece al
final de este libro. Después de leer y comprender el contenido del
estudio, se estará preparado para escribir una valoración crítica
inicial. Para ello, se debe identificar cada paso del proceso de
investigación de forma concisa y responder brevemente a las guías
y preguntas que aparecen en el cuadro 12.2.

Paso 2: determinación de los puntos fuertes


y débiles de los estudios
El segundo paso de la valoración crítica requiere la determinación
de los puntos fuertes y débiles de los estudios. Para ello, se debe
conocer cómo ha de ser cada paso del proceso de investigación a
partir de fuentes de expertos, como este libro y otras fuentes de
investigación (Creswell, 2014; Gray y cols., 2017; Grove y Cipher,
2017; Hoare y Hoe, 2013; Hoe y Hoare, 2012; O’Mathúna y Fineout-
Overholt, 2015; Waltz, Strickland y Lenz, 2017). A continuación, las
formas ideales de realizar los pasos del proceso de investigación se
comparan con los pasos del estudio actual. Durante esta
comparación, se analiza en qué medida el investigador siguió las
reglas para un estudio ideal, así como los puntos fuertes y débiles
de los elementos del estudio.
También es necesario analizar las relaciones lógicas o el flujo de
los pasos del estudio que se está valorando. Por ejemplo, el
problema tiene que proporcionar antecedentes y una orientación
para declarar el propósito. Las variables que se identifican en el
propósito del estudio deben ser coherentes con las variables
identificadas en los objetivos, las preguntas o las hipótesis de la
investigación, que deben definirse conceptualmente a la luz del
marco del estudio. Las definiciones conceptuales deben servir de
base para el desarrollo de las definiciones operacionales. El diseño y
el análisis del estudio deben ser apropiados para la investigación de
su propósito, así como para los objetivos, las preguntas o las

740
hipótesis específicos. El análisis de la calidad y las relaciones lógicas
entre los pasos del estudio permitirá determinar qué pasos son los
puntos fuertes y cuáles son los puntos débiles.
Las preguntas del cuadro 12.2 ayudan a analizar los puntos
fuertes y débiles de los pasos del proceso de investigación, así como
las relaciones lógicas entre estos pasos. En particular, se realiza una
valoración crítica del resumen, el problema, el propósito, la revisión
de la literatura, el marco, la metodología, los resultados y la
discusión. Se deben leer las preguntas y después realizar juicios
sobre los pasos del estudio (v. cuadro 12.2). Se deben justificar las
decisiones y documentarlas utilizando las fuentes de investigación
pertinentes, como las que se han enumerado antes en esta sección y
en la bibliografía al final de este capítulo. Por ejemplo, se podría
decidir que el propósito del estudio es un punto fuerte porque
aborda el problema que se desea estudiar, aclara el foco del estudio
y es posible investigarlo (Fawcett y Garity, 2009; Gray y cols., 2017;
O’Mathúna y Fineout-Overholt, 2015).

Paso 3: evaluación de la credibilidad y del


significado de los hallazgos del estudio
La evaluación de la credibilidad y del significado de los hallazgos
del estudio implica determinar la validez, la relevancia y el
significado del estudio analizando las relaciones entre los pasos del
estudio, sus hallazgos y los estudios previos. Los pasos del estudio
se evalúan a la luz de los estudios anteriores, como la evaluación de
las hipótesis, el diseño y los métodos de medición de las variables
actuales basados en hipótesis, diseños y métodos de medición
previos (Waltz y cols., 2017). Los hallazgos del estudio actual
también se analizan a la luz de los hallazgos de estudios anteriores.
La evaluación se basa en las conclusiones alcanzadas durante las
dos primeras fases de la valoración crítica, por lo que pueden
determinarse la credibilidad, la validez y el significado de los
hallazgos del estudio.
Es necesario volver a analizar las secciones de los hallazgos, las
conclusiones y las implicaciones del estudio, así como las
sugerencias de los investigadores para realizar más estudios. Se
debe utilizar la sección de credibilidad y significado de la guía de

741
valoración crítica presentada en el cuadro 12.2 como guía para
resumir la evaluación.

EJEMPLO DE UNA VALORACIÓN


CRÍTICA DE UN ESTUDIO
CUANTITATIVO
Se realizó una valoración crítica del estudio cuasiexperimental de
Whitaker-Brown, Woods, Cornelius, Southard y Gulati (2017), que
se presenta como ejemplo en esta sección. El informe de
investigación, «Improving quality of life and decreasing
readmissions in heart failure patients in a multidisciplinary
transition-to-care clinic», se incluye en esta sección. Después de este
estudio, se muestran los tres pasos para valorar críticamente un
estudio cuantitativo:

• Paso 1: identificación de los pasos del proceso de


investigación.
• Paso 2: determinación de los puntos fuertes y los puntos
débiles del estudio.
• Paso 3: evaluación de la credibilidad y del significado de los
hallazgos del estudio.

Los estudiantes y profesionales de enfermería en ejercicio suelen


realizar valoraciones críticas que se centran en la identificación de
los pasos del proceso de investigación en un estudio. Este tipo de
valoración crítica puede escribirse en formato de esquema, con
encabezamientos que identifican los pasos del proceso de
investigación. En una valoración más profunda no solo se incluye
este paso, sino que también se determinan los puntos fuertes y
débiles del estudio y se evalúan la credibilidad y el significado de
los hallazgos. Se recomienda la lectura del estudio de Whitaker-
Brown y cols. (2017) en el Ejemplo de investigación 12.1 y la
realización de una valoración crítica exhaustiva utilizando las guías
que se muestran en el cuadro 12.2. Cada lector puede comparar sus
ideas con las que se ofrecen en esta sección. Los números utilizados
en esta crítica de ejemplo corresponden a los de las guías de

742
valoración crítica (v. cuadro 12.2).

EJEMPLO DE INVESTIGACIÓN 12.1


Estudio cuantitativo

743
744
745
746
747
748
Valoración crítica

Paso 1: identificación de los pasos del proceso de


investigación en el estudio; y Paso 2:
determinación de los puntos fuertes y débiles del
estudio
1. Calidad de redacción: de forma global, la
calidad de redacción era adecuada. Las

749
mejoras del flujo de redacción y el uso de
un mayor detalle en algunas secciones
fomentarán la claridad. Además, ciertos
términos clave, como calidad de vida,
deberían haberse definido claramente al
comienzo del estudio.
2. Título: el título «Mejora de la calidad de vida
y disminución de los reingresos en pacientes
con insuficiencia cardiaca en una clínica
multidisciplinar de cuidados transicionales»
identificó la población de pacientes y las
variables clave: calidad de vida y
reingresos. El título puede hacer que se
interprete por error que el centro de
cuidados transicionales es el entorno del
estudio, cuando en realidad es la
intervención. El tipo de estudio realizado
no se mencionó en el título, pero podría
inferirse que fue de tipo
cuasiexperimental.
3. Autores: la Dra. Whitaker-Brown es una
enfermera de familia con un doctorado en
práctica enfermera que tiene experiencia
tanto clínica como de investigación en el
área de la insuficiencia cardiaca
(University of North Carolina en
Charlotte, 2017). Las Dras. Woods y
Cornelius, dos de las coautoras, son
enfermeras con título de doctorado que
son profesoras de universidad. Whitaker-

750
Brown y cols. (2017) identificaron sus
fuentes de financiación en la sección de
agradecimientos, pero no indicaron
explícitamente si tenían algún conflicto de
intereses en relación con el estudio.
4. Resumen: el resumen del estudio estaba
escrito claramente e incluyó el problema,
propósito, diseño, tamaño muestral,
resultados significativos y conclusiones
del estudio.
5. Problema de investigación: a partir de la
literatura comentada, el problema de
investigación pudo inferirse como: los
estudios publicados no han analizado «la
viabilidad y el impacto de un programa
de cuidados transicionales de 4 semanas
sobre la calidad de vida en pacientes con
IC» (Whitaker-Brown y cols., 2017, pág.
80). Las investigadoras proporcionaron
evidencia de que el problema fue
significativo para la enfermería al
comentar la carga de la IC y los problemas
de la transición al domicilio después de la
hospitalización, incluido el riesgo de
reingreso.
6. Propósito: las investigadoras indicaron
con claridad el propósito en los objetivos
del resumen y al final de la revisión de la
literatura. «El propósito de este estudio
fue analizar la viabilidad y los efectos de

751
un programa de cuidados transicionales
de 4 semanas sobre la calidad de vida en
pacientes con IC» (Whitaker-Browny y
cols., 2017, pág. 80). El propósito
restringió y aclaró el foco del estudio
(Creswell, 2014; O’Mathúna y Fineout-
Overholt, 2015). El propósito se vio
respaldado por la revisión de la literatura
y se relacionó lógicamente por el diseño
de investigación.
7. Revisión de la literatura: se presentó una
revisión mínima de la literatura en la
sección de introducción del informe de
investigación. La mayoría de las
referencias citadas por Whitaker-Brown y
cols. (2017) fueron fuentes primarias
revisadas por pares. La actualidad de las
fuentes citadas fue un punto débil de la
revisión de la literatura. Las
investigadoras citaron cuatro referencias
con la fecha de acceso, pero no las fechas
de la fuente real, por lo que no pudo
evaluarse su actualidad. Del resto de 45
fuentes, solo ocho (18%) se publicaron en
los 5 años previos a la publicación de este
estudio y 28 (62%) se publicaron en los 10
años previos. Algunas de las fuentes más
antiguas correspondieron a los métodos
de medición, la fidelidad de la
intervención y la patología de la IC. Las

752
fuentes citadas eran apropiadas para las
variables del estudio y procedían sobre
todo de las disciplinas de la medicina y la
enfermería. Las investigadoras
describieron la literatura sobre la carga de
la IC, que respalda la intervención y
proporciona una base para realizar este
estudio. Un resumen final de lo que se
sabía y no se sabía sobre el problema
estudiado habría añadido claridad a la
revisión de la literatura (Gray y cols.,
2017).
8. Marco o perspectiva teórica: Whitaker-
Brown y cols. (2017) no indicaron de
forma explícita el marco usado para su
estudio. El modelo de cuidados
transicionales fue el marco que guio el
desarrollo de la intervención. Un
diagrama detallado del modelo, tal y
como se aplicó a esta población de
pacientes, se mostró en la figura 1 (en el
artículo de Whitaker-Brown y cols.
[2017]). Las investigadoras aparentemente
usaron una versión modificada del
modelo de cuidados transicionales para
guiar su estudio. Una identificación más
clara del marco del estudio habría
permitido realizar una valoración crítica
de la idoneidad de la teoría del estudio.
9. Objetivos, preguntas o hipótesis de la

753
investigación: las investigadoras
plantearon la siguiente hipótesis para
dirigir su estudio: «prevemos que una
intervención intensiva, individualizada y
limitada en el tiempo puede mejorar la
calidad de vida en los pacientes con IC»
(Whitaker-Brown y cols., 2017). Un
estudio cuasiexperimental para evaluar la
eficacia de una intervención debería
guiarse por una hipótesis (Shadish, Cook
y Campbell, 2002). Sin embargo, esta
hipótesis no tenía una relación clara con el
marco del estudio (Smith y Liehr, 2014).
10. Variables: Whitaker-Brown y cols. (2017)
presentaron variables demográficas,
independientes y dependientes. Las
variables demográficas de la edad, el sexo,
la raza, el estado civil y la incidencia de IC
sistólica y diastólica se describieron en la
tabla 12.3 y en la sección de resultados.

TABLA 12.3
Estrategias de medición

KCCQ, Kansas City Cardiomyopathy Questionnaire.

754
La variable independiente (intervención de
cuidados transicionales) se definió
conceptualmente por el modelo Heart
Success Transition Model mostrado en la
figura 1 de su estudio (Whitaker-Brown y
cols., 2017, pág.81). La definición
operacional de la variable independiente
fue un «programa transicional
multidisciplinar de 4 semanas… diseñado
específicamente para proporcionar
enseñanza semanal y apoyo a los pacientes
con IC» (Whitaker-Brown y cols., 2017, pág.
80).
La calidad de vida (CV) relacionada con la
salud es la principal variable dependiente,
pero Whitaker-Brown y cols. (2017) no
indicaron su definición conceptual para
esta variable. El término calidad de vida se
usó en la revisión de la literatura, pero no
se definió con claridad. La definición
operacional de la medición de la CV se
describió con claridad: «La calidad de vida
(CV) relacionada con la salud se evaluó
utilizando el cuestionario Minnesota Living
with Heart Failure Questionnaire
(MLHFQ), una escala de Likert de 21 ítems
y 6 puntos que reflejó las formas más
frecuentes e importantes en las que la IC
afecta a las vidas de los pacientes»
(Whitaker-Brown y cols., 2017, pág. 81). Las

755
definiciones operacionales se relacionaron
con la metodología del estudio.
11. Diseño de investigación: el diseño de
investigación se identificó claramente como
«un diseño prospectivo de un grupo pretest
y postest» (Whitaker-Brown y cols., 2017,
pág. 80). En este tipo de diseño
cuasiexperimental, los sujetos actúan como
su propio control. Se trata de un diseño
débil, porque solo había un grupo y no
existía un grupo de comparación distinto
para determinar si el tratamiento fue eficaz
o si el cambio del pretest al postest se debía
a variables externas (Gray y cols., 2017;
Shadish y cols., 2002).
La intervención de cuidados transicionales
de 4 semanas fue apropiada para analizar
el propósito del estudio y comprobar la
hipótesis causal. La intervención completa
era muy representativa de la práctica
clínica (v. fig. 1 del estudio de Whitaker-
Brown y cols. [2017]). Las investigadoras
definieron con claridad el programa
transicional para apoyar a los pacientes con
IC. Sin embargo, debían proporcionar más
detalles sobre el modo en el que se
implementó el tratamiento, incluida la
transparencia sobre el número de
profesionales y sus características (Gray y
cols., 2017).

756
Whitaker-Brown y cols. (2017, pág. 81)
implementaron un protocolo para
garantizar la fidelidad de la intervención y
proporcionaron una descripción detallada
de los procedimientos del estudio. «Una
formación estandarizada fue importante
para mantener la fidelidad al tratamiento…
Además, los profesionales tenían
conocimientos de cardiología y utilizaron
un algoritmo estandarizado para el manejo
de la IC, incluido el manejo de los
fármacos. La disparidad en lo referente a
las habilidades de los profesionales se
minimizó mediante reuniones semanales
para actualizar sus conocimientos»
(Whitaker-Brown y cols., 2017, pág. 82).
Debido a que el tratamiento se implementó
por más de una persona, debía abordarse la
formación para fomentar la congruencia a
la hora de administrar el tratamiento
(Eymard y Altmiller, 2016). Como se ha
descrito previamente, no se indicaron las
características de los profesionales y las
variaciones de los resultados podrían haber
estado relacionadas con tener un
profesional con 20 años de experiencia
frente a otro con 1 año de experiencia, o un
profesional con competencia medible en un
área específica frente a otro sin esa
competencia.

757
Las investigadoras monitorizaron la
congruencia de la intervención, como lo
indica la siguiente cita: «Las estrategias de
fidelidad al tratamiento para monitorizar y
mejorar la recepción de tratamiento
consistieron en garantizar la comprensión
del paciente demostrada por tareas
semanales del paciente de elaborar un
diario de peso y presión arterial, la
verbalización del proceso y los síntomas de
enfermedad, así como la articulación de la
comprensión del régimen de tratamiento
(Whitaker-Brown y cols., 2017, pág. 82). La
congruencia es particularmente importante
en caso de intervención compleja, porque
cualquier desviación del plan de
tratamiento o de la interacción de los
cuidados puede afectar a los resultados del
estudio (Eymard y Altmiller, 2016;
Moorhead y cols., 2013).
Este estudio tenía un solo grupo de 50
participantes que actuaron como su propio
control (Gray y cols., 2017). Esto significa
que los participantes cumplimentaron la
escala MLHFQ en el pretest y después
participaron en la intervención de cuidados
transicionales durante 4 semanas, seguido
del postest con la escala MLHFQ. Por tanto,
el pretest se consideró el control y se realizó
el postest para determinar el efecto del

758
tratamiento. Las puntuaciones pretest se
compararon con las puntuaciones postest
para determinar el efecto de la
intervención.
Este estudio tuvo muchos puntos fuertes en
su diseño, como la calidad del desarrollo e
implementación de la intervención, la
fiabilidad del MLHFQ y un tamaño
muestral adecuado. Sin embargo, también
se observaron amenazas a la validez del
diseño, como la falta de un grupo de
comparación, la ausencia de muestra o de
asignación aleatoria a los grupos, el uso de
un único método de medición para la CV
relacionada con la salud y un abandono de
la muestra elevado. Sin embargo, este
estudio piloto proporcionó información
que podría utilizarse para fortalecer el
diseño y la viabilidad de estudios futuros.
12. Muestra: una muestra no probabilística de
conveniencia «se reclutó en un sistema
sanitario principal del sur de EE.UU.»
(Whitaker-Brown y cols., 2017, pág. 80).
Cuando se utiliza una muestra no
probabilística frente a otra aleatoria, la
posibilidad de error de muestreo es mayor.
Los «criterios de inclusión en la muestra
fueron una edad a partir de 45 años, sexo
masculino o femenino, no estar
embarazada y tener un diagnóstico

759
principal de IC» (Whitaker-Brown y cols.,
2017, pág. 80). Los criterios de exclusión del
estudio fueron «una edad de 44 años o
menor, mujeres embarazadas y diagnóstico
primario distinto a IC» (Whitaker-Brown y
cols., 2017, pág. 80). Los investigadores
proporcionaron unos criterios de inclusión
en la muestra apropiados, pero los criterios
de exclusión repitieron los criterios de
inclusión y no limitaron los posibles efectos
de variables externas ni mejoraron la
representatividad de la muestra (Aberson,
2010).
El tamaño muestral fue pequeño para este
estudio (n = 50), pero fue apropiado para
un estudio piloto. El estudio tuvo una tasa
de abandono elevada (28%) y 14 sujetos
dejaron el estudio antes de las 4 semanas
necesarias para completar el tratamiento.
Solo 36 (72%) de los participantes
completaron el estudio. Los investigadores
proporcionaron una justificación breve de
los motivos por los que los participantes no
completaron el estudio, pero no analizaron
las características de quienes lo
completaron respecto a los que no lo
hicieron. El análisis de esas características
mediante entrevistas al abandonar el
estudio podría haber ayudado a los
investigadores a hacer que la intervención

760
fuese más aceptable a esta población diana
en investigaciones futuras.
No se mencionó ningún análisis de la
potencia para determinar el tamaño
muestral adecuado para el estudio
(Aberson, 2010). Sin embargo, los
resultados del estudio fueron significativos,
lo que indica que la muestra tenía una
potencia adecuada y no hubo error de tipo
II (Gray y cols., 2017).
La población diana se determinó por los
criterios de inclusión de la muestra, y la
población accesible fue evidente a partir de
la discusión del entorno del estudio.
Whitaker-Brown y cols. (2017)
proporcionaron una información
demográfica mínima en la tabla 12.3, que
incluyó el sexo, la raza, el estado civil y el
tipo de IC de los participantes en el estudio.
El número de varones y mujeres que
participaron en el estudio fue
aproximadamente igual, pero la muestra
carecía de diversidad racial y étnica,
porque el 83% de los sujetos eran de raza
blanca.
Whitaker-Brown y cols. (2017, pág. 81)
señalaron que «el investigador principal
obtuvo el consentimiento informado», pero
no se describió el proceso de dicho
consentimiento.

761
13. Entorno: el entorno fue una clínica de
transición ambulatoria multidisciplinar
para pacientes con IC, que fue apropiado
para el estudio. La muestra se reclutó de un
sistema sanitario del sur de Estados
Unidos, localizado en Charlotte, Carolina
del Norte.
14. Medición:
Esta tabla se centra en la variable
dependiente CV relacionada con la salud.
El cuestionario MLHFQ, utilizado para
medir dicha variable dependiente, se
describió con claridad y era apropiado. El
MLHFQ se considera una estrategia de
medición sólida para la CV relacionada con
la salud y se ha utilizado en otros muchos
estudios a lo largo de los años (v. tabla 12.3;
Kelkar y cols., 2016). La puntuación del
MLHFQ se describió con claridad y las
puntuaciones podrían oscilar entre 0 y 105.
También indicaron el significado de las
distintas puntuaciones, señalando que «las
puntuaciones menores indican una mejor
calidad de vida» (Whitaker-Brown y cols.,
2017, pág. 81). No se proporcionaron las
técnicas para cumplimentar el MLHFQ. Los
α de Cronbach fueron sólidos y
respaldaron la fiabilidad de la consistencia
interna del MLHFQ en este estudio (Waltz
y cols., 2017).

762
15. Recogida de datos: de forma global, la
recogida de datos se podría haber descrito
con más detalle. Whitaker-Brown y cols.
(2017) no indicaron de forma específica
quién recogió los datos y cuántas personas
actuaron en dicha recogida. La información
proporcionada sugirió que los mismos
profesionales que implementaron la
intervención también podrían haber
recogido los datos, lo que podría introducir
sesgos. Debido a que más de una persona
recogió los datos, debería haberse
abordado la fiabilidad o congruencia del
proceso de recogida de datos (Gray y cols.,
2017; Eymard y Altmiller, 2016). Se
mencionó la formación sobre el MLHFQ,
pero se proporcionó poca información
sobre ese proceso. Además, no se indicaron
las técnicas específicas para la
estandarización de la recogida de datos.
Aparentemente, esta recogida fue ética. El
estudio fue aprobado por un comité de
revisión institucional (CRI) del centro
clínico y «el investigador principal obtuvo
el consentimiento informado» (Whitaker-
Brown y cols., 2017, pág. 80-81). Se debía
obtener la aprobación del CRI antes del
inicio del estudio, pero el momento de la
aprobación por el CRI no se especificó.
Habría sido útil mencionar más

763
información sobre las garantías para los
sujetos humanos durante la recogida de
datos. Sin embargo, los investigadores no
comunicaron ningún evento adverso
durante esta recogida.
16. Análisis de los datos: las técnicas
estadísticas utilizadas para analizar los
datos de las puntuaciones del MLHFQ se
identificaron con claridad y fueron
apropiadas (tabla 12.4). Se utilizó el
Statistical Package for the Social Sciences,
versión Windows, para realizar los análisis
estadísticos. Los análisis de los datos
abordaron el propósito y la hipótesis de la
investigación. La hipótesis causal de la
investigación fue respaldada por los
resultados de la prueba t, lo que indicó que
se rechazó la hipótesis nula (Grove y
Cipher, 2017). Las técnicas de análisis
(descriptiva e inferencial) fueron
apropiadas para el nivel de medición de las
variables (Grove y Cipher, 2017; Plichta y
Kelvin, 2013). Solo los 36 participantes que
completaron el estudio fueron incluidos en
los análisis. Whitaker-Brown y cols. (2017)
no indicaron de forma explícita el nivel de
significación, pero se asume que es α ≤0,05
porque los valores de p ≤0,05 y p ≤0,0001 se
describieron como significativos. Los
resultados de las puntuaciones totales, la

764
dimensión física y la dimensión emocional
del MLHFQ en el momento basal y a las 4
semanas de seguimiento se presentaron de
forma clara y concisa en la tabla 12.4 y en el
texto del estudio.

TABLA 12.4
Análisis estadísticos y resultados

Paso 3: evaluación de la credibilidad y significado


de los hallazgos del estudio
17. Interpretación de los hallazgos: los
hallazgos fueron los esperados y la
relevancia estadística y clínica de los
hallazgos se abordó con claridad (Grove y
Cipher, 2017; Hoare y Hoe, 2013). Los
hallazgos fueron congruentes con los

765
resultados del estudio y con las
investigaciones previas. El estudio se
habría reforzado si los hallazgos se
hubiesen relacionado con el modelo Heart
Success Transition Model (v. fig. 1 del
estudio de Whitaker-Brown y cols. [2017]).
Los investigadores identificaron las
limitaciones del estudio y proporcionaron
ideas específicas y relevantes para que los
estudios futuros superasen las limitaciones
de su estudio. Se recomendó un diseño de
ensayo clínico aleatorizado, que habría
aumentado en gran medida la calidad del
estudio y la credibilidad de los hallazgos
(Mittlbock, 2008). Los investigadores no
hicieron recomendaciones para la práctica
de enfermería, pero se centraron en la
necesidad de investigaciones adicionales
antes de realizar cambios en la práctica.
18. Limitaciones: Whitaker-Brown y cols.
(2017, pág. 83) identificaron las siguientes
limitaciones en su estudio:
Este estudio se vio limitado por el seguimiento a
corto plazo (4 semanas) y careció de un grupo
control; por tanto, no fuimos capaces de
analizar resultados a más largo plazo ni de
afirmar definitivamente que los cambios
positivos fuesen causados por la intervención.
Además, nuestra muestra consistió en un grupo
pequeño de una localización geográfica y los

766
resultados no se pueden generalizar a otras
áreas geográficas.
La alta tasa de abandono de este estudio
también fue una limitación que podría
haber alterado sus hallazgos y puede
revelar problemas de aceptabilidad de la
intervención en la población del estudio.
19. Conclusiones: en resumen, «los hallazgos
de este estudio respaldan la viabilidad de
un programa multidisciplinar de cuidados
transicionales de 4 semanas para pacientes
con IC con el fin de aumentar la calidad de
vida y disminuir los reingresos a los 30
días» (Whitaker-Brown y cols., 2017, pág.
83). Las conclusiones coincidieron con los
hallazgos del estudio y fueron congruentes
con las investigaciones previas. Whitaker-
Brown y cols. (2017, pág. 83) indicaron
apropiadamente que «nuestra muestra
consistió en un grupo pequeño de una
localización geográfica y los resultados no
se pueden generalizar a otras áreas
geográficas… Por tanto, los resultados de
este estudio se tienen que interpretar con
cautela».
20. Implicaciones para enfermería: Whitaker-
Brown y cols. (2017, pág. 83) no incluyeron
una sección sobre las implicaciones para
enfermería, pero relacionaron los
resultados con los cuidados del paciente en

767
las secciones de discusión y conclusiones.
«A pesar de estas limitaciones, los
hallazgos de este estudio respaldan la
viabilidad de un programa de cuidados
transicionales multidisciplinar de 4
semanas después de la hospitalización para
los pacientes con IC y el posible impacto
que este tipo de programas puede tener
sobre la calidad de vida y los reingresos
hospitalarios.»
21. Investigaciones futuras: Whitaker-Brown
y cols. (2017) proporcionaron sugerencias
detalladas para investigaciones futuras que
se basaron en su estudio actual. «Se
necesitan investigaciones futuras con un
tamaño muestral más grande, un diseño
aleatorizado y con control del efecto de las
enfermedades concurrentes y de afecciones
crónicas como la EPOC (enfermedad
pulmonar obstructiva crónica), la clase
funcional, la duración del tiempo con IC (p.
ej., primer episodio frente a uno de
muchos) y la depresión sobre los resultados
del estudio» (Whitaker-Brown y cols., 2017,
pág. 83). Los investigadores también
comentaron la importancia de abordar las
variables de confusión, la retención y el
coste en estudios futuros. En algunas
secciones se ofreció un gran detalle, como
en las referentes a la viabilidad y la

768
fidelidad al tratamiento. Otras partes del
informe de investigación carecían de
suficiente detalle para permitir una
replicación del estudio. Este estudio se
pudo realizar en términos de experiencia
de los investigadores, disponibilidad de
participantes en el estudio y problemas
éticos.
22. Resumen crítico: el estudio de Whitaker-
Brown y cols. (2017) tenía varios puntos
fuertes, como la medición de la CV, con el
MLHFQ, el modelo de la intervención
terapéutica y la sección detallada sobre la
fidelidad al tratamiento (Gray y cols., 2017;
Kelkar y cols., 2016). Los hallazgos de este
estudio eran concordantes con los de
investigadores previos y aumentaron
nuestra compresión de la relación entre los
cuidados transicionales en pacientes con IC
y la CV. Debido al pequeño tamaño
muestral y a otras limitaciones del estudio,
los investigadores no recomendaron
generalizar los hallazgos de la muestra a las
poblaciones accesible o diana. Whitaker-
Brown y cols. (2017) proporcionaron unas
orientaciones detalladas y excelentes para
futuros estudios. No recomendaron el uso
de los hallazgos en la práctica en este
momento, pero subrayaron la importancia
de esta área para investigaciones futuras.

769
COMPRENSIÓN DEL PROCESO DE
VALORACIÓN CRÍTICA DE
INVESTIGACIONES CUALITATIVAS
Los profesionales de enfermería en todas las fases y los campos de
la práctica necesitan experiencia en la valoración crítica de los
estudios cualitativos y cuantitativos. Aunque la valoración crítica
requiere un enfoque diferente para estos dos tipos de estudios
(Sandelowski, 2008), en ambos casos tiene un propósito común:
determinar el rigor con que se aplicaron los métodos y el grado de
confianza de las conclusiones. La valoración crítica de los estudios
cualitativos se centra en cómo la integridad del diseño y los
métodos afectan a la credibilidad y el significado de los resultados y
su utilidad en la práctica clínica (Roller y Lavrakas, 2015). Se han
utilizado diferentes criterios para valorar críticamente los estudios
cualitativos (Burns, 1989; Clissett, 2008; Cohen y Crabtree, 2008;
Morse, 1991; Schoe, Høstrop, Lyngsø, Larsen y Poulsen, 2011). Se
han incluido una serie de criterios sintetizados a partir de los
publicados y se han organizado en tres grandes pasos similares a
los utilizados para la valoración crítica de los estudios cuantitativos.
Por tanto, el proceso de valoración crítica de investigaciones
cualitativas consiste en: 1) la identificación de los componentes del
proceso de investigación cualitativa en los estudios, 2) la
determinación de los puntos fuertes y débiles del estudio y 3) la
evaluación de la confianza y el significado de los hallazgos del
estudio.
Cada paso contiene las preguntas que deben abordarse para
reflejar la orientación filosófica de la investigación cualitativa. Estos
tres pasos se presentan juntos en una guía única para la valoración
crítica en el cuadro 12.3. La guía proporciona preguntas relevantes
para cada paso. Estas preguntas se han seleccionado como una
forma para estimular el razonamiento lógico y el análisis necesario
para efectuar una valoración crítica de un estudio. Una persona con
experiencia en la valoración crítica, suele realizar dos o tres pasos
de este proceso simultáneamente.

CUADRO 12.3 GUÍAS DE VALORACIÓN

770
CRÍTICA
Estudio cualitativo

Paso 1: identificación de los pasos del proceso de


investigación en los estudios; y Paso 2:
determinación de los puntos fuertes y débiles del
estudio
1. Calidad de redacción
a. ¿El estilo de redacción del
informe es claro y conciso y se
han definido los términos
relevantes?
2. Título
a. ¿Cuál es el título?
b. ¿El título tiene un enfoque claro
e incluye el foco y la población
del estudio? ¿El título indica el
tipo de estudio realizado
(fenomenología, teoría
fundamentada, cualitativo
exploratorio-descriptivo y
etnografía) (Creswell y Poth,
2018; Powers, 2015)?
3. Autores
a. ¿Los autores tienen acreditación,
como un título de doctorado,
que les cualifique para realizar
el estudio?
b. ¿Los autores tienen experiencia
previa de investigación o clínica
que les cualifique para realizar

771
el estudio?
c. ¿Alguno de los autores tiene un
conflicto de intereses, como un
interés económico relacionado
con el estudio?
4. Resumen
a. ¿Se ha presentado el resumen
con claridad?
b. ¿El resumen incluye el
propósito, la metodología
cualitativa específica, la muestra
y los resultados clave?
5. Problema de investigación
a. ¿Se ha proporcionado una
declaración del problema? Si no
se ha proporcionado una
declaración del problema, ¿se
puede inferir el problema o la
laguna del conocimiento de
enfermería a partir de la
introducción y la revisión de la
literatura?
b. ¿Es el problema significativo
para la enfermería y la práctica
clínica (Cohen y Crabtree,
2008)?
6. Propósito
a. Se debe indicar el propósito.
b. ¿El propósito restringe y aclara
el foco del estudio (Creswell,

772
2014; Fawcett y Garity, 2009)?
7. Revisión de la literatura
a. ¿Son la mayoría de las
referencias fuentes primarias
revisadas por pares? ¿Los
autores justifican las referencias
que no son fuentes primarias
revisadas por pares?
b. ¿Son las referencias actuales
(número y porcentaje de fuentes
publicadas en los últimos 5 y 10
años)? ¿Las referencias más
antiguas de 10 años son fuentes
de medición o teóricas, o bien
estudios de referencia, iniciales
o de replicación?
c. ¿El contenido se relaciona
directamente con los conceptos
del estudio? ¿Los tipos de
fuentes y disciplinas de los
autores de la fuente son
apropiados para los conceptos
del estudio?
d. ¿Se ha realizado una valoración
crítica y síntesis de los estudios
(Fawcett y Garity, 2009; Gray y
cols., 2017; Hart, 2009)? ¿Se trata
de un resumen, presentado de
forma clara y concisa, del
conocimiento empírico y teórico

773
actual del área de estudio,
incluyendo la identificación de
aquello que se sabe y se
desconoce (Gray y cols., 2017)?
8. Orientación filosófica o marco del estudio
a. ¿Se identificó la orientación
filosófica del enfoque
cualitativo? ¿Se citó una fuente
primaria para la filosofía
(Creswell y Poth, 2018; Gray y
cols., 2017; Munhall, 2012)?
b. Si se usó un marco, ¿se reflejan
sus conceptos principales en las
preguntas planteadas durante la
recogida de datos y en los
hallazgos?
c. Teoría fundamentada
i. ¿El investigador
desarrolló una
descripción teórica
o diagrama como
parte de los
hallazgos del
estudio (Creswell y
Poth, 2018)?
ii. Si se desarrolló un
marco a partir de
los hallazgos
(estudio de teoría
fundamentada),

774
¿tiene una relación
clara con los
hallazgos del
estudio?
9. Objetivos (fines) o preguntas de
investigación:
a. ¿Los objetivos (fines) o
preguntas se identificaron y se
presentaron con claridad?
b. Se deben enumerar los objetivos
(fines) o preguntas de
investigación proporcionados, si
se han identificado.
c. ¿Los objetivos o preguntas se
relacionan con el propósito del
estudio?
10. Enfoque cualitativo (v. cap. 3)
a. Hay que identificar el enfoque
cualitativo utilizado:
fenomenología, teoría
fundamentada, etnografía,
exploratorio-descriptivo o
enfoque cualitativo no
especificado.
b. Enfoque cualitativo específico no
identificado.
i. ¿Qué aspectos del
método, como los
entornos naturales o
la codificación,

775
indican que se usó
un enfoque
cualitativo (Creswell
y Poth, 2018; Hall y
Roussel, 2017;
Munhall, 2012)?
ii. ¿El investigador
proporcionó un
fundamento de por
qué se realizó un
estudio cualitativo
(Creswell, 2014; Gray
y cols., 2017)?
c. ¿Los investigadores seleccionaron
un enfoque cualitativo que
produjo datos para cumplir los
objetivos o responder a las
preguntas de investigación?
11. Muestra (v. cap. 9)
a. ¿El plan de muestreo es adecuado
para abordar el propósito del
estudio?
i. Si se utiliza el
muestreo
intencional, ¿el
investigador
proporciona un
motivo para el
proceso de selección
de la muestra?

776
ii. Si se utiliza el
muestreo por redes o
en bola de nieve, ¿el
investigador ha
identificado las redes
utilizadas para
obtener la muestra y
proporciona una
justificación para su
selección?
iii. Si se utiliza el muestreo
teórico, ¿el investigador
indica cómo se seleccionaron
los participantes para
favorecer la elaboración de
una teoría?
b. ¿Se identifican los criterios de
muestreo y son apropiados para
el estudio?
c. Si los participantes potenciales
rechazaron participar o no
completaron el estudio,
¿reconoció el investigador estos
problemas como limitaciones?
d. ¿El investigador analiza la
calidad de los datos facilitados
por los participantes del estudio?
e. ¿Estaban los participantes
organizados, bien informados y
dispuestos a compartir la

777
información relevante para el
tema del estudio?
f. ¿El proceso de muestreo produjo
la saturación y la verificación de
datos en el área de estudio?
g. ¿Es el tamaño de la muestra
adecuado para el ámbito, la
naturaleza del tema, la calidad de
los datos y el diseño del estudio?
h. ¿Cómo se obtuvo el
consentimiento informado?
i. ¿El proceso usado para el
consentimiento informado fue
apropiado para la población del
estudio?
12. Entorno
a. ¿Cuál es el entorno del estudio?
b. ¿Es el entorno apropiado para el
propósito del estudio?
c. ¿El entorno en el que se
recogieron los datos protegió la
confidencialidad y fomentó la
comodidad de los participantes?
13. Recogida de datos
a. ¿Qué métodos de recogida de
datos se utilizaron: entrevistas,
grupos focales, observación u
otras fuentes?
b. Entrevistas
i. ¿Se realizaron

778
múltiples entrevistas
con la misma
persona o se
recogieron los datos
una vez de cada
participante?
ii. ¿Las preguntas usadas
durante la entrevista
o grupo focal eran
relevantes para los
objetivos o preguntas
de investigación del
estudio (Gray y cols.,
2017; Maxwell,
2013)?
iii. ¿Las entrevistas duraron lo
suficiente para que el
investigador recogiera unas
descripciones sólidas y
exhaustivas de los puntos de
vista de los participantes?
c. Grupo focal
i. ¿El tamaño,
composición y
duración del grupo
focal eran adecuados
para promover la
interacción del grupo
y producir unos
datos fiables?

779
ii. ¿Las preguntas usadas
durante la entrevista
o grupo focal eran
relevantes para los
objetivos o preguntas
de investigación del
estudio (Gray y cols.,
2017; Maxwell,
2013)?
d. Observaciones
i. ¿Se realizaron las
observaciones en
momentos y durante
períodos de
suficiente duración
para recoger datos
abundantes que
permitiesen una
descripción
exhaustiva de la
cultura, entorno o
proceso de interés
(Creswell y Poth,
2018; Wolf, 2012)?
ii. ¿El investigador tomó
notas de campo o
anotaciones en un
diario (Creswell,
2014; Miles,
Huberman y

780
Saldaña, 2014)?
e. ¿Cómo se registraron los datos
durante su recogida?
f. ¿Se obtuvo la aprobación del CRI
antes de la recogida de datos?
g. ¿El investigador identificó que los
participantes podrían haberse
sentido molestos durante la
recogida de datos? En tal caso,
¿qué medidas se aplicaron para
abordar la seguridad y las
necesidades emocionales de los
participantes (Cowles, 1988;
Maxwell, 2013)?
h. ¿La recogida de datos fue ética?
14. Análisis de datos
a. ¿Cómo se prepararon los datos
para el análisis?
b. ¿Cómo se analizaron los datos?
¿El investigador cita un método
específico de análisis y
proporciona una fuente
primaria?
c. ¿Se utilizó un programa de
manejo de datos cualitativos
asistido por ordenador durante el
análisis?
d. ¿Se describieron los procesos de
análisis de datos con la suficiente
exhaustividad para poder

781
evaluar la lógica de las decisiones
del investigador y respaldar el
rigor del estudio?
e. ¿Qué métodos se utilizaron para
aumentar la confianza de los
hallazgos, como verificación de
la exactitud de las
transcripciones, inmersión en los
datos, documentación de un
registro de auditoría (también
denominado registro de las
decisiones que se tomaron
durante la recogida y análisis de
los datos), comprobación de los
miembros, análisis
independiente de una porción de
los datos por otro investigador
(Cohen y Crabtree, 2008; Hall y
Roussel, 2017; Miles y cols., 2014;
Murphy y Yielder, 2010)?
f. ¿Las medidas para aumentar la
confianza del estudio fueron
adecuadas para proporcionar al
lector confianza en los hallazgos
(Cohen y Crabtree, 2008; Mackey,
2012; Wolf, 2012)?
Paso 3: evaluación de la credibilidad y del
significado de los hallazgos del estudio
15. Interpretación de los hallazgos
a. Hay que describir la

782
interpretación que el
investigador hace de los
hallazgos.
b. ¿Los hallazgos estaban
relacionados con citas u
observaciones específicas?
c. ¿El investigador abordó las
variaciones en los hallazgos
mediante características
relevantes de la muestra?
d. ¿Los hallazgos siguen estando
relacionados con el marco del
estudio (si es aplicable)?
e. ¿Los hallazgos son concordantes
con hallazgos de investigaciones
previas (Fawcett y Garity, 2009)?
f. Si los hallazgos fueron
imprevistos, ¿qué explicaciones
se ofrecieron de por qué pudo
ocurrir esto?
16. Limitaciones
a. ¿Qué limitaciones del estudio
identificaron los investigadores?
b. ¿Hubo limitaciones del estudio
que los investigadores no
identificaron?
c. ¿Las limitaciones del estudio
fueron el resultado de factores
que estaban bajo el control de los
investigadores que podrían

783
haberlas evitado o eran factores
externos sobre los que los
investigadores no tenían control
(Powers, 2015)?
17. Conclusiones
a. ¿Qué conclusiones identificaron
los investigadores en función de
su interpretación de los hallazgos
del estudio?
b. ¿Los hallazgos desembocaron de
forma lógica en las conclusiones?
c. ¿Los investigadores identificaron
otros entornos o poblaciones a las
que se podrían transferir o
aplicar los hallazgos?

Paso 1: identificación de los componentes


del proceso de investigación cualitativa en
los estudios
En una valoración crítica cualitativa, al igual que en una crítica
cuantitativa, el primer paso consiste en revisar el resumen, leer el
estudio de principio a fin y destacar o subrayar sus elementos.
Después de releer el artículo, se subrayan los términos que no se
comprendan y se determina su significado utilizando el glosario
que aparece al final de este libro. Después de leer y comprender el
contenido del estudio, se estará preparado para escribir una
valoración crítica inicial.
Para ello, se debe identificar cada elemento del estudio
cualitativo y responder de forma concisa a las guías y preguntas
que aparecen en el cuadro 12.3. El primer paso del proceso de la
valoración crítica proporciona una visión general del estudio.
Cuando se lee el informe con mayor profundidad, hay que
identificar y describir cada uno de los siguientes aspectos del

784
estudio.

Paso 2: determinación de los puntos fuertes


y débiles de los estudios
En este paso, se hacen más evidentes las diferencias de los procesos
de valoración crítica de los estudios cuantitativos y cualitativos. Sin
embargo, el objetivo de la valoración crítica sigue siendo el mismo:
determinar los puntos fuertes y débiles del estudio. Es necesario
conocer los diferentes enfoques cualitativos y los procesos de
obtención de datos para responder a las preguntas durante este
paso. Se puede consultar el capítulo 3 y complementar los
conocimientos con otras fuentes, como otros textos, libros de
referencia y artículos (Creswell y Poth, 2018; Fawcett y Garity, 2009;
Gray y cols., 2017; Miles y cols., 2014; Munhall, 2012; Petty,
Thomson, y Stew, 2012; Powers, 2015; Sandelowski y Barroso,
2007). Los métodos actuales del estudio que se va a evaluar se
comparan con las expectativas de los expertos cualitativos,
incluidos los impulsores originales de diferentes enfoques
cualitativos. Puesto que no todos los expertos están de acuerdo con
todas las «reglas» para aplicar los estudios cualitativos, es
importante utilizar las guías recomendadas por uno de ellos en el
método utilizado por los investigadores en el estudio. Las áreas de
coherencia son los puntos fuertes del estudio, mientras que las
áreas de incoherencia pueden indicar puntos débiles. La persona
que realiza la valoración crítica evalúa todos los aspectos del
estudio cualitativo y hace un juicio de su confianza, que es una
determinación de que un estudio cualitativo es riguroso y de alta
calidad. La confianza o veracidad es el grado en que un estudio
cualitativo es confiable, confirmable o auditable, creíble y
transferible.
Un informe exhaustivo de un estudio cualitativo debe incluir
información adecuada para que el lector pueda evaluar la
confiabilidad y auditabilidad del informe (Murphy y Yielder, 2010),
que son similares a la fiabilidad de los estudios cuantitativos. La
confiabilidad es la documentación de los pasos llevados a cabo y
de las decisiones tomadas durante el análisis. Como ya se mencionó
en el capítulo 3, el registro de los investigadores del proceso de

785
análisis se denomina registro de auditoría. La auditabilidad es el
grado en que otros investigadores pueden revisar el registro de
auditoría y estar de acuerdo en que las conclusiones de los autores
son lógicas (Miles y cols., 2014; Murphy y Yielder, 2010). Cuando se
ha valorado que los resultados de un estudio son auditables y
confiables, tienen más credibilidad. La credibilidad es la confianza
del lector sobre el grado en que los investigadores cualitativos han
generado resultados que reflejan las perspectivas de los
participantes; es similar a la validez en la valoración crítica de los
estudios cuantitativos (Murphy y Yielder, 2010). Petty y cols. (2012)
han explicado que los hallazgos cualitativos no son generalizables,
pero son transferibles o aplicables en otros entornos con
participantes similares.
Se debe valorar el rigor de los métodos de estudio buscando
información sobre el cuidado con que se han recogido los datos y la
minuciosidad con que se han analizado. Las preguntas acerca de
cada componente del estudio centrarán la atención del lector en el
rigor de los métodos y en las relaciones lógicas entre los elementos
del estudio. Estas relaciones son fundamentales para la credibilidad
del estudio (Cohen y Crabtree, 2008; Maxwell, 2013). Por ejemplo:

• ¿El objetivo del estudio es coherente con las preguntas de


investigación?
• ¿El propósito y las preguntas de investigación son
adecuados para abordar el problema de investigación?
• ¿El enfoque cualitativo seleccionado es la mejor manera
para responder a las preguntas de investigación?

Al igual que en la investigación cuantitativa, las contradicciones


lógicas y los métodos aplicados incorrectamente son puntos débiles
frecuentes de los estudios cualitativos. Como la investigación
cualitativa tiene menos reglas, valorar críticamente los estudios
cualitativos puede parecer desalentador. Las preguntas de las guías
críticas del cuadro 12.3 proporcionan una estructura para analizar
los puntos fuertes y débiles de cada aspecto de un estudio
cualitativo. Se deben consultar otras referencias, si es preciso, para
responder a las preguntas.

786
Paso 3: evaluación de la confianza y del
significado de los hallazgos del estudio
El paso final de la valoración crítica de los estudios cualitativos se
basa en la información que se ha identificado y en las conclusiones
que pueden hacerse a partir de los dos primeros pasos del proceso.
La evaluación de la confianza de un estudio consiste en determinar
la credibilidad, la transferibilidad, la confiabilidad y la
auditabilidad de los hallazgos. Aunque estos términos pueden
definirse de forma individual, las estrategias utilizadas por los
investigadores para mejorar la confiabilidad de los hallazgos
afectan directamente a la credibilidad y la auditabilidad de los
hallazgos. Del mismo modo, los hallazgos son transferibles
(aplicables) cuando la muestra se describe exhaustivamente y el
lector tiene confianza en la credibilidad, la confiabilidad y la
auditabilidad de los hallazgos. Las preguntas de las guías críticas
del cuadro 12.3 proporcionan una estructura para evaluar la
confianza y el significado del estudio que se está valorando.

EJEMPLO DE UNA VALORACIÓN


CRÍTICA DE UN ESTUDIO
CUALITATIVO
Gorlin, McAlpine, Garwick y Wieling (2016) realizaron un estudio
cualitativo sobre las experiencias de los familiares de niños con
autismo grave, que se presenta en el Ejemplo de investigación 12.2.
Se realizó una valoración del estudio para demostrar la aplicación
de las guías de valoración crítica en un estudio cualitativo
publicado. Desde aquí se anima a los lectores a realizar una
valoración crítica exhaustiva utilizando las guías presentadas en el
cuadro 12.3 y comparar sus ideas con la valoración crítica
presentada en el Ejemplo de investigación 12.2. Los números
utilizados en esta crítica de ejemplo corresponden a los de las guías
de valoración crítica (v. cuadro 12.3).

787
EJEMPLO DE INVESTIGACIÓN 12.2
Estudio cualitativo

788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
Valoración crítica

Paso 1: identificación de los pasos del proceso de


investigación en el estudio; y Paso 2:
determinación de los puntos fuertes y débiles del
estudio
1. Calidad de redacción: el informe de
investigación detallado fue claro y
conciso, con un hilo conductor lógico. Los
términos relevantes, como autismo, se
definieron con claridad en la sección de
antecedentes.
2. Título: el título «Autismo infantil grave:
experiencia vivida por la familia» indicaba
que el artículo trataba sobre el autismo y
que las familias de niños con autismo
grave eran la población (Gorlin y cols.,
2016, pág. 580). El título no indicó
directamente el tipo de enfoque
cualitativo que se usó, pero se puede
deducir implícitamente que fue la
fenomenología a partir de la frase
«experiencia vivida», que los
investigadores suelen utilizar en el título

806
de los estudios fenomenológicos.
3. Autores: la autora principal, la Dra.
Jocelyn Bessette Gorlin, es una enfermera
con título de doctorado que ejerce como
enfermera pediátrica titulada. El sitio web
de la Saint Catherine University tiene un
registro del trabajo académico de la Dra.
Gorlin, que incluye publicaciones
revisadas por pares sobre temas
relacionados con la enfermería pediátrica
(St. Catherine University, 2017). Las tres
coautoras de la Dra. Gorlin tenían el título
de doctorado y eran profesoras
universitarias. Gorlin y cols. (2016, pág.
596) no declararon conflictos de intereses
en la sección de agradecimientos.
4. Resumen: el resumen incluyó el método
cualitativo. El propósito del estudio y la
laguna de la literatura actual que abordó
el estudio se describieron con claridad. Se
identificaron el tamaño de la muestra y los
métodos de recogida de datos. El resto del
resumen contiene los seis temas
principales y la conclusión principal del
estudio.
5. Problema de investigación: Gorlin y cols.
(2016) expresaron claramente el problema
al afirmar que «Hay poca literatura sobre
las experiencias de las familias cuando un
niño tiene autismo grave a diferencia del

807
autismo más leve e incluye las opiniones
de múltiples familiares» (Gorlin y cols.,
2016, pág. 580).
6. Propósito: el propósito se identificó
claramente. «El fin o propósito de esta
investigación era interpretar el significado
de la experiencia vivida de las familias
que viven con un niño que tiene autismo
grave» (Gorlin y cols., 2016, pág. 582). El
problema fue significativo debido a la
prevalencia de la afección y a las
dificultades de cubrir las necesidades
sanitarias específicas de las familias
afectadas por el autismo grave. Los
objetivos de investigación se relacionaron
claramente con el propósito del estudio
(Creswell y Poth, 2018; Fawcett y Garity,
2009; Maxwell, 2013).
7. Revisión de la literatura: la revisión de la
literatura se identificó claramente con dos
encabezamientos principales,
antecedentes y revisión de la literatura
(Gorlin y cols., 2016, págs. 580-583). La
mayoría de las 39 referencias citadas por
Gorlin y cols. (2016) fueron fuentes
primarias revisadas por pares. De estas 39
referencias, 15 (38%) fueron publicadas en
los 5 años previos y 26 (67%) en los 10
años previos al artículo. Debido a que los
investigadores cualitativos suelen estudiar

808
temas sobre los que existen pocas
investigaciones, no es infrecuente que la
literatura citada sea más antigua. El
contenido de la revisión de la literatura
presentaba una relación directa con los
conceptos del estudio. La información y
los antecedentes sobre el autismo, así
como el método de la fenomenología, se
incluyeron en la revisión, en la que se
incluyeron fuentes de múltiples
disciplinas, como enfermería, psicología,
medicina y terapia ocupacional, que
fueron apropiadas para el estudio. La
revisión multidisciplinaria estaba bien
organizada. Las referencias citadas
apoyaban la necesidad del estudio y la
idoneidad de sus métodos. Gorlin y cols.
(2016) no señalaron los puntos fuertes o
débiles de los estudios revisados. Aunque
se proporcionó poca información acerca
de la calidad de los estudios revisados, los
hallazgos de estudios previos y la
información de otras referencias se
sintetizaron y se compararon entre sí. Se
identificó claramente la laguna en el
conocimiento que aborda el estudio.
8. Orientación filosófica o marco del
estudio: la orientación filosófica del
estudio fue la fenomenología
hermenéutica. Para apoyar este enfoque

809
cualitativo, Gorlin y cols. (2016) citaron
dos libros de van Manen (1997, 2014)
sobre fenomenología. Aunque Max van
Manen es un experto contemporáneo en
fenomenología hermenéutica citado
habitualmente, las investigadoras no
citaron a Heidegger, el creador de la
fenomenología hermenéutica.
9. Objetivos (fines) o preguntas de
investigación: el fin y la pregunta de
investigación se citaron en el último
párrafo de la sección de antecedentes. «El
fin o propósito de esta investigación fue
interpretar el significado de la experiencia
vivida de las familias que viven con un
niño que tiene autismo grave» (Gorlin y
cols., 2016, pág. 582). La pregunta de
investigación se relaciona claramente con
el propósito de la investigación (Creswell
y Poth, 2018). «Se utilizó un enfoque
fenomenológico para plantear la pregunta
del estudio: ¿Qué experiencia vive una
familia que tiene un hijo con autismo
grave?» (Gorlin y cols., 2016, pág. 582).
10. Enfoque cualitativo: la fenomenología
interpretativa fue el enfoque cualitativo
para este estudio. Gorlin y cols. (2016, pág.
583) explicaron en la sección de diseño y
métodos que «el enfoque fenomenológico
de Manen se centra en el significado

810
universal o la esencia del fenómeno que es
transmitido por temas esenciales basados
en las particularidades de la experiencia
vivida (van Manen, 1997, 2014)». Como se
ha mencionado antes, proporcionar
información de Heidegger y citar una
fuente primaria habría fortalecido la
descripción del enfoque cualitativo. El
enfoque cualitativo fue congruente con el
propósito y los objetivos del estudio.
11. Muestra: el plan de muestreo fue
adecuado para abordar el propósito del
estudio:
Se colocaron pósteres de reclutamiento en dos
clínicas urbanas: una era una clínica de autismo
en una gran universidad urbana y la otra era la
consulta de un psiquiatra pediátrico ubicada en
un gran hospital público urbano. El póster
también se colocó en la página de estudios de
investigación del boletín informativo electrónico
de la sociedad local de autismo. Las familias
interesadas en el estudio contactaron con el
investigador por correo electrónico. Se llamó a
las familias para determinar la elegibilidad
basándose en los criterios de inclusión para
participar en el estudio y para organizar una
entrevista en su domicilio. (Gorlin y cols.,
2016, pág. 583).
Los criterios de exclusión no se
mencionaron en el artículo. Sin embargo,

811
los criterios de muestreo se identificaron
con claridad y son apropiados para el
estudio:
Los criterios de inclusión fueron: 1) los
familiares fueron identificados por un
progenitor (que era el cuidador principal). Las
familias podían incluir a individuos que
tuviesen o no relación biológica, pero deben
tener un contacto constante y continuo, así
como cuidar al niño con autismo, 2) la
calificación del autismo como «grave» fue
evaluada por el investigador al pedir al
progenitor que respondiese a preguntas del
Autism Functional Challenge Questionnaire y
se confirmó en consulta, 3) el niño con autismo
vivía en el domicilio y tenía 4-13 años, 4) los
hermanos tenían al menos 6 años y 5) los
participantes hablaban inglés. (Gorlin y cols.,
2016, pág. 583).
Los investigadores no mencionaron si
algún participante rechazó participar o no
completó el estudio. Los participantes
reclutados tenían experiencia con el tema
de investigación y eran útiles como fuentes
de datos. Gorlin y cols. (2016) no refirieron
que se alcanzase la saturación con la
muestra. Sin embargo, la muestra (n = 22)
era adecuada para el diseño del estudio.
«Veintidós familiares individuales de 11
familias participaron en el estudio. Seis

812
familias participaron en las entrevistas
colectivas familiares (con una familia se
realizaron dos entrevistas colectivas), con
un total de 29 entrevistas tras 19 visitas a
domicilio (Gorlin y cols., 2016, pág. 583).
El consentimiento informado se obtuvo
antes de la recogida de datos. El
consentimiento/asentimiento escrito parece
ser apropiado para el nivel educativo de la
población del estudio, porque todos los 22
participantes habían finalizado los estudios
secundarios o superiores. Gorlin y cols.
(2016) no proporcionaron la tasa de rechazo
ni señalaron si se tomaron medidas con
antelación para hacer frente a las
necesidades emocionales de los
participantes en caso de que el tema fuera
molesto para ellos (Cowles, 1988).
12. Entorno: el domicilio de los participantes
fue el entorno del estudio. Este entorno fue
apropiado para el propósito del estudio y
sirvió para proteger la confidencialidad y
favorecer la comodidad de los
participantes.
13. Recogida de datos: los investigadores
solicitaron adecuadamente la aprobación
del CRI y la obtuvieron «en diciembre de
2014. La recogida de datos se realizó de
febrero a junio de 2015. Todos los
participantes otorgaron el

813
consentimiento/asentimiento escrito antes
de cualquier recogida de datos» (Gorlin y
cols., 2016, pág. 583). Sus métodos de
recogida de datos fueron éticos. «Se
utilizaron cinco tipos de datos en este
estudio: cuestionarios demográficos,
entrevistas fenomenológicas no
estructuradas, observaciones
familiares/domiciliarias, notas de campo y
líneas de vida (Gorlin y cols., 2016, pág.
584). El cuestionario familiar proporcionó
información básica «sobre el niño y la
familia.… El cuestionario se administró
antes de la entrevista» (Gorlin y cols., 2016,
pág. 584).
Las entrevistas fenomenológicas no
estructuradas fueron el método de recogida de
datos que proporcionó la mayor parte de la
información y se realizaron con cada uno de los
22 familiares, así como con las seis familias que
se entrevistaron como unidad familiar. La
pregunta básica, «¿Cuál es su experiencia como
familia con un niño con autismo?» se utilizó
para comenzar la conversación y obtener
información sobre la experiencia familiar. Se
plantearon otras preguntas para aclarar la
información… Todas las entrevistas se llevaron
a cabo exclusivamente en los domicilios
familiares. (Gorlin y cols., 2016, pág. 583).
La pregunta principal utilizada en las 29

814
entrevistas fue relevante para el objetivo
del estudio y reflejó estrechamente los
términos de ese objetivo (Gorlin y cols.,
2016). Las entrevistas duraron lo suficiente
según Gorlin y cols. (2016) para obtener
descripciones sólidas y exhaustivas. Las
entrevistas colectivas familiares podrían
haberse denominado grupos focales,
aunque Gorlin y cols. (2016) no utilizaron el
término grupo focal. «Todas las entrevistas
se grabaron en audio y se transcribieron
literalmente en texto escrito. Se comprobó
la exactitud de todas las entrevistas frente a
las grabaciones» (Gorlin y cols., 2016, pág.
584).
Debido a que las entrevistas se realizaron
en los domicilios familiares, los
investigadores pudieron observar el
entorno y las interacciones familiares antes
y después de las entrevistas. Las
observaciones añadieron riqueza a los
datos. Por ejemplo, las observaciones
aumentaron la profundidad al tema «Hacer
frente a dificultades conductuales graves»:
«Durante la entrevista de su madre, el niño
pellizcó mi cara con mucha fuerza. Las
disculpas repetidas de la madre pusieron
de relieve su propia experiencia de
estigma/vergüenza. Observé varios
domicilios que tenían agujeros en las

815
paredes causados porque el niño con
autismo tiraba juguetes u otros objetos»
(Gorlin y cols., 2016, pág. 588).
Otra fuente de datos fueron las notas de
campo. «Se tomaron notas de campo
extensas después de cada entrevista,
observación y durante el proceso de
investigación. Incluyeron tres tipos de
notas: 1) notas analíticas… 2) notas
personales… 3) notas metodológicas»
(Gorlin y cols., 2016, pág. 583). Los
participantes dibujaron las líneas de vida
en «papel de tamaño normal (21,5 × 28 cm)
que tenían una línea horizontal trazada en
la parte inferior. A la izquierda de la línea
estaba escrito ‘Nacimiento del niño’ y a la
derecha ‘Ahora’. En la parte superior del
papel estaba escrito: ‘Por favor, haga un
dibujo que describa las experiencias vitales
de su familia desde antes de que naciera su
hijo con necesidades especiales hasta el
momento actual. Se pueden marcar puntos
por encima y por debajo de la línea, utilizar
dibujos y símbolos, nombres y fechas, o
cualquier cosa que ofrezca una imagen de
la experiencia de su familia’. Se entregaron
lápices de colores al participante para que
los usara (Gorlin y cols., 2016, pág. 584).
14. Análisis de los datos: como se ha indicado
previamente, las entrevistas se convirtieron

816
en un formato escrito mediante una
transcripción literal. La transcripción
escrita se comparó a continuación de nuevo
con la grabación original para garantizar
que fuese correcta. Se utilizó el enfoque de
van Manen (2014) para analizar los datos.
«Esta es una forma de análisis
hermenéutico donde el investigador
interpreta las experiencias para identificar
temas o significados esenciales. El análisis
fenomenológico básico es la reducción, que
se dirige a obtener información sobre las
estructuras de significado (temas
esenciales) de las experiencias
prerreflexivas y reflexionadas» (Gorlin y
cols., 2016, pág. 584). El proceso de análisis
de los datos se describió con la suficiente
exhaustividad para poder evaluar la lógica
de las decisiones de los investigadores y
respaldó el rigor del estudio.
«Se escogió el programa Word de Microsoft
para manejar los datos. Cada miembro
familiar unitario y la unidad familiar
correspondiente se analizó de forma
independiente» (Gorlin y cols., 2016, pág.
584).
Gorlin y cols. (2016, págs. 586-587)
incluyeron una sección en el artículo,
«Rigor o valoración del estudio
fenomenológico», en la que describieron las

817
medidas tomadas para evaluar la confianza
del estudio. Gorlin y cols. (2016, pág. 586)
identificaron los aspectos de la recogida y
análisis de los datos que respaldaron la
«orientación, fuerza, riqueza y
profundidad», que son los cuatro criterios
de calidad propuestos por van Manen
(1997). Las medidas descritas claramente
para aumentar la confianza fueron
adecuadas para proporcionar dicha
confianza en los hallazgos.
Paso 3: evaluación de la credibilidad y significado
de los hallazgos del estudio
15. Interpretación de los hallazgos: Gorlin y
cols. (2016) proporcionaron una
interpretación detallada de los hallazgos,
incluidos los seis temas y subtemas. Los
seis temas identificados por Gorlin y cols.
(2016, pág. 589) fueron «Misterio y
complejidad del autismo grave…Hacer
frente a dificultades conductuales graves…
Hacer frente a dificultades de
comunicación significativas…Experimentar
un estrés grave…Vivir con aislamiento
grave [y] Dependencia fuerte de la familia».
Su interpretación detallada incluía citas
para respaldar cada tema y subtema. Las
citas de los participantes y las líneas de
vida familiares añadieron riqueza a los
datos y eran un reflejo claro de los temas

818
derivados. Por ejemplo, Gorlin y cols.
(2016, págs. 589-590) proporcionaron el
siguiente texto y cita como parte del apoyo
para el tema «Experimentar un estrés
grave»:
Muchas familias describieron sus vidas como
una ‘montaña rusa’ impredecible debido a las
dificultades diarias que experimentaban al
cuidar a su hijo. Un ejemplo de los altibajos de
su experiencia diaria fue la falta de sueño
descrita por todas las familias debido a los
horarios de sueño erráticos del niño y a la
necesidad de mantener la vigilancia observando
al niño durante la noche. Una madre exclamó:
‘¿Cómo cuido de mí misma? ¿Cómo puedo
descansar?… He llegado a un punto en el que
estoy a punto de derrumbarme. No puedo seguir
así 24 horas al día 7 días a la semana. ¡No
puedo hacerlo!’
El punto débil de la interpretación es que
no se abordaron las variaciones de los
hallazgos basándose en las características
de la muestra. Sin embargo, los hallazgos
del estudio se relacionaron claramente con
la investigación previa (Gorlin y cols.,
2016).
16. Limitaciones: las limitaciones del estudio
reconocidas por Gorlin y cols. (2016) se
minimizaron todo lo posible porque la
investigadora utilizó un diseño adecuado

819
de estudio. Gorlin y cols. (2016, pág. 595)
reconocieron que los
…distintos momentos desde el diagnóstico
podrían dar lugar a experiencias familiares muy
diferentes…los tipos de familiares que
participaron en el estudio fueron limitados. Por
ejemplo, solo participaron una tía, un hermano
y un amigo, pero ningún abuelo ni tíos. Haber
contado con la participación de más individuos
de este tipo habría ampliado el ámbito de los
hallazgos… gran parte de la experiencia
familiar se observó a lo largo de un día; en
aproximadamente la mitad de las familias se
realizó una visita domiciliaria (5 de 11 familias)
y en las otras seis familias se realizaron 2-3
visitas. Se podría alegar que una visita ofreció
una visión puntual limitada de la vida
familiar…
Una limitación no identificada fue que los
investigadores no basaron el tamaño muestral
en la saturación.
17. Conclusiones: Las investigadoras
concluyeron que:
El fin o propósito de esta investigación fue
interpretar la experiencia de las familias que
viven con un niño que tiene autismo grave. El
objetivo del estudio fue incluir solo niños con
autismo grave mientras que al mismo tiempo se
ampliaban los parámetros de muestreo para
incorporar a todas las personas significativas

820
que se consideraban familia. De forma global,
los resultados fueron un tanto sorprendentes.
Los hallazgos del estudio arrojaron luz sobre las
dificultades y desafíos considerables de las
familias que tienen un hijo con autismo grave,
identificaron los recursos necesarios y pusieron
de relieve el modo en el que las familias
constituían familias híbridas para obtener apoyo
adicional. Este nuevo conocimiento tiene
implicaciones para los profesionales de
enfermería y sanitarios, que alienta el desarrollo
de estrategias para proporcionar cuidados de
calidad a los niños con autismo grave y sus
familias. (Gorlin y cols., 2016, pág. 595).
Las conclusiones y recomendaciones para
estudios futuros fueron congruentes con los
hallazgos, como es lógico. Podrían haber
reforzado las conclusiones al identificar
otros entornos o poblaciones a las que se
podrían transferir o aplicar los hallazgos.
18. Implicaciones para enfermería: Gorlin y
cols. (2016) explicaron con claridad las
implicaciones del estudio para la práctica
enfermera y lo que aportó el estudio a la
comprensión del fenómeno de la
experiencia vivida de las familias de niños
con autismo grave.
Las implicaciones para la práctica pueden
incluir, en primer lugar, reconocer las
necesidades particulares de las familias de niños

821
con autismo grave en el entorno de la asistencia
sanitaria… la familia puede requerir apoyo
adicional cuando el niño tiene una consulta de
atención al niño sano, en el dentista o el
hospital… En segundo lugar, existe una
necesidad de un mejor apoyo psicológico por los
profesionales sanitarios, con el fin de mitigar el
estrés y el aislamiento familiares. (Gorlin y
cols., 2016, pág. 595).
19. Investigaciones futuras: Gorlin y cols.
(2016, pág. 596) señalaron que «Se necesitan
más investigaciones para ampliar nuestros
conocimientos sobre los problemas
particulares que se encuentran las familias
de niños con autismo grave, de modo que
se pueda mejorar en el futuro la asistencia
global a estas familias». No se realizaron
recomendaciones específicas sobre
metodología de estudio o sobre variables o
conceptos del estudio en el futuro.
20. Resumen de valoración crítica: de forma
global, el estudio era detallado, bien
organizado y estaba escrito con claridad.
Los derechos de los sujetos humanos se
protegieron mediante el reclutamiento, la
recogida de datos y las fases de análisis del
estudio. Gorlin y cols. (2016)
proporcionaron una descripción exhaustiva
de cada elemento de este estudio
cualitativo, que fue suficiente para permitir

822
la replicación por otro investigador. La
congruencia del propósito, del método y de
los hallazgos se demostró con claridad a lo
largo de la presentación del estudio.
La confianza del estudio se abordó con gran
detalle en la sección «Rigor o valoración del
estudio fenomenológico» (Gorlin, 2016,
pág. 586). El uso de varias estrategias para
mejorar la confiabilidad aumenta la
confianza del lector en los hallazgos (Cohen
y Crabtree, 2008; Murphy y Yielder, 2010).
El apoyo que proporciona la confianza del
estudio era uno de los principales puntos
fuertes del artículo. Gorlin y cols. (2016)
realizaron un estudio bien diseñado, que
minimizó las limitaciones en gran medida,
por lo que los hallazgos proporcionaron
una visión creíble de los niños con autismo
grave desde la perspectiva de sus familias.
Los hallazgos de este estudio amplían los
conocimientos actuales de la PBE y pueden
utilizarse para mejorar el apoyo del equipo
sanitario a estas familias y cubrir mejor las
necesidades de los niños con autismo
grave. Los puntos fuertes del estudio
superaron sus pocos puntos débiles y
pueden servir como un buen ejemplo de la
fenomenología interpretativa.

PUNTOS CLAVE

823
• Una valoración crítica intelectual de una investigación
requiere un análisis cuidadoso de todos los aspectos de un
estudio para evaluar sus puntos fuertes y débiles, la
credibilidad, el significado y la relevancia.
• La investigación se valora críticamente para aumentar los
conocimientos, mejorar la práctica y proporcionar
antecedentes para realizar un estudio.
• Todas las personas del ámbito de la enfermería
(profesionales, estudiantes, docentes e investigadores)
deben tener experiencia en la valoración crítica de la
investigación.
• Los estudios cuantitativos sólidos están guiados por un
problema y un propósito claros y concisos, y por objetivos,
preguntas y/o hipótesis adecuados. El marco del estudio es
apropiado, el diseño es relevante, con amenazas limitadas
para la validez, el análisis de los datos aborda los objetivos,
las preguntas o las hipótesis del estudio y los hallazgos son
creíbles y un fiel reflejo de la realidad.
• Los estudios cualitativos sólidos se basan en una orientación
filosófica y el enfoque cualitativo que se ha especificado. A
partir de esta base, el investigador aplica los métodos de
recogida y análisis de los datos que aumentan la confianza
del estudio.
• Se proporcionan guías detalladas para realizar valoraciones
críticas de los estudios cuantitativos y cualitativos. Se
ofrecen guías para cada uno de los tres pasos de valoración
crítica: 1) identificación de los pasos o los elementos del
estudio, 2) determinación de los puntos fuertes y débiles del
estudio y 3) evaluación de la confianza y el significado de
los hallazgos del estudio.
• Se proporcionan ejemplos de valoraciones críticas de un
estudio cuantitativo y de un estudio cualitativo.

BIBLIOGRAFÍA
Aberson, C. L. Applied power analysis for the behavioral sciences. New
York: Routledge Taylor & Francis; 2010.

824
Agency for Healthcare Research and Quality (AHRQ). AHRQ
home. Consultada el 5 de mayo de 2017, en http://www.ahrq.gov,
2017.

Alligood, M. R. Nursing theory: Utilization & application, 8th ed.


Maryland Heights, MO: Mosby Elsevier; 2014.

American Nurses Credentialing Center (ANCC). Magnet program


overview. Consultada el 18 de noviembre de 2017, en
http://www.nursecredentialing.org/Magnet/ProgramOverview,
2017.

American Psychological Association (APA). Publication manual of the


American Psychological Association, 6th ed. Washington, DC: APA;
2010.

Bialocerkowski, A., Klupp, N., Bragge, P. Research methodology


series: How to read and critically appraise a reliability article.
International Journal of Therapy and Rehabilitation. 2010; 17(3):114–120.

Brown, S. J. Evidence-based nursing: The research-practice connection,


4th ed. Sudbury, MA: Jones & Bartlett; 2018.

Burns, N. Standards for qualitative research. Nursing Science


Quarterly. 1989; 2(1):44–52.

Chinn, P. L., Kramer, M. K. Integrated theory and knowledge


development in nursing, 9th ed. St. Louis: Elsevier Mosby; 2015.

Clissett, P. Evaluating qualitative research. Journal of Orthopaedic


Nursing. 2008; 12(2):99–105.

Cohen, D. J., Crabtree, B. F. Evaluative criteria for qualitative


research in health care: Controversies and recommendations.

825
Annals of Family Medicine. 2008; 6(4):331–339.

Cowles, K. Issues in qualitative research on sensitive topics. Western


Journal of Nursing Research. 1988; 10(2):163–179.

Craig, J., Smyth, R. The evidence-based practice manual for nurses, 3rd
ed. Edinburgh: Churchill Livingstone Elsevier; 2012.

Creswell, J. W. Research design: Qualitative, quantitative and mixed


methods approaches, 3rd ed. Thousand Oaks, CA: Sage; 2014.

Creswell, J. W., Poth, C. Qualitative inquiry & research design, 4th ed.
Thousand Oaks, CA: Sage; 2018.

DeVon, H. A., Block, M. E., Moyle-Wright, P., Ernst, D. M., Hayden,


S. J., et al. A psychometric toolbox for testing validity and
reliability. Journal of Nursing Scholarship. 2007; 39(2):155–164.

Eymard, A. S., Altmiller, G. Teaching nursing students the


importance of treatment fidelity in intervention research: Students
as interventionists. Journal of Nursing Education. 2016; 55(5):288–291.

Fawcett, J., Garity, J. Evaluating research for evidence-based nursing


practice. Philadelphia: F.A. Davis; 2009.

Gloeckner, M. B., Robinson, C. B. A nursing journal club thrives


through shared governance. Journal for Nurses in Staff Development.
2010; 26(6):267–270.

Gorlin, J. B., McAlpine, C. P., Garwick, A., Wieling, E. Severe


childhood autism: The family lived experience. Journal of Pediatric
Nursing. 2016; 31(6):580–597.

Gray, J. R., Grove, S. K., Sutherland, S. The practice of nursing

826
research: Appraisal, synthesis, and generation of evidence, 8th ed. St.
Louis: Elsevier Saunders; 2017.

Grove, S. K., Cipher, D. J. Statistics for nursing research: A workbook


for evidence-based practice, 2nd ed. St. Louis: Elsevier; 2017.

Hall, H. R., Roussel, L. A. Evidence-based practice: An integrative


approach to research, administration and practice, 2nd ed. Burlington,
MA: Jones & Bartlett; 2017.

Hart, C. Doing a literature review: Releasing the social science


imagination. Thousand Oaks, CA: Sage Publications; 2009.

Hoare, Z., Hoe, J. Understanding quantitative research: Part 2.


Nursing Standard (Royal College of Nursing [Great Britain]). 2013;
27(18):48–55.

Hoe, J., Hoare, Z. Understanding quantitative research: Part 1.


Nursing Standard (Royal College of Nursing [Great Britain]). 2012;
27(15-17):52–57.

James, P. A., Oparil, S., Carter, B. L., Cushman, W. C., Denison-


Himmelfard, C., Handler, J., et al. 2014 evidence-based guidelines
for the management of high blood pressure in adults: Report from
the panel members appointed to the Eighth Joint National
Committee (JNC 8). Journal of the American Medical Association. 2013;
311(5):507–520.

Kelkar, A. A., Spertus, J., Pang, P., Pierson, R. F., Cody, R. J., Pina, I.
L., et al. Utility of patient-reported outcome instruments in heart
failure. JACC: Heart Failure. 2016; 4(3):165–175.

Mackey, M. Evaluation of qualitative research. In: Munhall P.L., ed.

827
Nursing research: A qualitative perspective. 5th ed. Sudbury, MA:
Jones & Bartlett; 2012:517–531.

Maxwell, J. Qualitative research design: An interactive approach, 3rd ed.


Thousand Oaks, CA: Sage; 2013.

Melnyk B.M., Fineout-Overholt E., eds. Evidence-based practice in


nursing & healthcare: A guide to best practice. 3rd ed. Wolters
Kluwer, Philadelphia, 2015.

Melnyk, B. M., Gallagher-Ford, E., Fineout-Overholt. Implementing


evidence-based practice competencies in healthcare: A practical guide for
improving quality, safety, & outcomes. Indianapolis, IN: Sigma Theta
Tau International; 2017.

Miles, M., Huberman, A., Saldaña, J. Qualitative data analysis: A


methods sourcebook, 3rd ed. Thousand Oaks, CA: Sage; 2014.

Mittlbock, M. Critical appraisal of randomized clinical trials: Can


we have faith in the conclusions? Breast Care. 2008; 3(5):341–346.

Moorhead, S., Johnson, M., Maas, M. L., Swanson, E. Nursing


outcomes classification (NOC): Measurement of health outcomes, 5th ed.
St. Louis: Elsevier; 2013.

Morse, J. M. Evaluating qualitative research. Qualitative Health


Research. 1991; 1(3):283–286.

Munhall, P. L. Nursing research: A qualitative perspective, 5th ed.


Sudbury, MA: Jones & Bartlett; 2012.

Murphy, F., Yielder, J. Establishing rigor in qualitative radiography.


Radiography. 2010; 16(1):62–67.

828
National Institute of Nursing Research (NINR). What is nursing
research? Consultada el 5 de mayo de 2017, en
https://www.ninr.nih.gov, 2017.

O’Mathúna, D. P., Fineout-Overholt, E. Critically appraising


quantitative evidence for clinical decision making. In: Melnyk B.M.,
Fineout-Overholt E., eds. Evidence-based practice in nursing &
healthcare: A guide to best practice. 2nd ed. Philadelphia: Lippincott
Williams & Wilkins; 2015:87–138.

Petty, N., Thomson, O., Stew, G. Ready for a paradigm shift? Part 2:
Introducing qualitative research methodologies and methods.
Manual Therapy. 2012; 17(5):378–384.

Plichta, S. B., Kelvin, E. Munro’s statistical methods for health care


research, 6th ed. Philadelphia: Lippincott Williams & Wilkins; 2013.

Powers, B. A. Critically appraising qualitative evidence for clinical


decision making. In: Melnyk B.M., Fineout-Overholt E., eds.
Evidence-based practice in nursing & healthcare: A guide to best practice.
2nd ed. Philadelphia: Lippincott Williams & Wilkins; 2015:139–168.

Pyrczak, F. Evaluating research in academic journals: A practical guide


to realistic evaluation, 4th ed. Los Angeles: Pyrczak; 2008.

Quality and Safety Education for Nurses (QSEN). Pre-licensure


knowledge, skills, and attitudes (KSAs). Consultada el 7 de abril de
2018, en http://qsen.org/competencies/pre-licensure-ksas, 2018.

Roller, M., Lavrakas, P. Applied qualitative research design: A total


quality framework approach. New York: Guilford Press; 2015.

Ryan-Wenger, N. A. Precision, accuracy, and uncertainty of

829
biophysical measurements for clinical research and practice. In:
Waltz C.F., Strickland O.L., Lenz E.R., eds. Measurement in nursing
and health research. 4th ed. New York: Springer; 2017:371–383.

Sandelowski, M. Justifying qualitative research. Research in Nursing


& Health. 2008; 31(3):193–195.

Sandelowski, M., Barroso, J. Handbook for synthesizing qualitative


research. New York: Springer; 2007.

Schoe, L., Høstrup, H., Lyngsø, E., Larsen, S., Poulsen, I. Validation
of a new assessment tool for qualitative research articles. Journal of
Advanced Nursing. 2011; 68(9):2086–2094.

Shadish, W. R., Cook, T. D., Campbell, D. T. Experimental and quasi-


experimental designs for generalized causal inference. Chicago: Rand
McNally; 2002.

Sherwood, G., Barnsteiner, J. Quality and safety in nursing: A


competency approach to improving outcomes, 2nd ed. Ames, IA: Wiley-
Blackwell; 2017.

Smith, M. J., Liehr, P. R. Middle range theory for nursing, 3rd ed. New
York: Springer; 2014.

St. Catherine University, School of Nursing. Jocelyn Bessette Gorlin.


Consultada el 4 de mayo de 2017, en
https://www.stkate.edu/academics/our-faculty/jocelyn-bessette-
gorlin, 2017.

University of North Carolina at Charlotte, School of Nursing.


Charlene Witaker-Brown. Consultada el 4 de mayo de 2017, en
http://nursing.uncc.edu/charlene-whitaker-brown, 2017.

830
van Manen, M. Researching lived experience: Human science for an
action sensitive pedagogy. Ontario, Canada: Althouse Press; 1997.

van Manen, M. Phenomenology of practice: Meaning-giving methods in


phenomenological research and writing. Walnut Creek, CA: Left Coast
Press; 2014.

Waltz, C. F., Strickland, O. L., Lenz, E. R. Measurement in nursing


and health research, 5th ed. New York: Springer; 2017.

Whitaker-Brown, C. D., Woods, S. J., Cornelius, J. B., Southard, E.,


Gulati, S. K. Improving quality of life and decreasing readmissions
in heart failure patients in a multidisciplinary transition-to-care
clinic. Heart & Lung. 2017; 46(2):79–84.

Wolf, M. Ethnography: The method. In: Munhall P.L., ed. Nursing


research: A qualitative perspective. 5th ed. Sudbury, MA: Jones &
Bartlett; 2012:285–338.

831
CAPÍTULO 13

Creación de una
práctica enfermera
basada en la
evidencia
Susan K. Grove

La página web de la National Guideline Clearinghouse de la Agency for


Healthcare Research and Quality (AHRQ) se cerró en 2018. Puede
consultarse más información en https://www.ahrq.gov/.

ÍNDICE DEL CAPÍTULO

Beneficios y dificultades relacionados con la práctica


enfermera basada en la evidencia, 388
Desarrollo de preguntas clínicas con el fin de buscar
evidencia basada en la investigación existente para su
uso en la práctica, 390
Valoración crítica de síntesis de investigaciones:
revisiones sistemáticas y metaanálisis, 394

832
Valoración crítica de metasíntesis, 406
Valoración crítica de revisiones sistemáticas de métodos
mixtos, 410
Modelos para promover la práctica basada en la
evidencia en enfermería, 414
Aplicación en la práctica de guías basadas en la
evidencia, 420
Introducción a los centros de práctica basada en la
evidencia, 425
Introducción a la investigación traslacional, 425
Puntos clave, 426
Bibliografía, 427

OBJETIVOS DE APRENDIZAJE
Tras concluir este capítulo, el lector debería ser capaz de:
1. Describir los beneficios y dificultades relacionados con la
práctica basada en la evidencia en enfermería.
2. Usar el formato PICO para formular preguntas clínicas con el
fin de identificar evidencia para su uso en la práctica.
3. Aplicar protocolos, algoritmos, guías y políticas basados en la
investigación en la práctica.
4. Valorar críticamente revisiones sistemáticas, metaanálisis y
metasíntesis, y revisiones sistemáticas de métodos mixtos de
evidencia de investigación.
5. Describir los modelos empleados para promover la práctica
basada en la evidencia en enfermería.
6. Aplicar el modelo de Iowa de práctica basada en la evidencia
para realizar cambios basados en las instituciones sanitarias.
7. Aplicar el modelo de Grove para implementar guías nacionales
basadas en la evidencia en la práctica.
8. Describir la relevancia de los centros de práctica basada en la

833
evidencia y la investigación traslacional en el desarrollo de la
asistencia sanitaria basada en la evidencia.

La evidencia de investigación ha crecido enormemente en los


últimos 30 años a medida que se han realizado y divulgado
numerosos estudios de calidad en enfermería y otras disciplinas
sanitarias. Estos estudios se divulgan habitualmente a través de
conferencias, revistas e internet. Las expectativas de la sociedad y
los objetivos de los sistemas sanitarios son proporcionar una
asistencia sanitaria de calidad, segura y rentable a pacientes,
familias y comunidades (Sherwood y Barnsteiner, 2017; Straus,
Glasziou, Richardson, Rosenberg y Haynes, 2011). Para garantizar
una asistencia sanitaria de calidad, la asistencia debe estar basada
en la mejor evidencia de investigación disponible actualmente. En
los últimos 15 años, los programas de enfermería han
proporcionado a los estudiantes conocimientos sobre la práctica
basada en la evidencia (PBE) para animar a los graduados a basar
su práctica en la investigación actual. El énfasis en la PBE en los
programas de educación de enfermería y en los centros clínicos ha
mejorado los resultados para los pacientes y las familias, los
profesionales de enfermería y los centros sanitarios (Mackey y
Bassendowski, 2017; Melnyk, Gallagher-Ford y Fineout-Overholt,
2017).
La práctica basada en la evidencia (PBE) es un tema importante
en este libro que se definió en el capítulo 1 como la integración de la
mejor evidencia de investigación con la experiencia clínica de los
profesionales de enfermería y las circunstancias y valores de los
pacientes en la provisión de una asistencia sanitaria de calidad,
segura y rentable (Straus y cols., 2011). La mejor evidencia de
investigación se produce mediante la realización y síntesis de
muchos estudios de alta calidad en un área seleccionada
relacionada con la salud. Este capítulo se basa en comentarios
previos sobre la PBE de este libro con el fin de proporcionar
estrategias para implementar la mejor evidencia de investigación en
la práctica y hacer que la profesión de enfermería avance hacia la
PBE.
Aquí se describen los beneficios y dificultades asociados con la

834
PBE para aumentar los conocimientos sobre la práctica de
enfermería basada en la evidencia. Se proporciona un formato para
desarrollar preguntas clínicas con el fin de dirigir las búsquedas de
la evidencia basada en la investigación para utilizarla en la práctica.
Se ofrecen guías para la valoración crítica de síntesis de
investigaciones (revisiones sistemáticas, metaanálisis, metasíntesis
y revisiones sistemáticas de métodos mixtos) con el fin de
determinar el conocimiento dispuesto para utilizarse en la práctica.
Se introducen dos modelos de enfermería que se han desarrollado
para facilitar la PBE en las instituciones sanitarias. Investigadores
expertos, clínicos y usuarios (a través de agencias gubernamentales,
organizaciones profesionales e instituciones sanitarias) han
desarrollado un gran número de guías basadas en la evidencia. Se
ofrece un marco para revisar la calidad de estas guías basadas en la
evidencia y utilizarlas en la práctica. El capítulo concluye con la
descripción de los centros de PBE designados en Estados Unidos y
Canadá, y la investigación traslacional puesta en práctica con el fin
de promover la asistencia sanitaria basada en la evidencia.

BENEFICIOS Y DIFICULTADES
RELACIONADOS CON LA PRÁCTICA
ENFERMERA BASADA EN LA
EVIDENCIA
La PBE es un objetivo de la profesión de enfermería y de todos los
profesionales de enfermería en ejercicio. En la actualidad, algunas
intervenciones de enfermería están basadas en la evidencia, pero
muchas de estas intervenciones requieren más investigaciones que
generen el conocimiento esencial para cambiar la práctica. Algunas
instituciones clínicas respaldan el proceso de PBE, pero otras no lo
hacen. Esta sección identifica algunos de los beneficios y
dificultades asociados con la implementación de la enfermería
basada en la evidencia.

Beneficios de la práctica enfermera basada

835
en la evidencia
El mayor beneficio que aporta la PBE es la obtención de mejores
resultados para pacientes, profesionales e instituciones sanitarias
(Melnyk y cols., 2016; Moorhead, Johnson, Maas y Swanson, 2013).
Las instituciones y organizaciones de todo el mundo han
promovido la síntesis de la mejor evidencia de investigación en
miles de áreas de salud por parte de equipos constituidos por
investigadores y clínicos expertos. Estas síntesis de investigaciones,
como revisiones sistemáticas y metaanálisis, han sentado las bases
para desarrollar guías sólidas basadas en la evidencia con vistas a la
práctica. Estas guías identifican el mejor plan de tratamiento, o
patrón oro, para la asistencia a pacientes en áreas específicas con el
fin de mejorar los resultados del paciente. Los estudiantes y
profesionales de enfermería clínicos tienen acceso electrónico a
numerosas guías basadas en la evidencia que les ayudan a tomar
las mejores decisiones clínicas para sus pacientes. Estas síntesis y
guías basadas en la evidencia se encuentran disponibles en todos
los países y se puede acceder fácilmente a ellas online a través de
distintas instituciones, como la National Guideline Clearinghouse
(NGC, 2017a) en Estados Unidos, la Cochrane Collaboration (2017)
en Reino Unido, y el Joanna Briggs Institute (2017) en Australia.
Algunos directores generales de enfermería (DGE) e instituciones
sanitarias respaldan con fuerza la PBE, tal y como lo indican sus
actitudes y la provisión de recursos para apoyar la PBE (Melnyk,
Fineout-Overholt, Giggleman y Choy 2017). Los líderes de estas
instituciones clínicas reconocen que la PBE fomenta los resultados
de calidad, mejora la satisfacción de los profesionales de enfermería
y facilita lograr los requisitos de acreditación. En un estudio
estadounidense de DGE, Melnyk y cols. (2016) observaron que una
organización con una cultura de PBE dirigida a realizar y utilizar la
evidencia de investigación en la práctica tenía mejoras sustanciales
en varios resultados de los pacientes. La Joint Commission (2017)
revisó sus criterios de acreditación insistiendo en los resultados de
la asistencia a los pacientes logrados gracias a la PBE.
Muchos DGE y supervisores de enfermería (SE) están tratando de
obtener o mantener el estatus Magnet, que documenta la excelencia
de la asistencia de enfermería en las instituciones sanitarias. La
aprobación del estatus Magnet se obtiene a través del American

836
Nurses Credentialing Center (ANCC) y las agencias sanitarias
estadounidenses e internacionales que cuentan actualmente con
este estatus pueden consultarse online (ANCC, 2017). El Magnet
Recognition Program destaca la PBE como una forma de mejorar la
calidad de la asistencia al paciente y revitalizar el entorno de
enfermería. Las instituciones clínicas que quieran obtener o
mantener el estatus Magnet deben documentar los resultados
relacionados con la investigación, incluidos los estudios de
enfermería realizados y las publicaciones y presentaciones
profesionales elaboradas por el personal de enfermería. En las
solicitudes e informes para lograr el estatus Magnet, en todos los
estudios hay que documentar el título, investigador o
investigadores principales, el papel del personal de enfermería en el
estudio y su estatus (ANCC, 2017).
El proyecto Quality and Safety Education for Nurses (QSEN,
2017) se puso en práctica con el fin de mejorar los «conocimientos,
habilidades y actitudes (CHA) necesarios para mejorar de forma
continua la calidad y seguridad de los sistemas sanitarios en los que
trabaja» el personal de enfermería pregraduado. Se desarrollaron
competencias QSEN en seis áreas esenciales para la práctica de
estudiantes y profesionales de enfermería titulados (ET): asistencia
centrada en el paciente, trabajo en equipo y colaboración, PBE,
mejora de la calidad (MC), seguridad e informática. La PBE es un
área importante de la formación de pregrado y los profesores
ayudan a los estudiantes a lograr las siguientes competencias de
PBE:

• Participar eficazmente en la recogida de datos apropiada y


otras actividades de investigación.
• Cumplir las guías del Comité de Revisión Institucional
(CRI).
• Basar el plan de asistencia individualizado en los valores del
paciente, la experiencia clínica y la evidencia.
• Leer informes de investigación y evidencia originales
relacionados con el área de la práctica.
• Localizar informes de evidencia relacionados con las
cuestiones de práctica clínica y guías.
• Participar en una estructuración del entorno laboral tal que

837
facilite la integración de la nueva evidencia en la práctica
habitual.
• Cuestionar las bases de las estrategias de cuidados
habituales que obtengan resultados inferiores a los
deseados o eventos adversos.
• Consultar con expertos clínicos antes de tomar la decisión
de incumplir los protocolos basados en la evidencia (QSEN,
2017).

Los docentes han modificado los currículos para incluir


contenido de PBE y cursos adicionales que han mejorado las
percepciones de los estudiantes y su confianza en la investigación y
la PBE (Keib, Cailor, Kiersma y Chen, 2017). Warren y cols. (2016,
pág. 15) observaron que «los profesionales de enfermería más
jóvenes con menos años de práctica eran más propensos a tener
creencias positivas hacia la PBE y a incluirla en la cultura de la
organización». En el trabajo hacia la PBE, a los estudiantes y
profesionales en ejercicio se les recomienda que aprovechen los
beneficios de la PBE, que realicen una valoración crítica de la
evidencia de investigación actual, que perfeccionen los protocolos,
algoritmos (árboles de decisión clínicos) de la agencia y las políticas
basadas en investigaciones actuales, que utilicen las guías basadas
en la evidencia disponibles y que recojan datos cuando sea
necesario para los proyectos de investigación.

Dificultades para la práctica enfermera


basada en la evidencia
El movimiento de la PBE se ha enfrentado a dificultades prácticas y
conceptuales. Una de las más importantes es la escasez de evidencia
de investigación disponible sobre la eficacia de muchas
intervenciones de enfermería. La PBE exige sintetizar las evidencias
de investigación procedentes de estudios controlados aleatorizados
(ECA) y otros tipos de estudios de intervención, que siguen siendo
escasos en enfermería. Las revisiones sistemáticas y metaanálisis
realizados en enfermería también escasean en comparación con
otras disciplinas, como medicina y psicología (Cochrane
Collaboration, 2017; Gray, Grove y Sutherland, 2017; NGC, 2017b).

838
Otra dificultad es que la evidencia de investigación se genera a
partir de datos poblacionales y después se aplica en la práctica a
pacientes individuales. En ocasiones, es difícil trasladar el
conocimiento de investigación a pacientes individuales, que
responden de formas únicas o que tienen circunstancias y valores
propios. Se necesita más trabajo para promover el uso de guías
basadas en la evidencia en pacientes individuales. En respuesta a
este problema, los National Institutes of Health (NIH, 2017) están
promoviendo la investigación traslacional (explicada más adelante
en el capítulo) para mejorar el uso de la evidencia de investigación
en distintas poblaciones de pacientes y varios entornos. Los malos
resultados que obtienen los pacientes cuando se les trata de acuerdo
con una guía basada en la evidencia deben ser comunicados y, si es
posible, sus circunstancias publicadas como estudio de caso. Las
historias clínicas electrónicas (HCE) permiten actualmente
determinar los resultados de la asistencia al paciente proporcionada
mediante guías de PBE.
Otro inconveniente importante es que algunas instituciones
sanitarias y gestores no facilitan los recursos o el apoyo que se
requiere para que los profesionales de enfermería implementen la
PBE. En su estudio estadounidense, Melnyk y cols. (2016, pág. 9)
indicaban que «Aunque los DGE y SE afirmaban que sus
prioridades máximas eran la calidad y la seguridad, la PBE no se
recogía como una prioridad principal y dedicaban un escaso
presupuesto a implementar y sostener la asistencia basada en la
evidencia». La falta de apoyo y de recursos incluía: 1) acceso
inadecuado a revistas de investigación y otras fuentes de síntesis de
hallazgos de investigación y guías basadas en la evidencia, 2)
conocimientos o tutoría errónea sobre cómo poner en práctica los
cambios basados en la evidencia, 3) carga de trabajo excesiva, con
un tiempo limitado para realizar modificaciones de la práctica
basadas en la evidencia, 4) autoridad limitada para cambiar la
asistencia al paciente de acuerdo con los hallazgos de
investigaciones, 5) apoyo limitado de los gestores de enfermería o
personal médico para realizar cambios en la práctica basados en la
investigación, 6) recursos limitados para apoyar proyectos de
investigación y cambios en la práctica basados en la investigación y
7) recompensas mínimas por proporcionar una asistencia basada en

839
la evidencia a pacientes y familias (Eizenberg, 2010; Melnyk y cols.,
2016; Melnyk y cols., 2017; Straka, Brandt y Brytus, 2013; Warren y
cols., 2016). El éxito de la PBE depende de todos los implicados,
incluidas las instituciones sanitarias, gestores, profesionales de
enfermería, médicos y otros profesionales sanitarios. El contenido
siguiente se ha desarrollado para ayudar a los estudiantes y a los
profesionales de enfermería a la hora de facilitar una práctica
basada en la evidencia.

DESARROLLO DE PREGUNTAS
CLÍNICAS CON EL FIN DE BUSCAR
EVIDENCIA BASADA EN LA
INVESTIGACIÓN EXISTENTE PARA
SU USO EN LA PRÁCTICA
Desarrollar una pregunta clínica en un área de interés y realizar una
búsqueda extensa de fuentes basadas en la evidencia es una forma
eficaz de identificar evidencia actual para su uso en la práctica. La
pregunta clínica suele desarrollarse utilizando el formato PICO,
que consta de los siguientes elementos:

P: población o participantes de interés en el entorno clínico.


I: intervención necesaria para la práctica.
C: comparaciones de intervenciones para determinar la mejor
intervención para la práctica.
O: resultados (outcomes) necesarios para la práctica y formas de
medir los resultados en la práctica.

El formato PICO ayuda a organizar la búsqueda de evidencia de


investigación en distintas bases de datos y sitios web. Se pueden
identificar síntesis de investigaciones (revisiones sistemáticas,
metaanálisis, metasíntesis y revisiones sistemáticas de métodos
mixtos), guías, protocolos y algoritmos basados en la evidencia, así
como estudios individuales mediante búsquedas en bases de datos
electrónicas, páginas de bibliotecas nacionales, organizaciones de

840
PBE y colecciones. En la tabla 13.1 se muestran algunos de los
recursos fundamentales para la PBE. Cada año se publican en inglés
al menos 2.500 revisiones sistemáticas nuevas, indexadas en el
Medical Literature Analysis and Retrieval System Online
(MEDLINE). La biblioteca de revisiones sistemáticas de la Cochrane
Collaboration (2017) es un recurso excelente, con más de 11.000
entradas relevantes para la enfermería y asistencia sanitaria. En
2009, se creó el Cochrane Nursing Care (CNC) Field para apoyar la
realización, divulgación y uso de revisiones sistemáticas en
enfermería. El CNC Field elabora las columnas Cochrane Corner
(resúmenes de Revisiones Cochrane relevantes para cuidados de
enfermería) que se publican con regularidad en revistas
colaboradoras relacionadas con cuidados de enfermería (CNC,
2017). El Joanna Briggs Institute (2017) también proporciona
recursos para localizar y realizar síntesis de investigaciones en
enfermería. El Nursing Reference Center (NRC) incluye hojas de
cuidados basados en la evidencia para muchas intervenciones de
enfermería y afecciones clínicas (v. tabla 13.1).

TABLA 13.1
RECURSOS DE PRÁCTICA BASADA EN LA EVIDENCIA

841
Evidencia centrada en la aspiración durante
las inyecciones intramusculares
Se puede plantear una pregunta clínica sobre si los profesionales de
enfermería deberían aspirar o no al administrar inyecciones
intramusculares (i.m.). Mediante el uso del formato PICO, se puede
identificar la evidencia necesaria para la práctica.

842
P: poblaciones: lactantes, preescolares, niños y adultos que
reciban vacunaciones por vía i.m. con fines profilácticos.
I: intervención: inyección i.m. administrada sin aspiración en la
localización correcta basada en el volumen de medicación y
la edad del paciente (Ogston-Tuck, 2014; Sisson, 2015;
Thomas, Mraz, y Rajcan, 2016; Wynaden y cols., 2015).
C: intervención de comparación: inyección i.m. administrada
con 5-10 segundos de aspiración en todas las localizaciones,
con independencia de la edad del paciente y del volumen de
medicación (Cocoman y Murray, 2008; Nicoll y Hesby,
2002).
O: resultado (outcome): inyección i.m. de vacuna sin
complicaciones.

Las guías basadas en la evidencia más antiguas de Nicoll y Hesby


(2002) y de Cocoman y Murray (2008) recomendaban la aspiración
durante 5-10 segundos con cada inyección i.m. para evitar la
inyección de sustancias directamente en el torrente sanguíneo del
paciente. Sin embargo, una revisión sistemática de Sisson (2015)
recomendaba que no se realizase aspiración con las inyecciones i.m.
administradas en las localizaciones deltoidea, ventroglútea y del
vasto lateral. Los profesionales solo deberían aspirar cuando se
administren inyecciones i.m. en la localización dorsoglútea debido a
la estrecha proximidad de la arteria glútea. Sin embargo, los
investigadores recomendaban que no se usase la localización
dorsoglútea, si fuese posible (Ogston-Tuck, 2014; Sisson, 2015;
Wynaden y cols., 2015). La evidencia de investigación actual
respecto a la aspiración durante las inyecciones i.m. se resume en el
cuadro 13.1. Sin embargo, muchos profesionales de enfermería no
utilizan esta evidencia de investigación actual sobre las inyecciones
i.m. en la práctica. Thomas y cols. (2016) observaron que el 74% de
los profesionales de enfermería aún aspiraban después de las
inyecciones i.m. el 90% de las veces. Wynaden y cols. (2015)
observaron un uso mayor de la localización dorsoglútea, aunque la
investigación actual recomienda el uso de la localización
ventroglútea. Por tanto, estos investigadores recomendaron más
formación en los programas de enfermería y la formación
continuada para garantizar que los profesionales de enfermería

843
conozcan y usen la evidencia de investigación actual en la práctica.

CUADRO 13.1 GUÍA DE PRÁCTICA CLÍNICA:


INYECCIONES INTRAMUSCULARES SIN
ASPIRACIÓN
Población de pacientes
Lactantes, preescolares, niños y adultos que reciben vacunaciones
por vía i.m. con fines profilácticos.
Objetivo
Administración de vacunaciones i.m. para eliminar la lesión y
molestias del paciente.
Intervención: inyección i.m.
Selección del sitio en función de la edad del paciente
(Nicoll y Hesby, 2002; Ogston-Tuck, 2014; Sisson, 2015; Wynaden y
cols., 2015):

• Lactantes: la localización de elección es el vasto lateral.


• Preescolares y niños: vasto lateral o deltoides.
• Adultos: ventroglúteo o deltoides.

Volumen de medicación
(Nicoll y Hesby, 2002; Sisson, 2015; Wynaden y cols., 2015).

• Se pueden administrar pequeños volúmenes de medicación (≤2


ml) en la localización deltoidea para preescolares, niños y
adultos, y en el vasto lateral para los lactantes.
• Los volúmenes grandes de medicación (2-5 ml) deberían
administrarse en la localización ventroglútea en los adultos. En
los lactantes, preescolares y niños, el volumen debe ser
limitado e inyectarse en el vasto lateral.

Inyección sin y con aspiración

• Se debe limpiar el sitio con alcohol y dejar que se seque.

844
• La aguja se inserta en el sitio apropiado.
• No debería aspirarse en las localizaciones del deltoides,
ventroglútea y del vasto lateral (Sisson, 2015; Thomas
y cols., 2016; Wynaden y cols., 2015).
• Se debe aspirar durante 5-10 segundos cuando se use
el sitio dorsoglúteo debido a la proximidad de la
arteria glútea, pero las investigaciones actuales
recomiendan que no se use esta localización (Sisson,
2015; Stringer, 2010; Thomas y cols., 2016; Wynaden y
cols., 2015).
• La medicación debe inyectarse despacio.
• La aguja se retira despacio y se aplica presión suave con una
gasa seca.

Resultado

• Hay que evaluar la localización para detectar complicaciones,


de forma inmediata y 2-4 horas después, si es posible.
• Hay que registrar el número y tipo de complicaciones: dolor,
eritema y/o calor.
• Hay que desechar de forma adecuada y rápida todo el equipo.

VALORACIÓN CRÍTICA DE SÍNTESIS


DE INVESTIGACIONES: REVISIONES
SISTEMÁTICAS Y METAANÁLISIS
La evidencia de investigación suele resumirse utilizando revisiones
sistemáticas, metaanálisis, metasíntesis y revisiones sistemáticas de
métodos mixtos (Whittemore, Chao, Jang, Minges y Park, 2014).
Como se ha indicado antes, Sisson (2015) realizó una revisión
sistemática para sintetizar la investigación relacionada con las
inyecciones i.m. y recomendó que los profesionales de enfermería
no aspirasen al administrar la mayoría de las inyecciones i.m. (v.
cuadro 13.1). Los estudiantes y profesionales de enfermería deben
ser capaces de revisar las síntesis de investigación y determinar la
evidencia que van a usar en la práctica. En esta sección se

845
proporcionan guías para comprender y valorar críticamente
revisiones sistemáticas y metaanálisis.

Valoración crítica de las revisiones


sistemáticas
Una revisión sistemática es una síntesis estructurada y exhaustiva
de la literatura científica con el fin de determinar la mejor evidencia
de la investigación disponible para abordar una pregunta o
problema sobre la asistencia sanitaria. La revisión sistemática
supone identificar, localizar, valorar y resumir evidencia de
investigación de calidad para que los clínicos la utilicen en su
trabajo (Bettany-Saltikov, 2010a, 2010b; Cooper, 2017; Liberati y
cols., 2009; Moher, Liberati, Tezlaff, Altman y PRISMA Group, 2009;
Setia, 2016). Las revisiones sistemáticas suelen realizarlas dos o más
investigadores y/o clínicos expertos en un área de asistencia
sanitaria escogida con el fin de determinar el mejor conocimiento de
investigación en esa área.
Las revisiones sistemáticas deberían incluir una metodología de
investigación estricta para potenciar la exactitud de los hallazgos y
minimizar el sesgo de los revisores. La tabla 13.2 contiene una lista
de verificación para valorar críticamente los pasos o elementos de
las revisiones sistemáticas y los metaanálisis. Estos pasos se basan
en la declaración Prefered Reporting Items for Systematic Reviews
and Meta-Analyses (PRISMA) (Liberati y cols., 2009; Moher y cols.,
2009). La declaración PRISMA fue creada en 2009 por un grupo
internacional de investigadores y clínicos expertos con el fin de
mejorar la calidad de la comunicación de revisiones sistemáticas y
metaanálisis. Contiene 27 ítems que pueden encontrarse en
http://prisma-statement.org y se detallan en los artículos de Liberati
y cols. (2009) y Moher y cols. (2009). Estos 27 ítems se consolidaron
en la lista de verificación de la tabla 13.2 para ayudar en la
valoración crítica de revisiones sistemáticas y de metaanálisis.

TABLA 13.2
LISTA DE VERIFICACIÓN PARA LA VALORACIÓN CRÍTICA
DE REVISIONES SISTEMÁTICAS Y METAANÁLISIS

846
PUBLICADOS

PRISMA, Preferred Reporting Items for Systematic Reviews and Meta-


Analyses.
Adaptada de Liberati, A., Altman, D. G., Tetzlaff, J., Mulrow, C., Gotzsche,
P. C., Ioannidis, J. P., y cols. (2009). The PRISMA Statement for reporting
systematic reviews and meta-analyses of studies that evaluate healthcare
interventions: Explanation and elaboration. Annals of Internal Medicine,
151(4), W-65–W-94; y Moher, D., Liberati, A., Tetzlaff, J., Altman, D. G. y
PRISMA Group. (2009). Preferred Reporting Items for Systematic Reviews
and Meta-Analyses: The PRISMA Statement. http://www.prisma-
statement.org.
La revisión sistemática de Holmen, Wahl, Småstuen y Ribu
(2017), que se centra en el uso de aplicaciones móviles para la

847
retroalimentación entre los pacientes con diabetes y los
profesionales sanitarios se presenta como ejemplo. Se puede
consultar esta revisión sistemática online en la base de datos
Cumulative Index to Nursing and Allied Health Literature
(CINAHL) (v. tabla 13.1). Nosotros recomendamos la lectura de este
artículo y el uso de las guías de la tabla 13.2 para valorar
críticamente esta revisión sistemática y comparar sus hallazgos con
el texto siguiente.

Paso 1: ¿indicó el título que se ha realizado una


revisión sistemática o metaanálisis?
Holmen y cols. (2017, e227) identificaron el tipo de síntesis de
investigación que realizaron en el título de su informe: «Tailored
communication within mobile apps for diabetes self-management:
A systematic review».

Paso 2: ¿incluyó el resumen una sinopsis


estructurada de la síntesis de investigación?
Holmen y cols. (2017) proporcionaron un resumen claro y conciso
que estaba estructurado por los siguientes encabezamientos:
antecedentes, objetivo, métodos, resultados y conclusiones de la
revisión.

Paso 3: ¿se desarrolló una pregunta clínica clara y


significativa para dirigir la síntesis de investigación?
Lo mejor es que las revisiones sistemáticas y los metaanálisis estén
dirigidos por una pregunta clínica relevante que centre el proceso
de revisión y promueva el desarrollo de una síntesis de calidad de
la evidencia de investigación. El formato PICOS es el más utilizado
para desarrollar preguntas clínicas para la síntesis de la
investigación. El formato PICOS (similar al formato PICO citado
antes) se incluye en la declaración PRISMA (Moher y cols., 2009)
con los siguientes elementos:

P: población o participantes en cuestión (v. muestreo en el cap.


9).
I: intervención necesaria para la práctica (v. intervenciones de

848
enfermería en el cap. 8).
C: comparaciones de la intervención respecto al control,
placebo, cuidados estándar, variaciones de dicha
intervención o distintos tratamientos (v. cap. 8).
O: resultados (del inglés outcomes) necesarios para la práctica
(v. métodos de medición en el cap. 10 y la investigación de
resultados en el cap. 14).
S: diseño del estudio (del inglés study) (v. tipos de diseños de
estudios en el cap. 8).

Holmen y cols. (2017) no proporcionaron una pregunta clínica


para dirigir su revisión sistemática, pero ofrecieron unos
antecedentes sólidos para la revisión. Los investigadores indicaron
que «Alrededor de 415 millones de personas tienen diabetes en
todo el mundo y el tratamiento de la diabetes y de sus
complicaciones sigue siendo una urgencia de salud global que ya
supone el 12% del gasto sanitario global… La literatura sobre salud
móvil (mobile health [mHealth]) indica que las personas que usan
aplicaciones móviles para el automanejo logran resultados de salud
positivos» (Holmen y cols., 2017, e227.1). Las ideas del informe se
resumen utilizando el formato PICOS:

P: población: pacientes diagnosticados de diabetes.


I: intervención: comunicación y retroalimentación
personalizada utilizando aplicaciones móviles entre los
pacientes y los profesionales sanitarios.
C: comparaciones de la intervención con controles y la
asistencia habitual.
O: los resultados (outcomes) analizados incluyeron la
hemoglobina A1c (HbA1c), la presión arterial y la
satisfacción con la aplicación móvil.
S: diseños del estudio: ensayos clínicos cuasiexperimentales y
experimentales.

Paso 4: ¿se han reseñado el propósito y/o los


objetivos o fines de la revisión?
Las revisiones sistemáticas de la investigación podrían incluir un
propósito o, en ocasiones, fines u objetivos específicos para guiar el

849
proceso de síntesis (Bettany-Saltikov, 2010a; Moher y cols., 2009;
Setia, 2016). Holmen y cols. (2017, e227.1) afirmaron:

Hasta donde alcanzan nuestros conocimientos, los resultados basados


exclusivamente en aplicaciones con comunicación integrada y
personalizada no se han resumido sistemáticamente. Esta revisión
aborda la laguna de conocimiento mediante una revisión sistemática
de los estudios dirigidos a evaluar la comunicación integrada en las
aplicaciones móviles para establecer una retroalimentación
personalizada entre pacientes con diabetes y médicos en términos de
1) características del estudio, 2) funciones, 3) resultados del estudio,
4) efectos y 5) calidad de la metodología.

Paso 5: ¿estaban claramente identificados los criterios


de la búsqueda de la literatura?
Los informes de investigación de las revisiones sistemáticas o de
metaanálisis deben identificar los criterios de inclusión y exclusión
usados para dirigir la búsqueda de la literatura (v. tabla 13.2). El
formato PICOS podría utilizarse para desarrollar los criterios de
búsqueda, empleando más detalle para cada uno de los elementos.
Estos criterios de búsqueda podrían centrarse en lo siguiente: 1)
tipo de métodos de investigación, como investigaciones
cuantitativas, cualitativas o de métodos mixtos, 2) población o tipo
de participantes del estudio, 3) diseños del estudio, como
cuasiexperimentales y experimentales, 4) procesos de muestreo,
como métodos de muestreo probabilístico y no probabilístico, 5)
intervención e intervenciones de comparación y 6) resultados
específicos medidos. Los criterios de búsqueda también tienen que
indicar los años de la revisión, el idioma y estado de publicación de
los estudios (Bettany-Saltikov, 2010b; Higgins y Green, 2008).
Holmen y cols. (2017) indicaron los criterios de elegibilidad
específicos para su búsqueda de la literatura. Los estudios incluidos
en la revisión tenían que evaluar una aplicación móvil con
comunicación entre los pacientes con diabetes y sus médicos. Los
estudios tenían que incluir un grupo de control o de asistencia
habitual, y debían tener un diseño cuasiexperimental o
experimental. Los estudios que se centraron en la prevención

850
primaria de la diabetes o que incluyeron participantes con diabetes
gestacional se excluyeron.

Paso 6: ¿se realizó una búsqueda sistemática y


exhaustiva de la literatura de investigación?
Los términos de búsqueda clave, las distintas bases de datos
buscadas y los resultados de la búsqueda deberían registrarse en las
publicaciones de revisión sistemática y de metaanálisis. En
ocasiones, los autores proporcionan una tabla que identifica los
términos y criterios de búsqueda. La declaración PRISMA
recomienda presentar toda la estrategia de búsqueda electrónica
utilizada para al menos una base de datos principal, como CINAHL
o MEDLINE (Liberati y cols., 2009).
Con frecuencia, las búsquedas se limitan a las fuentes publicadas
en las bases de datos habituales, lo que excluye la literatura gris de
la síntesis de investigaciones. La literatura gris hace referencia a
estudios de distribución limitada, como tesis y tesinas, informes de
investigación no publicados, artículos en revistas poco conocidas,
artículos en ciertas revistas online, artículos y resúmenes de
conferencias, actas de conferencias, informes de investigaciones
dirigidos a agencias patrocinadoras e informes técnicos (Conn,
Valentine, Cooper y Rantz, 2003). La mayor parte de la literatura
gris tiene un acceso difícil a través de búsquedas en bases de datos
y no suele estar revisada por pares, con información limitada sobre
las referencias. Estos son los motivos principales por los que la
literatura gris no se incluye en las revisiones sistemáticas y los
metaanálisis. Sin embargo, descartar la literatura gris de cualquier
tipo de síntesis de investigación puede dar lugar a resultados
sesgados y engañosos (Pappas y Williams, 2011).
Holmen y cols. (2017) detallaron su estrategia de búsqueda para
su revisión sistemática que incluyó un gran número de bases de
datos y otras fuentes. Proporcionaron un ejemplo de la estrategia de
búsqueda que se utilizó en MEDLINE. Sin embargo, no
mencionaron la inclusión de literatura gris en la revisión, lo que
podría haber sesgado los hallazgos. La estrategia de búsqueda de la
literatura se presentó brevemente en la siguiente cita:

Se realizó una búsqueda de la literatura según las guías PRISMA

851
(Moher y cols., 2009). Se buscó en la literatura médica publicada
desde enero de 2008 en enero de 2016, con una búsqueda actualizada
finalizada el 23 de septiembre de 2016, utilizando Medical Literature
Analysis and Retrieval System Online (MEDLINE), PubMed,
Cumulative Index to Nursing and Allied Health Literature
(CINAHL), Excerpta Medica database (EMBASE),
ClinicalTrials.gov y la International Clinical Trials Registry
Platform de la Organización Mundial de la Salud (OMS). Revisamos
las listas de referencias de revisiones y estudios relevantes, y también
realizamos búsquedas manuales en revistas relevantes del campo,
además de estudios basados en consejos de colegas del campo. …
organizamos una estrategia de búsqueda consistente en los términos
mobile applications, cell phones, mobile phones… diabetes mellitus…
diabetes mellitus type 2.… No establecimos una limitación de idioma,
pero sí una limitación de año de publicación… pues decidimos que las
tecnologías previas a 2008 tenían pocas probabilidades de ser
aplicaciones móviles.

Holmen y cols., 2017, e227.3

Paso 7: ¿se detalló el proceso de selección de los


estudios?
La selección de los estudios para la inclusión en una revisión
sistemática o metaanálisis es un proceso complejo que implica
inicialmente la revisión y eliminación de fuentes duplicadas. Los
resúmenes de los demás artículos son revisados por dos o más
autores, y en ocasiones por un revisor externo para garantizar que
cumplen los criterios identificados en el paso 5 (v. tabla 13.2). Es
posible que los resúmenes se descarten porque los participantes, las
intervenciones, los resultados o el diseño del estudio no cumplan
los criterios de búsqueda (Bettany-Saltikov, 2010b). El proceso de
selección de estudios se ilustra mejor con un diagrama de flujo
desarrollado por el grupo PRISMA (Moher y cols., 2009). Holmen y
cols. (2017) proporcionaron una descripción detallada del proceso
que usaron en la selección de los estudios para la revisión. El
proceso de selección se documentó utilizando un diagrama de flujo

852
que identificó los seis estudios incluidos en la revisión. La siguiente
cita presenta brevemente el proceso de selección del estudio.

Selección del estudio

Dos revisores (HH y LR [autores]) revisaron de forma independiente


todos los títulos y/o resúmenes de la búsqueda. Aplicamos nuestros
criterios de inclusión y exclusión fijados a priori. Para los estudios
posiblemente elegibles, se recuperó una copia del texto completo y se
revisó de forma independiente por HH y LR. Las discrepancias se
resolvieron mediante una discusión o con la participación de un tercer
revisor (AKW).…

Se identificó un total de 2.822 artículos durante la búsqueda (fig. 1).


Después de eliminar 1.694 duplicados, las restantes 1.128 citaciones
se evaluaron mediante el título y/o resumen, y se eliminaron 913
citaciones porque no cumplían claramente nuestros criterios de
inclusión. A continuación, se obtuvo el texto completo de las 215
citaciones restantes para aclarar sus detalles del estudio y se contactó
con 22 autores para aclarar que su intervención consistiese en una
aplicación con comunicación integrada y personalizada… Después de
terminar la búsqueda, se incluyeron 6 citaciones en esta revisión.

Holmen y cols., 2017, e227.4-5

853
FIG 1 Diagrama de flujo. (Tomada de Holmen, H., Wahl, A.
K., Småstuen, M. C. y Ribu, L. [2017]. Tailored communication
within mobile apps for diabetes self-management: A systematic
review. Journal of Medical Internet Research, 19[6], e227.)

La figura 1 documenta el proceso de selección que se utilizó para


determinar los estudios incluidos en la revisión de Holmen y cols.
(2017). El diagrama consta de las cuatro fases identificadas por la
declaración PRISMA (Moher y cols., 2009): 1) identificar las fuentes,
2) evaluar las fuentes según los criterios determinados, 3)
determinar si las fuentes cumplen los requisitos de elegibilidad y 4)
identificar los estudios incluidos en la revisión.

854
FIG 1 Diagrama de flujo de la selección de estudios.
(Tomada de Hall, H., Leach, M., Brosnan, C. y Collins, M. [2017].
Nurses’ attitudes towards complementary therapies: A systematic
review and meta-synthesis. International Journal of Nursing
Studies, 69[1], 49.)

Paso 8: ¿se abordaron los sesgos de publicación?


Incluso con búsquedas rigurosas de la literatura, los autores de
metaanálisis y de revisiones sistemáticas suelen limitarse
principalmente a estudios publicados. La naturaleza de las fuentes
puede dar lugar a sesgos y a conclusiones erróneas o imprecisas en
la síntesis de investigación. Los sesgos de publicación frecuentes
que pueden producirse al realizar y publicar síntesis de
investigación son el sesgo de retraso temporal, sesgo de
localización, sesgo de publicación duplicada, sesgo de citación y
sesgo de idioma. El sesgo de publicación se produce cuando los
estudios con resultados positivos tienen más probabilidades de ser

855
publicados que aquellos con resultados negativos o no
concluyentes. Higgins y Green (2008) observaron que los estudios
con resultados positivos tienen una probabilidad cuatro veces
mayor de ser publicados que aquellos con resultados negativos. El
sesgo de retraso temporal de los estudios es un tipo de sesgo de
publicación que se produce porque los estudios con resultados
negativos suelen publicarse más tarde, en ocasiones 2-3 años
después, que aquellos con resultados positivos. En ocasiones, los
estudios con resultados negativos no se publican en absoluto,
mientras que los estudios con resultados positivos podrían
publicarse más de una vez (sesgo de publicación duplicada). El
sesgo de localización de los estudios puede producirse si los
estudios se publican en revistas de menor impacto y se indexan en
bases de datos menos buscadas. El sesgo de citación se produce
cuando algunos estudios se citan más a menudo que otros y tienen
más probabilidades de ser identificados en las búsquedas en bases
de datos. El sesgo de idioma puede producirse si las búsquedas se
centran solo en estudios en inglés y existen estudios importantes en
otros idiomas. La revisión sistemática de Holmen y cols. (2017)
podía incurrir en el sesgo de publicación, porque no se abordó la
literatura gris. Sin embargo, el idioma no fue una limitación de esta
revisión y los resúmenes duplicados se eliminaron para evitar el
sesgo de duplicación. El intervalo de tiempo de la búsqueda fue
amplio, basado en el tema de las aplicaciones móviles.

Paso 9: ¿se han presentado los elementos clave de los


estudios?
La mejor forma de identificar los elementos clave de los estudios en
las revisiones sistemáticas y metaanálisis es elaborar una tabla que
describa las características de los estudios incluidos, así como sus
propósitos, las poblaciones, los procesos de muestreo, las
intervenciones, los hallazgos y los resultados (Bettany-Saltikov,
2010b; Liberati y cols., 2009). Holmen y cols. (2017) desarrollaron
tres tablas para documentar la información clave de los seis
estudios que revisaron. En una tabla se resumieron las
características del estudio, como autores, año de publicación, país
donde se publicó el estudio, aleatorización a los grupos y abandono
de los participantes del estudio. Los estudios procedieron de seis

856
países distintos y cuatro fueron ECA. Una segunda tabla mostró los
diseños de los estudios y una tercera tabla resumió las
características de los participantes en el estudio.

Paso 10: ¿se ha realizado una valoración crítica de los


estudios y se describieron los riesgos de sesgos?
Es necesario que dos o más expertos revisen los estudios por
separado y establezcan juicios de valor sobre su calidad. La
valoración crítica de los estudios suele ser difícil por las diferencias
en los tipos de participantes, diseños, métodos de muestreo,
intervenciones, variables de resultados y métodos de medida, así
como presentación de los resultados. Con frecuencia, los estudios se
ordenan jerárquicamente de acuerdo con su calidad y contribución
al desarrollo de la revisión (Bettany-Saltikov 2010b; Liberati y cols.,
2009). Holmen y cols. (2017) utilizaron la herramienta «riesgo de
sesgo» (RdS) Cochrane para puntuar cada estudio (Higgins y
Green, 2008). Tres de los investigadores emplearon
individualmente la RdS y las puntuaciones se comentaron para
alcanzar un consenso.
Holmen y cols. (2017) también proporcionaron una discusión
detallada y tablas para identificar los riesgos de sesgos
metodológicos y de comunicación de resultados en los estudios
revisados. El sesgo metodológico suele relacionarse con problemas
del diseño y del análisis de los datos en los estudios. Por ejemplo,
los estudios podrían tener limitaciones relacionadas con la muestra,
la intervención, la medición de los resultados y las técnicas de
análisis que provoquen sesgos metodológicos. Los siguientes sesgos
metodológicos se describieron en los seis estudios revisados por
Holmen y cols. (2017): 1) uso de distintas aplicaciones móviles
(intervenciones), 2) enmascaramiento limitado del personal y de los
participantes respecto a la asignación a los grupos y 3) descripción
insuficiente de los procedimientos de aleatorización. El sesgo de
comunicación de resultados se produce cuando los resultados del
estudio no se comunican claramente y con total exactitud. Por
ejemplo, este sesgo se produce cuando los investigadores
comunican de forma selectiva los resultados positivos y no los
negativos, o cuando se abordan en detalle los resultados positivos,
con una descripción limitada de los negativos. Holmen y cols.

857
(2017) notificaron unos datos de resultados incompletos debido al
abandono en cuatro de los seis estudios revisados. La notificación
selectiva se señaló en cinco de los estudios.

Paso 11: ¿se ha realizado un metaanálisis como parte


de la revisión sistemática?
Algunos autores realizan un metaanálisis en la síntesis de fuentes
de su revisión sistemática (Liberati y cols., 2009). Como el
metaanálisis supone el uso de la estadística para resumir los
resultados de distintos estudios, habitualmente aporta información
sólida y objetiva sobre la eficacia de una intervención y
conocimientos consistentes acerca de un problema clínico. Por
ejemplo, puede realizarse un metaanálisis sobre un pequeño grupo
de estudios similares con el fin de determinar el efecto de una
intervención. La revisión sistemática de Holmen y cols. (2017) no
incluyó un metaanálisis porque los estudios carecían de calidad
metodológica rigurosa para combinarse en un metaanálisis.

Paso 12: ¿se presentaron claramente los resultados


de la revisión?
Los resultados de la revisión sistemática y metaanálisis deben
incluir una descripción de los participantes del estudio, los tipos de
intervenciones llevadas a cabo en los estudios, los resultados
medidos y los métodos de medición. Posiblemente, la mejor forma
de sintetizar los resultados de los distintos tipos de intervenciones
es una tabla que contenga lo siguiente: 1) fuente del estudio, 2)
estructura de la intervención (independiente o multifactorial), 3)
tipo específico de intervención (p. ej., tratamiento fisiológico,
educación, asesoramiento o terapia conductual), 4) método de
administración (p. ej., demostración y nueva demostración por
parte del interesado, verbal, vídeo o autoadministración), 5)
periodo de tiempo en que se aplica la intervención y 6) diferencias
estadísticas entre los grupos de intervención y control, cuidados
estándar, placebo o intervención alternativa (Liberati y cols., 2009).
La revisión sistemática de Holmen y cols. (2017) se centró en la
intervención de comunicación entre los pacientes y los médicos con
el uso de aplicaciones móviles. Los seis estudios revisados

858
incluyeron aplicaciones móviles de diversos tipos y funciones, que
se resumieron en una tabla. Se realizaron los siguientes comentarios
sobre las capacidades de las aplicaciones: «La retroalimentación
utilizada era automática o manual… y 4 aplicaciones también
ofrecían mensajes directos del paciente en texto libre… Un total de
dos aplicaciones enviaban alertas críticas a los pacientes si las
mediciones introducidas estaban fuera de los umbrales
predeterminados» (Holmen y cols., 2017, e227. 6).
El mejor modo de resumir los resultados, incluidos los resultados
primarios y secundarios, es una tabla, que podría incluir: 1) la
fuente del estudio, 2) la(s) variable(s) de resultados, con una
indicación sobre si el estudio incluía un resultado primario o
secundario, 3) el método de medición utilizado para cada variable
de resultado del estudio y 4) la calidad de los métodos de medición,
como la fiabilidad y la validez de una escala, o la precisión y
exactitud de una medida fisiológica. Holmen y cols. (2017)
resumieron los resultados primarios y secundarios de su revisión en
una tabla e indicaron que los resultados primarios y secundarios
variaron para los seis estudios. La HbA1c fue un resultado primario
en cuatro estudios y solo dos estudios notificaron una disminución
significativa de HbA1c. La presión arterial (PA) fue un resultado
primario en tres estudios, pero en dos ensayos no se midió la PA.
Los resultados secundarios sobre el conocimiento de la diabetes y la
usabilidad y la satisfacción con las aplicaciones móviles se midieron
y notificaron de forma heterogénea, por lo que no se pudieron
extraer conclusiones.

Paso 13: ¿concluyó el informe con una sección de


discusión clara?
En una revisión sistemática o metaanálisis, la discusión de los
hallazgos incluye una evaluación global de los tipos de
intervenciones aplicadas y los resultados medidos. También cabe
esperar que se aborden los aspectos metodológicos o las
limitaciones de la revisión. Por último, la sección de discusión tiene
que aportar conclusiones y recomendaciones para futuras
investigaciones y para la práctica y desarrollo de políticas (Bettany-
Saltikov, 2010b; Higgins y Green, 2008; Liberati y cols., 2009).
Holmen y cols. (2017) proporcionaron una discusión de sus

859
hallazgos, limitaciones y recomendaciones para la investigación y la
práctica. De forma global, los problemas metodológicos de estos
estudios proporcionaron resultados diversos y pocos hallazgos
concluyentes sobre el uso de aplicaciones móviles que no están
preparados para guiar la práctica.

Conclusión

Las conclusiones de esta revisión sistemática son limitadas. La calidad


metodológica poco clara y escasa de este campo de investigación
emergente es un problema principal, y aunque en tres estudios se
observó que las aplicaciones con retroalimentación integrada mejoran
significativamente el resultado primario, la evidencia tiene
limitaciones debido a su escasa calidad metodológica. Las aplicaciones
móviles formarán parte del sistema sanitario en el futuro; por tanto,
se requiere una investigación sólida en esta área con el fin de realizar
las elecciones adecuadas para el paciente, para el sistema sanitario y
para la sociedad.

Holmen y cols., 2017, e227.11-12

Paso 14: ¿se ha redactado un informe claro y conciso


para su publicación?
El informe de revisión sistemática o metaanálisis tiene que incluir el
contenido descrito en los 13 pasos anteriores. Cuando se valora
críticamente una revisión sistemática, se puede usar la tabla 13.2
para indicar si está presente cada paso y comentar su calidad y los
fundamentos que lo respaldan. En resumen, Holmen y cols. (2017)
desarrollaron una revisión sistemática de calidad siguiendo las
guías PRISMA para su publicación. El título indicó claramente el
tipo de síntesis realizada. No se expresó ninguna pregunta clínica
para dirigir la revisión, pero se proporcionaron antecedentes, de
modo que se pudiera desarrollar el formato PICOS. Se identificó
una laguna de conocimientos para la práctica de enfermería y el fin
de la revisión se centró en esta área. La búsqueda de la literatura
podría haber sido más rigurosa e incluir más estudios,
especialmente de la literatura gris. La selección de estudios para la

860
síntesis se presentó claramente en un diagrama de flujo y se
documentó con sus fundamentos. Los estudios seleccionados para
la revisión sistemática se valoraron críticamente, y los resultados de
estas síntesis se presentaron claramente en tablas y texto. La
publicación concluyó con los hallazgos, limitaciones y
recomendaciones relevantes para la investigación y la práctica.

Valoración crítica de metaanálisis


Un metaanálisis se realiza con el fin de agrupar o combinar
estadísticamente los resultados de estudios previos en un único
análisis cuantitativo que alcanza uno de los niveles de evidencia
más altos sobre la eficacia de una intervención (Andrel, Keith y
Leiby, 2009; Cooper, 2017; Liberati y cols., 2009). Este enfoque tiene
una objetividad específica, porque incluye técnicas de análisis que
determinan el efecto de una intervención al mismo tiempo que
exploran las influencias de las variaciones en los estudios incluidos
en el metaanálisis. La heterogeneidad de los estudios incluidos en
un metaanálisis puede conducir a distintos tipos de sesgos
metodológicos y de comunicación de resultados comentados
previamente. Los metaanálisis que contienen estudios más
homogéneos (similares) tienen menos sesgos y suelen aportar
hallazgos más válidos (Moore, 2012).
Combinar estadísticamente datos de varios estudios produce un
tamaño muestral grande, con más potencia para determinar el
auténtico efecto de una intervención específica. El objetivo último
de un metaanálisis es determinar si una intervención: 1) mejora
significativamente los resultados, 2) ejerce un efecto mínimo o nulo
sobre los resultados o 3) aumenta el riesgo de eventos adversos. Los
metaanálisis son también una forma eficaz de resolver hallazgos
contradictorios de estudios y controversias que hayan surgido
respecto a una intervención seleccionada (Higgins y Green, 2008).
Los indicios sólidos que respaldan el uso de una intervención en
la práctica pueden provenir de un metaanálisis de múltiples
estudios de calidad tales como ECA y otros estudios
cuasiexperimentales. No obstante, la realización de un metaanálisis
depende de la exactitud, claridad y plenitud de la información
presentada en los estudios. El cuadro 13.2 contiene una lista de la

861
información que debe incluirse en un informe de investigación para
facilitar la realización de un metaanálisis. Se puede utilizar esta
información como lista de verificación para determinar si los
informes de ECA y otros estudios de intervención son completos.

CUADRO 13.2 RECOMENDACIONES PARA LOS


INVESTIGADORES SOBRE LA INFORMACIÓN
QUE DEBE INCLUIRSE EN LOS INFORMES
CON EL FIN DE FACILITAR LA REALIZACIÓN
DE METAANÁLISIS
Variables demográficas relevantes para la población
estudiada

• Edad.
• Sexo.
• Estado civil.
• Etnicidad.
• Educación.
• Estatus socioeconómico.

Características metodológicas

• Tamaño de la muestra (grupos control y experimental).


• Tipo de método de muestreo.
• Tasa de rechazo del muestreo y de abandono de la muestra.
• Características de la muestra.
• Diseño de investigación.
• Grupos incluidos en el estudio: grupos experimental, control,
de comparación y placebo.
• Protocolo de la intervención y discusión de la fidelidad.
• Técnicas de recogida de datos.
• Mediciones de resultados.
• Fiabilidad y validez de los instrumentos.
• Precisión y exactitud de las medidas fisiológicas.

862
Análisis de los datos

• Nombres de las pruebas estadísticas.


• Tamaño muestral para todas las pruebas estadísticas.
• Grados de libertad de todas las pruebas estadísticas.
• Valor exacto de todas las pruebas estadísticas.
• Valor exacto de p de todas las pruebas estadísticas.
• Prueba estadística de una o dos colas.
• Medidas de tendencia central (media, mediana y moda).
• Medidas de dispersión (rango, desviación estándar).
• Valores de los análisis post hoc para ANOVA (análisis de la
varianza) de tres o más grupos.

Los pasos para valorar críticamente un metaanálisis son similares


a los utilizados con las revisiones sistemáticas (detallados
previamente en la tabla 13.2). La declaración PRISMA (Moher y
cols., 2009), las guías de la Colaboración Cochrane para
metaanálisis (Higgins y Green, 2008) y otros recursos (Andrel y
cols., 2009; Moore, 2012; Setia, 2016; Turlik, 2010) se usaron para la
valoración crítica de un metaanálisis. Se presenta como ejemplo el
metaanálisis de Conn (2010) para determinar el efecto de las
intervenciones de actividad física (AF) sobre los resultados de
síntomas depresivos en adultos sanos.

Pregunta clínica que dirige un metaanálisis


La pregunta clínica desarrollada para un metaanálisis suele estar
claramente centrada: «¿Cuál es la eficacia de una intervención
seleccionada?». El formato PICOS (participantes o población,
intervención, comparaciones de la intervención o controles,
resultados [outcomes] y diseño del estudio [study]), descrito
anteriormente, puede utilizarse también para formular la pregunta
clínica (Moher y cols., 2009). Conn (2010) indicó que solo un
metaanálisis anterior había examinado el efecto de la AF sobre los
síntomas depresivos en los participantes en el estudio sin depresión
clínica. El metaanálisis realizado por Conn se centró en la siguiente
pregunta clínica: «¿Cuál es el efecto de la AF sobre los síntomas

863
depresivos en adultos sanos?».

Propósito y preguntas para dirigir un metaanálisis


Los investigadores deben identificar el propósito de su metaanálisis
y las preguntas u objetivos que lo guían. Conn (2010) identificó
claramente el siguiente propósito relevante y las preguntas de
investigación que guiaron su metaanálisis:

Este metaanálisis sintetizó los resultados de síntomas depresivos de


las intervenciones de AF supervisadas y no supervisadas en adultos
sanos.… Este metaanálisis abordó las siguientes cuestiones de
investigación:

1) ¿Cuáles son los efectos globales de las intervenciones de AF


supervisada y no supervisada sobre los síntomas depresivos en
adultos sanos sin depresión clínica?
2) ¿Varían los efectos de las intervenciones sobre los resultados de
síntomas depresivos según la intervención, muestra y
características del diseño de la investigación?
3) ¿Cuáles son los efectos de las intervenciones sobre los síntomas
depresivos en los estudios que comparan individuos en
tratamiento antes y después de las intervenciones?

Conn, 2010, págs. 128-129

Criterios de búsqueda y estrategias para los


metaanálisis
Los criterios de búsqueda suelen ser más restringidos para un
metaanálisis que para una revisión sistemática, con el fin de
identificar los estudios específicos que examinan el efecto de una
intervención determinada. Conn (2010) identificó claramente las
estrategias de búsqueda detalladas en el siguiente extracto. La
autora utilizó una búsqueda intrabibliográfica, que consiste en
usar las citas de estudios relevantes para identificar otros estudios.

Estrategias de búsqueda de estudios primarios

864
Se utilizaron múltiples estrategias de búsqueda para asegurar que
esta fuera exhaustiva y limitar así los sesgos, avanzando al mismo
tiempo respecto a las revisiones previas. Un bibliotecario experto en
bibliografía buscó en 11 bases de datos electrónicas (p. ej.,
MEDLINE, PsycINFO, EMBASE) utilizando términos de búsqueda
amplios (ejemplos de términos de intervención en MEDLINE:
cumplimiento, tratamiento conductual… términos de AF: ejercicio,
actividad física, forma física…. Los términos de búsqueda de síntomas
depresivos no se utilizaron para limitar la búsqueda porque muchos
estudios de intervención de AF comunican resultados de síntomas
depresivos, pero no consideran a estos los resultados principales del
estudio, y por este motivo los artículos no se indexan por esos
términos…. Las búsquedas electrónicas por autor se llevaron a cabo
para los investigadores principales de proyectos localizados a partir de
los registros de investigaciones y para los tres primeros autores de los
estudios candidatos. Las búsquedas por autor se realizaron también
en el caso de los autores de tesis con el fin de localizar artículos
publicados. En los artículos candidatos y de revisión, se llevó a cabo
una búsqueda intrabibliográfica. En el caso de 114 revistas que
contienen con frecuencia investigaciones sobre intervenciones de AF
se completó una búsqueda manual.

Conn, 2010, pág. 129

Posibles sesgos de los metaanálisis


Los sesgos de publicación, metodológicos y de comunicación de
resultados pueden debilitar la validez de los hallazgos del
metaanálisis. Es posible usar un método de análisis denominado
gráfico de embudo para evaluar los sesgos de un grupo de estudios.
Aquí se describen brevemente los gráficos de embudo, pero
esperamos que esto permita comprender los diagramas de embudo
incluidos en la mayoría de los metaanálisis.
Los gráficos de embudo son representaciones gráficas de los
posibles tamaños del efecto (TE) para las intervenciones en estudios
seleccionados (v. el cálculo del TE en el cap. 9). El TE, o solidez de
una intervención en un estudio, puede calcularse determinando la

865
diferencia entre el grupo control y el experimental respecto a la
variable de resultado. Resulta más sencillo determinar la diferencia
media entre los grupos control y experimental para varios estudios
si la variable de resultado se mide con la misma escala o
instrumento en todos los estudios. No obstante, hay que calcular la
diferencia estandarizada de las medias (DEM) en los metaanálisis
cuando el mismo resultado, como depresión, se mide mediante
distintas escalas o métodos. Más adelante en esta misma sección se
ofrecen más detalles sobre la DEM.
La figura 13.1 muestra un gráfico de embudo hipotético de las
DEM de 13 estudios. Los estudios con tamaños muestrales
pequeños están hacia la parte baja de la gráfica y los que tienen
tamaños mayores están hacia la parte alta. Las DEM de los estudios
son bastante simétricas o están divididas en partes iguales por la
línea media del embudo en la gráfica. Un gráfico de embudo
simétrico indica que el sesgo de publicación es limitado. La
asimetría del gráfico de embudo se debe sobre todo al sesgo de
publicación, pero también a los sesgos metodológicos y de
comunicación de resultados, a la heterogeneidad de los tamaños
muestrales y de las intervenciones de los estudios, así como al azar.

FIG 13.1 Gráfico de embudo de las diferencias


estandarizadas de las medias para ensayos
controlados aleatorizados hipotéticos con sesgos
limitados. ECA, ensayos controlados aleatorizados.

866
(Tomada de Gray, J. R., Grove, S. K. y Sutherland, S. [2017]. The
practice of nursing research: Appraisal, synthesis, and generation
of evidence [8.ª ed.]. San Luis, Missouri: Elsevier.)

Conn (2010) incluyó una discusión sobre la calidad de los


resultados de su búsqueda de la literatura y de los riesgos de sesgo
en su metaanálisis. La siguiente cita incluye contenido clave
referente a los resultados de la búsqueda y a los riesgos de sesgos:

«Las búsquedas exhaustivas hallaron 70 trabajos… La comparación


entre dos grupos de AF [actividad física] supervisada incluyó a 1.598
sujetos. La comparación entre dos grupos de AF [actividad física] no
supervisada incluyó 1.081 sujetos. Las comparaciones de tratamientos
con un grupo único contaron con 1.639 sujetos con AF supervisada y
3.420 con AF no supervisada. La mayoría de los estudios primarios
eran artículos publicados (s = 54) y el resto, tesis (s = 14), capítulos de
libros (s = 1) y materiales de presentación en conferencias (s = 1; s
indica el número de trabajos). El sesgo de publicación resultó evidente
en los gráficos de embudo elaborados para las comparaciones de
resultados entre dos grupos con AF supervisada y no supervisada, y
para las comparaciones entre AF supervisada y AF no supervisada
para grupos de tratamiento, antes y después de la intervención.

Conn, 2010, pág. 131

Resultados de metaanálisis
Muchos estudios de enfermería examinan variables de resultados
continuas o resultados medidos con métodos que producen datos a
nivel de intervalos o de razón. Las mediciones fisiológicas de la
presión arterial determinan datos a nivel de razón. Las escalas de
tipo Likert, como la escala Center for Epidemiologic Studies-
Depression (CES-D), generan datos a nivel de intervalos (v. una
copia de la CES-D en el cap. 10). Por tanto, la presión arterial y la
depresión son resultados continuos. El efecto de una intervención
sobre un resultado continuo en un metaanálisis está determinado
por la diferencia media entre dos grupos. La diferencia media es un
parámetro estadístico estándar que identifica la diferencia media
entre dos grupos. Se trata de una estimación de la cantidad de

867
variación causada por la intervención (p. ej., AF) sobre el resultado
(p. ej., depresión), en promedio, respecto al grupo control. La
diferencia media se describe en un metaanálisis para identificar el
efecto de una intervención, pero solo es apropiada si el resultado se
mide con la misma escala en todos los estudios (Higgins y Green,
2008).
La diferencia estandarizada de las medias (DEM), o d, es un
parámetro estadístico de resumen que se describe en un
metaanálisis cuando el mismo resultado se mide con distintas
escalas o métodos. La DEM también se denomina a veces tamaño
del efecto medio estandarizado. Por ejemplo, en el metaanálisis de
Conn (2010), la depresión se medía habitualmente con tres escalas
diferentes: perfil de estados de ánimo, inventario de depresión de
Beck y CES-D. Los estudios que tienen diferencias en las medias en
la misma proporción respecto a las desviaciones estándar
comparten la misma DEM (d), con independencia de las escalas
usadas para medir la variable de resultado. «Se asume que las
diferencias en las medias y desviaciones estándar de los estudios
son el resultado de las escalas de medición y no de la variabilidad
en el resultado» (Higgins y Green, 2008, pág. 256).
El resultado del metaanálisis de Conn (2010) identificó un tamaño
de efecto medio estandarizado de 0,372 (TE moderado) entre el
grupo control y de tratamiento para los 38 estudios con AF
supervisada y una DEM de 0,522 (TE fuerte) en los 22 estudios de
AF no supervisada. (El cap. 9 ofrece los valores para determinar TE
pequeños, moderados y fuertes.) Este metaanálisis documentó que
la AF supervisada y no supervisada reducía los síntomas de
depresión en adultos sanos o adultos sin depresión clínica. Por
tanto, una reducción de la depresión es otro motivo importante
para recomendar a los pacientes que realicen actividades físicas
estructuradas y no estructuradas.

VALORACIÓN CRÍTICA DE
METASÍNTESIS
La síntesis de investigaciones cualitativas es el proceso y el
producto de la revisión sistemática, la valoración crítica y la

868
integración formal de los estudios cualitativos para determinar el
conocimiento para la práctica (Butler, Hall y Copnell, 2016;
Finfgeld-Connett, 2010). El nombre de síntesis de investigación
cualitativa y el proceso para su realización están en continua
evolución en enfermería. En la literatura se encuentran varios
métodos de síntesis de investigaciones cualitativas, como
metasíntesis, metaetnografía, metaestudio, metanarrativa,
metarresumen cualitativo, metaanálisis cualitativo y análisis
agregado (Barnett-Page y Thomas, 2009; Butler y cols., 2016;
Sandelowski y Barroso, 2007; Tong, Flemming, McInnes, Oliver y
Craig, 2012). A pesar de la ausencia de consenso, los investigadores
cualitativos reconocen la importancia de resumir los hallazgos
cualitativos con el fin de determinar el conocimiento actual que
podría usarse en la práctica, para dirigir investigaciones adicionales
o para el desarrollo de políticas.
La metasíntesis parece ser el término más frecuente para el
proceso de sintetizar estudios cualitativos (Butler y cols., 2016;
Melnyk y Fineout-Overholt, 2015; Sandelowski y Barroso, 2007;
Tong y cols., 2012). En este libro, una metasíntesis se define como la
recopilación e integración sistemáticas de resultados de estudios
cualitativos para aumentar la comprensión y desarrollar una
interpretación única de los hallazgos de estudios en un área
seleccionada. El foco de atención se centra en la interpretación en
lugar de en la combinación de los resultados del estudio, como
sucedía con la síntesis de la investigación cuantitativa. Una
metasíntesis supone disgregar los hallazgos de distintos estudios
para descubrir sus características esenciales y a continuación
combinar esas ideas en un todo único transformado. Sandelowski y
Barroso (2007) identificaron los metarresúmenes como un paso en
la creación de metasíntesis. Un metarresumen es la síntesis de
hallazgos de trabajos cualitativos con el fin de identificar
conocimientos en un área determinada.
Tong y cols. (2012) desarrollaron la declaración Enhancing
Transparency in Reporting Synthesis of Qualitative Research
(ENTREQ), y Butler y cols. (2016) desarrollaron guías para fomentar
la consistencia al publicar las síntesis cualitativas. Mediante una
combinación de ideas de distintas fuentes, se desarrollaron las
siguientes ideas para guiar a los estudiantes y profesionales de

869
enfermería en la valoración crítica de metasíntesis. Aquí se realiza
la valoración crítica de una metasíntesis efectuada por Hall, Leach,
Brosnan y Collins (2017) utilizando estas preguntas.

GUÍAS DE VALORACIÓN CRÍTICA


Valoración crítica de metasíntesis

A Introducción y determinación del marco de la metasíntesis


1. ¿Identificó el título del informe que se trata de una
metasíntesis?
2. ¿El resumen incluye los antecedentes, el fin o la
pregunta clínica abordada, el proceso de búsqueda
de la literatura, la metodología para sintetizar los
estudios cualitativos, los resultados, los hallazgos y
las conclusiones?
3. ¿Identificaron claramente los autores el fin u
objetivo de su metasíntesis?
4. ¿Tiene la metasíntesis un marco para aclarar su foco
y ámbito, con el fin de que sea manejable?
B Búsqueda de la literatura y selección de las fuentes
5. ¿Han realizado los autores una búsqueda
sistemática y exhaustiva, y han obtenido estudios
cualitativos del área de la síntesis?
6. ¿Se ha detallado el proceso de selección de estudios
para la metasíntesis?
C Valoración crítica de los estudios y análisis de los datos
7. ¿Se ha descrito el proceso de valoración crítica de
los estudios?
8. ¿Se ha detallado el análisis de los hallazgos de los
estudios cualitativos y se han presentado los
resultados con claridad?
D Discusión de los hallazgos de la metasíntesis
9. ¿Han discutido claramente los autores la
interpretación de los hallazgos de los estudios
cualitativos?
10. ¿Se han presentado claramente los hallazgos de la

870
metasíntesis, incluidos los temas identificados y/o un
modelo o mapa de los hallazgos globales?
11. ¿El informe de la metasíntesis era completo y
conciso? (Butler y cols., 2016; Finfgeld-Connett, 2010;
Higgins y Green, 2008; Tong y cols., 2012)?

Introducción y determinación del marco de


la metasíntesis
En el título de su artículo, Hall y cols. (2017) identificaron que su
síntesis de las actitudes de los profesionales de enfermería hacia las
terapias complementarias es una revisión sistemática y
metasíntesis. Sin embargo, en este artículo solo se incluyó una
metasíntesis de estudios cualitativos. Los investigadores
proporcionaron un resumen de calidad de su síntesis que incluyó
los antecedentes, el fin de la metasíntesis, la búsqueda de la
literatura, el proceso ENTREQ para la síntesis de los estudios, los
resultados, la discusión de los hallazgos y las conclusiones.
Una metasíntesis debe enmarcarse por un objetivo o fin y ámbito
claramente indicados. El fin de la metasíntesis suele ser un área
importante de interés para las personas que la realizan y es un tema
con un conjunto adecuado de estudios cualitativos. El ámbito de
una metasíntesis es un área de debate. Algunos investigadores
cualitativos recomiendan un enfoque preciso y restringido,
mientras que otros aconsejan un enfoque más amplio y más
inclusivo. Sin embargo, los investigadores reconocen que establecer
el marco es esencial para que el proceso de síntesis sea manejable y
los hallazgos significativos y potencialmente transferibles a la
práctica (Butler y cols., 2016; Walsh y Downe, 2005).
Hall y cols. (2017, pág. 48) indicaron que: «El fin de esta
metasíntesis es revisar, valorar críticamente y sintetizar la
investigación para desarrollar una interpretación más sustancial de
las actitudes de los profesionales de enfermería respecto a las
terapias complementarias… Esta revisión se publicó según las guías
Enhancing Transparency in Reporting the Synthesis of Qualitative
Research (ENTREQ) (Tong y cols., 2012).

Búsqueda de la literatura y selección de las


871
fuentes
La mayoría de los autores coinciden en que es necesario realizar
una búsqueda rigurosa de la literatura. La búsqueda tiene que
incluir bases de datos, libros y capítulos de libros, y textos
completos de tesis y tesinas, así como informes de conferencias. A
menudo, los investigadores documentan las estrategias específicas
de búsqueda que usan para localizar estudios cualitativos
relevantes de cara a su síntesis. Los criterios de búsqueda deben
detallarse en el informe de síntesis y es necesario indicar los años de
la búsqueda, las palabras clave buscadas, así como los idiomas de
las fuentes. Las metasíntesis suelen limitarse a los estudios
cualitativos únicamente y no incluyen estudios de métodos mixtos
(Butler y cols., 2016; Whittemore y cols., 2014). Además, se suelen
descartar hallazgos cualitativos que no han sido analizados o
interpretados, como citas no analizadas, notas de campo, historiales
de casos, historias y poemas (Finfgeld-Connett, 2010). El proceso de
búsqueda suele ser muy fluido y se realizan búsquedas
informáticas y manuales adicionales para identificar más estudios.
Hall y cols. (2017) incluyeron la siguiente discusión de sus criterios
de búsqueda, estrategias de búsqueda y la selección de estudios
para la síntesis.

Criterios de inclusión y exclusión

Los estudios empíricos cualitativos publicados que describen las


actitudes de los profesionales de enfermería hacia las terapias
complementarias se incluyeron en esta revisión. Los profesionales de
enfermería podrían estar contratados en cualquier nivel, en cualquier
entorno clínico y en cualquier país. Para esta revisión, nosotros
consideramos las terapias complementarias como un término general
amplio en lugar de centrarnos en productos o prácticas específicas.
Los estudios que implican múltiples grupos profesionales se
excluyeron debido a la posible dificultad para extraer e interpretar los
datos específicos de enfermería.

Estrategia de búsqueda

872
Se realizó una búsqueda exhaustiva de los artículos relevantes
publicados en inglés entre enero de 2000 y diciembre de 2015
utilizando las siguientes bases de datos electrónicas: MEDLINE,
CINAHL y AMED (Allied and Complementary Medicine Database).
En la tabla 1, se presenta una lista de los términos usados en la
búsqueda. Las listas de referencias de los artículos incluidos también
se buscaron de forma manual para localizar publicaciones adecuadas,
y se usaron opengrey.edu, greylit.com y Google Académico para
identificar literatura gris pertinente.

Hall y cols., 2017, pág. 48

TABLA 1
TÉRMINOS DE BÚSQUEDA

Tomada de Hall, H., Leach, M., Brosnan, C. y Collins, M. (2017). Nurses’


attitudes towards complementary therapies: A systematic review and meta-
synthesis. International Journal of Nursing Studies, 69(1), 48.
Hall y cols. (2017) identificaron unos criterios de búsqueda
apropiados y los implementaron claramente en su informe. Las
estrategias de búsqueda se detallaron y la inclusión de la literatura
gris redujo el potencial de sesgo de publicación. La búsqueda sí
tuvo un sesgo de idioma, porque solo se revisaron estudios en
inglés. Los términos de búsqueda clave se identificaron con
claridad en una tabla (v. tabla 1) y la búsqueda se reforzó mediante
la revisión de las fuentes de los últimos 15 años.

TABLA 1
USO DEL MODELO DE IOWA PARA PROYECTOS DE
PRÁCTICA BASADA EN LA EVIDENCIA CON EL FIN DE

873
ESTABLECER UNA HERRAMIENTA CLÍNICA DESTINADA A
LA EVALUACIÓN DEL RIESGO DE ÚLCERAS POR PRESIÓN
EN UNA UCIN

HOC, heridas, ostomía y continencia; IHI, Institute for Healthcare


Improvement; UCIN, unidad de cuidados intensivos neonatales; UPAH,
úlcera por presión adquirida en el hospital.
Tomada de Schumacher, B., Askew, M. y Otten, K. (2013). Development of
a pressure ulcer trigger tool for the neonatal population. Journal of Wound,
Ostomy, and Continence Nursing, 40(1), 47.
La selección final de los estudios que se van a incluir en una
metasíntesis depende del foco y del ámbito de la síntesis. Algunos

874
autores se centran en un tipo de investigación cualitativa, como
etnografía, o en un investigador de un área particular. Otros
incluyen estudios con distintas metodologías cualitativas e
investigadores de un campo o de campos relacionados. Los criterios
de búsqueda tienen que aplicarse de forma coherente a la hora de
determinar los estudios que se incluirán y descartarán en la síntesis.
Hall y cols. (2017) incluyeron un diagrama de flujo detallado (v. fig.
1) para documentar su proceso de selección de los 15 estudios
incluidos en su metasíntesis.

875
FIG 1 Diagrama de flujo de una revisión de la
literatura. IC, insuficiencia cardiaca. (Tomada de Karimi,
M. y Clark, A. M. [2016]. How do patients’ values influence heart
failure self-care decision-making? A mixed-methods systematic
review. International Journal of Nursing Studies, 59[1], 93.)

Valoración crítica de los estudios y análisis


de los datos
El proceso de valoración crítica para una búsqueda cualitativa varía
según las fuentes. Por lo general, se crea una tabla como parte del
proceso de valoración, pero esto también es objeto de debate
porque las tablas de estudios se incluyen con más frecuencia en las
síntesis de estudios cuantitativos. Los encabezamientos de la tabla
podrían incluir: 1) autor y año de la fuente, 2) fin o meta del
estudio, 3) orientación metodológica, 4) participantes, 5) hallazgos y
6) otros contenidos clave relevantes para la comparación. Esta tabla
representa elementos relevantes de los estudios de modo que sea
posible realizar una valoración comparativa (Butler y cols., 2016;
Finfgeld-Connett, 2010). El análisis comparativo de los estudios

876
supone examinar la metodología y los hallazgos de los estudios en
busca de similitudes y diferencias. Se puede registrar la frecuencia
de hallazgos similares. Las diferencias o contradicciones de los
estudios tienen que ser resueltas y/o explicadas. A menudo, los
investigadores utilizan distintas técnicas de análisis para
transformar los hallazgos de los diferentes estudios a una
descripción nueva o exclusiva. Tong y cols. (2012) presentan una
tabla resumen de las metodologías frecuentes usadas para la
síntesis de estudios cualitativos.
Hall y cols. (2017, pág. 49) indicaron que los «hallazgos de esta
revisión se basan en cinco artículos de EE.UU., tres de Australia,
dos de Reino Unido y Tailandia, y un artículo de Taiwán, Canadá e
Israel». Estos 15 estudios se presentaron en detalle en una tabla de
análisis comparativo que incluyó los encabezamientos apropiados
de autores, año, fin, método, participantes y hallazgos. Dos
revisores (HH y MC) extrajeron datos de forma independiente de
los estudios. «Los datos se analizaron utilizando el proceso de
síntesis temática… En la etapa final, los revisores completaron un
análisis inductivo de los temas para desarrollar una interpretación
que fuese más allá del contenido de los estudios originales» (Hall y
cols., 2017, pág. 49).

Discusión de los hallazgos de la


metasíntesis
Un informe de metasíntesis incluye hallazgos presentados en
distintos formatos de acuerdo con el conocimiento desarrollado y la
perspectiva de los autores. Una síntesis de estudios cualitativos en
un área quizá permita el descubrimiento de temas exclusivos o más
sofisticados que expliquen el área de síntesis. Los hallazgos de una
metasíntesis se podrían presentar en formato de texto o
gráficamente en un modelo o mapa. Los autores también deberían
identificar las limitaciones de la metasíntesis. El informe suele
concluir con recomendaciones para futuras investigaciones e
implicaciones para la práctica (Butler y cols., 2016; Tong y cols.,
2012; Walsh y Downe, 2005).
Hall y cols. (2017, pág. 49) identificaron los siguientes hallazgos:
«Los datos permitieron deducir cinco temas analíticos referentes a

877
las actitudes de los profesionales de enfermería hacia las terapias
alternativas: los puntos fuertes y débiles de la medicina
convencional; las terapias complementarias como una forma de
potenciar la práctica de enfermería; el empoderamiento del paciente
y la práctica centrada en el paciente; las barreras culturales y los
facilitadores para la integración». El informe del metaanálisis
incluyó una discusión de las limitaciones, implicaciones para la
práctica y conclusiones. Hall y cols. (2017, pág. 47) concluyeron que
«La profesión de enfermería debe considerar el modo de abordar
las deficiencias actuales relativas al uso de terapias
complementarias por los pacientes».

VALORACIÓN CRÍTICA DE
REVISIONES SISTEMÁTICAS DE
MÉTODOS MIXTOS
En los últimos años, los investigadores de enfermería han realizado
estudios por métodos mixtos que incluyen métodos de
investigación cuantitativa y cualitativa (Creswell, 2014; Gray y cols.,
2017) (v. la investigación de métodos mixtos en el cap. 14). Los
investigadores son conscientes de la importancia de sintetizar los
hallazgos de estos estudios con el fin de determinar conocimientos
importantes para la práctica y las investigaciones futuras. Creswell
(2014) identificó este proceso de combinación de hallazgos
procedentes de estudios cuantitativos y cualitativos como síntesis
de métodos mixtos. Higgins y Green (2008) denominaron a esta
síntesis de estudios cuantitativos, cualitativos y de métodos mixtos
revisión sistemática de métodos mixtos, que es el término utilizado
en este libro.
Las revisiones sistemáticas descritas anteriormente en este
capítulo solo incluían estudios con metodología cuantitativa, como
metaanálisis, ECA y estudios cuasiexperimentales, para determinar
la eficacia de una intervención. La revisión sistemática de métodos
mixtos puede incluir varios diseños de estudios, como distintos
tipos de investigación cualitativa; estudios cuantitativos
descriptivos, de correlación y cuasiexperimentales y/o estudios de
métodos mixtos (Bettany-Saltikov, 2010b; Higgins y Green, 2008;

878
Liberati y cols., 2009; Whittemore y cols., 2014).
Higgins y Green (2008) describieron dos tipos de enfoques
destinados a integrar los hallazgos procedentes de estudios
cuantitativos, cualitativos y de métodos mixtos: síntesis multinivel
y síntesis paralela. La síntesis multinivel consiste en sintetizar los
hallazgos de estudios cuantitativos de forma separada respecto a
los de los estudios cualitativos e integrar los hallazgos de estas dos
síntesis en el informe final. La síntesis paralela consiste en la
síntesis separada de los estudios cuantitativos y cualitativos, pero
los hallazgos de la síntesis cualitativa se usan para interpretar los
estudios cuantitativos sintetizados.
Son necesarios más trabajos con el fin de desarrollar la
metodología necesaria para realizar una revisión sistemática de
métodos mixtos. Los pasos se solapan con los de los procesos de
revisión sistemática y metasíntesis expuestos anteriormente. Es
posible que la mejor forma de llevar a cabo este proceso sea con un
equipo de investigadores expertos en la realización de distintos
tipos de estudios y síntesis de investigaciones. A continuación, se
exponen las guías de valoración crítica de revisiones sistemáticas de
métodos mixtos.

GUÍAS DE VALORACIÓN CRÍTICA


Valoración crítica de revisiones sistemáticas
de métodos mixtos

A Introducción de la revisión sistemática de métodos mixtos


1. ¿El título identificó el tipo de síntesis de
investigaciones realizada?
2. ¿Existía un resumen claro y conciso que incluía el
objetivo de la revisión, las fuentes de datos, el
proceso de selección del estudio, los resultados, los
hallazgos y las conclusiones?
3. ¿El objetivo y/o las preguntas guiaron la revisión
sistemática de métodos mixtos?
B Métodos de búsqueda de la literatura y selección de las
fuentes

879
4. ¿Cuáles fueron los criterios de búsqueda para
identificar los estudios cuantitativos, cualitativos y
de métodos mixtos?
5. ¿Se han detallado lo suficiente las estrategias de
búsqueda para identificar estudios cuantitativos,
cualitativos y de métodos mixtos relevantes?
6. ¿Se ha realizado una búsqueda rigurosa de la
literatura y se detalla en el informe final?
7. ¿Se ha descrito el proceso de selección de los
estudios cuantitativos, cualitativos y de métodos
mixtos relevantes para la síntesis?
C Valoración crítica de los estudios y resultados
8. ¿Los autores de la revisión presentaron una tabla y
un texto que mostraran una valoración comparativa
de los estudios llevada a cabo?
9. ¿Se resumieron las valoraciones críticas de los
estudios en el informe final y se proporcionaron los
resultados?
D Hallazgos, conclusiones e implicaciones para la
investigación y la práctica
10. ¿Se ha presentado una síntesis clara de los hallazgos
de los estudios? ¿Integró esta síntesis de forma eficaz
los hallazgos de estudios cuantitativos, cualitativos y
de métodos mixtos?
11. ¿Se identificaron las implicaciones para la
investigación y la práctica (Bettany-Saltikov, 2010a,
2010b; Creswell, 2014; Higgins y Green, 2008)?

Introducción de la revisión sistemática de


métodos mixtos
Karimi y Clark (2016) realizaron una revisión sistemática de
métodos mixtos para determinar el modo en el que los valores de
los pacientes influían en la toma de decisiones de pacientes con
insuficiencia cardiaca (IC) sobre el autocuidado. En su título,
indicaron que se realizó una revisión sistemática de métodos
mixtos. El título también incluyó la pregunta clínica que guio la
revisión: How do patients’ values influence heart failure self-care

880
decision-making? (¿Cómo influyen los valores de los pacientes en la
toma de decisiones sobre el autocuidado de la insuficiencia
cardiaca?) (Karimi y Clark, 2016, pág. 89). El resumen abarcó de
forma clara y concisa los antecedentes que respaldaban la revisión,
el proceso de búsqueda, el tipo y número de estudios seleccionados
para la revisión, los hallazgos y las conclusiones. Los tres objetivos
o fines de esta síntesis se identificaron en una fase precoz de la
revisión y dirigieron el proceso de revisión.

Métodos de búsqueda de la literatura y


selección de las fuentes
Karimi y Clark (2016) realizaron una búsqueda exhaustiva de
múltiples bases de datos y de otras fuentes con ayuda de un
bibliotecario especializado en ciencias de la salud. «La búsqueda
incluyó términos relacionados con tres conceptos: autocuidado,
valores e IC… e identificó 6.467 estudios. Se evaluaron inicialmente
por su título y resumen, lo que dio lugar a una revisión a texto
completo de 579 artículos (fig. 1). De ellos, 54 cumplieron los
criterios de inclusión» (Karimi y Clark, 2016, pág. 92). Como se
indica en la figura 1, los 54 estudios revisados incluyeron 30
estudios cualitativos, 8 estudios de métodos mixtos y 16 estudios
cuantitativos. Los participantes en estos estudios fueron 6.045
pacientes, 38 cuidadores no profesionales y 96 profesionales
sanitarios. Esta revisión sistemática de métodos mixtos incluyó una
muestra amplia de estudios que representaba los tres tipos de
metodologías e incluyó muchos datos de numerosos pacientes,
cuidadores y profesionales sanitarios.

Valoración crítica de los estudios y


resultados
Los datos de los 54 estudios se presentaron en un formato de tabla
comparativa. Los encabezamientos en la tabla incluyeron el autor y
año, el foco primario, los métodos, el país, los métodos de recogida
de datos, el muestreo, los participantes, la clase de la New York
Heart Association (NYHA), el promedio de edad y una escala de
calidad del estudio. Se realizó un análisis comparativo utilizando

881
los datos de la tabla que se sinterizaron en el informe. Karimi y
Clark (2016, págs. 101-102) reconocieron la posibilidad de un sesgo
de publicación porque «nuestra búsqueda se limitó solo al idioma
inglés, a revistas revisadas por pares o a tesis publicadas a partir del
año 2000... Los hallazgos también se vieron restringidos, debido a
que la mayoría de los estudios incluidos se realizaron en países de
alta renta per cápita. Pocos describían las características de quienes
declinaron participar en el estudio». Un problema grave fue la falta
de estudios que abordasen explícitamente los valores de los
pacientes y los autores tuvieron que extraer el contenido de los
valores a partir de las discusiones teóricas.

Hallazgos, conclusiones e implicaciones


para la investigación y la práctica
Karimi y Clark (2016) sintetizaron sus hallazgos en un modelo del
proceso de toma de decisiones sobre el autocuidado con una alta
carga de valores (fig. 3). Las relaciones en este modelo orientan la
práctica y deberían evaluarse mediante más investigaciones. Los
autores desarrollaron las conclusiones, las implicaciones y las
direcciones para investigaciones adicionales basándose en los
hallazgos de su revisión sistemática de métodos mixtos. Afirmaron
lo siguiente:

882
FIG 3 Proceso de toma de decisiones de autocuidado
cargado de valores. (Tomada de Karimi, M. y Clark, A. M.
[2016]. How do patients’ values influence heart failure self-care
decision-making? A mixed-methods systematic review.
International Journal of Nursing Studies, 59[1], 99.)

Los valores son un elemento integral del modo en el que los pacientes
abordan y llevan a cabo el autocuidado de la IC… Los valores
incluyen los que se relacionan con sí mismo y con los demás e
incorporan una gama notable de dimensiones personales, vitales y
sociales [v. fig. 3]. No se puede asumir que los valores sean fijos,
normativos o similares a los que tienen los profesionales de enfermería
y otros profesionales sanitarios. Las intervenciones futuras para
mejorar el autocuidado en la IC deben abordar y responder a la
complejidad de estos valores y al modo en el que influyen en la
conducta del paciente.

Karimi y Clark, 2016, pág. 102

883
MODELOS PARA PROMOVER LA
PRÁCTICA BASADA EN LA
EVIDENCIA EN ENFERMERÍA
La PBE es un fenómeno complejo que exige integrar la mejor
evidencia de investigación con la experiencia clínica, las
circunstancias del paciente y sus valores en la prestación de una
asistencia de calidad, segura y rentable. Los dos modelos más
usados en enfermería para aplicar en la práctica la evidencia de
investigación son el modelo de Stetler de uso de la investigación
para facilitar la PBE (Stetler, 2001) y el modelo de Iowa de PBE
(Iowa Model Collaborative, 2017). Estos dos modelos se presentan
brevemente en esta sección.

Modelo de Stetler de uso de la investigación


para facilitar la práctica basada en la
evidencia
El modelo de Stetler de uso de la investigación para facilitar la
práctica basada en la evidencia (fig. 13.2) proporciona un marco
exhaustivo destinado a potenciar el uso de la evidencia de
investigación en la práctica de enfermería. La evidencia de
investigación se puede utilizar a nivel institucional o individual. A
nivel institucional, se sintetizan los hallazgos de estudios y el
conocimiento generado se emplea en el desarrollo o
perfeccionamiento de políticas, algoritmos, procedimientos,
protocolos y otros programas formales implementados en la
institución. Los profesionales individuales de enfermería, los
profesores y los encargados de elaborar políticas resumen las
investigaciones y utilizan el conocimiento para tomar decisiones de
práctica, modificar los programas educativos y guiar la toma de
decisiones políticas. Por ejemplo, las guías basadas en la evidencia
del cuadro 13.1 proporcionan conocimientos sobre la edad,
localizaciones, volumen de medicación y aspiración con las
inyecciones i.m. que deberían implementar los profesionales de
enfermería individuales para promover unos resultados de calidad

884
de los pacientes.

FIG 13.2 Modelo de Stetler, parte I. Se muestran los


pasos del uso de la investigación para facilitar la
práctica basada en la evidencia. (Tomada de Stetler, C. B.
[2001]. Updating the Stetler model of research utilization to
facilitate evidence-based practice. Nursing Outlook, 49[6], 276.)

El modelo de Stetler se incluye en este texto para fomentar el uso


de la evidencia de investigación por parte de profesionales de
enfermería individuales e instituciones sanitarias con el fin de
facilitar el desarrollo de la PBE. Las próximas secciones describen
brevemente las cinco fases del modelo de Stetler (2001): 1)
preparación; 2) validación; 3) evaluación comparativa y toma de
decisiones; 4) traducción y aplicación, y 5) evaluación.

Fase I: preparación
La intención del modelo de Stetler (2001) es convertir el uso de la
evidencia de investigación en la práctica en un proceso consciente
de pensamiento crítico puesto en marcha por el usuario. Por tanto,
la Fase I: preparación, consiste en determinar el propósito, foco y

885
posibles resultados de realizar una modificación basada en la
evidencia en una institución clínica. Una vez que la agencia, las
personas o un comité han identificado y aprobado el propósito del
proyecto basado en la evidencia, se realiza una búsqueda de la
literatura detallada para determinar la solidez de la evidencia
existente para su uso en la práctica.

Fase II: validación


En la Fase II: validación, los informes de investigación se valoran
críticamente con el fin de determinar su solidez científica (Gray y
cols., 2017; Grove y Cipher, 2017; Melnyk y Fineout-Overholt, 2015).
Si los estudios son limitados en número, inconsistentes o ambos, los
hallazgos y conclusiones se consideran inadecuados para utilizarse
en la práctica y el proceso se detiene. Si se ha realizado una revisión
sistemática, metaanálisis o metasíntesis en el área sobre la que
desea establecer un cambio basado en la evidencia, esto refuerza
enormemente la calidad de la evidencia de investigación. Si la base
de conocimiento de investigación es potente en el área elegida, la
institución clínica o el profesional de enfermería individual debe
tomar una decisión sobre el uso de la evidencia en la práctica. Por
ejemplo, los profesionales de enfermería individuales pueden
implementar la guía relacionada con las inyecciones i.m. (v. cuadro
13.1) para mejorar sus resultados prácticos.

Fase III: evaluación comparativa/toma de decisiones


La Fase III: evaluación comparativa/toma de decisiones incluye
cuatro partes: 1) fundamentar la evidencia, 2) encajar la evidencia
en el entorno sanitario, 3) viabilidad del uso de los hallazgos de
investigación y 4) problemas de la práctica actual (v. fig. 13.2). La
evidencia se fundamenta mediante revisiones sistemáticas y
metaanálisis de estudios relevantes. No obstante, los estudios
cuasiexperimentales y experimentales individuales también pueden
proporcionar una evidencia muy sólida para realizar cambios en
una institución. Con el fin de determinar el encaje de la evidencia
en la institución clínica, hay que examinar las características de ese
entorno para determinar los elementos que facilitarán o
entorpecerán la aplicación del cambio basado en la evidencia.
Stetler (2001) ha señalado que la viabilidad del uso de evidencias de

886
investigación en la práctica supone explorar los tres factores
relacionados con la realización de cambios en la práctica: 1) riesgos
potenciales; 2) recursos necesarios, y 3) disposición de los
implicados. Mediante la fase III, se pueden valorar los beneficios y
riesgos globales de utilizar la evidencia de investigación en un
entorno de práctica. Si los beneficios son mucho mayores que los
riesgos para la organización, el profesional de enfermería
individual o ambos, será factible emplear en la práctica la
intervención basada en la investigación.
Durante el proceso de toma de decisiones de la fase III hay tres
decisiones posibles: 1) utilizar la evidencia de investigación, 2)
plantearse el uso de la evidencia y 3) no emplear la evidencia de
investigación (v. fig. 13.2). La decisión de usar el conocimiento
procedente de la investigación en la práctica depende
principalmente de la solidez de la evidencia. Otra decisión podría
ser plantearse el uso en la práctica de la evidencia de investigación
existente. Cuando un cambio es complejo y afecta a múltiples
disciplinas, con frecuencia se necesita más tiempo para determinar
cómo se emplearía la evidencia y qué medidas se tomarán para
coordinar la participación de distintos profesionales sanitarios en el
cambio. La última opción sería no usar la evidencia de
investigación en la práctica porque la evidencia existente no es
sólida, o los riesgos o costes de modificar la práctica actual son
demasiado elevados respecto a los beneficios (Stetler, 2001).

Fase IV: traducción/aplicación


La Fase IV: traducción/aplicación consiste en planificar y utilizar
realmente la evidencia de investigación en la práctica. La fase de
traducción supone determinar exactamente qué conocimientos se
emplearán y cómo se aplicarán en la práctica. El uso de la evidencia
de investigación puede ser cognitivo, instrumental o simbólico. En
la aplicación cognitiva, la base de investigación es un medio para
modificar una forma de pensar o la consideración personal de un
asunto (Stetler, 2001). Por ejemplo, la aplicación cognitiva puede
mejorar la comprensión del profesional de enfermería de una
situación, permitir el análisis de la dinámica de práctica o mejorar
las habilidades de solución de problemas en cuestiones clínicas. La
aplicación instrumental consiste en usar la evidencia de

887
investigación para respaldar la necesidad de cambios en
intervenciones de enfermería o protocolos de práctica. La
utilización simbólica o política tiene lugar cuando la información se
emplea para respaldar o modificar una política existente. La fase de
aplicación comprende los siguientes pasos para una modificación
planeada: 1) valorar la situación que se cambiará, 2) desarrollar un
plan de cambio y 3) aplicar el plan. Durante la fase de aplicación se
ponen en práctica los protocolos, políticas y/o algoritmos
desarrollados con los conocimientos provenientes de la
investigación.

Fase V: evaluación
El estadio final, Fase V: evaluación, consiste en determinar el
impacto del cambio basado en la investigación sobre la institución
sanitaria, el personal y los pacientes. El proceso de evaluación
puede incluir actividades formales e informales realizadas por
administradores, personal de enfermería clínica y otros
profesionales sanitarios. Las evaluaciones informales podrían
consistir en automonitorización o diálogos con pacientes, familias,
compañeros y otros profesionales. Las evaluaciones formales
pueden incluir estudios de casos, auditorías, mejora de la calidad y
proyectos de investigación traslacional o de resultados. En
resumen, el modelo de Stetler (2001) proporciona los pasos
detallados para animar a los profesionales de enfermería a
convertirse en agentes de cambio y realizar las mejoras necesarias
en la práctica basándose en la evidencia de investigación.

Modelo de Iowa de práctica basada en la


evidencia
Los profesionales de enfermería se han implicado activamente en la
investigación, síntesis de evidencias de investigación y desarrollo
de guías basadas en la evidencia para la práctica. Estas actividades
respaldan su gran compromiso con la PBE, que se ha facilitado por
el modelo de Iowa. El modelo de Iowa de práctica basada en la
evidencia fomenta la implementación de la PBE por los
profesionales de enfermería en las instituciones clínicas.
Recientemente, el Iowa Model Collaborative (2017) realizó un

888
estudio para revisar y validar el modelo de Iowa. La figura 13.3
muestra la versión más actual de este modelo. En las instituciones
sanitarias, hay cuestiones desencadenantes u oportunidades que
inician la necesidad de cambio, con el foco puesto en la realización
de cambios basados en la mejor evidencia de investigación
existente. Las cuestiones desencadenantes suelen estar centradas en
los problemas y evolucionan a partir de los problemas clínicos y de
los datos del manejo del riesgo, la mejora del proceso, los análisis
comparativos y los informes económicos. Las oportunidades
pueden estar centradas en el conocimiento, como nuevos hallazgos
de investigación, modificación en instituciones nacionales o
estándares organizativos y guías, expansión de la filosofía de la
asistencia, un modelo profesional de asistencia actualizado
(requisito para el reconocimiento Magnet) o cuestiones del comité
de estándares institucionales. Los temas identificados se evalúan y
se priorizan según las necesidades de la institución clínica. Si un
tema se considera una prioridad de la institución, se forma un
grupo con el fin de buscar la mejor evidencia para gestionar el
problema clínico (v. fig. 13.3).

889
890
FIG 13.3 Modelo de Iowa revisado: práctica basada en
la evidencia para promover la excelencia en la
asistencia sanitaria. (Tomada de Iowa Model Collaborative.
[2017]. Iowa Model of Evidence-Based Practice: Revisions and
validation. Worldviews on Evidence-Based Nursing, 14[3], 175-
182, 178.)

En algunas situaciones, la evidencia de investigación no es


adecuada para realizar cambios en la práctica y se necesitan más
estudios que refuercen la base de conocimientos (v. fig. 13.3). En
ocasiones, la evidencia de investigación se puede combinar con
otras fuentes de conocimiento (p. ej., teorías, principios científicos,
opiniones de expertos y descripciones de caso) con el fin de
proporcionar una evidencia bastante sólida para utilizarla en el
desarrollo de protocolos basados en la investigación para la
práctica. Los protocolos basados en la investigación son guías
estructuradas para aplicar en la práctica intervenciones de
enfermería que se basan en la evidencia de investigación actual. La
evidencia más sólida proviene de revisiones sistemáticas que
incluyen metaanálisis de ECA. No obstante, las metasíntesis,
revisiones sistemáticas de métodos mixtos y los estudios
individuales también aportan una evidencia importante para
modificar la práctica. El capítulo 1 describe los niveles de evidencia
de investigación (v. fig. 1.3), que también se muestran en el interior
de la cubierta de este libro.
Los protocolos, algoritmos, guías o políticas basados en la
investigación desarrollados podrían ponerse a prueba como plan
piloto y después ser evaluados para determinar el impacto sobre la
asistencia al paciente, el personal y la institución sanitaria. Si los
resultados de la prueba piloto son favorables, el cambio sería
adecuado para su adopción en la práctica. Estos cambios se
llevarían a cabo por los administradores y el personal de la
institución sanitaria para integrar y mantener el cambio en la
práctica. Los resultados clave serían monitorizados mediante
mejora de la calidad para garantizar que el cambio en la práctica
promueva una asistencia de calidad, segura y rentable. El modelo
de Iowa revisado (v. fig. 13.3) «sigue siendo una guía orientada a la
aplicación para el proceso de PBE» y es una fuente útil para

891
implementar la evidencia de investigación en las instituciones
clínicas (Iowa Model Collaborative, 2017, pág. 175).

Aplicación del modelo de Iowa de práctica basada en


la evidencia
La disposición a usar evidencias de investigación en la práctica
suscita algunas cuestiones importantes.

• ¿Qué hallazgos de investigación están preparados para


usarse en la práctica clínica?
• ¿Cuáles son las estrategias más eficaces para aplicar
protocolos basados en la investigación o guías basadas en la
evidencia en una institución clínica?
• ¿Cuáles son los resultados de utilizar la evidencia de
investigación en la práctica?
• ¿Respaldan los datos de gestión de riesgos, mejora de
calidad, de comparativas o económicos la modificación de
la práctica basada en la evidencia de investigación?
• ¿Es el cambio basado en la investigación propuesto una
prioridad de la institución?

Nosotros sugerimos que las estrategias eficaces para usar la


evidencia de investigación en la práctica requerirán un enfoque
multifactorial que tenga en cuenta la evidencia disponible, las
actitudes de los profesionales de enfermería, la filosofía de la
organización y los estándares organizativos y guías nacionales
(ANCC, 2017; Melnyk y Fineout-Overholt, 2015; The Joint
Commission, 2017). En esta sección, los pasos del modelo de Iowa
(v. fig. 13.3) dirigen el uso de una intervención basada en la
investigación en un hospital para facilitar la PBE.
Schumacher, Askew y Otten (2013) usaron el modelo de Iowa
para poner en práctica un instrumento indicador en la evaluación
de úlceras por presión (UP) en la población de recién nacidos de su
hospital. La prevalencia de UP era del 0-1% por trimestre en esta
gran unidad de cuidados intensivos neonatales (UCIN) del Medio
Oeste. Schumacher y cols. observaron que en su UCIN no se
utilizaba de forma constante una herramienta de valoración del
riesgo de UP. La tabla 1 (Schumacher y cols., 2013) resume la

892
aplicación del modelo de Iowa a este problema clínico. La pregunta
clínica abordada se generó con el formato PICO. La población eran
los lactantes de la UCIN. La intervención que se debía aplicar
consistía en una herramienta indicadora de UP con tres preguntas
que evaluaba si los recién nacidos presentaban un riesgo de
desarrollar lesiones cutáneas. Se comparó con la escala Q de
Braden, los cuidados estándar o la práctica habitual para
determinar los neonatos que presentaban un riesgo de UP. El
resultado medido fue la eficacia de la herramienta indicadora de
UP comparada con la escala Q de Braden en la evaluación de los
recién nacidos con riesgo de UP. Se valoraron críticamente los
estudios que habían analizado la eficacia de distintas herramientas
de evaluación de UP neonatales. Se consideró que las herramientas
de dichos estudios eran demasiado largas para su uso clínico
rutinario. Schumacher y cols. (2013) desarrollaron una herramienta
de valoración más corta basada en la evidencia de investigación:

Preguntas para determinar el riesgo de úlceras por presión propuestas


por el Institute for Clinical Systems Improvement: El lactante:
¿Mueve las extremidades y/o el cuerpo de forma apropiada para su
edad de desarrollo? ¿Responde a las molestias de un modo adecuado al
desarrollo? ¿Tiene una perfusión tisular adecuada de acuerdo con la
fórmula clínica (presión arterial media = edad gestacional y/o relleno
capilar <3 s)?

Schumacher y cols., 2013, pág. 48

Schumacher y cols. (2013) observaron que su herramienta de


valoración de UP de tres preguntas era tan eficaz como la escala Q
de Braden para determinar el riesgo neonatal de UP. Sus hallazgos
se resumen en el siguiente extracto del estudio:

Tras la aplicación de las preguntas de detección en 2009, no


observamos incrementos netos del número de derivaciones al equipo
HOC [heridas, ostomías y continencia] por cada 1.000 pacientes. No
obstante, nuestra prevalencia de UP (úlceras por presión) en la UCIN
sigue siendo baja, de 0,01 por cada 1.000 pacientes-días. Las
comparaciones de resultados de las tres preguntas de detección y la

893
escala Q de Braden realizadas por el profesional de enfermería de
HOC demostraron que la herramienta identifica correctamente a la
mayoría de los recién nacidos, a excepción de los lactantes muy
inmaduros que podrían presentar un riesgo de sufrir úlceras
relacionadas con dispositivos médicos….

Instauramos una herramienta de detección de tres ítems para ayudar


a los profesionales de enfermería de la UCIN a identificar a los recién
nacidos con riesgo de desarrollar UP. Aunque estas preguntas no
cuantifican el riesgo, hemos descubierto que son una herramienta de
cribado inicial eficaz cuando se combinan con valoraciones adicionales
y tratamiento junto con el personal de enfermería dedicado a HOC.

Schumacher y cols., 2013, pág. 50

APLICACIÓN EN LA PRÁCTICA DE
GUÍAS BASADAS EN LA EVIDENCIA
Todos los días se genera conocimiento de investigación que se
sintetiza con el fin de determinar la mejor evidencia para su uso en
la práctica (Cochrane, 2017; Mackey y Bassendowski, 2017: NGC,
2017a). Esta sección aborda las guías basadas en la evidencia
desarrolladas de acuerdo con la mejor evidencia de investigación
disponible actualmente, publicada en sitios web nacionales e
internacionales, y en revistas profesionales con revisores externos.
La guía JNC 8 (Eighth Joint National Committee) basada en la
evidencia para el tratamiento de la hipertensión arterial en adultos
se presenta como ejemplo (James y cols., 2014).

Recursos para las guías basadas en la


evidencia
Desde la década de 1980, la Agency for Healthcare Research and
Quality (AHRQ) ha resultado fundamental en la identificación de
cuestiones de salud y el fomento del desarrollo de guías basadas en
la evidencia para esas cuestiones (http://www.ahrq.gov). Las

894
primeras guías basadas en la evidencia fueron desarrolladas por
paneles de investigadores acreditados en EE.UU. en el área en
cuestión, clínicos expertos (médicos, profesionales de enfermería,
farmacéuticos y trabajadores sociales), gestores sanitarios,
desarrolladores de políticas, economistas, representantes
gubernamentales y usuarios. Los miembros del panel determinaban
el ámbito de la guía y realizaban revisiones exhaustivas de la
literatura, que incluían revisiones sistemáticas relevantes,
metaanálisis, estudios individuales y teorías. Las guías basadas en
la evidencia desarrolladas han sido evaluadas por consultores, otros
investigadores y clínicos expertos adicionales para obtener su
opinión. Basándose en la crítica de los expertos, la AHRQ revisó y
presentó las guías para su distribución a los profesionales
sanitarios.
En la actualidad, el desarrollo de guías estandarizadas oscila
entre un proceso estructurado como el que se acaba de describir y
uno menos estructurado, en el que una organización sanitaria, plan
sanitario u organización profesional podría desarrollar una guía. La
AHRQ puso en marcha la NGC (NGC, 2017a) en 1998 para archivar
las guías de PBE. La NGC (2017b) es una base de datos de acceso
público que recopila guías clínicas basadas en la evidencia y
documentos relacionados. La NGC se actualiza semanalmente con
nuevo contenido que produce la AHRQ en colaboración con la
American Medical Association y los America’s Health Insurance
Plans. Los componentes clave de la NGC y sus recursos fáciles de
usar pueden encontrarse en el sitio web de la AHRQ
(http://www.guideline.gov/). La información clave proporcionada
por la NGC que es relevante para el lector incluye:

• Resúmenes estructurados sobre la guía y su desarrollo.


• Enlaces al texto completo de guías, si están disponibles, y/o
a la solicitud de información de copias impresas.
• Descargas del índice completo de la NGC para todas las
guías presentes en la base de datos.
• Base de datos bibliográfica anotada en la que los usuarios
pueden buscar citas de publicaciones y recursos sobre
guías.
• What’s New permite a los usuarios ver qué guías se han

895
añadido cada semana y contiene un índice de todas las
guías en la NGC.
• Glossary proporciona definiciones de términos usados en los
resúmenes estandarizados (sumarios).

La NGC proporciona un mecanismo fácil de usar para obtener


información objetiva y detallada sobre las guías de práctica clínica.
Además de las guías basadas en la evidencia, la AHRQ ha
desarrollado muchas herramientas para valorar la calidad de la
asistencia prestada mediante las guías basadas en la evidencia. En
la página web de la AHRQ (2017a)
(http://www.qualitymeasures.ahrq.gov) se puede encontrar una
herramienta apropiada para medir una variable en un proyecto de
investigación o evaluar resultados de la asistencia en una
institución clínica. Numerosas organizaciones profesionales,
agencias sanitarias, universidades y otros grupos ofrecen síntesis de
evidencia, guías basadas en la evidencia para la práctica y métodos
de medición para resultados que pueden encontrarse en los sitios
web enumerados en el cuadro 13.3.

CUADRO 13.3 SITIOS WEB DE PRÁCTICA


BASADA EN LA EVIDENCIA

• Academic Center for Evidence-Based Nursing:


http://www.acestar.uthscsa.edu.
• Association of Women’s Health, Obstetric, and Neonatal
Nurses: http://awhonn.org.
• Centers for Disease Control Healthcare Providers:
http://www.cdc.gov/CDCForYou/healthcare_providers.html.
• Centers for Health Evidence: http://www.cche.net.
• Guidelines Advisory Committee: http://www.gacguidelines.ca.
• Guidelines International Network: http://www.g-i-n.net/.
• HerbMed: Evidence-Based Herbal Database, 1998, Alternative
Medicine Foundation: http://www.herbmed.org/.
• National Association of Neonatal Nurses:
http://www.nann.org/.

896
• National Institute for Clinical Excellence (NICE):
http://www.nice.org.uk/.
• Oncology Nursing Society: http://www.ons.org/.
• Primary Care Clinical Practice Guidelines:
http://www.medscape.com/pages/editorial/public/pguidelines/index-
primarycare.
• US Preventive Services Task Force:
http://www.uspreventiveservicestaskforce.org.

Implementación de una guía basada en la


evidencia para el tratamiento de la
hipertensión en adultos
Las guías basadas en la evidencia se han convertido en la referencia
de la asistencia a pacientes en Estados Unidos y otros países. La
guía basada en la evidencia de 2014 para el tratamiento de la
hipertensión arterial en adultos fue desarrollada por los miembros
del panel JNC 8, que realizaron una revisión sistemática de ECA
para determinar la mejor evidencia de investigación. La guía
incluye nueve recomendaciones revisadas para el tratamiento de la
hipertensión (HTA) y están disponibles en el artículo de James y
cols. (2014, pág. 511) o a través del resumen de guías de la NGC
(2017a) NGC-10397. La guía del JNC 8 también incluye el algoritmo
de tratamiento de la guía para la hipertensión de 2014. Este
algoritmo orienta a los clínicos para: 1) implementar intervenciones
del estilo de vida, 2) fijar unos objetivos de PA y 3) iniciar
medicación antihipertensiva basada en la edad, la diabetes y la
enfermedad renal crónica (ERC; James y cols., 2014). Los
profesionales de enfermería y otros profesionales sanitarios pueden
utilizar este algoritmo para seleccionar los métodos terapéuticos
más apropiados para cada paciente individual diagnosticado de
HTA.
Los estudiantes y profesionales de enfermería tienen que evaluar
la utilidad y calidad de las guías basadas en la evidencia antes de
ponerlas en práctica. La figura 13.4 presenta el modelo de Grove
para implementar en la práctica las guías basadas en la evidencia.
En este modelo, los profesionales de enfermería identifican un

897
problema de la práctica, buscan la mejor evidencia de investigación
para tratar el problema en su práctica y detectan que se ha
desarrollado una guía basada en la evidencia. La evaluación de la
calidad y utilidad de la guía implica analizar lo siguiente: 1) autores
de la guía, 2) relevancia del problema sanitario, 3) solidez de la
evidencia de investigación, 4) relación con la referencia nacional y
5) rentabilidad del uso de la guía en la práctica. La calidad de la
guía del JNC 8 se describe utilizando estos cinco criterios.

898
FIG 13.4 Modelo de Grove para aplicar en la práctica
las guías basadas en la evidencia.

Autores de las guías


Los miembros del panel de la guía JNC 8 se seleccionaron
específicamente a partir de más de 400 candidatos basándose en su
«experiencia en hipertensión (n = 14), atención primaria (n = 6), …
farmacología (n = 2), ensayos clínicos (n = 6), medicina basada en la
evidencia: (n = 3), epidemiología (n = 1), informática (n = 4) y el
desarrollo e implementación de guías clínicas en sistemas de
asistencia (n = 4)» (James y cols., 2014, pág. 508). Estos miembros del
panel se seleccionaron específicamente basándose en su experiencia
amplia y variada para desarrollar una guía basada en la experiencia

899
para el tratamiento de la HTA.

Relevancia del problema sanitario


James y cols. (2014, pág. 507) indicaron que la HTA es la «afección
más frecuente observada en atención primaria y provoca infarto de
miocardio (IM), ictus, insuficiencia renal y el fallecimiento si no se
detecta de forma precoz y se trata apropiadamente. Los pacientes
quieren asegurarse de que el tratamiento de la PA reducirá su carga
de enfermedad, mientras que los clínicos quieren orientación sobre
el tratamiento de la HTA usando la mejor evidencia científica».

Solidez de la evidencia de investigación


James y cols. (2014) realizaron una revisión sistemática para
identificar la evidencia de investigación para la guía nacional sobre
el tratamiento de la HTA. Los participantes en los estudios
revisados eran adultos a partir de 18 años con HTA. Solo los
estudios con tamaños muestrales amplios (>100 participantes) y un
seguimiento adecuado para proporcionar resultados relacionados
con la salud (≥1 año) se incluyeron en la revisión sistemática. El
panel también «limitó su evidencia únicamente a ensayos
controlados aleatorizados (ECA), porque están menos sujetos a
sesgos que otros diseños de estudios y representan el patrón oro
para determinar la eficacia y la efectividad» (James y cols., 2014,
pág. 508).
Los miembros del panel del JNC 8 contaron con un equipo de
metodología externo que realizó la búsqueda de la literatura y
resumió los datos de estudios seleccionados en una tabla de
evidencia (James y cols., 2014). A partir de la revisión de la
evidencia, los miembros del panel desarrollaron declaraciones de
evidencia que proporcionaron la base para las nueve
recomendaciones sobre el tratamiento de la HTA. La evidencia de
investigación para el desarrollo de la guía del JNC 8 sobre el
tratamiento de la HTA fue muy sólida.

Relación con los estándares nacionales y rentabilidad


de la guía basada en la evidencia
Las guías basadas en la evidencia de calidad deberían estar

900
relacionadas con los estándares nacionales y ser rentables (v. fig.
13.4). La guía basada en la evidencia del JNC 8 para el tratamiento
de la HTA se basó en la guía nacional del JNC 7 para la evaluación,
diagnóstico y tratamiento de la HTA. Las recomendaciones para el
JNC 7 han obtenido el respaldo del Department of Health and
Human Services y se han difundido por los NIH (NIH, 2003,
Publicación n.º 03-5231). Se prevé que el uso de la guía del JNC 8 en
la práctica sea rentable, porque las recomendaciones para el
tratamiento de la HTA deberían disminuir la incidencia de la
mortalidad relacionada con IM, ictus, ERC, IC y enfermedades
cardiovasculares (ECV), y debería mejorar los resultados de salud
para adultos con HTA.

Implementación en la práctica de la guía basada en la


evidencia
El siguiente paso es que los estudiantes y los profesionales de
enfermería tanto de práctica normal como avanzada utilicen la guía
basada en la evidencia del JNC 8 en su práctica. Los estudiantes y
profesionales de enfermería deben medir y registrar con exactitud
la PA de los pacientes en las HCE, que forman parte de las bases de
datos de las instituciones clínicas (v. tabla 13.3). Los profesionales y
estudiantes de enfermería también deben educar a los pacientes y
familias sobre las modificaciones del estilo de vida necesarias para
mejorar su PA, como un programa de ejercicio con regularidad,
dieta equilibrada, peso normal, dejar de fumar y reducción de la sal
en la dieta y el alcohol. Los pacientes deben conocer sus valores de
PA y los objetivos de PA aconsejables para ellos. Las personas con
cifras elevadas de PA según su edad y enfermedades crónicas (p.
ej., diabetes, ERC) deberían derivarse a profesionales de enfermería
de práctica avanzada y a médicos. Los profesionales de práctica
avanzada comenzarán o revisarán tratamientos farmacológicos
antihipertensivos según las circunstancias de salud y los valores de
sus pacientes (v. tabla 13.3).

TABLA 13.3
GUÍA BASADA EN LA EVIDENCIA PARA LA EVALUACIÓN Y
TRATAMIENTO DE LA HIPERTENSIÓN ARTERIAL EN

901
ADULTOS

DM, diabetes mellitus; ERC, enfermedad renal crónica; HTA, hipertensión;


PA, presión arterial; PEPA, profesional de enfermería de práctica
avanzada.
a
El tratamiento está determinado por la categoría de PA más alta (sistólica
o diastólica).
b
Modificación del estilo de vida: dieta equilibrada, ejercicio con regularidad,
lograr un peso normal, dejar de fumar, reducir la ingesta de sal en la dieta
y de alcohol; se debería implementar la educación en todos los adultos con
HTA.
c
Los pacientes con DM o ERC necesitan educación sobre el tratamiento de
estas enfermedades y su relación con la hipertensión.
Adaptada de James, P. A., Oparil, S., Carter, B. L., Cushman, W. C.,
Denison-Himmelfard, C., Handler, J., y cols. (2014). 2014 evidence-based
guidelines for the management of high blood pressure in adults: Report
from the panel members appointed to the Eighth Joint National Committee
(JNC 8). Journal of the American Medical Association, 311(5), 507-520.
Los resultados para el paciente, el profesional y la institución se
deben evaluar. Los resultados deberían registrarse en las HCE de
los pacientes y han de incluir lo siguiente: 1) cifras de PA de los
pacientes, 2) conductas de estilo de vida actuales de los pacientes, 3)
incidencia de diagnóstico de HTA según las guías del JNC 8, 4)
idoneidad de los tratamientos farmacológicos instaurados para
tratar la HTA y 5) incidencia de ictus, IM, IC, ERC, así como ECV y
mortalidad relacionada a lo largo de 5, 10, 15 y 20 años. Los
resultados de la institución sanitaria comprenden el acceso a la
asistencia por parte de pacientes con HTA, satisfacción del paciente
con la asistencia y costes relacionados con el diagnóstico y
tratamiento de la HTA, además de las complicaciones de la HTA
mencionadas previamente. Esta guía de PBE se perfeccionará en el
futuro en función de los resultados clínicos, estudios de resultados

902
y nuevos ECA. El uso de esta guía basada en la evidencia y de guías
adicionales fomenta la PBE para los profesionales de enfermería y
las instituciones sanitarias (v. fig. 13.4).

INTRODUCCIÓN A LOS CENTROS DE


PRÁCTICA BASADA EN LA
EVIDENCIA
En 1997, la AHRQ puso en marcha una iniciativa destinada a
promover la PBE mediante el establecimiento de 12 centros de
práctica basada en la evidencia (CPBE) en EE.UU. y Canadá. Con
este programa, la AHRQ se convierte en un «socio de ciencia» de
organizaciones públicas y privadas para mejorar la calidad,
rentabilidad e idoneidad de la asistencia sanitaria al sintetizar la
evidencia de investigación y facilitar la aplicación de los hallazgos
de investigación basada en la evidencia en la práctica (AHRQ,
2017b).
Mediante el programa de CPBE, la AHRQ concede contratos de 5
años a instituciones para que actúen como CPBE. Los CPBE revisan
toda la literatura científica relevante sobre temas clínicos,
conductuales, organizativos y económicos con el fin de generar
informes de evidencia y evaluaciones de tecnologías. Los temas son
designados por socios no federales, como sociedades profesionales,
planes de salud, aseguradoras, empresarios y grupos de pacientes.
Los informes de los CPBE se usan «para fundamentar y desarrollar
decisiones de cobertura, medidas de calidad, materiales educativos,
herramientas, guías y agencias de investigación» (AHRQ, 2017b).
Los CPBE también realizan investigaciones sobre la metodología de
las revisiones sistemáticas.
El sitio web de la AHRQ (2017b) contiene los nombres de los
CPBE y el propósito primordial de cada centro. Este sitio también
proporciona enlaces a los informes basados en evidencia elaborados
por esos centros. Estos CPBE han tenido un papel importante en el
desarrollo de síntesis y guías basadas en la evidencia durante las
últimas décadas.

903
INTRODUCCIÓN A LA
INVESTIGACIÓN TRASLACIONAL
Algunas dificultades a las que se ha enfrentado la PBE han dado
lugar al desarrollo de una nueva metodología de investigación, la
investigación traslacional, para mejorar la aplicación de la evidencia
de investigación en la práctica. La investigación traslacional se ha
denominado traslado de la investigación del laboratorio a la cabecera del
paciente, lo que implica la traslación de los descubrimientos
científicos básicos a aplicaciones prácticas (Callard, Rose y Wykes,
2012). Los descubrimientos de investigación básica realizados en el
entorno del laboratorio deben probarse en estudios humanos.
Además, los resultados de los ensayos clínicos humanos deben
adoptarse y mantenerse en la práctica clínica. La investigación
traslacional se está realizando en enfermería y medicina para
aumentar la implementación de las intervenciones basadas en la
evidencia en la práctica y determinar si estas intervenciones son
eficaces para producir los resultados deseados.
El National Center for Advancing Translation Sciences (NCATS)
se creó en 2011 como parte de los NIH. Con el fin de animar a los
investigadores a realizar investigación traslacional, los NIH (2017)
pusieron en marcha el consorcio Clinical and Translational Science
Awards (CTSA). Este consorcio comenzó con 12 centros localizados
a lo largo de Estados Unidos y se expandió a 39 centros en abril de
2009. El programa se implementó por completo en 2012, con
alrededor de 60 instituciones implicadas en la ciencia clínica y
traslacional. Se ha desarrollado un sitio web para aumentar la
comunicación y alentar que se comparta la información relacionada
con proyectos de investigación traslacional (v.
https://ncats.nih.gov/).
El consorcio CTSA se centra sobre todo en ampliar la traslación
de la investigación médica a la práctica. Titler (2004, pág. S1)
definió la investigación traslacional para la profesión de enfermería
como la «investigación científica de métodos, intervenciones y
variables que influyen en la adopción de la PBE por individuos y
organizaciones con el fin de mejorar la toma de decisiones clínicas y
operacionales en la asistencia sanitaria. Esto incluye probar los
efectos de las intervenciones y fomentar la adopción y

904
mantenimiento de la PBE». Westra y cols. (2015, pág. 600)
desarrollaron un «plan de acción nacional para los datos de
enfermería compartibles y comparables con el fin de apoyar la
investigación práctica y traslacional». Este plan proporciona
orientación para realizar y utilizar la investigación traslacional con
el fin de modificar la práctica de enfermería.
Los estudios traslacionales cada vez son más frecuentes en la
literatura de enfermería. Por ejemplo, Mello y cols. (2013) realizaron
un estudio traslacional para fomentar el uso de una guía de cribado,
intervención breve y derivación con el fin de recibir tratamiento
para el alcoholismo (SBIRT, Screening, Brief Intervention, and Referral
to Treatment) en centros traumatológicos pediátricos. Antes del
estudio, solo el 11% de los pacientes se evaluaban y recibían una
intervención. «Después de completar las actividades de asistencia
técnica del SBIRT, la totalidad de los siete centros traumatológicos
participantes habían desarrollado, adoptado e implementado con
eficacia las políticas SBIRT para los pacientes hospitalizados
adolescentes lesionados. Además, en todos los centros, el 73% de
los pacientes elegibles recibieron servicios SBIRT después de las
fases de implementación y de mantenimiento» (Mello y cols., 2013,
pág. S301).
Esperamos que el contenido de este capítulo haya servido para
aumentar los conocimientos sobre la PBE, la valoración crítica de
las síntesis de investigación, la aplicación de los modelos de PBE y
la puesta en práctica de guías de PBE. Animamos a los lectores a
participar activamente en el avance de la enfermería hacia la PBE,
que mejora los resultados para pacientes, profesionales de
enfermería e instituciones sanitarias.

PUNTOS CLAVE
• La práctica basada en la evidencia (PBE) es la integración
consciente de la mejor evidencia de investigación con la
experiencia clínica y las circunstancias y valores del
paciente en la prestación de una asistencia sanitaria de
calidad, segura y rentable.
• La mejor evidencia de investigación se produce mediante la

905
realización y síntesis de muchos estudios de alta calidad en
un área relacionada con la salud.
• Los profesionales de enfermería deben conocer los
beneficios y dificultades que se asocian con la PBE.
• El formato PICO se describe para generar una pregunta
clínica que guíe el uso de la evidencia de investigación
actual en la práctica.
• Se ofrecen unas guías para la valoración crítica de los
procesos de síntesis de la investigación de revisión
sistemática, metaanálisis, metasíntesis y revisión sistemática
de métodos mixtos.
• Una revisión sistemática es una síntesis estructurada y
exhaustiva de la literatura de investigación cuantitativa con
el fin de determinar la mejor evidencia de investigación
disponible para abordar una pregunta sobre la asistencia
sanitaria.
• Un metaanálisis se realiza con el fin de agrupar
estadísticamente los resultados de estudios anteriores en un
único análisis cuantitativo que constituye uno de los niveles
de evidencia más elevados sobre la eficacia de una
intervención.
• Una metasíntesis se define como la recopilación e
integración sistemáticas de estudios cualitativos para
aumentar la comprensión y desarrollar una interpretación
única de los hallazgos de estudios en un área seleccionada.
• Las revisiones que contienen síntesis de varios estudios
cuantitativos, cualitativos y de métodos mixtos reciben el
nombre de revisiones sistemáticas de métodos mixtos en
este texto.
• El modelo de Stetler de uso de la investigación para facilitar
la práctica basada en la evidencia proporciona un marco
exhaustivo destinado a potenciar el uso en la práctica de la
evidencia de investigación por los profesionales de
enfermería.
• El modelo de Iowa para la práctica basada en la evidencia
presenta guías para llevar a cabo una asistencia a pacientes
basada en la mejor evidencia de investigación y observar los
cambios en la práctica con el fin de garantizar una

906
asistencia de calidad.
• Se describe el proceso de desarrollo de guías basadas en la
evidencia, con un ejemplo de la guía para la evaluación,
diagnóstico y tratamiento de la hipertensión (HTA).
• Se detalla el modelo de Grove para la aplicación en la
práctica de guías basadas en la evidencia con el fin de
ayudar a los profesionales de enfermería a determinar la
calidad de las guías basadas en la evidencia y los pasos que
se deben seguir en el uso de estas guías en la práctica.
• Los centros de práctica basada en la evidencia (CPBE),
creados por la AHRQ, han sido muy importantes en la
realización de investigaciones, elaboración de revisiones
sistemáticas y formulación de guías basadas en la evidencia
en áreas seleccionadas de práctica.
• La investigación traslacional está en expansión en la
asistencia sanitaria para trasladar los descubrimientos
científicos básicos a aplicaciones prácticas.

BIBLIOGRAFÍA
Agency for Healthcare Research and Quality (AHRQ). AHRQ’s
National Quality Measures Clearinghouse (NQMC). Consultada el
28 de noviembre de 2017, en http://qualitymeasures.ahrq.gov, 2017.

Agency for Healthcare Research and Quality (AHRQ). Evidence-


based Practice Centers (EPCs) evidence-based reports. Consultada
el 18 de julio de 2017, en
https://www.ahrq.gov/research/findings/evidence-based-
reports/index.html, 2017.

American Nurses Credentialing Center (ANCC). Find a Magnet


hospital: Current number of Magnet facilities. Consultada el 29 de
noviembre de 2017, en
http://www.nursecredentialing.org/Magnet/FindaMagnetFacility.aspx
2017.

907
Andrel, J. A., Keith, S. W., Leiby, B. E. Meta-analysis: A brief
introduction. Clinical and Translational Science. 2009; 2(5):374–378.

Barnett-Page, E., Thomas, J., Methods for the synthesis of


qualitative research: A critical review. BMC Medical Research
Methodology 9 59 2009 Consultada el 18 de marzo de 2018, en.
https://www.biomedcentral.com/1471-2288/9/59

Bettany-Saltikov, J. Learning how to undertake a systematic review:


Part 1. Nursing Standard. 2010; 24(50):47–56.

Bettany-Saltikov, J. Learning how to undertake a systematic review:


Part 2. Nursing Standard. 2010; 24(51):47–58.

Butler, A., Hall, H., Copnell, B. A guide to writing a qualitative


systematic review protocol to enhance evidence-based practice in
nursing and health care. Worldviews on Evidence-Based Nursing. 2016;
13(3):241–249.

Callard, F., Rose, D., Wykes, T. Close to the bench as well as the
bedside: Involving service users in all phases of translational
research. Health Expectations. 2012; 15(4):389–400.

Cochrane Collaboration. Cochrane: Our evidence. Consultada el 19


de noviembre de 2017, en http://www.cochrane.org/evidence, 2017.

Cochrane Nursing Care (CNC). Resources. Consultada el 30 de


noviembre de 2017, en http://nursingcare.cochrane.org/resources,
2017.

Cocoman, A., Murray, J. Intramuscular injections: A review of best


practice for mental health nurses. Journal of Psychiatric and Mental
Health Nursing. 2008; 15(5):424–434.

908
Conn, V. S. Depressive symptom outcomes of physical activity
interventions: Meta-analysis findings. Annals of Behavioral Medicine.
2010; 39(2):128–138.

Conn, V. S., Valentine, J. C., Cooper, H. M., Rantz, M. J. Methods:


Grey literature in meta-analyses. Nursing Research. 2003; 52(4):256–
261.

Cooper, H. Research synthesis and meta-analysis: A step-by-step


approach, 5th ed. Los Angeles, CA: Sage; 2017.

Creswell, J. W. Research design: Qualitative, quantitative and mixed


methods approaches, 4th ed. Thousand Oaks, CA: Sage; 2014.

Eizenberg, M. M. Implementation of evidence-based nursing


practice: Nurses’ personal and professional factors? Journal of
Advanced Nursing. 2010; 67(1):33–42.

Finfgeld-Connett, D. Generalizability and transferability of meta-


synthesis research findings. Journal of Advanced Nursing. 2010;
66(2):246–254.

Gray, J. R., Grove, S. K., Sutherland, S. The practice of nursing


research: Appraisal, synthesis, and generation of evidence, 8th ed. St.
Louis, MO: Elsevier Saunders; 2017.

Grove, S. K., Cipher, D. J., Statistics for nursing research: A


workbook for evidence-based practice 2nd ed. Elsevier, St. Louis,
MO, 2017.

Hall, H., Leach, M., Brosnan, C., Collins, M. Nurses’ attitudes


towards complementary therapies: A systematic review and meta-
synthesis. International Journal of Nursing Studies. 2017; 69(1):47–56.

909
Higgins, J. P.T., Green, S. Cochrane handbook for systematic reviews of
interventions. West Sussex, England: Wiley-Blackwell and The
Cochrane Collaboration; 2008.

Holmen, H., Wahl, A. K., Småstuen, M. C., Ribu, L., Tailored


communication within mobile apps for diabetes self-management:
A systematic review. Journal of Medical Internet Research 19 6
2017:e227 Consultada el 18 de marzo de 2018, en.
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5501926/

Iowa Model Collaborative. Iowa Model of Evidence-Based Practice:


Revisions and validation. Worldviews on Evidence-Based Nursing.
2017; 14(3):175–182.

James, P. A., Oparil, S., Carter, B. L., Cushman, W. C., Denison-


Himmelfard, C., Handler, J., et al. 2014 evidence-based guidelines
for the management of high blood pressure in adults: Report from
the panel members appointed to the Eighth Joint National
Committee (JNC 8). Journal of the American Medical Association. 2014;
311(5):507–520.

Joanna Briggs Institute. Joanna Briggs Institute (JBI): About us.


Consultada el 19 de julio de 2017, en
http://www.joannabriggs.org/about.html, 2017.

Karimi, M., Clark, A. M. How do patients’ values influence heart


failure self-care decision-making?: A mixed-methods systematic
review. International Journal of Nursing Studies. 2016; 59(1):89–104.

Keib, C. N., Cailor, S. M., Kiersma, M. E., Chen, A. M. Changes in


nursing students’ perceptions of research and evidence-based
practice after completing a research course. Nurse Education Today.
2017; 54(1):37–43.

910
Liberati, A., Altman, D. G., Tetzlaff, J., Mulrow, C., Gotzsche, P. C.,
Ioannidis, J. P., et al. The PRISMA Statement for reporting
systematic reviews and meta-analyses of studies that evaluate
healthcare interventions: Explanation and elaboration. Annals of
Internal Medicine. 2009; 151(4):W-65–W-94.

Mackey, A., Bassendowski, S. The history of evidence-based


practice in nursing education and practice. Journal of Professional
Nursing. 2017; 33(1):51–55.

Mello, M. J., Bromberg, J., Baird, J., Nirenberg, T., Chun, T., Lee, C.,
Linakis, J. G. Translation of alcohol screening and brief intervention
guidelines to pediatric trauma centers. Journal of Trauma & Acute
Care Surgery. 2013; 75(4):S301–S307.

Melnyk, B. M., Fineout-Overholt, E. Evidence-based practice in nursing


and healthcare: A guide to best practice, 3rd ed. Philadelphia, PA:
Lippincott, Williams, & Wilkins; 2015.

Melnyk, B. M., Fineout-Overholt, E., Giggleman, M., Choy, K. A test


of the ARCC© Model improves implementation of evidence-based
practice, healthcare culture, and patient outcomes. Worldviews on
Evidence-Based Nursing. 2017; 14(1):5–9.

Melnyk, B. M., Gallagher-Ford, E., Fineout-Overholt, E.


Implementing evidence-based practice competencies in healthcare: A
practical guide for improving quality, safety, & outcomes. Indianapolis,
IN: Sigma Theta Tau International; 2017.

Melnyk, B. A., Gallagher-Ford, L., Thomas, B. K., Troseth, M.,


Wyngarden, K., Szalacha, L. A study of chief nurse executives
indicates low prioritization of evidence-based practice and
shortcomings in hospital performance metrics across the United

911
States. Worldview on Evidence-Based Nursing. 2016; 13(1):6–14.

Moher, D., Liberati, A., Tetzlaff, J., Altman, D. G., PRISMA Group.
Preferred Reporting Items for Systematic Reviews and Meta-
Analyses: The PRISMA Statement. Consultada el 19 de julio de
2017, en http://www.prisma-statement.org, 2009.

Moorhead, S., Johnson, M., Maas, M. L., Swanson, E. Nursing


outcomes classification (NOC): Measurement of health outcomes, 5th ed.
St. Louis, MO: Elsevier; 2013.

Moore, Z. Meta-analysis in context. Journal of Clinical Nursing. 2012;


21(19/20):2798–2807.

National Guideline Clearinghouse (NGC). AHRQ’s National


Guideline Clearinghouse: Public resource for summaries of
evidence-based clinical practice guidelines. Consultada el 17 de
diciembre de 2017 en https://www.guideline.gov/, 2017.

National Guideline Clearinghouse (NGC). National Guideline


Clearinghouse: Guideline syntheses. Consultada el 19 de diciembre
de 2017, en https://www.guideline.gov/syntheses/index, 2017.

National Institutes of Health (NIH). NIH: National Center for


Advancing Translational Science. Consultada el 30 de diciembre de
2017, en https://ncats.nih.gov/translation, 2017.

National Institutes of Health (NIH), Seventh Report of the Joint


National Committee on Prevention, Detection, Evaluation, and
Treatment of High Blood Pressure (JNC 7) Consultada el 18 de
marzo de 2018, en.
www.nhlbi.nih.gov/files/docs/guidelines/phycard.pdf, 2003

912
Nicoll, L. H., Hesby, A. Intramuscular injections: An integrative
research review and guideline for evidence-based practice. Applied
Nursing Research. 2002; 16(2):149–162.

Ogston-Tuck, S. Intramuscular injection technique: An evidence-


based approach. Nursing Standard. 2014; 29(4):52–59.

Pappas, D., Williams, I. Grey literature: Its emerging importance.


Journal of Hospital Librarianship. 2011; 11(3):228–234.

Quality and Safety Education for Nurses (QSEN). Pre-licensure


knowledge, skills, and attitudes (KSAs). Consultada el 23 de
diciembre de 2017, en http://qsen.org/competencies/pre-licensure-
ksas/, 2017.

Sandelowski, M., Barroso, J. Handbook for synthesizing qualitative


research. New York, NY: Springer; 2007.

Schumacher, B., Askew, M., Otten, K. Development of a pressure


ulcer trigger tool for the neonatal population. Journal of Wound,
Ostomy, and Continence Nursing. 2013; 40(1):46–50.

Setia, M. S. Methodology series module 6: Systematic reviews and


meta-analysis. Indian Journal of Dermatology. 2016; 61(6):602–607.

Sherwood, G., Barnsteiner, J. Quality and safety in nursing: A


competency approach to improving outcomes, 2nd ed. Ames, IA: Wiley-
Blackwell; 2017.

Sisson, H. Aspirating during the intramuscular injection procedure:


A systematic literature review. Journal of Clinical Nursing. 2015;
24(17/18):2368–2375.

Stetler, C. B. Updating the Stetler model of research utilization to

913
facilitate evidence-based practice. Nursing Outlook. 2001; 49(6):272–
279.

Straus, S. E., Glasziou, P., Richardson, W. S., Rosenberg, W.,


Haynes, R. B. Evidence-based medicine: How to practice and teach EBM,
5th ed. Edinburgh, Scotland: Churchill Livingstone Elsevier; 2011.

Straka, K. L., Brandt, P., Brytus, J. Brief report: Creating a culture of


evidence-based practice and nursing research in a pediatric
hospital. Journal of Pediatric Nursing. 2013; 28(4):374–378.

Stringer, P. M. Sciatic nerve injury from intramuscular injections: A


persistent and global problem. International Journal of Clinical
Practice. 2010; 64(11):1573–1579.

The Joint Commission. About The Joint Commission. Consultada el


17 de diciembre de 2017, en
https://www.jointcommission.org/about_us/about_the_joint_commission_main
2017.

Thomas, C. M., Mraz, M., Rajcan, L. Blood aspiration during IM


injection. Clinical Nursing Research. 2016; 25(5):549–559.

Titler, M. G. Overview of the U.S. invitational conference


“Advancing Quality Care Through Translation Research.”.
Worldviews on Evidence-Based Nursing. 2004; 1(1):S1–S5.

Tong, A., Flemming, K., McInnes, E., Oliver, S., Craig, J. Enhancing
transparency in reporting the synthesis of qualitative research:
ENTREQ. BMC Medical Research Methodology. 2012; 12(181):1–8.

Turlik, M. Evaluating the results of a systematic review/meta-


analysis. Podiatry Management. 2010; 29(1):193–198.

914
Walsh, D., Downe, S. Meta-synthesis method for qualitative
research: A literature review. Journal of Advanced Nursing. 2005;
50(2):204–211.

Warren, J. I., McLaughin, M., Bardsley, J., Eich, J., Esche, C. A.,
Kropkowski, L., Risch, S. The strengths and challenges of
implementing EBP in healthcare systems. Worldviews on Evidence-
Based Nursing. 2016; 13(1):15–24.

Westra, B. L., Latimer, G. E., Matney, S. A., Park, J. I., Sensmeier, J.,
Simpson, R. L., et al. A national action plan for sharable and
comparable nursing data to support practice and translation
research for transforming health care. Journal of American Medical
Informatics Association. 2015; 22(3):600–607.

Whittemore, R., Chao, A., Jang, M., Minges, K. E., Park, C. Methods
for knowledge synthesis: An overview. Heart & Lung. 2014;
43(5):453–461.

Wynaden, D., Tohotoa, J., Omari, O. A., Happell, B., Heslop, K.,
Barr, L., Sourinathan, V. Administering intramuscular injections:
How does research translate into practice over time in the mental
health setting? Nurse Education Today. 2015; 35(1):620–624.

915
CAPÍTULO 14

Introducción a las
metodologías de
investigación
adicionales en
enfermería:
investigación de
métodos mixtos y de
resultados
Susan K. Grove and Jennifer R. Gray

La página web de la National Guideline Clearinghouse de la Agency for


Healthcare Research and Quality (AHRQ) se cerró en 2018. Puede
consultarse más información en https://www.ahrq.gov/.

916
ÍNDICE DEL CAPÍTULO

Investigación y diseño de métodos mixtos, 431


Investigación de resultados, 441
Puntos clave, 462
Bibliografía, 463

OBJETIVOS DE APRENDIZAJE
Tras concluir este capítulo, el lector debería ser capaz de:
1. Identificar los métodos cuantitativos y cualitativos en los
estudios de métodos mixtos.
2. Describir los diseños de métodos mixtos, como concurrente
convergente, exploratorio secuencial y explicativo secuencial.
3. Describir las dificultades específicas de la realización de
estudios de métodos mixtos.
4. Valorar críticamente un estudio de métodos mixtos.
5. Explicar la base teórica de la investigación de resultados.
6. Analizar los antecedentes de la investigación de resultados en
enfermería.
7. Describir el papel de la investigación de resultados en la
valoración del efecto de la enfermería en los resultados de
salud.
8. Diferenciar la investigación de resultados de otros tipos de
investigaciones llevadas a cabo por profesionales de
enfermería.
9. Identificar los métodos usados en los estudios de resultados
publicados.
10. Valorar críticamente los estudios de resultados publicados.

917
En este capítulo se describen las metodologías de métodos mixtos
y de investigación de resultados. Estos tipos de investigación se han
realizado con más frecuencia en enfermería en los últimos 10 años y
se pueden encontrar informes de estos tipos de estudios en la
literatura. El contenido de este capítulo tiene como finalidad
proporcionar una base para la valoración crítica de los estudios de
métodos mixtos y de resultados. La primera parte del capítulo se
centra en la investigación de métodos mixtos, seguida de una
descripción de la investigación de resultados.

INVESTIGACIÓN Y DISEÑO DE
MÉTODOS MIXTOS
Los problemas clínicos y sus preguntas de investigación
relacionadas suelen ser complejos y multidimensionales. Algunos
investigadores han estudiado estas preguntas de investigación
complejas utilizando métodos cuantitativos y cualitativos en el
mismo estudio, enfoque que se denomina investigación de
métodos mixtos (Creswell, 2014, 2015; Leavy, 2017). Los estudios de
métodos mixtos permiten a los investigadores aprovechar las
ventajas de los números y las palabras para responder a los
distintos componentes o fases de una pregunta de investigación
(Creswell, 2015). En este apartado del capítulo, se describen las
bases filosóficas de los estudios de métodos mixtos, los distintos
diseños utilizados en estos estudios, así como las dificultades que
presentan y el modo de realizar su valoración crítica.

Bases filosóficas de los diseños de métodos


mixtos
La base filosófica para la investigación de métodos mixtos no es ni
simplemente la visión pospositivista objetiva de los investigadores
cuantitativos ni la visión constructivista subjetiva de los
investigadores cualitativos. Los investigadores que utilizan diseños
de métodos mixtos han intercambiado la dicotomía del positivismo
y el constructivismo por el término medio del pragmatismo
(Yardley y Bishop, 2015). Para nuestros propósitos, el pragmatismo

918
es una filosofía que se centra en resolver los problemas por
cualquier método que se adapte al problema o pregunta (Leavy,
2017). Los pragmáticos quieren obtener la información que
consideran necesaria para resolver un problema. Por ejemplo, un
gestor de enfermería en una clínica está preocupado porque los
pacientes no asisten a sus citas de revisión. El gestor colabora con
un investigador y juntos planifican un estudio de métodos mixtos
para describir los elementos facilitadores y los obstáculos para
mantener las citas en la clínica. Ambos planifican la realización de
grupos focales con pacientes (datos cualitativos) y distribuyen una
encuesta al alta (datos cuantitativos) para comprender mejor las
formas de fomentar la adherencia a las citas en la clínica. Se
seleccionó el diseño de métodos mixtos porque el objetivo era
obtener la información que necesitaban con el fin de mejorar la tasa
de asistencia, objetivo que es congruente con un enfoque
pragmático (Bishop, 2015). Con los diseños de métodos mixtos, el
investigador puede permitir que los puntos fuertes de un método
compensen las posibles limitaciones del otro (Creswell, 2015). Dicho
de un modo más positivo, la investigación de métodos mixtos
permite que los puntos fuertes de cada método interactúen de una
forma complementaria con los del otro (Leavy, 2017).

Generalidades de los diseños de métodos


mixtos
Cuando se lee un artículo sobre un estudio de métodos mixtos, hay
varias preguntas que se pueden responder y que ayudarán a
identificar el diseño:

1. ¿Se implementaron los dos componentes del estudio


(cuantitativo y cualitativo) de forma simultánea o
secuencial?
2. Si un componente precedió al otro (diseño secuencial), ¿cuál
se implementó primero?
3. ¿Cómo combinaron o interpretaron los investigadores los
hallazgos de un componente a la vista del otro?

Las tres preguntas se muestran en un algoritmo en la figura 14.1.

919
Estas decisiones pueden dar lugar a una amplia gama de diseños de
métodos mixtos. Los diseños de métodos mixtos se han descrito y
clasificado de varias formas. Este capítulo se centra en tres diseños
utilizados habitualmente en investigación de enfermería y sanitaria,
que son congruentes con los tres diseños básicos de Creswell (2015):
1) estrategia convergente concurrente, 2) estrategia exploratoria
secuencial y 3) estrategia explicativa secuencial. Se presentan las
descripciones, diagramas y estudios de ejemplo de estos tres
enfoques de métodos mixtos para ampliar la comprensión de estos
diseños.

FIG 14.1 Algoritmo para identificar los diseños de


métodos mixtos.

Estrategia convergente concurrente


La estrategia convergente concurrente se selecciona cuando un
investigador quiere utilizar los métodos cuantitativo y cualitativo
para intentar confirmar, valorar de forma cruzada o corroborar los
hallazgos utilizando una única muestra o dos muestras de la misma
población (Leavy, 2017). Este diseño también se puede denominar
diseño paralelo, porque los procesos de recogida de datos
cuantitativos y cualitativos se realizan a la vez. Esta estrategia suele

920
integrar los resultados de los dos métodos después de que los datos
se analizan y durante la fase de interpretación. Cuando los
hallazgos de los métodos cualitativo y cuantitativo son iguales, se
habla de convergencia, que refuerza la evidencia. Cuando los
hallazgos de las dos partes del estudio son diferentes, los
investigadores pueden utilizar los hallazgos distintos para
proporcionar una descripción más amplia del problema (fig. 14.2).

FIG 14.2 Métodos mixtos convergentes concurrentes.

Hagstrom (2017) realizó un estudio de métodos mixtos


convergente concurrente del estrés familiar con progenitores de
niños que llevaban ingresados en una unidad de cuidados
intensivos pediátricos (UCIP) más de 1 semana. Esta autora declaró
claramente que el problema de investigación era que «se sabe poco
sobre cómo las familias experimentan estrés cuando la estancia de
su hijo en una unidad de cuidados intensivos (UCI) se prolonga»
(pág. 33). A partir de la experiencia clínica de la investigadora y de
la literatura como marco conceptual del estudio, se desarrolló un
modelo ecológico complejo de vivir en dos mundos. El marco
consistió en los múltiples factores que afectan a los progenitores y al
niño en una familia cuando el niño es hospitalizado. Los factores
ayudaron a guiar las preguntas de la entrevista. La investigadora
entrevistó a nueve progenitores correspondientes a ocho familias.
Hagstrom (2017) reconoció que hizo hincapié en el componente
cualitativo del estudio, utilizando los hallazgos cuantitativos para
aumentar la descripción del estrés de las familias y comparar su
estrés cuantificado con su valoración verbal de dicho estrés. Los
datos cualitativos se recogieron mediante una entrevista, seguida
de la cumplimentación de los dos cuestionarios cuantitativos: el
Family Inventory of Life Events y el Family Systems Stressor-
Strength Inventory. Los participantes cumplimentaron los

921
instrumentos después de la entrevista, pero se les animó a hablar
sobre los motivos de sus respuestas sobre los cuestionarios a
medida que los cumplimentaban. Toda la interacción con el
participante se grabó en audio y se transcribió para su análisis
(Hagstrom, 2017). Aunque las entrevistas se realizaron en primer
lugar, las transcripciones no se analizaron antes de la fase
cuantitativa y ambos tipos de datos se recogieron durante una
reunión, lo que es concordante con un diseño concurrente.
Debido al pequeño tamaño muestral, las frecuencias y los
estadísticos descriptivos fueron los únicos análisis descritos para los
datos cuantitativos. Se utilizaron los datos demográficos para
clasificar las familias según su estadio de desarrollo como familia,
en función de la edad del niño mayor. La clasificación permitió al
investigador comparar las puntuaciones de estrés de cada familia
con las normas nacionales para las familias del mismo estadio de
desarrollo (Hagstrom, 2017). Con este método, solo una familia se
clasificó en el grupo de estrés bajo. La mitad de las familias vivían a
80 km o más del hospital y un progenitor permanecía en el hospital
todo el tiempo. Una familia vivía a 1.930 km de distancia. Algunos
de los niños tenían una historia prolongada de enfermedad y uno
de ellos había tenido 21 hospitalizaciones previas. Dos eran recién
nacidos y estaban en la UCIP después de una intervención por
cardiopatía congénita. El análisis cuantitativo proporcionó datos
sobre las familias que establecieron el contexto social para la fase
cualitativa del estudio.
El análisis cualitativo reveló tres temas, uno de los cuales se
denominó separación. El tema de la separación constaba de los
códigos de «estar separado», «una tracción constante», «cambios de
roles familiares», «dejar el hospital» y «hermanos en el hospital». El
segundo tema se denominó enfermedad y angustia del niño. Las
amenazas futuras para la salud del niño eran factores del estrés de
los progenitores relacionados con la enfermedad actual y la
angustia del niño. El tercer tema era el desconocimiento, que se
relacionaba con el miedo sobre lo que pasaría a continuación
cuando los progenitores describían la sensación de montaña rusa de
estar en la UCIP. Uno de los elementos de estrés era que los
profesionales sanitarios tampoco sabían qué pasaría, debido a los
numerosos factores que influían en el progreso y el pronóstico del

922
niño. A pesar de la información y orientación previas, los
progenitores sentían que no estaban preparados para la
incertidumbre de la hospitalización de su hijo (Hagstrom, 2017).
Hagstrom (2017, pág. 35) describió el análisis combinado de los
datos cuantitativos y cualitativos como una comparación «intra e
interfamiliar para evaluar cómo se relacionaban». Uno de los
puntos fuertes del estudio fue la atención de la investigadora al
rigor, incluida la descripción del registro de decisiones, del
muestreo hasta alcanzar la saturación y de otros métodos utilizados
para aumentar la confianza de los hallazgos. Otro punto fuerte fue
la integración de los hallazgos combinados con los hallazgos de los
estudios publicados. La contribución del estudio al conocimiento de
enfermería fue el hallazgo de que los progenitores no se sentían
preparados para lo que ocurría durante la hospitalización, a pesar
de la información y el apoyo proporcionados por el equipo
sanitario (Hagstrom, 2017). Sin embargo, nosotros observamos un
problema ético relacionado con la confidencialidad. En el artículo,
los datos demográficos se resumieron para cada familia. Por
ejemplo, la familia que vivía a 1.930 km del hospital tenía un hijo de
12 años con diabetes que estaba en la UCIP por haber recibido un
trasplante de órgano. La combinación específica de datos descrita
por cada familia podría haber hecho que las familias fuesen
identificables por los profesionales de enfermería y otro personal
sanitario en el entorno en el que se realizó la investigación.

Estrategia exploratoria secuencial


Esta estrategia comienza con la recogida y análisis de datos
cualitativos, seguidos por la recogida de datos cuantitativos. Esta
estrategia suele seleccionarse para temas poco investigados (Leavy,
2017). La primera fase permite la exploración del tema para obtener
información con vistas a la fase cuantitativa. Los resultados del
componente cualitativo pueden utilizarse para diseñar la fase
cuantitativa (fig. 14.3). Esto es lo que se realizó en el estudio llevado
a cabo por Al-Yateem, Docherty y Rossiter (2016). Durante la
primera fase del estudio, se entrevistó a 25 adolescentes y adultos
jóvenes con fibrosis quística (FQ) para obtener percepciones de la
asistencia de calidad en esta población de pacientes. Los
investigadores identificaron cuatro determinantes de calidad del

923
servicio utilizando un análisis del contenido para analizar los datos
de las entrevistas. El primero era la «provisión de información fácil
de comprender por el adolescente relacionada con todos los
aspectos de vivir con FQ» (Al-Yateem y cols., 2016, pág. 259). Los
otros tres eran: «servicios que facilitan y fomentan la
independencia», «servicios caracterizados por una estructura con
capacidad de ser tanto dinámicos como flexibles» y «profesionales
sanitarios con conocimientos y capacitación en cuestiones
específicas de adolescentes» (págs. 258-259).

FIG 14.3 Métodos mixtos exploratorios secuenciales.

Los hallazgos cualitativos se utilizaron para desarrollar el


cuestionario utilizado durante la fase cuantitativa. Los cuatro
determinantes de la calidad del servicio se transformaron en ítems
en un cuestionario. «Cada determinante del servicio sanitario
propuesto constituyó un ítem individual en el cuestionario» (pág.
257). Los investigadores preguntaron a un panel de 10 expertos que
valorasen la claridad y relevancia de los ítems, lo que dio lugar a
una validez del contenido de 0,91 (Waltz, Strickland y Lenz, 2017).
A continuación, el cuestionario de 24 ítems desarrollado a partir de
los hallazgos de la entrevista se distribuyó a un grupo mayor de
participantes en el estudio, a quienes se les pidió que puntuaran la
importancia de los determinantes de calidad para aumentar la
«validez y transferibilidad de los resultados del estudio» (Al-
Yateem y cols., 2016, pág. 257).
A partir de un registro de FQ, se reclutaron 113 adolescentes y
adultos jóvenes, que cumplimentaron el cuestionario para priorizar
los ítems. Al-Yateem y cols. (2016) identificaron que la inclusión
solo de participantes que tenían FQ era una limitación cuando la
pregunta de investigación abordaba de un modo más amplio la
calidad asistencial para niños y adolescentes con cualquier
enfermedad crónica. Los investigadores también señalaron que los

924
hallazgos eran «decepcionantemente congruentes con los hallazgos
de otros muchos estudios que analizaron las experiencias de
adolescentes y adultos jóvenes en los sistemas sanitarios» (Al-
Yateem y cols., 2016, pág. 261). A semejanza de los hallazgos
previos, los hallazgos de su estudio pusieron de relieve la necesidad
de que los servicios se basasen en la información sobre la necesidad
de quienes reciben dichos servicios. Los participantes indicaron que
los profesionales sanitarios parecían poco informados sobre la
«complejidad del desarrollo de los adolescentes» (pág. 263) y sobre
el hecho de que los «protocolos y listas de comprobación de los
profesionales… no satisfacían las necesidades actuales» (pág. 262)
de sus pacientes adolescentes.
Al-Yateem y cols. (2016) identificaron con claridad que la relación
entre las dos fases de su diseño exploratorio secuencial consistió en
la corroboración y priorización. Se describió la validez del
contenido de la encuesta, pero no se proporcionó información sobre
la fiabilidad. El equipo no se centró en el desarrollo de una
herramienta con fines de investigación, sino en la comprensión de
las perspectivas de la población sobre una asistencia de calidad. Su
motivación fue mejorar la asistencia de niños con enfermedades
crónicas utilizando los cuatro determinantes de la calidad. Las
descripciones exhaustivas de los determinantes de una asistencia
sanitaria de calidad pueden servir como estándares con los que se
deberían diseñar y evaluar la asistencia a adolescentes. La
limitación principal del estudio fue que el cuestionario parecía estar
diseñado solo para su uso en el estudio y requeriría una
comprobación adicional antes de que se pudiese utilizar para
evaluar la asistencia o para comprobar los efectos de una
intervención.
Los investigadores han identificado motivos adicionales para
utilizar el diseño exploratorio secuencial. A diferencia del estudio
de Al-Yateem y cols. (2016), este enfoque de método mixto se usa
con frecuencia para desarrollar una herramienta de investigación
cuantitativa rigurosa, proporcionar información preliminar sobre
sus propiedades psicométricas y preparar la herramienta para
utilizarla con otras muestras en el futuro (Morgan, 2014). Otro
motivo para utilizar el diseño es desarrollar hipótesis de
investigación para la fase cuantitativa a partir de los hallazgos de la

925
fase cualitativa (Morgan, 2014). La estrategia exploratoria
secuencial también puede estar indicada cuando un tema no se ha
estudiado previamente y los investigadores quieren obtener las
opiniones no sesgadas de los participantes. Existe el temor de que el
contenido de los instrumentos cuantitativos pueda influir en las
respuestas de los participantes. Para evitar esto, los datos
cualitativos se recogen y se analizan primero, seguidos de los
instrumentos cuantitativos.

Estrategia explicativa secuencial


Cuando se utiliza una estrategia explicativa secuencial, el
investigador recoge y analiza los datos cuantitativos, tras lo que
hace lo mismo con los datos cualitativos para explicar los hallazgos
cuantitativos (fig. 14.4). Un análisis cualitativo del fenómeno facilita
una comprensión más completa y es adecuada para explicar e
interpretar las relaciones.

FIG 14.4 Métodos mixtos explicativos secuenciales.

Lenz y Lancaster (2017) seleccionaron un diseño explicativo


secuencial para reforzar la validez de su estudio sobre los efectos
del tratamiento psicológico ambulatorio intensivo (PAI). La
intervención se diseñó específicamente para los supervivientes de
traumas con un diagnóstico de trastorno de estrés postraumático
(TEPT). El formato PAI se consideró una alternativa viable a la
hospitalización del paciente cuando este no mostraba intenciones
de lesionarse a sí mismo o a los demás, pero necesitaba un
tratamiento adicional a la terapia ambulatoria tradicional.
Basándose en el entorno y en la integración de múltiples terapias,
los investigadores accedieron a los datos de ingreso y de alta de
pacientes que habían recibido tratamiento con un formato PAI, pero
que carecían de los recursos para crear un grupo de comparación o

926
de control. «…Complementamos las estimaciones cuantitativas de
los efectos del tratamiento con datos cualitativos…» para identificar
«las percepciones de los participantes sobre qué aspectos del
tratamiento les resultaban útiles» (Lenz y Lancaster, 2017, pág. 25).
El estudio tuvo tres preguntas de investigación. Las primeras dos
preguntas abordaron la magnitud del cambio de la gravedad de los
síntomas de salud mental y de la salud relacional desde el ingreso
hasta el alta (Lenz y Lancaster, 2017). Estos datos se recogieron con
instrumentos cuantitativos. La tercera pregunta, «¿Qué factores
programáticos atribuyen los pacientes a los cambios observados?»,
se contestó utilizando datos de grupos focales. Los datos de los
grupos focales se analizaron utilizando codificación y procesos de
teoría fundamentada (v. cap. 3). La teoría fundamentada se
seleccionó como metodología cualitativa porque el objetivo era
«generar una teoría provisional para explicar los aspectos comunes
de las experiencias de los pacientes» en el programa (Lenz y
Lancaster, 2017, pág. 28).
La muestra para el estudio de métodos mixtos consistió en 30
mujeres y 18 varones con un promedio de edad de 43,48 años.
Desde la admisión al alta, los resultados cuantitativos mostraron
cambios estadísticamente significativos en la ansiedad, depresión,
hostilidad, sensibilidad interpersonal e ideación paranoide, con
unos tamaños del efecto moderados o grandes (Lenz y Lancaster,
2017). Los participantes indicaron unos cambios significativos
también en sus relaciones con los compañeros y con la comunidad.
El tema teórico de los datos cualitativos fue la reintegración del yo
en contraste con lo referido por los pacientes que era «sentirse
fragmentados y desconectados de ellos mismos y de su entorno al
principio del tratamiento» (Lenz y Lancaster, 2017, pág. 29). Los
cambios que experimentaron se atribuyeron a «un medio
terapéutico diverso que proporcionó los elementos fundamentales
de esperanza y curación» (pág. 29). Durante la terapia de grupo, los
pacientes se encontraban con otras personas que habían «sufrido
una fractura similar por un trauma», elemento común que creó
cohesión en el grupo (pág. 30). Diversas actividades, como la
realización de un diario, proporcionaron catarsis y les ayudaron a
comprender mejor el dolor que habían experimentado y seguían
experimentando. La combinación de terapias permitió la

927
reintegración a «desarrollarse orgánicamente a medida que los
pacientes elaboraban las herramientas, la conciencia y el apoyo para
afrontar su pasado» (Lenz y Lancaster, 2017, pág. 31). Los hallazgos
de la fase cuantitativa fueron que «los participantes mostraron unos
cambios significativos en los síntomas psicológicos y la salud
relacional con el tiempo»; los hallazgos de la fase cualitativa fueron
que «los aspectos humanos del cambio y la recuperación del trauma
se extendieron más allá de las interpretaciones de los tamaños del
efecto» (Lenz y Lancaster, 2017, pág. 31).
Lenz y Lancaster (2017, pág. 32) combinaron apropiadamente dos
métodos para superar algunas de las limitaciones de un diseño
cuantitativo con un solo grupo, que no «permite atribuciones
causales relacionadas con la implementación del tratamiento que se
puedan generalizar a una población más amplia…». Reconocieron
que la maduración era una amenaza para la validez porque los
síntomas de los participantes pueden haber mejorado con el tiempo
y recomendaban que los diseños futuros permitan comparaciones
entre grupos. Otra limitación del diseño era que no generó
información sobre la sostenibilidad de los efectos terapéuticos, lo
que se podría haber superado mediante la realización de una
evaluación de seguimiento unos meses después del tratamiento.

Dificultades de los diseños de métodos


mixtos
Combinación de datos cuantitativos y cualitativos
Los estudios deben diseñarse cuidadosamente para garantizar la
congruencia entre el problema, el propósito, las preguntas, los
diseños, la recogida y análisis de datos, así como la interpretación
de los hallazgos. La congruencia de los estudios de métodos mixtos
puede ser especialmente difícil, porque los métodos cuantitativos y
cualitativos se basaron en filosofías discrepantes. Cuando se usa el
pragmatismo como filosofía predominante, la motivación para el
estudio y el resultado deseado determinan la mejor forma de
integrar los datos de un estudio de métodos mixtos (Morgan, 2014).
La integración de los resultados de cada componente es la fase
crítica y debería considerarse exhaustivamente durante el
desarrollo del estudio (Guetterman, Fetters y Creswell, 2015). Lo

928
ideal es que los planes para integrar los datos formen parte de la
propuesta de investigación y pueden incluir basar la segunda fase
del estudio en los hallazgos de la primera, ampliar la visión de un
fenómeno, o reforzar el respaldo mediante la interpretación
conjunta de los datos.
Algunos investigadores que utilizan diseños de métodos mixtos
recomiendan convertir los datos de la fase cualitativa en el mismo
tipo de datos que se generaron por la fase cuantitativa, o viceversa.
Cuando se hace esto, los códigos cualitativos se pueden contar y
convertir en datos cuantitativos, o los datos cuantitativos se pueden
convertir en ideas o temas conceptuales (Leavy, 2017). Otros
investigadores comparan y contrastan sistemáticamente los
hallazgos de cada grupo del estudio, y muestran estas relaciones en
gráficas, tablas y figuras (Creswell, 2015; Guetterman y cols., 2015).
La capacidad de los diseños de métodos mixtos para responder a
las preguntas de investigación depende de que se usen unos
métodos eficaces para integrar los datos de cada componente.

Uso de recursos
Como se puede deducir de los ejemplos proporcionados en este
capítulo, los estudios de métodos mixtos requieren una dedicación
de tiempo que puede superar a la necesaria para los estudios de un
solo método (Wisdom y Creswell, 2013). Por ejemplo, un equipo de
investigación recogió datos durante 4 años para implementar un
estudio de métodos mixtos (Goldman y Little, 2015). El estudio de
Goldman y Little sobre el empoderamiento de las mujeres en
grupos de tribus masái en Tanzania y Uganda fue riguroso y
consistió en entrevistas individuales, entrevistas de grupo y
observación etnográfica para la fase cualitativa, así como datos de
encuestas para la fase cuantitativa. Las investigadoras creyeron que
el esfuerzo mereció la pena y que garantizó un estudio de alta
calidad gracias a que se dedicó mucho tiempo para ser aceptadas en
las comunidades donde se realizó el estudio. En los diseños
secuenciales, la recogida y análisis de datos debe completarse
durante la primera fase para desarrollar o revisar la segunda fase.
El tiempo adicional a menudo se traduce en la necesidad de un
mayor respaldo económico (van Griensven, Moore y Hall, 2014).

929
Financiación
Puede ser necesario buscar y recibir financiación para garantizar
que se completa el estudio. Debido a la complejidad de los diseños
concurrentes, se necesita más personal para llevar a cabo todos los
aspectos de la investigación cuantitativa y cualitativa
simultáneamente. Lo ideal es que el equipo de investigación esté
compuesto por profesionales sanitarios con una formación y
experiencia diferentes (Creswell, 2015). Cuando el equipo de
investigación es multidisciplinar, sus miembros aportan
perspectivas, habilidades y experiencia distintas. Se pueden asignar
aspectos específicos a los miembros del equipo para que coincidan
con su experiencia. Puede que se necesite tiempo adicional para
desarrollar la propuesta cuando se trabaja con un equipo
multidisciplinar, ya que se puede tardar más en lograr un acuerdo
sobre el propósito, diseño y métodos del estudio, debido a las
distintas creencias filosóficas y conceptuales. Cuando se realizan
estudios de métodos mixtos por parte de investigadores
individuales, pueden requerir financiación adicional para contratar
un consultor que se ocupe del componente del estudio con el que se
esté menos familiarizado.

Valoración crítica de los diseños de métodos


mixtos
Está empezando a alcanzarse un acuerdo sobre los estándares con
los que debería valorarse la calidad de los estudios de métodos
mixtos (Creswell, 2015). Pluye, Gagnon, Griffiths y Johnson-Lafleur
(2009) publicaron una revisión sistemática de la literatura con el fin
de determinar si había un consenso sobre los estándares de calidad
con los que valorar los diseños de métodos mixtos. Los National
Institutes of Health (NIH) mediante su Office of Behavioral and
Social Science Research en los NIH convocaron un panel de
expertos con el fin de desarrollar las mejores prácticas para la
investigación de métodos mixtos (Creswell, Klassen, Clark y Smith,
2011). Parte de la tarea del panel era identificar los criterios para
evaluar las aplicaciones de métodos mixtos con el fin de obtener
financiación por los NIH. En este libro, hemos sintetizado los
estándares de las distintas fuentes, para dar lugar a una serie

930
concisa de estándares de calidad para la investigación de métodos
mixtos (tabla 14.1).

TABLA 14.1
CRITERIOS PARA LA VALORACIÓN CRÍTICA DE ESTUDIOS
DE MÉTODOS MIXTOS: PREGUNTAS UTILIZADAS PARA
GUIAR LA VALORACIÓN

Adaptada de Creswell, J. W. (2014). Research design: Qualitative,


quantitative, and mixed methods approaches (4.ª ed.). Los Angeles,
California: Sage; Creswell, J. W. (2015). A concise introduction to mixed
methods research. Los Angeles, California: Sage; and Creswell, J.,
Klassen, A., Clark, V., Smith, K. (2011). Best practices for mixed methods
research in health sciences.
https://www2.jabsom.hawaii.edu/native/docs/tsudocs/Best_Practices_for_Mixed_Method
Basándose en los conocimientos sobre los métodos cuantitativos
y cualitativos, aprender a criticar los estudios de métodos mixtos
amplía las capacidades académicas. Los estándares de calidad que
se muestran en la tabla 14.1 proporcionan un método sistemático
para la valoración crítica de los estudios de métodos mixtos. A
continuación, se proporciona como ejemplo una valoración crítica
de un estudio de métodos mixtos realizado por Giarelli, Denigris,
Fisher, Maley y Nolan (2016), utilizando los estándares de calidad
propuestos.
El estrés relacionado con el trabajo (ERT) y la fatiga por

931
compasión de los profesionales de enfermería oncológica fueron los
conceptos de interés para el estudio de Giarelli y cols. (2016), que se
realizó con una muestra de 20 profesionales de enfermería en una
unidad de hematooncología y «evaluó las notificaciones de los
profesionales de enfermería de experiencias positivas y negativas
sobre factores que podrían ser modificables y que podrían
traducirse en un programa de prevención receptivo para mejorar la
satisfacción de estos profesionales» (Giarelli y cols., 2016, pág.
E121). La razón pragmática para la realización de este estudio de
métodos mixtos fue el desarrollo de un programa para reducir o
evitar el ERT y la fatiga por compasión de los profesionales de
enfermería.

Relevancia
La relevancia de la preguntas de investigación se estableció en un
grado limitado. Giarelli y cols. (2016) declararon que la satisfacción
de los profesionales de enfermería con su trabajo podría mejorar la
asistencia prestada a los pacientes, pero proporcionaron una
evidencia mínima que respaldase esta declaración. La sección de
antecedentes incluyó las investigaciones publicadas sobre el
desgaste profesional, la fatiga por compasión y el ERT, señalando
una cierta evidencia contradictoria. Las investigadoras
establecieron que estos conceptos eran aplicables a los profesionales
sanitarios de diversos entornos.

Experiencia
Tres miembros del equipo de investigación eran docentes con
grados de doctorado. Uno tenía un grado de doctorado en
investigación, otro un grado de doctorado en enfermería práctica
(Doctor of Nursing Practice, DNP) y el tercero un grado de doctorado
en educación. La Dra. Giarelli no había publicado ningún trabajo
previo sobre el tema del estrés laboral y la satisfacción de los
profesionales de enfermería, pero había publicado varios trabajos
sobre los aspectos genéticos del cáncer en la misma revista.
También tenía muchas publicaciones como autora individual y
como parte de un equipo en el área del trastorno del espectro
autista. Había publicado estudios tanto cuantitativos como
cualitativos, pero no se encontró ningún estudio de métodos

932
mixtos. La Dra. Giarelli era una líder experimentada del equipo de
investigación. La Dra. Fisher había tenido experiencia con los
métodos mixtos y había publicado muchos estudios de
investigación. El resto de los miembros del equipo eran una gestora
clínica de una unidad de oncología y un estudiante que actuó de
ayudante de investigación (Giarelli y cols., 2016). La gestora clínica,
Jami Denigris, había publicado dos trabajos sobre la asistencia
oncológica. Denigris había trabajado con Giarelli para
conceptualizar el problema de investigación y el diseño del estudio,
lo que puede indicar las preocupaciones sobre la fatiga por
compasión de los profesionales de enfermería de su unidad. El
equipo de investigación tenía una experiencia excelente. Las
contribuciones de cada miembro se indicaron claramente y eran
apropiadas en función de su formación.

Idoneidad
Este criterio aborda si el diseño era apropiado para el propósito del
estudio, comenzando con el hecho de que las investigadoras
hubiesen establecido la necesidad de utilizar métodos mixtos. El
propósito del estudio era «analizar los factores que influyen en la
percepción que los profesionales de enfermería tienen de la calidad
de la vida laboral y del riesgo de FC (fatiga por compasión) (Giarelli
y cols., 2016, E121). La necesidad de utilizar un diseño de métodos
mixtos se vio respaldada porque las investigadoras señalaron la
complejidad y naturaleza personal del fenómeno. Giarelli y cols.
(2016, pág. E123) también evaluaron la literatura que revisaron,
indicando que había hallazgos conflictivos y tamaños muestrales
pequeños. Se argumentó que la recogida de datos tanto
cuantitativos como cualitativos daría lugar a una descripción más
exhaustiva del fenómeno y respaldaría el desarrollo de un
programa preventivo (Giarelli y cols., 2016). Concluyeron que el
problema continuo de la fatiga por compasión indicaba la
necesidad de «aumentar la comprensión y llevar a cabo estrategias
preventivas utilizando un enfoque muy personal, comprometiendo
a los profesionales de enfermería en el proceso de reflexionar sobre
su riesgo y solicitando recomendaciones» (Giarelli y cols., 2016, pág.
E123).

933
Muestreo
El estudio se realizó en una única unidad en un hospital que
contaba con 50 profesionales de enfermería que trabajaban en
turnos de 12 horas. Veinte de dichos profesionales participaron
voluntariamente en el estudio. La muestra fue la misma para la
recogida de datos cuantitativos y cualitativos. La gestora de la
unidad reclutó la muestra de la unidad en la que estaba contratada
mediante la publicación de anuncios. Cuando los profesionales de
enfermería expresaban su interés, la gestora obtenía el
consentimiento informado y proporcionaba una serie de
instrumentos de investigación. La inclusión de la gestora de la
unidad en el equipo puede haber tenido efectos positivos o
negativos en la disposición de los profesionales a participar. Los
profesionales de enfermería de la muestra podían proporcionar los
datos necesarios para responder a las preguntas de investigación.

Métodos
Las investigadoras indicaron que su estudio tenía un diseño
descriptivo de métodos mixtos. Utilizando las preguntas de la
figura 14.1, el estudio tiene un diseño convergente concurrente
(Giarelli y cols., 2016). Las investigadoras utilizaron instrumentos
de investigación sólidos desde un punto de vista psicométrico,
congruentes con la filosofía lógico-positivista asociada con la
investigación cuantitativa. También se indicó la fiabilidad y validez
de los instrumentos en estudios previos. Se realizaron entrevistas en
persona y telefónicas para recopilar descripciones cualitativas
personales del ERC y de la fatiga por compasión compatibles con el
constructivismo. El pragmatismo fue la filosofía principal del
estudio y guio las preguntas de la entrevista que dieron lugar a
recomendaciones sobre los métodos de prevención.
Se proporcionaron suficientes detalles para la mayoría de los
procedimientos de recogida de datos. Como se ha indicado, se
proporcionaron las características de los instrumentos cuantitativos,
así como las preguntas de la entrevista (Giarelli y cols., 2016). Se
describieron los procedimientos de análisis de los datos, pero no se
indicaron las evaluaciones de la fiabilidad de los instrumentos con
esta muestra. El informe incluyó suficientes detalles para que se
pudiese criticar el modo en el que se interpretaron e integraron los

934
datos de ambos componentes. Las investigadoras describieron la
congruencia y la incongruencia de los resultados cuantitativos y
cualitativos en el texto, pero era difícil seguirlo y relacionarlo con
los datos que lo respaldaban. Una presentación visual o una tabla
que mostrase la integración de los hallazgos cuantitativos habría
sido muy útil. La tabla 14.2 se elaboró a partir de los resultados del
estudio para mostrar cómo se podrían haber integrado los
hallazgos.

TABLA 14.2
REPRESENTACIÓN VISUAL DE LOS HALLAZGOS
CUANTITATIVOS Y CUALITATIVOS DEL ESTUDIO DE
MÉTODOS MIXTOS DEL ESTRÉS RELACIONADO CON EL
TRABAJO Y LA FATIGA POR COMPASIÓN DE
PROFESIONALES DE ENFERMERÍA ONCOLÓGICA

CVPro, calidad de vida profesional; EEV, escala de eventos vitales; EIE,


escala de impacto de los eventos; ETS, estrés traumático secundario.
La protección de los sujetos humanos quedó clara en el estudio.
Giarelli y cols. (2016) obtuvieron la aprobación del comité de
revisión institucional (CRI) de la universidad y del CRI del centro.
La información de identificación se separó de los datos codificados
de los instrumentos para proteger el anonimato de los datos
cuantitativos. Debido a que las entrevistas fueron realizadas por
alguien que no formaba parte del equipo investigador y a que no se
escribieron nombres en las cintas de audio ni en las transcripciones,
se protegió la confidencialidad de los datos cualitativos.
Los procedimientos cuantitativos fueron apropiados para un

935
estudio descriptivo sin intervención. Se realizaron procedimientos
cualitativos para aumentar la confianza, la confiabilidad y
credibilidad de los resultados, como garantizar la exactitud de las
transcripciones de las entrevistas (Giarelli y cols., 2016). Las
investigadoras realizaron sesiones informativas entre ellas para
alcanzar un consenso sobre los temas de las entrevistas. Se
incluyeron citas de los participantes en el informe publicado como
evidencia para respaldar los temas.

Hallazgos
La ausencia de una tabla o diagrama que mostrase la integración de
los resultados de los componentes del diseño cuantitativo y
cualitativo hizo que la integración de los resultados no quedase
clara. Entre las limitaciones identificadas por las investigadoras, se
incluyó la homogeneidad de la muestra para el sexo, la raza y la
etnicidad, así como el impacto desconocido de los turnos de 12
horas sobre el ERT. Otras limitaciones son la autoselección de los
profesionales de enfermería, la implicación de la gestora de la
unidad en el reclutamiento y el pequeño tamaño muestral del
grupo cuantitativo del estudio. Giarelli y cols. (2016) señalaron que
los participantes en el estudio refirieron un ERC y una fatiga por
compasión mínimos. Una explicación puede ser que algunos
profesionales de enfermería de la unidad optaran por no participar
debido a la falta de energía emocional por unos grados mayores de
estrés y fatiga.

Conclusiones e implicaciones
Giarelli y cols. (2016) concluyeron que el estudio respaldaba la
naturaleza social del ERC y de la fatiga por compasión. Por tanto, se
deben abordar los factores de la unidad, de la institución e
interpersonales en entornos específicos antes de implementar un
plan de prevención para el desgaste profesional. Las conclusiones
de las investigadoras y las implicaciones para enfermería fueron
apropiadamente cautelosas debido a las limitaciones y amenazas
para la validez del estudio.

Contribuciones al conocimiento

936
La inversión de tiempo, dinero y esfuerzo proporcionó una
información útil para una unidad específica que tenía unos
pacientes física y psicológicamente vulnerables y con un estado de
salud muy grave (Giarelli y cols., 2016). Debido a la conclusión
sobre la especificidad de los factores que influyen en el ERT y la
fatiga por compasión, la generalizabilidad de los hallazgos es
limitada. Las investigadoras no identificaron uno de los posibles
beneficios principales del estudio, que podría haber sido
proporcionar una oportunidad a los profesionales de enfermería
para verbalizar su estrés y recomendar estrategias personales y para
la unidad con el fin de prevenir la fatiga por compasión y del
desgaste profesional.

INVESTIGACIÓN DE RESULTADOS
La investigación de resultados es un método científico riguroso
que se centra en los resultados finales de la atención al paciente.
Más concretamente, la investigación de resultados se ocupa de la
eficacia de las intervenciones de la atención sanitaria y los servicios
de salud (Doran, 2011; Kane y Radosevich, 2011). En el contexto de
la enfermería, la investigación de resultados se centra en cómo el
estado de salud de un paciente cambia como resultado de los
cuidados de enfermería recibidos o de los servicios de enfermería
proporcionados (Moorhead, Johnson, Maas y Swanson, 2013).
Según la Agency for Healthcare Research and Quality (AHRQ), la
investigación de resultados se realiza para entender los resultados
finales de prácticas e intervenciones sanitarias específicas. Los
resultados finales incluyen los efectos que las personas
experimentan y que les preocupan, como los cambios en su
capacidad funcional. En concreto, para las personas con
enfermedades crónicas, en quienes la curación no siempre es
posible, los resultados finales comprenden la calidad de vida, el
funcionamiento, el manejo de los síntomas y la mortalidad. Al
relacionar la atención que reciben las personas con los resultados
que experimentan, la investigación de resultados se ha convertido
en la clave para desarrollar formas mejores de controlar y mejorar
la calidad asistencial (AHRQ, 2017a).
La investigación de resultados está impulsada sobre todo por los

937
responsables de elaborar políticas, las aseguradoras y la sociedad,
que basan el pago de la asistencia sanitaria en la eficiencia
económica de los sistemas sanitarios, sobre todo en la sanidad
pública. Como resultado, ha habido una creciente demanda de
datos que documenten las intervenciones, que justifiquen los costes
de la atención y que demuestren los mejores resultados para los
pacientes. En ese sentido, los resultados sensibles a la atención de
enfermería se han convertido en un tema de creciente interés
debido a las preocupaciones nacionales relacionadas con la calidad
de la atención al paciente (Moorhead y cols., 2013). Debido a que los
profesionales de enfermería están en la primera línea de la
prestación asistencial, la demanda de responsabilidad profesional
en relación con los resultados del paciente determina que podamos
identificar y documentar los resultados influidos por dicha
asistencia.
La primera parte de esta sección de investigación de resultados
aborda las bases teóricas de dicha investigación, ofrece unos
antecedentes breves de los proyectos emergentes para examinar los
resultados, explica la importancia de la investigación de resultados
diseñada para examinar la práctica enfermera y pone de relieve las
metodologías utilizadas en esta investigación. Esta sección concluye
con una introducción a las guías que podrían utilizarse para valorar
críticamente los estudios de resultados. El desarrollo de la
investigación de resultados y los enfoques descritos en este capítulo
son un fenómeno mundial (AHRQ, 2017a; Kenner, 2017).
La investigación de resultados difiere significativamente de otros
tipos de investigación abordados en este libro. Los estudios de
resultados tienen un diseño, población, entornos y análisis de los
datos más complejos y los investigadores que participan en ellos
proceden a menudo de diversas disciplinas, como la economía y la
salud pública, así como de la enfermería. Los estudios utilizan un
marco teórico único para centrarse en resultados de salud. En
consonancia con la perspectiva interprofesional de la investigación
de resultados, se han utilizado numerosas publicaciones
procedentes de diversas disciplinas para desarrollar el contenido de
este capítulo.

Base teórica de la investigación de

938
resultados
El teórico Avedis Donabedian (1978, 1980, 1987) propuso una teoría
para una atención sanitaria de calidad y proporcionó un
procedimiento para evaluarla. Esta teoría todavía es el marco
dominante para la investigación de resultados. Se han desarrollado
otras teorías de resultados desde entonces, pero nuestra discusión
se limita a la teoría de Donabedian. Aunque la calidad es el
constructo primordial de la teoría de Donabedian, en realidad él
nunca la definió (Mark, 1995). La Organización Mundial de la Salud
(OMS; 2017) definió la calidad de la asistencia como el grado en
que los servicios sanitarios dispensados a individuos y poblaciones
aumentan los resultados de salud deseados y son congruentes con
el conocimiento profesional actual.
Donabedian (1987) representó los conceptos y relaciones clave de
su teoría utilizando un cubo. El cubo mostrado en la figura 14.5
ayuda a explicar los elementos de una atención sanitaria de calidad.
Las tres dimensiones del cubo son la salud, los sujetos que reciben
la atención y los proveedores de dicha atención. El cubo también
incorpora tres de los muchos aspectos de la salud: función física,
función psicológica y función social. Donabedian (1987, pág. 4)
propuso que «la manera en que concebimos la salud, y nuestra
responsabilidad respecto a ella, marca una diferencia fundamental
en el concepto de calidad y, en consecuencia, en los métodos que
utilizamos para evaluar y asegurar la calidad de la asistencia».

939
FIG 14.5 Nivel y ámbito de preocupación como
factores para definir la calidad. (Tomada de Donabedian, A.
[1987]. Some basic issues in evaluating the quality of health care.
En L. T. Rinke [Ed.], Outcome measures in home care. vol. 1
[págs. 3-28]. Nueva York, Nueva York: National League for
Nursing.)

Donabedian (1987, 2005) identificó tres focos de evaluación en la


valoración de la calidad: la estructura (p. ej., unidades de
enfermería, hospitales, agencias de cuidados a domicilio), el
proceso (modo de prestar la asistencia, como un estilo o un
estándar de cuidados) y los resultados (resultados finales de la
asistencia). Cada uno de estos conceptos se aborda en este capítulo.
Un estudio de resultados de calidad completo requiere la inclusión
simultánea de los tres y una evaluación de las relaciones entre ellos.
Sin embargo, los investigadores han tenido poco éxito a la hora de
lograr este objetivo teórico. Los estudios diseñados para examinar
los tres conceptos requerirían muestras suficientemente grandes de

940
diversas estructuras, cada una con distintos procesos que comparar,
y muestras grandes de participantes en el estudio que hayan
experimentado los resultados de esos procesos. La financiación y la
cooperación necesarias para lograr este objetivo aún no se han
logrado; sin embargo, hay ejemplos de la investigación en
enfermería en los que se han evaluado dos o más aspectos de la
estructura, el proceso y/o los resultados. Muchos estudios
realizados por profesionales de enfermería en Estados Unidos
(Kutney-Lee, Sloane y Aiken, 2013; Rosenfeld y Glassman, 2016;
Staggs, Olds, Cramer y Shorr, 2017) y a escala internacional (Bakker
y cols., 2011; Oh, Park, Yin, Piao y Lee, 2014) han explorado las
relaciones entre los servicios e intervenciones de enfermería y los
resultados de los pacientes. Las intervenciones de enfermería
reflejan la atención prestada por los profesionales de enfermería.
Una evaluación del riesgo de caídas o de úlceras por presión son
ejemplos de intervenciones de enfermería. Los servicios de
enfermería son un concepto general que hace referencia a la
organización y administración de las actividades de enfermería. Las
variables del servicio de enfermería que se han estudiado incluyen
diversas habilidades y la constitución del personal de enfermería;
niveles de dotación de personal; patrones de asignación (enfermería
primaria, asignaciones funcionales o enfermería en equipo);
patrones de turnos; niveles de formación académica en enfermería,
experiencia y conocimientos; proporción entre profesionales de
enfermería que trabajan a tiempo completo y a tiempo parcial; nivel
y tipo de liderazgo de enfermería disponible de forma central y en
unidades asistenciales; cohesión y comunicación entre el personal
de enfermería y entre los profesionales de enfermería y los médicos;
aplicación de planes de atención clínica para pacientes con
diagnósticos seleccionados, e interrelaciones de estos factores (Kane
y Radosevich, 2011; Moorhead y cols., 2013).

Resultados sensibles a enfermería


Los resultados de pacientes sensibles a enfermería (RPSE) son
sensibles porque están influidos por decisiones y acciones de
enfermería. Puede que no estén causados por la práctica enfermera,
sino asociados a ella. En varias situaciones, la «práctica enfermera»

941
podría ser el profesional individual de enfermería, los profesionales
de enfermería como grupo de trabajo, el enfoque de la práctica
enfermera, la unidad o institución de enfermería que determina el
número de profesionales de enfermería, su carga de trabajo, la
gestión de estos profesionales y las políticas relacionadas con ellos y
su práctica. Podría incluso incluir la arquitectura de la unidad de
enfermería. De cualquier modo, las acciones de enfermería influyen
en los resultados, aunque los actos de otros profesionales sanitarios,
factores organizativos, así como características y conductas de los
pacientes suelen estar implicados en el resultado. Hay varios
resultados de los pacientes que podrían ser sensibles a enfermería.
En la tabla 14.3 (Doran, 2011; Moorhead y cols., 2013) se muestran
ejemplos de estos resultados y sus definiciones.

TABLA 14.3
RESULTADOS DE LOS PACIENTES SENSIBLES A LA
PRÁCTICA ENFERMERA Y DEFINICIONES

CONCEPTO
DE DEFINICIÓN
RESULTADO
Estado El estado funcional es un constructo multidimensional que se
funcional compone al menos de elementos conductuales (p. ej., realización de
actividades de la vida diaria), psicológicos (p. ej., estado de ánimo),
cognitivos (p. ej., atención, concentración) y sociales (p. ej.,
actividades asociadas con roles) (Doran, 2011; Moorhead y cols.,
2013)
Autocuidado Las conductas de autocuidado implican la práctica de acciones o
actividades que los individuos inician y llevan a cabo, dentro de
unos plazos de tiempo, por sí mismos con la intención de mantener
la vida, una funcionalidad saludable, un desarrollo personal
continuado y el bienestar (Moorhead y cols., 2013; Orem, 2001;
Sidani, 2011a)
Síntomas «Los síntomas se refieren a: a) sensaciones o experiencias que
reflejan cambios en las funciones biopsicosociales de una persona,
b) percepción del paciente de un estado físico, emocional o
cognitivo alterado, c) indicadores percibidos de cambio en el
funcionamiento normal, tal como los experimentan los pacientes, o
d) experiencia subjetiva que refleja los cambios en el
funcionamiento biopsicosocial, sensaciones o cognición de un
individuo» (Sidani, 2011b, pág. 132)
Dolor El dolor se ha definido como «la gravedad de la respuesta adversa

942
cognitiva y emocional al dolor físico» (Moorhead y cols., 2013, pág.
389)
Resultado Un resultado adverso se define como la consecuencia de una lesión
adverso causada por un tratamiento médico o una complicación en lugar de
por la propia enfermedad de base y, por lo general, incluye una
asistencia sanitaria prolongada, una discapacidad secundaria o la
muerte en el momento del alta (Doran, 2011)
Angustia La angustia psicológica se ha definido como «la condición
psicológica emocional que uno siente en respuesta a tener que afrontar
situaciones que son inquietantes, frustrantes o percibidas como
perjudiciales o amenazantes» (trabajo de Lazarus y Folkman,
citados en Howell, 2011, pág. 289)
Satisfacción «La satisfacción del paciente con los resultados de la asistencia
del paciente describe las percepciones de un individuo sobre la calidad e
con la idoneidad de la asistencia sanitaria prestada» (Moorhead y cols.,
asistencia 2013, pág. 49)
Tasa de La mortalidad, en su acepción más simple, refleja la muerte. «Al
mortalidad examinar la muerte como un resultado de calidad asistencial, se
examinan las tasas de muerte de muestras o poblaciones específicas
de pacientes» (Tourangeau, 2011, pág. 411)
Utilización de «La utilización de la asistencia sanitaria puede considerarse como
la asistencia la suma o el agregado de servicios utilizados por los pacientes en
sanitaria sus intentos de mantener o recuperar un nivel de estado de salud,
junto con los costes de estos servicios» (Clarke, 2011, pág. 441)

El modelo de efectividad del rol de enfermería, presentado en la


figura 14.6, se desarrolló para orientar la conceptualización y la
investigación relacionadas con los resultados sensibles a la práctica
enfermera. También proporcionó la base teórica para la revisión
sistemática de los «conocimientos actuales en la medición de los
resultados sensibles a enfermería» (Doran, 2011, pág. 15). Irvine,
Sidani y Hall (1998) adaptaron la teoría de la calidad de
Donabedian (1987) al desarrollo del modelo de efectividad del rol
de enfermería. Este modelo tiene tres componentes principales: la
estructura, el proceso (los roles de los profesionales de enfermería)
y los resultados del paciente y de salud.

943
FIG 14.6 Modelo de efectividad del papel de
enfermería. (Tomada de Irvine, D., Sidani, S. y Hall, L. M.
[1998]. Linking outcomes to nurses’ roles in health care. Nursing
Economic, 16[2], 58-64.)

La estructura en los resultados tiene tres subcomponentes: el


profesional de enfermería, la organización y el paciente. Las
variables del profesional de enfermería que influyen en la calidad
asistencial de enfermería incluyen factores como el grado de
experiencia, los conocimientos y las habilidades. Entre los
componentes organizativos que pueden afectar a la calidad de los
cuidados de enfermería se incluyen la combinación del personal, la
carga de trabajo y los patrones de asignación. Las características de
los pacientes que pueden afectar a la calidad asistencial y a los
resultados son su estado de salud, la gravedad de la enfermedad y
la morbilidad.
El proceso incluye la función del profesional de enfermería en
los resultados, que tiene tres subcomponentes: las funciones
independientes del profesional de enfermería, las funciones
dependientes del profesional de enfermería y las funciones
interdependientes del profesional de enfermería. Las funciones
independientes del personal de enfermería incluyen la evaluación,
el diagnóstico, las intervenciones iniciadas por el profesional de
enfermería y la atención continuada. Los resultados del paciente y
la salud de la función independiente son el control clínico y

944
sintomático, la ausencia de complicaciones, el estado funcional y el
autocuidado, el conocimiento de la enfermedad y su tratamiento, la
satisfacción y los costes (v. fig. 14.7). Las funciones dependientes
del personal de enfermería incluyen la ejecución de órdenes
médicas y de los tratamientos iniciados por los médicos. Las
funciones dependientes son las que pueden dar lugar a resultados
desfavorables para el paciente y la salud, como infección, ictus o
insuficiencia renal. Las funciones interdependientes del personal
de enfermería incluyen la comunicación, la gestión de casos, la
coordinación y la continuidad asistencial, el seguimiento y la
presentación de informes. Las funciones interdependientes dan
lugar al funcionamiento del equipo e influyen en los resultados de
los pacientes y de la salud de la función independiente. Los
resultados de los pacientes y de la salud están claramente
interrelacionados en todo el contexto de la atención (Irvine y cols.,
1998).

FIG 14.7 Teoría de Donabedian de la calidad centrada


en la estructura, el proceso y los resultados. (Adaptada
de Donabedian, A. [2003]. An introduction to quality assurance in
health care. Oxford, Reino Unido: Oxford University Press.)

Origen de los resultados y supervisión de la


prestación
Florence Nightingale se considera la primera enfermera que recogió
datos para identificar la contribución de la enfermería a una
atención de calidad y realizar investigaciones de los resultados del
paciente (Magnello, 2010). Sin embargo, los esfuerzos por recoger

945
sistemáticamente datos para evaluar los resultados en tiempos más
modernos no recibieron una atención generalizada en Estados
Unidos hasta finales de la década de 1970. En ese momento, la
preocupación por la calidad asistencial impulsó el desarrollo del
Universal Minimum Health Data Set, que fue seguido poco después
por el Uniform Hospital Discharge Data Set (Kleib, Sales, Doran,
Mallette y White, 2011). Estos conjuntos de datos proporcionaron
coherencia en la recogida de datos entre las organizaciones
sanitarias al indicar los datos que se debían recopilar. Los datos
agregados se utilizaron después para realizar una evaluación de la
calidad asistencial en hospitales y proporcionar información sobre
los pacientes dados de alta de los hospitales. Sin embargo, esos
conjuntos de datos no incluían información sobre los cuidados de
enfermería proporcionados a pacientes hospitalizados (Kleib y cols.,
2011). Sin esa información, la contribución de los cuidados de
enfermería al paciente, a nivel organizativo y a los resultados del
sistema permanecía invisible. Esta importante laguna en la
información se abordó mediante el desarrollo de conjuntos
mínimos básicos de datos de enfermería en Estados Unidos,
Canadá y otros países del mundo.

Iniciativas nacionales en investigación de


resultados
En la actualidad, hay varias iniciativas nacionales de la
investigación de resultados en Estados Unidos y otros países
centradas en el desarrollo de métodos para medir los resultados de
salud de los pacientes e informar sobre ellos. Aquí se comentan
algunas de las iniciativas nacionales de la investigación de
resultados en Estados Unidos para ofrecer una panorámica general,
comenzando con el trabajo de la AHRQ, tras lo que nos
centraremos en ejemplos de iniciativas nacionales de la
investigación de resultados en enfermería. Estas iniciativas están
allanando el camino para la investigación de resultados mediante la
elaboración de herramientas y metodologías para la medición de
los resultados del paciente y el desarrollo de grandes bases de
datos, que son fuentes de información para la investigación de
resultados.

946
Agency for Healthcare Research and Quality
La AHRQ, como parte del Department of Health and Human
Services (DHHS) estadounidense, apoya la investigación destinada
a mejorar los resultados y la calidad asistencial, reducir los costes
sanitarios, abordar la seguridad del paciente y los errores médicos y
ampliar el acceso a servicios eficaces. La página web de la AHRQ
(http://www.ahrq.gov) es una valiosa fuente de información sobre
la investigación de resultados, oportunidades de financiación y
resultados de la investigación más reciente, incluida la
investigación en enfermería. Los anuncios de subvenciones de la
AHRQ (2017b) se centran en «el apoyo de la investigación para
mejorar la calidad, eficacia, accesibilidad y rentabilidad de la
asistencia sanitaria».

Investigación de resultados centrada en el paciente


Una de las iniciativas más actuales de la AHRQ es la investigación
de efectividad comparativa. La financiación de la American
Recovery and Reinvestment Act (Recovery Act), promulgada en
2009, permitió a la AHRQ ampliar su labor para respaldar la
investigación de efectividad comparativa, incluyendo la mejora del
programa sobre la efectividad de la atención sanitaria. Se destinó
un total de 473 millones de dólares para la financiación de la
investigación de resultados centrada en el paciente (PCOR, patient-
centered outcomes research) en el PCOR Institute (PCORI). El PCORI
(2017) «ayuda a las personas a tomar decisiones sanitarias
informadas y mejora la provisión de asistencia sanitaria y los
resultados, mediante la producción y promoción de una
información basada en la evidencia y de alta integridad procedente
de investigaciones guiadas por pacientes, cuidadores y la
comunidad sanitaria más amplia». La prioridad de financiación
principal para la AHRQ es mejorar la calidad de la asistencia
sanitaria mediante el apoyo de la implementación de la PCOR. La
AHRQ cuenta con una amplia cartera de investigaciones que abarca
casi todos los aspectos de la asistencia sanitaria, incluidos:

• Práctica clínica.
• Resultados y eficacia de la atención.
• Práctica basada en la evidencia (PBE).

947
• Atención primaria y la atención de poblaciones prioritarias.
• Calidad de la asistencia sanitaria.
• Seguridad del paciente y errores médicos.
• Organización y prestación de la atención y uso de los
recursos sanitarios.
• Costes y financiación sanitarios.
• Tecnología de la información sanitaria.
• Transmisión del conocimiento.

National Quality Forum


El National Quality Forum (NQF) fue creado en 1999 como una
organización nacional de estandarización para las medidas de
rendimiento de la asistencia sanitaria (NQF, 2017a). La cartera de
servicios del NQF de los estándares de consenso voluntario incluye
las medidas de rendimiento, los eventos notificables graves y las
prácticas preferidas (es decir, prácticas seguras). Se puede encontrar
una lista completa de las medidas incluidas en la cartera del NQF
en la siguiente dirección de internet:
http://www.qualityforum.org/Measures_Reports_Tools.aspx.
Alrededor de un tercio de las medidas en la cartera del NQF son
medidas de resultados de pacientes, como la mortalidad, los
reingresos, el funcionamiento sanitario, la depresión y la
experiencia asistencial. El NQF incluye en su cartera varias medidas
sensibles a la práctica enfermera para medir el rendimiento. Las
siguientes fueron presentadas por la American Nurses Association
(ANA) conforme a los National Database of Nursing Quality
Indicators (v. después):

• Combinación de habilidades del personal de enfermería.


• Horas de cuidados de enfermería por paciente y día.
• Tasa de infecciones del tracto urinario asociadas al sondaje
vesical.
• Tasa de bacteriemia asociada a vía venosa central.
• Tasas de caídas y lesiones.
• Tasas de úlceras por presión adquiridas en hospitales y
unidades asistenciales.
• Tasa de rotación del personal de enfermería.
• Escala de entorno de la práctica de un profesional de

948
enfermería diplomado.
• Tasa de neumonía asociada a ventilación mecánica.

Estos indicadores son las primeras medidas nacionales de


rendimiento estandarizadas de resultados sensibles a enfermería en
hospitales de agudos y se han diseñado para evaluar la calidad de
la asistencia sanitaria, la seguridad del paciente y un entorno de
trabajo profesional y seguro. Aunque la mayoría de las medidas
utilizadas se centran en la incapacidad de cumplir los estándares
esperados, el NQF cree que la calidad tiene que ver tanto con la
influencia en los resultados positivos, como con la evitación de los
resultados negativos. Por tanto, el NQF está desarrollando
actualmente estándares nacionales para evaluar la calidad de la
asistencia sanitaria en función de cómo se sienten los pacientes. Se
señala que «los programas nacionales para la evaluación de la
calidad suelen medir y recompensar las prácticas basadas en la
mejora de procesos clínicos como las tasas de reingreso o de
infección. Aunque este tipo de información es importante y útil
para los clínicos, no siempre tiene en cuenta lo más importante para
el paciente y la familia del paciente que recibe asistencia, como el
manejo sintomático a largo plazo o la capacidad para llevar a cabo
sus actividades diarias» (NQF, 2017b).

National Database of Nursing Quality Indicators


En 1994, la ANA, en colaboración con el Nursing Expert Panel on
Quality Health Care de la American Academy of Nursing, puso en
marcha un plan para identificar los indicadores de calidad de la
práctica enfermera y recoger y analizar datos utilizando estos
indicadores en Estados Unidos (Mitchell, Ferketich y Jennings,
1998). El objetivo fue identificar y/o desarrollar medidas de calidad
sensibles a la práctica enfermera. La teoría de Donabedian se utilizó
como marco para el proyecto. En conjunto, estos indicadores
definieron la Nursing Care Report Card de la ANA, podría facilitar
la evaluación comparativa o fijar un estándar deseable que
permitiese las comparaciones entre hospitales respecto a la calidad
de sus cuidados de enfermería.
En 1998, la ANA proporcionó fondos para desarrollar una base
de datos nacional destinada a albergar los datos recogidos a través

949
de los indicadores de calidad sensibles a enfermería. Esta se
convirtió en la National Database of Nursing Quality Indicators
(NDNQI, 2017; Montalvo, 2007). La participación en la NDNQI
cumple los requisitos del Magnet Recognition Program y el 20% de
los miembros de la base de datos participan por ese motivo. La
investigación actual de Richards, Lasater y McHugh (2017) ha
relacionado a los hospitales Magnet con mejores resultados para los
pacientes y los profesionales de enfermería. Las guías detalladas
para la recogida de datos, incluidas las definiciones y las guías de
decisión, han sido proporcionadas por la NDNQI (2017). Los
indicadores sensibles a enfermería de la NDNQI se resumen en la
tabla 14.4.

TABLA 14.4
BASE DE DATOS DE LA AMERICAN NURSES
ASSOCIATION SOBRE LOS INDICADORES DE CALIDAD DE
ENFERMERÍA

950
ANA, American Nursing Association.
a
Indicador sensible a la práctica enfermera original de la American Nursing
Association.
b
Indicador sensible a la práctica enfermera avalado por el National Quality
Forum.
c
La encuesta al profesional de enfermería es anual, mientras que los otros
indicadores son trimestrales.
Otras organizaciones que contribuyen actualmente a estudiar los
resultados sensibles a la práctica enfermera son la Collaborative
Alliance for Nursing Outcomes California Database (CALNOC,
2017a), la Centers for Medicare & Medicaid Services (CMS)
Hospital Quality Initiative, la American Hospital Association, la
Federation of American Hospitals y la Joint Commission.

Oncology Nursing Society

951
La Oncology Nursing Society (ONS, 2017) es una organización
profesional de más de 35.000 profesionales de enfermería y otros
profesionales sanitarios dedicados a la excelencia en la atención al
paciente, la educación, la investigación y la administración en
enfermería oncológica. La ONS ha asumido un papel de liderazgo
entre las organizaciones de enfermería especializada a la hora de
desarrollar un área de recursos de la PBE en su página web
(http://www.ons.org/ClinicalResources). La página proporciona a
los profesionales de enfermería una guía para identificar, valorar
críticamente y utilizar la evidencia para resolver problemas clínicos.
La página web de la ONS también apoya a los profesionales de
enfermería, en particular a aquellos de práctica avanzada, que estén
ayudando a otros a desarrollar protocolos de PBE. El área de los
recursos de resultados ayuda a los profesionales de enfermería a
lograr los resultados deseados en personas con cáncer, al
proporcionar medidas de resultados, tarjetas de recursos y tablas de
evidencia.

Investigación de resultados de enfermería de


práctica avanzada
La demostración del valor de los roles de los profesionales de
enfermería de práctica avanzada (EPA) en el sistema sanitario ha
sido el centro de atención de gran parte de la investigación de
resultados en enfermería, probablemente porque los roles de
práctica avanzada se encuentran a menudo amenazados cuando las
organizaciones sanitarias realizan reestructuraciones para restringir
los costes o cuando se introducen por primera vez nuevos roles de
práctica avanzada, como fue el caso de los roles de especialista en
enfermería clínica (CNS, clinical nurse specialist) y de profesional de
enfermería especializada (NP, nurse practitioner). La ANA reconoce
cuatro tipos de EPA: enfermeras de anestesia certificadas (CRNA,
certified registered nurse anesthetists), matronas certificadas (CNM,
certified nurse-midwives), CNS y NP. El estudio de la EPA requiere
determinar qué sucede durante el proceso de atención de la EPA.
Esta atención incluye un conjunto de actividades entre los
profesionales y los pacientes, así como elementos técnicos e
interpersonales. Por tanto, el proceso de atención es complejo,

952
variado e individualizado. Sin embargo, describir claramente lo que
ocurre durante el proceso es esencial para el desarrollo de la
comprensión exhaustiva de cómo los EPA influyen en los
resultados. El libro de Kleinpell (2013) ofrece una descripción
detallada de la evaluación de los resultados para NP, CNS, CRNA,
CNM y para quienes tienen un grado de DNP.

Investigación de resultados y práctica


enfermera
Los estudios de resultados proporcionan numerosas oportunidades
para construir una base científica más sólida para la práctica
enfermera. Los investigadores de enfermería han participado
activamente en el esfuerzo de evaluación de los resultados de la
atención al paciente. Idealmente, nos gustaría entender los
resultados de la práctica enfermera en la relación entre un
profesional de enfermería y un paciente concreto; sin embargo, en
la mayoría de los casos, el efecto de los cuidados de enfermería es
compartido, ya que varios profesionales atienden a un mismo
paciente. Además, los gestores y administradores de enfermería
controlan al personal de enfermería y el entorno de la práctica
enfermera, y este control afecta a la autonomía del profesional de
enfermería para llevar a cabo la práctica. En consecuencia, la
investigación de resultados debe centrarse primero en cómo se
organizan los cuidados, más que en lo que hacen los profesionales
de enfermería. Cuando esto ocurre, es posible comenzar a
determinar cómo lo que hacen los profesionales de enfermería
influye en los resultados de los pacientes.

Evaluación de resultados de la asistencia


En esta sección, se describen los enfoques para evaluar los
resultados, las variables estructurales y los procesos de asistencia.
En la figura 14.7 se muestra la relación de la estructura y el proceso
que influye en los resultados de la asistencia sanitaria. El objetivo
de la investigación de resultados es la evaluación de los criterios de
valoración según la definición de Donabedian; sin embargo, este
objetivo no se alcanza tan fácilmente. La teoría de Donabedian
(1987) requiere que los resultados identificados se relacionen

953
claramente con el proceso que provocó el resultado. Los
investigadores deben definir el proceso y justificar las relaciones
causales con los resultados seleccionados. La identificación de los
resultados deseables de la asistencia requiere el diálogo entre los
beneficiarios y los proveedores de dicha asistencia. Aunque los
proveedores de la asistencia pueden delimitar lo que puede
lograrse, los receptores de dicha asistencia deben aclarar qué es lo
deseable. Un resultado deseable aborda las cuestiones de interés
específico para los pacientes, como síntomas a largo plazo o su
capacidad para realizar actividades de la vida diaria. Los resultados
también deben ser relevantes para los objetivos de los profesionales
sanitarios, para el sistema de atención sanitaria del cual los
profesionales forman parte y para la sociedad.
Los resultados dependen del tiempo. Algunos resultados pueden
no ser evidentes hasta mucho tiempo después del proceso que
supuestamente los ha causado, mientras que otros pueden ser
identificados de inmediato (v. fig. 14.8). Algunos resultados son
temporales y otros son permanentes. Por tanto, se debe establecer
un marco temporal adecuado para determinar los resultados
seleccionados.

FIG 14.8 Tipos de bases de datos que surgen de la


asistencia al paciente. (Grove, S. K., Burns, N. y Gray, J. R.
[2013]. The practice of nursing research: Appraisal, synthesis,
and generation of evidence [7.ª ed.]. San Luis, Missouri: Elsevier
Saunders.)

954
Una última cuestión en la evaluación de resultados es determinar
la atribución. Esto requiere asignar el lugar y el grado de
responsabilidad de los resultados observados. Muchos factores
aparte de la atención sanitaria pueden influir en los resultados y se
debe procurar mantener constantes todos los factores significativos,
además de los factores sanitarios, o tener en cuenta su efecto si
pueden extraerse conclusiones válidas de la investigación de
resultados. En particular, hay que tener en cuenta factores del
paciente, como la fisiopatología de la enfermedad, el cumplimiento
terapéutico, la predisposición genética a la enfermedad, la edad, la
propensión a utilizar recursos, las conductas de alto riesgo (p. ej.,
tabaquismo, hábitos dietéticos deficientes, consumo de drogas) y el
estilo de vida. Deben incluirse factores ambientales, como la calidad
del aire, las políticas públicas relacionadas con el tabaquismo y los
riesgos profesionales. La responsabilidad de los resultados puede
distribuirse entre los proveedores, los pacientes, los empresarios,
las aseguradoras, la comunidad y los organismos gubernamentales.
En la tabla 14.5 se muestran algunos ejemplos de estudios de
resultados.

TABLA 14.5
ESTUDIOS QUE ANALIZAN LAS RELACIONES ENTRE LOS
CONCEPTOS DE ESTRUCTURA, PROCESO Y/O
RESULTADOS

AÑO ESTUDIO
2017 Richards, M. R., Lasater, K. y McHugh, M. (2017). A race to the top?
Competitive pressure and Magnet adoption among U.S. hospitals 1997-2012.
Medical Care, 55(4), 384-390
2017 Staggs, V. S., Olds, D. M., Cramer, E. y Shorr, R. I. (2017). Nursing skill mix,
nurse staffing level, and physical restraint use in U.S. hospitals: A
longitudinal study. Journal of General Internal Medicine, 32(1), 35-41
2016 Min, A. y Scott, L. D. (2016). Evaluating nursing hours per patient day as a
nurse staffing measure. Journal of Nursing Management, 24(4), 439-448
2016 Rosenfeld, P. y Glassman, K. (2016). The long-term effect of a nurse
residency program 2005-2012. Journal of Nursing Administration, 46(6), 336-
344
2015 Lasater, K. B., Sloane, D. M. y Aiken, L. H. (2015). Hospital employment of
supplemental registered nurses and patients’ satisfaction with care. Journal
of Nursing Care Quality, 45(3), 145-151

955
2015 Zivin, K., Yosef, M., Miller, E. M., Valenstein, M., Duffy, S., Kales, H. C. y
cols. (2015). Associations between depression and all-cause and cause-
specific risk of death: A retrospective cohort study in the Veterans Health
Administration. Journal of Psychosomatic Research, 78(4), 324-331
2014 Van Bogaert, P., Timmermans, O., Weeks, S. M., van Heusden, D., Wouters,
K. y Franck, E. (2014). Nursing unit teams matter: Impact of unit-level nurse
practice environment, nurse work characteristics, and burnout on nurse
reported job outcomes, and quality of care, and patient adverse events—A
cross-sectional survey. International Journal of Nursing Studies, 51(8), 1123-
1134
2013 Ausserhofer, D., Schubert, M., Desmedt, M., Blegen, M. A., De Geest, S. y
Schwendimann, R. (2013). The association of patient safety climate and
nurse-related organizational factors with selected patient outcomes: A cross-
sectional survey. International Journal of Nursing Studies, 50(2), 240-252
2013 McHugh, M. D., Kelly, L. A., Smith, H. L., Wu, E. S., Vanak, J. M. y Aiken, L.
H. (2013). Lower mortality in Magnet hospitals. Medical Care, 51(5), 382-388
2013 Yoder, L., Xin, W., Norris, K. y Yan, G. (2013). Patient care staffing levels and
facility characteristics in US hemodialysis facilities. American Journal of
Kidney Disease, 62(6), 1130-1140
2012 Ruesch, C., Mossakowski, J., Forrest, J., Hayes, M., Jahrsdoerfer, M.,
Comeau, E. y Singleton, M. (2012). Using nursing expertise and telemedicine
to increase nursing collaboration and improve patient outcomes.
Telemedicine Journal & E-Health, 18(8), 591–595

Existe todavía poca base científica para juzgar la relación exacta


entre cada uno de estos factores complejos y el resultado
seleccionado. Muchos de los factores que influyen pueden estar
fuera de la competencia o influencia del sistema de atención
sanitaria o de sus proveedores. Una forma de abordar el problema
para identificar resultados relevantes es definir un conjunto de
resultados proximales específicos para la enfermedad por la cual se
presta asistencia sanitaria. Un resultado proximal es un resultado
cercano a la prestación de la asistencia. Los signos y síntomas de
una enfermedad corresponden a un ejemplo de un resultado
proximal (Moorhead y cols., 2013; Kane y Radosevich, 2011). Un
resultado distal se aleja de la proximidad del acto asistencial y está
más influido por factores externos (no del tratamiento o no de la
intervención) que un resultado proximal. La calidad de vida es un
ejemplo de un resultado distal. Moorhead y cols. (2013) han
desarrollado la Clasificación de resultados de enfermería (Nursing
Outcomes Classification, NOC), una fuente importante que
identifica los resultados proximales y distales sensibles a enfermería
para la investigación y la práctica.

956
Los estudios de resultados que se están llevando a cabo en este
momento no evalúan la atención del paciente desde el punto de
vista del profesional de enfermería o del paciente individualmente,
como ocurre en muchos estudios de enfermería; en su lugar, por
ejemplo, evalúan todos los cuidados de enfermería prestados a los
pacientes en una UCI particular. Algunas de las preguntas que los
investigadores podrían hacerse sobre un estudio de resultados son
las siguientes:

• ¿Cuáles son los resultados finales de la asistencia a


pacientes (toda la asistencia proporcionada por todos los
proveedores de dicha asistencia)?
• ¿Qué efecto tiene la asistencia de enfermería (toda la
asistencia proporcionada por todos los profesionales de
enfermería) en los resultados finales de la asistencia a un
paciente? ¿Se pueden medir, y por tanto identificar, los
resultados finales de la asistencia de enfermería?
• ¿Hay algunas intervenciones de enfermería que no tienen
ningún efecto en los resultados o que realmente causen
daño?
• ¿Cuándo medimos los efectos de la atención, los resultados
finales (p. ej., cambios sintomáticos, funcionalidad, calidad
de vida): inmediatamente después de la asistencia, cuando
el paciente sea dado de alta o mucho más tarde?
• ¿Cómo distinguimos la asistencia proporcionada por los
profesionales de enfermería de la prestada por otros
profesionales en la evaluación de los resultados del
paciente?

Evaluación de la estructura de la asistencia


Los elementos de la organización y administración, así como las
características del proveedor y del paciente que dirigen los procesos
asistenciales se denominan estructuras de la asistencia. Sabemos
que la organización de la asistencia de enfermería y el liderazgo de
enfermería influyen en la práctica enfermera y, a su vez, en los
resultados del paciente. Estos se denominan variables estructurales
en la teoría de calidad de Donabedian (1987). La autonomía en la
práctica clínica de enfermería es una variable estructural, que se

957
considera crucial para lograr resultados positivos en los pacientes.
Por tanto, es importante identificar las variables estructurales que
permiten la autonomía en estructuras organizativas de la práctica
enfermera. Una de estas estructuras, determinada por varios
estudios de enfermería, es la designación de hospital Magnet
(Richards y cols., 2017). Para comprobar el estatus de un hospital
concreto respecto a su reconocimiento de la excelencia en la
atención de enfermería, se puede buscar el estatus Magnet en la
página web del American Nurses Credentialing Center (ANCC,
2017).
El primer paso en la evaluación de la estructura asistencial es
identificar y describir los elementos de la estructura. Pueden
utilizarse diversas teorías administrativas y de gestión para
identificar estos elementos. Pueden incluir el liderazgo, la jerarquía
de la organización, los procesos para la toma de decisiones, la
distribución del poder, la gestión económica y los procesos para la
toma de decisiones administrativas. Los investigadores de
enfermería que analizan la influencia de las variables estructurales
sobre la calidad asistencial y los resultados han estudiado factores
como la dotación de personal, la formación y el entorno de trabajo
de enfermería, así como las características del hospital y la
organización de la prestación de la asistencia. Por ejemplo, Staggs y
cols. (2017) realizaron un estudio de resultados para analizar los
efectos de una combinación de habilidades de enfermería y de la
dotación del personal de enfermería sobre el uso de sujeciones
físicas en hospitales estadounidenses.
El segundo paso es evaluar el impacto de diversos elementos
estructurales en el proceso asistencial y en los resultados. Esta
evaluación requiere la comparación de diferentes estructuras que
proporcionan los mismos procesos asistenciales. La estructura es la
unidad de medida cuando se evalúan las estructuras La evaluación
requiere el acceso a una muestra suficientemente grande de
estructuras «parecidas», con procesos y resultados similares, que
pueda ser comparada con una muestra de otra estructura que
preste los mismos procesos y evalúe los mismos resultados. Por
ejemplo, en la investigación en enfermería, los profesionales de
enfermería podrían querer comparar varias estructuras que
proporcionen asistencia sanitaria primaria, como en una consulta

958
médica privada, una organización para el mantenimiento de la
salud, una clínica de salud rural, clínicas de atención primaria
orientadas a la comunidad y centros gestionados por personal de
enfermería. Por otra parte, los investigadores en enfermería podrían
evaluar los cuidados de enfermería proporcionados dentro de las
estructuras de una clínica privada dedicada a la cirugía
ambulatoria, un hospital privado, un hospital comarcal y un
hospital docente asociado a un centro de ciencias de la salud. En
cada uno de estos ejemplos, el foco de la investigación sería el
impacto de la estructura en los procesos y resultados asistenciales.
Por ejemplo, Lasater, Sloane y Aiken (2015) evaluaron los efectos de
la contratación por el hospital de profesionales de enfermería
adicionales sobre la satisfacción de los pacientes con la asistencia.
La tabla 14.5 proporciona ejemplos adicionales de estudios de
resultados.
En Estados Unidos, las residencias de ancianos, las agencias
dedicadas a proporcionar atención sanitaria a domicilio y los
hospitales están obligados a recoger variables de calidad definidas
de forma precisa y medidas específicamente, y comunicarlas al
gobierno federal. Esta orden se estableció debido a un cambio
considerable en la calidad asistencial en estas estructuras. Varias
agencias gubernamentales analizan la calidad de estas estructuras
para poder supervisar adecuadamente la calidad asistencial
prestada a la población estadounidense. Estos datos se encuentran
disponibles para el público en general para que las personas
puedan determinar por sí mismas la calidad asistencial prestada
por diversas residencias de ancianos, agencias dedicadas a
proporcionar atención sanitaria a domicilio y hospitales. Los
investigadores también pueden acceder a estos datos para el
estudio de la calidad de diversas estructuras. Para acceder a estos
datos en internet, se pueden realizar búsquedas con las frases
«comparar residencias de ancianos», «comparar atención sanitaria a
domicilio» y «comparar hospitales». Además de poder seleccionar
un hospital, residencia de ancianos o agencia de atención sanitaria
domiciliaria específica, se puede acceder a información general
considerable de la calidad en relación con cada una de estas
estructuras de asistencia sanitaria.

959
Evaluación del proceso asistencial
La gestión clínica del proceso asistencial implementado por los
profesionales de enfermería ha sido más un arte que una ciencia
hasta que se ha hecho hincapié en la PBE (v. cap. 13). Una
comprensión suficiente del proceso para poder estudiarlo debe
comenzar con una reflexión, diálogo y observación cuidadosos.
Existen varios componentes de la gestión clínica, muchos de los
cuales aún no se han definido o probado con claridad. Tres
componentes del proceso que son de particular interés son los
estándares de cuidados, los estilos de práctica y los costes
asistenciales. Los estándares de cuidados y los estilos de práctica se
incluyen en las secciones siguientes, pero los costes asistenciales se
analizan más adelante en este capítulo, con las metodologías de
evaluación.
Estándares de cuidados. Un estándar de cuidados o asistencia de
referencia es una norma con la que se evalúa la calidad asistencial.
Las guías clínicas, las vías críticas y los planes de atención definen
los estándares de asistencia en situaciones particulares. En este
sentido, Donabedian (1982, 1987, 1988) y otros investigadores
recomiendan el desarrollo de criterios específicos que se utilizarán
como base para juzgar la calidad asistencial. Estos criterios pueden
adoptar la forma de guías clínicas o planes de atención basados en
la validación previa de que la asistencia contribuyó a los resultados
deseados. Las guías clínicas publicadas por la AHRQ establecieron
normas o estándares respecto a los que puede juzgarse la validez de
la gestión clínica. Estas normas ahora se establecen a través de guías
de práctica clínica disponibles en la National Guideline
Clearinghouse (NGC, 2017) dentro de la AHRQ (v.
http://www.guideline.gov). El capítulo 13 ofrece un análisis
detallado de la NGC y de sus recursos.
Estilos de práctica, patrones de práctica y práctica basada en la
evidencia. El estilo de la práctica de un profesional de enfermería es
otra dimensión del proceso asistencial que influye en la calidad; sin
embargo, es problemático juzgar lo que constituye un buen estilo y
justificar las decisiones que se tomen al respecto. El modelo de
práctica es un concepto estrechamente relacionado con el estilo. El
estilo de práctica representa un cambio de cómo proporcionar la
atención, mientras que el modelo de la práctica representa un

960
cambio de la atención que se proporciona.
La PBE es otra dimensión del proceso asistencial que se considera
un aspecto crítico de la práctica profesional. Los objetivos finales de
la PBE son mejorar el estado de salud del paciente y la calidad
asistencial (Graham, Bick, Tetroe, Straus y Harrison, 2011; Melnyk,
Gallagher-Ford y Fineout-Overholt, 2017). Por tanto, el impacto de
la PBE debe evaluarse a través de la medición de los resultados de
los pacientes. Pocos estudios empíricos han analizado el impacto de
la práctica enfermera basada en la evidencia sobre los resultados
del paciente, lo que sugiere la necesidad de más investigaciones en
esta área.

Metodologías de los estudios de resultados


Las metodologías de la investigación de resultados se han
desarrollado para vincular la asistencia que reciben las personas
con los resultados que experimentan, lo que proporciona así
mejores formas de controlar y mejorar la calidad asistencial (Clancy
y Eisenberg, 1998; Donabedian, 2003, 2005). En esta sección se
describen algunas de las metodologías actuales utilizadas en la
realización de la investigación de resultados, incluidos los métodos
de muestreo, las estrategias o diseños de investigación, los procesos
de medición y los métodos estadísticos. Estas descripciones no son
suficientes para guiar la utilización de los métodos descritos, pero
proporcionan una perspectiva más amplia de las diversas
metodologías que se encontrarán en los estudios de resultados. Este
conocimiento ayudará a comprender y valorar críticamente las
metodologías utilizadas en los estudios de resultados publicados.
Para obtener más información, se pueden consultar las citas de cada
sección y otras fuentes de la investigación de resultados (Doran,
2011; Gray, Grove y Sutherland, 2017: Kane y Radosevich, 2011;
Moorhead y cols., 2013). Los estudios de resultados afectan a
diversas disciplinas; por tanto, las nuevas metodologías se están
enriqueciendo con una interrelación de ideas, algunas de las cuales
son nuevas para la investigación en enfermería.

Muestras y muestreo
Los métodos preferidos para la obtención de muestras son

961
diferentes en los estudios de resultados. El muestreo aleatorio
raramente se utiliza, excepto en un ensayo controlado aleatorizado
(ECA), cuando se está evaluando una intervención o servicio de
asistencia sanitaria específico. Por lo general, en la investigación de
resultados se obtienen muestras heterogéneas (con diversos tipos de
pacientes), en vez de muestras homogéneas (con pacientes
similares). Los investigadores de resultados limitan los criterios de
muestreo para obtener grandes muestras heterogéneas que reflejen,
en lo posible, a todos los pacientes que estén recibiendo asistencia
en un contexto de atención sanitaria real. Por ejemplo, las muestras
deben incluir pacientes con diversas enfermedades concurrentes y
pacientes con diversos niveles de su estado de salud. Además, se
deberían identificar las personas que no reciben tratamiento de
enfermería o médico para su enfermedad, porque pueden
representar a los que rechazan el tratamiento o que no acceden al
sistema sanitario.
El diseño de formas para evaluar la representatividad de estas
muestras es problemático. Para que una muestra sea representativa,
debe ser lo más parecida posible a la población diana, sobre todo en
relación con las variables en estudio (v. cap. 9). Debido a que la
población diana de la investigación de resultados suele ser
heterogénea, existe un gran número de variables para las que debe
determinarse la representatividad de la muestra. Otro de los retos
en la investigación de resultados es el desarrollo de estrategias para
la localización de individuos no tratados e incluirlos en los estudios
de seguimiento. La intención es determinar si los resultados
difieren entre los tratados y los no tratados. Para afrontar algunos
de estos desafíos, los investigadores de resultados han utilizado
grandes bases de datos como fuentes de las muestras en los diseños
de investigación observacionales.
Grandes bases de datos como fuentes de muestras. Una de las
fuentes de muestras de los estudios de resultados son las grandes
bases de datos. Como se observa en la figura 14.8, la asistencia de
los pacientes da lugar a dos amplias categorías de bases de datos:
las bases de datos clínicas y las bases de datos administrativas. Las
bases de datos clínicas son creadas por proveedores como
hospitales, las organizaciones para el mantenimiento de la salud, las
organizaciones responsables de la asistencia y los profesionales

962
sanitarios. Los datos clínicos se generan como resultado de la
documentación rutinaria de la asistencia en la historia clínica
electrónica (HCE) o en relación con un protocolo de investigación.
Algunas bases de datos son los registros de datos que se han
desarrollado para reunir información relacionada con una
enfermedad particular, como cardiopatías o cáncer. Con una base
de datos clínica, se pueden relacionar observaciones realizadas por
muchos profesionales de enfermería durante largos períodos de
tiempo con los resultados de los pacientes (Gray y cols., 2017).
Las bases de datos administrativas las crean compañías de
seguros, agencias gubernamentales y otros organismos que no
participan directamente en la prestación de cuidados al paciente.
Estas bases de datos tienen conjuntos de datos normalizados de un
enorme número de pacientes y de proveedores. Un ejemplo es la
base de datos de Medicare, gestionada por el CMS. Las bases de
datos administrativas se pueden utilizar para determinar la
incidencia o prevalencia de una enfermedad, las variaciones
geográficas en el uso de la asistencia médica, así como las
características y los resultados de dicha asistencia. En la tabla 14.6
se proporcionan ejemplos de los indicadores de grandes bases de
datos utilizados para evaluar la calidad asistencial. Iniciativas como
CALNOC (2017b) y NDNQI (2017) han hecho que los datos de
enfermería sean más accesibles para la investigación con amplias
bases de datos.

TABLA 14.6
INDICADORES DE BASES DE DATOS AMPLIAS
UTILIZADOS PARA MONITORIZAR INDICADORES
ESTRUCTURALES, DE PROCESO Y DE RESULTADO DE
ENFERMERÍA

TIPO DE
INDICADOR FUENTE
INDICADOR
Estructural Horas de National Database of Nursing Quality
enfermería (p. ej., Indicators (NDNQI, 2017); Collaborative
RN, LPN, UAP) Alliance for Nursing Outcomes (CALNOC,
por paciente y día 2017a); National Quality Forum (NQF, 2017b)
Combinación de NDNQI (2017);CALNOC (2017a); NQF (2017b)
personal (RN,

963
LPN, LVN, UAP)
Rotación del NDNQI (2017); CALNOC (2017a); NQF (2017b)
personal de
enfermería

Entorno de la NDNQI (2017); NQF (2017b)


práctica del RN
Proceso Evaluación del CALNOC (2017a)
riesgo de úlceras
por presión
Sujeciones físicas NDNQI (2017); CALNOC (2017a)
Protocolos de CALNOC (2017a)
prevención
aplicados
Precisión de la CALNOC (2017a)
administración de
fármacos
Resultado Caídas del NDNQI (2017); CALNOC (2017a); NQF (2017b)
paciente, lesiones
por caídas
Tasa de NDNQI (2017); NQF (2017b)
infecciones del
tracto urinario
asociadas al
sondaje vesical
Úlceras por NDNQI (2017); CALNOC (2017a); NQF (2017b)
presión
adquiridas en el
hospital
Tasa de NDNQI (2017); CALNOC (2017a); NQF (2017b)
bacteriemia
asociada a vía
venosa central
LPN, profesional de enfermería práctico titulado (licensed practical nurse);
LVN, profesional de enfermería vocacional titulado (licensed vocational
nurse); RN, profesional de enfermería diplomado (registered nurse); UAP,
personal asistencial no titulado (unlicensed assistive personnel).

Diseños de los estudios


Aunque los ECA se consideran el patrón oro para la investigación
clínica (v. cap. 8), la mayoría de los estudios de resultados utilizan
diseños de investigación cuasiexperimentales u observacionales,
que son adecuados para abordar cuestiones de eficacia y eficiencia.
Al igual que los EAC, la investigación de resultados a veces busca

964
proporcionar evidencia sobre qué intervenciones funcionan mejor
para cada tipo de pacientes y de circunstancias. Sin embargo, la
«intervención» que se evalúa no se limita a medicamentos o nuevos
procedimientos clínicos, sino que también puede incluir la
prestación de servicios o recursos concretos e incluso la entrada en
vigor de las políticas y reglamentos específicos de organismos
legislativos y financieros. La investigación de resultados a menudo
considera parámetros adicionales, como el coste, la puntualidad, la
comodidad, la accesibilidad geográfica y las preferencias del
paciente. En la siguiente sección, se analizan brevemente los tipos
habituales de los diseños utilizados en la investigación de
resultados.
Estudios de cohortes prospectivos. Un estudio de cohortes
prospectivo emplea un diseño de estudio epidemiológico en el que
el investigador identifica un grupo de personas que presentan un
riesgo de sufrir un evento particular y luego lo sigue a lo largo del
tiempo para observar si se produce o no dicho evento. Los tamaños
de la muestra para estos estudios a menudo deben ser muy
grandes, particularmente si solo una pequeña porción del grupo de
riesgo experimentará el evento. Se sigue a todo el grupo a lo largo
del tiempo para determinar cuándo se produce el evento, las
variables asociadas con él y los resultados en quienes
experimentaron el evento en comparación con aquellos que no lo
experimentaron.
Schetter, Niles, Guardino, Khaled y Kramer (2016) realizaron un
estudio de cohortes prospectivo multicéntrico con 5.271 mujeres
embarazadas. Estos investigadores estadounidenses y canadienses
colaboraron para determinar si las variables demográficas, médicas
y psicosociales eran factores predictivos de ansiedad durante el
embarazo. La fortaleza de este estudio es evidente por su gran
tamaño muestral, un diseño de estudio de resultados sólido y la
colaboración de los investigadores. A continuación se presenta el
resumen de este estudio:

Antecedentes: la ansiedad durante el embarazo se asocia con los


riesgos de parto prematuro y con una serie de otros resultados
perinatales, para el lactante y durante la infancia. Sin embargo, las
investigaciones previas no han ayudado a identificar cuáles son las

965
mujeres embarazadas con un riesgo mayor de sufrir este trastorno
afectivo específico relacionado con el contexto.

Métodos: en este estudio se analizan las asociaciones entre los


factores demográficos, médicos y psicosociales y la ansiedad durante el
embarazo a las 24-26 semanas de gestación en un estudio de cohortes
multicéntrico prospectivo de 5.271 mujeres embarazadas en
Montreal, Canadá.

Resultados: los análisis multifactoriales indicaron que una mayor


ansiedad durante el embarazo se relacionaba de forma independiente
con tener un embarazo no deseado, la primiparidad, un mayor riesgo
médico y un mayor riesgo percibido de complicaciones. Entre las
variables psicosociales, una mayor ansiedad durante el embarazo se
asociaba con un menor control percibido del embarazo, un menor
compromiso con la gestación, más eventos vitales estresantes, un
mayor estrés percibido, presencia de estrés laboral, menor autoestima
y más apoyo social. La ansiedad durante el embarazo también era
mayor en mujeres que habían tenido problemas económicos precoces y
en las que no hablaban francés como idioma principal. Las variables
psicosociales explicaron una cantidad significativa de la varianza en
la ansiedad relacionada con el embarazo, con independencia de las
variables demográficas y médicas.

Conclusiones: las mujeres con factores de riesgo relacionados con el


embarazo, estrés de distintos tipos y otros factores psicosociales
experimentaron más ansiedad durante el embarazo en esta amplia
muestra canadiense. Algunos de los factores predictivos específicos de
la ansiedad durante el embarazo se corresponden con los de estudios
previos estadounidenses, mientras que otros apuntan en nuevas
direcciones. Puede que sea necesario realizar un cribado de la
ansiedad durante el embarazo, en particular en las mujeres
primíparas y en las que tienen embarazos de alto riesgo.

Schetter y cols., 2016, pág. 421

966
Estudios de cohortes retrospectivos. Un estudio de cohortes
retrospectivo incluye un diseño de estudio epidemiológico en el
que el investigador identifica un grupo de personas que han sufrido
un evento particular. Esta es una técnica de investigación
frecuentemente utilizada en el campo de la epidemiología para
estudiar la exposición ocupacional a sustancias químicas. Entre los
eventos de interés para enfermería que podrían haberse estudiado
de este modo, se incluyen un procedimiento, episodio asistencial,
intervención de enfermería y/o diagnóstico. Los profesionales de
enfermería podrían utilizar un estudio de cohortes retrospectivo
para el seguimiento de una cohorte de mujeres que fueron
sometidas a una mastectomía por cáncer de mama o de pacientes a
quienes se realizó un sondaje vesical durante y después de una
intervención. La cohorte se evalúa después del evento para
determinar los cambios que se producen en el estado de salud; por
ejemplo, en enfermería, la calidad de vida y el estatus funcional de
los pacientes son resultados de interés. Los profesionales de
enfermería también están interesados en el patrón de recuperación
después de un evento o, en el caso del sondaje vesical, en la
incidencia de infecciones vesicales en los meses posteriores a la
cirugía.
Basándose en los hallazgos del estudio, los investigadores
calculan el riesgo relativo del cambio identificado en la salud del
grupo. El riesgo relativo es la probabilidad de que el resultado se
produzca en el grupo expuesto frente al grupo no expuesto
(control). Por ejemplo, si la muerte fuera el factor de interés, se
determinaría el número esperado de muertes. El número observado
de muertes dividido entre el número esperado de muertes y
multiplicado por 100 da lugar a una tasa de mortalidad
estandarizada (TME), que se considera una medida del riesgo
relativo del grupo estudiado de morir por una enfermedad
particular (Grove y Cipher, 2017). En los estudios de enfermería, se
puede hacer un seguimiento de los pacientes a lo largo del tiempo
después del alta en un centro sanitario para determinar las tasas de
complicaciones y la TME.
En estudios de cohortes retrospectivos, los investigadores suelen
pedir a los pacientes que recuerden información relevante sobre su
estado de salud previo. Esta información se utiliza a menudo para

967
determinar la magnitud de cambio que se ha producido antes y
después de una intervención. El recuerdo puede distorsionarse
fácilmente, lo que engaña a los investigadores a la hora de
determinar los resultados. Algunas fuentes de distorsión del
recuerdo son: 1) la pregunta planteada al participante del estudio
puede ser concebida o expresada de forma incorrecta, 2) el proceso
de recuerdo puede ser erróneo y 3) la medición del recuerdo puede
dar lugar a la aparición de recuerdos diferentes de lo que ocurrió
realmente. Por tanto, el recuerdo debería utilizarse con cautela
(Herrmann, 1995).
Chen y Bennett (2016) implementaron un diseño de cohortes
retrospectivo en su estudio de un modelo de algoritmo para
predecir las tasas de aprobados/suspensos en la primera ocasión
que se realizaba el examen NCLEX-RN (National Council Licensure
Examination-Registered Nurse). Este modelo clasificó
correctamente al 92,7% de los estudiantes que iban a aprobar el
examen. Se necesitan más investigaciones sobre el modelo, porque
el estudio incluyó a 453 estudiantes de un programa de enfermería.
A continuación se presenta el resumen de este estudio:

Antecedentes: hay poca evidencia que muestre el uso de algoritmos


de decisión para identificar los factores predictivos y analizar sus
asociaciones con las tasas de aprobado del examen NCLEX-RN en los
estudiantes de enfermería. Este estudio de cohortes longitudinal y
retrospectivo investigó si un algoritmo de decisiones podría utilizarse
para desarrollar un modelo de predicción exacto para determinar si los
estudiantes aprobarían o suspenderían el examen NCLEX-RN.

Método: este estudio utilizó datos archivados de 453 estudiantes de


enfermería en un programa seleccionado. Se empleó el análisis de
detección automática de interacción de χ2 del módulo de algoritmos
para evaluar el efecto de los factores predictivos recopilados sobre si se
aprobaría o suspendería el examen NCLEX-RN.

Resultados: las puntuaciones porcentuales actuales de la


herramienta RN Comprehensive Predictor del Assessment
Technologies Institute identificaron con exactitud a los estudiantes

968
con riesgo de suspender. El modelo de clasificación identificó
correctamente al 92,7% de los estudiantes que iban a aprobar el
examen.

Conclusión: este estudio aplicó el modelo de algoritmo de decisiones


para analizar una base de datos secuencial con el fin de desarrollar un
modelo predictivo para solucionar problemas de forma precoz en la
preparación del examen NCLEX-RN.

Chen y Bennett, 2016, pág. 454

Estudios poblacionales. Los estudios poblacionales se realizan


en el contexto de la comunidad del paciente en vez de en el
contexto del sistema médico. Con este método, se incluyen todos los
casos de una afección que se producen en la población definida, no
solo los tratados en un centro sanitario en particular. Esto último
podría introducir un sesgo de selección. Para evitar el sesgo de
selección, el investigador podría tratar de incluir personas con la
enfermedad que no habían recibido tratamiento.
Las normas comunitarias de los instrumentos de pruebas y de
encuesta obtenidas de esta manera proporcionan una imagen más
clara de los diversos valores que el espectro limitado de pacientes
atendidos en clínicas especializadas. Las estimaciones de la
sensibilidad y la especificidad del instrumento son más exactas (v.
cap. 10). Este método permite a los investigadores comprender la
historia natural de una enfermedad o los riesgos y beneficios a largo
plazo de una intervención en particular (Doran, 2011; Kane y
Radosevich, 2011).
Estudios económicos. Muchos de los problemas estudiados en la
investigación de resultados abordan preocupaciones relacionadas
con el uso eficiente de recursos escasos y, por tanto, con los aspectos
económicos. Los economistas de la salud se ocupan de los costes y
beneficios de los tratamientos alternativos o de las formas de
identificar los medios más eficientes de asistencia. La evaluación
económica se ha definido como un «conjunto de métodos
cuantitativos formales utilizados para comparar dos o más
tratamientos, programas o estrategias con respecto a su utilización
de recursos y sus resultados esperados» (Guyatt, Rennie, Meade y

969
Cook, 2008, pág. 781). Un economista define el término eficiencia
como el método menos costoso de lograr un fin deseado, mientras
que se obtiene el máximo beneficio o resultado de los recursos
disponibles. Si los recursos disponibles deben compartirse con otros
programas u otros tipos de pacientes, un estudio económico puede
determinar si el cambio de la distribución de los recursos
incrementará el beneficio o bienestar total.

Métodos de medición
La selección de las variables de resultado adecuadas es crucial para
el éxito de un estudio de investigación de resultados. Como en
cualquier estudio, el investigador debe evaluar la evidencia de la
validez y la fiabilidad de los métodos de medición. Los resultados
seleccionados para los estudios de enfermería deberían ser los más
congruentes con la práctica y la teoría de la enfermería (Moorhead y
cols., 2013). En algunos estudios, en lugar de seleccionar el
resultado final de la asistencia, que puede tardar en producirse
meses o años, los investigadores utilizan medidas de criterios de
valoración intermedios o resultados proximales. Los criterios de
valoración intermedios son eventos o marcadores que actúan como
precursores del resultado final. Sin embargo, es importante
documentar la validez del criterio de valoración intermedio para
predecir el resultado. En los primeros estudios de resultados, los
investigadores seleccionaban las medidas de resultados que podían
obtener con facilidad, en lugar de las más deseables para un estudio
de resultados. Los estudios de resultados posteriores seleccionaron
medidas de resultados de fuentes de datos secundarios (p. ej.,
Aiken y cols., 2008; Cummings, Midodzi, Wong y Estabrooks,
2010). Esta selección implica un análisis secundario, que es
cualquier nuevo análisis de datos o de la información recogida por
otros investigadores, organizaciones o instituciones (Gray y cols.,
2017). Los investigadores de resultados han utilizado datos
secundarios procedentes de fuentes como la HCE y otros conjuntos
de datos clínicos mínimos recogidos por hospitales, clínicas y
centros de rehabilitación. Los datos recogidos a través de NDNQI
(2017) o CALNOC (2017b) también se pueden utilizar en la
investigación de resultados de enfermería.
Cuando se realiza la valoración crítica del enfoque de la medición

970
en un estudio de resultados, la fiabilidad, sensibilidad y validez de
las herramientas de medición deberían valorarse y resumirse. La
sensibilidad al cambio es una propiedad de medición importante
que se debe tener en cuenta en la investigación de resultados
porque los investigadores suelen estar interesados en evaluar cómo
los resultados cambian en respuesta a las intervenciones sanitarias
(Polit y Yang, 2016). A medida que aumenta la sensibilidad de una
medida, también lo hace la potencia estadística, lo que permite que
se detecten diferencias significativas con tamaños de muestra más
pequeños. Para un análisis completo de la fiabilidad y validez de
las escalas y cuestionarios, la precisión y la exactitud de las
mediciones fisiológicas, y la sensibilidad y especificidad de las
herramientas de diagnóstico, se puede consultar el capítulo 10 de
este libro, así como el libro de Waltz, Strickland y Lenz (2017) sobre
la medición en la investigación en enfermería y de la salud.

Métodos estadísticos para los estudios de


resultados
Aunque los investigadores de resultados buscan la significación
estadística de sus hallazgos, esta evaluación no se considera
suficiente para juzgar que los resultados son importantes. Su foco
de atención se centra en la importancia clínica de los hallazgos del
estudio (v. cap. 11). Al analizar los datos, los investigadores de
resultados se han alejado de los análisis estadísticos que utilizan la
media para comprobar si existen diferencias de grupo. Ahora dan
mayor importancia a analizar cambios en la puntuación y utilizan
métodos exploratorios para evaluar datos que identifiquen los
valores atípicos.

Análisis del cambio


Al ponerse el foco de atención en los estudios de resultados, ha
surgido un interés renovado por los métodos de análisis del
cambio. El libro de Harris (1967) es la base para la mayoría de los
enfoques actuales para analizar el cambio. Sin embargo,
recientemente han surgido algunas ideas nuevas en relación con el
análisis del cambio. Los estudios de Tracy y cols. (2006) y Bettger,
Coster, Latham, y Keysor (2008) son buenas referencias en este

971
sentido. Para algunos resultados, los cambios pueden no ser
lineales o subir y bajar, en lugar de ir siempre en aumento. Por eso
es tan importante descubrir los patrones del cambio, como
comprobar las diferencias estadísticamente significativas en
distintos momentos. Algunos cambios pueden producirse en
relación con períodos de recuperación o mejoría. Estos cambios
pueden suceder a lo largo de semanas, meses o incluso años. Se
obtiene una imagen más completa del proceso de recuperación
evaluando el proceso con mayor detalle y de forma más amplia.
Con este enfoque, el evaluador puede elaborar una curva de
recuperación, que proporciona un modelo del proceso de
recuperación, que a continuación puede ponerse a prueba.

Análisis de la mejoría
Además de informar sobre la puntuación media de la mejoría de
todos los pacientes tratados, es importante comunicar cuál es el
porcentaje de los pacientes que mejoraron. ¿Todos los pacientes
mejoraron ligeramente o existe una divergencia entre ellos, de
modo que algunos mejoran en gran medida y otros no lo hacen en
absoluto? Esta divergencia puede ilustrarse mejor representando
los datos en gráficas. Los investigadores que estudian un
tratamiento o enfoque de la asistencia en particular podrían
desarrollar un estándar o índice con los distintos grados de mejoría
que pudieran darse. El índice permitiría realizar mejores
comparaciones de la eficacia de diversos tratamientos. Deberían
describirse en el informe de investigación las características de los
pacientes que experimentan diversos grados de mejoría y los
valores atípicos. Este paso requiere que el diseño del estudio
incluya medidas del estado basal del paciente, como características
demográficas, estado funcional y medidas de gravedad de la
enfermedad. Un análisis de la mejoría permite que se juzgue mejor
el uso adecuado de los diferentes tratamientos (Doran, 2011).

Valoración crítica de los estudios de


resultados
Esta sección aborda los enfoques para valorar críticamente los
estudios de resultados. Guyatt y cols. (2008) describieron la

972
metodología para la valoración crítica de los diseños de los
estudios, incluidos los que se utilizan habitualmente en la
investigación de resultados. Esta guía proporciona unas hojas de
trabajo utilizadas para resumir los resultados de una valoración
crítica. Las hojas de trabajo que son más relevantes para la
investigación de resultados son las que se ocupan de los estudios de
análisis económico, el diseño de cohortes retrospectivo, la calidad
de vida relacionada con la salud y el diseño de cohortes
prospectivo. En la siguiente sección, se proporciona un ejemplo de
los tipos de preguntas que se han de considerar en la valoración
crítica de los estudios de resultados de calidad de vida relacionada
con la salud.

GUÍAS DE VALORACIÓN CRÍTICA


Investigación de resultados
Las valoraciones críticas de los estudios de resultados se
organizan en tres grandes preguntas: ¿Son válidos los resultados?
¿Cuáles son los resultados? ¿Cómo puedo aplicar los resultados a
la atención del paciente?

1. ¿Son válidos los resultados?


a. En un estudio de cohortes prospectivo, ¿los grupos
expuesto y de control no expuesto comenzaron y
terminaron con el mismo riesgo de experimentar un
resultado? ¿Cómo se definió la exposición?
b. En los estudios de resultados de enfermería, la
exposición podría relacionarse con una intervención
particular de enfermería, un modelo o una
combinación de personal, o incluso con la política
sanitaria.
c. Deben tenerse en cuenta tres subpreguntas al
abordar la pregunta original sobre la validez de los
resultados del estudio:
i. ¿Se sabía si los pacientes eran similares
para los factores o variables asociadas
con el resultado (o se utilizó el ajuste

973
estadístico para controlar las diferencias
entre los grupos expuesto y de control
no expuesto)?
ii. ¿Fueron similares las circunstancias y
métodos para la detección del resultado?
¿Los investigadores utilizaron el mismo
método para medir los resultados en los
grupos expuesto y de control no
expuesto?
iii. ¿Fue el seguimiento suficientemente
completo? Lo ideal sería lograr un seguimiento
de alrededor del 80% tanto en el grupo control
como en el expuesto.
d. En un estudio de cohortes retrospectivo, ¿tuvieron
los grupos expuesto y de control la misma
posibilidad de estar expuestos en el pasado? En un
estudio de cohortes retrospectivo, el investigador
estaría interesado en determinar si los resultados
difieren en los individuos expuestos en el pasado a
un riesgo concreto para la salud, enfermedad o
servicio sanitario, siguiéndolos longitudinalmente
después de la exposición específica. En los estudios
de cohortes retrospectivos deben abordarse las
siguientes preguntas:
i. ¿Fueron los casos y controles similares
respecto a la indicación o circunstancias
que dieron lugar a la exposición? Por
ejemplo, ¿fueron todos igualmente
elegibles para recibir la intervención de
enfermería en particular o recibir
asistencia bajo un modelo de dotación de
personal concreto?
ii. ¿Fueron las circunstancias y los métodos
para determinar la exposición similares
para los casos y los controles? En un
estudio de cohortes retrospectivo, los
investigadores miran hacia atrás en el
tiempo para determinar la exposición a

974
una intervención en particular o para
determinar la existencia de una
enfermedad específica. Para responder a
esta pregunta, habría que dilucidar si el
estudio utilizó el mismo método para
determinar la exposición en los grupos de
control y de intervención.
2. ¿Cuáles son los resultados?
a. ¿Cuál es la solidez de la asociación entre la
exposición y el resultado? ¿Fueron los resultados
estadísticamente significativos?
b. ¿Qué precisión tuvo la estimación del efecto?
¿Fueron los intervalos de confianza grandes o
pequeños para el efecto? Los intervalos de
confianza pequeños reflejan una mayor precisión en
la estimación del efecto. Por ejemplo, en un estudio
de un resultado como la calidad de vida relacionada
con la salud (CVRS):
i. ¿Los investigadores midieron los aspectos
de las vidas de los pacientes que estos
consideraron importantes? Para
responder a esta pregunta, habría que
considerar si los autores describieron el
contenido de su medida de CVRS con
suficiente detalle para que sea posible
hacer un juicio sobre la relevancia de la
medida en una población particular de
pacientes y/o si los autores
proporcionaron evidencia directa de su
estudio o evidencia indirecta de estudios
previos de que la medida de la CVRS es
importante para la población de
pacientes analizada.
ii. ¿Funcionó de la forma prevista el
instrumento de trabajo de la CVRS? Esta
pregunta requiere una valoración de las
propiedades psicométricas del
instrumento de CVRS respecto a la

975
fiabilidad y validez.
iii. ¿Hubo aspectos importantes de la CVRS que
se omitieron de la medición? Esta pregunta
requiere una valoración de la validez de
contenido del instrumento respecto a si el
instrumento fue minucioso en su medición de
la CVRS.
3. ¿Cómo puedo aplicar los resultados a la atención del
paciente?
a. ¿Fueron los pacientes del estudio similares a los de
mi entorno práctico?
b. ¿El seguimiento fue suficientemente largo para
evaluar un impacto en el resultado?
c. ¿Es la exposición (p. ej., intervención, modelo de
dotación de personal, política sanitaria) similar a lo
que podría producirse en mi entorno de práctica?
d. ¿Cuál es la magnitud del efecto? Esta pregunta
requiere que se considere si el efecto fue
clínicamente importante para que valga la pena
cambiar la práctica.
e. ¿Existen beneficios conocidos asociados con la
exposición? Esta pregunta obliga a considerar si los
beneficios para los pacientes y/o el entorno de la
práctica son lo suficientemente valiosos como para
sugerir que se querría actuar sobre los resultados.

Orwelius y cols. (2013, pág. 229) investigaron la calidad de vida


relacionada con la salud (CVRS) a largo plazo después de sufrir
quemaduras. Su resumen del estudio se muestra en el Ejemplo de
investigación 14.1.

EJEMPLO DE INVESTIGACIÓN 14.1


Valoración crítica de un estudio de resultados
Extracto del estudio de investigación
Antecedentes: la calidad de vida relacionada con la salud (CVRS) se

976
reduce después de una quemadura y se ve afectada por enfermedades
asociadas. Los fines de la investigación fueron examinar y describir los
efectos de una enfermedad coexistente sobre la CVRS y cuantificar el
porcentaje de personas quemadas cuya CVRS era inferior a la de un grupo
control emparejado por edad, sexo y enfermedades asociadas.
Método: un estudio a escala nacional de 9 años de duración… examinó
la CVRS a los 12 y 24 meses después de una quemadura con el
cuestionario SF-36. El grupo de control era de la zona de referencia de uno
de los hospitales.
Resultados: la CVRS de los pacientes quemados era inferior a la del
grupo control principalmente en dimensiones mentales, y solo algunos
pacientes individuales se vieron afectados en dimensiones físicas. El factor
que afectó significativamente a la mayoría de las dimensiones de la CVRS
(n = 6) después de la quemadura fue el desempleo, mientras que solo
podrían atribuirse directamente a la quemadura efectos menores.
Conclusión: se registró una mala CVRS solo en un pequeño número de
pacientes y los descensos eran en su mayoría en las dimensiones mentales
en comparación con un grupo ajustado por edad, sexo y enfermedades
asociadas. Los factores distintos a la propia quemadura, como sobre todo el
desempleo y la enfermedad preexistente, fueron más importantes para la
CVRS a largo plazo en estos pacientes. (Orwelius y cols., 2013, pág.
229)
Valoración crítica
El estudio utilizó un diseño de cohortes retrospectivo. Las personas
que sufrieron una quemadura se siguieron durante 24 meses para
determinar el impacto de la quemadura, junto con otros factores,
sobre los cambios de la CVRS. El grupo expuesto estaba compuesto
por pacientes a partir de 18 años, ingresados con quemaduras en el
10% o más de su superficie corporal total o con una duración de su
estancia en una unidad de quemados de 7 días o más, entre los
años 2000 y 2009 (en adelante se denomina cohorte de quemados).
La cohorte no expuesta se obtuvo a partir de una encuesta pública
de salud que se completó en 1999 (en lo sucesivo, la cohorte de
control sana). Las dos cohortes no fueron similares en todos los
factores conocidos asociados con la CVRS. Por ejemplo, la cohorte
de quemados incluyó más varones, un menor número de personas
con formación académica superior, más personas solteras y menos

977
personas desempleadas o jubiladas que la cohorte de control sana.
Estas diferencias podrían haber influido en la CVRS y, en este
estudio, los investigadores tuvieron en cuenta estas diferencias
estadísticas en su análisis. Aunque las circunstancias para la
detección de los resultados fueron diferentes para ambas cohortes,
el método de valoración, es decir, el SF-36 (Short Form-36) (Ware y
Sherbourne, 1992), fue el mismo. El SF-36 es una medida de la
CVRS bien reconocido, con una fiabilidad y validez altas
establecidas en una población de quemados representativa (Edgar,
Dawson, Hankey, Phillips y Wood, 2010).
El seguimiento en la cohorte de quemados fue de 24 meses, una
duración que se considera suficientemente larga para detectar
cambios en la CVRS. De los pacientes elegibles con quemaduras, el
61% fueron reclutados en la cohorte y el seguimiento de la muestra
a los 24 meses fue del 48%. La respuesta después de dos
recordatorios de la cohorte de control sana fue del 61%. El
seguimiento incompleto de ambas cohortes podría significar que
hay diferencias sistemáticas (es decir, un sesgo de respuesta) entre
las personas que respondieron a la encuesta y las que no lo
hicieron, lo que influye en la generalizabilidad de los hallazgos del
estudio. Hubo diferencias estadísticamente significativas en la
CVRS entre la cohorte de quemados y la cohorte de control sana,
principalmente en la dimensión mental, y los autores informaron
de mejorías clínicamente significativas en las puntuaciones de la
función física y la función de rol en la cohorte de quemados. El
factor que afectó más significativamente a la CVRS después de la
quemadura fue el desempleo, mientras que solo podían atribuirse
pequeños efectos directamente a la quemadura. En conclusión,
hubo algunas amenazas a la validez de los resultados del estudio,
particularmente en relación con las diferencias entre la cohorte de
quemados y la cohorte control sana, y un seguimiento incompleto.
Algunas de estas diferencias se tuvieron en cuenta estadísticamente
en el análisis. Los puntos fuertes del estudio incluyeron el uso de
una medida fiable y válida de la CVRS, y unos efectos
significativos desde los puntos de vista estadístico y clínico. Las
investigaciones adicionales en entornos variados favorecerían que
estos hallazgos se trasladasen a la práctica.

978
PUNTOS CLAVE
• La investigación de métodos mixtos combina los métodos
de investigación cuantitativos y cualitativos para responder
a una pregunta de investigación con un enfoque
pragmático.
• Los datos se recogen de forma secuencial o simultánea.
• Los tres enfoques de métodos mixtos que suelen utilizarse
en investigación de enfermería son: 1) diseños convergentes
concurrentes, 2) diseños exploratorios secuenciales y 3)
diseños explicativos secuenciales.
• Los diseños convergentes concurrentes se utilizan cuando la
pregunta de investigación se puede abordar utilizando
métodos cuantitativos y cualitativos. El investigador recoge
datos cuantitativos y cualitativos al mismo tiempo, analiza
cada grupo de datos e integra los resultados.
• Los diseños exploratorios secuenciales se pueden utilizar
cuando el investigador quiere expandir lo que se sabe sobre
un fenómeno y no quiere que el contenido de los
instrumentos cuantitativos sesgue las respuestas de los
participantes en la fase cualitativa. Los hallazgos de la fase
cualitativa suelen utilizarse para finalizar los métodos de la
fase cuantitativa.
• Los diseños explicativos secuenciales comienzan con la
recogida, análisis e interpretación de los datos cuantitativos,
seguidos de una fase cualitativa. Estos estudios son más
útiles para proporcionar respuestas a preguntas «por qué» y
«cómo» que surgen de los hallazgos cuantitativos.
• Las estrategias de investigación de métodos mixtos
requieren una profundidad y amplitud de conocimientos de
investigación, así como una dedicación significativa de
tiempo y recursos.
• Es crucial determinar el método de integración antes de
comenzar el estudio. La integración de los datos puede
mostrarse en tablas, gráficas o matrices.
• La investigación de resultados evalúa los resultados finales
de la asistencia al paciente.
• Los enfoques científicos utilizados en los estudios de los

979
resultados difieren en algunos aspectos importantes de los
que se utilizan en la investigación tradicional de enfermería.
• Donabedian (1987, 2005) desarrolló la teoría en la que se
basa la investigación de resultados; la calidad es el
constructo dominante de la teoría.
• Los tres conceptos principales de la teoría son la salud, los
sujetos que reciben la asistencia y los proveedores de dicha
asistencia.
• Donabedian identificó tres componentes de evaluación en la
valoración de la calidad: estructura, proceso y resultado.
• El objetivo de la investigación de resultados es evaluar los
resultados que están claramente vinculados con el proceso
que los provocó.
• Se establecieron unas guías clínicas para incorporar la
evidencia disponible a los resultados de salud.
• Los estudios de resultados proporcionan numerosas
oportunidades para construir una base científica más sólida
para la práctica enfermera.
• Un resultado del paciente sensible a la práctica enfermera es
«sensible» porque está influido por dicha práctica.
• Las estrategias del diseño de resultado tienden a tener
menos control que los diseños de investigación de
enfermería tradicionales analizados en este libro (v. cap. 8).
• Algunas de las metodologías comunes de los estudios de
resultados incluyen los estudios de cohortes prospectivos,
los estudios de cohortes retrospectivos, los estudios
poblacionales y los análisis económicos.
• Los estudios de resultados suelen utilizar muestras grandes
representativas y heterogéneas en lugar de muestras
aleatorias.
• Los enfoques estadísticos utilizados en los estudios de
resultados se centran en evaluar la fiabilidad de la
medición, analizar el cambio y determinar la mejoría de la
salud.
• La valoración crítica de los estudios de resultados se centra
en las similitudes de las cohortes expuesta y no expuesta
(de control), la adecuación e integridad del seguimiento, la
fiabilidad y la validez de la(s) medida(s) de resultado y la

980
significación estadística y clínica de los hallazgos del
estudio.

BIBLIOGRAFÍA
Agency for Healthcare Research and Quality (AHRQ). Patient-
centered outcomes research (PCOR) at AHRQ. Consultada el 30 de
mayo de 2017 en https://www.ahrq.gov/pcor/index.html, 2017.

Agency for Healthcare Research and Quality (AHRQ). Funding


announcements. Consultada el 29 de mayo de 2017 en
https://www.ahrq.gov/funding/fund-opps/index.html, 2017.

Aiken, L. H., Clarke, S. P., Sloane, D. M., Lake, E. T., Cheney, T.


Effects of hospital care environment on patient mortality and nurse
outcomes. Journal of Nursing Administration. 2008; 38(5):223–229.

Al-Yateem, N., Docherty, C., Rossiter, R. Determinants of quality


care for adolescents and young adults with chronic illnesses: A
mixed methods study. Journal of Pediatric Nursing. 2016; 31:255–266.

American Nurses Credentialing Center (ANCC). ANCC Magnet


Recognition Program. Consultada el 14 de mayo de 2017 en
http://nursecredentialing.org/Magnet.aspx, 2017.

Ausserhofer, D., Schubert, M., Desmedt, M., Blegen, M. A., De


Geest, S., Schwendimann, R. The association of patient safety
climate and nurse-related organizational factors with selected
patient outcomes: A cross-sectional survey. International Journal of
Nursing Studies. 2013; 50(2):240–252.

Bakker, R., Steegers, E., Biharie, A., Mackenbach, J., Hofman, A.,
Jaddoe, V. Explaining differences in birth outcomes in relation to

981
maternal age: The Generation R Study. BJOG: An International
Journal of Obstetrics and Gynaecology. 2011; 118(4):500–509.

Bettger, J. A., Coster, W. J., Latham, N. K., Keysor, J. J. Analyzing


change in recovery patterns in the year after acute hospitalization.
Archives of Physical Medicine & Rehabilitation. 2008; 89(7):1267–1275.

Bishop, F. Using mixed methods research designs in health


psychology: An illustrative discussion from a pragmatist
perspective. British Journal of Health Psychology. 2015; 20(1):5–20.

Chen, H., Bennett, S. Decision-tree analysis for predicting first-time


pass/fail rates for the NCLEX-RN® in associate degree nursing
students. Journal of Nursing Education. 2016; 55(8):454–457.

Clancy, C. M., Eisenberg, J. M. Outcomes research: Measuring the


end results of health care. Science. 1998; 282(5387):245–246.

Clarke, S. P. Health care utilization. In: Doran D.M., ed. Nursing


outcomes: The state of the science. 2nd ed. Sudbury, MA: Jones &
Bartlett; 2011:439–485.

Collaborative Alliance for Nursing Outcomes (CALNOC).


CALNOC: Home page. Consultada el 15 de mayo de 2017, en
http://www.calnoc.org/, 2017.

Collaborative Alliance for Nursing Outcomes (CALNOC).


Overview. Consultada el 15 de mayo de 2017 en
http://www.calnoc.org/?page=A1, 2017.

Creswell, J. W., Research design: Qualitative, quantitative, and


mixed methods approaches 4th ed. Sage, Los Angeles, CA, 2014.

Creswell, J. W. A concise introduction to mixed methods research. Los

982
Angeles, CA: Sage; 2015.

Creswell, J., Klassen, A., Clark, V., Smith, K. Best practices for
mixed methods research in health sciences. Consultada el 25 de
mayo de 2017 en
https://www2.jabsom.hawaii.edu/native/docs/tsudocs/Best_Practices_for_Mixed
2011.

Cummings, G. G., Midodzi, W. K., Wong, C. A., Estabrooks, C. A.


The contribution of hospital nursing leadership styles to 30-day
patient mortality. Nursing Research. 2010; 59(5):331–339.

Donabedian, A. Needed research in quality assessment and monitoring.


Hyattsville, MD: U.S. Department of Health, Education, and
Welfare, Public Health Service, National Center for Health Services
Research; 1978.

Donabedian, A. Explorations in quality assessment and monitoring.


Ann Arbor, MI: Health Administration Press; 1980.

Donabedian, A. The criteria and standards of quality. Ann Arbor, MI:


Health Administration Press; 1982.

Donabedian, A., Some basic issues in evaluating the quality of


health careRinke L.T., ed. Outcome measures in home care Vol. I.
National League for Nursing, New York, NY, 1987. 338. [(Original
work published in 1976.)].

Donabedian, A. The quality of care: How can it be assessed? Journal


of the American Medical Association. 1988; 260(12):1743–1748.

Donabedian, A. An introduction to quality assurance in health care.


Oxford, UK: Oxford University Press; 2003.

983
Donabedian, A. Evaluating the quality of medical care. The Milbank
Quarterly. 2005; 83(4):691–729.

Doran D.M., ed. Nursing outcomes: The state of the science, 2nd
ed., Sudbury, MA: Jones & Bartlett, 2011.

Edgar, D., Dawson, A., Hankey, G., Phillips, M., Wood, F.


Demonstration of the validity of the SF-36 for measurement of the
temporal recovery of quality of life outcomes in burns survivors.
Burns. 2010; 36(7):1013–1020.

Giarelli, E., Denigris, J., Fisher, K., Maley, M., Nolan, E. Perceived
quality of work life and risk for compassion fatigue among
oncology nurses: A mixed-methods study. Oncology Nursing Forum.
2016; 43(3):E121–E131.

Goldman, M., Little, J. Innovative grassroots NGOs and the


complex processes of women’s empowerment: An empirical
investigation from northern Tanzania. World Development. 2015;
66(2):762–777.

Graham, I. D., Bick, D., Tetroe, J., Straus, S. E., Harrison, M. B.


Measuring outcomes of evidence-based practice: Distinguishing
between knowledge use and its impact. In: Bick D., Graham I., eds.
Evaluating the impact of implementing evidence-based practice. Oxford,
UK: Wiley-Blackwell; 2011:18–37.

Gray, J. R., Grove, S. K., Sutherland, S. The practice of nursing


research: Appraisal, synthesis, and generation of evidence, 8th ed. St.
Louis, MO: Elsevier; 2017.

Grove, S. K., Cipher, D. J. Statistics for nursing research: A workbook


for evidence-based practice, 2nd ed. St. Louis, MO: Elsevier; 2017.

984
Guetterman, T., Fetters, M., Creswell, J. Integrating quantitative and
qualitative results in health science mixed methods research
through joint displays. Annals of Family Medicine. 2015; 13(6):554–
561.

Guyatt, G., Rennie, D., Meade, M. O., Cook, D. J. Users’ guides to the
medical literature: A manual for evidence-based practice, 2nd ed. New
York, NY: McGraw-Hill Medical; 2008.

Hagstrom, S. Family stress in pediatric critical care. Journal of


Pediatric Nursing. 2017; 32(1):32–40.

Harris, C. W. Problems in measuring change. Madison, WI: University


of Wisconsin Press; 1967.

Herrmann, D. Reporting current, past, and changed health status:


What we know about distortion. Medical Care. 1995; 33(Suppl.
4):AS89–AS94.

Howell, D. Psychological distress as a nurse-sensitive outcome. In:


Doran D.M., ed. Nursing outcomes: The state of the science. 2nd ed.
Sudbury, MA: Jones & Bartlett; 2011:285–358.

Irvine, D. M., Sidani, S., Hall, L. M. Linking outcomes to nurses’


roles in health care. Nursing Economic. 1998; 16(2):58–64. [87.].

Kane, R. L., Radosevich, R. M. Conducting health outcomes research.


Sudbury, MA: Jones & Bartlett Learning; 2011.

Kenner, C. A. Trends in US nursing research: Links to global


healthcare issues. Journal of Korean Academic Nursing Administration.
2017; 23(1):1–7.

Kleib, M., Sales, A., Doran, D. M., Malette, C., White, D. Nursing

985
minimum data sets. In: Doran D.M., ed. Nursing outcomes: The state
of the science. 2nd ed. Sudbury, MA: Jones & Bartlett; 2011:487–512.

Kleinpell, R. M. Outcome assessment in advanced practice nursing, 3rd


ed. New York, NY: Springer Publishing Company; 2013.

Kutney-Lee, A., Sloane, D., Aiken, L., Increase in the number of


nurses with baccalaureate degrees is linked to lower rates of
postsurgery mortality. Health Affairs 32 3 2013:579–586

Lasater, K. B., Sloane, D. M., Aiken, L. H. Hospital employment of


supplemental registered nurses and patients’ satisfaction with care.
Journal of Nursing Care Quality. 2015; 45(3):145–151.

Leavy, P. Research design: Quantitative, qualitative, mixed methods,


arts-based, and community-based participatory research approaches. New
York, NY: Guilford Press; 2017.

Lenz, A., Lancaster, C. A mixed-methods evaluation of intensive


trauma-focused programming. Journal of Counseling & Development.
2017; 95(1):24–34.

Magnello, M. E. The passionate statistician. In: Nelson S., Rafferty


A.M., eds. Notes On Nightingale: The influence and legacy of a nursing
icon. Ithaca, NY: Cornell University Press; 2010:115–129.

Mark, B. A. The black box of patient outcomes research. Image:


Journal of Nursing Scholarship. 1995; 27(1):42.

McHugh, M. D., Kelly, L. A., Smith, H. L., Wu, E. S., Vanak, J. M.,
Aiken, L. H. Lower mortality in Magnet hospitals. Medical Care.
2013; 51(5):382–388.

Melnyk, B. M., Gallagher-Ford, L., Fineout-Overholt, E.

986
Implementing evidence-based practice competencies in healthcare: A
practical guide for improving quality, safety, & outcomes. Indianapolis,
IN: Sigma Theta Tau International; 2017.

Min, A., Scott, L. D. Evaluating nursing hours per patient day as a


nurse staffing measure. Journal of Nursing Management. 2016;
24(4):439–448.

Mitchell, P. H., Ferketich, S., Jennings, B. M. American Academy of


Nursing Expert Panel on Quality Health Care: 1998 Quality Health
Outcomes Model. Image—Journal of Nursing Scholarship. 1998;
30(1):43–46.

Montalvo, I. National Database of Nursing Quality Indicators


(NDNQI). Consultada el 30 de mayo de 2017 en
http://www.nursingworld.org/ojin, 2007.

Moorhead, S., Johnson, M., Maas, M. L., Swanson, E. Nursing


outcomes classification (NOC): Measurement of health outcomes, 5th ed.
St. Louis, MO: Elsevier Mosby; 2013.

Morgan, D. Integrating qualitative & quantitative methods: A pragmatic


approach. Los Angeles, CA: Sage; 2014.

National Database of Nursing Quality Indicators (NDNQI).


Nursing quality (NDNQI). Consultada el 30 de mayo de 2017 en
http://www.pressganey.com/solutions/clinical-quality/nursing-
quality, 2017.

National Guideline Clearinghouse (NGC). AHRQ’s National


Guideline Clearinghouse is a public resource for summaries of
evidence-based clinical practice guidelines. Consultada el 30 de
mayo de 2017 en http://www.guideline.gov, 2017.

987
National Quality Forum (NQF). About NQF. Consultada el 15 de
mayo de 2017 en http://www.qualityforum.org/About_NQF/, 2017.

National Quality Forum (NQF). NQF’s strategic direction 2016-


2019: Lead, prioritize, and collaborate for better health
measurement. Consultada el 15 de mayo de 2017 en
http://www.qualityforum.org/NQF_Strategic_Direction_2016-
2019.aspx, 2017.

Oh, S. H., Park, E. J., Yin, Y., Piao, J., Lee, S. Automatic delirium
prediction system in Korean surgical intensive care unit. Nursing in
Critical Care. 2014; 19(6):281–291.

Oncology Nursing Society (ONS). About ONS. Consultada el 15 de


mayo de 2017 en http://www.ons.org/about, 2017.

Orem, D. Nursing concepts of practice, 6th ed. St Louis, MO: Mosby;


2001.

Orwelius, L., Willebrand, M., Gerdin, L., Ekselius, L., Fredrikson,


M., Sjöberg, F. Long-term health-related quality of life after burns is
strongly dependent on pre-existing disease and psychosocial issues
and less due to the burn itself. Burns. 2013; 39(2):229–235.

Patient-Centered Outcomes Research Institute (PCORI). PCORI:


About us. Consultada el 15 de agosto de 2017 en
http://www.pcori.org/about-us, 2017.

Polit, D. F., Yang, F. M. Measurement and the measurement of change.


Philadelphia, PA: Wolters Kluwer; 2016.

Pluye, P., Gagnon, M. P., Griffiths, F., Johnson-Lafleur, J. A scoring


system for appraising mixed methods research, and concomitantly

988
appraising qualitative, quantitative and mixed methods primary
studies in mixed studies reviews. International Journal of Nursing
Studies. 2009; 46(4):529–546.

Richards, M. R., Lasater, K., McHugh, M. A race to the top?


Competitive pressure and Magnet adoption among U.S. hospitals
1997-2012. Medical Care. 2017; 55(4):384–390.

Rosenfeld, P., Glassman, K. The long-term effect of a nurse


residency program 2005-2012. Journal of Nursing Administration.
2016; 46(6):336–344.

Ruesch, C., Mossakowski, J., Forrest, J., Hayes, M., Jahrsdoerfer, M.,
Comeau, E., Singleton, M., Using nursing expertise and
telemedicine to increase nursing collaboration and improve patient
outcomes. Telemedicine Journal & E-Health 18 8 2012:591–595

Schetter, C. D., Niles, A. N., Guardino, C. M., Khaled, M., Kramer,


M. S. Demographic, medical, and psychosocial predictors of
pregnancy anxiety. Paediatric and Perinatal Epidemiology. 2016;
30(5):421–429.

Sidani, S. Self-care. In: Doran D.M., ed. Nursing outcomes: The state of
the science. 2nd ed. Sudbury, MA: Jones & Bartlett; 2011:79–130.

Sidani, S. Symptom management. In: Doran D.M., ed. Nursing


outcomes: The state of the science. 2nd ed. Sudbury, MA: Jones &
Bartlett; 2011:131–199.

Staggs, V. S., Olds, D. M., Cramer, E., Shorr, R. I. Nursing skill mix,
nurse staffing level, and physical restraint use in U.S. hospitals: A
longitudinal study. Journal of General Internal Medicine. 2017;
32(1):35–41.

989
Tourangeau, A. E. Mortality rate: A nursing sensitive outcome. In:
Doran D.M., ed. Nursing outcomes: The state of the science. 2nd ed.
Sudbury, MA: Jones & Bartlett; 2011:409–437.

Tracy, S., Schinco, M. A., Griffen, M. M., Kerwin, A. J., Devin, T.,
Tepas, J. J. Urgent airway intervention: Does outcome change with
personnel performing the procedure? Journal of Trauma. 2006;
61(5):1162–1165.

Van Bogaert, P., Timmermans, O., Weeks, S. M., van Heusden, D.,
Wouters, K., Franck, E. Nursing unit teams matter: Impact of unit-
level nurse practice environment, nurse work characteristics, and
burnout on nurse reported job outcomes, and quality of care, and
patient adverse events—A cross-sectional survey. International
Journal of Nursing Studies. 2014; 51(8):1123–1134.

van Griensven, H., Moore, A., Hall, V. Mixed methods research –


The best of both worlds? Manual Therapy. 2014; 19(5):367–371.

Waltz, C. F., Strickland, O. L., Lenz, E. R. Measurement in nursing


and health research, 5th ed. New York, NY: Springer; 2017.

Ware, J. R., Sherbourne, J. E. The MOS, 36-item short-form health


survey (SF-36). I. Conceptual framework and item selection. Medical
Care. 1992; 30(6):473–483.

Wisdom, J., Creswell, J. Mixed methods: Integrating quantitative and


qualitative data collection and analysis while studying patient-centered
medical home models. Rockville, MD: Agency for Healthcare Research
and Quality. AHRQ Publication No. 13-0028-EF; 2013.

World Health Organization (WHO). The conceptual framework for


the International Classification for Patient Safety (ICPS). Consultada

990
el 15 de mayo de 2017 en
http://www.who.int/patientsafety/implementation/taxonomy/ICPS-
report/en/, 2017.

Yardley, L., Bishop, F. Using mixed methods in health research:


Benefits and challenges. British Journal of Health Psychology. 2015;
20(1):1–4.

Yoder, L., Xin, W., Norris, K., Yan, G. Patient care staffing levels
and facility characteristics in US hemodialysis facilities. American
Journal of Kidney Disease. 2013; 62(6):1130–1140.

Zivin, K., Yosef, M., Miller, E. M., Valenstein, M., Duffy, S., Kales,
H. C., et al. Associations between depression and all-cause and
cause-specific risk of death: A retrospective cohort study in the
Veterans Health Administration. Journal of Psychosomatic Research.
2015; 78(4):324–331.

991
GLOSARIO

A
Abandono de individuos Véase tasa de abandono de una muestra.
Abandono de la muestra Véase tasa de abandono de una muestra.
Abordaje émico Estrategia de investigación antropológica para
estudiar comportamientos desde dentro de una cultura.
Abordaje ético Estrategia de investigación antropológica para
estudiar el comportamiento situándose fuera de la cultura y
examinando similitudes y diferencias entre culturas.
Abstracto Idea que se centra en una visión general de un fenómeno;
expresado sin referencia a ningún ejemplo concreto.
Aceptación voluntaria Decisión tomada por un individuo de
participar en un estudio, por su propia voluntad, sin coerción ni
influencias indebidas.
Actas de conferencias Colección de artículos presentados en un
congreso de organizaciones profesionales importantes, que
posteriormente se publican.
Alfa (α) Nivel de significación o punto de corte usado para
determinar si las muestras estudiadas pertenecen a la misma
población (no significativa) o a distintas poblaciones
(significativa); por lo general, alfa se fija en 0,05; 0,01, o 0,001.
Alfa también es la probabilidad de cometer un error tipo I.
Algoritmo Árbol de decisión que proporciona un grupo de normas

992
para resolver un problema concreto de la práctica. Su desarrollo
suele estar basado en evidencias de investigación y
conocimientos teóricos.
Amenazas a la validez de constructo Defecto del diseño en el que
la medición de una variable no es adecuada para el concepto que
representa. Una medición puede incluir no solo el concepto de
interés, sino también otros conceptos relacionados.
Amenazas a la validez de la conclusión estadística Factor que
produce una conclusión falsa del análisis de datos, debido
habitualmente a un tamaño muestral inadecuado o al uso
inapropiado de una prueba estadística.
Amenazas a la validez del diseño Posibles problemas o
condiciones de un estudio que disminuyen la precisión o validez
de los resultados de la investigación. Estas amenazas se
organizan en cuatro categorías: validez de la conclusión
estadística, validez interna, validez de constructo y validez
externa.
Amenazas a la validez externa Límite a la generalización basado en
las diferencias entre las condiciones de los participantes del
estudio y las condiciones o las características de las personas o
entornos para los que se considera la generalización.
Amenazas a la validez interna En investigación de intervención,
factor que causa cambios en la variable dependiente además de
los cambios causados por la variable independiente. En
investigación no intervencional, un investigador puede
implementar el estudio con métodos inconsistentes.
Análisis bivariante Procedimientos estadísticos que implican la
comparación de la misma variable en dos grupos diferentes o la
medición de dos variables distintas dentro de un mismo grupo.
Análisis de correlación Procedimiento estadístico que se realiza
para determinar la dirección (positiva o negativa) y la magnitud
(o fuerza) de la relación entre dos variables.
Análisis de datos Técnicas usadas para reducir, organizar y dar
significado a los datos.

993
Análisis de informes de investigación Capacidad de pensamiento
crítico que supone determinar el valor de un estudio
disgregando el contenido del informe del estudio en partes y
examinando dichas partes respecto a su exactitud, integridad,
exclusividad de la información y organización.
Análisis de la covarianza (ANCOVA) Técnica estadística en la que
se lleva a cabo un análisis de regresión antes de realizar un
análisis de la varianza (ANOVA); diseñada para reducir la
varianza intragrupal al eliminar estadísticamente la varianza
causada por una variable de confusión.
Análisis de la potencia Técnica empleada para determinar el riesgo
de error de tipo II de modo que sea posible modificar el estudio
con el fin de reducir el riesgo en caso necesario y garantizar que
el estudio cuenta con una muestra del tamaño correcto. La
realización de un análisis de potencia incluye alfa (nivel de
significación), la magnitud del efecto y una potencia estadística
de 0,8 para determinar el tamaño de la muestra para un estudio.
Análisis de la varianza (ANOVA) Prueba estadística usada para
examinar diferencias entre dos o más grupos comparando la
variabilidad intergrupal con la variabilidad presente en cada
grupo respecto a alguna variable continua dependiente o de
resultado.
Análisis de regresión Técnica estadística usada para predecir el
valor de una variable mediante los valores conocidos de una o
más variables. La variable(s) independiente(s) (predictor) se
analiza(n) para determinar su influencia sobre la variación o
cambio del valor de la variable dependiente.
Análisis de regresión múltiple Técnica estadística que se realiza
para predecir la variable dependiente utilizando más de una
variable independiente; es una extensión de una regresión lineal
simple.
Análisis estadístico Técnicas utilizadas para examinar, reducir y
dar sentido a los datos numéricos de un estudio.
Análisis estadísticos paramétricos Técnicas estadísticas utilizadas

994
cuando se cumplen tres suposiciones: 1) la muestra se tomó de
una población en la que la distribución de valores se espera que
sea normal o aproximadamente normal; 2) la medición de
variables se realiza a nivel de intervalos o de razón, y 3) los datos
pueden tratarse como si se hubiesen obtenido de muestras
aleatorias; las mismas técnicas pueden utilizarse para datos de
intervalos o de razón.
Análisis exploratorio Examen descriptivo de los datos
cuantitativos para identificar los valores extremos y los sesgos;
permite al investigador familiarizarse con ellos.
Análisis factorial Estrategia estadística en la que variables o ítems
de un instrumento se evalúan para determinar interrelaciones
con el fin de identificar las variables estrechamente relacionadas
que comparten una idea común. Dos tipos frecuentes de análisis
de factores son el exploratorio y el de confirmación.
Análisis no paramétrico Técnica estadística utilizada cuando los
datos no presentan una distribución normal a los niveles
nominal u ordinal; los datos no cumplen las suposiciones de la
estadística paramétrica (distribución normal, datos a nivel de
intervalos o racional).
Análisis post hoc Técnicas estadísticas realizadas para determinar
qué grupos son significativamente diferentes después de que la
prueba inicial con más de dos grupos demuestre unas diferencias
significativas. Por ejemplo, el ANOVA (análisis de la varianza)
indica que hay diferencias significativas entre tres grupos
(intervención, placebo y control), pero los análisis post hoc
señalan específicamente qué grupos son diferentes.
Análisis secundario Nuevo análisis de la información o los datos
previamente recogidos por otro investigador u organización. Un
análisis secundario puede implicar el uso de bases de datos de
investigación o administrativas.
Anonimato Incapacidad de que otras personas, incluido el
investigador, relacionen la identidad del participante de un
estudio con sus respuestas individuales.
Antecedentes de un problema Parte del problema de investigación

995
que indica lo que se sabe o que identifica las publicaciones de
investigación clave en el ámbito del problema.
Artículo Escrito sobre un tema específico publicado con otros
artículos en una revista, enciclopedia o libro editado.
Asentimiento para la participación del niño en una investigación
Aceptación de un niño o adulto con autonomía disminuida para
participar en un estudio cuando los progenitores o tutores han
otorgado su permiso.
Asignación aleatoria a los grupos Técnica utilizada para asignar
aleatoriamente a los participantes de un estudio a un grupo de
intervención o control. Cada participante en el estudio debería
tener las mismas oportunidades de ser adscrito a cualquiera de
los dos grupos.
Asimilación Complicación de la observación en la que el
investigador se convierte en parte de la cultura y pierde su
capacidad de observar claramente.
Auditabilidad Grado en el que otros investigadores pueden revisar
el registro de auditoría de un estudio cualitativo y aceptar que
las conclusiones de los autores son lógicas.
Autonomía Libertad de una persona para tomar decisiones y actuar
según sus propias decisiones; cuando se aplica a la investigación,
una persona escoge si quiere participar sin una influencia ni
coerción indebidas.
Autonomía reducida Condición de las personas cuya capacidad de
otorgar un consentimiento informado voluntariamente está
reducida por incompetencia legal o mental, enfermedad terminal
o reclusión en una institución.
Autoridad Persona(s) con experiencia y poder capaz de influir en
las opiniones y comportamientos de otros.

B
Base de datos administrativa Recurso creado por compañías
aseguradoras, agencias gubernamentales y otros organismos no

996
implicados directamente en la asistencia a pacientes; contiene
grupos de datos estandarizados de un gran número de pacientes
y profesionales.
Base de datos bibliográfica Recopilación almacenada
electrónicamente de citaciones relevantes para una disciplina
específica o una amplia colección de citaciones de diversas
disciplinas; puede buscarse por autores, títulos, revistas,
palabras clave o tema.
Base de datos clínica Base de datos de información de pacientes,
médicos y agencias sanitarias que elaboran las agencias
sanitarias y, en ocasiones, los médicos para documentar la
prestación de cuidados y los resultados.
Búsqueda intrabibliográfica Análisis de referencias en busca de
estudios relevantes con el fin de identificar estudios previos que
sean pertinentes para la búsqueda; se utiliza cuando se realiza
una síntesis de investigación o una búsqueda exhaustiva de la
literatura para un estudio.

C
Calidad de la asistencia Grado en el que los servicios sanitarios
prestados a los individuos y poblaciones mejoran los resultados
de salud deseados y son concordantes con el conocimiento
profesional actual. Los resultados se exploran en la investigación
de resultados.
Características de la muestra Datos analizados y resumidos para
describir a los participantes en un estudio. Entre las variables
demográficas frecuentes que se miden en los estudios de
enfermería se encuentran la edad, el sexo, la etnicidad, la raza y
los diagnósticos médicos.
Características demográficas Véase características de la muestra.
Causalidad Relación que consta de tres condiciones: 1) debe existir
una correlación sólida entre la causa propuesta y el efecto; 2) la
causa propuesta tiene que preceder al efecto en el tiempo, y 3) la
causa debe estar presente siempre que se produce el efecto.

997
Centros de práctica basada en la evidencia (CPBE) Universidades
y organismos identificados por la Agency for Healthcare
Research and Quality como centros para la realización,
comunicación y síntesis del conocimiento de investigación en
áreas seleccionadas para promover la asistencia sanitaria basada
en la evidencia.
Cero absoluto El valor de cero indica la ausencia de la propiedad
que se está midiendo; un peso de cero significa la ausencia de
peso.
Circunstancias del paciente Estado clínico, objetivos de salud (p.
ej., promoción de la salud, manejo de la enfermedad y/o muerte
tranquila) y entorno clínico de un individuo. La práctica basada
en la evidencia es una combinación de la mejor evidencia de
investigación, experiencia clínica y circunstancias del paciente.
Cita Acto de citar una fuente, utilizándola como ejemplo, o
presentándola como respaldo de una postura adoptada en un
artículo o publicación. Una cita debería acompañarse de la
referencia adecuada a su fuente.
Cociente(s) de verosimilitudes (CV) Cálculos adicionales que
ayudan a los investigadores a determinar la precisión de las
pruebas diagnósticas o de cribado, basados en la sensibilidad y
especificidad de los resultados.
Cociente de verosimilitudes (CV) negativo Cociente entre
resultados verdaderos negativos y falsos negativos; se calcula del
siguiente modo:

CV negativo = (100% − sensibilidad) + especificidad

CV negativo = (100% − sensibilidad) + especificidad


Cociente de verosimilitudes (CV) positivo Cociente usado para
determinar la probabilidad de que un resultado positivo de una
prueba sea un resultado verdadero positivo. Se calcula del
siguiente modo:

998
CV positivo = sensibilidad ÷ (100% − especificidad)

CV positivo = sensibilidad ÷ (100% − especificidad)


Cociente riesgo-beneficio Comparación de los potenciales
beneficios (resultados positivos) y riesgos (resultados negativos)
de un estudio que emplean los investigadores y revisores para
asegurar la realización de investigaciones éticas.
Codificación Forma de indexar o identificar categorías en datos
cualitativos.
Código de Núremberg Declaraciones de conducta ética de
investigación que se formularon en respuesta a los juicios de
Núremberg después de la Segunda Guerra Mundial.
Código ético de la American Nurses Association Guías
desarrolladas por las enfermeras para proteger los derechos de
las personas durante la práctica y la investigación en enfermería.
Coeficiente de correlación Indica el grado de correlación entre dos
variables; el valor del coeficiente oscila entre +1 (relación positiva
perfecta) y −1,00 (relación negativa perfecta o relación inversa).
Coeficiente de determinación (r2) Cuadrado del valor de
correlación (r2), que representa el porcentaje de varianza que
comparten dos variables.
Coeficiente de determinación múltiple Técnica estadística
realizada cuando un estudio incluye múltiples variables
independientes para predecir una variable dependiente. R2 es el
porcentaje de la variación total que puede explicarse por todas
las variables que el investigador incluye en la ecuación de
predicción final.
Coerción Amenaza manifiesta de un daño o recompensa excesiva
realizada intencionadamente por una persona a otra con el fin de
lograr su consentimiento; por ejemplo, ofrecer a individuos una
gran suma de dinero para que participen en un proyecto de
investigación peligroso.
Colas de la curva normal Extremos terminales de la curva normal

999
en los que se pueden encontrar valores estadísticamente
significativos.
Comité de revisión institucional (CRI) Comité de una universidad
u organización sanitaria que revisa la investigación para
asegurar que el investigador la está realizado éticamente; se
requiere la aprobación del CRI antes de realizar un estudio en
esa organización.
Common Rule Nombre dado a las similitudes entre los capítulos
del Code of Federal Regulations entre los departamentos
federales estadounidenses; incluye los contenidos de un
documento de consentimiento, los procesos para la obtención del
consentimiento informado y para mantener el comité de revisión
institucional (CRI), los niveles de revisión del CRI y la protección
de las poblaciones vulnerables.
Comprensión en profundidad de un informe de investigación
Proceso de pensamiento crítico empleado en la lectura de
informes de investigación, en el que la atención se dedica a
entender los conceptos principales y el flujo lógico de ideas en
un estudio.
Comprensión en profundidad de una fuente Proceso realizado
mediante la lectura y atención plena a los puntos principales de
un artículo u otras fuentes.
Concepto Término que describe de forma abstracta y denomina un
objeto o fenómeno, proporcionándole así una identidad o
significado distinto.
Conceptos de investigación Ideas, experiencias, situaciones o
acontecimientos examinados en la investigación cualitativa.
Conclusión Afirmación cerca del final de una revisión de la
literatura que refleja la síntesis del conocimiento en un área
temática conceptual e incluye lo que se sabe y lo que no se sabe;
en un artículo de investigación, son las afirmaciones que
resumen los hallazgos de un estudio, su significado y la
contribución al conocimiento.
Concreto Se refiere a términos de pensamiento que se orientan a

1000
cosas tangibles o acontecimientos observados y experimentados
en la realidad.
Confiabilidad Documentación de los pasos llevados a cabo y las
decisiones tomadas durante el análisis cualitativo.
Confianza Fortaleza de un estudio cualitativo determinada por el
grado en el que las características interrelacionadas de
credibilidad, transferibilidad, confiabilidad y auditabilidad de
los hallazgos del estudio son evidentes en el informe de
investigación.
Confidencialidad Gestión de datos durante un estudio de modo tal
que solo el investigador conoce las identidades de los
participantes y es capaz de relacionarlas con sus respuestas.
Congruencia metodológica Consistencia entre la filosofía
subyacente, el diseño cualitativo utilizado y el desarrollo del
producto de estudio.
Conocimiento Contenido o cuerpo de información esencial para
una disciplina que se adquiere mediante tradiciones, fuentes
autorizadas, préstamo, ensayo y error, experiencia personal,
modelado de roles y tutoría, intuición, razonamiento e
investigación. Se espera que el conocimiento sea un reflejo
preciso de la realidad y se incorpora y utiliza para dirigir las
acciones de una persona.
Consentimiento amplio Acuerdo por el cual un participante del
estudio concede al investigador permiso para almacenar,
administrar y utilizar la información privada y muestras
biológicas sin violar la confidencialidad; este tipo de
consentimiento se incluyó en las revisiones de la Common Rule.
Consentimiento informado Aceptación voluntaria por un posible
individuo competente para participar en una investigación
después de que se ha proporcionado y comprendido la
información esencial sobre el estudio.
Constructo Concepto con un nivel muy elevado de abstracción que
posee un significado general.
Control En investigación, imposición de reglas por parte del

1001
investigador con el fin de reducir la posibilidad de error y
aumentar la probabilidad de que los hallazgos del estudio sean
un reflejo preciso de la realidad.
Correlación bivariante Medida del grado de la relación lineal entre
dos variables.
Correlación del producto-momento de Pearson(r) Análisis
estadístico paramétrico realizado para determinar la relación
lineal entre dos variables.
Credibilidad Seguridad del lector sobre el grado en que los
investigadores cualitativos han generado resultados que reflejan
las perspectivas de los participantes; similar a la validez en la
valoración crítica de los estudios cuantitativos.
Criterios de elegibilidad Véase criterios de muestreo o elegibilidad.
Criterios de exclusión de la muestra Características que pueden
hacer que una persona o elemento sea excluido de la población
diana porque la característica tiene el potencial de introducir
error en el estudio.
Criterios de inclusión en la muestra Requisitos de muestreo
identificados por el investigador que deben estar presentes para
que los participantes o elementos se consideren parte de la
población diana para su posible selección en una muestra de
estudio.
Criterios de muestreo o elegibilidad Lista de las características
esenciales para la inclusión o exclusión de la población diana.
Criterios de valoración intermedios Eventos o marcadores cuya
validez se evalúa para predecir el resultado y que actúan como
precursores del resultado final.
Cuestionario Formulario autocompletado diseñado para conseguir
información (datos) de los participantes que responden
seleccionando de una lista de opciones predeterminadas o
escribiendo respuestas textuales a las preguntas.
Curva normal Distribución teórica en forma de campana, simétrica
y unimodal de todos los valores posibles; ninguna distribución

1002
real se ajusta exactamente a la curva normal.

D
Datos Porciones de información recopilada durante un estudio.
Datos nominales Nivel más bajo de datos que solo se pueden
organizar en categorías que son excluyentes y exhaustivas. Estos
datos se analizan con estadística no paramétrica.
Datos ordinales Datos que se pueden ordenar jerárquicamente con
intervalos entre las categorías que no son necesariamente
iguales. Estos datos se analizan con técnicas estadísticas no
paramétricas.
Datos primarios Información o valores recogidos para un estudio
concreto.
Datos racionales Información numérica basada en la escala de los
números reales; los datos pueden analizarse con estadística
paramétrica. Véase nivel de medida racional o de razón.
Datos secundarios Información recogida en la práctica clínica o
para otro estudio previo al estudio actual; se almacena
electrónicamente en una base de datos.
Declaración de Helsinki Declaración de principios éticos que
seguía el Código de Núremberg; especificó las diferencias entre
la investigación terapéutica y no terapéutica, señalando a los
investigadores como responsables de proteger la dignidad,
privacidad y salud de los participantes.
Declaración del problema Declaración que concluye la discusión
del problema de investigación y plantea la ausencia del
conocimiento necesario para la práctica. La determinación del
problema suele constituir la base del propósito del estudio.
Declaraciones Frases que aclaran la existencia de conceptos, sus
definiciones y las relaciones entre ellos.
Definición conceptual Definición que otorga a una variable o
concepto un significado connotativo (abstracto, exhaustivo,
teórico) establecido a partir del análisis, derivación o síntesis de

1003
conceptos. La definición conceptual de un concepto se desarrolla
a partir del marco del estudio y proporciona una relación entre el
marco y la definición operacional de la variable.
Definición operacional Descripción de cómo se medirán o
manipularán en un estudio las variables o conceptos.
Descripción Implica identificar y comprender la naturaleza y
atributos de los fenómenos de enfermería y, en ocasiones, las
relaciones entre ellos.
Destreza clínica Conocimiento y habilidades de los profesionales
sanitarios encargados de la asistencia. En enfermería, la destreza
clínica se ve influida por los años de experiencia clínica, el
conocimiento actual de la investigación y literatura clínica, así
como por la preparación educativa. La práctica basada en la
evidencia es una combinación de la mejor evidencia de
investigación, experiencia clínica y circunstancias del paciente.
Desviación estándar (DE) Medida del grado de dispersión respecto
a la media que caracteriza a una serie de datos; es la raíz
cuadrada de la varianza.
Determinación de los puntos fuertes y débiles de los estudios El
segundo paso de la valoración crítica de estudios para
determinar su calidad. Con el fin de completar este paso, el
investigador debe tener conocimiento de cómo debería ser cada
paso del proceso de investigación según fuentes expertas, como
este texto y otras fuentes de investigación, y comparar los pasos
del estudio con esas fuentes.
Diagramas o gráficas de dispersión Gráficas o figuras que
muestran la dispersión de los valores de una variable o ilustran
la relación de los datos de una variable con los datos de otra. Un
diagrama de dispersión tiene dos escalas, horizontal (eje de
abscisas) y vertical (eje de ordenadas).
Diferencia estandarizada de medias (DEM) Parámetro estadístico
de resumen que está reseñado en un metaanálisis cuando el
mismo resultado se mide con distintas escalas o métodos. La
DEM también se denomina parámetro estadístico d.

1004
Diferencia media Parámetro estadístico estándar que se calcula
para determinar la diferencia absoluta entre las medias de dos
grupos.
Difusión de los hallazgos de la investigación Comunicación de los
hallazgos de la investigación mediante presentaciones y
publicaciones.
Diseño cuasiexperimental Plan de un estudio creado para
determinar la eficacia de las intervenciones cuando algún
aspecto de un experimento no se puede implementar.
Diseño de comprobación de modelos Investigación de correlación
que mide las relaciones propuestas en un modelo teórico. Este
diseño exige medir los conceptos relevantes para el modelo y
examinar las relaciones entre esos conceptos.
Diseño de correlación descriptivo Tipo de diseño utilizado para
describir variables y examinar relaciones presentes en una
situación.
Diseño de correlación predictivo Diseño de correlación utilizado
para establecer la fuerza y dirección de las relaciones entre las
variables; el diseño se aplica con el fin de predecir el valor de
una variable dependiente basándose en los valores obtenidos
para otras variables independientes; estrategia para examinar
relaciones causales entre las variables.
Diseño de grupo control solo postest Diseño experimental en el
que no hay una medición preintervención del valor de la
variable dependiente en los grupos experimental o control.
Diseño de investigación Plan para realizar un estudio; maximiza el
control de los factores que podrían afectar a la validez de los
hallazgos y dirige la planificación y puesta en práctica de un
estudio de tal forma que se alcance la máxima posibilidad de
lograr el objetivo previsto.
Diseño descriptivo Tipo de diseño de estudio cuantitativo
realizado para determinar la prevalencia de una variable y sus
características en un conjunto de datos.

1005
Diseño descriptivo comparativo Diseño empleado para describir
diferencias en el valor de una variable de dos o más grupos en
un entorno natural.
Diseño descriptivo simple Plan para que un estudio examine las
variables en una muestra.
Diseño experimental Tipo de diseño que proporciona la mayor
cantidad de control posible con el fin de examinar la causalidad
en los estudios.
Diseño longitudinal Investigación no intervencional consistente en
recoger datos de los mismos participantes en el estudio en
distintos momentos para determinar un cambio en una variable
a lo largo del tiempo en un grupo definido; también puede
denominarse de mediciones repetidas.
Diseño no experimental Diseño descriptivo y de correlación
dedicado a examinar las variables tal y como aparecen
naturalmente en un entorno, no con la aplicación de un
tratamiento por parte del investigador.
Diseño no intervencional Véase diseño no experimental.
Diseño pretest-postest con grupo control Diseño experimental con
asignación aleatoria de los participantes a los grupos de
intervención y control. Ambos grupos reciben el pretest y,
después de la intervención, el postest; mide el efecto de la
intervención; suele denominarse diseño experimental clásico.
Diseño pretest-postest con grupo de comparación Diseño
cuasiexperimental en el que la intervención se aplica al grupo
experimental después del pretest de los grupos experimental y
de comparación y de un postest después de la implementación
de la intervención; evalúa el efecto de la intervención que puede
medirse (básicamente, un diseño pretest-postest sin asignación
aleatoria a los grupos experimental y de comparación).
Diseño solo postest con grupo de comparación Diseño
cuasiexperimental utilizado para analizar la diferencia entre el
grupo de tratamiento que recibe una intervención y el grupo de
comparación que no la recibe; proporciona un mal control de las

1006
amenazas a la validez interna.
Diseño transversal Tipo de estrategias usadas para examinar
grupos de participantes en diversas etapas de un proceso
simultáneamente, con la intención de inferir tendencias a lo largo
del tiempo. Por ejemplo, los participantes podrían estar en varios
estadios de desarrollo, gravedad de enfermedad o fases de
recuperación, y se describen en las distintas etapas en un
momento dado.
Diseños de estudio de correlación Variedad de diseños de estudio
desarrollados para examinar relaciones entre variables.
Distribución En estadística, la frecuencia relativa con la que una
variable adopta ciertos valores.
Distribución bimodal Dispersión de datos que tiene dos modas
(datos que se producen con más frecuencia).
Distribución de frecuencias Técnica estadística que consiste en
enumerar todos los posibles valores de una variable y calcular el
número de cada valor en el conjunto de datos.
Distribución de frecuencias agrupadas Presentación visual de un
recuento de los valores de las variables divididos en categorías.
Por ejemplo, en lugar de mostrar los números de individuos de
cada edad, los rangos de valores se consideran como grupos (p.
ej., edades de 20-29, 30-39).
Distribución de frecuencias no agrupadas Enumeración de todos
los valores de una variable, con un recuento del número de veces
que el valor se registró en los datos.
Distribuciones de porcentaje Los datos se agrupan y se calculan
los porcentajes para una serie de valores que se encuentran en un
grupo específico, como edades de 20 a 29 = 20% y de 30 a 39 =
12%.
Doble enmascaramiento Estrategia en la que ni los participantes ni
las personas que recogen los datos conocen la asignación del
participante a un grupo. El doble enmascaramiento evita varias
amenazas contra la validez de constructo.

1007
E
Eje horizontal (de abscisas) Eje x en una gráfica de una línea de
regresión o de un diagrama de dispersión que está orientado de
izquierda a derecha en la gráfica.
Eje vertical (de ordenadas) Eje y en una gráfica de una línea de
regresión o de un diagrama de dispersión. El eje vertical se
orienta de arriba hacia abajo en la gráfica.
Ejex Escala horizontal de un diagrama de dispersión. Véase eje
horizontal (de abscisas).
Ejey Escala vertical de un diagrama de dispersión. Véase eje vertical
(de ordenadas).
Elementos en los estudios Personas (individuos o participantes),
acontecimientos, comportamientos o cualquier otra unidad de
análisis en los estudios.
Enciclopedia Recopilación acreditada de información en temas
ordenados alfabéticamente que puede aportar información
general y conducir a otras fuentes, pero rara vez se cita en
artículos académicos y publicaciones.
Engaño Información falsa a los participantes sobre la intención de
un estudio o recogida de datos con propósitos de investigación;
requiere que a los participantes se les revele la verdad o se les
informe del auténtico propósito y de los resultados una vez
finalizada su participación.
Enmascaramiento Ocultación de la asignación del grupo o de otra
información del estudio a los recopiladores de datos,
participantes y sus médicos para reducir los posibles sesgos.
Ensayo controlado aleatorizado (ECA) Evaluación estrechamente
controlada de una intervención en la que se utiliza un diseño de
grupo control pretest-postest u otro diseño experimental para
producir una evidencia definitiva sobre la eficacia de una
intervención. Un ECA puede ser monocéntrico o multicéntrico.
Ensayo y error Estrategia con resultados desconocidos utilizada en
situaciones inciertas cuando no hay otras fuentes de

1008
conocimiento.
Entorno Véase entorno de investigación.
Entorno altamente controlado Entorno creado artificialmente y
cuyo único fin es investigar, como laboratorios, centros
experimentales o de investigación, o unidad de pruebas.
Entorno de investigación Lugar o localización para la realización
de un estudio. Un entorno de investigación puede ser natural,
parcialmente controlado o muy controlado.
Entorno natural Entorno real o de campo para realizar una
investigación en el que el investigador no trata de controlar
variables externas. Los entornos naturales incluyen los hogares,
puesto de trabajo y colegio de los participantes.
Entorno parcialmente controlado Entorno natural que el
investigador ha manipulado o modificado de alguna manera
para controlar los efectos de las variables externas.
Entrevista Comunicación verbal estructurada o no estructurada
entre investigador y participante del estudio en la que se recogen
datos para un estudio.
Entrevista abierta Tipo de entrevista usada en investigación
cualitativa con un centro de interés definido, pero sin secuencia
fija de preguntas. Las preguntas de la entrevista pueden variar a
medida que el investigador conoce más datos por las entrevistas
previas y se anima a los participantes a plantear temas
importantes no abordados por el investigador.
Entrevista estructurada Comunicación entre el investigador y el
participante durante la cual se plantean preguntas
predeterminadas en el mismo orden en todas las entrevistas; se
puede utilizar para recoger datos cualitativos asignando
números a las opciones de respuesta.
Entrevista no estructurada Comunicación entre el investigador y el
participante que comienza con una pregunta general. Se insta a
los participantes a profundizar en un tema, introducir nuevos
temas y, por tanto, a controlar el contenido de la entrevista; suele
usarse para recoger datos cualitativos.

1009
Entrevista semiestructurada Interacción entre un investigador y un
participante guiada por un conjunto predeterminado de
preguntas sin respuestas fijas.
Error de medición Diferencia entre lo que existe en realidad y lo
que es medido por un instrumento de investigación.
Error de medición aleatorio Tipo de error en el que los valores
observados de los individuos varían al azar alrededor de los
verdaderos valores.
Error de medición sistemático Error no aleatorio de medición que
se produce constantemente con la misma magnitud y en la
misma dirección, como una balanza que pesa incorrectamente a
todos los participantes con 1 kg más que el peso real.
Error de tipo I Se produce cuando el investigador concluye que
existe una diferencia significativa entre los grupos cuando en
realidad las muestras no son significativamente diferentes. La
hipótesis nula se rechaza cuando es cierta.
Error de tipo II Se produce cuando el investigador concluye que no
hay una diferencia significativa entre las muestras cuando en
realidad sí existe una diferencia. La hipótesis nula se considera
verdadera cuando, en realidad, es falsa.
Error en las medidas fisiológicas Imprecisión de los instrumentos
fisiológicos relacionada con el entorno, usuarios, participantes en
el estudio, equipo y errores de interpretación.
Escala Forma de medición autoaplicada compuesta por varios
puntos diseñados para medir el constructo en estudio. Los
participantes responden a cada punto del continuum o de la
escala, como en una escala de depresión.
Escala de calificación Método de medición en el que el evaluador
hace una selección, en ocasiones numérica y otras no numérica,
de un conjunto ordenado de categorías predefinidas para
expresar sentimientos, preferencias y otras percepciones
subjetivas. Por ejemplo, la escala del dolor de caras es una escala
de calificación utilizada habitualmente para medir el dolor en los
pacientes pediátricos.

1010
Escala de Likert Tipo de escala diseñada para determinar las
opiniones o actitudes de los participantes del estudio. Contiene
varias frases declarativas, cada una de las cuales se sigue de una
escala de respuesta que oscila de muy de acuerdo a muy en
desacuerdo; se pueden usar otros descriptores en la escala de
respuesta.
Escala sumada Varios puntos de una escala que se suman juntos
para obtener un valor único.
Escala visual analógica Línea de 100 mm con topes en ángulo recto
y palabras o frases descriptivas en cada extremo. Se pide a los
participantes en el estudio que registren la intensidad, magnitud
o fuerza de sus síntomas o actitudes en la línea.
Especificidad Grado en el que una medida fisiológica puede
determinar la ausencia de una enfermedad. Una especificidad
mayor significa que la medida es más precisa.
Especificidad de una prueba de cribado o diagnóstica Proporción
de pacientes sin la enfermedad que obtienen un resultado
negativo en la prueba o verdadero negativo.
Estadística descriptiva Análisis realizados para resumir y
organizar los datos de forma tal que transmitan un significado y
faciliten el conocimiento, como distribuciones de frecuencias y
medidas de tendencia central y dispersión.
Estadística inferencial Análisis realizados para permitir la
inferencia desde el estadístico de la muestra en estudio hasta el
parámetro poblacional; suele realizarse para probar las hipótesis
y abordar las preguntas de investigación en los estudios.
Estándar de cuidados o asistencia de referencia Estándar respecto
al cual se enjuicia la calidad de la asistencia. La asistencia de
referencia se basa en los hallazgos de la investigación junto con
los patrones de práctica actuales. Según Donabedian, la
asistencia de referencia se considera uno de los procesos de
asistencia.
Estilo de práctica Representa las variaciones en el modo de
proporcionar la asistencia.

1011
Estrategia convergente concurrente Diseño de investigación con
métodos mixtos en el que se recopilan datos cualitativos y
cuantitativos simultáneamente, pero se analizan por separado.
Los hallazgos de cada componente se integran durante la fase de
interpretación.
Estrategia explicativa secuencial Diseño de investigación de
métodos mixtos en los que los datos cuantitativos se recogen y se
analizan primero. Los hallazgos cuantitativos se utilizan para
planificar la recogida de datos para la fase cualitativa del estudio
y la extracción de conclusiones.
Estrategia exploratoria secuencial Diseño de investigación de
métodos mixtos en los que los datos cualitativos se recogen y se
analizan primero. Los hallazgos cualitativos se utilizan para
planificar la recogida de datos cuantitativos y la extracción de
conclusiones.
Estructura en los resultados La estructura en los resultados se basa
en la teoría de Donabedian e incluye tres subcomponentes:
profesional de enfermería, organización y paciente.
Estructuras de la asistencia Elementos de la organización y
administración, así como proveedor y características del paciente
que dirigen los procesos asistenciales.
Estudio de caso Análisis a fondo y descripción sistemática de un
paciente o un grupo de pacientes similares con el fin de
promover el conocimiento de las intervenciones, problemas o
situaciones de enfermería. Los estudios de caso son un ejemplo
de la investigación relacionada con la práctica que se realiza en
enfermería.
Estudio de cohortes prospectivo Estudio epidemiológico en el cual
el investigador identifica un grupo de personas en riesgo de
presentar un episodio determinado y después les realiza un
seguimiento a lo largo del tiempo para observar si aparece o no
el episodio.
Estudio de cohortes retrospectivo Estudio epidemiológico en el
cual el investigador identifica un grupo de personas que han

1012
presentado un episodio determinado y estudia sus resultados.
Estudio piloto Versión de menor tamaño de un estudio propuesto
realizado para desarrollar y refinar la metodología, como
intervenciones, instrumentos o procesos de recogida de datos
que se emplearán en el estudio de mayor tamaño.
Estudios de referencia Proyectos fundamentales de investigación
generadores de conocimiento que influyen en una disciplina y a
veces en la sociedad en general.
Estudios de replicación Investigación que reproduce o repite
estudios previos para determinar si se obtendrán hallazgos
similares.
Estudios iniciales Primera investigación realizada sobre un tema
en particular.
Estudios poblacionales Tipo de investigación de resultados que
supone estudiar las condiciones de salud en el contexto de la
comunidad del paciente en vez de en el contexto del sistema
médico. En un estudio poblacional se incluyen todos los casos de
una afección que se producen en la población definida, no solo
los tratados en un centro sanitario en particular.
Etnografía crítica Estudio cualitativo que se centra en los factores
sociológicos y políticos de una cultura.
Etnografía enfocada Observación y descripción de una cultura
organizativa definida, realizadas en un periodo de tiempo más
corto que una etnografía tradicional.
Evaluación de la confianza y del significado de los hallazgos del
estudio Determinación de la credibilidad, transferibilidad,
confiabilidad y auditabilidad de los hallazgos de un estudio
cualitativo.
Evaluación de la credibilidad y del significado de los hallazgos de
estudios Determinación de la validez, fiabilidad, relevancia y
significado de un estudio cuantitativo mediante el examen de las
relaciones entre el proceso del estudio, sus hallazgos y los
estudios previos.

1013
Evaluación económica Análisis y comparación de los costes de
implementación y de los resultados esperados, de tratamientos,
estrategias, enfoques de la práctica u otros procesos asistenciales;
el objetivo deseado es identificar la opción menos costosa con los
mejores resultados.
Evidencia de validez por convergencia Véase validez convergente.
Evidencia de validez por divergencia Véase validez divergente.
Evidencia de validez por grupos de contraste Comprobados
mediante la identificación de grupos que se espera que tengan
distintos valores en un instrumento; también se denominan
validez de grupos conocidos.
Exactitud Grado de concordancia entre el valor medido y el valor
verdadero de la cantidad que se está midiendo.
Exactitud de las medidas fisiológicas Término que aborda el grado
en que el instrumento mide lo que presuntamente mide en un
estudio; comparable a la validez.
Exactitud de una prueba de cribado Las pruebas de cribado
utilizadas para confirmar un diagnóstico son valoradas respecto
a su capacidad de identificar correctamente la presencia o
ausencia de una enfermedad o trastorno, comparada con el
patrón oro.
Exento de revisión Designación otorgada a los estudios que
carecen de riesgos aparentes para las personas de la
investigación o que recogen datos no relacionados con personas
vivas; un representante del comité de revisión institucional (CRI)
debe designar que el estudio cumple los criterios para estar
exento y que no se requiere más revisión por el CRI.
Expectativa del experimentador Amenaza para la validez de
constructo, caracterizada por una creencia de la persona que
recoge los datos que puede fomentar ciertas respuestas de los
individuos en el sentido de respaldar dichas creencias o de
oponerse a ellas.
Experiencia personal Conocimiento alcanzado gracias a la

1014
participación en vez de la observación de funciones, incluidos
acontecimientos, situaciones o circunstancias. Benner (1984)
describió cinco niveles de experiencia en el desarrollo de
conocimientos y destreza en enfermería clínica: 1) principiante,
2) principiante avanzado, 3) hábil, 4) competente y 5) experto.
Experimento Estudio que suele incluir la distribución aleatoria de
los participantes en grupos, la recogida de datos y la realización
de análisis estadísticos. Véase investigación experimental.
Explicación Aclaración de las relaciones entre variables e
identificación de los motivos por los que tienen lugar
determinados acontecimientos.

F
Fabricación de datos en la investigación Tipo de mala praxis
científica en investigación que consiste en inventarse los datos y
registrar o comunicar resultados falsos.
Facilitador Véase moderador.
Factor Constructo hipotético creado por análisis de factores que
representa varios ítems o variables distintas; se le asigna un
nombre para reflejar el centro de interés de las variables
asociadas entre sí.
Falsificación de la investigación Tipo de mala praxis científica
consistente en modificar u omitir datos, alterar el equipo o
interferir con el proceso de investigación; los resultados del
estudio no representan con precisión la realidad.
Falso negativo (resultado) Resultado de una prueba diagnóstica o
de cribado que indica que una enfermedad no está presente
cuando sí lo está.
Falso positivo (resultado) Resultado de una prueba diagnóstica o
de cribado que indica que una enfermedad está presente cuando
no lo está.
Fase I: preparación Etapa que implica determinar el propósito, el
centro de interés y los posibles resultados de realizar un cambio

1015
basado en la evidencia en una institución clínica; comprende el
primer paso en el uso del modelo de Stetler de uso de la
investigación para facilitar la práctica basada en la evidencia.
Fase II: validación Fase del modelo de Stetler de uso de la
investigación para facilitar la práctica basada en la evidencia que
implica la evaluación crítica de los estudios identificados para
determinar su solidez científica.
Fase III: evaluación comparativa/toma de decisiones Fase del
modelo de Stetler de uso de la investigación para facilitar la
práctica basada en la evidencia que tiene cuatro partes: 1)
sustanciación de la evidencia; 2) ajuste de la evidencia en el
entorno sanitario; 3) viabilidad del uso de los hallazgos de la
investigación, y 4) preocupaciones con la práctica actual.
Fase IV: traducción/aplicación Fase del modelo de Stetler de uso
de la investigación para facilitar la práctica basada en la
evidencia que consiste en planificar y determinar exactamente
qué conocimiento se usará y cómo ese conocimiento se aplicará a
la práctica. La aplicación puede ser cognitiva, instrumental o
simbólica.
Fase V: evaluación Fase final del modelo de Stetler de uso de la
investigación para facilitar la práctica basada en la evidencia en
la que el equipo determina el impacto del cambio basado en la
investigación sobre la institución sanitaria, el personal y los
pacientes mediante actividades formales e informales; puede
incluir la automonitorización, estudios de caso, auditorías,
proyectos de mejora de la calidad, así como conversaciones con
pacientes, familias, compañeros y otros profesionales.
Fenómeno Hecho o experiencia de la que una persona es consciente
y puede observar o describir; puede ser el foco de atención de un
estudio cualitativo.
Fenomenología Filosofía y conjunto de métodos de investigación
congruentes con la filosofía mediante los cuales los
investigadores describen y analizan las experiencias vividas
desde la perspectiva de aquellos inmersos en la experiencia.
Fenomenología interpretativa Estudio en el que un investigador

1016
reconoce la influencia de su percepción, experiencias y valores
propios en el análisis de la experiencia vivida de los
participantes; método cualitativo promovido por Heidegger,
filósofo alemán, que también puede denominarse fenomenología
hermenéutica.
Fiabilidad Grado en que un instrumento mide constantemente una
variable o concepto. Véase prueba de fiabilidad.
Fiabilidad de equivalencia Comparación de dos versiones del
mismo instrumento o de dos observadores que miden el mismo
acontecimiento.
Fiabilidad de la consistencia interna Correlación de cada ítem con
todos los demás ítems de una escala para evaluar el grado en el
que los ítems miden el mismo concepto; las correlaciones más
elevadas significan que la escala tiene consistencia; la medida
más frecuente de fiabilidad de la consistencia interna se
denomina alfa de Cronbach.
Fiabilidad de la estabilidad Grado en el que una medición produce
el mismo valor al repetirse; a menudo se denomina fiabilidad test-
retest.
Fiabilidad de la homogeneidad Véase fiabilidad de la consistencia
interna.
Fiabilidad de las formas alternativas Denominada también
fiabilidad de las formas paralelas; prueba de equivalencia que
consiste en comparar los valores de dos versiones del mismo
instrumento.
Fiabilidad interobservador Grado de consistencia entre dos o más
observadores o evaluadores que asignan independientemente
valoraciones a variables o elementos de interés durante un
estudio.
Fiabilidad test-retest Estabilidad de una medición a lo largo del
tiempo; se determina mediante la correlación de los valores de
mediciones repetidas.
Fidelidad de la intervención Precisión, consistencia (fiabilidad) y
rigor con el que una intervención se implementa en un estudio,

1017
con adherencia al protocolo, programa de tratamiento o modelo
de intervención especificado; puede verse afectada por la
competencia del investigador a la hora de implementar el
tratamiento.
Fidelidad del tratamiento Véase fidelidad de la intervención.
Filosofía Exploración intelectual y racional de la verdad; principios
del ser, conocimiento o conducta.
Formato PICOS o PICO Acrónimo de la población o los
participantes de interés, la intervención necesaria para la
práctica, las comparaciones de la intervención con el control, la
asistencia estándar o las variaciones de la misma intervención,
los resultados necesarios en la práctica y el diseño del estudio.
PICOS es uno de los formatos más frecuentes usados para
delimitar una pregunta clínica relevante.
Formulario de consentimiento Documentación escrita o registrada
de otro modo del acuerdo de una persona para participar en un
estudio.
Fuente primaria Publicación cuyo autor creó o es responsable de
generar las ideas publicadas.
Fuente secundaria Fuente cuyo autor resume o cita contenido de
fuentes primarias.
Fuentes actuales Referencias citadas en un artículo de investigación
que se han publicado en los 5 años previos a la fecha de
aceptación del manuscrito del artículo para ser publicado.
Función del personal de enfermería en los resultados La
participación del personal de enfermería en los resultados de un
estudio tiene tres subcomponentes función independiente,
dependiente e interdependiente.
Funciones dependientes del personal de enfermería Funciones
que incluyen la implementación de las órdenes médicas y de los
tratamientos iniciados por el médico; se evalúan por la ausencia
de resultados adversos.
Funciones independientes del personal de enfermería Funciones

1018
que incluyen la evaluación, diagnóstico, intervenciones iniciadas
por el personal de enfermería y cuidados de seguimiento; se
evalúan por los resultados del paciente de control de los
síntomas, ausencia de complicaciones, estado funcional y
autocuidado, conocimiento de la enfermedad y su tratamiento,
satisfacción y costes.
Funciones interdependientes del personal de enfermería
Funciones que incluyen la comunicación, gestión de casos,
coordinación y la continuidad asistencial, monitorización y
comunicación entre los miembros del equipo sanitario.

G
Generalización Extensión de las implicaciones de los hallazgos
desde la muestra o situación estudiada hasta una población o
situación de mayor tamaño.
Grado de legibilidad Grado de dificultad para leer y comprender
un texto, a menudo aplicado a una escala o instrumento de
estudio; puede determinarse contando la longitud de frases u
oraciones, y el número de sílabas de las palabras, o utilizando las
herramientas de evaluación disponibles en los programas de
procesamiento de textos; puede influir en la fiabilidad y validez
cuando se utiliza en un estudio.
Grados de libertad(gl) Libertad de variar que tiene el valor de un
índice, dados los valores de otros índices existentes y la suma
establecida de esos índices; el número de valores que son
realmente independientes (la fórmula varía según la prueba
estadística).
Gráfico de embudo Representación gráfica de posibles magnitudes
del efecto (ME) para las intervenciones en estudios seleccionados
usada en metaanálisis.
Gran teoría de enfermería Teoría abstracta de amplio alcance que
engloba las acciones de enfermería y las respuestas del paciente
en múltiples entornos; las teorías iniciales fueron escritas por
estudiosos de la enfermería en la década de 1970.

1019
Grupo control Grupo de elementos o individuos no expuestos al
tratamiento experimental en un estudio. El término grupo control
se usa cuando los participantes del estudio se asignan de forma
aleatoria al grupo.
Grupo de comparación Grupo que no está expuesto a la
intervención de la investigación. En la investigación de
enfermería, el grupo de comparación suele recibir una asistencia
estándar, de modo que ambos grupos (el de intervención y el de
comparación) reciben tiempo y atención.
Grupo de intervención Véase grupo experimental (o de tratamiento) y
grupo de tratamiento.
Grupo de referencia Grupo de individuos o de otros elementos que
constituye el estándar con el que se comparan los valores de cada
participante individual del estudio.
Grupo de tratamiento Véase grupo experimental (o de tratamiento) y
grupo de intervención.
Grupo experimental (o de tratamiento) Participantes del estudio
que están expuestos al tratamiento de investigación o a una
intervención en un estudio.
Grupos dependientes Véase grupos emparejados (o dependientes).
Grupos emparejados (o dependientes) Participantes u
observaciones seleccionados para la recogida de datos que están
relacionados de alguna forma con la selección de otros
participantes u observaciones. Por ejemplo, si los participantes
del estudio actúan como su propio control utilizando la situación
pretest como grupo control, las mediciones (y, por tanto, los
grupos) están emparejadas.
Grupos focales Método de recogida de datos cualitativos
recabando las percepciones de los participantes organizados en
un grupo; el facilitador orienta la discusión y crea un entorno no
amenazante.
Grupos independientes Grupos en los que los participantes en el
estudio se asignan a un grupo o condición o a otro, de modo que

1020
la asignación no está relacionada. Por ejemplo, si se asigna
aleatoriamente a los participantes al grupo de intervención o de
control, los grupos son independientes.
Guías basadas en la evidencia Véase guías de práctica basada en la
evidencia.
Guías de práctica basada en la evidencia Guías clínicas explícitas y
rigurosas basadas en la mejor evidencia de investigación
disponible (p. ej., hallazgos de revisiones sistemáticas,
metaanálisis, revisiones sistemáticas con métodos mixtos,
metasíntesis y ensayos clínicos de gran tamaño); están
respaldadas por el consenso de expertos nacionales reconocidos
y confirmadas por los resultados obtenidos por los clínicos.

H
Hallazgos Resultados traducidos e interpretados de un estudio.
Health Insurance Portability and Accountability Act (HIPAA) Ley
federal que protege la información referente a la salud de un
individuo generada durante la asistencia clínica, almacenada
electrónicamente y transferida de una entidad a otra; conocida
como norma de privacidad, influye en la asistencia sanitaria y la
investigación.
Hipótesis Declaración formal de la relación esperada entre dos o
más variables en una población concreta.
Hipótesis asociativa Afirmación de una relación no causal
propuesta entre variables. Las variables de esta hipótesis
aparecen o tienen lugar juntas en el mundo real, de modo que
cuando una variable cambia también lo hace la otra, sin que esto
suponga una relación causa-efecto entre variables.
Hipótesis causal Relación entre dos variables, en la cual una de
ellas (variable independiente) presuntamente causa o determina
la presencia de la otra (variable dependiente). Algunas hipótesis
causales pueden incluir más de una variable independiente o
dependiente.
Hipótesis compleja Hipótesis que predice la relación (asociativa o

1021
causal) entre tres o más variables; por este motivo, la hipótesis
puede incluir dos (o más) variables independientes y/o dos (o
más) variables dependientes.
Hipótesis comprobable Hipótesis que contiene variables que
pueden ser medidas o manipuladas en el mundo real.
Hipótesis de investigación Hipótesis alternativa a la hipótesis
nula. Declara que existe una relación entre dos o más variables o
una diferencia entre los grupos.
Hipótesis direccional Afirmación que predice la dirección (positiva
o negativa) de la relación entre dos o más variables.
Hipótesis estadística Véase hipótesis nula (H0).
Hipótesis no direccional Tipo de hipótesis que establece la
presencia de una relación, pero que no predice su naturaleza
exacta (positiva o negativa o fuerza).
Hipótesis nula (H0) Hipótesis opuesta a la hipótesis de la
investigación, que establece que no existe una diferencia
significativa entre los grupos del estudio o que no existen
relaciones significativas entre las variables estudiadas. La
hipótesis nula se comprueba durante el análisis de datos y se
utiliza para interpretar los resultados estadísticos.
Hipótesis simple Afirmación de la existencia de una relación
(asociativa o causal) entre dos variables.
Historia Acontecimiento no planificado que se produce durante un
estudio y que puede ser una amenaza para la validez interna.

I
Identificación de los pasos del proceso de investigación Primer
paso de la valoración crítica. Consiste en comprender los
términos y conceptos del informe, así como identificar los
elementos del estudio y captar la naturaleza, relevancia y
significado de dichos elementos.
Identificadores digitales de objetos (DOI) Serie única de números

1022
y letras relacionada con un artículo o publicación específica; los
DOI son promovidos por la International Standards
Organization (http://www.doi.org/), pero aún no han logrado un
respaldo universal.
Implicaciones para enfermería Significado de los hallazgos y
conclusiones del estudio para el cuerpo de conocimiento de
enfermería, su teoría y práctica.
Importancia clínica Relevancia práctica de un hallazgo estadístico
positivo en un estudio; aborda la pregunta: «¿Esto supondrá una
diferencia significativa para la experiencia o resultados del
paciente?».
Individuos Personas que participan en un estudio (aquellas que
son estudiadas), en ocasiones denominadas participantes.
Inferencia Generalización desde un caso específico hasta una
verdad general, de la parte al todo, de lo concreto a lo abstracto o
de lo conocido a lo desconocido.
Información privada identificable Características documentadas
de una persona y de su vida que pueden relacionarse con la
persona.
Información sanitaria protegida Datos generados y recogidos para
una investigación que pueden relacionarse con un individuo.
Informante clave Participante en un estudio etnográfico con
extensos conocimientos e influencia en una cultura con quien el
investigador puede interactuar de forma repetida para aprender
sobre la cultura.
Informe Belmont Declaración de principios éticos de investigación
desarrollada en Estados Unidos en respuesta al estudio de
Tuskegee sobre la sífilis; proporcionó guías para seleccionar a los
participantes, como informarles de los riesgos y beneficios, y
documentar su consentimiento.
Informe de investigación Descripción por escrito de un estudio
completo diseñado para comunicar los hallazgos del estudio de
forma eficaz a profesionales de enfermería y otros profesionales
sanitarios.

1023
Informe de investigación cualitativa Informe escrito que consta de
una introducción, revisión de la literatura, métodos, resultados y
discusión de los hallazgos de un estudio cualitativo.
Informe de investigación cuantitativa Informe escrito que consta
de una introducción, revisión de la literatura, métodos,
resultados y discusión de los hallazgos de un estudio
cuantitativo.
Inmersión Estar en una cultura y familiarizarse cada vez más con el
idioma, patrones, expresión de emociones y métodos de
socialización de la cultura; también puede referirse a la
familiarización creciente de los investigadores con los datos
cualitativos mediante la dedicación de mucho tiempo a leer y
releer las notas de campo y transcripciones, y en reflexionar
sobre el significado de los datos. Véase inmersión en los datos.
Inmersión en los datos Término del análisis de datos cualitativos
usada para indicar que el investigador ha empleado mucho
tiempo en la lectura y reflexión de los datos.
Instrumentación Componente de la medición que implica la
aplicación de normas específicas para desarrollar un dispositivo
o instrumento de medición.
Interpretación Proceso por el cual el investigador sitúa los
hallazgos en un contexto mayor; puede relacionar distintos
temas o factores de los hallazgos entre sí y con el conocimiento
existente.
Interpretación de los resultados de investigación Proceso formal
por el cual los investigadores consideran los resultados del
análisis de datos, forman conclusiones, analizan la importancia
clínica de los hallazgos, consideran las implicaciones para el
conocimiento y teoría de enfermería, generalizan o transfieren
los hallazgos y plantean más estudios.
Intersección con el ejey (ordenada en el origen) Punto de
intersección entre la línea de regresión y el eje y. En este punto
de la línea de regresión, x = 0.
Intervalo de confianza Probabilidad de incluir el valor de la

1024
población entre unas estimaciones superior e inferior de un
intervalo; suele calcularse para intervalos del 95% o del 99%.
Intervención Tratamiento o variable independiente que se
implementa durante la realización de un estudio para producir
un efecto sobre las variables dependientes o de resultados.
Intervención de enfermería Actividades cognitivas, físicas o
verbales deliberadas planificadas junto o en nombre de
individuos y sus familias que se dirigen a lograr objetivos
terapéuticos particulares relacionados con la salud y el bienestar
de los individuos.
Intuición Conocimiento íntimo o comprensión de una situación o
un acontecimiento como un todo que por lo general no puede
explicarse lógicamente.
Invasión de la privacidad Compartir información privada con
otros sin el conocimiento del interesado o en contra de sus
deseos.
Investigación Búsqueda o exploración diligente y sistemática con el
fin de validar y perfeccionar el conocimiento existente y generar
nuevos conocimientos.
Investigación aplicada Investigación científica realizada para
generar conocimiento que tiene el potencial de influir
directamente en la práctica clínica.
Investigación básica (pura) Investigaciones científicas en busca del
«conocimiento por el propio conocimiento» o por el placer de
aprender y descubrir la verdad.
Investigación cualitativa Enfoque metodológico académico y
subjetivo utilizado para describir las experiencias vitales,
culturas y procesos sociales desde la perspectiva de las personas
implicadas.
Investigación cualitativa exploratoria-descriptiva Estudios que no
identifican un método o enfoque filosófico específico; a menudo
están motivados por el deseo de resolver un problema; se realiza
en entornos naturalistas.

1025
Investigación cuantitativa Proceso formal, objetivo y sistemático
de investigación usado para describir variables usando números,
comprobar las relaciones entre ellas y examinar interacciones de
causa y efecto entre las variables.
Investigación cuasiexperimental Tipo de investigación cuantitativa
realizada para evaluar una relación causa-efecto, pero que carece
de los tres elementos esenciales de la investigación experimental:
1) manipulación controlada por el investigador de la variable
independiente (intervención), 2) grupo control tradicional y 3)
asignación aleatoria de los participantes del estudio a los grupos.
Investigación de correlación Investigación sistemática de las
relaciones entre dos o más variables con el fin de explicar la
naturaleza de las relaciones en el mundo real; no examina causas
y efectos.
Investigación de enfermería Proceso científico de investigación
que puede generar nuevo conocimiento o valida y perfecciona el
conocimiento existente; los hallazgos influyen directa e
indirectamente en la aplicación de la práctica enfermera basada
en la evidencia.
Investigación de etnoenfermería Tipo de investigación que surgió
de la Teoría de Enfermería Transcultural de Leininger; dedicada
fundamentalmente a observar y documentar cómo las
condiciones y los patrones de la vida cotidiana influyen en la
asistencia sanitaria, la salud y las prácticas de cuidados de
enfermería.
Investigación de métodos mixtos Metodología de investigación
que ofrece a los investigadores la capacidad de utilizar los
puntos fuertes de los diseños de investigación cualitativos y
cuantitativos en un estudio. La investigación de métodos mixtos
se caracteriza por ser un tipo de investigación que contiene
elementos de los enfoques cualitativo y cuantitativo.
Investigación de resultados Metodología científica desarrollada
para examinar los resultados finales de la asistencia a pacientes.
A diferencia de las iniciativas científicas clásicas, la investigación
de resultados incorpora perspectivas de la investigación de

1026
evaluación, epidemiología y teoría económica.
Investigación de teoría fundamentada Método de investigación
inductivo basado en la teoría de la interacción simbólica; se lleva
a cabo con el fin de explorar y analizar el proceso que utilizan las
personas para gestionar una situación o problema específico.
Idealmente, el estudio da lugar a una descripción teórica o
diagrama del proceso.
Investigación descriptiva Investigación que proporciona una
caracterización o explicación precisa de las características de una
persona, acontecimiento o grupo específico en una situación de
la vida real; investigación realizada con el fin de descubrir
nuevos significados, describir lo que existe, determinar la
frecuencia con que sucede algo y categorizar la información.
Investigación etnográfica Metodología de investigación cualitativa
para estudiar culturas. La investigación consiste en la recogida,
descripción y análisis de los datos con el fin de desarrollar una
descripción de una cultura.
Investigación experimental Investigación controlada, objetiva y
sistemática realizada para examinar la causalidad. Se caracteriza
por los siguientes aspectos: 1) manipulaciones de la variable
independiente controladas por el investigador; 2) presencia de
un grupo control específico, y 3) asignación aleatoria de los
participantes a la condición del experimento o de control.
Investigación fenomenológica Estudio cualitativo centrado en las
experiencias vividas de los participantes desde su perspectiva.
Investigación fenomenológica descriptiva Estudio de
investigación en el que un investigador deja de lado su
percepción, experiencia y valores propios relacionados con un
fenómeno para describir la experiencia vivida de los
participantes; método cualitativo defendido por Husserl (filósofo
alemán que estableció la escuela de la fenomenología).
Investigación no terapéutica Tipo de investigación realizada para
generar conocimiento de una disciplina; los resultados podrían
beneficiar a futuros pacientes, pero no es probable que beneficien
a los participantes de la investigación.

1027
Investigación terapéutica Estudios que proporcionan al paciente la
oportunidad de recibir un tratamiento experimental que podría
tener resultados beneficiosos.
Investigación traslacional Concepto en evolución definido por los
National Institutes of Health (NIH) como la traducción de
descubrimientos científicos básicos en aplicaciones prácticas.

L
Lectura de informes de investigación Método de lectura que
incluye la lectura rápida entresacando los datos importantes,
comprensión y análisis del contenido de un estudio para
fomentar la comprensión.
Lectura rápida de informes de investigación Revisión rápida de
una fuente para lograr una perspectiva global del contenido
leyendo el título, nombre del autor, resumen o introducción,
encabezamientos, una o dos frases de cada encabezamiento y la
sección de discusión.
Libro de texto Monografía o libro considerado la referencia para el
estudio de una materia determinada; puede servir como fuente
de información para un curso académico.
Limitaciones Aspectos o debilidades de un estudio que amenazan
a la validez del diseño y disminuyen la capacidad de
generalización de los hallazgos; entre los ejemplos, se encuentran
las muestras no representativas, entorno único, control limitado
sobre la intervención, instrumentos con fiabilidad y validez
limitadas, control limitado sobre la recogida de datos y uso
inadecuado de los análisis estadísticos.
Limitaciones metodológicas Véase limitaciones.
Línea de tendencia El mejor reflejo de los valores en el diagrama de
dispersión. Se traza la línea de regresión que mejor se ajusta a
todos los valores de variables emparejadas.
Literatura Todas las fuentes escritas relevantes para el tema elegido
por el investigador, incluidos artículos publicados en revistas o

1028
publicaciones periódicas, publicaciones en internet, monografías,
enciclopedias, trabajos de conferencias, trabajos de fin de máster,
tesis, revistas clínicas, libros de texto y otros libros.
Literatura basada en datos Compuesta por informes de
investigación, tanto los publicados en revistas y libros impresos
o en línea como trabajos no publicados, por ejemplo, tesis de fin
de máster y tesis.
Literatura empírica Estudios relevantes publicados en revistas,
libros y en internet, así como estudios no publicados, como
trabajos de fin de máster y tesis doctorales.
Literatura gris Publicaciones de investigación que tienen una
distribución limitada, como trabajos de fin de máster y tesis,
informes de investigación no publicados, artículos en revistas de
escasa distribución, informes dirigidos a las agencias
patrocinadoras, informes técnicos y resúmenes, artículos y actas
de conferencias.
Literatura relevante Publicaciones pertinentes que proporcionan
información importante necesaria para sintetizar el estado del
cuerpo de conocimientos en un área problemática.
Literatura teórica Análisis de conceptos, mapas conceptuales,
teorías y marcos teóricos conceptuales que respaldan un
problema de investigación seleccionado y su propósito.

M
Maduración Amenaza a la validez interna debido a los cambios
normales que se producen a lo largo del tiempo durante un
estudio y que pueden afectar a la variable dependiente; los
participantes en el estudio podrían fatigarse o aprender con el
tiempo, lo que provoca modificaciones en sus valores de la
variable dependiente.
Magnitud del efecto Grado en que el fenómeno estudiado está
presente en la población o en el que la hipótesis nula es falsa. En
el análisis de relaciones, es el grado o magnitud de la asociación
entre variables; también se refiere a la eficacia de una

1029
intervención en la investigación cuasiexperimental y
experimental.
Mala praxis investigadora Desviación voluntaria de las prácticas
habitualmente aceptadas en la comunidad científica para
proponer, realizar o comunicar investigaciones; puede consistir
en invención, falsificación o plagio; no incluye los errores sin
mala fe ni diferencias honestas en la interpretación o juicio de los
datos.
Manipulación Modificación del valor o aspectos de la variable
independiente para medir su efecto sobre la variable
dependiente.
Mapas o modelos conceptuales Diagramas que muestran
gráficamente los conceptos y relaciones de teorías o marcos de
investigación.
Marco de investigación Estructura abstracta y lógica de significado
que guía el desarrollo de un estudio y le permite al investigador
relacionar los hallazgos con el cuerpo de conocimientos; puede
ser una parte de una teoría o variables relacionadas en estudios
previos.
Marco de muestreo Lista de todos los miembros de la población
diana. Los criterios de muestreo se utilizan para definir la
pertenencia a la población.
Marco implícito Ideas conceptuales que guían un estudio, pero que
no están claramente conectadas o descritas como una teoría, a
menudo incluidas en una introducción o en una revisión de la
literatura como relaciones entre variables o hallazgos de estudios
anteriores.
Marco teórico Estructura de significado abstracta y lógica, como
una parte de una teoría, que dirige el desarrollo del estudio, se
puede poner a prueba en el estudio y permite al investigador
relacionar los hallazgos con el cuerpo de conocimiento de
enfermería.
Media Medida de tendencia central obtenida mediante una
medición a nivel de intervalos y racional; cifra obtenida

1030
sumando todos los valores y dividiendo el total por el número
de valores.
Mediana Valor que ocupa el centro exacto de la distribución de
frecuencias ordenadas no agrupadas; cuando el número de
puntos de datos es par, el valor de la mediana es la media de los
dos valores centrales.
Medición Proceso de asignación de valores a objetos,
acontecimientos o situaciones de acuerdo con ciertas normas.
Medición observacional Uso de observaciones estructuradas y no
estructuradas para medir variables del estudio.
Medida de intervalo Cuantificación que utiliza distancias
numéricas iguales entre los intervalos; cumple las normas de
categorías mutuamente excluyentes, categorías exhaustivas y
orden jerárquico, como la temperatura o las puntuaciones en las
escalas.
Medida o valor verdadero Valor que se obtendría si no se hubiesen
producido errores de medición. En teoría, siempre se produce
algún error de medición cuando se usa una muestra para estimar
un parámetro poblacional.
Medidas de dispersión Análisis estadísticos para determinar el
modo de variación o de dispersión de los valores alrededor de la
media; estos análisis incluyen el rango, valores de diferencias,
suma de cuadrados, varianza y desviación estándar.
Medidas de tendencia central Análisis estadísticos para determinar
el centro de una distribución de valores; incluyen la moda,
mediana y media.
Medidas directas Medidas utilizadas para la cuantificación de
variables simples y concretas, como estrategias para medir la
altura, peso o temperatura.
Medidas fisiológicas Técnicas y equipo utilizados para medir
variables fisiológicas de forma directa o indirecta, como las
técnicas para medir la presión arterial y la frecuencia cardiaca.
Medidas o indicadores indirectos Cuantificación de conceptos

1031
abstractos que se miden por el grado en el que los indicadores o
atributos de los conceptos están presentes. Las escalas son
ejemplos de medidas indirectas, como el uso de la escala de caras
para medir el dolor.
Mejor evidencia de investigación Conocimiento empírico más
sólido disponible en áreas de promoción de la salud, prevención
de la enfermedad y la evaluación, diagnóstico y tratamiento de
enfermedades agudas y crónicas. Se obtiene por la realización y
síntesis de numerosos estudios de alta calidad. La práctica
basada en la evidencia es una combinación de la mejor evidencia
de investigación, experiencia clínica y circunstancias del
paciente.
Metaanálisis Técnica estadística realizada para agrupar los datos y
resultados de varios estudios en un único análisis cuantitativo;
proporciona uno de los niveles de evidencia más altos (efecto de
una intervención o fuerza de una relación) para la práctica. Los
estudios deben compartir un diseño similar para incluirlos en el
análisis.
Metasíntesis, cualitativa Recopilación e integración sistemática de
estudios cualitativos para aumentar la comprensión y desarrollar
una interpretación única de los hallazgos de estudios en un área
seleccionada.
Metasumario, cualitativo Síntesis de múltiples estudios
cualitativos primarios para desarrollar una descripción del
conocimiento actual en un área.
Método de muestreo Proceso de selección de un grupo de
personas, acontecimientos, comportamientos u otros elementos
que cumplen los criterios de muestreo. Los métodos de muestreo
pueden ser aleatorios o no aleatorios (probabilísticos y no
probabilísticos).
Método de muestreo aleatorio Véase método de muestreo
probabilístico.
Método de muestreo probabilístico Técnica de muestreo aleatoria
en la que cada miembro (elemento) de la población tiene una
probabilidad mayor que cero de ser seleccionado para la

1032
muestra, como sucede en el muestreo aleatorio simple, aleatorio
estratificado, por conglomerados y sistemático.
Moda Cifra o valor que aparece con mayor frecuencia en una
distribución que no indica necesariamente el centro del rango.
Modelado de roles Aprendizaje mediante la imitación de la
conducta de un modelo ejemplar o de rol. Por ejemplo, en un
programa de internado, los profesionales de enfermería
principiantes aprenden imitando los comportamientos de los
expertos.
Modelo conceptual Conjunto de constructos relacionados de gran
abstracción que explica a grandes rasgos fenómenos de interés o
expresa presunciones; suele reflejar una postura filosófica.
Modelo de Grove para implementar en la práctica las guías
basadas en la evidencia Modelo desarrollado por uno de los
autores del libro para fomentar el uso en la práctica de guías
nacionales, estandarizadas y basadas en la evidencia.
Modelo de Iowa de práctica basada en la evidencia (PBE) Marco
teórico para la implementación de la PBE que se revisó y validó
por el Iowa Model Collaborative en 2017. En las agencias
sanitarias, hay elementos activadores que inician la necesidad de
cambio; se necesita una evidencia significativa para realizar el
cambio, este debe ser apropiado para la práctica y el cambio
debe integrarse y mantenerse en la práctica.
Modelo de Stetler de uso de la investigación para facilitar la
práctica basada en la evidencia Modelo que proporciona un
marco teórico exhaustivo que fomenta el uso de los hallazgos de
la investigación por parte del personal de enfermería a medida
que implementan la práctica basada en la evidencia.
Moderador Conductor de la discusión en un grupo focal; no
siempre es el investigador.
Molestias y daños Grado de riesgo potencial y real experimentado
por un participante en un estudio; los riesgos pueden ser físicos,
psicológicos, económicos, emocionales o una combinación de
ellos.

1033
Monografías Libros, cuadernillos de actas de conferencias o folletos
que pueden publicarse una vez para un fin específico; se pueden
actualizar con nuevas ediciones, si es preciso.
Muestra Subgrupo de la población seleccionado para un estudio.
Muestra heterogénea Muestra en la que los participantes presentan
un intervalo amplio de los valores en estudio; aumenta la
representatividad de la muestra y la capacidad de generalizar
desde la población accesible a la población diana.
Muestra homogénea Muestra en la que los valores de los
participantes en un estudio en métodos de medición
seleccionados de un estudio son similares, lo que da como
resultado una distribución o dispersión limitada o estrecha de
los valores. El uso de una muestra homogénea reduce el efecto
de las variables externas, pero limita el potencial de
generalización debido a que la muestra podría no ser
representativa de la población diana.
Muestreo Proceso de selección de un grupo de personas,
acontecimientos, comportamientos u otros elementos que son
representativos de la población estudiada.
Muestreo aleatorio estratificado Método usado cuando el
investigador sabe que algunas de las variables en la población
son esenciales para lograr la representatividad. La muestra se
divide en estratos o grupos empleando esas variables
identificadas y los participantes se seleccionan aleatoriamente a
partir de cada estrato.
Muestreo aleatorio simple Selección al azar de participantes o
elementos del marco de muestreo para su inclusión en un
estudio. Cada participante en el estudio tiene una probabilidad
mayor que cero de ser seleccionado para su inclusión en el
estudio.
Muestreo de bola de nieve Véase muestreo por redes.
Muestreo deliberado (o intencional) Selección de participantes que
poseen ciertas características, como tener experiencia o ser
conocedores de la cultura o fenómeno para un estudio

1034
cualitativo. El investigador selecciona los participantes
conscientemente, por lo que este método de muestreo es no
probabilístico o no aleatorio.
Muestreo no probabilístico Técnica de muestreo no aleatorio en el
que no todos los elementos de la población tienen ocasión de ser
elegidos, como muestreo por conveniencia, cuotas, intencionado,
por redes y teórico.
Muestreo por conglomerados Método de muestreo en el que se
desarrolla un marco teórico que incluye una lista de todas las
localizaciones, instituciones u organizaciones (conglomerados)
que podrían utilizarse en un estudio porque las identidades de
los participantes individuales se desconocen; de esa lista se
extrae una muestra aleatorizada.
Muestreo por conveniencia Técnica de muestreo no probabilístico
en la que las personas que se incluyen en el estudio estaban en el
lugar correcto en el momento adecuado, con la adición de
individuos disponibles hasta alcanzar el tamaño muestral
deseado; también denominado «muestreo accidental».
Muestreo por cuotas Técnica de muestreo por conveniencia no
probabilístico en la que la proporción de grupos identificados
está predeterminada por el investigador para aumentar la
representatividad de la muestra de la población. El muestreo por
cuotas puede utilizarse para asegurar la inclusión de
participantes en el estudio que probablemente estén
infrarrepresentados en la muestra por conveniencia, como
mujeres, minorías y personas sin instrucción.
Muestreo por redes Técnica de muestreo no probabilístico que
incluye una técnica de bola de nieve para aprovechar las redes
sociales y el hecho de que los amigos suelen tener características
en común. Se pide a los participantes que cumplen los criterios
de la muestra que ayuden a localizar a otros con características
similares. El muestreo por redes es sinónimo de muestreo en
cadena y de muestreo de bola de nieve.
Muestreo sistemático Muestreo realizado cuando se dispone de
una lista ordenada de todos los miembros de la población;

1035
implica la selección de cada x.° (valor determinado por el
investigador) individuo de la lista, utilizando un punto
seleccionado al azar.
Muestreo teórico Método de muestreo utilizado a menudo durante
los estudios de teoría fundamentada; implica el reclutamiento de
participantes elegibles basándose en su capacidad de hacer
progresar la teoría emergente.
Multicausalidad Reconocimiento de que un número de variables
interrelacionadas pueden causar un efecto determinado.

N
Nivel de medida nominal Nivel inferior de cuantificación utilizado
cuando los datos pueden organizarse en categorías excluyentes y
exhaustivas, pero las categorías no se pueden comparar ni
ordenar jerárquicamente. Las variables como el sexo, raza,
estado civil y diagnósticos se miden a nivel nominal.
Nivel de medida ordinal Método por el cual los datos son
asignados a categorías mutuamente excluyentes y exhaustivas.
Una categoría se considera (o se ordena jerárquicamente)
superior o inferior, o mejor o peor, que otra. Los intervalos entre
los datos jerarquizados no son necesariamente iguales, como
cuando el dolor se clasifica en leve, moderado e intenso.
Nivel de medida racional o de razón Forma más elevada de
medición que cumple todas las reglas de los demás niveles de
medición: categorías mutuamente excluyentes y exhaustivas,
jerarquía ordenada, intervalos de igual cuantía y una línea
continua de valores; también tiene un cero absoluto, como el
pulso.
Nivel de significación estadística Véase alfa (α).
Niveles de medición Grupo organizado de normas para asignar
números a objetos de modo que se establezca una jerarquía de la
medición, de menor a mayor. Los niveles de medición son
nominales, ordinales, de intervalos y racional.
Notas de campo Anotaciones realizadas por investigadores

1036
cualitativos durante o justo después de la recogida de datos.
Nursing Care Report Card Evaluación de la asistencia de
enfermería hospitalaria desarrollada en 1994 por la American
Nurses Association y el American Academy of Nursing Expert
Panel on Quality Health Care con la finalidad de identificar y
desarrollar medidas de calidad sensibles a enfermería utilizando
10 indicadores (dos indicadores de estructura, dos indicadores
de proceso y seis indicadores de resultado). Esta report card
podría facilitar las comparativas o fijar un estándar deseable que
permita las comparaciones entre hospitales respecto a la calidad
de sus cuidados de enfermería.

O
Objetivo de la investigación Declaración clara y concisa expuesta
para dirigir un estudio; se centra en identificar y describir
variables y relaciones entre las variables.
Observación Método fundamental de recogida de datos para los
estudios cualitativos, especialmente de los estudios etnográficos,
dedicando tiempo y centrándose en la comunicación y las
acciones en una cultura.
Observación no estructurada Observación espontánea y registro de
lo observado con una planificación mínima; suele usarse para
recoger datos cualitativos.
Observaciones estructuradas Identificación clara de qué
comportamientos son de interés y se traducirán en datos; las
observaciones se definen, registran y codifican con precisión.
Obtención de datos encubierta Información sobre los participantes
en la investigación que se recopila sin su conocimiento o
conciencia.

P
Palabras clave Términos o etiquetas utilizadas que son los
principales conceptos, variables o metodologías de investigación

1037
que se enumeran en el cuerpo inicial de un informe de
investigación; se pueden utilizar para realizar búsquedas en
bases de datos bibliográficas con el fin de encontrar artículos
sobre un tema en particular.
Paráfrasis Replantear clara y concisamente las ideas de un autor
con las propias palabras del investigador.
Parámetro Valor numérico desconocido de una característica de
una población. Los parámetros de la población se estiman
mediante estadística.
Parámetro estadístico de resumen Véase estadística descriptiva.
Participantes Individuos que participan voluntariamente en un
estudio. Los investigadores cualitativos utilizan este término; los
investigadores cuantitativos pueden referirse a estas personas
como individuos o participantes.
Patrón de práctica Representa las variaciones de la asistencia que se
proporciona.
Patrón oro Referencia aceptada para evaluar y diagnosticar
actualmente un problema particular de un paciente; sirve de
base de comparación con las pruebas diagnósticas o de cribado
recientemente desarrolladas; también es el patrón oro o
referencia para gestionar la asistencia de los pacientes que se
relaciona con los resultados de estos.
Periodo de lavado Cantidad de tiempo que se requiere para que los
efectos de una intervención se disipen y para que el participante
en el estudio regrese a su estado basal.
Permiso para participar en una investigación Documentación que
un(os) progenitor(es) o tutor concede para la participación de su
hijo o tutelado en un estudio.
Placebo En farmacología, sustancia sin efecto perceptible que se
administra a un grupo control en los estudios. En un sentido más
amplio, una intervención destinada a no tener ningún efecto.
Plagio Utilización de las ideas, procesos, resultados o palabras de
otra persona sin otorgarle el crédito debido; es un tipo de mala

1038
praxis en investigación.
Plan de muestreo Incluye las estrategias propuestas que deben
utilizarse para obtener una muestra en un estudio; puede
englobar los métodos de muestreo aleatorios y no aleatorios
(probabilísticos y no probabilísticos).
Población Grupo particular de elementos (personas, objetos,
acontecimientos o sustancias) que es el centro de interés del
estudio.
Población accesible Proporción de la población diana a la que el
investigador tiene un acceso razonable.
Población diana Todos los elementos (individuos, objetivos o
acontecimientos) que cumplen los criterios de muestreo para su
inclusión en el estudio y a los que podrían generalizarse los
hallazgos del estudio.
Poblaciones vulnerables Participantes potenciales de una
investigación que son más susceptibles a una influencia o
coerción indebida, como niños, reclusos y personas
económicamente desfavorecidas.
Porcentaje de varianza Grado de variabilidad que se explica por
una relación lineal. El valor se obtiene mediante el coeficiente de
correlación de Pearson (r). Por ejemplo, si r = 0,5 en un estudio, el
porcentaje de varianza explicada es r2 = 0,25 o 25%.
Potencia Probabilidad de que una prueba estadística detecte una
diferencia significativa o relación en caso de existir, que es la
capacidad de rechazar una hipótesis nula correctamente.
Potencia estadística baja La potencia para detectar relaciones y
diferencias significativas es menor que el estándar aceptable de
0,8 necesario para realizar un estudio. Una potencia estadística
baja aumenta la probabilidad de un error tipo II.
Práctica basada en la evidencia (PBE) Método de práctica que
consiste en la integración consciente de la mejor evidencia de
investigación con la experiencia clínica y las circunstancias y
valores de los pacientes para producir resultados sanitarios de

1039
calidad.
Precisión Exactitud con la que han sido estimados los parámetros
de población en un estudio; también se usa para describir la
exactitud, detalle y orden de un propósito de investigación y una
descripción detallada del diseño del estudio.
Precisión de una medición fisiológica Exactitud y
reproducibilidad de mediciones de características o funciones del
cuerpo, como el peso, presión arterial y pulso.
Predicción Estimación de la probabilidad de un resultado
específico en una situación determinada que puede alcanzarse
mediante la investigación.
Pregunta de investigación Frase interrogativa concisa desarrollada
para dirigir un estudio; Las preguntas de investigación
cuantitativa se centran en describir variables, examinar las
relaciones entre variables y determinar las diferencias entre dos
o más grupos; las preguntas de investigación cualitativa
identifican los conceptos o fenómenos principales que debe
abordar el estudio.
Principio de beneficencia Principio ético de hacer el bien y no
exponer a los demás al daño. En investigación, esto significa
minimizar los riesgos, garantizar los beneficios y mantener la
integridad del estudio.
Principio de justicia Principio ético de tratamiento con equidad; en
relación con los estudios, las oportunidades de participar, lograr
beneficios y ser protegido del daño se distribuyen
equitativamente.
Principio de respeto por las personas Principio ético de tratar a las
personas como entes autónomos que pueden decidir o no
participar en la investigación y abandonar un estudio en
cualquier momento. La confidencialidad y el consentimiento
informado se basan en este principio.
Principios éticos Normas de conducta apropiada aplicables a la
investigación, que consisten en respetar a los demás, hacer el
bien y tratar a los demás de forma justa.

1040
Privacidad Libertad para decidir el momento, alcance y
circunstancias generales bajo las cuales la información privada
será compartida con otros u ocultada.
Probabilidad Posibilidad de que se produzca un acontecimiento
determinado en una situación; hace referencia a la causalidad
relativa de los acontecimientos, más que a la absoluta. En
estadística, es la probabilidad porcentual de que los resultados
de la prueba estadística indiquen que la muestra representa en
realidad a la población de la que se ha extraído.
Problema de investigación Área de interés en la que no está
completa la base de conocimientos necesaria para la práctica
enfermera. Se realiza una investigación con el fin de generar
conocimientos esenciales con los que abordar el problema en la
práctica, con el objetivo último de lograr la práctica basada en la
evidencia. El problema de investigación de un estudio tiene que
incluir relevancia, antecedentes y declaración del problema.
Procedimiento de Bonferroni Análisis post hoc para determinar
diferencias entre tres o más grupos sin aumentar el error tipo I;
cuando un diseño implica múltiples comparaciones, el
procedimiento puede utilizarse durante la fase de planificación
de un estudio para ajustar el nivel de significación de modo que
no se aumente el error tipo I.
Proceso Serie lógica y estructurada de acciones con un objetivo
definido.
Proceso asistencial Constructo que incluye la asistencia real
proporcionada por el personal sanitario. El proceso asistencial es
uno de los tres componentes (estructura, proceso y resultados de
la asistencia) de la teoría de Donabedian sobre la calidad de la
asistencia sanitaria.
Proceso de enfermería Subconjunto del proceso de solución de
problemas. Sus pasos son valoración, diagnóstico, planificación,
ejecución, evaluación y modificación.
Proceso de investigación Serie de acciones conectadas que
requieren el dominio de un lenguaje particular; supone la

1041
aplicación meticulosa de distintos métodos de investigación a la
realización de estudios.
Proceso de investigación cualitativa Serie de acciones conectadas
que comienza con la identificación de un problema de
investigación que se aborda mejor desde la perspectiva de las
personas que están en la situación. El proceso puede evolucionar
con el transcurso del estudio, pero consta de varios pasos para
aumentar la credibilidad de los resultados.
Proceso de valoración crítica de investigaciones cualitativas
Proceso en tres partes que consiste en lo siguiente: 1) identificar
los componentes del proceso de investigación cualitativa en
estudios; 2) determinar los puntos fuertes y debilidades del
estudio, y 3) evaluar la confianza, credibilidad y significado de
los hallazgos del estudio.
Proceso de valoración crítica de investigaciones cuantitativas
Incluye tres pasos básicos: 1) identificar los pasos del proceso de
investigación en estudios; 2) determinar los puntos fuertes y
debilidades, y 3) evaluar la credibilidad y significado de los
hallazgos del estudio.
Proposición Declaración abstracta que describe las relaciones entre
conceptos en las teorías; su ámbito oscila de lo general a lo
específico. Este último puede dar lugar a hipótesis.
Proposiciones específicas Declaraciones presentes en las teorías
que tienen un nivel moderado de abstracción y proporcionan las
bases para la generación de hipótesis para guiar un estudio.
Propósito de la investigación Declaración clara y concisa del
objetivo o fin específico del estudio. El propósito es la razón para
realizar el estudio y se genera a partir del problema.
Prospectivo Que se refiere al futuro; datos recogidos durante un
estudio en tiempo real.
Protocolo basado en la investigación Documento que contiene
pasos claramente desarrollados para instaurar en la práctica un
tratamiento o intervención que estén basados en hallazgos de
estudios.

1042
Proveedores de asistencia Individuos responsables de la prestación
de asistencia, como personal de enfermería y médicos, que
forman parte de la estructura asistencial de la teoría de
Donabedian de la asistencia sanitaria.
Prueba de fiabilidad Método para determinar la cuantía de error
aleatorio en un método de medición; evalúa los siguientes
aspectos de la fiabilidad: estabilidad, equivalencia y consistencia
interna u homogeneidad.
Prueba de independencia de χ2 Prueba usada para analizar datos
nominales con el fin de determinar diferencias significativas
entre las frecuencias observadas en los datos y las frecuencias
pronosticadas.
Prueba de significación de dos colas Análisis usado para
comprobar una hipótesis no direccional en la que el investigador
asume que puede producirse un valor extremo en cualquiera de
las colas de la curva normal.
Prueba de significación de una cola Análisis usado con las
hipótesis direccionales en el que se cree que los valores de interés
estadísticos extremos aparecen en una sola cola de la curva
normal.
Prueba muy específica Prueba de cribado o de diagnóstico que
proporciona un resultado verdadero negativo para una gran
proporción de pacientes sin la enfermedad o problema.
Prueba muy sensible Prueba de cribado o de diagnóstico que
proporciona un resultado verdadero positivo para una gran
proporción de pacientes con la enfermedad o problema.
Pruebat Técnica de análisis paramétrico utilizada para determinar
diferencias significativas entre medidas de dos muestras. Hay
dos tipos de pruebas t; pruebas t con muestras independientes y
pruebas t con muestras dependientes. Véanse las definiciones
para las muestras independientes y las muestras emparejadas.
Publicaciones periódicas Fuentes bibliográficas, como revistas,
publicadas un número especificado de veces cada año, que se
continúan publicando a lo largo del tiempo y que se numeran

1043
secuencialmente durante los años de publicación.
Puntuación estandarizada Expresión de las desviaciones respecto a
la media (puntuaciones de diferencia) en unidades de desviación
estándar, como la puntuación z, donde la media es 0, y la
desviación estándar, 1.
Puntuaciones z Valores estandarizados obtenidos a partir de la
curva normal que equivalen a la desviación estándar de la curva.

Q
Quality and Safety Education for Nurses (QSEN) Iniciativa
dedicada a identificar el conocimiento, habilidades y actitudes
(CHA) que deben tener los profesionales de enfermería para
promover la calidad y la seguridad en la asistencia del paciente.
Se han desarrollado declaraciones de CHA para cada una de las
competencias de la educación de pre- y posgrado. Una de las
competencias se centra en la práctica basada en la evidencia.

R
Rango Medida más sencilla de dispersión. El rango se calcula
restando el valor más bajo del más alto (rango, 96 − 78 = 18) o
identificando sin más el valor mínimo y el máximo (rango, 78 a
96).
Razonamiento Procesamiento y organización de ideas para llegar a
conclusiones; los tipos de razonamiento son problemático,
operativo, dialéctico y lógico.
Razonamiento deductivo Razonamiento desde lo general hasta lo
específico o de una premisa general a una situación particular.
Razonamiento inductivo Tipo de razonamiento desde lo específico
hasta lo general, en el que se observan casos particulares y
después se combinan en un conjunto mayor o declaración
general.
Recogida de datos Obtención precisa y sistemática de información
(datos) relevante para el propósito de la investigación o los

1044
objetivos específicos, preguntas o hipótesis de un estudio.
Recomendaciones para futuros estudios Indicaciones aportadas
por los investigadores para futuros estudios basadas en los
hallazgos de su estudio. Las recomendaciones podrían consistir
en replicar o repetir el diseño con una muestra distinta o de
mayor tamaño, usar distintos métodos de medición o probar otra
intervención.
Reducción fenomenológica(bracketing) Técnica de investigación
cualitativa en la que un investigador identifica prejuicios y
creencias, y los deja de lado conscientemente durante el tiempo
que dure el estudio.
Referencia Documentación del origen de una cita mencionada o
idea parafraseada que incluye información identificativa, de
modo que el lector pueda localizar el material original.
Registro de auditoría Registro de acciones llevadas a cabo durante
la organización de datos cualitativos y de decisiones tomadas
durante el análisis e interpretación de datos; aumenta la
seguridad en la transparencia del estudio.
Regresión lineal simple Técnica de análisis paramétrico que estima
el valor de una variable dependiente en función del valor de una
variable independiente.
Relación investigador-participante Interacción y experiencia
compartida del investigador y el participante que tienen efectos
sobre la recogida y la interpretación de los datos. El investigador
establece una relación respetuosa con cada participante, que
incluye ser honesto y abierto sobre el propósito y los métodos
del estudio.
Relación negativa (inversa) Asociación en la que una variable o
concepto cambia (su valor aumenta o disminuye) y la otra
variable o concepto varía en la dirección opuesta.
Relación positiva (lineal) Asociación numérica entre dos variables
en la que una de ellas cambia (su valor aumenta o disminuye) y
la otra se modifica en la misma dirección.
Relevancia de un problema de investigación Indica la importancia

1045
de un problema para la asistencia sanitaria y de enfermería, y
respecto a la salud de las personas, familias y comunidades.
Representatividad de la muestra Grado en el que la muestra es
como la población a la que supuestamente representa; también
se define como el grado en que la muestra, la población accesible
y la población diana se parecen o son similares.
Resultado(s) Hallazgos del análisis de datos generados para cada
objetivo, pregunta o hipótesis de la investigación; pueden ser
mixtos, no significativos, significativos y no predichos,
significativos y predichos o inesperados.
Resultado distal Resultado alejado de la proximidad del acto
asistencial y que está más influido por factores externos (no del
tratamiento) que un resultado proximal.
Resultado proximal Resultado próximo a la prestación de
asistencia.
Resultado sensible a enfermería Véase resultados de pacientes
sensibles a enfermería (RPSE).
Resultados de pacientes sensibles a enfermería (RPSE) Resultados
de pacientes que se ven influidos por la asistencia de enfermaría
o que se asocian a ella. Estos resultados son sensibles porque
están influidos por decisiones y acciones de enfermería.
Resultados de salud de pacientes Resultados específicos basados
en el modelo de eficacia de la función de enfermería. Los
resultados de la función independiente son control clínico y de
síntomas, ausencia de complicaciones, situación funcional y
autocuidado, y conocimiento de la enfermedad y su tratamiento,
satisfacción y costes.
Resultados inesperados Resultados observados cuando el
investigador encuentra relaciones entre variables o diferencias
entre grupos que no estaban previstos en la hipótesis ni
predichos a partir del marco de investigación usado.
Resultados mixtos Resultados de estudios compuestos por
hallazgos significativos y no significativos, o hallazgos
contradictorios relacionados con la relación o intervención

1046
evaluada en el estudio.
Resultados no significativos Resultados estadísticos que no son lo
suficientemente sólidos para alcanzar significación estadística;
no se rechaza la hipótesis nula; se considera que son resultados
negativos o inesperados; pueden reflejar con precisión la
realidad o bien estar causados por debilidades del estudio.
Resultados significativos Resultados estadísticamente
significativos concordantes con la predicción del investigador; es
muy improbable que se hayan producido por azar.
Resultados significativos no predichos Resultados que son los
contrarios a los predichos por el investigador, lo que indica la
presencia de fallos en la lógica del investigador y/o de la teoría
probada.
Resumen Síntesis clara y concisa de un estudio, habitualmente
limitada a 100-250 palabras.
Retención de la muestra Número de participantes en el estudio que
se mantienen y completan dicho estudio.
Retrospectivo Orientado hacia el pasado; cuando se aplica a la
investigación, se refiere a aquella que usa la información
obtenida previamente como datos de un estudio.
Revisado por pares Hace referencia a publicaciones que incluyen
solo artículos analizados por académicos conocedores del tema y
considerados precisos, bien escritos y consistentes con el objetivo
de la revista. Si un manuscrito es un artículo de investigación, los
expertos también evaluarán el rigor del estudio. Las
publicaciones con artículos revisados por pares se denominan en
ocasiones revistas con revisores externos.
Revisión completa Proceso de revisión institucional para estudios
con riesgos mayores que superan el mínimo y que requiere la
aprobación de todo el comité de revisión institucional; también
se denomina revisión total.
Revisión de la literatura Resumen de las fuentes teóricas y
empíricas actuales con el fin de caracterizar lo que se conoce y no
se conoce acerca de un problema concreto; puede dar lugar a la

1047
declaración de un problema de investigación o a la identificación
de conocimiento listo para usarse en la práctica.
Revisión de la literatura relevante Véase revisión de la literatura.
Revisión expedita por el comité de revisión institucional (CRI)
Proceso de revisión institucional para estudios sin riesgos
aparentes o con riesgos mínimos, como los que están presentes
en la vida cotidiana o durante el desarrollo de exploraciones
físicas o psicológicas habituales; puede delegarse a
representantes del CRI.
Revisión sistemática Síntesis estructurada y exhaustiva de estudios
cuantitativos y de resultados en un área de salud determinada
con el fin de identificar las mejores evidencias de investigación
disponibles para que clínicos expertos las utilicen en la
promoción de la práctica basada en la evidencia. Las revisiones
sistemáticas se guían por las preguntas PICOS.
Revisión sistemática con métodos mixtos Síntesis que incluye
varios diseños de estudios, como investigación cualitativa y
estudios cuasiexperimentales, de correlación y cuantitativos
descriptivos para determinar el conocimiento actual en un área
problemática.
Revista clínica Publicación periódica que contiene artículos de
investigación y otros no relacionados con la investigación sobre
problemas prácticos y cuestiones profesionales de una disciplina
académica específica.
Revistas académicas Publicaciones periódicas que incluyen
artículos de investigación y de temas distintos a la investigación
relacionados con una disciplina académica específica o con la
metodología de la investigación.
Revistas con revisores externos Véase revisado por pares.
Riesgo mínimo Véase revisión expedita por el comité de revisión
institucional (CRI).
Rigor Excelencia en la investigación; alcanzado mediante el uso de
disciplina, atención meticulosa a los detalles y precisión estricta.

1048
S
Saturación Momento en un estudio cualitativo en el que la recogida
de datos adicionales no aporta información nueva, sino que hay
una redundancia de los datos recogidos previamente. El tamaño
muestral de un estudio cualitativo se determina cuando aparece
una saturación de los datos.
Saturación de datos Véase saturación.
Sensibilidad Grado en el que una medida fisiológica puede
detectar cambios pequeños. Una sensibilidad mayor significa
que la medida es más precisa.
Sensibilidad de una prueba de cribado o diagnóstica Precisión de
una prueba de cribado o diagnóstica; proporción de pacientes
con la enfermedad que tienen una prueba positiva o un resultado
verdadero positivo.
Sesgo Influencia o acción en un estudio que distorsiona los
hallazgos o los aleja de los verdaderos o esperables.
Sesgo de citación Preferencia que se produce cuando algunos
estudios se citan más a menudo que otros y tienen más
probabilidades de ser identificados en las búsquedas en bases de
datos.
Sesgo de comunicación de resultados Tipo de sesgo que tiene
lugar cuando los resultados del estudio no se comunican
claramente y con total exactitud.
Sesgo de idioma Se produce si las búsquedas para revisiones
sistemáticas se centran solo en estudios en inglés, mientras que
existen estudios importantes en otros idiomas; los estudios de
otros idiomas tienen menos probabilidades de incluirse en una
revisión sistemática.
Sesgo de localización Se produce cuando los estudios están
publicados en revistas de menor impacto e indexados en bases
de datos menos exploradas; por tanto, es menos probable que se
incluyan en una revisión sistemática.
Sesgo de publicación Sesgo que se produce cuando los estudios

1049
con resultados positivos tienen más probabilidades de ser
publicados que los estudios con resultados negativos o no
concluyentes.
Sesgo de publicación duplicada Aparición de más apoyo de
investigación para un hallazgo que es preciso porque los autores
han publicado los hallazgos de un estudio en más de una revista,
sin referenciar la otra revista.
Sesgo de retraso temporal de los estudios Tipo de sesgo de
publicación; se produce porque los estudios con resultados
negativos suelen publicarse más tarde, en ocasiones 2-3 años
después, que aquellos con resultados positivos. En ocasiones, los
estudios con resultados negativos no se publican en absoluto.
Sesgo metodológico Se produce cuando los estudios seleccionados
para una revisión sistemática tienen debilidades en su diseño,
intervenciones, recogida de datos o análisis de los datos. La
influencia de las limitaciones del estudio debería incluirse en la
revisión.
Sesgo o variación sistemática Fenómeno que se produce cuando
determinados participantes del estudio comparten varias
características, de modo que la muestra es menos representativa
de la población.
Significación estadística Véase alfa (α).
Simétrica Término usado para describir la curva normal, en la que
el lado izquierdo de la curva es una imagen en espejo del lado
derecho.
Síntesis de fuentes Conexión e interrelación de ideas procedentes
de varias fuentes para fomentar una comprensión nueva de lo
que se conoce y no se conoce en un área.
Síntesis de investigación cualitativa Proceso y producto de una
revisión sistemática e integración formal de los hallazgos de
estudios cualitativos. En este libro se utiliza el término
metasíntesis para describir el proceso de revisión sistemática e
integración de los hallazgos de investigaciones cualitativas.
Síntesis multinivel Síntesis realizada durante una revisión

1050
sistemática con métodos mixtos que consiste en sintetizar los
hallazgos de estudios cuantitativos de forma separada respecto a
los de los estudios cualitativos e integrar los hallazgos de estas
dos síntesis en el informe final.
Síntesis paralela Durante una revisión sistemática con métodos
mixtos, consiste en la síntesis separada de los estudios
cuantitativos y cualitativos, pero los hallazgos de la síntesis
cualitativa se usan para interpretar los estudios cuantitativos
sintetizados.
Sitios web Páginas de internet mantenidas por individuos,
organizaciones y compañías para proporcionar información, que
deben evaluarse para determinar su precisión, sesgos y
relevancia antes de citarlas en una revisión de la literatura.
Sondeo Pregunta o afirmación abierta de un investigador
cualitativo durante una entrevista para obtener más información
del participante; puede utilizarse para seguir un comentario
previo o para evaluar con más detalle la perspectiva del
participante.
Suposición Declaración tenida por cierta o considerada verdadera,
aunque no haya sido probada científicamente.

T
Tablas de frecuencia Representación visual de los resultados de
una distribución de frecuencia, en la que los valores posibles
aparecen en una columna de una tabla y la frecuencia de cada
valor en la otra columna.
Tamaño muestral Número de participantes, acontecimientos,
comportamientos o situaciones examinados en un estudio.
Tasa de abandono de una muestra Número y porcentaje de
participantes que abandonan un estudio antes de completarse, lo
que amenaza la validez interna del estudio. La tasa de abandono
se calcula dividiendo el número de participantes que salen de un
estudio entre el tamaño de la muestra original. Por ejemplo, si el
tamaño muestral es 200 y 20 personas salieron del estudio,

1051
entonces (20 ÷ 200) × 100% = 10%.
Tasa de aceptación Número y porcentaje de participantes de un
estudio que acceden a participar en él. El porcentaje se calcula
dividiendo el número de participantes que acceden a participar
entre el número de aquellos a los que se ha hecho la propuesta.
Por ejemplo, si se propone participar a 100 personas y 90
acceden, la tasa de aceptación es del 90%: (90 ÷ 100) × 100% = 0,9
× 100% = 90%.
Tasa de mortalidad estandarizada (TME) Número de
fallecimientos observado dividido entre el número de
fallecimientos anticipado y multiplicado por 100. La TME se
considera una medida del riesgo relativo del grupo estudiado de
fallecer por una enfermedad concreta.
Tasa de rechazo Porcentaje de individuos potenciales que
rehusaron participar en el estudio. El estudio debe incluir sus
motivos para no participar. La tasa de rechazo se calcula
dividiendo el número que rechaza participar entre el número de
individuos potenciales propuestos y multiplicando el resultado
por 100%. Por ejemplo, si se propone a 100 personas y 15
rehúsan participar, la tasa de rechazo es (15 ÷ 100) × 100% = 0,15
× 100% = 15%.
Tasa de retención Número y porcentaje de participantes en el
estudio que lo completan.
Temas de investigación Conceptos o áreas problemáticas en
términos generales que indican los focos de conocimiento de
investigación esencial necesarios para llevar a cabo una práctica
de enfermería basada en la evidencia. Los temas de investigación
incluyen muchos problemas de investigación potenciales.
Teoría Conjunto integrado de conceptos definidos, declaraciones
de existencia y declaraciones relacionales que presenta una
visión sistemática de un fenómeno.
Teoría científica Estructura conceptual con una evidencia de
investigación exhaustiva que respalda sus afirmaciones. Los
conceptos están claramente definidos y pueden medirse con
fiabilidad y validez para comprobar sus proposiciones; estas

1052
pueden considerarse leyes y principios listos para su aplicación
en la práctica.
Teoría de la decisión Teoría estadística basada en presunciones de
la curva normal teórica; se usa para comprobar si existen
diferencias entre grupos; la expectativa subyacente es que todos
los grupos son miembros de la misma población y se expresa
como una hipótesis nula. El nivel de significación (alfa) suele
fijarse en 0,05 antes de la recogida de datos.
Teoría de la interacción simbólica Principio que evalúa el modo en
el que las interacciones entre las personas y el entorno crean
procesos sociales y significados, que dan lugar a comunicación y
comportamientos.
Teoría de la probabilidad Teoría estadística o matemática que
aborda la probabilidad de que se produzca un hecho; en
investigación, la probabilidad de que los hallazgos de una
muestra sean los mismos que los parámetros poblacionales.
Teoría provisional o teoría tentativa Estructura conceptual
propuesta recientemente, que se ha expuesto mínimamente a la
crítica de los académicos de la disciplina y apenas se ha probado.
Teoría sustantiva o esencial Estructura conceptual de conceptos,
definiciones y declaraciones relacionales que se identifican con
claridad; también puede denominarse teoría de rango medio; es útil
como guías prácticas y marcos de investigación.
Teorías de práctica Teorías de rango medio muy específicas
desarrolladas para describir un elemento concreto de las
acciones de enfermería y explicar las respuestas del paciente; en
ocasiones se denominan teorías específicas de la situación.
Teorías de rango medio Descripciones conceptuales relativamente
concretas con un número limitado de conceptos y proposiciones
que se pueden aplicar en la práctica, utilizadas para guiar
estudios o evaluadas mediante investigación.
Tesis Proyecto de investigación extenso y habitualmente original
completado por un estudiante de doctorado como parte de los
requisitos del grado de doctor.

1053
Trabajo de fin de máster Proyecto de investigación completado por
un estudiante graduado como parte de los requisitos del título
de máster.
Tradiciones Verdades o creencias basadas en costumbres y usos del
pasado que son una fuente de conocimiento. Las tradiciones se
transmiten entre los profesionales de enfermería mediante
modelado de roles y por comunicación escrita y oral.
Transcripciones Registro escrito temporal creado a partir de una
grabación de audio de una entrevista o grupo focal.
Transferibilidad Término usado para describir los hallazgos
cualitativos respecto a su posibilidad de aplicación a otros
entornos con participantes similares cuando el estudio tiene una
descripción minuciosa de la muestra y el lector confía en la
credibilidad, confiabilidad y auditabilidad de los hallazgos.
Tratamiento Véase intervención.
Tutor Persona que actúa como profesor, promotor, guía o ejemplo
para un principiante.
Tutoría En enfermería, forma intensa de modelado de roles en la
que un profesional de enfermería experto sirve de profesor,
promotor, guía, ejemplo y asesor para un principiante o
discípulo.

V
Validez Grado en que un instrumento o método de medición
refleja con exactitud el constructo (o concepto) examinado.
Validez concurrente Grado en el que una puntuación de un
individuo en una escala se puede utilizar para estimar su
rendimiento actual o concurrente en otra variable o criterio; tipo
de validez del criterio.
Validez convergente Tipo de validez de medición obtenida
utilizando dos instrumentos para medir la misma variable, como
la depresión, y correlacionando los resultados de estos
instrumentos; la evidencia de la validez de convergencia es una

1054
correlación positiva moderada o fuerte entre las dos mediciones.
Validez de constructo Grado en el que un instrumento mide en
realidad el constructo teórico que pretende medir; esto implica
examinar la concordancia entre las definiciones conceptual y
operacional de una variable de estudio.
Validez de contenido Grado en que los ítems de una escala
incluyen los elementos principales relevantes para el constructo
que se está midiendo. La evidencia sobre la validez de contenido
incluye 1) la idoneidad con la que los ítems de la escala reflejan
la descripción del concepto en la literatura (o validez aparente);
2) la evaluación de los expertos de la relevancia de los ítems que
se pueden describir como un índice, y 3) las respuestas de los
participantes a los ítems de la escala.
Validez de criterio Grado en el que los valores en un instrumento
pueden usarse para predecir otra variable o valor; la validez de
criterio incluye la validez predictiva y concurrente.
Validez de la conclusión estadística Grado en que el investigador
toma decisiones sobre el uso correcto de la estadística, de modo
que las conclusiones sobre relaciones y diferencias obtenidas a
partir de los análisis estadísticos son un reflejo exacto de la
realidad.
Validez del diseño Probabilidad de que los hallazgos del estudio
sean un reflejo preciso de la realidad. Sus cuatro componentes
son la validez de constructo, validez interna, validez externa y
validez de la conclusión estadística.
Validez del estudio Medida de la verdad o exactitud de los
hallazgos obtenidos en un estudio. La validez del diseño de un
estudio es clave para obtener resultados y hallazgos de calidad
de ese estudio.
Validez divergente Tipo de validez de medición obtenida
utilizando dos instrumentos para medir variables opuestas,
como esperanza y desesperanza; la evidencia de la validez
divergente es una correlación negativa moderada o fuerte entre
las dos mediciones.

1055
Validez externa Hace referencia al grado en que los hallazgos del
estudio pueden generalizarse más allá de la muestra usada en el
estudio.
Validez interna Grado en que las relaciones medidas entre
variables de un estudio son un auténtico reflejo de la realidad, en
vez del resultado de variables externas.
Validez predictiva Grado en el que la puntuación de un individuo
en una escala puede predecir con precisión su resultado futuro;
es un tipo de validez relacionada con el criterio.
Valoración crítica de investigaciones Examen de las fortalezas y
debilidades, del significado, de la credibilidad y de la relevancia
de los estudios de enfermería en la génesis de conocimiento.
Valoración crítica intelectual de un estudio Examen exhaustivo de
todos los aspectos de un estudio para valorar sus fortalezas y
debilidades, su significado, su credibilidad y su relevancia de
acuerdo con investigaciones previas y el conocimiento del tema.
Valores atípicos(outliers) Puntuaciones o valores exagerados en
una serie de datos que parecen dispares respecto al resto de la
muestra; pueden deberse a la variabilidad aleatoria o a errores
redundantes de medida o ejecución, o a errores en la
identificación de variables importantes para explicar la
naturaleza del fenómeno en estudio.
Variable(s) Cualidades, propiedades o características concretas o
abstractas de personas, objetos o situaciones que cambian o
varían, y son manipuladas o medidas en la investigación
cuantitativa.
Variable dependiente (v. de respuesta o v. de resultado)
Respuesta, comportamiento o resultado que se predice o explica
en la investigación. En un estudio centrado en evaluar una
intervención, se asume que los cambios de la variable
dependiente están causados por la variable independiente.
Variable independiente En la investigación de intervención, se
refiere a la intervención o tratamiento que el investigador
manipula o modifica para causar un efecto en la variable

1056
dependiente. En investigación de correlación, la variable(s)
independiente(s) se usa(n) para predecir la aparición de la
variable dependiente.
Variables ambientales Tipos de variables externas que componen
el entorno en el cual se realiza un estudio.
Variables de confusión Tipo de variable externa que está incluida
en el diseño del estudio y que no se puede controlar.
Variables de investigación Cualidades, propiedades o
características identificadas en el propósito y los objetivos o
preguntas de investigación que son observadas o medidas en un
estudio.
Variables demográficas Variables de atributo específicas de los
participantes de un estudio que se recogen para describir la
muestra, como la edad, el sexo, la raza y la etnicidad.
Variables estructurales Factores tales como la organización de los
cuidados de enfermería y el liderazgo de enfermería que tienen
efectos sobre la práctica enfermera y, a su vez, sobre los
resultados de pacientes.
Variables externas Variables que existen en todos los estudios y
pueden afectar a la medición de las variables del estudio y las
relaciones entre esas variables.
Variación aleatoria Diferencias que ocurren normalmente y son
previsibles en los valores que se obtienen cuando el investigador
examina las respuestas o características de los participantes en el
estudio de la misma muestra.
Varianza Medida de dispersión en la que, cuanto mayor sea la
varianza, más grande será la dispersión de los valores. Su cálculo
es uno de los pasos en la determinación de la desviación
estándar; también, en un modelo de predicción, la cantidad total
de la variable dependiente explicada por las variables
independientes o predictores.
Varianza explicada Cantidad de variación de los valores explicada
por la relación entre las dos variables.

1057
Varianza intergrupal Variación de las medias del grupo alrededor
de la media general; se determina mediante la realización de
técnicas estadísticas de análisis de la varianza (ANOVA).
Varianza intragrupal Variación de los valores individuales en un
grupo respecto a la media del grupo; se determina mediante el
análisis de la varianza (ANOVA).
Varianza no explicada Variación entre dos o más variables que es
el resultado de otros factores distintos de las relaciones.
Varianza total Suma de la varianza intragrupal y la intergrupal
determinada por un análisis de la varianza (ANOVA).
Verdadero negativo (resultado) Resultado de una prueba
diagnóstica o de cribado que indica con exactitud la ausencia de
una enfermedad.
Verdadero positivo (resultado) Resultado de una prueba
diagnóstica o de cribado que indica con exactitud la presencia de
una enfermedad.
Viabilidad de un estudio Grado en el que los recursos son o no
suficientes para completar un estudio; se determina mediante el
examen del tiempo y dinero necesarios, destreza del
investigador, disponibilidad de participantes, centros y equipos,
cooperación de otros y consideraciones éticas del estudio.
Violación de la confidencialidad Acción intencionada o accidental
que permite que una persona no autorizada tenga acceso a los
datos de la identidad de participantes y a los datos del estudio.

1058
ÍNDICE
ALFABÉTICO

Nota: Los números de página seguidos de la letra f indican figuras; los seguidos de
la letra t, tablas, y los seguidos de la letra c, cuadros.

A
AAALAC See American Association for Accreditation of Laboratory Animal Care
International (AAALAC)
AACN See American Association of Colleges of Nursing (AACN), sobre
investigación en enfermería
Abandono de la muestra, 233–236
adecuación, 234c
ejemplo de investigación, 234c
Abordaje
émico, de la investigación antropológica, 70
ético, de la investigación antropológica, 70
Academic Center for Evidence-Based Nursing, página web, 422c
Academic Search Complete, base de datos, revisiones de la literatura de enfermería,
162t
Aceptación voluntaria, 106
Actas de conferencias, 153
Acuerdo, uso de datos, 102
Administración e investigación en enfermería, 2–3
Advances in Nursing Science, , 8
Agency for Healthcare Policy and Research (AHCPR), en investigación de

1059
resultados, 9
Agency for Healthcare Research and Quality (AHRQ), 9, 129, 336, 421, 441, 446
Agua, trabajo de Florence Nightingale, 6
AHCPR See Agency for Healthcare Policy and Research (AHCPR)
AHRQ See Agency for Healthcare Research and Quality (AHRQ)
Aislamiento, en estudios cualitativos, 363c
Alfa (α), 294
Algoritmos, 389
para identificar una técnica de análisis apropiada, 310, 311f
American Association for Accreditation of Laboratory Animal Care International
(AAALAC), 114
American Association of Colleges of Nursing (AACN), sobre investigación en
enfermería, 7t, 10
American Association of Critical Care Nurses, prioridades de investigación, 128–
129
American Journal of Nursing, historia, 6
American Nurses Association (ANA)
Code of Ethics for Nurses, 96
National Database of Nursing Quality Indicators, 448t
Nursing Care Report Card, 447
sobre investigación en enfermería, 6, 7t
American Nurses Credentialing Center (ANCC), 389
página web, 452
y Magnet Recognition Program, 335
American Psychological Association (APA), 335
American Recovery and Reinvestment Act, 446
ANA See American Nurses Association (ANA)
Análisis
de correlación, para evaluar relaciones, 312
de datos, 84–86, 85c
ejemplo, 86c
en investigación
cualitativa, 84–86, 85c, 358c, 362
puntos fuertes y débiles, 362, 363c
cuantitativa, 45–46, 46c

1060
puntos fuertes y débiles, 343–344
guías de valoración crítica, 310–312, 312c
proceso, elementos, 299–300, 299c
técnicas, 246–248
de factores, 316–317
de la covarianza (ANCOVA), 325
definición, 325
usos, 325
de la mejoría, en investigación de resultados, 459
de la varianza (ANOVA), 323–325
definición, 323–325
ejemplo de investigación, 324c, 325t
interpretación de los resultados, 324–325
de los datos, 84–86, 85c
ejemplo, 86c
en investigación
cualitativa, 84–86, 85c, 358c, 362, 363c
cuantitativa, 45–46, 46c, 338c, 342t, 343–344, 345c
guías de valoración crítica, 310–312, 312c
proceso, elementos, 299–300, 299c
técnicas, 246–248
de potencia, 62–63
del tamaño muestral, 245
en estadística, 298
de regresión, 317–319
ejemplo de investigación, 318c, 319t
resultados, 317–319
del cambio, en investigación de resultados, 459
estadístico
en estudios cuantitativos, 338c, 342t, 355–356t
inferencial, 300
proceso
pasos, 299–300
teorías y concepto, 293–299

1061
resultados, 326–329
conclusiones, 328
generalización de los hallazgos, 328
guías de valoración crítica, 329c
hallazgos, 327–328
implicaciones, 328
limitaciones, 328
recomendaciones para estudios adicionales, 328–329
exploratorios, 300
no paramétricos, 310
paramétricos, 310
post hoc, , 320
secundario, 458
ANCC See American Nurses Credentialing Center (ANCC)
ANCOVA See Análisis de la covarianza (ANCOVA)
Angustia psicológica, definición, 444t
Animales
de laboratorio, cuidado y trato humanos, 114
en investigación, uso, 114
Annual Review of Nursing Research, , 7t, 9
Anonimato, 100–101
Anonimización, de información sanitaria protegida, 113
ANOVA See Análisis de la varianza (ANOVA)
Antropología e investigación etnográfica, 70
APA See American Psychological Association (APA)
Aplicabilidad, 63–64
Apoyo
emocional, 174
social, 175
Applied Nursing Research, , 48
Applied Nursing Research y Nursing Science Quarterly, , 8–9
Árbol(es) de decisión, 431
clínica, 389
para identificar una técnica de análisis apropiada, 310, 311f

1062
Artículos, 153
de texto completo, archivo electrónico, 163
lectura, 163–164
obtención de copias de texto completo, 163
palabras clave para su selección, 161
Asignación económica, 131
Asimilación, en investigación etnográfica, 70–71
Asistencia
estándares, 453
evaluación
de la estructura, 451t, 452–453
de los resultados, 449–452
del proceso, 453
Ask Suicide Screening Questions (ASQ), 274t
ASQ See Ask Suicide Screening Questions (ASQ)
Association of Women’s Health, Obstetric, and Neonatal Nurse, página web, 422c
Auditabilidad, 362
Autism Functional Challenge Questionnaire, , 363c
Autocuidado, definición, 444t
Autodeterminación, derechos, 96–99
Autonomía disminuida, 97–99
y competencia para otorgar el consentimiento informado, 97
Autoridad, definición, 11–12

B
Bachelor of Science in Nursing (BSN), papeles, en investigación en enfermería, 20–21,
20t
Base(s)
de datos
administrativa, 455
amplias, como fuentes de datos, 454–455, 454f, 455t
bibliográfica, 161
campos de investigación, 162
clínica, 454–455
electrónica, para una revisión de la literatura, 161

1063
existente, obtención de datos, 287–289
usadas para revisiones de la literatura en enfermería, 162t
filosóficas, de los diseños de métodos mixtos, 431
Beneficencia, principio, 96, 101
Biblioteca Cochrane, 391–392t
Bibliotecario/miembro del profesorado del curso, 160–161
Búsqueda(s)
depuración, 162–163, 165t
intrabibliográfica, 404
uso de una tabla u otro método para documentar los resultados, 162

C
Calidad
asistencial
definición, 442
estándares, 453
nivel y ámbito de preocupación, 442f
valoración, 443
de vida relacionada con la salud (CVRS), 176t
CALNOC See Collaborative Alliance for Nursing Outcomes California Database
(CALNOC)
Cáncer, investigación no ética, en el Jewish Chronic Disease Hospital, 97
CANCERLIT, 391–392t
Características de la muestra, en las variables demográficas, 145
Causalidad
definición, 194
elementos de los diseños que la analizan, 211–213
evaluación en diseños
cuasiexperimentales, 192–193
experimentales, 192–193, 219f
uso de la estadística para evaluarla, 319–320
Centers for Health Evidence, página web, 422c
Centers for Medicare & Medicaid Services (CMS), 449
Centros
de práctica basada en la evidencia (CPBE)

1064
definición, 425, 427
introducción, 425
disponibilidad, 131–132
CES-D See Escala(s), del Center for Epidemiologic Studies Depression (CES-D)
CFR See Code of Federal Regulations (CFR)
CINAHL See Cumulative Index to Nursing and Allied Health Literature (CINAHL)
Cita, 153, 168t
de fuentes, propósito, 163
Citación
sesgo, 400
Clasificación
de resultados de enfermería (NOC), 450
del empleo, como variable demográfica, 145
Clinical Nursing Research, 9, 48
CMS See Centers for Medicare & Medicaid Services (CMS)
CNM See Matronas certificadas (CNM)
Cociente
de verosimilitudes (CV), 275–276
negativo, 276
positivo, 275
riesgo-beneficio, definición, 111
Code of Federal Regulations (CFR), 94
Codificación, método, 85
Código(s)
de Núremberg, 92–93, 93c
en investigación cualitativa, 85
éticos y normas, eventos históricos que influyeron, 91
Coeficiente
alfa de Cronbach, 300
de correlación
relevancia, comprobación, 314–316, 315c, 315–316t
resultados del análisis de correlación de Pearson, 313–314
de determinación múltiple, 317–318
de regresión, 317–318

1065
Coerción, 97
Collaborative Alliance for Nursing Outcomes California Database (CALNOC), 449
Comités de revisión institucional (CRI), 108, 109c
composición y función, 108–109
niveles de revisión, 109–110
revisiones completas, 110–112
Common Rule, 94, 113
Competencia, del consentimiento informado, 106
Comprensión, de la información del consentimiento, 105–106
Comprobación de hipótesis, 294–295
Computación, en el proceso de análisis estadístico, 293
Conceptos
como elementos básicos de una teoría, 174–176, 175f
de investigación, 140–146
en investigación cualitativa, 144
definición, 173
en estudios fisiológicos, 186
Conclusiones
de los resultados estadísticos, 328
e implicaciones, en la investigación de métodos mixtos, 438t, 441
en el razonamiento, 13–14
Concreto, 174
Conduct and Utilization of Research in Nursing, 7t, 8–9
Conducta(s)
de cuidado, 63
humana, en investigación fenomenológica, 67
Confiabilidad, 362
Confianza, 361
Confidencialidad, 100–101
violación, 100–101
Congruencia metodológica, 62
Conocimiento
adquisición, 11–14
autoridad, 14

1066
definición, 11
mediante investigación de enfermería, 14–17
empírico, 3, 20–21
revisión de la literatura, 150
Consentimiento
amplio, 99
componentes, 100c
de los participantes en el estudio, 45
documentos, formulario corto, 106
formulario, 105
informado, 104–108
aceptación voluntaria, 106
componentes, 105c
cuatro elementos, 104–106, 105f
competencia, 106
comprensión, 105–106
revelación de la información esencial, 104–105
documentación, 106–108
exento, 106–107
guías de valoración crítica, 107, 107c
proceso, Código de Núremberg, 92–93
Consistencia, en la recogida de datos, 286–287
CONsolidated Standards for Reporting Trials (CONSORT), 222, 223f
Consorcio Clinical and Translational Science Awards (CTSA), 425–426
CONSORT See CONsolidated Standards for Reporting Trials (CONSORT)
Constructos
definición(es)
en una teoría, 175, 175f
inadecuadas, 198
Contribución al conocimiento, en la investigación de métodos mixtos, 438t, 441
Control
definición en investigación de enfermería, 19–20
en el diseño
de la investigación, 196

1067
del estudio, 287
en investigación cuantitativa, 34–35, 35t
Convergencia, definición, 432
Correlación
bivariante, 312–313
del producto-momento de Pearson, 312–316
ejemplo de investigación, 315c, 315–316t
resultados, interpretación, 313–314
Costes
de estudios de investigación, 128
de la asistencia sanitaria, 17
Cotinina urinaria, como variable, 188t
CPBE See Centros, de práctica basada en la evidencia (CPBE)
Creatinina, como variable, 188t
Crecimiento intrauterino retardado, como variable, 188t
Credibilidad, 362
evaluación, en estudios cuantitativos, 344
CRI See Comités de revisión institucional (CRI)
Criterios
de elegibilidad, en la teoría del muestreo, 230–231
de exclusión en la muestra, 230
de inclusión en la muestra, en la teoría del muestreo, 230
de muestreo, en la teoría del muestreo, 230–231, 235f
adecuación, 234c
ejemplo de investigación, 234c
de valoración intermedios, 458
Crítica, 333
CRNA See Enfermeras de anestesia certificadas (CRNA), en investigación de
resultados
CTSA See Consorcio Clinical and Translational Science Awards (CTSA)
Cuestionario(s), 281–282
de Apoyo Social Funcional, 175
ejemplo de investigación, 282c
guías de valoración crítica, 282c

1068
Cultura, investigación etnográfica, 70, 76
Cumulative Index to Nursing and Allied Health Literature (CINAHL), como base
de datos para las revisiones de la literatura en enfermería, 162t, 391–392t
Curva normal, 295–297, 296f
CV See Cocientes, de verosimilitudes (CV)

D
Daño
molestias, derecho a protección, 101–102
permanente, certeza, 102
Datos See Recogida de datos
administrativos, recogida de datos, 287–288
cualitativos, dificultades de los diseños de métodos mixtos, 436, 440t
de mortalidad, recogidos por Florence Nightingale, 6
documentos y materiales multimedia, 83c
obtención, 287–289
organización, 84
perdidos, gestión, 299
primarios, 287
secundarios, 287
DE See Desviación estándar (DE)
Declaración(es)
de Helsinki, 93
en una teoría, 173
Enhancing Transparency in Reporting Synthesis of Qualitative Research
(ENTREQ), 407
ENTREQ See Declaración Enhancing Transparency in Reporting Synthesis of
Qualitative Research (ENTREQ)
Preferred Reporting Items for Systematic Reviews and Meta-Analyses (PRISMA),
394, 398
diagrama de flujo, 399f
PRISMA See Declaración, Preferred Reporting Items for Systematic Reviews and
Meta-Analyses (PRISMA)
relacionales, en las teorías, 177
Definiciones
conceptuales, 176t, 188t

1069
de las variables del estudio, 42, 42c
de variables en investigación cuantitativa, 142–143, 144c
descripción, 176
protección frente a sesgos, 202
connotativas, 176
operacionales, 176, 176t, 188t
de variables, 42, 42c
en investigación cuantitativa, 142–144, 144c
protección contra sesgos, 202
DEM See Diferencia estandarizada de las medias (DEM)
Department of Health and Human Services (DHHS), 10
HIPAA Privacy Rule, 99
Department of Health, Education, and Welfare (DHEW), protección de los sujetos
humanos de investigación, 91
Depresión, 176t
Derecho(s)
a la autodeterminación, 96–99
a la privacidad, 99
a la protección frente a las molestias y el daño, 101–102
a la selección y trato justos, 102–103
al anonimato y la confidencialidad, 100–101
humanos
principios éticos, 96f
protección, 95–103, 103c
Descripción, definición de investigación en enfermería, 2
Desviación estándar (DE)
curva normal, 296f
definición, 305
DHEW See Department of Health, Education, and Welfare (DHEW)
DHHS See Department of Health and Human Services (DHHS)
Diagnóstico, como variable demográfica, 145
Dieta, trabajo de Florence Nightingale, 6
Diferencia estandarizada de las medias (DEM), 405–406, 405f
Dificultades

1070
conductuales, hacer frente, en estudios cualitativos, 363c
de comunicación, hacer frente, en estudios cualitativos, 363c
Dinero See Costes
Diseño(s)
algoritmo para determinar el tipo, 193f, 203f
comprobación de modelos, 210, 210f, 212c
conceptos importantes, 194–196
causalidad, 194
control, 196
manipulación, 196
multicausalidad, 194
probabilidad, 194–195
sesgo, 195
cuasiexperimentales
algoritmo para determinar los tipos, 219f
análisis de la causalidad, 211
definición, 214–218, 217c
de comprobación de modelos
definición, 210
diagramas ilustrativos, 210f
de correlación, 204c
algoritmo para determinar el tipo, 207f
comprobación de modelos, 210, 210f, 212c
descriptivo, 207–208, 207f, 208c
predictivo, 208–210, 209c, 209f
propósito, 204c
de estudio, 43
de investigación
algoritmo para determinar el tipo, 193f
comprobación de modelos, 210, 210f, 212c
conceptos relevantes, 194–196
causalidad, 194
control, 196
manipulación, 196

1071
multicausalidad, 194
probabilidad, 194–195
sesgo, 195
de correlación, 204c
descriptiva, 207–208, 207f
predictiva, 208–210, 209c, 209f
definición, 191–192
descriptiva, 202–206
comparativa, 205–206
ensayos controlados aleatorizados, 222–226
estudios cuantitativos, 338c
para estudios de enfermería, 192–193
Fisher, Ronald, 30
de los estudios, 62
en estudios cualitativos, 252–254
en investigación de resultados, 455–458
estudios
de cohortes
prospectivos, 456
retrospectivos, 456–457
económicos, 458
poblacionales, 457–458
definición, 34, 191–192
descriptivos, 202–206
comparativo, 205–206, 206f
definición, 205–206
diagrama ilustrativo, 206f
ejemplo de investigación, 206c
de correlación, 206–210
definición, 202–206, 204c
diagrama de diseño simple, 204f
ejemplo de investigación, 205c
simple, 204–205, 204c, 204f
ensayos controlados aleatorizados, 222–226

1072
experimentales
algoritmo para determinar el tipo, 219f
definición, 217c, 218–226
pretest y postest, 218–220, 220f
longitudinal, 192
no experimentales, 192
paralelo, 432
postest, 214–218, 216f
con diseño de grupo control, 220–222, 221c
pretest y postest
con grupo de comparación, 214–218, 215–216f, 217c
en el diseño experimental, 218–226, 220f
puntos fuertes y débiles, en estudios cuantitativos, 338c, 343–344, 345c
transversal, 192
Dispersión, medidas, 304–307
Distribución(es)
bimodal, 304, 304f
de frecuencia, 301–302
agrupadas, 301–302, 302t
no agrupadas, 301, 301t
de porcentajes, 301t, 302, 303f
DNP See Doctor of Nursing Practice, DNP
Docentes de enfermería, valoración crítica de los estudios, 335
Doctor of Nursing Practice, DNP, 20t
Doctor of Philosophy, PhD, en enfermería, 20t
Documentación, del consentimiento informado, 106–108
Documentos y materiales multimedia, en investigación cualitativa, 82–84, 83c
DOI See Identificadores digitales de objetos (DOI)
Dolor, definición, 444t
Donabedian, Avedis, 442

E
EBSCOhost, 161
ECA See Ensayos controlados aleatorizados (ECA)

1073
ECN See Escala(s), de calificación, numérica (ECN)
Edad, como variable demográfica, 145
Educación
como variable demográfica, 145
enfermería, 6
historia de la enfermería, 6, 7t
Efecto Rosenthal See Expectativas del experimentador
Eficiencia, definición, 458
Eje
X, en un diagrama de dispersión, 306–307, 306f
Y, en un diagrama de dispersión, 306–307, 306f
Elementos, definición de población, 229–230, 229f
Enciclopedia, 153
online, 153
EndNotes, 162
Enfermedad y angustia del niño, 433
Enfermeras de anestesia certificadas (CRNA), en investigación de resultados, 449
Enfermería
conocimiento See Conocimiento
de práctica avanzada (EPA), seguridad y eficacia, 449
educación, 2–3
ejemplo de investigación de teoría fundamentada, 68c
estrategias de medición, 276–286
cuestionarios, 281–282
entrevistas, 280–281
escalas, 282–286
medición observacional, 277–280
medidas fisiológicas, 276–277
etnografía, 70
niveles de experiencia, 12–13
valoración crítica
investigación
cualitativa, 333–386
cuantitativa, 333–386

1074
Enfoque cualitativo, en estudios cualitativos, 361
Engaño, 97
Enmascaramiento, 222
Ensayos controlados aleatorizados (ECA), 222–226, 223f, 224c, 390, 454
Entorno(s)
de campo, 35–36, 254–255, 254c
e intervención, interacción, 201
investigación, 35–36, 254–256
muy controlados, 35–36, 35t, 255–256, 256c
naturales, 35–36, 254–255, 254c
parcialmente controlados, 35–36, 255, 255c
Entrevistas, 280–281
abiertas, 77–78 See also Entrevistas, no estructuradas
ejemplo de investigación, 280c
en investigación cualitativa, 77–79, 78–79c
estructurada, 280
guías de valoración crítica, 280c
no estructuradas, 77, 280
en investigación cualitativa, 77
propósito, 78
semiestructuradas, en investigación cualitativa, 77
telefónicas, 280
transcripción, 84
EPA See Enfermería, de práctica avanzada (EPA), seguridad y eficacia
Equipamientos, disponibilidad, 131–132
Error
de medición
aleatorio, 263–264
sistemático, 264
de tipo I, en la teoría de las decisiones, 297–298, 298t
de tipo II, en la teoría de las decisiones, 297–298, 298t
control del riesgo, 298
ERT See Estrés, relacionado con el trabajo (ERT)
Escala(s), 282–286

1075
de calificación, 283, 283f
numérica (ECN), 283f
de intervalo, medición, definición, 262–263
de Likert, 283–284, 354t
del Center for Epidemiologic Studies Depression (CES-D), 264, 265f
ejemplo de investigación, 285c
guías de valoración crítica, 285c
sumadas, 282
visual analógica (EVA), 284–286, 284f
Especificidad, ejemplo de investigación, 274c
Esquema de temas, 363c
Estabilidad, 265–267
Estadística
descriptiva, 299
ejemplo de investigación, 308c, 308–309t
en investigación, 292–332
descriptiva, 301–309
determinación de la idoneidad de la estadística inferencial, 309–312
interpretación de los resultados de investigación, 326–329, 329c
para examinar
diferencias, 319–325
relaciones, 312–317
para predecir los resultados, 317–319
pasos del proceso de análisis de datos, 299–300, 299c
teorías y conceptos del proceso de análisis estadístico, 293–299
inferencial, 299
en estudios, determinación de la idoneidad, 309–312
para examinar diferencias, 319–320
Estado
civil, como variable demográfica, 145
funcional, definición, 444t
Estándares
de cuidados, definición, 453
internacionales, 92–93

1076
Estilo de práctica, en investigación de resultados, 453
Estrategia
concurrente convergente, 431–433, 432f
de ensayo y error, para adquirir conocimiento, 12
explicativa secuencial, 431, 435–436, 435f
exploratoria secuencial, 431, 433–435, 434f
Estratificación, 239
Estrés
grave, en estudios cualitativos, 363c
oxidativo, como variable, 188t
relacionado con el trabajo (ERT), 437
Estructura(s)
de la asistencia, definición, 452
en los resultados, 444
Estudio(s)
cualitativos
análisis de datos, 358c, 362, 363c
credibilidad y significado, 362
identificación de componentes, 358c, 361
proceso de investigación, guías para identificar componentes, 361
puntos fuertes y débiles, 361–362
recogida de datos, 358c, 361–362, 363c
resumen de la literatura, 165t
tamaño muestral, 251–254, 253c
adecuación, 253c
ámbito del estudio, 252
calidad de la información, 252
diseño del estudio, 252–254
guías de valoración crítica, 253c
naturaleza del tema, 252
valoración crítica, 357–384, 363c, 363f
ejemplo de investigación, 363c, 363f
intelectual, 336–337
para la práctica de enfermería, 333–386

1077
principios clave, 337c
revisión de la literatura, 158–160, 158c
cuantitativos
análisis de datos, 343–344
comunicación de datos, 343–344
determinación de los puntos fuertes y débiles, 343–344
evaluación de la credibilidad y el resultado, 338c, 344
identificación de los pasos del proceso de investigación, 343
recogida de datos, 343–344
resumen de la literatura, 165t
valoración crítica, 344–357
ejemplo de investigación, 345c, 345f
guías, 338c
intelectual, 336–337
para la práctica de enfermería, 333–386
principios clave, 336–337
revisión de la literatura, 156–158, 157c
de caso, definición, 6
de cohortes
prospectivos, 456
retrospectivos, 456–457
de referencia, definición, 155
de replicación, definición, 155
de Willowbrook, 92, 97
del Jewish Chronic Disease Hospital, 92, 97
económicos, 458
fisiológico, marco, 186, 186c, 187f
fraudulentos, en investigación, 114
iniciales, definición, 155
piloto, 43
poblacionales, 457–458
publicado, valoración, en una revisión de la literatura, 155–156
relevantes, definición, 155
sobre la sífilis de Tuskegee, 91

1078
Ética, en investigación en enfermería, 90–118
problemas, 112–115
Etnografía
crítica, 71
definición, 70
enfocada, 70
EVA See Escala(s), visual analógica (EVA)
Evaluación(es)
económica, 458
en la valoración de la calidad, 443
Evidencia
basada en la investigación, desarrollo de preguntas clínicas para identificar, para
su uso en la práctica, 390–394, 391–392t, 393c
de investigación, niveles, 23–24, 24f
Exactitud
de las medidas fisiológicas, 266t, 269–270
y precisión, en investigación cuantitativa, 34
Exento de revisión, 109
Expectativas del experimentador, 199
Experiencia
clínica, 3
en la investigación de métodos mixtos, 438–439, 438t
personal, 12–13
adquisición de conocimiento, 12
Experimento(s)
características, 29
médicos nazis, 91, 102
Explicación, definición en investigación en enfermería, 18–19
Exposición al formaldehido (FA), como variable, 188t

F
Fabricación de datos, en investigación, 114–115
FACES Pain Rating Scale de Wong-Baker, 283f
Facilitador, en un grupo focal, 79
Factor, 316

1079
Falsificación, de investigación, 114–115
Falso
negativo, 272, 272t
positivo, 272, 272t
Familia
características demográficas, 363c
entrevistas, resumen, 363c
Fase I: preparación, en el modelo de Stetler de uso de la investigación para facilitar
la práctica basada en la evidencia, 414, 415f
Fase II: validación, en el modelo de Stetler de uso de la investigación para facilitar
la práctica basada en la evidencia, 414–415, 415f
Fase III: evaluación comparativa/toma de decisiones, en el modelo de Stetler de uso
de la investigación para facilitar la práctica basada en la evidencia, 415–416, 415f
Fase IV: traducción/aplicación, en el modelo de Stetler de uso de la investigación
para facilitar la práctica basada en la evidencia, 415f, 416
Fase V: evaluación, en el modelo de Stetler de uso de la investigación para facilitar
la práctica basada en la evidencia, 415f, 416
Fenomenología, 64–65
resultado, 65–67
Fenomenologistas, 64–65, 152
Fenómenos
definición, 64
diseños descriptivos, 194
en teoría, 173
Fiabilidad, 264–267
comprobación, 264–267
consistencia interna, 266t
de equivalencia, 266t
comprobación, 267
de formas alternativas, 266t, 267
de la consistencia interna, 266t, 267
de la estabilidad, 265–267, 266t
ejemplo de investigación, 271c
formas alternativas, 266t
interobservador, 266t, 267
métodos de medición, 266t, 270c

1080
en el proceso de análisis de datos, 300
test-retest, 265–267, 266t
Fidelidad de la intervención, 202
Filosofía
de Heidegger, investigación fenomenológica, 65
de Husserl, 65
definición, 174
elemento básico de una teoría, 174
Financiación, en diseños de métodos mixtos, 437
Fisher, Ronald, 30
Food and Drug Administration (FDA) estadounidense, para la protección de los
sujetos humanos, 94
Formato PICO, 391–392, 396–397, 404, 426
Formulario de asentimiento, muestra, 107c
Foros online, 82
Fotovoz, 82
Frecuencia cardíaca, como medida fisiológica, 269
Fuentes
actuales, definición, 155
citación, 163
comprensión, 164
de muestras, bases de datos extensas, 454–455, 454f
primarias, definición, 155
secundarias, definición, 155
síntesis, 166

G
Generalizabilidad, 63–64
Generalización
de los hallazgos estadísticos, 328
definición, 46
en el proceso de análisis estadístico, 295
en la teoría del muestreo, 230
Geriatric Nursing, 48
gl See also Grados de libertad (gl)

1081
Google Académico, como base de datos para las revisiones de la literatura en
enfermería, 162t
Grabación
en audio, 79–80
en vídeo, 79–80
Grados de libertad (gl), 299
Gráficas de dispersión, 306–307, 306–307f, 318f
Gráficos de embudo, 405, 405f
Grandes teorías de enfermería, 178–179, 178t
marco, 182–183, 182c
Grupo(s)
control, 211
de comparación See Grupo(s), control
de tratamiento See Grupo(s), experimental
dependientes, 310
emparejados, 310
experimental, 213
focales, 79–81, 80c
independientes, 310
investigación de teoría fundamentada, 67
múltiples, en diseños experimentales, 220
Guía(s)
basadas en la evidencia, introducción, 24–25
de valoración crítica
para cuestionarios, 282c
para el análisis de datos, 310–312
para el error de medición, 270c
para el marco de un estudio, 181c
para entrevistas, 280c
para la adecuación
de la muestra, en estudios cualitativos, 253c
del muestreo, en estudios cuantitativos, 234c, 247c
para la especificidad y sensibilidad, 273c
para la fiabilidad y validez, 270c

1082
para la medición observacional, 278c
para la protección de los derechos humanos, 103, 103c
para la recogida de datos, 288c
para la viabilidad del problema y del propósito de un estudio, 130c
para las escalas, 285c
para las hipótesis en estudios, 139c
para los aspectos éticos de un estudio, 111, 111–112c
para los objetivos y preguntas de investigación, 133c
para los problemas y propósitos de la investigación, 120c
para los resultados de la investigación, 329c
para metasíntesis, 407c
para revisiones
de la literatura, 156c
sistemáticas de métodos mixtos, 411c
para una prueba
de cribado, 273c
diagnóstica, 273c
para variables, 143c
sobre el proceso de consentimiento informado, 107, 107c
SBIRT See Guía(s), Screening, Brief Intervention, and Referral to Treatment (SBIRT)
Screening, Brief Intervention, and Referral to Treatment (SBIRT), 426
Guidelines Advisory Committee, página web, 422c
Guidelines International Network, página web, 422c

H
H0 See Hipótesis, nula (H0)
Hallazgos
en la investigación de métodos mixtos, 438t, 440–441
estadísticos, 327–328
evaluación de la relevancia, 327
Hambruna, trabajo de Florence Nightingale, 6
Health Insurance Portability and Accountability Act (HIPAA)
autorización para usos y divulgación de la investigación, 104
desarrollo, 94–95

1083
Health Source: Nursing/Academic Edition, como base de datos para las revisiones
de la literatura en enfermería, 162t
Healthy People 2000, 10
Healthy People 2010, 10
Healthy People 2020, 129
página web, 129
Heart Success Transition Model, 345c, 345f
HerbMed: Evidence-Based Herbal Database, página web, 422c
Hermenéutica, descripción, 65
Heterogeneidad, en metaanálisis, 402
HIPAA See Health Insurance Portability and Accountability Act (HIPAA)
Hipertensión, cuidados basados en la evidencia, 5, 5f
Hipótesis, 135–140, 177t
asociativa
definición, 135–136
frente a causal, 135–137
causales
definición, 136, 137f
frente a asociativas, 135–137
complejas
definición, 137
frente a hipótesis simples, 137–138, 137f
comprobable, 140
de investigación, 119–149
definición, 139
frente a estadística, 139–140
definición, 41–42
desarrollo, de diseños descriptivos, 204
determinación, 62
direccionales
definición, 138
frente a no direccionales, 138–139, 138f
ejemplo de investigación, 139c
en las teorías, 177

1084
estadística
definición, 139
frente a investigación, 139–140
guías de valoración crítica, 139c
no direccionales
definición, 138
frente a direccionales, 137f, 138–139, 138f
nula (H0)
definición, 139
frente a hipótesis de investigación, 139–140
simples
definición, 137
frente a complejas, 137–138, 137f
tipos, 135–140, 136c, 136f
Historia
de la investigación en enfermería, 6–11
e intervención, interacción, 201
en la evaluación de la validez de los estudios, 200
influencia en el desarrollo de códigos éticos y normas, 91
Homogeneidad, 266t, 267

I
IC See Intervalo de confianza (IC)
Identificadores digitales de objetos (DOI), 167–168
Idoneidad, en la investigación de métodos mixtos, 438t, 439
Implementación, pasos del proceso de enfermería, 36
Implicaciones para enfermería, en la investigación científica, 328
Importancia clínica, estadística, 327–328
Incertidumbre en la teoría de la enfermedad, 179t
Indicadores
de conceptos de la teoría de la medición, 260–261
de proceso, 455t
de resultados, 455t
estructurales, 455t

1085
Índice de masa ósea, como medida fisiológica, 269
Inferencia, en el proceso de análisis estadístico, 295
Información
calidad, en estudios cualitativos, 252
privada identificable (IPI), 99
sanitaria
protegida (ISP), 94–95
que permite identificar al individuo, 99
Informantes clave, en investigación cualitativa, 76
Informe(s)
Belmont, 93
de investigación, 132–140
análisis, 52
comprensión, 52
contenido, 48–51
discusión, 51
frente a lectura rápida, 52
fuentes, 48
introducción, 50
lectura, 48–52
consejos, 51–52
métodos, 50
referencias, 51
resultados, 50–51
resumen, 48
secciones, 151
Ingresos, como variable demográfica, 145
Inmersión
en investigación etnográfica, 70
en los datos, 84–85
International Journal of Nursing Studies, 8
International Journal of Nursing Terminologies and Classification, 8
International Orem Society, 178
Interpretaciones

1086
de la investigación cualitativa, 85–86, 85–86c
de la prueba
de independencia de χ2, 320–321
t, 322–323
de los resultados de la investigación, 326–329
conclusiones, 328
generalización de los hallazgos, 328
guías de valoración crítica, 329c
hallazgos, 327–328
implicaciones, 328
limitaciones, 328
recomendaciones para estudios adicionales, 328–329
del análisis de la varianza (ANOVA), 324–325
Intervalo de confianza (IC), 305
Intervenciones
análisis, en estudios de enfermería, 211–213
del estudio, definición, 36
Intuición, definición, 13
Invasión de la privacidad, 99
Investigación
aplicada, definición, 33
autorización de la revelación, 104–105
básica, definición, 33
clínica, historia, 6
conductual, realización ética, 91
consentimiento informado, 104–108
cualitativa
características, 15t
códigos, 85
conceptos de investigación, 144
definición de proceso, 16
documentos y materiales multimedia, 82–84
exploratoria-descriptiva, 73–75, 74c, 127
ejemplos, 125–126t, 127

1087
orientación filosófica, 73
resultado previsto, 73–75
historia, 9
identificación de los componentes, en estudios cualitativos, 361
introducción, 15–17
métodos de muestreo probabilísticos y no probabilísticos, 238t
orientación filosófica, 357, 358c
preguntas de investigación, 135c
problemas y propósitos en los distintos tipos, 125–127, 125–126t
programas informáticos, 63, 84
propósito de la revisión de la literatura, 152
tipos y clasificación, 15c, 16–17
valoración crítica, proceso, 357–362
cuantitativa, 55c
control, 34–35
de los problemas y propósitos de investigación, 120c
definición, 30
de términos relevantes, 32–36
elementos controlados, 35c
identificación de los problemas y el propósito, 123–124t
introducción, 15–17, 29–58, 60
a los diseños, 191–227
abordajes de métodos mixtos, 431–441
análisis de la causalidad, 211–213
conceptos relevantes, 194–196
diseños
cuasiexperimentales, 214–218, 217c, 219f
de correlación, 204c, 206–210
descriptivos, 202–206, 204c
experimentales, 217c, 218–226, 219f
ensayos controlados aleatorizados, 222–226
estudios de enfermería, 192–193, 193f
validez, 196–202
medición y recogida de datos, 259–291

1088
conceptos de la teoría de la medición, 260–269
métodos de muestreo
no probabilísticos, 242–244
probabilísticos frente a no probabilísticos, 238t
objetivos de investigación, 132–133
preguntas de investigación, 134c
problemas y propósitos en los distintos tipos, 123–124t
procesos
definición, 15–16
identificación de los pasos, 38–48, 39f
solución de problemas y procesos de enfermería, 37
y proceso de investigación cualitativa, similitudes y diferencias, 61t
propósito de la revisión de la literatura, 151
representatividad de la muestra, 231–236
rigor, 34
síntesis, 23
tamaño muestral, 247c
adecuación, 244–245, 247c
guías de valoración crítica, 247c
número de variables, 246
sensibilidad de la medición, 246
tamaño del efecto, 245–246
técnicas de análisis de datos, 246–248
tipos, 246
tipos, 30–32, 31f
valoración crítica, proceso, 338–344, 338c
variables, tipos, 141–142
cuasiexperimental, 35t
ejemplo, 123–124t
introducción, 15c, 16
pasos, 53c
práctica de lectura, 52–56
problemas y propósitos, 125
propósito, 53

1089
de correlación, 35t
definición, 31
ejemplo, 123–124t
introducción, 15c, 16
problemas y propósitos, 124
propósito, 124
de etnoenfermería, descripción, 70
de métodos mixtos
algoritmo para identificación, 432f
bases filosóficas, 431
dificultades, 436–437
financiación, 437
generalidades, 431–436
introducción, 17
recursos, 436–437
relevancia, 437
valoración crítica, 437–441, 438t
y diseño, 431–441
de resultados, 441–462
áreas esenciales, 17
base teórica, 442–443
centrada en el paciente (PCOR), 446
con práctica basada en la evidencia, 17
enfermería de práctica avanzada, 449
estructura, 444
indicadores, 455t
iniciativas nacionales, 446–449
introducción, 17
metodologías, 453–458
diseños de estudio, 455–458
métodos de medición, 458
muestras y muestreo, 454–455
métodos estadísticos, 459
análisis

1090
de la mejoría, 459
del cambio, 459
origen, y supervisión, 445–446
paciente y salud
de papel
dependiente, 444–445
independiente, 444–445
interdependiente, 444–445
papel del profesional de enfermería, 444–445
práctica de enfermería, 449–453
representatividad de la muestra, 231–236
resultados sensibles a enfermería, 443–445
valoración crítica, 459–462, 460–461c
de teoría fundamentada
definición, 67–70
ejemplo, 68c, 69f
resultado previsto, 68–70
ejemplos, 125–126t
introducción, 16
problemas y propósitos, 127
propósito de la revisión de la literatura, 152
uso del muestreo teórico, 250–251
definición, 2
del laboratorio a la cabecera del paciente, 425
descriptiva, 35t
definición, 30–31
introducción, 15c, 18
en enfermería, 1–28
adquisición de conocimiento, 14–17
análisis de intervenciones, 211–213
características y papeles, 2–3
consentimiento informado, 104–108
de, 1900 a la década de, 1970, 6–8
definición, 2–3

1091
desarrollo, 6–11, 7t
diseños
descriptivos, 202–206
comparativos, 205–206
en las décadas de, 1980 y, 1990, 8–9
estadística
descriptiva, 301–309
determinación de la idoneidad de la estadística inferencial, 309–312
interpretación de los resultados de investigación, 326–329, 329c
para examinar
diferencias, 319–325
relaciones, 312–317
para predecir los resultados, 317–319
pasos del proceso de análisis de datos, 299–300, 299c
teorías y conceptos del proceso de análisis estadístico, 293–299
ética, 90–118
historia, 6–11, 7t
objetivos para el siglo XXI, 10
papel de los profesionales de enfermería, 20–21, 20t
entorno, 35–36
estadística, 292–332
árbol de decisión/algoritmo, para identificar una técnica de análisis apropiada,
311f
determinación de la idoneidad de la estadística inferencial, 309–312
estadística descriptiva, 301–309
interpretación de los resultados de investigación, 326–329, 329c
para examinar
diferencias, 319–325
relaciones, 312–317
para predecir los resultados, 317–319
pasos del proceso de análisis de datos, 299–300, 299c
teorías y conceptos del proceso de análisis estadístico, 293–299
estándares éticos, 92–95
etnográfica

1092
antropología, 70
cultura, 70, 76
ejemplo, 71c, 125–126t
en investigación cualitativa, 70–73, 72c
introducción, 17
problemas y propósitos, 127
relación investigador-participante, 76–77
resultado previsto, 71–73
revisión de la literatura, 152
experimental, 35t, 125
ejemplo, 123–124t
práctica de lectura, 52–56
propósito, 32
fenomenológica
definición, 64–67
descriptiva, 65
ejemplo, 66c, 125–126t, 127
interpretativa, 65
introducción, 16
orientación filosófica, 64–65
valoración crítica, en estudios cualitativos, 363c
genómica, 112–113
no ética, 91–92
no terapéutica, 93
poblaciones y muestras, 228–258
cuantitativa, métodos de muestreo no probabilísticos, 242–244
entornos de investigación, 254–256
métodos de muestreos probabilísticos, 237–242
muestreo en investigación cualitativa, 248–251
representatividad, 231–236
tamaño muestral en estudios
cualitativos, 251–254
cuantitativos, 244–248
teoría del muestreo, 229–231

1093
práctica See Investigación, aplicada, definición
pura See Investigación, básica, definición
revisión
de la literatura, 150–171
sistemática, 23
terapéutica, 93
traslacional
definición, 425, 427
introducción, 425–426
uso de animales, 114
valoración crítica, 25 See also Valoración crítica; Guía(s), de valoración crítica
Investigadores
estudios cualitativos
exploratorios-descriptivos, 152
valor otorgado, 60
valoración crítica de estudios, 335
Inyecciones intramusculares, aspiración durante, 392–394, 393c
IPI See Información, privada identificable (IPI)
ISP See Información, sanitaria, protegida (ISP)

J
Journal of Pediatric Nursing, Heart & Lung, 48
Justicia, principio, 96

L
Lectura de informes de investigación, 48–52
consejos, 51–52
frente a comprensión, 52
Legibilidad
de las medidas fisiológicas, 266t
grado, 266t, 269
Leininger, Madeline, sobre la visibilidad de la etnografía, 70
Libros de texto, 154
Limitaciones

1094
definición, 46
en la interpretación de los resultados estadísticos, 328
metodológicas, 328
Línea
de tendencia, 317, 318f
de vida
con caras, 363c
con recuadro, 363c
gráfica, 363c
recargada, 363c
Literatura, 153
basada en datos, en la revisión de la literatura, 154
calidad de las fuentes, 155
empírica, 154
gris, 398
tabla resumen, 164
ejemplo, para los estudios, 165t
para estudios
cualitativos165t
cuantitativos, 165t
teórica, 154
valorar, analizar y sintetizar, 164–166

M
Maduración, en la evaluación de la validez de los estudios, 200
Magnet Recognition Program, 335
Mala praxis en investigación, 114–115
Manipulación, 196
Mantenimiento funcional, áreas de investigación de resultados, 17
Mapas, marco de investigación, 180
Mapeo, manipulación, 164
MAR See Modelo(s), de adaptación, de Roy (MAR)
Marco(s), 180–181
basados en la teoría del rango medio, 183–184, 184c

1095
comprensión de la teoría y marcos de investigación, 172–190
conceptuales, de teorías, 178
de investigación, 180–181
de muestreo, 236
de teoría tentativa, 3, 184–186, 185c
en estudios cuantitativos
puntos fuertes y débiles, 338c, 343–344
sección, 151
en investigación cualitativa, 62
estudio, en el proceso de investigación cuantitativa, 40–41, 41c
guías de valoración crítica, ejemplos, 181–186, 181c
implícitos, 180–181
para estudio fisiológico, 186, 186c, 187f
teórico, selección, 62
Master of Science in Nursing (MSN), 20t
Matronas certificadas (CNM), 449
Mead, George Herbert, teoría de interacción simbólica, 67
Media, 301t
definición, 304
diferencia, 406
en investigación cualitativa, 82–84, 83c
en las medidas de tendencia central, 304
Mediana
definición, 304
en las medidas de tendencia central, 304
Medición(es)
definición, 259–260
error, 263–264
guías de valoración crítica, 270c
estrategias en enfermería, 276–286
cuestionarios, 281–282
entrevistas, 280–281
escalas, 282–286
medición observacional, 277–280

1096
medidas fisiológicas, 276–277
fiabilidad, 264–267
inmediatez, 260–261, 261f, 270c
métodos, 458
en investigación cuantitativa, 44–45, 44c
nivel(es), 261–263, 262f, 270c
de intervalos, 262–263
nominal, 261
categorías, 261
ordinal, 262
racional, 263
observacional, 277–280
ejemplo de investigación, 278c, 279f
estructurada, 277–278
guías de valoración crítica, 278c
propósito, 263–264
puntos fuertes y débiles, en estudios cuantitativos, 338c, 341t, 343–344, 345c, 354t
recogida de datos y, en investigación cuantitativa, 259–291
conceptos de la teoría de la medición, 260–269
estrategias de medición en enfermería, 276–286
exactitud, precisión, y error de las medidas fisiológicas, 269–272
proceso, 286–289
sensibilidad, 246
validez, 267–269
Medida(s)
de dispersión, 304–307
de tendencia central, 296f, 302–304
media, 301t, 304
mediana, 304
moda, 304
directas, 260
fisiológicas, 269–272
ejemplo de investigación, 271c, 277c
error, 270–272

1097
exactitud, 269–270
precisión, 270
indirectas, de conceptos, 260–261
verdadera, 263
MEDLINE, como base de datos para las revisiones de la literatura en enfermería,
162t, 391–392t
Mejor evidencia de la investigación, 3, 21–25, 388
Metaanálisis
criterios de búsqueda/estrategias, 404–405
de literatura de investigación, 22t, 23–24
definición, 23, 402, 426
pregunta(s)
clínica, 404
para dirigirlo, 404
propósito, 404
recomendación sobre la información que debe incluirse en los informes para
facilitarlo, 403c
resultados, 406
sesgos posibles, 405–406
valoración crítica, 394–406
como revisión sistemática, 401
detallado, 398–399
directo, 396–397
elementos clave, 400
estudios, 400–401
identificado, 397
informe, 402
literatura de investigación, 397–398
propósito/objetivos, 397
realización, 394
resultados, 401
resumen, 396
sección de discusión, 402
sesgos de publicación, 400
Metarresumen, 407

1098
cualitativo, 407
Metasíntesis, 22t
análisis de los datos, 410
búsqueda de la literatura, 408–409, 409t
definición, 23, 407, 426
determinación del marco, 407–408
discusión de los hallazgos, 410
selección de las fuentes, 408–409, 409f
valoración
crítica, 406–410, 407c
de los estudios, 410
Métodos
de muestreo
no probabilísticos, muestreo
por conveniencia, 238t, 242–244, 243c
por cuotas, 244, 244c
probabilísticos y no probabilísticos, 238t
en la investigación de métodos mixtos, 438t, 439–440
Minnesota Living with Heart Failure Questionnaire (MLHFQ), 354t
Moda
definición, 304
medidas de tendencia central, 304
Modelado de roles, aprendizaje, 13
Modelo(s)
conceptuales, definición, 178 See also Grandes teorías de enfermería
de adaptación, 178t
de Roy (MAR), 178
de efectividad del papel de enfermería, 443, 445f
de Grove, para implementar las guías basadas en la evidencia en la práctica, 422,
423f, 427
de Iowa, de práctica basada en la evidencia, 416–420, 417f, 419–420t, 426
aplicación, 418–420
de Stetler de uso de la investigación para facilitar la práctica basada en la
evidencia, 414–416, 415f, 426
fase I: preparación, 414, 415f

1099
fase II: validación, 414–415, 415f
fase III: evaluación comparativa/toma de decisiones, 415–416, 415f
fase IV: traducción/aplicación, 415f, 416
fase V: evaluación, 415f, 416
marco de investigación, 180
Moderador, en grupos focales, 79
Molestias
temporales, 101
niveles inusuales, 101
y daños, derecho a la protección, 101–102
Monografías, definición, 153
Mortalidad, definición, 444t
MSN See Master of Science in Nursing (MSN)
Muestras
definición, 43, 44c, 229
descripción, en el proceso de análisis de datos, 300
en investigación de resultados, 454–455
heterogéneas, 230
homogéneas, 230
poblaciones, 228–258, 229f
entornos de investigación, 254–256
métodos de muestreo
no probabilísticos, en investigación cuantitativa, 242–244
probabilísticos, 237–242
muestreo en investigación cualitativa, 248–251
representatividad, 231–236
tamaño muestral en estudios
cualitativos, 251–254
cuantitativos, 244–248
teoría del muestreo, 229–231
valoración crítica
en estudios
cualitativos, 358c
cuantitativos, 338c, 345c

1100
Muestreo
accidental See Muestreo, por conveniencia, como método de muestreo no
probabilístico
aleatorio, 36, 236, 454
estratificado, como método de muestreo de probabilidad, 238t, 239–240, 240c
simple, como método de muestreo de probabilidad, 237–239, 238t, 239c
crítico, 248–249
definición, 36
en la teoría del muestreo, 229
deliberado, 238t, 248–249, 249c
en investigación
cualitativa, 248–251
muestreo
intencional o deliberado, 248–249, 249c
por redes, 249–250, 250c
teórico, 250–251
de métodos mixtos, 438t, 439
de resultados, 454–455
en redes o en bola de nieve, 238t
intencional, 238t, 248–249, 249c
por conglomerados, como método de muestreo de probabilidad, 238t, 240–241,
241c
por conveniencia, como método de muestreo no probabilístico, 238t, 242–244,
243c
por cuotas, como método de muestreo no probabilístico, 238t, 244, 244c
por redes, 249–250, 250c
probabilístico
métodos, 237–242
muestreo
aleatorio
estratificado, 239–240, 240c
simple, 237–239, 239c
por conglomerados, 238t, 240–241, 241c
sistemático, 241–242, 242c
selectivo, 248–249

1101
sistemático, como método de muestreo de probabilidad, 238t, 241–242, 242c
teórico, 238t, 250–251, 251c
Multicausalidad, 194

N
NANDA See North American Nursing Diagnosis Association (NANDA)
National Association of Neonatal Nurses, página web, 422c
National Center for Advancing Translation Sciences (NCATS), 425
National Center for Nursing Research (NCNR), 7t, 9
National Commission for the Protection of Human Subjects of Biomedical and
Behavioral Research, 93
National Database of Nursing Quality Indicators (NDNQI), 447–449, 448t
National Guideline Clearinghouse (NGC), 421, 453
de la Agency for Healthcare Research and Quality (AHRQ), 421
National Human Genome Research Institute, 33
National Institute for Clinical Excellence (NICE), página web, 422c
National Institute of Nursing Research (NINR), 336
abordaje de las prioridades de investigación en enfermería, 129
historia, 7t, 9
misión, 10
National Institutes of Health (NIH), 437
National Library of Health (NLH), 391–392t
National Quality Forum (NQF), 447
NCATS See National Center for Advancing Translation Sciences (NCATS)
NCNR See National Center for Nursing Research (NCNR)
NDNQI See National Database of Nursing Quality Indicators (NDNQI)
Nephrology Nursing, 48
NGC See National Guideline Clearinghouse (NGC)
NICE See National Institute for Clinical Excellence (NICE)
Nightingale, Florence, 445–446
papel en investigación en enfermería, 6, 7t
NIH See National Institutes of Health (NIH)
NINR See National Institute of Nursing Research (NINR)
Niños
características demográficas, en estudios cualitativos, 363c

1102
realización ética de investigación, 98, 98f
Nivel
competente, de experiencia en enfermería, 12–13
de experto, de experiencia en enfermería, 12–13
de principiante
avanzado, de experiencia en enfermería, 12–13
de experiencia en enfermería, 12–13
de significación, 294–295 See also Alfa (α)
curva normal, 295–297
hábil, de experiencia en enfermería, 12–13
NOC See Clasificación, de resultados de enfermería (NOC)
Normas federales, para la protección de los sujetos humanos, 94–95, 94f, 95c
North American Nursing Diagnosis Association (NANDA), 7t, 8
Notas de campo, 81
NQF See National Quality Forum (NFQ)
Número de colas, de las curvas normales, 297
Nursing Care Report Card, 447
Nursing Diagnosis, 8
Nursing Research, historia, 6–8, 7t
Nursing Science Quarterly, 8–9

O
Objetivos
de investigación, 132–140, 133c
definición, 41
ejemplos, 133c
en estudios cualitativos, 358c
guías de valoración crítica, 133c
puntos fuertes y débiles, en estudios cuantitativos, 338c, 343–344
propósito, en estudios de investigación, 132
Observaciones
en investigación cualitativa, 81–82, 81–82c
estructurada frente a no estructurada, 277–280
no estructuradas, 277

1103
Obtención de datos encubierta, 97
Office of Laboratory Animal Welfare (OLAW), 114
Office of Research Integrity (ORI), 114
OLAW See Office of Laboratory Animal Welfare (OLAW)
Oncology Nursing Forum, 48
Oncology Nursing Society (ONS), 449
página web, 422c
ONS See Oncology Nursing Society (ONS)
Organizaciones de revisión de los estándares profesionales, 9
ORI See Office of Research Integrity (ORI)
Orígenes étnicos, como variable demográfica, 145

1104
P
PADCAO See Programa(s), de análisis de datos cualitativos
asistidos por ordenador (PADCAO), en investigación cualitativa
Páginas web, 153
de Healthy People, 2020, 129
de la Agency for Healthcare Research and Quality (AHRQ), 446
de la Association of Women’s Health, Obstetric, and Neonatal
Nurses, 422c
de la Guidelines International Network, 422c
de la HerbMed: Evidence-Based Herbal Database, 422c
de la HIPAA Privacy Rule, 94–95
de la National Association of Neonatal Nurses, 422c
de la Office of Research Integrity (ORI), 114–115
de la Oncology Nursing Society, 422c
de la US Preventive Services Task Force, 422c
de las Primary Care Clinical Practice Guidelines, 422c
de los Centers for Health Evidence, 422c
del Academic Center for Evidence-Based Nursing, 422c
del American Nurses Credentialing Center (ANCC), 452
del Guidelines Advisory Committee, 422c
del Informe Belmont, 93
del National Institute for Clinical Excellence (NICE), 422c
para identificar prioridades de investigación, 128–129
para programas de gestión de referencias, 162
sobre principios éticos, 95
sobre revisión institucional, 108
Palabras clave, definición, 161

1105
Paráfrasis, definición, 167
Participantes
abandono, 2, 199
definición de población, 229–230
selección
en investigación cualitativa, 76, 76c
y asignación, a los grupos, 199
Patrón
de práctica, 453
oro, 25, 272
PBE See Práctica basada en la evidencia (PBE)
PCOR See Investigación, de resultados, centrada en el paciente
(PCOR)
Pearson, Karl, enfoques estadísticos entre variables, 30
Pediatric Research Equity Act (PREA), 99
Pensamiento teórico, niveles, 177–181
Personal asistencial no titulado (UAP), 448t
Perspectiva teórica, en estudios cuantitativos, 338c
Peso, como medida fisiológica, 269
PHS See Public Health Services (PHS)
Plagio, en investigación, 114–115
Planes de muestreo, 236
Población(es)
accesible, 235f
definición, 229–230
representatividad, 231–236
definición, 43, 44c, 229–230

1106
diana, 235f
definición, 229–230
representatividad, 231–236
muestras, 228–258, 229f
entornos de investigación, 254–256
métodos de muestreo
no probabilístico en investigación cuantitativa, 242–244
probabilístico, 237–242
muestreo en investigación cualitativa, 248–251
representatividad, 231–236
tamaño muestral en estudios
cualitativos, 251–254
cuantitativos, 244–248
teoría del muestreo, 229–231
vulnerables, 94
Posdoctorado, 20t
Positivismo lógico, 15–16
Potencia, 245
definición, en estadística, 298
estadística baja, en el análisis de la validez de los estudios, 201
Práctica basada en la evidencia (PBE), 1–28, 3f, 387–429, 453
beneficios, 388–389, 426
como objetivo de enfermería, 3
definición, 388, 426
dificultades, 390
esfuerzo, 333
experiencia clínica, 3

1107
implementación, 420–425, 423f, 424t
del JNC, 8, 4
mejor evidencia de investigación, 3
modelos para fomentar, en enfermería, 414–420
páginas web, 422c
presión arterial, clasificación con intervenciones de enfermería, 4–
5, 4t
recursos, 421
Pragmatismo, 431
PREA See Pediatric Research Equity Act (PREA)
Precisión
de las medidas fisiológicas, 266t, 270
definición, en investigación cuantitativa, 34
Predicciones, definición en investigación de enfermería, 19
Preguntas
de investigación, 133–135
de un estudio
cualitativo, 135c
cuantitativo, 134c
definición, en investigación cuantitativa, 41, 41c
guías de valoración crítica, 133c
en investigación cualitativa, 77
Premisa, definición, 14
Presión arterial (PA)
clasificación, con intervenciones de enfermería, 4–5, 4t
como medida fisiológica, 269
Préstamo, en enfermería, 12

1108
Primary Care Clinical Practice Guidelines, página web, 422c
Principio
de beneficencia, 96, 101
de justicia, 96
de respeto por las personas, 95
ético, 95
aplicación, 95–103
derecho a una selección y trato justos, 102–103
Privacidad
definición, 99
derecho, 99
invasión, 99
Privacy Rule, de la Health Insurance Portability and Accountability
Act, 94–95
Probabilidad
curva normal, 295–297
de causalidad relativa frente a absoluta, 194
Problemas de investigación, 119–149
definición, en investigación cuantitativa, 38, 39c
determinación de la relevancia, 127–130
ejemplo
de investigación, 133c
de estudio cuantitativo, 121c
en investigación
cualitativa, 125–126t
cuantitativa, 123–124t
valoración crítica

1109
en estudios
cualitativos, 358c
cuantitativos, 338c
guías, 120c
viabilidad, 130–132, 130c
y propósitos, 120–122
Procedimiento de Bonferroni, 321–322, 324
Proceso(s)
de enfermería
como base para comprender el proceso de investigación
cuantitativa, 36–38
comparación
con la solución de problemas, 37
de los procesos de solución de problemas y de investigación,
37t
de investigación
comparación del proceso de enfermería, 37–38
pasos, en estudios cuantitativos, 343
cualitativa
abordajes, 64–75, 64c
exploratoria-descriptiva, 73–75, 74c
investigación
de teoría fundamentada, 67–70, 68c, 69f
etnográfica, 70–73, 71–72c
fenomenológica, 64–67, 66c
análisis de datos, 84–86, 85–86c
características, 60c
definición, 59

1110
documentos y materiales multimedia, 83c
elementos, 59–60
entrevistas, 79c
introducción, 59–89
manejo de datos, 84–86
métodos, 62
de recogida de datos, 77–84
muestreo y reclutamiento, 75–77
relación investigador-participante, 76–77, 77c
selección de participantes, 76, 76c
pasos, 60–64
rigor, 64, 86–87
valor otorgado por los investigadores, 60
y proceso de investigación cuantitativa, similitudes y
diferencias, 61t
de solución de problemas, 37
evaluación en la teoría de Donabedian, 443
variables y resultados, estudios que investigan su relación, 451t
Profesionales de enfermería
características y papeles, enfermería, investigación, 2–3
importancia de la investigación en enfermería, 2–3
negociación del papel, 68c, 69f
valoración crítica de los estudios, 335
Programa(s)
de análisis de datos cualitativos asistidos por ordenador
(PADCAO), en investigación cualitativa, 84
gestor de referencias, 162
informáticos, para investigación cualitativa, 84

1111
Promotores, 83
Proposiciones
de la investigación, 119–149
definición, en investigación cuantitativa, 38–40, 39c
determinación de la relevancia, 127–130
ejemplos de estudio cuantitativo, 121c
en investigación
cualitativa, 125–126t
cuantitativa, 123–124t
guías de valoración crítica, 121c
viabilidad, 130–132, 130c
definición, 14
ejemplo de investigación, 177t
en las teorías, 177
específicas, en las teorías, 177, 177t
generales, en las teorías, 177, 177t
Propuestas de investigación, valoración crítica, 336
Protección de los sujetos humanos, normas federales, 94–95
Protocolos basados en la investigación, 418
Proyecto Genoma Humano, 181
Prueba(s)
de cribado
cocientes de verosimilitudes, 275–276
determinación de la calidad, 272–276
especificidad, 272–275, 272t, 273c
exactitud, 272
resultados, 272

1112
sensibilidad, 272–275, 272t, 273c
de diferencia significativa honesta (DSH) de Tukey, 324
de Dunnett, 324
de fiabilidad de la homogeneidad See Fiabilidad, de la
consistencia interna
de independencia de χ2, 320–321
ejemplo de investigación, 321c
interpretación de los resultados, 320–321
de Newman-Keuls, 324
de Scheffé, 324
de significación
de dos colas, 296f, 297
de una cola, 297, 297f
diagnósticas
cocientes de verosimilitudes, 275–276
determinación de la calidad, 272–276
especificidad, 272–275, 272t, 273c
sensibilidad, 272–275, 272t, 273c
muy específica, 273
muy sensible, 273
t, 321–323
ejemplo de investigación, 322c, 322–323t
interpretación de los resultados, 322–323
PsycARTICLES, como base de datos para las revisiones de la
literatura en enfermería162t
Psychological and Behavioral Sciences Collection, como base de
datos para las revisiones de la literatura en enfermería162t
PsycINFO, 391–392t

1113
Public Health Services (PHS), bienestar de los animales de
laboratorio, 114
Publicaciones
contenido, 154
periódicas, descripción, 153
sesgo, 400
tipos, 153–154
PubMed, como base de datos para las revisiones de la literatura en
enfermería, 162t
Puntuación(es)
estandarizadas, 306
verdadera, 263
z, 306

Q
QSEN See Quality and Safety Education for Nurses (QSEN)
Qualitative Health Research, 9
Quality and Safety Education for Nurses (QSEN), 11, 334, 389

R
Rango, 305
Raza, como variable demográfica, 145
Razonamiento
deductivo, definición y ejemplo, 14
definición, 13–14
inductivo, definición y ejemplo, 14
Reclutamiento, de participantes en un estudio, 286
Recogida de datos

1114
consistencia, 286–287
control, 287
ejemplo de investigación, 288c
en estudios
cualitativos, 77–84, 358c, 362
puntos fuertes y débiles, 362, 363c
cuantitativos, 45, 45c, 338c
puntos fuertes y débiles, 343–344
estrategias de medición
cuestionarios, 281–282
entrevistas, 280–281
escalas, 282–286
medición observacional, 277–280
medidas fisiológicas, 276–277
guías de valoración crítica, 288c
mediciones, en investigación cuantitativa, 259–291
conceptos de la teoría de la medición, 260–269
estrategias de medición en enfermería, 276–286
exactitud, precisión y error de las medidas fisiológicas, 269–
272, 270c
proceso, 286–289
métodos en investigación cualitativa, 77–84
documentos y materiales multimedia, 82–84
entrevistas, 77–79, 78c
grupos focales, 79–81, 80c
observación, 81–82, 81–82c
proceso, 286–289

1115
reclutamiento de los participantes en el estudio, 286
Recomendaciones para estudios adicionales, 328–329
Recuerdo, de información, en estudio de cohortes retrospectivo, 457
Reducción fenomenológica, 65
Referencia, 153
lista
comprobación de la revisión, 169
creación, 167–169
RefWorks, 163
Registro de auditoría, 362
Regresión
lineal simple, 317
múltiple, 317
Relación(es)
investigador-participante, en investigación cualitativa, 76–77, 77c
negativas, en el análisis de correlación de Pearson, 313
positivas, en el análisis de correlación de Pearson, 313
uso de la estadística para analizarlas, 312–317
Relevancia
en la investigación de métodos mixtos, 437, 438t
exploración de los hallazgos, 327
Representatividad, de la muestra en investigación cuantitativa y de
resultados, 231–236
Research in Nursing & Health, 8
Research to Accelerate Cures and Equity Act, 99
Respeto por las personas, principio, 95
Respuestas del paciente, áreas de investigación de resultados, 17

1116
Resultado(s)
adverso, definición, 444t
análisis de la varianza (ANOVA), 324–325
de estadística descriptiva, 307–309, 308c
de investigación See Investigación, de resultados
interpretación, 46, 326–329
conclusiones, 328
generalización de los hallazgos, 328
guías de valoración crítica, 329c
hallazgos, 327–328
implicaciones, 328
limitaciones, 328
recomendaciones para estudios adicionales, 328–329
de la pruebat, 322–323, 322c, 322t
de pacientes sensibles a enfermería (RPSE), 443
definición, 444t
discusión, 46–48
distal, 450
económicos, áreas de investigación de resultados, 17
fortuitos, 327
inconcluyentes, 326
inesperados, 327
mixtos, 326
no predichos, 327
no significativos, 326
predicciones, 19
proximal, 450

1117
prueba de independencia de χ2, 320–321, 321c
sección, de los informes de investigación, 49c, 50–51
sensible a enfermería, 17
significativos
y no predichos, 326
y predichos, 326
tipos, 326–327
uso de estadísticas para su predicción, 317–319
Resúmenes
definición, teorías descriptivas, 174
revisión, para identificar estudios relevantes, 163
sección, en informes de investigación, 48–50, 49c
valoración crítica, en estudios
cualitativos, 358c
cuantitativos, 336, 338c
Retención de la muestra, 233–236
adecuación, 234c
ejemplo de investigación, 234c
Revisado por pares, definición, 155
Revisión(es)
completas, por los comités de revisión institucional, 109–110
de la literatura, 160–169
bases de datos electrónicas y términos de búsqueda, 161, 162t
comprensión y valoración crítica, 150–171
en estudios
cualitativos, 358c
cuantitativos, 338c

1118
puntos fuertes y débiles, 344
en la investigación publicada, 151
fuentes incluidas, 153–155
lista de comprobación, pasos, 160c
organizar la información, 166–167
preparación, 160–161
explicación del propósito, 160–161
procesamiento, 163–166, 165t
realización, 160c, 165t
redacción, 166–169
propósito, 151–152
en investigación
cualitativa, 152
cuantitativa, 151
relevante, 62
en investigación cuantitativa, 40, 40c
valoración crítica, 155–160, 156c
en estudios
cualitativos, 158–160, 158c
cuantitativos, 156–158, 157c
expedita, 109–110, 110c
integrales, de investigación, definición, 23
sistemática
de la investigación, 23
de métodos mixtos, 22t, 23
definición, 411
hallazgos, conclusiones e implicaciones, 413–414, 413f

1119
introducción, 412
métodos de búsqueda de la literatura, 412, 412f
resultados, 413
selección de fuentes, 412
valoración crítica, 410–414, 411c
selección de estudios, 409f
sesgos posibles, 405–406
valoración crítica, 394–406, 395–396t
definición, 394, 426
diagrama de flujo, 399f
Revistas
clínicas, 153, 154t
con revisores externos, 336
Riesgos
balance con los beneficios, Código de Núremberg, 92–93
cociente riesgo-beneficio, 111
daño permanente, a los sujetos, 101
mínimos, definición, 106–107
molestias temporales, 101
Rigor
definición, en investigación cuantitativa, 34
en investigación cualitativa, 64, 86–87
valoración crítica, en estudios cualitativos, 363c
Roy Adaptation Association, 178
RPSE See Resultado(s), de pacientes sensibles a enfermería (RPSE)

1120
Saneamiento, trabajo de Florence Nightingale, 6
Satisfacción del paciente
áreas de investigación de resultados, 17
con la asistencia, definición, 444t
Saturación
de los datos del estudio, 251–252
en investigación cualitativa, 62–63
Scholarly Inquiry for Nursing Practice: An International Journal, 335
Science of Unitary Human Beings, 178t
Sección
de discusión, de los informes de investigación, 47c, 49c, 51, 151
de introducción
de los informes de investigación, 49c, 50
en una revisión de la literatura, 158
de métodos
de los informes de investigación, 49c, 50, 151
de un artículo de investigación, 131–132
de referencias, de los informes de investigación, 49c, 51
Selección
e intervención, interacción, 200
justa, derecho, 102–103
Sensibilidad
al cambio, en investigación de resultados, 458
ejemplo de investigación, 274c
Separación, definición, 433
Servicios sanitarios, investigación de enfermería, 2–3
Sesgo

1121
de citación, 400
de comunicación de resultados, 400–401
de idioma, 400
de localización de los estudios, 400
de publicación duplicada, 400
de retraso temporal de los estudios, 400
definición, 195
metodológico, 400–401
monooperación, 198–199
protección, 202
sistemático See Variación(es), sistemática, definición
Sexo, como variable demográfica, 145
Sífilis, estudio en afroamericanos, en el estudio no ético de
Tuskegee, 93
Sigma Theta Tau International, descripción, 8
Simétrica, definición, 312–313
Síntesis
de investigación, valoración crítica, 394–406
multinivel, 411
paralela, 411
Síntomas, definición, 444t
Sistema de préstamo interbibliotecario, 163
Sondeos, en investigación cualitativa, 77
SORT See Standardized Reporting of Trials (SORT)
Standardized Reporting of Trials (SORT), 222
Sujetos See Participantes
autodeterminación, derechos, 96–99

1122
consentimiento informado, 104–108
definición de población, 229–230
disponibilidad, 131–132
protección
Código de Núremberg, 92–93
derechos humanos, 95–103
reclutamiento, 286
selección y trato justos, 102–103
Sunshine Model of Transcultural Nursing Care, 70
Suposiciones, definición
de investigación cuantitativa, 40–41
de modelo conceptual, 178

T
Tabaquismo, daño pulmonar, como ejemplo de investigación de
correlación, 31
Tabla de números aleatorios, 238t
Tamaños
del efecto, 405
definición, 245–246
en estadística, 298
muestrales en estudios
cualitativos, 251–254
cuantitativos, 244–248
adecuación, 244–245, 247c
guías de valoración crítica, 247c
número de variables, 246
sensibilidad de la medición, 246–248

1123
tamaño del efecto, 245–246
técnicas de análisis de datos, 246–248
tipos, 246
Tasa(s)
de aceptación
adecuación, 234c
de los sujetos, 232–233
de mortalidad estandarizada (TME), 457
de rechazo
adecuación, 234c
de los sujetos, 232–233
ejemplo de investigación, 234c
Técnicas estadísticas, definición, 299
Tema(s)
de investigación, 119–120, 120f
en investigación
cualitativa, 125–126t
cuantitativa, 123–124t
de la investigación cualitativa, 85–86
y subtemas esenciales, en estudios cualitativos, 363c
Teoría(s)
científica, 181
conceptos, 174–176
de Donabedian, 442
sobre la calidad de la asistencia sanitaria, 450f
resultados sensibles a enfermería, 443–445
de la autotrascendencia, 179t

1124
de la comodidad, 179t
de la conducta de búsqueda de asistencia, 180, 180f
de la decisión, 294–295
de la fuerza interior, 179t
de la Incertidumbre frente a la Enfermedad Aguda y Crónica
(1988), 183–184
de la interacción simbólica, 67
de la ira de las mujeres, 179t
de la probabilidad, en estadística, 293–294
de las transiciones, 179t
de logro de metas, 178t
de los síntomas desagradables, 179t
de medición, conceptos, 260–269
error, 263–264
fiabilidad, 264–267, 270c
inmediatez de la medición, 260–261, 261f
niveles, 261–263, 262f
validez, 267–269, 270c
de muestreo
criterios de elegibilidad, 230–231
poblaciones y elementos, 229–230, 229f
de práctica, teorías de rango medio, 179
de rango medio, 172–173, 179t
definición, 179
ejemplo de investigación, 184c
marco basado en ellas, 183–184
de sistemas de la familia, 185

1125
declaraciones relacionales, 177, 177t, 180f
definición, 173
del capital intelectual de enfermería, 179t
del cuidado, 179t
del déficit de autocuidado, 178t
del Logro de Metas de King, 182
elementos, 173–177, 175f
constitutivos, 174f
en el marco del estudio, 40–41
específicas de situación, 179
grandes teorías de enfermería, 178–179, 178t
logro de metas, 178t
marcos, 172–190
práctica, 179
rango medio, 179, 179t
marco basado en ella, 183–184, 184c
sustantivas, 179
tentativa, 181
marco, 3, 184–186, 185c
Tesis, 153
TME See Tasa(s), de mortalidad estandarizada (TME)
«Todo cohesivo», 86
Toma de decisiones
en el modelo de Stetler de uso de la investigación para facilitar la
práctica basada en la evidencia, 414, 415f
proceso, 413f, 416
Trabajo de fin de máster, definición, 153

1126
Tradiciones, definición en enfermería, 11
Transcripción(es), 84
de entrevistas, 65, 84
Trato justo, derecho, 102–103
Triangulación, 66c
Tutoría, 13

U
UAP See Personal asistencial no titulado (UAP)
UCIN See Unidad de cuidados intensivos neonatales (UCIN)
Unidad de cuidados intensivos neonatales (UCIN), 71
Uniform Hospital Discharge Data Set, 445–446
Universal Minimum Health Data Set, 445–446
US Preventive Services Task Force, página web, 422c
Utilización de la asistencia sanitaria, definición, 444t

V
Validez
concurrente, 266t, 269
convergente, 266t
de constructo, 196–199, 197–198t, 266t, 268
de contenido, 266t, 268
de la conclusión estadística, 197–198t, 201–202
de las medidas fisiológicas, 266t
del estudio, 196
del instrumento, 267–269, 270c
diseño, 191–192

1127
divergente, 266t
ejemplo de investigación, 271c
externa, 197–198t, 200–201
interna, 197–198t, 199–200
por convergencia, evidencia, 266t, 268
por divergencia, evidencia, 266t, 268
por grupos de contraste, evidencia, 266t, 268
predictiva, 266t, 268–269
relacionada con el criterio, 266t, 268–269
tipos, 197–198t
y diseños cuasiexperimentales, 214
Valoración crítica, 333
de estudios
cualitativos, 357–384, 363c, 363f
cuantitativos, 344–357, 345c, 345f
en enfermería, 334–336
después de la presentación y publicación, 335
para la presentación y publicación, 336
por estudiantes, 334
por profesionales, docentes e investigadores de enfermería,
335
propuestas de investigación, 336
de investigación de resultados, 459–462, 460–461c
de la muestra en estudios
cualitativos, 358c
cuantitativos, 338c, 345c
de las revisiones de la literatura, 155–160, 156c

1128
de un resumen, 336
intelectual, 334, 336–337, 384
de estudios
cualitativos, 336–337
cuantitativos, 336–337
pasos, 334
principios clave, 336–337, 337c
proceso en investigación
cualitativa, 357–362
cuantitativa, 338–344, 338c
Valores atípicos, 300
Variabilidad See Medida(s), de dispersión
Variables
ambientales, 142
causalidad, 194
de confusión, 142
de investigación, 141
definición, 140–141
en investigación cuantitativa, 42, 42c
en una teoría, 175, 175f, 188t
demográficas, 145–146, 145c, 145–146t, 300, 345c
dependientes, 141, 345c
en investigación cuasiexperimental, 215–216f, 217c, 219f
en un diseño de correlación predictivo, 208–209, 209f
diseño de correlación, 206–207
distribuciones de frecuencias no agrupadas, 301, 301t
en diseños descriptivos, 192–193

1129
en investigación
cuantitativa
definiciones, 140–141, 143c
tipos, 142–144, 143c, 143t
cuasiexperimental, 214, 215–216f
estructurales, 452
y resultados, estudios que investigan su relación, 451t
externas, 35, 142
en investigación cuantitativa, 35
guías de valoración crítica, 143c
independientes, 141, 345c
en investigación
cuantitativa, 32
cuasiexperimental, 192–193, 215–216f
en un diseño de correlación predictivo, 208–209, 209c
investigación, 141
número, en estudios cuantitativos, 246
puntos fuertes y débiles, en estudios cuantitativos, 338c, 343–344
y resultados, estudios que investigan la relación, estructural, 451t
Variación(es)
aleatoria, definición, 232
externas, del entorno del estudio, 201
sistemática, definición, 232
Varianza(s), 305
cálculo, 301t, 305
explicada, 313, 314f
externas, en el entorno del estudio, 201

1130
intergrupal, 323
intragrupal, 323
no explicada, 313, 314f
total, 323
Ventilación, trabajo de Florence Nightingale, 6
Verdadero
negativo, 272, 272t
positivo, 272, 272t
Verificación, de los datos del estudio, 252
Viabilidad, de un problema y propósito, 130–132
consideraciones éticas, 132
guías de valoración crítica, 130c
Viabilidad/fidelidad del tratamiento, en estudios cuantitativos, 345c
Violación de la confidencialidad, 100–101

W
Western Journal of Nursing Research, 8, 335
Wikipedia, 153
Worldviews on Evidence-Based Nursing, 10

1131
Interior de
contracubierta
NIVELES DE EVIDENCIA DE LA
INVESTIGACIóN

1132
1133
Índice
Portada 2
Índice de Capítulos 4
Página de créditos 13
Dedicatoria 16
COLABORADORAS Y REVISORAS 17
PRÓLOGO 19
AGRADECIMIENTOS 25
Capítulo 1: Introducción a la investigación en
enfermería y su importancia en el desarrollo de una 28
práctica basada en la evidencia
¿QUÉ ES LA INVESTIGACIÓN EN ENFERMERÍA? 31
¿QUÉ ES LA PRÁCTICA BASADA EN LA EVIDENCIA? 32
DESARROLLO HISTÓRICO DE LA INVESTIGACIÓN EN
38
ENFERMERÍA
ADQUISICIÓN DE CONOCIMIENTOS DE ENFERMERÍA 48
ADQUISICIÓN DE CONOCIMIENTOS A TRAVÉS DE LA
55
INVESTIGACIÓN EN ENFERMERÍA
OBJETIVOS DE LA INVESTIGACIÓN PARA
IMPLEMENTAR UNA PRÁCTICA DE ENFERMERÍA 62
BASADA EN LA EVIDENCIA
COMPRENSIÓN DEL PAPEL DEL PROFESIONAL EN LA
66
INVESTIGACIÓN DE ENFERMERÍA
DETERMINACIÓN DE LA MEJOR EVIDENCIA DE LA
69
INVESTIGACIÓN PARA LA PRÁCTICA
PUNTOS CLAVE 77
Capítulo 2: Introducción a la investigación cuantitativa 87
¿QUÉ ES LA INVESTIGACIÓN CUANTITATIVA? 89
SOLUCIÓN DE PROBLEMAS Y PROCESOS DE
ENFERMERÍA: BASES PARA LA COMPRENSIÓN DEL 102
PROCESO DE INVESTIGACIÓN CUANTITATIVA
IDENTIFICACIÓN DE LOS PASOS DEL PROCESO DE
105

1134
INVESTIGACIÓN CUANTITATIVA 105

LECTURA DE INFORMES DE INVESTIGACIÓN 124


PRÁCTICA DE LECTURA DE ESTUDIOS
134
CUASIEXPERIMENTALES
PUNTOS CLAVE 141
Capítulo 3: Introducción a la investigación cualitativa 148
IDENTIFICACIÓN DE LOS PASOS DEL PROCESO DE
150
INVESTIGACIÓN CUALITATIVA
ENFOQUES DE LA INVESTIGACIÓN CUALITATIVA 157
MUESTREO Y RECLUTAMIENTO 183
MÉTODOS DE RECOGIDA DE DATOS 187
MANEJO Y ANÁLISIS DE LOS DATOS 201
RIGOR EN INVESTIGACIÓN CUALITATIVA 206
PUNTOS CLAVE 207
Capítulo 4: Análisis de la ética en investigación en
215
enfermería
INVESTIGACIÓN NO ÉTICA: PERIODO DE 1930 A 1989 217
ESTÁNDARES ÉTICOS PARA INVESTIGACIÓN 220
PROTECCIÓN DE LOS SUJETOS HUMANOS 227
COMPRENSIÓN DEL CONSENTIMIENTO INFORMADO 245
COMPRENSIÓN DE LA REVISIÓN INSTITUCIONAL 254
CUESTIONES ACTUALES EN LA ÉTICA DE LA
263
INVESTIGACIÓN
PUNTOS CLAVE 270
Capítulo 5: Evaluación de los problemas, los propósitos
280
y las hipótesis de investigación
¿CUÁLES SON LOS PROBLEMAS Y PROPÓSITOS DE LA
283
INVESTIGACIÓN?
IDENTIFICACIÓN DEL PROBLEMA Y DEL PROPÓSITO
287
EN ESTUDIOS CUANTITATIVOS Y CUALITATIVOS
DETERMINACIÓN DE LA RELEVANCIA DEL PROBLEMA
295
Y DEL PROPÓSITO DE UN ESTUDIO
ANÁLISIS DE LA VIABILIDAD DEL PROBLEMA Y DEL
301
PROPÓSITO DE UN ESTUDIO

1135
HIPÓTESIS DE LA INVESTIGACIÓN EN LOS INFORMES 305
DE INVESTIGACIÓN
COMPRENSIÓN DE LAS VARIABLES DEL ESTUDIO Y DE
321
LOS CONCEPTOS DE INVESTIGACIÓN
PUNTOS CLAVE 331
Capítulo 6: Comprensión y valoración crítica de la
340
revisión de la literatura científica
PROPÓSITO DE LA REVISIÓN DE LA LITERATURA 342
FUENTES INCLUIDAS EN UNA REVISIÓN DE LA
346
LITERATURA
VALORACIÓN CRÍTICA DE LA REVISIÓN DE LA
352
LITERATURA
REVISIÓN DE LA LITERATURA 361
PUNTOS CLAVE 378
Capítulo 7: Comprensión de la teoría y los marcos de
386
investigación
COMPRENSIÓN DE LOS ELEMENTOS DE UNA TEORÍA 388
NIVELES DE PENSAMIENTO TEÓRICO 397
EJEMPLOS DE VALORACIÓN CRÍTICA DE MARCOS DE
403
INVESTIGACIÓN
PUNTOS CLAVE 418
Capítulo 8: Introducción a los diseños de investigación
426
cuantitativa
IDENTIFICACIÓN DE LOS DISEÑOS DE INVESTIGACIÓN
428
CUANTITATIVA EN ESTUDIOS DE ENFERMERÍA
COMPRENSIÓN DE LOS CONCEPTOS RELEVANTES
PARA LOS DISEÑOS DE INVESTIGACIÓN 432
CUANTITATIVA
ANÁLISIS DE LA VALIDEZ DEL DISEÑO DE ESTUDIOS
437
CUANTITATIVOS
DISEÑOS DESCRIPTIVOS 448
DISEÑOS DE CORRELACIÓN 456
ELEMENTOS DE LOS DISEÑOS QUE ANALIZAN LA
463
CAUSALIDAD
DISEÑOS CUASIEXPERIMENTALES 467

1136
DISEÑOS CUASIEXPERIMENTALES 467
DISEÑOS EXPERIMENTALES 478
PUNTOS CLAVE 492
Capítulo 9: Análisis de poblaciones y muestras en
498
investigación
COMPRENSIÓN DE LOS CONCEPTOS CLAVE DE LA
500
TEORÍA DEL MUESTREO
REPRESENTATIVIDAD DE UNA MUESTRA EN
504
INVESTIGACIÓN CUANTITATIVA
MÉTODOS DE MUESTREO PROBABILÍSTICO 518
MÉTODOS DE MUESTREO NO PROBABILÍSTICO MÁS
529
UTILIZADOS EN INVESTIGACIÓN CUANTITATIVA
TAMAÑO DE LA MUESTRA EN ESTUDIOS
534
CUANTITATIVOS
MUESTREO EN INVESTIGACIÓN CUALITATIVA 542
TAMAÑO DE LA MUESTRA EN ESTUDIOS
549
CUALITATIVOS
ENTORNOS DE INVESTIGACIÓN 555
PUNTOS CLAVE 559
Capítulo 10: Clarificación de la medición y la recogida
565
de datos en investigación cuantitativa
CONCEPTOS DE LA TEORÍA DE LA MEDICIÓN 567
EXACTITUD, PRECISIÓN Y ERROR DE LAS MEDIDAS
584
FISIOLÓGICAS
USO DE LA SENSIBILIDAD, LA ESPECIFICIDAD Y LOS
COCIENTES DE VEROSIMILITUDES PARA DETERMINAR 589
LA CALIDAD DE LAS PRUEBAS DIAGNÓSTICAS
ESTRATEGIAS DE MEDICIÓN EN ENFERMERÍA 598
PROCESO DE RECOGIDA DE DATOS 618
PUNTOS CLAVE 625
Capítulo 11: Consideraciones sobre la estadística en
633
investigación
COMPRENSIÓN DE TEORÍAS Y CONCEPTOS DEL
636
PROCESO DE ANÁLISIS ESTADÍSTICO
IDENTIFICACIÓN DE LOS PASOS DEL PROCESO DE

1137
USO DE LA ESTADÍSTICA PARA DESCRIBIR VARIABLES 650
DETERMINACIÓN DE LA IDONEIDAD DE LA
665
ESTADÍSTICA INFERENCIAL EN LOS ESTUDIOS
USO DE LA ESTADÍSTICA PARA EXAMINAR
670
RELACIONES
USO DE LA ESTADÍSTICA PARA PREDECIR
678
RESULTADOS
USO DE LA ESTADÍSTICA PARA EXAMINAR
684
DIFERENCIAS
INTERPRETACIÓN DE LOS RESULTADOS DE
698
INVESTIGACIÓN
PUNTOS CLAVE 708
Capítulo 12: Estudios cuantitativos 714
PROPÓSITO DE LA REALIZACIÓN DE VALORACIONES
716
CRÍTICAS DE LOS ESTUDIOS EN ENFERMERÍA
PRINCIPIOS CLAVE PARA REALIZAR VALORACIONES
CRÍTICAS INTELECTUALES DE LOS ESTUDIOS 722
CUANTITATIVOS Y CUALITATIVOS
COMPRENSIÓN DEL PROCESO DE VALORACIÓN
724
CRÍTICA DE INVESTIGACIONES CUANTITATIVAS
EJEMPLO DE UNA VALORACIÓN CRÍTICA DE UN
742
ESTUDIO CUANTITATIVO
COMPRENSIÓN DEL PROCESO DE VALORACIÓN
770
CRÍTICA DE INVESTIGACIONES CUALITATIVAS
EJEMPLO DE UNA VALORACIÓN CRÍTICA DE UN
787
ESTUDIO CUALITATIVO
PUNTOS CLAVE 823
Capítulo 13: Creación de una práctica enfermera basada
832
en la evidencia
BENEFICIOS Y DIFICULTADES RELACIONADOS CON LA
835
PRÁCTICA ENFERMERA BASADA EN LA EVIDENCIA
DESARROLLO DE PREGUNTAS CLÍNICAS CON EL FIN
DE BUSCAR EVIDENCIA BASADA EN LA
840
INVESTIGACIÓN EXISTENTE PARA SU USO EN LA
PRÁCTICA
VALORACIÓN CRÍTICA DE SÍNTESIS DE

1138
VALORACIÓN CRÍTICA DE SÍNTESIS DE
INVESTIGACIONES: REVISIONES SISTEMÁTICAS Y 845
METAANÁLISIS
VALORACIÓN CRÍTICA DE METASÍNTESIS 868
VALORACIÓN CRÍTICA DE REVISIONES SISTEMÁTICAS
878
DE MÉTODOS MIXTOS
MODELOS PARA PROMOVER LA PRÁCTICA BASADA
884
EN LA EVIDENCIA EN ENFERMERÍA
APLICACIÓN EN LA PRÁCTICA DE GUÍAS BASADAS EN
894
LA EVIDENCIA
INTRODUCCIÓN A LOS CENTROS DE PRÁCTICA
903
BASADA EN LA EVIDENCIA
INTRODUCCIÓN A LA INVESTIGACIÓN TRASLACIONAL 904
PUNTOS CLAVE 905
Capítulo 14: Introducción a las metodologías de
investigación adicionales en enfermería: investigación 916
de métodos mixtos y de resultados
INVESTIGACIÓN Y DISEÑO DE MÉTODOS MIXTOS 918
INVESTIGACIÓN DE RESULTADOS 937
PUNTOS CLAVE 979
GLOSARIO 992
ÍNDICE ALFABÉTICO 1059
Interior de contracubierta 1132

1139

También podría gustarte