Está en la página 1de 5

Mtodos y herramientas para la realizacin de ciclos de mejora de la calidad en servicios de salud

Evaluar con muestreo es Si el total de casos (universo o marco decidido si nos interesa que sea un profesional
una manera eficiente y muestral) que responde a la definicin de uni- individual, un equipo, todo el centro, etctera;
til de tener datos, que se dad de estudio es pequeo o disponemos de con ello hemos contribuido a definir tambin
convierte en obligatoria si el toda la informacin en base de datos informa- el marco muestral. Sin embargo, esta decisin
universo de casos o marco tizados, podemos plantearnos la posibilidad tiene adems una gran trascendencia para de-
muestral es muy grande.
de evaluarlos todos; sin embargo, por lo gene- terminar el tamao de la muestra: el nmero
ral es ms conveniente extraer una muestra. de casos que decidamos extraer nos va a per-
El muestreo, aparte de ser el proceder de mitir obtener conclusiones sobre la calidad al
eleccin cuando el universo de unidades de nivel organizativo que previamente hayamos
estudio es relativamente grande, y obligatorio decidido, pero no a un nivel inferior. Es decir:
cuando es muy grande, tiene la ventaja de que una muestra pensada para evaluar la calidad
es menos costoso (por lo menos en tiempo) que de atencin al nivel de centro sanitario no va
evaluar la totalidad de casos, y permite obte- a servir para evaluar a cada profesional por
ner resultados tiles a corto plazo. Los incon- separado. Si queremos evaluar cmo lo hace
venientes, si es que puede llamrselos as, son, cada mdico, enfermero o fisioterapeuta, va-
por un lado, que para hacerlo correctamente mos a necesitar el mismo tamao de muestra
hay que manejar con cierta soltura unos con- pensado para el centro, pero para cada uno de
ceptos estadsticos bsicos; por otro, que puede los profesionales individuales. Es factible la
haber escpticos que no terminen de dar crdito agrupacin de muestras pensadas para nive-
a los resultados por el simple hecho de ser una les organizativos ms bajos para evaluar nive-
muestra. Es muy aconsejable prepararse para les superiores (por ejemplo, agrupar los datos
En las evaluaciones de afrontar estos dos inconvenientes porque las de cada mdico para evaluar el centro), pero
calidad solemos utilizar ventajas superan con mucho los esfuerzos que no al revs. Hay que tener esto muy claro y
inicialmente muestras puede suponer el poder evaluar con muestras. muy en cuenta al disear el estudio.
manejables, relativamente
pequeas (50 a 60 o hasta 8. Nmero de casos necesarios. 8.2. Representatividad, precisin y confianza
100 casos) pero no exentas Representatividad, precisin y confianza de la muestra
de rigor cientfico. de la muestra
Estos tres conceptos, con estos y otros nom-
La definicin del nmero de casos o unidades bres, suelen considerarse relacionados con el
de estudio necesarios para la evaluacin es uno tamao de la muestra y se utilizan a veces de
de los puntos que ms angustia produce al di- forma confusa e intercambiable, aunque son
sear una muestra. Es tambin un punto en el diferentes. Vamos a aclarar su significado.
cual, el enfoque aconsejable para los estudios Supongamos que estamos interesados
de evaluacin de la calidad puede diferir sus- en saber la altura media de los pacientes que
tancialmente del recomendado para trabajos de estn en un determinado da en las salas de
investigacin de otro tipo. Podemos adelantar espera de un centro de salud grande. Si qui-
que un tamao de muestra manejable y habi- siramos saberlo con toda exactitud, medira-
tualmente suficiente es de 50 a 60 casos, y como mos la talla de todos ellos y calcularamos la
mximo 100, pero conviene entender por qu media; en este caso, como no es una muestra,
y aprender a extraer la muestra de forma que no habra problema de representatividad, pre-
sea representativa. Para ello, tras decidir cul cisin ni confianza del resultado. Pero, y si
es el nivel o unidad organizativa para la cual son cientos de personas? Podemos considerar,
queremos extraer conclusiones, hay que tener entonces, la posibilidad de hacer una estima-
El tamao de muestra
claros los conceptos de confianza, precisin y cin midiendo la talla slo en una muestra de
decidido para evaluar
niveles organizativos representatividad de la muestra. estas personas. Al ser una muestra, el resulta-
superiores (por ejemplo, do que obtengamos est sujeto a errores, pero
centro sanitario) no sirve 8.1. Unidad organizativa para la que queremos esos errores pueden conocerse y controlarse
para evaluar niveles ms extraer conclusiones de manera que los tengamos en cuenta a la
desagregados (por ejemplo, hora de dar los resultados de nuestro mues-
cada mdico del centro). Al definir la unidad de estudio en lo relativo treo. Estos errores son de tres tipos y se rela-
al proveedor del servicio que se evala, hemos cionan con la representatividad, la precisin y
U 110 U
Diseo de estudios de nivel de calidad y la investigacin de causas. Componentes de una evaluacin

la confianza de los resultados o estimaciones tra con un intervalo de valores, dentro del cual La representatividad, la
de la muestra. sabemos (por la teora de la probabilidad) que precisin y la confianza
El primer error que podemos tener es hacer est el valor real de lo que estamos midiendo, representan tres tipos de
una seleccin sesgada de las personas que in- aunque no sepamos a ciencia cierta cul de errores diferentes que
cluimos en la muestra. Por ejemplo, suponga- los valores incluidos en el intervalo es el real podemos tener al medir con
muestreo.
mos que seleccionamos todos de las consultas (para eso tendramos que medir a todos, no
de pediatra. Obviamente, esta muestra no es a una muestra!). Cuanto ms pequeo sea el
representativa de los pacientes que esperan en intervalo que nos resulta, ms precisa ser
las consultas del centro de salud, y esto con in- nuestra estimacin, es decir, ms pequeo ser
dependencia de cuntos nios hayamos incluido este error de muestreo. Lgicamente, la esti-
en la muestra. El problema, el error, es que en macin va a ser ms precisa con intervalo de
nuestra muestra los nios estn sobrerepresen- posibles valores reales ms pequeo (menos
tados, hayamos medido muchos o pocos. Para error) cuanto ms grande sea la muestra. En
ser representativa tendramos que haber hecho nuestro ejemplo, a cuanta ms gente midamos
la seleccin de casos para la muestra de manera la talla, ms se acercar nuestra estimacin al
La representatividad hace
que todos los pacientes de todas las consultas valor real; los clculos matemticos oportunos
referencia al error de sesgo
hubieran tenido la misma oportunidad de en- nos mostraran que podemos dar nuestra esti- y no depende del tamao
trar en la muestra, y no nicamente los de pe- macin con intervalos de valores posibles cada de la muestra sino del
diatra. El control del error de sesgo para que la vez ms pequeos. mtodo de obtencin de la
muestra sea representativa depende del mto- Pero an nos queda otra posibilidad de misma.
do de muestreo, no del tamao de la muestra. error: hasta qu punto estamos seguros de que
La muestra va a ser representativa (no sesgada) el valor real est realmente comprendido en
si se ha realizado de forma aleatoria, lo cual el intervalo de valores que hemos calculado?
equivale a decir que se le da a todas las unida- Est claro que slo tendremos 100% de certeza
des del universo muestral la misma oportuni- si medimos a todos los pacientes que esperan.
dad de entrar en la muestra. Otra cosa es, una Como hemos obtenido una muestra, tenemos
vez que nos aseguramos de que la muestra no una cierta probabilidad de equivocarnos si
es sesgada, en qu grado las estimaciones que afirmamos que los resultados obtenidos en la
hagamos con nuestra muestra responden o no muestra seran los que obtendramos si midi-
al valor real que tiene, en el universo muestral, ramos a todos los pacientes. Esta probabilidad La precisin de los datos
lo que estamos midiendo con una muestra. Es de estar o no equivocados al afirmar que el va- medidos en una muestra
decir, siguiendo con nuestro ejemplo, hasta qu lor real es uno de los valores del intervalo que se refiere a un error de
punto podemos inferir la altura media real de hemos calculado para saber la precisin, es lo muestreo que podemos
todos los que estn esperando en las consul- que se conoce como significacin o grado de calcular y reconocer
tas a partir de una muestra representativa (no confianza de la estimacin que hemos obtenido dando el resultado de la
evaluacin con un intervalo
sesgada) de los mismos. Para saberlo, tenemos con el muestreo. La confianza en el resultado
de valores, dentro del cual
que tener en cuenta los otros dos errores que, del muestreo aumentar, naturalmente, si au-
est el valor real.
stos s, varan con el tamao de la muestra. mentamos el tamao de la muestra, pero tam-
Una de las cosas que nos va a preocupar bin si decidimos dar el resultado con menos
es la precisin de la estimacin. Sabemos que precisin (con un intervalo de valores ms am-
el valor que encontramos en la muestra puede plio). Pensemos en nuestro ejemplo: si decimos
no ser el real pero, y si, a partir de la estima- que, segn los resultados de la muestra repre-
cin de la talla media que hemos obtenido en sentativa (es decir, sin sesgo, extrada de forma
la muestra y teniendo en cuenta la variacin aleatoria), la altura media estimada es de 160
(dispersin) de valores diferentes y el tamao cm y que la media real est en un intervalo de
de la muestra, tuviramos un medio para afir- 20 cm en torno a esa media estimada (es decir,
mar que el valor real se encuentra entre unos entre 140 y 180 cm), tendremos menos posibi- La precisin aumenta (es
determinados lmites? As podramos conocer lidades de equivocarnos (ms confianza) para decir, el intervalo de valores
la magnitud de este error. Pues bien, el medio un mismo tamao de muestra, que si afirma- posibles disminuye) a
de calcularlo existe, y la forma de reconocerlo mos que el valor real est entre 160 cm 5 cm medida que aumenta el
y controlarlo es dar el resultado de la mues- (es decir, entre 155 y 165). tamao de la muestra.

U 111 U
Mtodos y herramientas para la realizacin de ciclos de mejora de la calidad en servicios de salud

Dado que ambos errores (representados z2 p (1 - p)


por la precisin y la confianza), aunque dife- n=
rentes, estn indisolublemente unidos y ambos i2
dependen del tamao de la muestra, cuando Si la variable que se va a medir es cualitativa;
se dan los resultados de mediciones con base es decir si en cada unidad de estudio se mide
en una muestra se suelen (en realidad se deben) la presencia o ausencia de algo (una cualidad
La confianza es una medida acompaar de la medida de estos dos errores, determinada), y el resultado de toda la mues-
de otro posible error del que es lo que se conoce conjuntamente como tra se resume en proporcin o porcentaje de in-
muestreo y representa intervalo de confianza del resultado obtenido. El dividuos que tienen esa cualidad; por ejemplo,
la probabilidad de que intervalo hace referencia a la precisin y se ex- cumplimiento o incumplimiento de un deter-
el resultado que hemos presa como una cierta cantidad, que hay que minado criterio.
obtenido con la muestra sumar y restar al valor estimado que hemos z2 2
(precisin incluida) sea obtenido en la muestra, y la confianza hace re- n=
cierto. Esta confianza o ferencia al grado de certeza del resultado que i2
probabilidad de certeza se hemos obtenido (intervalo incluido) y se suele
expresa en porcentaje y,
expresar en porcentaje. Este porcentaje expre- Si la variable es cuantitativa; es decir si lo que
como valor aceptable, se
sa la probabilidad de que el valor real sea de medimos en cada individuo de la muestra es
suele establecer 95%.
verdad uno de los que est incluido en el inter- la magnitud o cantidad en que la variable en
valo; por ejemplo un intervalo de confianza de estudio est presente (por ejemplo, peso, talla,
95% quiere decir que estamos un 95% seguros tiempo de espera, etc.), y el resultado de toda
de que el valor real est dentro del intervalo o, la muestra se resume como cantidad media
lo que es lo mismo, que la probabilidad de que (peso medio, talla media, tiempo de espera
el valor real sea un valor de fuera del intervalo medio, etc.).
es slo de 5%. En nuestro ejemplo, si el resul-
tado de la medicin de la talla en la muestra En estas frmulas:
representativa es de 160 cm 10 cm, para una n= tamao de la muestra que necesitamos
confianza de 95% (o lo que es lo mismo, el in- z= un nmero que depende de la confianza
tervalo de confianza de 95% es 160 10 cm), que queremos tener en el resultado. Este
quiere decir que hay 95% de probabilidades de nmero representa valores de la distri-
que sea cierto que la talla media real est entre bucin normal que se busca en las tablas
150 cm y 170 cm (o 5% de probabilidades de correspondientes, y es 1.96 para una con-
que el valor real, el que resultara de medir a to- fianza de 95%, que es la ms habitual en
dos, sea inferior a 150 cm o superior a 170 cm). estudios muestrales.
Una vez entendido el significado de los i= el intervalo o precisin, expresado en pro-
tres errores que hay que tener en cuenta al me- porcin (tanto por uno), para las variables
dir con muestra y cmo uno de ellos (el ses- cualitativas, y en unidades de medida de
go, traducido como representatividad) no de- la variable en estudio, para las cuantitati-
pende del nmero de casos de la muestra sino vas. Representa la precisin deseada. Por
del mtodo de muestreo, podemos volver a la ejemplo 0.1 si queremos que el valor real
En los trabajos de cuestin cuntos casos hacen falta para que la est en el intervalo comprendido entre lo
investigacin suelen evaluacin sea til, es decir, suficientemente que resulte en la muestra 0.1 (equivale a
emplearse frmulas para precisa y confiable? 10%).
calcular el nmero de casos El proceder habitual en los trabajos de p= la proporcin esperada de lo que se va a
necesarios que garantice investigacin es calcular, mediante frmulas, medir. Como habitualmente no se sabe,
una precisin y confianza el tamao de la muestra habiendo fijado an- se pone 0.5 (equivalente a 50%), que es el
previamente definidas. tes la precisin y la confianza, de forma que valor de p que da un nmero mayor de n,
los resultados tengan el nivel de interpreta- para garantizar que en cualquier caso la
bilidad buscado. Las frmulas que se em- muestra tendr la precisin y la confianza
plean con ms frecuencia son las siguientes:* prefijadas.
= la desviacin estndar que se espera va a te-
* El lector que no est interesado puede obviar la lectura de este aparta- ner la variable que se va a medir, expresada
do, puesto que no es estrictamente necesario para llevar a la prctica el
contenido de este captulo. en unidades de medida de esa variable.
U 112 U
Diseo de estudios de nivel de calidad y la investigacin de causas. Componentes de una evaluacin

Si el universo o marco muestral (que se repre- relacin con las necesidades de introducir La muestra de 50 a 60 casos
senta como N) es suficientemente pequeo medidas correctoras. Pinsese, por ejem- se extrae de forma aleatoria
(como regla, si la n que hemos calculado es plo, en que quisiramos un cumplimiento para que sea representativa
mayor a 10% de N), se calcula un tamao de de determinado criterio en al menos 75% y despus calculamos el
muestra ms reducido (n), pero que mantiene de los casos, y que en la muestra nos sale intervalo de confianza del
resultado obtenido.
la misma precisin y confianza. Para esto, se 30% 20; igualmente tendramos que ac-
usa la frmula tuar si la proporcin real de cumplimiento
n fuese de 10% que si fuese de 50%, que son
n =
n-1 los dos extremos del intervalo de valores
1+
N posibles. El anexo 5.2 muestra los inter-
valos de confianza de 95% para diversos
Dado que los criterios para evaluar el nivel de tamaos de muestra y estimaciones pun-
calidad son habitualmente variables cualitati- tuales del nivel de cumplimiento.
vas, se presenta un cuadro (anexo 5.1) con el l Importancia de la factibilidad del proyecto: en
nmero de casos necesarios para asegurarnos GC, tanto al inicio como para el manteni-
En las evaluaciones de
una confianza de 95% y diferentes intervalos miento de las actividades, es de gran tras- la calidad, estimaciones
(precisin), para diversas proporciones de cendencia mantener niveles lo ms altos no muy precisas dan
cumplimiento esperadas (p). En este cuadro se posible de factibilidad de los proyectos. informacin suficiente para
ha destacado la columna que corresponde a la No hay que sacrificar la factibilidad a la decidir.
proporcin esperada de 50% y el intervalos de precisin del muestreo, aunque s combi-
0.05. nar ambas caractersticas sabiendo que la
Sin embargo, para las evaluaciones de cali- primera va a ser determinante del xito de
dad se aconseja hacer caso omiso de estos cl- la implantacin rutinaria de las activida-
culos y utilizar un tamao de muestra mane- des. Con muestras relativamente peque-
jable, que garantice la factibilidad del estudio. as, las estimaciones pueden resultar poco
Aconsejamos que este tamao inicialmente precisas pero, si el muestreo est bien he-
sea de 50 a 60 casos aunque pueden efectuarse cho y se ha respetado la aleatoriedad, tam-
evaluaciones con tamaos an ms pequeos bin sabemos que la estimacin nos aporta
(mnimo 30). informacin vlida. Los proyectos de mejora
Utilizar esta regla prctica para determi- l Importancia de evitar muestreos ineficientes: de calidad deben de ser
nar el tamao de la muestra pareciera restar en las frmulas habituales, para calcular el factibles. Muestras grandes
cientifismo a las evaluaciones de la calidad nmero necesario de casos en la muestra pueden impedir que el
asistencial. Sin embargo, una vez realizado el por ejemplo, para una variable cualitativa proyecto se lleve a cabo
muestreo aleatorio de este nmero relativa- que es lo ms frecuente en GC, hay que por el esfuerzo inicial que
mente pequeo de casos, nada impide enmen- introducir no slo la precisin que busca- supone.
dar la falta de cientifismo y calcular a posteriori mos y el nivel de confianza que queremos
el intervalo de confianza que corresponde a obtener, sino tambin el valor estimado a
los valores encontrados (como veremos en el priori que tiene la variable en estudio en la
captulo 7). Muy probablemente, estaremos poblacin de donde se extrae la muestra.
suficientemente satisfechos con la informacin Habitualmente no tenemos esta estimacin
obtenida por las siguientes razones: al estudiar por primera vez un tema concre-
l Necesidad relativa de estimaciones muy preci- to en GC. Como consecuencia, es habitual
sas: en GC por lo general no es de primor- calcular la frmula situndonos en el peor de
dial inters tener una gran precisin sobre los casos, es decir aquel valor esperado (p)
Utilizar en principio
el grado de cumplimiento de los criterios, de la variable en estudio que precisara de
muestras pequeas evita
sino tener una idea aproximada que ilus- un nmero ms elevado de casos para ser muestreos ineficientes.
tre sobre todo si nos encontramos muy por medida con una muestra, con resultados Respetando la aleatoriedad,
debajo o notablemente por encima. Inter- que tengan intervalos de confianza no ms siempre tendremos la
valos de hasta 0.15, es decir, 15 en por- grandes que el previamente fijado. En va- opcin de ampliar el
centaje (o a veces ms) no nos van a mo- riables cualitativas, el peor de los casos es tamao de la muestra si es
dificar las conclusiones sobre el tema en que la variable tenga un valor estimado de necesario.

U 113 U
Mtodos y herramientas para la realizacin de ciclos de mejora de la calidad en servicios de salud

Si queremos detectar p=0.5 (50%). En el campo de la GC, la apli- de ellos ha de cumplirse en todo un grupo de
diferencias pequeas en cacin de esta regla, sumamente extendi- poblacin (por ejemplo, deteccin de cncer en
la reevaluacin, conviene da en los trabajos de investigacin que no mujeres de edad determinada), mientras que
utilizar muestras ms pueden permitirse realizar muestreos que los siguientes aplican slo a sectores incluidos
grandes. produzcan resultados de una precisin re- en el primer grupo (por ejemplo, criterios de
lativamente baja, conduce a la realizacin seguimiento en caso de encontrar citologa o
de un trabajo extra, al muestrear un nme- exploracin mamaria positivas). En estos casos
ro de casos mayor que el necesario para de- el universo de referencia para cada criterio es
cidir, y que no se traduce en unos mejores diferente: en nuestro ejemplo, una muestra rea-
resultados para el programa. lizada para evaluar la posible realizacin de las
actividades de screening, difcilmente va a ser-
Si se tienen los recursos suficientes (ganas y virnos tambin para evaluar adecuadamente el
tiempo), nada impide emplear las frmulas cumplimiento de los criterios de seguimiento.
habituales para calcular el tamao de la mues- Como consecuencia, puede ser conveniente
tra; con ello nos garantizamos una precisin realizar muestreos diferentes para el estudio
determinada. Sin embargo, para una evalua- de cada criterio (con referencia a su universo
cin de calidad asistencial que inicia un ciclo especfico de aplicacin) o realizar un muestreo
de mejora, es preferible realizar de entrada una amplio hasta cubrir un mnimo de 30 casos en
muestra pequea (mximo de 100 casos), cal- los que pueda evaluarse el criterio aplicable al
cular a posteriori el intervalo de confianza y, en subgrupo de poblacin ms pequeo. Siempre
caso de que la informacin obtenida no resulte pensando en la factibilidad de los proyectos, es
satisfactoria para los objetivos de GC, ampliar aconsejable evitar en las primeras evaluaciones
En las evaluaciones con el nmero de casos de la muestra. Para esto l- criterios que slo sean aplicables a subgrupos
criterios secuenciales timo, ya dispondremos como mnimo de una de pacientes o poblacin de nmero reducido
(encadenadas), es estimacin del valor de p, que va a ser mejor, y que no puedan ser fcilmente identificados
importante considerar un en cuanto al tamao de la muestra necesario, para su muestreo.
muestreo que nos garantice que situarnos en el peor de los casos.
un mnimo de 30 casos para 9. Mtodos de muestreo
el criterio que se evala 8.3. Inconvenientes de las muestras pequeas
en el ltimo eslabn de la Ya hemos sealado que la representatividad de
cadena.
Aparte de los problemas de precisin ya co- la muestra depende del mtodo de muestreo,
mentados, el principal inconveniente que y ms concretamente de que ste no sea sesga-
puede tener el evaluar la calidad con base en do y est hecho de manera que todos los ele-
muestras pequeas es que, al comparar los re- mentos del universo o marco muestral tengan
sultados iniciales con evaluaciones posteriores, la misma oportunidad de ser incluidos en la
slo vamos a encontrar significativas las dife- muestra; es decir que el muestreo sea aleatorio.
rencias importantes. Las variaciones pequeas Existen diversos mtodos de muestreo que
no van a ser detectadas o, si aparecen en los respetan la aleatoriedad. Los ms comunes y
resultados, probablemente carecern de sig- tiles para los estudios de calidad son el mues-
nificacin estadstica. Con base en lo alejados treo aleatorio simple, el sistemtico, el estrati-
que se encuentren de nuestro estndar los pri- ficado y combinaciones de ellos (por ejemplo
meros resultados, podremos decidir ampliar estratificado y sistemtico).
la muestra para la segunda evaluacin o para Los mtodos que respetan la aleatoriedad
ambas. Revisamos este punto en el captulo 9. nos aseguran la representatividad estadstica,
Otra circunstancia frecuente e importante pero hay otros mtodos de muestreo, encua-
que puede complicar el muestreo es el hecho de drables en lo que se conoce como muestreos de
que los diferentes criterios que vayamos a utili- conveniencia, relativamente frecuentes y tiles
zar en la evaluacin no sean aplicables a la mis- pero sobre cuyas limitaciones debemos estar
Para que la muestra sea ma unidad de estudio sino a subunidades. Por avisados.
representativa, el muestreo ejemplo, en el caso de utilizar criterios secuen- Vamos a revisar las caractersticas y me-
debe ser aleatorio. ciales, encadenados, en los cuales el primero cnica de todos ellos. En el diseo del estudio

U 114 U

También podría gustarte