Confiabilidad y error de medicién
+ Contisilidad
‘que, a su vez,
jdn, como desarrollar nuevos métodos e
Alicis Caysstals
Seeeee“ee
mayor calidad. En este capitulo ~asi como en el resto de este libro-, la medieién en
llamada Teoria Clasica de
‘Siempre que ere ccometerse errores,
Estas supuestos pueden parecer contradictorios. Sin embargo, sise tiene en cuen
5 un stipuesta ideal -una hipdtesis de trabajo, una probabilidad
ronces, la existencia de puntua
XX 4% aonde ceainic
RyeX% uy
Donde X, es el p
eal; que es igual al X -puntaje
: puntaje debido al
Confit y
EE puntaje vorcadore
Li puntaje exor
Figura 4.1. lepresentacion grates ela eompasioion do pu
ye obtens,
Se han elaboracio modelos formalos o teorfas de los tests que permit
relaciones entre estos tres componentes bsicos: las puntuaciones
errores de medida y las puntuaciones verdoderas.
in Jas mediciones indirectas de fondmenos Intangibles - como som
las que se realizan en psicolog!
ido, dado su car:
gue se intenta acceder
azn, el objetiva de los
nes obtenidas.
12 complement
te, retonta el tema de la confiabilidad, para reco
rracedimientos empfrieas que permiten
de confiabilidad, Por thtimo, vuelve sis del error para
modo concreto, al error de medicién y ala confiabilidad en la valoracion d
rencias entre puntajes obtenides, ambas cuestiones de summa importare
‘ena practice profesional,
4.2 Tipos de error
8 Varladas que no es posi
in embargo, se las puede dividir en dos categorias
‘generan: sisterndticas o asistematicas, A su voz, 2 est
estos tipos de error implica l
‘macisn y control. Dedicaremos un apartado a cada uno de ellos ya que
tal que el lector los distinga claramente.120 lie Cossiots
Errores sisvaméticas
Las fuentes de orroressistemsticos son equellas que desplazan las puntuaciones en
cierta direccicn, generando una puntuacion sistematicamente
denominarse también errores constantes (Hogen, 2008).
Skg més (o menos, no impor
que se pesan en ella, obviamente, no pesa bien, es deci, no
verdadero”, Notese también que, si se evalia con esta balanze no
o azuna muestrade sujetos, el peso relativo de las personas permanece
entendienda como tal la diferencia de pesos enite ellos, Dicio de otro
dos al diagndstico y clones posterlores. Los instrumentas que conl
van este tipo de error sistematico sobreestiman (o subestiman, segiin el caso) el at
buto evaluado (peso, en este ejemplo).
‘Tomemos ahora un par de ejemplos donde se consideren variables psicolégicas: un
tost de inteligencie y una técnica que evalda depresi6n. En el primer ca
tun test que sistematicamente sobrevalora (0 subvalora)
sujetos y en el segundo estos errores inluirian
cidn del nivel de depresion de las persons exe
‘ocasionasfan a su vez erzores en el dlegnéstico intele
‘opsicapatoldgica, respect
icos pueden ser detectados a través del andlisis dela valides del
sobre la confiabilidad se ocupan de los errores asistemdti
as que se dedica el siguiente apartado.
Errores ne sisteméticns
Los errores no sistemiticos, también llamados asistemaéticos, son aquellos sin posi
billdad de ser eontrolados, impredecibles 0 aleatortos, ya que son generados por las
variaciones cuye causa es ol azar
Las técnicas psicométricas son instrumentos estandarizads, lo cual implica, ene
otras cuestiones, uniformicad en el proceso de administracidn yde evaluacién,
las variaciones en los procedimientos darian lugar a variaciones en las re
atribuibles@ la variable que se desea medir (véase cap. 1.8). Sin embargo, aunque les
TE Teds dana Cpe Ro aesven
error de recon 424
pautes de aplicacién y evaluacién,
aplicar, sean respetadas,
diciones azarosas qui
sido generadas en la
senaledas por ol autor en el Manual de
cig de un instrumento, una de las posibles es la del muestreo de con
re a la variaciGn en los resultados obtenidos dependiendo de
dos en la técnica. Un test do Vocabul
tun contenido espectfico. El autor,
ado se le pregumtaré
e afectadios en mayor o menor grado por
de enor para las puntuaciones. Para dejar en
estar implicada en la
fuente de error. Co
las instrucciones para eval
Cuanto menos expli
margen dejado al
de una técnica y por lot
Teh tocado en suerte al-pto clave en Je Teoria CT), a continua:
es. Se aclara gue el ‘pare contrastar
r poldmicas ent los distintos autores, ya que todas
1d de modo correcta. Elo cor se gute por la
ida a tendencia de un objeto 0 um sujeto 0
‘de medidas de un atzibuto.
idad de un test se refiere ala con
Je consistenci
esta proporeién,
ya vercaders y
‘o€n ottas condiciones de admi
error de de un
ictuacién en la
desconocidos,
relacién entre con:
psicaldgico ~aunque esta
serta cantidad de error aleatorio,
eses despues? O la siguiente pregunta,
es las puntuaciones obtenidas a tra
srentes segtin quién fa evakie? Para con
ate situacion: un adolescente os le
fa de un Hospltal porgue presenta sintomas de
entre otras intervencionas, Je administra
vvés de una técnica que a:
textuar esta cuestion podem
vado a un Se
no de estos profesi
erento si
Dante y anor te meciion 483
lado para res
obrenido
trumento €s nec
lector que tenga co
‘was que sugerimos su lectura s aquel que nec:
4.4 Repaso de conceptos estadisticos relacionados,
Sise entiende a estadistica como un conjunto cle métodos para tor nes
repaso que se propone in:
nza y desvio estandar y (b} coeficient
‘comprension del resto del capitulo.
is siguientes conceptos
de corvelacidn, que sersin ¢
Varianza y deevio estander
Ambos conceptos son utilizados en el estudio dela ispersién de!
aritmética yqueda cefinida como la summa de ios cuadrados de las diferencias
lores de a variable y la media, ponderados por sus respectivas froc
in Romén, 1992). La varianza puede ser definida también, de modo mas
‘coma el promedio de las desviaciones al cui
Sampieri et. a. (200
ones abtenidas pi
sienda128 | Alcis Cayce
verienza total de las puntuaciones obtenidas partir de a administracisn de wna téc-
nlea en una muestra de sujetos, s?represonta la varianza verdadera y 5~'representa la
vvarlanza debida a error, entonces la welaciGn de las varianas puede expresarse coma:
Peaeest t
sigue: la varianza total en una disteibucién de puntua
aes igual a fa suma de la varianza verdadera més la
la descomposicion en partes separadas qu
para construir el total
Lamediia de la confiablidad de una técnica depende de la vasiat
tuaciones que axroja, de su dispersién. EI desaffo, entonces, para el
dde una técnica de evaluacion pal
total que es varianza verda
para comprender las proved
idad de una téenica psicom
cexprosa el grado de corresponden-
establecer al grado de asoci
‘variables, pero es siompre bivariads. Es una prueba estadistica pare anali
tentre dos variables siempre y cuando las mismas sean medidas en un
ease niveles de medicion en apartado 1.2)
aes causade la otta, esta prueba este-
te ya otra como dependie
En resumen, el coeficionte de correlacién ge calcula a partir de
obtenidas en una muestea en dos variables. Relaciona las puntu:
une vertable eon las puntuaciones obtenidas en ot variable, en los mismos:
Si bien hay varios coeficiontes de correlacion, ol que se utiliza con més frecuencia, por
adecuarse a las caracteristicas de [as variables psicologicas, es el coeficiente de.corte
lcidn lineal de Pearson, al que se lo exprese como ry,
lo pensade desde el absurdo ha resultado util para la comprensiénde este
sy la mag
tamafio de ple, mayor
ligencia. Decide obtener evidencia empirical res
Conse y error oe
de inteligencie a une muestra de sujetos los cuales les pregunta tam!
zan. iene asi dos mediciones ce cada uno de los sujetos de Ia muestra y
iente de correlacién para estudiar esta covariacién que lo obsesione, 5! en
Jainterpretacion adecuada es que mientras una var
el ple y magniud de Cl
\dependientos ia una dela otra,
1s del coeficiente de correlacisn ya inter
Je relacion entre las varisbles en estudio,
esque
Tabla 4.1, Lectura de la inierprotacion de coeiientea de eorelacin
[Costiciente de corretacion
‘existe Correlacion alguna &
ve 86
uj songs ure cana contra) Esa tnben so pion a's nararX mayer t
‘enica de expresién es el
mnerloes caleulando la proporcién
in verdadera en una prucba y
inilar ala que fuera presentace en
por el poreentaje de fa varianza128 | Ales Cyosis
2a es verdadera y el 15% es v
total de las pontuact
ad es un ndimero cuyo valor minimo
arlanza verdadera, ya que toda os
hhay dos que son desconocidos.
Le exictoncia de una varianza verdadera se sostiene en ol supuesta que ya fuera
implica que la conflabilidad -s} bien
‘conceptualmente estd blen expresada por le proporeidn entre ambas varianzas.
Canticle y error de me
deberd hallarse de alguna otra forma, a partir de métodos empiricos,
cacidn directa dela formula (3), En el siguiente apartado se revisan alg
cedimientos empiricos que se utilizan para obtener el coeficiente de con
4.6 Procedimientos em;
Tipos de confiabilidad
cos para estimar el coeficiente de conf
pero casi siempre estarén presentes.
exactamente los mismos resultados
0. Es deci,
‘medic
arrojados por la técnica
junto de datos se roma e
Wy poca diserepanc
rmediciones, este dato sera un indicador de que los puntajes del instrumento poseen
idad en ese lapso de tiempo,
‘A partir de Ia implementacion de estos métodos empiricas, se128 Aico Crass
El método o métodos selecctonados puede:
cen el siguiente cuiadro se propone una categoriz-cion, entre otras posibles, que los
‘vide en dos grupos, por un lado, aquellos en ins que-es necesuria solo una aplieacion
snumento a la muestra de sujetos y por el oto, ei grupo que requieren repetidas
clones 218
Wwatedo que requires ‘Método ave raquieron
| “tra sola apicectin ropetas aplicaciones
ucra diferentes pasos para halla el cveficiente de confiabilided,
yrocedimientos, como se verd més adelante, es necesario disponer
de los mismos sujetos,
d de puntajes. Recordamos que aa
Jas puntuaciones obtenidas por una muestra de sujetos, yno el
por UN solo sujeto, El objetivo de estas estudios es analizar Ie ais-
iimero de calzado, mientras
le dos variables diferentes, sin
rovengan de una misma varia
(dn entre un conjunto de datos
yy de tina segunda siendo la misma variable la
n tal caso, el coefieiente de correlactén indica la
apartado 3.4., donde
camente se ealeula la
idad de les puntuaciones.
al segundo (no hut
ficaran los resultados); por el contrario, cuanto ms cercano a 0 (ceroysea ese val
ypancia (presencia de exrores) entre las dos medic
gran mel
cuando vale uno spor ello que la confiabi
lidad, desde el punto de vista préctico, se calcula con el coefitiente de correlacion de
ambas medidas: nétese que esto es justac ~~
Denfbitdady aror de
Pearson o ~come se verd mis adelante-, con varlantes de éste que cons
pledad de valer cera ctuando hay total discrepancia entze los dos conju
‘das y uno cuando hay absoluta concordancia,
‘Cuando en el coeficiente de correlacién de Pearson i se utliza una sols
“como en caso del ediculo de la confiabilidad.-, es natural camblar sus subi.
por my, ye que no existen dos variables, sino una variable, x quedando ent.
‘otacién ta. Como e! coeficiente de correlacién hara las veces
fiabilided,¥, teniendo en cuenta esta nomenclature, es que el coef
lidad C tambien se [o denomina con los mistmos subi
Dade la frecuencia de Ia utizacién del ediculo de Ia
ciente de correlacidn de Pearson, el -ontearé frecuentemente,e
‘ambos come sindnimos (
10s conceptuales no lo sean,
Coe te Hl
En razén de lo expuesto, es digna de destacar y
confusiones. Mientras que el coeficiente de «i
fe confablidad sagt la corelacionhalisds,
Cootclente F "T Lectura del cosficiente 7]
[_de Pearson se confiabiidad
“$3.00 | Navoa alearza
twenlca ara
080
vO ‘Adecuada 7
$0.50 ino compe requictas
Pron dad 1
‘0.00 ‘Ausencia de correlacion enire | Medicibn contaminada de err |
Tas variables No confab
Como se puede observar, se trata de una tabla si Ja 84. (W apartado 3.4),
pero nétese que aqui, por un lado, se han suprimido los valores de correlaci
ra por otf, se ha agregado la interpretacidn psicomeétrica del coeficiente
fabllidad {y esto en tanto coeficiente aplicado al tema de la confiabilidad)
ra columna presenta un continnum que ve de 0 2 1, tomando
us distancia a cada uno de estos polos.190 Aicia Cayasiote
Matados basados en medides repetidas
Fs importante que un instrumento arzoje mediciones estables en el
poco serviriacontar con una cinta motvieaeldstica, por ejemplo, que midi
centonces, en usar el mismo instrumento en una muestra de sujetos, en dos momen:
tos, es decir, con un lapso de tiempo entre ambas administraciones. Con estos méto-
dos se estima el cooticiente de conabllidad que permite medir la estabilidad de Ins,
tuaciones obtenidas por la técnica de e estudio, En este categoria
tramos e] método Test-retest y el de Formas paralelas o alvernativas, aplicadas
con un intervalo de tlerapo.
vente de fala de conflabilidad que identifica el método test
1 temporales aleatorias, que influyen tanto en las condicio-
nes de administracion como en las condiciones de los examinados.
En este procedimlento empirice es funda
Ung complicacién inherente a la
isto instrumento no evaltia lo mi
10 en dos puntos diferentes del tiempo: cuando
factores tales como la experiencia previa con
ia memoria, 1a fatiga o la falta de motivacion, y
porlo tanto la segunda aplicacion ya no conserva las cazacter(stieas de le primera
Por ote lado, por multiples factores, conforme se inerements al intervalo de tiem
Jones del mismo test, la correlacién entre las puntuaciones obte-
Jende s disminuis.
‘o adaprador de una técnica pslcomeét
Siel perfodo es largo, y la variable susceptible de cambios, esto puede confundir la
Interpretacién del coeficiente de confiabilidad abtenido por este procedimiento, /
Contatidady amar de mein 134
ided. En sintesis, cuanto mayor tiempo pase entre
y le segunda, el coeficiente de correlacidn seré menor, y
reve sea el intervalo la estabilidad temporal de los puntajes serd de
hel siguiente cuadro se sintatizan las etapas que se llevan adelant
cign de este procedimiento.
tapas - Método Testretest |
‘muy prolongado ni muy.
‘Afios despu
parti
Test de Bender con muy
dia, hasta 8 meses, aunque la ma
semanas (entre 1 y 18 semanas), Las correlaciones halla
ependiendo del disefio. La aurora concluye que estos estudios indicen
zados, son razonablement esta
testretest no excede de 3 meses.
tema es que los
ima tienden a madurar @ un ritmo mas le
de les investigaciones 1
través de} Test de Bender,1182 Ato Coyssios
punto de vista tedrico y aque
test, pero clebidos a fuentes de error inhierentes
de precision,
de este método en os estudio rea
ifs, La establlidad de los puntajes.
mtervalos que oscilaron entre 12 y 63
‘con un intervalo mediano de 23 dias. Como mues
3 det WISC-T1 muestra
rupos de edad. En dicho
dliscrepancias on Jos puntajes debidas a los efectos de la
raciones, segin Ja duraci6n del interval.
una adecuada estabilidad
texto se analizan tambi
prictica entee ambas a
-nalgin tipo de entrenanl
clretesteo; el diseho aqui tiene como objetivo detectar
nla destroza aprendida o Ja disminucion de sintomes que
En este caso el método Test-retest es utilizado pars captar
joservado puede
por tratarse, mera
ser atribuido & la intervencion y en cusinto es esperable u
‘mente, de una segunda administracion.
Formas peralelee 0 ekernstves [con intorval
(Come fuera mencionado en el apai
inimizar el efecto de la memoria del contenido de otra prueba
ridad. Es deci, es una buena alternativa cuando no se puede aplicar el
‘método test-retest por el efecto que el aprendizaje y la memoria tendrian sobre los
resultados en la segunda administracién. Se procede entonces « elaborar formas equ
vvalentes y se las aplica alos mismos sujetos en dos oportunidades, com un intervalo de
dacon
modicicm, sino
borar una técnica’
segunda
muestra celecci
EE EES EE EE SEES eseE Ce eeEE CeCe eee
5 (con intervato)
muesia de sujetos
Yorma paralla dees alos mismos
1 e} coeficiente de cortelacién hallado se debe de tener
cehtte una aplicacién y la otra) como el muestreo ce contenido (debido
Aniluencia de razones azarosas en la seleccién de ftems que componen u
/ otra)
Métodos besados en una sole aplicacion del vest
Los mét
momento ceterminado, son los més utlizadas por los autores y adaptadoras de las
xn clnco métodos: divisién por
‘confiabil194 Alcia Coyote
que utlliza este método, tiene
fe conformuan ia prueba y el andlisis de las
ento empirico eporia informacién para estimar el
tencia interna del inst
por mitades controla o identifica la inconsistencia de la muestra de items, el muestreo
de contenido. Es condicion que la téenica en estudio sea homogénea, que evalie wn
Ainico atributo 0 factor.
Reguiere solo una aplicacién del test 2 una
testa de sujetos, lego de lo cual se
tapas Division por Witades
ict Ia tocrice @ una muestra de sujtos
el canjunia de items en dos mitades homogensas
3) Galeular ls carelacion (n) ence las puntuaciones ebtonicas en las dos mitados en
ins que ha quedado divide le tecnica
4) Ajustar la confabliad de a mitad de la prusba usando la formula de Spearmar-
sane
rmitades que han si
La cuarta consiste en la aplicacién especifica de la férmula Spearman:
0 acortado en cualquier cant
tte mitad, entonces, ol cdlculo de la confi
debe ser ajustaco al test entero (vease con mayor detalle las aplicaciones de
la Spearman-Brovsn en Col werdlik, 2000),
Veamos, 2 partir de algun s, c6mo el autor de tna técnica valora a posi
billdad de utlizar 6 ne este proce 2971), en el libro Test Guestals
£0 Visomotor para Nifios desc
‘miento, aclara, no es apropiado para ve
ised y error de mien 4985
amente porque es imposible dividir en dos mitades homogéneas las 9
man este prueba
or ej contrario, en el estudio de las propiedades de algunos subtests ce! WISC- 111
(Wechsler, 1994), este procedimiento results adecuado ya que los dist
10s en das mitades homogeneus.
jaron con este métado solo “algunos subtests” y no
pleto? Esta cuesticn permitird aclerar
fa Ja que hemos aludido al comianzo de
heterogéneo, mide dlversos atributos y factores, por lo tanto seria impo:
as. La hamogeneidad, -palabra derivada del griego ho:
ques! y genous, que significa “clase”, indica, on términ
‘cos, que una técnica mide un solo atributo o factor.
terior de cada test a es posible aplicar la division por mitades en “alg
tests”, podrfamos preguatar tambien jpor qué no aplicarlo en todost Por
cellos “Claves y Busqueda de Simbolos-son pruebas de velocidacl En est
‘cualquiera de las do:
6 items pares y la
tiempo espurria, ya que no aportaria
este proce:
jad de Ins
fabllidad de las puntuaciones. En consecuenc
lares a él, es inapropiado pare valorar la confit
pruebas de velocidad.
“Hechas estas aclaraciones y volviendo al WISC, la confiabilidad dela mayé
subtests -excepto Clavos y Buequeda de Simbolos-fue cal
Stems de los subtests fueron divididos en dos medios tests con
damente iguales, luego se correl
reportan los coeficient
6,81 yVocabulatio, 0,87
promedio de los coeficientes
‘Tabla 5.1. en pag. 202 del Man
1964), ya que la segmentacién de la muestra de sujet
intas grupos y el coeficionte confiabilidad se
Formas paraleas 0 atarnatcas {sin intervalo)
Este método es similar al de Formas paralelas o alternativas, con intervalo di
po la diferencia reside en que en este procedimiento no hay un lapso de
separe ambas administra nbas formas ~que, y2 se