Está en la página 1de 28
Confiabilidad y error de medicién + Contisilidad ‘que, a su vez, jdn, como desarrollar nuevos métodos e Alicis Caysstals Seeeee “ee mayor calidad. En este capitulo ~asi como en el resto de este libro-, la medieién en llamada Teoria Clasica de ‘Siempre que ere ccometerse errores, Estas supuestos pueden parecer contradictorios. Sin embargo, sise tiene en cuen 5 un stipuesta ideal -una hipdtesis de trabajo, una probabilidad ronces, la existencia de puntua XX 4% aonde ceainic RyeX% uy Donde X, es el p eal; que es igual al X -puntaje : puntaje debido al Confit y EE puntaje vorcadore Li puntaje exor Figura 4.1. lepresentacion grates ela eompasioion do pu ye obtens, Se han elaboracio modelos formalos o teorfas de los tests que permit relaciones entre estos tres componentes bsicos: las puntuaciones errores de medida y las puntuaciones verdoderas. in Jas mediciones indirectas de fondmenos Intangibles - como som las que se realizan en psicolog! ido, dado su car: gue se intenta acceder azn, el objetiva de los nes obtenidas. 12 complement te, retonta el tema de la confiabilidad, para reco rracedimientos empfrieas que permiten de confiabilidad, Por thtimo, vuelve sis del error para modo concreto, al error de medicién y ala confiabilidad en la valoracion d rencias entre puntajes obtenides, ambas cuestiones de summa importare ‘ena practice profesional, 4.2 Tipos de error 8 Varladas que no es posi in embargo, se las puede dividir en dos categorias ‘generan: sisterndticas o asistematicas, A su voz, 2 est estos tipos de error implica l ‘macisn y control. Dedicaremos un apartado a cada uno de ellos ya que tal que el lector los distinga claramente. 120 lie Cossiots Errores sisvaméticas Las fuentes de orroressistemsticos son equellas que desplazan las puntuaciones en cierta direccicn, generando una puntuacion sistematicamente denominarse también errores constantes (Hogen, 2008). Skg més (o menos, no impor que se pesan en ella, obviamente, no pesa bien, es deci, no verdadero”, Notese también que, si se evalia con esta balanze no o azuna muestrade sujetos, el peso relativo de las personas permanece entendienda como tal la diferencia de pesos enite ellos, Dicio de otro dos al diagndstico y clones posterlores. Los instrumentas que conl van este tipo de error sistematico sobreestiman (o subestiman, segiin el caso) el at buto evaluado (peso, en este ejemplo). ‘Tomemos ahora un par de ejemplos donde se consideren variables psicolégicas: un tost de inteligencie y una técnica que evalda depresi6n. En el primer ca tun test que sistematicamente sobrevalora (0 subvalora) sujetos y en el segundo estos errores inluirian cidn del nivel de depresion de las persons exe ‘ocasionasfan a su vez erzores en el dlegnéstico intele ‘opsicapatoldgica, respect icos pueden ser detectados a través del andlisis dela valides del sobre la confiabilidad se ocupan de los errores asistemdti as que se dedica el siguiente apartado. Errores ne sisteméticns Los errores no sistemiticos, también llamados asistemaéticos, son aquellos sin posi billdad de ser eontrolados, impredecibles 0 aleatortos, ya que son generados por las variaciones cuye causa es ol azar Las técnicas psicométricas son instrumentos estandarizads, lo cual implica, ene otras cuestiones, uniformicad en el proceso de administracidn yde evaluacién, las variaciones en los procedimientos darian lugar a variaciones en las re atribuibles@ la variable que se desea medir (véase cap. 1.8). Sin embargo, aunque les TE Teds dana Cpe Ro aesven error de recon 424 pautes de aplicacién y evaluacién, aplicar, sean respetadas, diciones azarosas qui sido generadas en la senaledas por ol autor en el Manual de cig de un instrumento, una de las posibles es la del muestreo de con re a la variaciGn en los resultados obtenidos dependiendo de dos en la técnica. Un test do Vocabul tun contenido espectfico. El autor, ado se le pregumtaré e afectadios en mayor o menor grado por de enor para las puntuaciones. Para dejar en estar implicada en la fuente de error. Co las instrucciones para eval Cuanto menos expli margen dejado al de una técnica y por lot Teh tocado en suerte al -pto clave en Je Teoria CT), a continua: es. Se aclara gue el ‘pare contrastar r poldmicas ent los distintos autores, ya que todas 1d de modo correcta. Elo cor se gute por la ida a tendencia de un objeto 0 um sujeto 0 ‘de medidas de un atzibuto. idad de un test se refiere ala con Je consistenci esta proporeién, ya vercaders y ‘o€n ottas condiciones de admi error de de un ictuacién en la desconocidos, relacién entre con: psicaldgico ~aunque esta serta cantidad de error aleatorio, eses despues? O la siguiente pregunta, es las puntuaciones obtenidas a tra srentes segtin quién fa evakie? Para con ate situacion: un adolescente os le fa de un Hospltal porgue presenta sintomas de entre otras intervencionas, Je administra vvés de una técnica que a: textuar esta cuestion podem vado a un Se no de estos profesi erento si Dante y anor te meciion 483 lado para res obrenido trumento €s nec lector que tenga co ‘was que sugerimos su lectura s aquel que nec: 4.4 Repaso de conceptos estadisticos relacionados, Sise entiende a estadistica como un conjunto cle métodos para tor nes repaso que se propone in: nza y desvio estandar y (b} coeficient ‘comprension del resto del capitulo. is siguientes conceptos de corvelacidn, que sersin ¢ Varianza y deevio estander Ambos conceptos son utilizados en el estudio dela ispersién de! aritmética yqueda cefinida como la summa de ios cuadrados de las diferencias lores de a variable y la media, ponderados por sus respectivas froc in Romén, 1992). La varianza puede ser definida también, de modo mas ‘coma el promedio de las desviaciones al cui Sampieri et. a. (200 ones abtenidas pi sienda 128 | Alcis Cayce verienza total de las puntuaciones obtenidas partir de a administracisn de wna téc- nlea en una muestra de sujetos, s?represonta la varianza verdadera y 5~'representa la vvarlanza debida a error, entonces la welaciGn de las varianas puede expresarse coma: Peaeest t sigue: la varianza total en una disteibucién de puntua aes igual a fa suma de la varianza verdadera més la la descomposicion en partes separadas qu para construir el total Lamediia de la confiablidad de una técnica depende de la vasiat tuaciones que axroja, de su dispersién. EI desaffo, entonces, para el dde una técnica de evaluacion pal total que es varianza verda para comprender las proved idad de una téenica psicom cexprosa el grado de corresponden- establecer al grado de asoci ‘variables, pero es siompre bivariads. Es una prueba estadistica pare anali tentre dos variables siempre y cuando las mismas sean medidas en un ease niveles de medicion en apartado 1.2) aes causade la otta, esta prueba este- te ya otra como dependie En resumen, el coeficionte de correlacién ge calcula a partir de obtenidas en una muestea en dos variables. Relaciona las puntu: une vertable eon las puntuaciones obtenidas en ot variable, en los mismos: Si bien hay varios coeficiontes de correlacion, ol que se utiliza con més frecuencia, por adecuarse a las caracteristicas de [as variables psicologicas, es el coeficiente de.corte lcidn lineal de Pearson, al que se lo exprese como ry, lo pensade desde el absurdo ha resultado util para la comprensiénde este sy la mag tamafio de ple, mayor ligencia. Decide obtener evidencia empirical res Conse y error oe de inteligencie a une muestra de sujetos los cuales les pregunta tam! zan. iene asi dos mediciones ce cada uno de los sujetos de Ia muestra y iente de correlacién para estudiar esta covariacién que lo obsesione, 5! en Jainterpretacion adecuada es que mientras una var el ple y magniud de Cl \dependientos ia una dela otra, 1s del coeficiente de correlacisn ya inter Je relacion entre las varisbles en estudio, esque Tabla 4.1, Lectura de la inierprotacion de coeiientea de eorelacin [Costiciente de corretacion ‘existe Correlacion alguna & ve 86 uj songs ure cana contra) Esa tnben so pion a's nararX mayer t ‘enica de expresién es el mnerloes caleulando la proporcién in verdadera en una prucba y inilar ala que fuera presentace en por el poreentaje de fa varianza 128 | Ales Cyosis 2a es verdadera y el 15% es v total de las pontuact ad es un ndimero cuyo valor minimo arlanza verdadera, ya que toda os hhay dos que son desconocidos. Le exictoncia de una varianza verdadera se sostiene en ol supuesta que ya fuera implica que la conflabilidad -s} bien ‘conceptualmente estd blen expresada por le proporeidn entre ambas varianzas. Canticle y error de me deberd hallarse de alguna otra forma, a partir de métodos empiricos, cacidn directa dela formula (3), En el siguiente apartado se revisan alg cedimientos empiricos que se utilizan para obtener el coeficiente de con 4.6 Procedimientos em; Tipos de confiabilidad cos para estimar el coeficiente de conf pero casi siempre estarén presentes. exactamente los mismos resultados 0. Es deci, ‘medic arrojados por la técnica junto de datos se roma e Wy poca diserepanc rmediciones, este dato sera un indicador de que los puntajes del instrumento poseen idad en ese lapso de tiempo, ‘A partir de Ia implementacion de estos métodos empiricas, se 128 Aico Crass El método o métodos selecctonados puede: cen el siguiente cuiadro se propone una categoriz-cion, entre otras posibles, que los ‘vide en dos grupos, por un lado, aquellos en ins que-es necesuria solo una aplieacion snumento a la muestra de sujetos y por el oto, ei grupo que requieren repetidas clones 218 Wwatedo que requires ‘Método ave raquieron | “tra sola apicectin ropetas aplicaciones ucra diferentes pasos para halla el cveficiente de confiabilided, yrocedimientos, como se verd més adelante, es necesario disponer de los mismos sujetos, d de puntajes. Recordamos que aa Jas puntuaciones obtenidas por una muestra de sujetos, yno el por UN solo sujeto, El objetivo de estas estudios es analizar Ie ais- iimero de calzado, mientras le dos variables diferentes, sin rovengan de una misma varia (dn entre un conjunto de datos yy de tina segunda siendo la misma variable la n tal caso, el coefieiente de correlactén indica la apartado 3.4., donde camente se ealeula la idad de les puntuaciones. al segundo (no hut ficaran los resultados); por el contrario, cuanto ms cercano a 0 (ceroysea ese val ypancia (presencia de exrores) entre las dos medic gran mel cuando vale uno spor ello que la confiabi lidad, desde el punto de vista préctico, se calcula con el coefitiente de correlacion de ambas medidas: nétese que esto es justac ~~ Denfbitdady aror de Pearson o ~come se verd mis adelante-, con varlantes de éste que cons pledad de valer cera ctuando hay total discrepancia entze los dos conju ‘das y uno cuando hay absoluta concordancia, ‘Cuando en el coeficiente de correlacién de Pearson i se utliza una sols “como en caso del ediculo de la confiabilidad.-, es natural camblar sus subi. por my, ye que no existen dos variables, sino una variable, x quedando ent. ‘otacién ta. Como e! coeficiente de correlacién hara las veces fiabilided,¥, teniendo en cuenta esta nomenclature, es que el coef lidad C tambien se [o denomina con los mistmos subi Dade la frecuencia de Ia utizacién del ediculo de Ia ciente de correlacidn de Pearson, el -ontearé frecuentemente,e ‘ambos come sindnimos ( 10s conceptuales no lo sean, Coe te Hl En razén de lo expuesto, es digna de destacar y confusiones. Mientras que el coeficiente de «i fe confablidad sagt la corelacionhalisds, Cootclente F "T Lectura del cosficiente 7] [_de Pearson se confiabiidad “$3.00 | Navoa alearza twenlca ara 080 vO ‘Adecuada 7 $0.50 ino compe requictas Pron dad 1 ‘0.00 ‘Ausencia de correlacion enire | Medicibn contaminada de err | Tas variables No confab Como se puede observar, se trata de una tabla si Ja 84. (W apartado 3.4), pero nétese que aqui, por un lado, se han suprimido los valores de correlaci ra por otf, se ha agregado la interpretacidn psicomeétrica del coeficiente fabllidad {y esto en tanto coeficiente aplicado al tema de la confiabilidad) ra columna presenta un continnum que ve de 0 2 1, tomando us distancia a cada uno de estos polos. 190 Aicia Cayasiote Matados basados en medides repetidas Fs importante que un instrumento arzoje mediciones estables en el poco serviriacontar con una cinta motvieaeldstica, por ejemplo, que midi centonces, en usar el mismo instrumento en una muestra de sujetos, en dos momen: tos, es decir, con un lapso de tiempo entre ambas administraciones. Con estos méto- dos se estima el cooticiente de conabllidad que permite medir la estabilidad de Ins, tuaciones obtenidas por la técnica de e estudio, En este categoria tramos e] método Test-retest y el de Formas paralelas o alvernativas, aplicadas con un intervalo de tlerapo. vente de fala de conflabilidad que identifica el método test 1 temporales aleatorias, que influyen tanto en las condicio- nes de administracion como en las condiciones de los examinados. En este procedimlento empirice es funda Ung complicacién inherente a la isto instrumento no evaltia lo mi 10 en dos puntos diferentes del tiempo: cuando factores tales como la experiencia previa con ia memoria, 1a fatiga o la falta de motivacion, y porlo tanto la segunda aplicacion ya no conserva las cazacter(stieas de le primera Por ote lado, por multiples factores, conforme se inerements al intervalo de tiem Jones del mismo test, la correlacién entre las puntuaciones obte- Jende s disminuis. ‘o adaprador de una técnica pslcomeét Siel perfodo es largo, y la variable susceptible de cambios, esto puede confundir la Interpretacién del coeficiente de confiabilidad abtenido por este procedimiento, / Contatidady amar de mein 134 ided. En sintesis, cuanto mayor tiempo pase entre y le segunda, el coeficiente de correlacidn seré menor, y reve sea el intervalo la estabilidad temporal de los puntajes serd de hel siguiente cuadro se sintatizan las etapas que se llevan adelant cign de este procedimiento. tapas - Método Testretest | ‘muy prolongado ni muy. ‘Afios despu parti Test de Bender con muy dia, hasta 8 meses, aunque la ma semanas (entre 1 y 18 semanas), Las correlaciones halla ependiendo del disefio. La aurora concluye que estos estudios indicen zados, son razonablement esta testretest no excede de 3 meses. tema es que los ima tienden a madurar @ un ritmo mas le de les investigaciones 1 través de} Test de Bender, 1182 Ato Coyssios punto de vista tedrico y aque test, pero clebidos a fuentes de error inhierentes de precision, de este método en os estudio rea ifs, La establlidad de los puntajes. mtervalos que oscilaron entre 12 y 63 ‘con un intervalo mediano de 23 dias. Como mues 3 det WISC-T1 muestra rupos de edad. En dicho dliscrepancias on Jos puntajes debidas a los efectos de la raciones, segin Ja duraci6n del interval. una adecuada estabilidad texto se analizan tambi prictica entee ambas a -nalgin tipo de entrenanl clretesteo; el diseho aqui tiene como objetivo detectar nla destroza aprendida o Ja disminucion de sintomes que En este caso el método Test-retest es utilizado pars captar joservado puede por tratarse, mera ser atribuido & la intervencion y en cusinto es esperable u ‘mente, de una segunda administracion. Formas peralelee 0 ekernstves [con intorval (Come fuera mencionado en el apai inimizar el efecto de la memoria del contenido de otra prueba ridad. Es deci, es una buena alternativa cuando no se puede aplicar el ‘método test-retest por el efecto que el aprendizaje y la memoria tendrian sobre los resultados en la segunda administracién. Se procede entonces « elaborar formas equ vvalentes y se las aplica alos mismos sujetos en dos oportunidades, com un intervalo de dacon modicicm, sino borar una técnica’ segunda muestra celecci EE EES EE EE SEES eseE Ce eeEE CeCe eee 5 (con intervato) muesia de sujetos Yorma paralla dees alos mismos 1 e} coeficiente de cortelacién hallado se debe de tener cehtte una aplicacién y la otra) como el muestreo ce contenido (debido Aniluencia de razones azarosas en la seleccién de ftems que componen u / otra) Métodos besados en una sole aplicacion del vest Los mét momento ceterminado, son los més utlizadas por los autores y adaptadoras de las xn clnco métodos: divisién por ‘confiabil 194 Alcia Coyote que utlliza este método, tiene fe conformuan ia prueba y el andlisis de las ento empirico eporia informacién para estimar el tencia interna del inst por mitades controla o identifica la inconsistencia de la muestra de items, el muestreo de contenido. Es condicion que la téenica en estudio sea homogénea, que evalie wn Ainico atributo 0 factor. Reguiere solo una aplicacién del test 2 una testa de sujetos, lego de lo cual se tapas Division por Witades ict Ia tocrice @ una muestra de sujtos el canjunia de items en dos mitades homogensas 3) Galeular ls carelacion (n) ence las puntuaciones ebtonicas en las dos mitados en ins que ha quedado divide le tecnica 4) Ajustar la confabliad de a mitad de la prusba usando la formula de Spearmar- sane rmitades que han si La cuarta consiste en la aplicacién especifica de la férmula Spearman: 0 acortado en cualquier cant tte mitad, entonces, ol cdlculo de la confi debe ser ajustaco al test entero (vease con mayor detalle las aplicaciones de la Spearman-Brovsn en Col werdlik, 2000), Veamos, 2 partir de algun s, c6mo el autor de tna técnica valora a posi billdad de utlizar 6 ne este proce 2971), en el libro Test Guestals £0 Visomotor para Nifios desc ‘miento, aclara, no es apropiado para ve ised y error de mien 4985 amente porque es imposible dividir en dos mitades homogéneas las 9 man este prueba or ej contrario, en el estudio de las propiedades de algunos subtests ce! WISC- 111 (Wechsler, 1994), este procedimiento results adecuado ya que los dist 10s en das mitades homogeneus. jaron con este métado solo “algunos subtests” y no pleto? Esta cuesticn permitird aclerar fa Ja que hemos aludido al comianzo de heterogéneo, mide dlversos atributos y factores, por lo tanto seria impo: as. La hamogeneidad, -palabra derivada del griego ho: ques! y genous, que significa “clase”, indica, on términ ‘cos, que una técnica mide un solo atributo o factor. terior de cada test a es posible aplicar la division por mitades en “alg tests”, podrfamos preguatar tambien jpor qué no aplicarlo en todost Por cellos “Claves y Busqueda de Simbolos-son pruebas de velocidacl En est ‘cualquiera de las do: 6 items pares y la tiempo espurria, ya que no aportaria este proce: jad de Ins fabllidad de las puntuaciones. En consecuenc lares a él, es inapropiado pare valorar la confit pruebas de velocidad. “Hechas estas aclaraciones y volviendo al WISC, la confiabilidad dela mayé subtests -excepto Clavos y Buequeda de Simbolos-fue cal Stems de los subtests fueron divididos en dos medios tests con damente iguales, luego se correl reportan los coeficient 6,81 yVocabulatio, 0,87 promedio de los coeficientes ‘Tabla 5.1. en pag. 202 del Man 1964), ya que la segmentacién de la muestra de sujet intas grupos y el coeficionte confiabilidad se Formas paraleas 0 atarnatcas {sin intervalo) Este método es similar al de Formas paralelas o alternativas, con intervalo di po la diferencia reside en que en este procedimiento no hay un lapso de separe ambas administra nbas formas ~que, y2 se

También podría gustarte