Está en la página 1de 8

Vocabulario del Capitulo 4 Confiabilidad 1. La confiabilidad se refiere a la consistencia de los resultados.

En el anlisis de la confiabilidad se busca que los resultados de un cuestionario concuerden con los resultados del mismo cuestionario en otra ocasin. Si esto ocurre se puede decir que hay un alto grado de confiabilidad. Tambin se habla de confiabilidad cuando dos o ms evaluadores evalan al mismo estudiante sobre el mismo material y se obtienen puntuaciones semejantes.

Confiabilidad entre evaluadores 1. Es la medida en que coinciden dos observadores o jueces independientes. Los anlisis de la confiabilidad inter-evaluadores se han trabajado generalmente desde tres modelos tericos: la Teora Clsica de los Tests, la Teora de la Generalizabilidad y el Modelo Rasch de Facetas Mltiples. Adems es importante considerar que la confiabilidad inter-evaluadores no es un concepto unitario pues existen diversas perspectivas respecto a su conceptualizacin y anlisis. As, Stemler (2004) propone una clasificacin tripartita de los diversos tipos de estimaciones de la confiabilidad interevaluadores, cuya sntesis presentamos a continuacin: 1. Consenso: - Las estimaciones de consenso se basan en el supuesto que dos o ms observadores independientes deben llegar a un acuerdo exacto respecto a como aplicar los diversos niveles de una escala de calificacin a un comportamiento observado. - Este tipo de ndices es ms til cuando los datos son de naturaleza nominal, es decir, la escala de calificacin representa diferencias cualitativas. - Los mtodos ms utilizados para este tipo de confiabilidad implican el clculo del porcentaje de acuerdos, denominado en alguna ocasiones ndice de acuerdos (Escurra 1998), el coeficiente Kappa de Cohen y otros menos utilizados como la J de Jaccard, el ndice G y el ndice Delta propuesto por Martin y Femia (2004). Estos ndices tiene la desventaja de tener que aplicarse a cada pregunta y a cada par de jueces.

- Es importante sealar que existe una variante del coeficiente Kappa, conocida como Kappa mltiple, que se puede aplicar cuando hay ms de dos evaluadores (Watkins 2002). 2. Consistencia: - Las estimaciones de consistencia suponen que no es necesario que dos jueces muestren consenso en el uso de una escala de calificacin, siempre y cuando las diferencias de consenso se apliquen de manera consistente. Es decir, puede ser que el juez A le asigne siempre o casi siempre la calificacin 1 a cierto tipo de respuestas, mientras que el juez B les asigna siempre o casi siempre la calificacin 3 a ese mismo tipo de respuestas. Por lo tanto, la diferencia de calificaciones entre ambos ser predecible y podr corregirse mediante el uso de constantes aditivas. - Este enfoque es utilizado cuando los datos son de naturaleza cuantitativa continua, pero tambin pueden aplicarse a variables ordinales, si se suponen que representan un continuo a lo largo de una sola dimensin. - La ventaja de este enfoque es que si hay una consistencia en las calificaciones entre jueces, pueden aplicarse estrategias de correccin de las diferencias en severidad. Por ejemplo si un juez A da una calificacin un punto por encima de la de otro juez B y esto se repite de manera consistente, la correlacin entre ambas calificaciones ser bastante alta y se podrn equiparar las puntuaciones de ambos jueces restndoles un punto a todas las personas que fueron evaluadas por el juez A. - Los procedimientos empleados para las estimaciones de consistencia incluyen la correlacin de Pearson (variables cuantitativas continuas) y de Spearman (variables ordinales). En los casos de tener varios jueces, se puede utilizar al W de Kendall (Cairns 2003; Legendre 2005). 3. Medida: - Las estimaciones de medida postulan que debe usarse toda la informacin disponible de los jueces cuando se trata de crear una calificacin final para cada persona evaluada. Por ejemplo, se pueden controlar los efectos de severidad o lenidad al momento de asignar las calificaciones. - Se emplean cuando los diferentes niveles de la escala de calificacin pretenden representar diferentes niveles de una variable latente unidimensional. Tambin sirven cuando se tienen varios jueces y es imposible que todos los jueces califiquen todas las preguntas. Es decir, se tienen una matriz incompleta de datos, con conexiones por medio de personas comunes (una persona o conjunto de personas es calificada de forma independiente por diferentes jueces, pero no todas las personas son calificadas por todos los jueces). - El procedimiento ms utilizado para este tipo de estimaciones es el anlisis Rasch de Facetas Mltiples. En el caso de modelar las calificaciones de los jueces como una faceta, asume que la probabilidad de respuesta a una pregunta es una funcin de la

habilidad de quien responde a la pregunta, la dificultad de la pregunta y la severidad del corrector (Bond y Fox 2001). Otra alternativa es la propuesta por Patz, Junker, Johnson y Mariano (2002) conocida como Modelo Jerrquico de Evaluadores (HRM), que dentro del marco de la Teora de la Generalizabilidad, utiliza las distribuciones de las habilidades latentes propias de la Teora de Respuesta al tem, en lugar de las distribuciones de puntajes verdaderos y los supuestos de distribucin normal.

Confiabilidad de prueba repeticin de la prueba 1. Evala en que medida personas que son observadas o que se someten a la misma prueba dos veces, quiz con dos meses o ms de diferencia, obtienen una puntuacin parecida. Confiabilidad de forma alternativa 1. Este instrumento utiliza dos o ms versiones equivalentes de instrumentos. SE observa cual es el efecto del primer instrumento sobre el segundo o dems. Confiabilidad por divisin de mitades 1. En esta se maneja de acuerdo con el nmero de tems que maneje el instrumento de medicin. Demasiados tems provocara cansancio en el respondiente y hay riesgo que el contenido de las mitades sea diferente.

Correlacin 1. En probabilidad y estadstica indica la fuerza y la direccin de una relacin lineal entre dos variables aleatorias. Se considera que dos variables cuantitativas estn correlacionadas cuando los valores de una de ellas varan sistemticamente con respecto a los valores homnimos de la otra: si tenemos dos variables (A y B) existe correlacin si al aumentar los valores de A lo hacen tambin los de B y viceversa. La correlacin entre dos variables no implica, por s misma, ninguna relacin de causalidad.

Validez 1. Es la cualidad del instrumento para medir los rasgos o caractersticas que se pretenden medir. Por medio de la validacin se trata de determinar si realmente el cuestionario mide aquello para lo que fue creado. ltimamente, el concepto de validez se ha modificado considerablemente. Muy rara vez se oye hablar de la validez de un instrumento. Los psicmetros se refieren principalmente a la validez de las inferencias hechas a partir de los resultados del cuestionario. El foco de atencin se ha desplazado del instrumento a la interpretacin de los resultados y a las implicaciones en trminos decisionales que estas interpretaciones conllevan

Validez concurrente (descriptiva) La forma de determinarla implica tener dos situaciones de medida diferentes: uno es el Predictor (X) y otro el Criterio (Y), medimos a los mismos sujetos y tenemos dos observaciones de resultado: una con X y la otra con Y. Cmo cuantificamos el grado en que es vlido?. - Si la escala de medida es de intervalo o de razn, se usar el COEFICIENTE DE CORRELACIN O TEST DE PEARSON, el resultado puede oscilar entre: -1 y +1. Interpretacin en cuanto a validez: Cuanto ms cercano a 1 est el coeficiente en trminos relativos (sin tener en cuenta el signo) mayor es el grado de validez y cuanto ms cercano est a 0, menor ser la validez. Las situaciones de mxima validez sern las ms prximas a +1 y a 1, el signo +/- depender de la direccin en la relacin. Validez predictiva 1. Es el grado de capacidad que tienen para predecir el comportamiento futuro de una persona en un rea especfica, basndose en criterios de xito y contrastando las caractersticas de la persona contra estos criterios objetivo a fin de identificar su compatibilidad. La validez predictiva es la base de un concepto novedoso en la Industria del Assessment: el Job Match o el Job-Fit. Podemos traducirlos como adecuacin de la Persona al Puesto y no es otra cosa que identificar cules son los requerimientos crticos o claves de un puesto as como las caractersticas relevantes de la persona evaluada, y contrastar ambas informaciones para determinar el xito que puede tener esa persona que hemos evaluado en el desempeo de las funciones de ese puesto.

El valor de la Validez Predictiva en una Herramienta de Assessment vendr determinado por la solidez de las investigaciones estadsticas que la soporten, por la especificidad y claridad de los criterios que se utilicen en los estudios de investigacin y la sostenibilidad en el tiempo, es decir, que existan estudios continuos para verificar o confirmar la validez de prediccin de la herramienta. Definitivamente para identificar el talento en nuestras organizaciones es necesario contar con la suficiente cantidad de informacin que se pueda obtener acerca de las personas. Adems de diagnosticar las caractersticas ms relevantes, es importante predecir el futuro xito laboral y as conseguir el desarrollo adecuado del talento. Estas decisiones merecen la dedicacin en tiempo y el uso de fuentes de informacin fiables y precisas que nos permitan conseguir lo que queremos. Con decisiones acertadas conseguiremos mejorar la productividad y la motivacin de nuestro principal activo: las personas. Y esto impactar sin duda en nuestra cuenta de resultados y en el logro de nuestros objetivos. Fuente rrhh.magazine

Validez de constructos Es el grado en que una medicin se relaciona consistentemente con otras mediciones de acuerdo con hiptesis derivadas tericamente y que conciernen a los conceptos (o constructos) que estn siendo medidos. Un constructo es una variable medida y que tiene lugar dentro de una teora o esquema terico. Por ejemplo, supongamos que un investigador desea evaluar la validez de constructo de una medicin particular, digamos una escala de motivacin intrnseca: el Cuestionario de Reaccin a Tareas, versin mexicana (Hernndez-Sampieri y Corts, 1982). Estos autores sostienen que el nivel de motivacin intrnseca hacia una tarea est relacionado positivamente con el grado de persistencia adicional en el desarrollo de la tarea (v.g., los empleados con mayor motivacin intrnseca son los que suelen quedarse ms tiempo adicional una vez que concluye su jornada). Consecuentemente, la prediccin terica es que a mayor motivacin intrnseca, mayor persistencia adicional en la tarea. El investigador administra dicho cuestionario de motivacin intrnseca a un grupo de trabajadores y tambin determina su persistencia adicional en el trabajo. Ambas mediciones son

correlacionadas. Si la correlacin es positiva y sustancial, se aporta evidencia para la validez de constructo del Cuestionario de Reaccin a Tareas, versin mexicana (a la validez para medir la motivacin intrnseca). La validez de constructo incluye tres etapas: 1) 2) 3) Se establece y especifica la relacin terica entre los conceptos (sobre la base del marco terico). Se correlacionan ambos conceptos y se analiza cuidadosamente la correlacin. Se interpreta la evidencia emprica de acuerdo a qu tanto clarifica la validez de constructo de una medicin en particular.

El proceso de validacin de un constructo est vinculado con la teora. No es posible llevar a cabo la validacin de constructo, a menos que exista un marco terico que soporte a la variable en relacin con otras variables. Desde luego, no es necesaria una teora sumamente desarrollada, pero si investigaciones que hayan demostrado que los conceptos estn relacionados. Entre ms elaborado y comprobado se encuentre el marco terico que apoya la hiptesis, la validacin de constructo puede arrojar mayor luz sobre la validez de un instrumento de medicin. Y mayor confianza tenemos en la validez de constructo de una medicin, cuando sus resultados se correlacionan significativamente con un mayor nmero de mediciones de variables que tericamente y de acuerdo con estudios antecedentes estn relacionadas. Esto se representa en la figura 9.3. Para analizar las posibles interpretaciones de evidencia negativa en la validez de constructo, se sugiere consultar a Cronbach y Meeh (1955) y Cronbach (1984). VALIDEZ TOTAL = VALIDEZ DE CONTENIDO + VALIDEZ DE CRITERIO + VALIDEZ DE CONSTRUCTO As, la validez de un instrumento de medicin se evala sobre la base de tres tipos de evidencia. Entre mayor evidencia de validez de contenido, validez de criterio y validez de constructo tenga un instrumento de medicin; ste se acerca ms a representar la variable o variables que pretende medir.

Cabe agregar que un instrumento de medicin puede ser confiable pero no necesariamente vlido (un aparato por ejemplo puede ser consistente en los resultados que produce, pero no medir lo que pretende). Por ello es requisito que el instrumento de medicin demuestre ser confiable y vlido. De no ser as, los resultados de la investigacin no los podemos tomar en seno. Meninges Membranas que recubren el cerebro y la mdula espinal. Las meninges estn formadas por tres membranas: 1) la piamadre, que es la ms interna y la que est en contacto con el cerebro; 2) la membrana aracnoides, en situacin intermedia; 3) la duramadre, la membrana ms externa.

Hemisferios Cerebrales Se designa cada una de las dos estructuras que constituyen la parte ms grande del encfalo. Son inversos el uno del otro, pero no inversamente simtricos, son asimtricos, como los dos lados de la cara del individuo. Una cisura sagital profunda en la lnea media (la cisura interhemisfrica o longitudinal cerebral) los divide en hemisferio derecho y hemisferio izquierdo. Esta cisura contiene un pliegue de la duramadre y las arterias cerebrales anteriores. En lo ms hondo de la cisura, el cuerpo calloso (una comisura formada por un conglomerado de fibras nerviosas blancas), conecta ambos hemisferios cruzando la lnea media y transfiriendo informacin de un lado al otro.

También podría gustarte