Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Asignatura
: PSICOMETRIA
Docente
SEMESTRE
:I
Ciclo
:V
HUANCAYO, 2011
Pgina 1
CAPACIDADES
1. Explica y describe los aspectos fundamentales de la psicometra.
2. Elabora, selecciona y disea los diferentes tems en los tests
psicomtricos.
3. Distingue y reconoce las cualidades de los tests psicomtricos.
4. Aplica la teora psicomtrica a los diversos campos de la psicologa.
5. Maneja los anlisis estadsticos de mayor uso en psicometra.
Pgina 2
ACTIVIDAD n 01
PSICOMETRIA
FUNDAMENTOS DE LA TEORA Y LA PRCTICA DE LA PSICOMETRA
Es importante la psicometra?
La psicometra cada da nos confirma que todava el hombre es nico y que en nuestra
mismidad, como seres biolgicos y sociales, cada uno es diferente psicolgicamente del
otro; que las diferencias individuales existen de manera evidente y mensurable. El tipo de
anlisis de la personalidad que se hace desde el modelo psicomtrico pretende ser
objetivo y molecular. La objetividad la va a basar en la psicologa matemtica,
enfatizando los aspectos cuantitativos de la evaluacin. Realmente, los desarrollos
realizados en metodologa de la evaluacin por este enfoque han sido significativos, y
definidores de la tarea diagnstica. Los conceptos de fiabilidad y validez han sido y son
criterios clave para juzgar las pruebas psicolgicas.
Modelo psicomtrico, psicologa matemtica.
Qu rea ha contribuido ms para hacer de la psicologa una ciencia? Se pregunta
Nuria Cortada (1999, 2000, 2001), a quien seguimos en lo fundamental en los avances de
la investigacin psicomtrica, su respuesta considera que ha sido la psicometra la que
empez tratando de medir los constructos psicolgicos y sigue en la lucha por la
matematizacin de nuestra ciencia para estar a tono con los avances de las dems
ciencias y con la complicada tecnologa del tercer milenio.
En efecto cuando una ciencia tiene por objeto el estudio de procesos dinmicos necesita
un aparato formal para analizarlos. La psicologa estudia muchos procesos como el
aprendizaje, la percepcin, la memoria, la atencin, los fenmenos cognitivos y
emocionales que son procesos que se refieren al cambio o modificacin de una variable
en funcin de otras, como por ejemplo la evolucin del aprendizaje en funcin de la
prctica, el declive de las huellas de la memoria en funcin del tiempo, el cambio de
niveles de percepcin en funcin de los estmulos, el aumento de las funciones cognitivas
en relacin al crecimiento, etc
Antecedentes histricos de la psicometra:
Las races de la aplicacin de pruebas, se encuentran en la antigedad partiendo de los
exmenes que se hacan en China para el servicio civil, hasta la aplicacin de exmenes
en Grecia para evaluar las habilidades fsicas e intelectuales.
De gran importancia fueron las aportaciones hechas en el siglo XIX por los mdicos
franceses, Esquirol y Seguin. Aporte fundamental para el establecimiento de la
psicometra lo hicieron los investigadores Charles Darwin, Francis Galton, James McKeen
Cattell, Krapelin, Charles Spearman, T.L. Kelly, L.L. Thurstone, E.B. Titchener y otros.
Concepto de psicometra: La Psicometra es la ciencia cuyo objeto es medir los
aspectos psicolgicos de una persona, como son: el conocimiento, las habilidades, las
capacidades, las actitudes o la personalidad. La Psicometra se encarga de los procesos
para la medida de los aspectos "psicolgicos" de una persona, tales como conocimiento,
habilidades, capacidades, o personalidad. Las primeras pruebas psicometras fueron
construidas para medir la inteligencia. Las bases tericas de la psicometra parten de la
teora de los tests y los mtodos de elaboracin de escalas.
Importancia de la medicin en psicologa: La importancia de la medicin psicolgica
radica en su afn por establecer cientficamente la diferencia entre los rasgos y estados
psicolgicos entre individuos para ello se utilizan diferentes escalas que apoyan la
medicin objetiva de los atributos conductuales.
Medicin y estadstica: En 1816 Bessel Astrnomo de Greenwich, con base en sus
investigaciones descubre variaciones considerables entre individuos con respecto de la
Flix Rodrguez Isidro
Pgina 3
rapidez con que reaccionaban ante un estmulo visual (lo llamo ecuacin personal), este
suceso tuvo gran relevancia para la psicologa ya que sent las bases para la medicin
de al menos una caracterstica mental (Tyler, 1978)
En la actualidad, la construccin de escalas y el anlisis de datos obtenidos, perderan su
carcter de objetividad sin el uso de los mtodos estadsticos (medidas de tendencia
central). La estadstica permite determinar aproximaciones correlacinales entre
variables. En la determinacin de correlaciones entre dos variables, el anlisis estadstico
es muy til para condensar y analizar los datos.
La estadstica es la disciplina que proporciona una metodologa para recoger, organizar,
resumir, analizar datos y hacer inferencias a partir de ellas. La Estadstica se divide en:
estadstica descriptiva y estadstica Inferencia. En la estadstica descriptiva, se analizan
indicadores como: los porcentajes, la media, la moda, la mediana, la desviacin tpica, los
percentiles, etc. En el caso de la estadstica inferencial, que es en la que se apoya la
psicologa para hacer inferencias, los tpicos a analizar son las leyes del azar y el
concepto de probabilidad, los tipos de muestreo, diferencia de medias y anlisis de
varianza.
La medicin y las teoras psicolgicas: Existen diversas teoras que tratan sobre la
razn por la cual las personas se comportan como lo hacer. Algunos tericos centran el
nfasis en la herencia y el ambiente como modeladores del comportamiento humano. Las
teoras de los tipos, de los rasgos, psicoanalticas, fenomenolgicas, son tiles como gua
hacia la medicin y comprensin de la personalidad.
Principios ticos y deontolgico en la medicin psicolgica: La deontologa refiere a
los deberes relativos a una prctica determinada, los cuales, en su forma de enunciados
normativos se plasman en los llamados "cdigos de tica". La deontologa se aboca al
estudio de los deberes y obligaciones de los psiclogos, lo cual incluye el tratamiento de
ciertas problemticas propias del campo deontolgico, tales como, competencia,
idoneidad, integridad, capacitacin, respeto por los derechos y dignidad de las personas,
responsabilidad profesional y cientfica, mbitos de incumbencia. Tambin se ocupa de
los deberes y obligaciones de los psiclogos en lo referido a declaraciones pblicas,
publicaciones, actividades de investigacin, supervisin, docencia, etc.
Las escalas de medicin en psicologa: Medir es utilizar los procedimientos
matemticos para asignar nmeros e identificar atributos fsicos y psicolgicos que
permitan poner en claro las diferencias individuales. Una escala de medida permite al
investigador determinar el tipo de anlisis estadsticos que deber utilizar para examinar
una prueba y as poder considera a la prueba como buena.
Tipos de escalas: Son cuatro las escalas utilizadas para medir variables fsicas y
psicolgicas. Si se utilizan nmeros para describir o nombrar algo la escala debe ser
nominal. En una escala ordinal los nmeros se refieren a la clasificacin ordenada de
objetos o eventos en funcin del rasgo que se mide. En las escalas de intervalo la
distancia entre intervalos tendr que establecer valores iguales. Este tipo de escalas son
las ms usadas para medir variables psicolgicas y comparar diferencias interindividuales
o intraindividuales.
Las escalas de razn son las que poseen un cero real que significa ausencia total de lo
que se quiere medir (Coolican, 1997).
Mtodos de elaboracin de escalas: Cohen (2001) define elaboracin de escalas
como el proceso de establecimiento de reglas para la asignacin numrica en la
medicin. Es el proceso por el que se disea y calibra un dispositivo de medicin, y la
forma en que se asignan nmeros (u otros ndices), valores de escala a diferentes
cantidades del rasgo, atributo o caracterstica que se este midiendo (Cohen, 2001, pg.
288)
Flix Rodrguez Isidro
Pgina 4
Por lo regular existen diferentes mtodos de medicin escalar, los cuales pueden estar
abocados a medir personas, estmulos y tipos de respuesta. La medicin escalar de
estmulos se puede realizar con base a estimaciones subjetivas, ya que se requiere la
tarea evaluativo del sujeto. Los modelos discriminativos son otra opcin, estos modelos
ponen nfasis en la variabilidad de la respuesta a cada estmulo.
En la medicin escalar de sujetos, los estmulos se constituyen en reactivos los cuales se
le presentan al sujeto para que proporcione un tipo de respuesta.
Son 3 los mtodos para medir tipos de respuesta, los ms importantes son: juicios y
sentimientos, respuestas comparativas y absolutas, escala de respuesta.
Escalas multidimensionales: Las tcnicas de elaboracin
de escalas
multidimensionales se usan en caso de que el reactivo englobe ms de una dimensin.
El objetivo primario de los anlisis multivariados es resumir grandes cantidades de datos
en relativamente pocos parmetros (Nuria Cortada de Kohan)
Definicin y funcin de las pruebas: (tests): Una prueba psicolgica es una medida
objetiva y tipificada de una muestra de conducta. Una prueba psicolgica sirve de
estmulo para extraer un segmento de la conducta. Es rigurosamente estandarizada, o
sea se construye, se administra y se califica segn reglas preestablecidas. Permite
comparar estadsticamente la conducta de un sujeto con un grupo de sujetos de una
poblacin definida y clasificarla cuantitativamente, cualitativamente y/o tipolgicamente
(Costa, 1996; pg. 17)
Uso de las pruebas (tests) psicolgicas: Las pruebas o tests se usan con motivo de
evaluar aspectos educativos, clasificacin por ejemplo la inteligencia, en el rea del
trabajo, para la seleccin de personal, las pruebas tambin son utilizadas para
diagnosticar la existencia o ausencia de problemas en el comportamiento, son un recurso
importante para comprobar hiptesis de investigacin, en la clnica es un mtodo para
diagnosticar comportamiento normal o patolgico, o establecer un tratamiento
teraputico.
Clasificacin de las pruebas (tests): Las pruebas pueden clasificarse porsu objetivo
(potencia, ejecucin mxima, ejecucin de rasgos, o proyectivas). Por la forma o tipo de
respuesta que exigen (pruebas objetivas, subjetivas). Por la forma de administracin
(aplicacin individual o colectiva). Por la forma de dar las instrucciones.(Morales, 2002;
pgs. 24-30).
Teora de la Generalizabilidad. Fue desarrollada por Cronbach y sus colegas, esta
teora parte de la idea que las puntuaciones de prueba de una persona varan de una
prueba a otra, debido a variables en la situacin de prueba (Cohen, 2000; pg. 175).
La escuela americana (Thurstone): Thurstone no concordaba con la existencia de un
factor general y afirmaba que factores independientes o factores de grupo integraban la
inteligencia. Desarroll un procedimiento matemtico, denominado anlisis factorial
mltiple, este mtodo permite identificar un sin nmero de aptitudes que constituyen la
inteligencia y correlacionarlos entre s.
La estructura del intelecto de Guilford: El realiz un estudio muy completo de las
aptitudes cognoscitivas, l y su colaboradores encontraron un sinnmero de factores que
podran ser relacionados unos con otros (Tyler, 1978)
Elaboro un modelo estructural de la inteligencia al que llam estructura del intelecto. Este
constaba de tres dimensiones: operaciones (modos de pensar), contenidos (aplicaciones
del pensamiento) y productos (resultado de la aplicacin de una operacin a un
contenido.
Pgina 5
Pgina 6
ACTIVIDAD n 02
MEDICION - REQUISITOS- PROCEDIMIENTO PARA CONSTRUIR
UN INSTRUMENTO DE MEDICION
QUE IMPLICA LA ETAPA DE RECOLECCION DE DATOS?
Una vez seleccionado el tipo y el diseo de investigacin apropiado y la muestra
adecuada de acuerdo a nuestro problema de estudio, la siguiente etapa consiste en
recolectar los datos pertinentes sobre las variables involucradas en la investigacin.
Recolectar los datos implica tres actividades estrechamente vinculadas entre s:
1.Seleccionar un instrumento de medicin de los disponibles en el estudio del
comportamiento o desarrollare uno que sea vlido y confiable, de lo contrario, no
podremos basarnos en sus resultados para realizar conclusiones.
2.Aplicar ese instrumento de medicin, es decir, obtener las observaciones y mediciones
de las variables que son de inters para nuestro estudio.
3.Codificar, analizar e interpretar estas mediciones.
QU SIGNIFICA MEDIR?
De acuerdo a definiciones clsicas como la de Stevens (1951), significa asignar nmeros
o valores a objetos y eventos de acuerdo a reglas. Sin embargo, como lo seala
Carmines y Zeller (1979), esta definicin es ms apropiada para las ciencias fsicas que
para las ciencias sociales, las cuales trabajan con una serie de conceptos ms abstractos
que no pueden verse directamente o tratarse como productos o resultados.
Este razonamiento nos hace sugerir que es ms adecuado definir medicin como el
proceso de vincular conceptos abstractos con indicadores empricos, proceso que se
realiza mediante un plan explcito y organizado para clasificar y frecuentemente
cuantificar los datos que me puedan suministrar conductas observables relacionadas con
las variables en estudio. El centro de atencin es por lo tanto la respuesta observable
(bien sea una respuesta marcada en un cuestionario, una conducta grabada o una
respuesta dada en una entrevista). Un instrumento de medicin adecuado va a ser aqul
que me registra datos observables que verdaderamente representan los conceptos o
variables (ms abstractas) que el investigador tiene en mente.
QU REQUISITOS DEBE CUBRIR UN INTRUMENTO DE MEDICION?
Toda medicin o instrumento de recoleccin de datos debe reunir dos requisitos
esenciales; confiabilidad y validez.
LA CONFIABILIDAD de un instrumento de medicin se refiere al grado de precisin o
exactitud de la medida, en el sentido de que si aplicamos repetidamente el instrumento al
mismo sujeto u objeto produce iguales resultados. Es el caso de un balanza o de un
termmetro, los cuales sern confiables si al pesarnos o medirnos la temperatura en dos
ocasiones seguidas, obtenemos los mismos datos.
LA VALIDEZ se refiere al grado en que un instrumento mide la variable que pretende
medir. Por ejemplo, un test de inteligencia no ser vlido, si lo que mide es realmente
memoria y no inteligencia. Ciertas variables como el sexo, la nacionalidad, son muy
fciles de observar o de preguntar y obtener una respuesta vlida. Pero cuando se trata
de diversas variables que se trabajan en ciencias sociales como motivaciones, actitudes,
Flix Rodrguez Isidro
Pgina 7
Pgina 8
SI
UN
INSTRUMENTO
ES
CONFIABLE
VALIDO?
En la prctica es casi imposible que una medicin sea perfecta, generalmente se tiene un
grado de error. Desde luego, se trata que este error sea el mnimo posible y para ello hay
formas de calcular la confiabilidad y la validez.
Para la confiabilidad, generalmente todos los procedimientos utilizan frmulas que
producen coeficientes de confiabilidad, los cuales pueden oscilar entre 0 y 1, donde 0
significa confiabilidad nula y 1 representa el mximo de confiabilidad. Entre ms se
acerque el coeficiente a 0 habr mayor error en la medicin. Los procedimientos ms
utilizados son:
Medida de estabilidad (confiabilidad por test-retest). Un mismo instrumento es aplicado
dos o ms veces a un mismo grupo de personas. Si la correlacin entre los resultados de
las diferentes aplicaciones es altamente positiva, el instrumento se considera confiable..
Desde luego, el perodo de tiempo entre las mediciones es un factor a considerar. Si es
muy largo, otros factores como maduracin o cambio de condiciones pueden afectar la
segunda medida. Si es muy corto, las personas pueden recordar cmo contestaron la
primera vez y aparecer como ms consistentes la segunda vez.
Medidas paralelas o formas equivalentes de medir. En este procedimiento no se aplica el
mismo instrumento de medicin sino dos o ms versiones equivalentes de ste. Las
versiones deben ser similares en contenido, instrucciones, duracin, etc. Por ej. cuando
un profesor administra 2 o ms modalidades de examen en su grupo de alumnos. El
instrumento es confiable si la correlacin entre los resultados de las dos o ms pruebas
administradas es significativamente positiva.
Mtodo de mitades divididas. Aqu se administra un solo instrumento, una sola vez, pero
se dividen las preguntas o los items (Por ejemplo los items pares con respecto a los
impares, o la primera mitad con respecto a la segunda mitad). Si correlacionan los
resultados de las dos partes, se considera el instrumento confiable. Ahora bien, la
confiabilidad vara de acuerdo al nmero de items de la prueba. Cuantos ms items
mayor es la confiabilidad.
Cotejo entre observadores. Se utiliza fundamentalmente cuando se aplican instrumentos
de observacin y registro. Dos o ms observadores aplican el mismo instrumento al
mismo tiempo. Luego se calcula la correlacin de aspectos coincidentes observados. Se
considera confiable el instrumento si hay un porcentaje de coincidencias superior al 80%.
Por supuesto que este mtodo implica que los observadores tengan el mismo nivel de
preparacin o de entrenamiento para observar.
Para calcular la validez, la validez que ms interesa obtener en una investigacin es la
validez de contenido. Para obtener validez de contenido primero que nada hace falta
revisar como ha sido tratada esta variable por otros investigadores anteriormente.
Segundo, elaborar un universo de items tan amplio como sea posible, para medir la
variable en todas sus dimensiones. Posteriormente, se consulta con investigadores
familiarizados con el tema y la variable a medir para ver si el contenido es exhaustivo.
Esto se conoce con el nombre de validacin por expertos.
Flix Rodrguez Isidro
Pgina 9
Pgina 10
Pgina 11
ACTIVIDAD n 03
LOS TESTS PSICOMTRICOS
Desde que la psicologa, separada del corpus filosfico que le dio origen, empieza a
desarrollarse como disciplina cientfica, ha sido atravesada por distintos paradigmas y por
variadas concepciones y epistemologas, que tienen su anclaje en diferentes momentos
socio-histricos. El psicodiagnstico, o, ms especficamente el uso de las tcnicas
diagnsticas, probablemente una de las prcticas ms vinculadas identitariamente a la
psicologa, no escapa a esos cambios, antes bien es causa y a la vez consecuencia de
los mismos.
La creacin de los tests psicolgicos, tiene su origen en la necesidad de medir y
cuantificar para de esta forma poder categorizar a los individuos. Este desarrollo, que
pauta un momento histrico para la disciplina psicolgica, no est por supuesto carente
de ideologas y concepciones acerca del hombre. En tanto inaugura algo, ha dejado una
marca que en cierta medida sigue hasta nuestros das.
Plantearnos hoy que el par psicodiagnstico-evaluacin no slo da cuenta de esa marca
sino que pone en evidencia al mismo tiempo el origen y la historia, en una suerte de
convivencia compleja de distintas concepciones que nos atraviesan en la actualidad.
Realizar una lectura crtica de los diferentes momentos de esa historia nos permitir
pensar sobre las prcticas vigentes de modo que las mismas no queden naturalizadas
per se como cientficas o no cientficas.
Si bien a Francis Galton se le reconoce como precursor del empleo de tests para la
evaluacin psicolgica (1883), James Mckeen Cattell, fue el primero que los aplic para
medir la inteligencia (1890), y Mnsterberg inici los tests de aptitud profesional, no es
menos cierto que ya en 1575 el pregraflogo espaol Juan Huarte de San Juan
reclamaba la necesidad de pruebas especficas (psicotcnicos) para los funcionarios de
la administracin pblica como un medio para conocer las aptitudes psicolgicas
individuales y su correcta adecuacin profesional.
El propio Alfred Binet junto a Vctor Henri (1895) recurri el estmulo perceptivo de las
manchas en lo que sera un antecedente de tcnica proyectiva formulado ms tarde por
H. Rorschach. Ser en 1904, cuando Jung elabore la primera prueba proyectiva: el test
de asociacin de palabras. ste se utiliz en criminologa, intercalando vocablos
vinculados a los hechos inculpatorios, para estudiar la reaccin del sujeto ante esas
palabras con fuerte carga emocional, y sus variaciones fisiolgicas en las respuestas
verbales; Jung le llamaba "indicios de complejo". En contraposicin Freud no consideraba
vlida la prctica de la asociacin libre para detectar a sujetos que han cometido un
delito, puesto que l que ha cometido realmente la accin fraudulenta, en la asociacin
libre, no deja plenamente libertad, hace esfuerzos por controlar la situacin; mientras que
por el contrario el neurtico, por sentimientos de culpa, va a delatarse, por el miedo a que
se den cuenta, precisamente de su miedo a que le crean culpable, es el llamado
delincuente por sentimiento de culpa. (Dr. Jorge Ulnik. Psiquiatra Psicoanalista de la
Facultad de Medicina de la Universidad de Buenos Aires).
En 1920, M. Klein, las emplea en el psicoanlisis de los nios, obteniendo excelentes
resultados, pues stos se expresaban mejor ante el juego y el dibujo, y en 1920, aparece
la tcnica del Rorschah, donde la personalidad de cada uno determina la percepcin de
las manchas.
.- Fiabilidad o constancia de los resultados,
Pgina 12
Pgina 13
Pgina 14
ACTIVIDAD n 04 y 05
ITEMS DEL TEST
Antes tendremos que analizar los items de cualquier instrumento de medicin que
utilizaremos con fines diagnsticos, se exige que ellos satisfagan ciertos requisitos, entre
los principales estn las condiciones siguientes: Ser objetivos, confiables y vlidos.
Por esto la consecuencia prctica es el aspecto ms importante del anlisis de los tems,
cuando al eliminar los inadecuados o revisar los que necesitan mejorarse se garantiza la
confiabilidad y validez futura de la prueba, asegurando adems las mejores condiciones
para su normalizacin.
En el anlisis de los tems se consideran tres criterios fundamentales:
POR DIFICULTAD: se entiende el por ciento de sujetos que responden
correctamente al tem. Este ndice garantizar la dificultad baja, promedio o alta del
test segn sea el objetivo del investigador.
LA DISCRIMINACIN: es la segunda y ms complicada parte del anlisis de los
tems, est caracterizada por el coeficiente de discriminacin, que no es ms que la
correlacin entre la respuesta al tem y la puntuacin total de la prueba. Entonces la
discriminacin se analiza a travs de un criterio interno, por eso el problema ahora, es
averiguar la contribucin del tem a la puntuacin total del test.
LA VALIDEZ: del tem se define mediante la correlacin entre la respuesta
correcta de los sujetos al tem y el grado en que l expresa la caracterstica medida
con un criterio externo.
La importancia de estos criterios y los requisitos que se le imponen al tem con respecto a
ellos, dependen del Test de que se trate y de los que persiga el investigador. Despus de
analizar los tems de un test, es posible tambin indagar sobre el pronstico de la validez
y la confiabilidad de la prueba total. El anlisis de la validez solo es posible hacerlo
cuando en la base de datos del anlisis de los tems, se tiene informacin sobre los
coeficientes de validez adems de los de discriminacin, mientras que la posibilidad de
pronosticar la confiabilidad siempre est garantizada.
ELABORACIN Y SELECCIN DE LOS TEMS:
Segn como seleccionamos los tems el test tendr un contenido. Las preguntas y
alternativas de respuesta son el protocolo del test. Los tems son verbales, grficos o
manipulativos. El tipo de tems tiene que ver con s el sujeto responde de forma libre,
estructurada o de forma mixta
tems de respuesta libre: El sujeto debe responder con sus propias palabras, no
hay una nica respuesta. Es la ms completa. El sujeto desarrolla de forma abierta y
libre una respuesta ante una pregunta que se plantea, desde una perspectiva personal
y su propio lenguaje. Puede ser verbal, manipulativo o grfico.
Ventajas: se recoge la creatividad/originalidad de la respuesta del sujeto, se permiten
varias respuestas verdaderas y se puede valorar no solo lo que dice sino tambin
cmo lo expone y lo construye (informacin adicional).
Desventajas: la subjetividad a la hora de construir y, fundamentalmente, a la hora de
valorar estos tems (diferentes evaluadores no llegan al mismo acuerdo, es diferente
segn el juez, evaluacin sesgada, a no ser que evalu un solo juez).
Sobre los dems tiene la ventaja de tener la mejor manera de valorar la creatividad y
originalidad del sujeto.
tems de respuesta restringida. En los que se le pide una respuesta breve, tiene
menor libertad pero se puede ampliar el nmero de tems (hacer ms preguntas).
Ventajas: correccin rpida y se llega a un acuerdo entre jueces.
Desventajas: perdemos mucho la valoracin de la creatividad del sujeto y sigue
siendo subjetiva.
tems de respuesta estructurada: Se pierde totalmente la posibilidad de valorar
respuestas creativas (p.e. exmenes tipo test), se le dan las respuestas al sujeto y se
Flix Rodrguez Isidro
Pgina 15
Pgina 16
Si cada mbito va ser valorado igual habr un mismo nmero de tems para cada
rea (p.e. la asertividad en la familia, el trabajo, con los amigos), si le damos ms
relevancia mayor nmero de tems y obtener ms muestras de conducta.
Cmo elegimos los tems? - La eleccin de los tems la hace el autor de los test,
tomando en cuenta:
Que sean representativos del atributo que quiero medir, cmo se manifiesta ese
atributo? observacin directa, definir cul es la manifestacin, tomar datos de campo.
Hasta que punto necesito una precisin de los datos, cuanto ms estructurado es un
tem ms preciso es pero menos creativo. Qu quiero evaluar y qu precisin quiero;
me interesan los datos cualitativos o cuantitativos, describir (cualidad, ensayo) o
predecir (cantidad, respuesta alternativa).
Las personas, a quien voy a evaluar, considerar edad, nivel sociocultural, acadmico,
contexto, ambiente. Variables del sujeto.
Forma de administracin: individual o colectiva.
Tiempo disponible (las pruebas verbales son ms rpidas de aplicar y corregir que
una manipulativa o grfica)
Longitud (cuntos tems tendr la prueba): Ver la caracterstica que quiero evaluar y lo
amplia que es (p.e. una caracterstica de personalidad es ms amplia que el clima
familiar, ms concreto), y ver si tengo de esa caracterstica tengo ms reas de
evaluacin, si es as necesitar ms tems. Cada uno de los tems es una muestra de
conducta, cuntas ms tengamos mejor podremos entender al sujeto pero sin perder
el equilibrio (no preguntas en exceso).
Tipo de tems elegidos (la prueba es ms larga o corta segn los tems, las pruebas
verbales tienen ms tems, los manipulativos son menos). Demarcar la longitud del
test.
Finalidad del instrumento, segn ella la longitud puede cambiar.
Forma de aplicacin. Los test individuales suelen tener menor nmero de tems, en
los colectivos se pierden la relacin de t a t y otra informacin, hay que tener ms
preguntas, son ms amplios que los individuales (p.e. tiempo de reaccin WAIS,
dificultad de los tems y cunto tiempo necesita para pensar y responder).
Caractersticas del sujeto. Tiempo de aplicacin, si tenemos menos tiempo utilizamos
test cortos. No hay normas fijas, depende de estos apartados y del autor.
dificultad de los tems: Tomar en cuenta el tipo de prueba, en las de personalidad
tendr que ser una dificultad media y media-alta, en los test de manipulativos y de
inteligencia existirn diferentes niveles. Por ende, hay que valorar lo que mide la
prueba y el tipo de sujetos a evaluar (tipo de tems, presentacin, reas de contenido
y caractersticas del sujeto marcarn la dificultad). Es importante que el nivel de
lectura o lenguaje de los sujetos evaluados no sea un obstculo para responder a las
tareas, debe estar adecuado a su nivel de lenguaje. La nica excepcin sera si se
trata de una prueba en que se evalu el rendimiento en el lenguaje, pero en ellas
poco a poco se va aumentado el grado de dificultad para que el sujeto encuentre
tems que pueda resolver. (p.e. para un nio son ms difciles los tems verbales que
los grficos).
APLICACIN, CORRECIN Y PROCEDIMIENTOS ESTADSTICOS DE LOS ITEMS:
Hay que aplicar el test y para ello tenemos que tener en cuenta:
Delimitar unas normas claras de aplicacin.
Tener elegida de forma clara la muestra representativa.
Aplicar el test: Recoger datos significativos.
Ahora hay que hacer un anlisis de los tems a dos niveles:
Cualitativo: anlisis lgico- racional.
Cuantitativo: anlisis emprico de las propiedades estadsticas de cada uno de
los tems.
A. ESTADSTICA DE TEMS: es tan econmica como la anterior. Una sola medida.
Valora la consistencia interna con criterios internos. Comparamos las
puntuaciones de cada tem con la puntuacin obtenida en el test completo.
Flix Rodrguez Isidro
Pgina 17
Se considera a cada tem como un test individual. Comparacin de cada tem con
la puntuacin total del test.
Se supone que todos los tems tienen la misma varianza y la misma media
utilizamos la formula de Kuder- Richardson.
Si las varianzas y medias son distintas:
Los distintos mtodos nos dan diferentes medidas de confiabilidad, varan en
cuanto al grado y en cuanto al contenido
INSTRUMENTOS PSICOMETRICOS
A.- DE INTELIGENCIA B.- DE PERSONALIDAD CONSEJOS PARA REALIZAR
ESTAS PRUEBAS TIPOS DE PRUEBAS No evalan ni lo que sabes ni lo que sabes
hacer, sino lo que podras llegar a saber y a hacer, es decir, tu potencial. Lo importante
aqu es no considerar que si no pasas una prueba psicotcnica, es porque eres medio
tonto. En realidad, cada empresa decide qu busca al pasar un psicotcnico (por
ejemplo, para un puesto de trabajo determinado, puede que la empresa no seleccione
a personas con una inteligencia superior a la media -segn el test, claro- porque no
desempeara bien el trabajo). Los test que suelen pasar en una seleccin de
personal, suelen depender del puesto de trabajo, es decir, si te presentas para
administrativo, seguramente pasarn un test numrico (si lo tuyo no son los nmeros,
tendrs que destacar ms en otras habilidades que se requieran, o pensar en otros
puestos de trabajo, en los que los nmeros no sean tan importantes).
B.- DE INTELIGENCIA TEST DE AMPLITUD: Miden el conocimiento y/o el
rendimiento. Pueden valorar la memoria, precisin, destreza, atencin, sentido de la
organizacin, agilidad manual y mental. -MATRICES DE RAVEN: Orientados a la
valoracin de la inteligencia concreta, nivel de observacin y organizacin lgica.
Consiste en descubrir qu figura corresponde al cuadro en blanco de los otros que
aparecen en la parte inferior. Las figuras pueden ser abstractas u objetos que
mantienen un orden lgico. Interesan la identificacin y la diferenciacin de formas.
Son ejercicios en orden de dificultad creciente. El tiempo est limitado, con lo cual hay
que evitar estancarse en un ejercicio. -FICHAS DE DOMIN: Miden la abstraccin
lgica. -TEST DE RAZONAMIENTO: Miden las facultades de adaptacin: agilidad
mental, resolucin de problemas, etc. -TEST DE COMPRENSIN VERBAL: Miden la
comprensin de ideas, facultad de anlisis y sntesis.
C.-DE PERSONALIDAD -TEST DE RORSCHACH: Analiza las dimensiones
intelectual, afectiva y de comportamiento. -TEST DE APERCEPCIN TEMTICA:
Evala los factores y necesidades de la conducta y de las motivaciones, valorando las
emociones y estados internos. -TEST DE RBOL: Revela a la persona en la vida
interior y el desarrollo afectivo. En definitiva en un prueba psicotcnica nos podemos
encontrar los siguientes puntos: Test de informacin: Evalan cuestiones
relacionadas con el vocabulario, fluidez verbal y significado de las palabras.
Problemas aritmticos: Intentan medir la capacidad para resolver problemas
aritmticos y matemticos mediante ejercicios relacionados con nmeros. Series
numricas: Estos ejercicios prueban la capacidad para resolver problemas aritmticos
y matemticos, convirtindose en una buena forma de medir el razonamiento inductivo
o razonamiento abstracto. Las series numricas pueden presentarse de forma que el
individuo complete los nmeros que faltan o bien se les da a elegir el nmero siguiente
entre varias alternativas posibles. Series alfabticas: Del mismo modo que con las
series numricas, se pretende medir tambin el razonamiento abstracto. Problemas
de razonamiento no verbal: Son test que se han creado con figuras o smbolos para
medir la inteligencia general o el razonamiento abstracto. Ejercicios de visualizacin:
Evalan la capacidad para captar relaciones espaciales. Es importante para aquellas
personas que deben manejar objetos, mquinas, planos, etc. Test de capacidad
mecnica: Tienen como finalidad identificar a aquellos individuos con aptitudes para
trabajos de carcter mecnico y trabajos de mantenimiento. Test de personalidad:
Tratan de buscar rasgos de carcter, acordes con el perfil del puesto: introvertido o
extrovertido, dinmico o pasivo, optimista o pesimista, con iniciativa o sumiso,
impulsivo o moderado, etc. Test de aptitudes administrativas: Sirven para medir la
Flix Rodrguez Isidro
Pgina 18
Pgina 19
AVTIVIDAD 06
INSTRUMENTOS PSICOMTRICOS
El Mini Mental StateExamination (MMSE) de Folstein.
DESCRIPCION:
Diseado por Folstein y McHung en 1975, con la idea de proporcionar un anlisis breve y
estandarizado del estado mental que sirviera para diferenciar, en pacientes psiquitricos,
los trastornos funcionales orgnicos.
Hoy en da, se utiliza sobre todo para detectar y evaluar la progresin del Trastorno
Cognitivo asociado a Enfermedades Neurodegenerativas como la de tipo Alzheimer. El
MEC fue la primera versin en castellano del MMSE, adaptada por Lobo y col. La versin
de 35 puntos, fue la primera y es la ms utilizada actualmente. Se trata de una sencilla
escala estructurada, que no requiere ms de 5 10 minutos para su administracin.
Sus tems exploran 5 reas cognitivas:
Orientacin, Fijacin, Concentracin y Clculo, Memoria y Lenguaje
INSTRUCCIONES GENERALES:
Invitar al entrevistado a colaborar. No corregir nunca al paciente, aunque se equivoque.
Contabilizar los puntos correctos de cada uno de los 5 tems del test.
1. Orientacin: No se permite la Comunidad Autnoma como respuesta correcta
para la provincia ni para nacin o pas(excepto en las comunidades histricas).
2. Fijacin. Repetir claramente cada palabra en un segundo. Le damos tantos puntos
como palabras repita correctamente al primer intento. Hacer hincapi en que las
recuerde, ya que ms tarde se le volvern a preguntar. Asegurarse de que el
paciente repita las tres palabras correctamente hasta que las aprenda. Estn
permitidos seis intentos para que las repita correctamente.
3. Concentracin y Clculo: Sustraccin de 3 en 3. Si no le entiende se puede
reformular la pregunta. Si tiene 30 pesetas y me da tres cuntas le quedan?, y
seguir pero sin repetir cifra que d el paciente. Se dar un punto por cada
sustraccin correcta.
Repetir los dgitos 5 9 2 lentamente: 1 segundo cada uno, hasta que los
aprenda, se le da 1 punto por cada dgito que coloque en posicin inversa
correcta.
4. Memoria: Dar un amplio margen de tiempo para que pueda recordar sin ayudarlo.
1 punto por cada palabra recordada sin tener en cuenta el orden.
5. Lenguaje y construccin: El entrevistador ha de leer la frase poco a poco y
correctamente articulada, un error en la letra, es 0 puntos en el tem:
Semejanzas: En las semejanzas perro-gato las respuestas correctas son
animales de x caractersticas. rdenes verbales, si el paciente coge el papel
con la mano izquierda, se valorar como error, si lo dobla ms de dos veces es
otro error.
Lectura, escritura y dibujo: Si utiliza gafas se solicita que se las ponga.
Frase: Advertir que no se considerar correcta si escribe su nombre. Si es
necesario se le puede poner un ejemplo, pero insistiendo en que ha de escribir
algo diferente. Debe construir una frase con sujeto, verbo y complemento para
valorarla con un punto.
Figura. Cada pentgono ha de tener exactamente 5 lados y 5 ngulos y debe
entrelazarse en dos puntos de contacto.
PUNTUACIN:
La puntuacin total mxima es de 35 puntos.
Flix Rodrguez Isidro
Pgina 20
Excluimos las preguntas que hayan sido eliminadas, bsicamente por analfabetismo o
por imposibilidad fsica de cumplir un tem (ej.: ceguera). Entonces calculamos la
puntuacin total corregida: la obtenida por regla de tres despus de corregir la puntuacin
total.
Ejemplo, si el paciente es ciego y no puede acceder a 4 de los 35 puntos posibles, la
puntuacin final se calcular sobre 31 puntos posibles. Imaginemos que la puntuacin
total ha sido 20, aplicando la correccin obtenemos una puntuacin (20x35/21) = 22,5
(redondearemos al nm. entero + prximo, el 23).
INTERPRETACIN:
Instrumento sencillo y breve de aplicacin, no requiere de especiales habilidades para su
administracin. La edad y la escolarizacin influyen en la puntuacin total.
Existen limitaciones a su uso en pacientes con bajo nivel cultural, analfabetos o con
dficit sensoriales.
No explora todas las reas cognitivas. Posibilidad de que pasen inadvertidos los casos
incipientes de deterioro cognitivo.
RANGO de PUNTUACION 0 35.
Lobo y col, proponen:
Pacientes GERIATRICOS:(> de 65 aos), punto de corte 23/24; es decir, 23 menos
igual a caso y 24 ms a no caso.
Pacientes NO GERIATRICOS punto de corte 27/28 (es decir, 27 0 menos igual a caso,
y 28 ms igual a no caso.
Cuestionario de Estado Mental
Portatil de Pfeiffer
DESCRIPCION
Fue diseado por Pfeiffer en 1975 como test de screening de deterioro cognitivo.Se
encuentra validado en nuestro pas por Garca-Moltalvo.
Se trata de un cuestionario heteroaplicado de 10 tems, sobre cuestiones muy generales
y personales. Se puede pasar en 4 5 minutos. Se van anotando las respuestas
errneas. Se permite un fallo de ms si el paciente no ha recibido educacin primaria y
uno de menos si tiene estudios superiores.
Explora la:
Memoria a corto plazo.
Orientacin.
Informacin sobre hechos cotidianos, y la Capacidad de clculo.
INTERPRETACIN.
Detecta tanto la presencia de deterioro cognitivo como el grado del mismo. Las
cuestiones con varias respuestas slo se aceptan como correctas si todos los elementos
de la misma lo son.
Para poblacin de raza blanca y nivel cultural medio se considera:
- NORMAL de 0 a 2 errores.
- Deterioro cognitivo Leve de 3 a 4 errores.
- Deterioro cognitivo MODERADO (Patolgico) de 5 a 7 errores,
- Deterioro cognitivo Importante de 8 a 10 errores.
Sus valores psicomtricos arrojan valores bajos de sensibilidad en estudios realizados
en la comunidad (S 34 48% y E 94- 95 %) y mejorando stos en casos diagnosticados
de grados moderados o severos de demencia.
Flix Rodrguez Isidro
Pgina 21
Enfatiza mucho el lenguaje y la memoria y tiene una intensa orientacin verbal. Por lo
que en algunos tipos de dficit sensoriales o trastornos psiquitricos (depresin) podra
dar falsos positivos. A pesar de haber sido diseado para screening, no detecta deterioros
leves ni cambios pequeos en la evolucin del deterioro cognitivo.
Es un test muy rpido de administrar que no requiere especial entrenamiento, lo que lo
hace muy indicado en los CRC... Se ha mostrado especialmente til en invidentes,
personas de edad avanzada y analfabetos. Especialmente til para screening en
poblacin general.
PROPIEDADES PSICOMETRICAS
- Fiabilidad:La fiabilidad test-retest oscila entre 0,82 y 0,85.
- Validez: Los ndices de correlacin con otros instrumentos similares: son 0,76 al 0,88
con el Mental Status Questionnaire.
- Sensiblidad: Segn varios estudios recogidos por Del Ser la sensibilidad, vara del 68 al
82 % y la Especificidad del 92 al 96%.
Trastornos orgnicos: Ansiedad Depresion
Trastornos del ESTADO DEL NIMO
Depresin
Actualmente se conocen ms de 100 escalas, lo que nos da una idea de las limitaciones
de estas herramientas y del hecho de que no existe ningn instrumento "ideal".
En las escalas todos los sntomas son igual de importantes y se suman tems vegetativos
o cognitivos de forma intercambiables. Por eso, estas escalas no permiten realizar el
diagnstico de dapresin y mucho menos especificar de qu tipo de depresin se trata...
Su funcin es evaluar la intensidad de los sntomas una vez que se ha realizado el
diagnstico.
OBJETIVO DE LA ESCALA:
Son 3 los objetivos principales de las escalas para evaluar la depresin:
- Cuantifica la intensidad de la depresin en sujetos ya diagnosticados.
- Evala la efectividad del tratamiento.
- Cribaje en poblacin general o en poblacin clnica.
CARACTERISTICAS ESPECFICAS:
La primera de las escala desarrolladas para evaluar la depresin fue la de HAMILTON, y
con ella naca la moderna psicometra.
1. La Escala de HAMILTON. Es la ms utilizada y sirve de referencia para todas las
dems. Que deben demostrar una buena validez convergente con sta....... Su
mayor limitacin es que requiere cierto entrenamiento por parte del entrevistador
por lo que encarece su uso.
2. La Escala de BECK. Es la ms empleada de las escalas autoadministradas en
depresin.
3. Escala Ansiedad Depresin de GOLDBERG. Es una de los tests utilizado como
instrumento de cribaje en depresin y ansiedad. Es breve, fcil de administrar y
sirve como gua clnica.
4. Escala Ansiedad Depresin Hospitalaria. Especialmente indicada en pacientes
hospitalizados con co-morbilidad orgnica.
Estas dos ltimas escalas no evalan especficamente depresin ya que tambin
incluyen ansiedad. El problema de a ellas es que no discriminan bien ambas
entidades.
El solapamiento entre las escalas de ansiedad y depresin no debe atribuirse
necesariamente a una mala construccin del instrumento, sino a la mala
delimitacin de ambos sndromes clnicos. Por eso se tienden a emplearse como
medidas de malestar general, en la lnea del General HeatthQuestionnaire (GHQ).
Flix Rodrguez Isidro
Pgina 22
Pgina 23
Pgina 24
Pgina 25
Pgina 26
riesgo.
2) El Test de Hostilidad de BUSS-DURKEE.
Este, es uno de los cuestionarios autoaplicados ms empleados para medir la
agresin, de especial utilidad para evaluar impulsividad, intencionalidad suicida y
agresin en general.
3) La Escala de Impulsividad de BARRAT.
Es una escala autoaplicado y uno de las ms utilizadas en investigacin. Est
indicado en trastornos de personalidad (especialmente lmites), trastornos
bipolares y todo trastorno psiquitrico en que la conducta impulsiva o suicida
constituye un problema.
4. ESCALA de BUSQUEDA de SENSACIONES.
DESCRIPCIN
La escala de bsqueda de sensaciones (Forma V), fue diseada por Zuckerman
y col., siendo la versin ms reciente la de 1978. Su objetivo es valorar la
bsqueda de sensaciones. Este rasgo fue definido por Zckerman como la
necesidad de sensaciones y experiencias nuevas, variadas y complejas y el
deseo de arriesgarse con el fin de obtenerlas.
Es un cuestionario autoadministrado, formado por 40 preguntas con respuestas
dicotmicas (Si No). Cada respuesta afirmativa punta 1 y cada negativa 0.
CONSTA de 4 Escalas:
Bsqueda de Emociones (BEM): tems 1.5.9.13.17.21.25.29.33.37
Bsqueda Excitacin (BEX): tems 2,6,10,14,18,22,26,30,34, 38
Desinhibicin: tems 3,7,11,15,19,23,27,31,35,39.
Susceptibilidad al aburrimiento (SAB):4,8,12,15,20,24,28,32,36,40
Proporciona por tanto 4 puntuaciones distintas (una por escala) y adems una
total. En nuestro medio ha sido validada por Prez y col., en base a trabajos
previos de este mismo autor.
INTERPRETACION.
Se trata de un instrumento adecuado para la investigacin del rasgo bsqueda
de sensaciones en nuestro medio. No existen puntos de corte propuestos por los
autores y debe interpretarse que puntuaciones + elevadas representan mayor
presencia del rasgo.
Al igual que numerosos estudios, en la validacin espaola se observan
puntuaciones ms elevadas en todas las subescalas y la puntuacin total en
varones respecto a las mujeres. En varones las puntuaciones ms altas se
obtienen en la escala BEM y las menores en la SAB. En mujeres las ms altas en
la BEM y las menores en la DES. Existe una relacin inversa entre la edad y la
puntuacin de la escala.
La subescala SAB es la menos homognea, la que presenta menor correlacin
con las otras y es la que menos fiabilidad alfa demuestra. La menor fiabilidad se
obtiene mediante la utilizacin de la puntuacin total. En lugar de la de las
subescalas. A modo orientativo, presentamos los datos normativos en poblacin
espaola
BEM
BEX
DES
SAB
Varones 6.8 (2,6) 5,7 (2,1) 5,1 (2,5) 3, )
,3
Mujeres 6,1 (2,4) 5,4 (1,9) 3,0 (1,9) 3,0 (1,9)
Flix Rodrguez Isidro
TOTAL
(6,4)
17,7 ,3)
Pgina 27
PROPIEDADES PSICOMETRICAS.
Fiabilidad
La fiabilidad test- retest en la poblacin espaola con un intervalo de 5 das es en
valores del 0,9 para la puntuacin total y oscila entre 0,68 y 0,94 para las
subescalas. En las mujeres para la puntuacin total es de 0,92 y entre 0,72 y 0,95
para las subescalas. El mismo caso anterior. Pero con un intervalo de 5 semanas
arroja valores similares en varones (0,88 para la puntuacin total y 0,71 0,86
para las subescalas) y mujeres (0,78 para el total y 0,70 0,87 para las
subescalas).
Validez
La
validez
concurrente
observada
con
las
diferentes
escalas
selEysencjPersonalityQuestionnaire son: Las Escalas E (Extraversin) y P
(Psicoticismo) presentan correlaciones superiores con la escala de Busqueda de
Sensaciones que la escala de N (Neuroticismo).
Instrumentos Psicomtricos que nos permiten evaluar la Esquizofrenia y los
Trastornos Psicticos
INTRODUCCION:
Desde la descripcin de Demencia precoz por Kraepelin, que se considera el punto de
partida de la psiquiatra moderna, se han intentado identificar grupo de sntomas que
diagnostiquen de forma fiable este trastorno. De hecho, las clasificaciones psiquitricas
DSM y CIE han intentado, en cada una de sus ediciones, afinar los criterios diagnsticos
en este sentido, sin conseguir acuerdos definitivos.En 1980 Crow y en 1982 Andreasen
defienden la existencia de 2 tipos de sntomas en la esquizofrenia: Positivos y
Negativos, con sus correlatos biolgicos y de neuroimagen.
En 1987, Liddle revisa este modelo y sugiere uno tridimensional con las categoras de
Positivo-paranoide, Negativo-Deficitario y desorganizado y hefebrnico. En 1990, Kay y
Sevy proponen un modelo de 4 factores:: Positivo, Negativo, Agitacin y Depresin.
Por ltimo, Linstrom y Von Knorring entre otros autores, proponen un sistema
pentadimensional
con las siguientes dimensiones: negativo, Positivo, Disfuncin
cognitiva, Ansiedad / Depresin y Excitacin. Todas estas propuestas cuentan con
estudios que poyan y con otras que los invalidan, y cualquier otra alternativa nosolgica
resulta igualmente endeble.
En este momento se acepta que la esquizofrenia es un grupo hetereogneo de
enfermedades cuya clasificacin se encuentra en contnua revisin. La consecuencia es
que no hay un patrn oro, por lo que las escalas de evaluacin , basadas en alguno de
los modelos
descritos, se emplean para validar
o rechazar dichos modelos,
producindose un error autolgico metodolgicamente inaceptable. Este problema casi
especfico de la esquizofrenia, no parece que vaya a subsanarse en los prximos aos,
por lo que va a implicar limitaciones importantes desde el punto de vista de la
Psicometra.
TIPOS DE ESCALAS:
Los principales aspectos que pueden evaluarse en la esquizofrenia son los siguientes:
1)Instrumentos para evaluar la PSICOSIS en general.
Por las caractersticas
especficas de la Psicosis (la falta de conciencia de enfermedad en la mayora de
estos enfermos), las escalas tienen que ser heteroevaluadas ya que el paciente
frecuentemente no va a colaborar.
Dentro de este grupo, la BPRS (ESCALA BREVE DE EVALUACION PSIQUIATRICA)
es no solamente la escala ms utilizada con esta funcin, sino el test psiquitrico
ms empleado a nivel internacional junto a la escala de Hamilton de Depresin.
Flix Rodrguez Isidro
Pgina 28
Pgina 29
ACTIVIDAD 07 y 08
Cualidades que debe tener un test psicomtrico
Confiabilidad
La confiabilidad (o consistencia) de un test es la precisin con que el test mide lo que
mide, en una poblacin determinada y en las condiciones normales de aplicacin.
(Anastasi, 1982; Aiken, 1995). (Las condiciones normales de aplicacin se refieren a las
condiciones especificadas en el manual del test).
La falta de confiabilidad de un test psicomtrico esta en relacin con la intervencin del
error. Se considera que el error es cualquier efecto irrelevante para los fines o resultados
de la medicin que influye sobre la falta de confiabilidad de tal medicin. El error es de
dos tipos: a) Error constante (sistemtico), que se produce cuando las mediciones que se
obtienen con una escala son sistemticamente mayores o menores que lo que realmente
deben ser. b) Error causal (al azar o no sistemtico), que se produce cuando las medidas
son alternativamente mayores o menores de lo que realmente deben ser.
Este ltimo tipo de error interviene cuando se afecta la confiabilidad de un test
psicomtrico. Este error tiene que ver con la salud, fatiga, motivacin, tensin emocional,
fluctuaciones de la memoria, condiciones externas de luz, humedad, ventilacin, calor,
distraccin por problemas del momento, familiaridad con la prueba, que presenta el
examinado al momento de dar el test (Rey, 1972; Brown, 1982).
Cmo se presenta la confiabilidad de un test psicomtrico? La confiabilidad se presenta
por medio del coeficiente de confiabilidad (rxx) y del error estndar de medida (EEM).
Jaime Aliaga 93
A) Coeficiente de confiabilidad
Es un coeficiente de correlacin entre dos grupos de puntajes e indica el grado en que los
individuos mantienen sus posiciones dentro de un grupo. Abarca valores desde 0 a 1.
Cuanto ms se acerque el coeficiente a 1, ms confiable ser la prueba. El coeficiente de
confiabilidad seala la cuanta en que las medidas del test estn libres de errores
casuales o no sistemticos.
Por ejemplo, un coeficiente de 0.95 quiere decir que en la muestra y condiciones fijadas
de aplicacin del test el 95% de la varianza de los puntajes directos se debe a la
autntica medida, y slo el 5%, a errores aleatorios.
Existen cuatro mtodos bsicos para obtener el coeficiente de confiabilidad (rxx): Mtodo
de las formas equivalentes; mtodo del test-retest; mtodo de la divisin por mitades
emparejadas o "Split half method"; y mtodo de la equivalencia racional o de KuderRichardson.
a) Mtodo de las formas equivalentes: Se aplican dos formas equivalentes o paralelas del
test al mismo grupo de individuos, y las dos series de puntajes resultantes se
correlacionan con el coeficiente producto de los momentos de Pearson (r).
b) Mtodo del test-retest: Se aplica dos veces el mismo test (el lapso entre las
aplicaciones se determina previamente), a una misma muestra de individuos. Las dos
series de puntajes resultantes se correlacionan con el coeficiente de correlacin "r" de
Pearson.
c) Mtodo de la divisin por mitades emparejadas o "split half method": Se aplica el test
una sola vez a una muestra. Luego, se califica por separado los temes pares (2, 4, 6, ...,
n) y los temes impares (1, 3, 5, ..., n). A continuacin, las dos series de puntajes
resultantes se correlacionan con el coeficiente "r" de Pearson, pero por haberse dividido
el test en dos partes (temes pares e temes
impares), el "r" resultante debe ser "corregido" para arrojar el "r" para todo el test. Esta
correccin se efecta con la frmula de profeca de Spearman-Brown:
d) Mtodo de la equivalencia racional: En este mtodo se considera que si un test esta
formado por un conjunto de temes estos pueden ser considerados como un conjunto de
Pgina 30
tests paralelos (tantos como temes tenga el test). Luego se deriva una ecuacin para
computar el coeficiente de confiabilidad. Kuder y Richardson
derivaron varias frmulas para el clculo del coeficiente de 94 Psicometra
confiabilidad, son las ms conocidas la KR20 y la KR21. Actualmente, un coeficiente ms
utilizado es el coeficiente alfa de Cronbach
(1972; Anastasi, 1982; Aiken, 1995).
B) Error estndar de medida
Por medio de este error estndar de medida se estima el intervalo probable de puntajes
en el cual se encontrar el puntaje verdadero de un sujeto examinado con un test
psicomtrico. El error estndar de medida (EEM) se obtiene a travs de la siguiente
frmula:
EEM = s 1- rxx
Donde:
s = Desviacin estndar de los puntajes de la distribucin.
rxx = Coeficiente de confiabilidad del test.
1 = Constante.
Obtenido el EEM, debemos escoger el nivel de confianza:
- Nivel de confianza del 68% = PD 1 EEM.
- Nivel de confianza del 95% = PD 2 EEM.
Para el nivel de confianza del 68% la interpretacin es la siguiente: "Podemos concluir,
con un 68% de confianza, que el puntaje verdadero de un sujeto est en la zona o
intervalo comprendido entre su puntaje directo u obtenido (PD) y 1 EEM".
El nivel de confianza ms usado en psicometra es el del 95%: "el puntaje verdadero de
un sujeto se encontrara en el intervalo comprendido entre su puntaje obtenido o directo
(PD) y 2 EEM".
Validez
Si tenemos una prueba X nos equivocaramos al creer que su titulo nos dice lo que la
prueba mide, pues cualquier persona puede reunir un conjunto de reactivos y esperar a
obtener una medida, por ejemplo, de razonamiento numrico o de las estrategias de
aprendizaje. La averiguacin de lo que la prueba mide no responde a la pregunta cmo
llama el autor a la prueba?, sino ms bien a qu hacen referencia los puntajes obtenidos
en esta?, es vlido el uso o la interpretacin de las puntuaciones de este test?, qu
generalizaciones se pueden hacer apropiadamente a partir de la puntuacin en esta
prueba? (Thorndike, 1989). En esencia, el trasfondo de estas preguntas es determinar
cules son los procesos mentales que pone en juego el test. Ahora bien, el responder a
las Jaime Aliaga 95 citadas interrogantes necesita de una indagacin larga y compleja
que en psicometra se denomina proceso de validacin.
a) Distincin entre la validez y la confiabilidad segn el error.
La distincin entre confiabilidad y validez se basa en lo que consideramos como error. En
la validez interesan los errores constantes o sistemticos y en la confiabilidad los errores
aleatorios o no sistemticos. El siguiente ejemplo nos permitir precisar la diferencia
entre ambos tipos de error: Supongamos que un reloj es adelantado 20 minutos. Si se
trata de un buen cronometro el tiempo
que marca ser confiable (es decir consecuente), pero no ser valido en comparacin
con el tiempo estndar (hora GMT).
b) Definicin de validez.
En trminos estadsticos la validez se define como la proporcin de la varianza
verdadera que es relevante para los fines del examen. Con el trmino relevante nos
referimos a lo que es atribuible a la variable, caractersticas o dimensin que mide la
prueba. En este sentido, generalmente la validez de un test se define ya sea por medio
de (1) la relacin entre sus puntuaciones con alguna medida de criterio externo, o bien (2)
la extensin con la que la prueba mide un rasgo subyacente especfico hipottico o
constructo.
Flix Rodrguez Isidro
Pgina 31
Pgina 32
Pgina 33
cuando se revisa superficialmente los reactivos y se consideran que los tems parece
que miden lo que se supone tienen que medir. Esta validez puede ser una consideracin
importante a tener en cuenta, si la apariencia de los tems influye en la motivacin del
sujeto. Por ejemplo, si en un test para adultos se incluyen reactivos en lenguaje y
contenido infantil, se dir que este test no tiene validez de facie; el sujeto puede no
sentirse motivado a obtener buenos resultados al sentir que la prueba es poco importante
para la decisin que se va a tomar.
(2) Validez Predictiva (evidencia externa) - Predicen las puntuaciones del test un
rendimiento o conducta futura? (Junto con la validez concurrente se le denomina tambin
validez emprica del test).
Un uso comn de los tests es predecir la conducta futura; utilizamos el test para
ayudarnos a tomar alguna decisin prctica (seleccin, clasificacin, etc.). En cada una
de estas situaciones, cuanto mayor es la exactitud de prediccin del resultado (es decir
del criterio externo), tanto ms til ser la prueba. Por ejemplo, el test ser un
componente aceptable de un proceso de seleccin de
personal, si sus calificaciones o puntuaciones predicen la ejecucin de algn componente
importante del trabajo (criterio externo); en otras palabras, para que el test se pueda
utilizar como parte de un proceso de seleccin es preciso demostrar la validez de la
prueba relacionndola con los criterios pertinentes. En este sentido, el contenido de la
prueba pasa a tener un lugar secundario, siendo el inters fundamental del psiclogo el
averiguar si el test predice un criterio determinado. 100 Psicometra Para este logro es
necesario que los criterios externos con los cuales se relacionar las puntuaciones del
test sean criterios validos y confiables.
Un criterio es cualquier desempeo que los sujetos tienen en la vida real, por ejemplo, las
medidas de rendimiento acadmico, medidas de rendimiento laboral, clasificaciones
psiquitricas, etctera. En muchos casos resulta imposible hallar un criterio no ambiguo
de un rasgo mental. Por ejemplo, dos psiclogos, Carla y Abel, que investigan el rasgo de
aptitud numrica pueden emplear diferentes criterios externos para correlacionar los
puntajes del test que han creado. As, Carla puede considerar que el criterio externo ms
adecuado son las calificaciones que reciben los sujetos en un curso de mecnica en
taller; mientras que Abel puede considerar como criterio el periodo de tiempo que gastan
los estudiantes en aprender una tarea mecnica y sencilla durante el entrenamiento en
un fabrica. Qu sucede si las pruebas que emplean ambos psiclogos correlacionan
0.006 con uno de los criterios, y 0.70 con el otro?, cmo podemos afirmar que la prueba
es valida cuando arrojan resultados de cierta clase?, se trata en verdad de una prueba
de aptitud mecnica? En razn a situaciones como esta se llego a la conclusin de que la
validacin de un test es un proceso largo y no un hecho aislado. Solamente a travs de
estudios de correlacin con una amplia variedad de criterios podremos comprender que
mide la prueba. As, una serie de investigaciones sobre la prueba de actitud mecnica
nos puede demostrar que en realidad esta midiendo la habilidad para realizar
movimientos fino y cuidadosamente controlados, siendo completamente independiente
para comprender las reacciones complejas de la piezas mecnicas. De esta manera el
test puede tener una alta correlacin con las calificaciones obtenidas en el taller y
ninguna con los trabajos e maquinarias. En el proceso de validacin, la validez predictiva
de un test (y tambin la concurrente) se expresa generalmente por medio de un
coeficiente de correlacin entre los puntajes y los denominados criterios. Este coeficiente
se denomina coeficiente de validacin. La interpretacin de este coeficiente requiere un
dominio excelente del anlisis estadstico utilizado para obtenerlo. Despus del criterio,
los procedimientos estadsticos adquieren vital importancia para obtener esta categora
de validez. Incluso para un mejor anlisis es conveniente contar con el dispersigrama o
scatergrama o nube de Jaime Aliaga 101 puntos (grfica del coeficiente de correlacin
entre las puntuaciones del test X y las del criterio Y).
(3) Validez Concurrente.- Permiten las puntuaciones del test la valoracin de ciertos
hechos presentes? Para estimarla se administra el test y se le correlaciona con el criterio.
La diferencia con la validez predictiva se da en dos aspectos: a) las medidas del test y del
Flix Rodrguez Isidro
Pgina 34
Pgina 35
Pgina 36
Pgina 37
9) Entre las limitaciones en el uso de un test psicomtrico tenemos: Una prueba o test
slo puede medir aquellos aspectos para los que ha sido construido; las normas (baremo)
de una prueba no tienen validez universal; si las condiciones que influyen sobre el
individuo se modifican, existe la posibilidad de que tales cambios durante la aplicacin de
la prueba influyan en los puntajes resultantes
del test; los resultados de un test no deben emplearse para diagnosticar per se estados
patolgicos;.y, finalmente, las categoras descriptivas (inteligencia muy superior, superior,
etc.) slo deben utilizarse para los tests cuyos puntajes le dieron origen.
10) Un test psicomtrico tiene generalmente las siguientes secciones o partes: El test
propiamente dicho, y el manual del test.
11) Entre las cualidades que debe tener un test psicomtrico, hay que tener en cuenta: la
confiabilidad, que puede estimarse a Jaime Aliaga 107
travs de dos procedimientos: el coeficiente de confiabilidad y el error estndar de
medida (EEM); y la validez, que es el grado en que una prueba mide lo que intenta medir.
12) La validez cientfica de un test la da la validez de constructo. La tendencia ya no es
hablar de tipo de validez, sino de categoras de validez en la que la validez de contenido,
validez predictiva, validez concurrente y validez de constructo reconstituyen en
estrategias de validacin.
13) La teora de respuesta al tem (TRI), denominada tambin Teora del Rasgo Latente,
es un modelo probabilstico que permite conocer la informacin proporcionada por cada
tem, y as crear tests individualizados, es decir, a medida. Los supuestos de la TRI son:
la unidimensionalidad del rasgo latente; y la independencia, es decir, que las respuestas
de un examinado a cualquier par de temes son independientes.
Pgina 38
Actividad 10 y 11
MEDICION Y EVALUACION
Medicin: medida interpretada que es implcita a la medicin de un test.
Objetiva: mtodo y procedimiento en la administracin de un instrumento sin influencia
de factor externo; que al ser repetida en igualdad de circunstancias los resultados deben
ser iguales.
Tipificada: debe ser aplicable a una poblacin diferenciada por ciertas caractersticas.
Muestra de conducta : es muestra ya que ningn tipo de comportamiento es posible de
medir completamente, lo que hacemos es aproximarnos a su medicin a travs de una
muestra.
MEDICIN: Consiste en reglas para asignar smbolos a objetos de manera que:
1. Representen numricamente cantidades de atributos (escalas de medida).
2. Definan si los objetos caen en las mismas categoras o en diferentes con respecto a un
atributo determinado (clasificacin).
Tanto las escalas de medicin como la clasificacin implican la formulacin y evaluacin
de reglas. Estas reglas son usadas para medir atributos de los objetos, por lo general,
pero no de manera exclusiva, sino tambin de personas. Es importante recordar que
podemos medir slo atributos de los objetos, no a los objetos mismos. Entre las
caractersticas de las buenas reglas estn la receptibilidad (confiabilidad) y de modo ms
importante, la validez en los sentidos que se describan. La estandarizacin es un objetivo
importante de la medicin debido a que facilita la objetividad, cuantificacin,
comunicacin, economa y generalizacin cientfica.
La medicin usa matemticas, pero las dos sirven a papeles separados. La medicin
necesita relacionarse con el mundo fsico, pero las matemticas puras slo se ocupan de
la consistencia lgica. Un aspecto tradicionalmente importante, pero controvertido de las
escales de medicin, es que estas por lo general caen en uno de cuatro niveles (han sido
sugeridos otros); nominal, ordinal, de intervalos y de razn. Estos cuatro niveles
representan de manera progresiva reglas mejor articuladas, por ejemplo, las escalas
nominales tan slo definen si dos (2) objetos son equivalentes o no, entre s, con
respecto a un atributo crtico, pero las escalas ordinales determinan si un objeto que no
es equivalente a otro es mayor o menor que el otro; son posibles resultados ms
consistentes con niveles superiores de medicin. El concepto de invarianza es bsico
para estos niveles de medicin, el cual tiene que ver con lo que permanece igual cuando
se realizan cambios permisibles en la escala. Las escalas de niveles superiores estn
ms restringidas en cuanto a la manera en que pueden ser transformadas y an
conservar invarianzas claves.
ESCALAS DE MEDICIN.
Stevens propuso que las mediciones entran en cuatro (4) clases principales de escala de
medicin (nominal, ordinal, de intervalo y de razn), las cuales permitieron que se
ejecutaran en las medidas, procedimientos cuantitativos cada vez ms complicados, pero
a su vez demandaron cada vez ms de las operaciones de medicin.
Escalas de Medicin:
* Nominal: contiene reglas para decidir si dos (2) objetos son equivalentes o no para una
categorizacin. El resultado de una escala nominal, es una serie de clases, a las cuales
podra darse una designacin numrica. Es importante distinguir entre usar categoras
"Nombres" lo cual es impropio y la categora "Frecuencias" la cual es bastante apropiada.
* Ordinal: contiene reglas para decidir si un objeto es diferente a otro es mayor o menor
con respecto a un atributo determinado.
* De Intervalo: relfejan operaciones que definen una unidad de medicin; as como
mayor, igual o menor.
* De Razn: es una escala de intervalo con un cero (0) racional (verdadero), en lugar de
un cero (0) arbitrario. Un cero (0) racional significa la ausencia del atributo y no
simplemente razonable.
Pgina 39
Desarrollo de las escalas (qu pasos sigui para elaborar los tems, tareas, qu
modificaciones se han dado, criterios seguidos paras las modificaciones)
Otros (bibliografa).
Condiciones ambientales.
Pgina 40
TIPOS DE PRUEBAS
A.- DE INTELIGENCIA
TEST DE AMPLITUD: Miden el conocimiento y/o el rendimiento. Pueden valorar la
memoria, precisin, destreza, atencin, sentido de la organizacin, agilidad manual y
mental.
-MATRICES DE RAVEN:
Orientados a la valoracin de la inteligencia concreta, nivel de observacin y organizacin
lgica.
Consiste en descubrir qu figura corresponde al cuadro en blanco de los otros que
aparecen en la parte inferior. Las figuras pueden ser abstractas u objetos que mantienen
un orden lgico. Interesan la identificacin y la diferenciacin de formas.
Son ejercicios en orden de dificultad creciente. El tiempo est limitado, con lo cual hay
que evitar estancarse en un ejercicio.
-FICHAS DE DOMIN: Miden la abstraccin lgica.
-TEST DE RAZONAMIENTO: Miden las facultades de adaptacin: agilidad mental,
resolucin de problemas, etc...
-TEST DE COMPRENSIN VERBAL: Miden la comprensin de ideas, facultad de
anlisis y sntesis.
B.- DE PERSONALIDAD
-TEST DE RORSCHACH: Analiza
comportamiento.
las
dimensiones
intelectual,
afectiva
y de
Pgina 41
Test de capacidad mecnica: Tienen como finalidad identificar a aquellos individuos con
aptitudes para trabajos de carcter mecnico y trabajos de mantenimiento.
Test de personalidad: Tratan de buscar rasgos de carcter, acordes con el perfil del
puesto: introvertido o extrovertido, dinmico o pasivo, optimista o pesimista, con iniciativa
o sumiso, impulsivo o moderado, etc.
Test de aptitudes administrativas: Sirven para medir la capacidad de percepcin, rapidez
de lectura, de precisin en actividades especficas, clculo aritmtico, comprobacin de
datos, ortografa, archivo, comprobacin de errores, etc.
Pruebas psicomtricas y proyectivas:
CLEAVER
Prueba que describe el perfil laboral de cada candidato. Describe el comportamiento y
habilidades del personal en la organizacin, apoyando los programas de Planeacin de
Recursos Humanos, mejorando la comunicacin y el desempeo en el trabajo
AUTODESCRIPCION DEL CANDIDATO
Describe en trminos de comportamiento, la percepcin que el individuo tiene de s
mismo, con relacin al puesto que desempea, clarificando las diferencias existentes
entre el puesto y el ocupante del mismo.
RASGOS A MEDIR EN CADA CANDIDATO:
* COMPORTAMIENTO DIARIO
COMPORTAMIENTO BAJO PRESIN
INDICADORES DE MOTIVACIN
TERMAN MERRIL
Prueba para la medicin del Coeficiente Intelectual I.Q., conocimientos generales,
comprensin, anlisis y sntesis, razonamiento, aritmtica, juicio prctico, sentido comn
y capacidad de deduccin.
Proporciona una medida de la inteligencia para examinados adultos, esta orientado para
personas de nivel escolar bachillerato o superior.
INVENTARIO MULTIFASICO DE LA PERSONALIDAD MMPI- ESPAOL
Prueba de personalidad conocida tambin como MINESOTA, consta de 566 preguntas y
est enfocada a la seleccin de personal, sin embargo la grfica que se obtiene, se
puede usar para un anlisis ms profundo o clnico.
Describe de manera textual las siguientes caractersticas: Hipocondriasis, Depresin,
Histeria, Personalidad psicoptica, Masculinidad-Feminidad, Paranoia, ObsesivoCompulsivo, Esquizofrenia, Mana, Introversin Social, Capacidad de Autocrtica,
Capacidad de Liderazgo, Actitud de Servicio, Capacidad para trabajar bajo presin,
Capacidad para trabajar en equipo, Sentido de la realidad, Metas y logros, Meticulosidad
y Detallismo.
BARSIT
Determina rpidamente el nivel de inteligencia o aptitud para aprender. - Compara la
composicin de grupos, selecciona previamente casos excepcionales. - Adaptabilidad del
sujeto.
HTP: (sigla que proviene de House, Three, person)
El test de la casa/rbol/persona es un test proyectivo basado en la tcnica grfica del
dibujo, a travs del cual podemos realizar una evaluacin global de la personalidad de la
persona, su estado de nimo, emocional, etc. La realizacin de dibujos es una forma de
Flix Rodrguez Isidro
Pgina 42
lenguaje simblico que ayuda a expresar de manera bastante inconsciente los rasgos
ms ntimos de nuestra personalidad.
IPV (Inventario de la Personalidad del Vendedor )
Proporciona la medida de la Disposicin General para la Venta (DGV) del candidato en
dos dimensiones amplias las cuales son Receptividad y Agresividad.
KOSTICK:
El Inventario de Preferencias y Percepciones de Kostick es un instrumento diseado para
ayudar a comprender los estilos administrativos de las personas, que permite evaluar a
los candidatos a un puesto y a descubrir gente de xito en las organizaciones.
MACHOVER:
Prueba proyectiva mediante la cual se evala maduracin, organicidad y cuadros
patolgicos.
La personalidad se desarrolla a travs del movimiento, sentimiento y pensamiento de un
cuerpo especfico.
Los mtodos proyectivos han puesto repetidamente determinantes profundos y quizs
inconscientes, de expresin propia, los cuales no podran manifestarse en comunicacin
directa.
Toda actividad creadora lleva el sello especfico de conflicto y necesidades que presionan
sobre el individuo que est creando. La actividad despertada como respuesta a "Dibuje
una persona", es en verdad una experiencia creadora. El dibujo de la figura humana
indica una unin entre la figura y la personalidad del individuo que la realiza.
ZAVIC
Prueba para evaluar los valores e intereses de los individuos: Consta de 20 preguntas
con cuatro opciones cada una, se divide en dos reas : Valores : Moral, Legalidad,
Indiferencia y Corrupcin Intereses : Economico, Politico, Social y Religioso.
Otras....
1.Actividades Instrumentales De La Vida Diaria
2.Audit(alcohol Use Disorders Identification)
3. Barber - Encuesta Deteccion De Ancianos Con Riesgo
4. Barnes Para Evaluacion De Acatisia
5. Bender Koppitz Escala De Maduracion Neuro Motriz
6. Bprs - Escala Breve De Evaluacion Psiquiatrica
7. Cage
8. Clasificacion Rorschach
9. Componentes Obsesivo - Compulsivos De La Bebida
10 Coopersmith
11 Criterios De Ingreso Por Riesgo De Suicidio
12 Cuestionario Apgar Familiar
13 Cuestionario Apoyo Social Funcional
14 Cuestionario De 90 Sintomas - Scl - 90 - R 15 Cuestionario De Actitudes Ante La Alimentacin , Eat - 40 16 Cuestionario De Actitudes Ante La Allimentacin , Eat - 26 17 Cuestionario De Actividad Funcional De Pfeffer
18 Cuestionario De Afrontamiento Del Dolor
19 Cuestionario De Apoyo Social De Sarans
20 Cuestionario De Cambios Vitales Recientes
21 Cuestionario De Dolor De Mcgill
22 Cuestionario De Estado Mental Portatil
23 Cuestionario De Estres Percibido De Leve
24 Cuestionario De Experiencia Traumatica
25 Cuestionario De Miedos
26 Cuestionario De Salud General De Gold
Flix Rodrguez Isidro
Pgina 43
Actividad 12 AL 15
ESTADISTICAS QUE SE UTILIZAN PARA LAS MEDICIONES
PSICOLOGICAS
TRATAMIENTO ESTADISTICO
DISTRIBUCION DE FRECUENCIAS LA DISPERSION
LA MEDIANA ( Me )
Dada una distribucin de frecuencias con los valores ordenados de menor a mayor,
llamamos mediana y la representamos por Me, al valor de la variable, que deja a su
izquierda el mismo nmero de frecuencias que a su derecha.
LA MEDIA ARITMTICA ( X )
La media aritmtica o simplemente media, que denotaremos por X , es el nmero
obtenido al dividir la suma de todos los valores de la variable entre el nmero total de
observaciones.
LA DESVIACIN ESTNDAR:
En rigor, esta medida de dispersin es utilizada con ms frecuencia por los estadsticos.
Supongamos las observaciones x1, .., xi, .., xn, entonces la desviacin estndar S se
define como
Observemos como antes que esta desviacin estndar tiene la misma unidad que las
observaciones. En rigor es un promedio de las diferencias cuadrticas de las
observaciones respecto de la media. El cuadrado permite eliminar los signos negativos,
de modo que no se anulen diferencias simtricas en torno de la media.
PERCENTILES (PI)
Son los valores que dividen a la distribucin en 100 partes iguales, cada una de las
cuales engloba el 1 % de las observaciones. En total habr 99 Percentiles. (Q2 = D5 =
Me = P50)
COEFICIENTE DE CORRELACIN
Un coeficiente de correlacin se dice que es significativo si se puede afirmar, con una
cierta probabilidad, que es diferente de cero. Ms estrictamente, en trminos estadsticos,
preguntarse por la significacin de un cierto coeficiente de correlacin no es otra cosa
que preguntarse por la probabilidad de que tal coeficiente proceda de una poblacin
cuyo valor sea de cero. A este respecto, como siempre, tendremos dos hiptesis
posibles.
TRANSFORMACION DE PUNTAJES DIRECTOS A PUNTUACIONES ESTANDAR
Esta tcnica es la ms conocida y utilizada en el marco de la TCT, al punto que muchos
usuarios asumen que es la nica existente para estimar la Puntuacin Verdadera. Se trata de
un procedimiento ampliamente recomendado por muchos autores (e.g. Allen & Yen, 1979;
Anastasi & Urbina, 1998; Felt & Brennan, 1989; Gulliksen, 1950) que consiste en utilizar el
EEM para construir un intervalo de confianza en torno a la Puntuacin Observada.
Tericamente, el procedimiento se fundamenta en asumir que los errores de medida se
distribuyen normalmente. Bajo este supuesto es posible utilizar el EEM para construir un
intervalo de confianza para la Puntuacin Verdadera, en torno a la Puntuacin Observada.
Sin profundizar en la derivacin de la frmula (para tal efecto ver, por ejemplo, Muiz, 2001),
las ecuaciones para el lmite inferior y superior del intervalo de confianza corresponden a:
Pgina 44
Pgina 45
Pgina 46
ejemplo, a una desviacin tpica por encima y por debajo de la Media se encuentra el
68,26% de la distribucin. El clculo de la Desviacin Tpica se realiza mediante el
clculo de la raz cuadrada de la sumatoria de los desvos de los puntajes con respecto a
la media elevados al cuadrado. Es tambin la raz cuadrada de la Varianza.
Dificultad de los tems. El grado de dificultad de un tem se determina mediante la
proporcin de respuestas correctas (cociente entre respuestas correctas divididas entre el
nmero de respuestas totales). La proporcin que se obtiene se denomina a la media del
tem, o la p del tem y es un indicador directo de su facilidad, o inverso de la dificultad,
ya que su valor, comprendido entre 0 y 1, indica que mientras ms se acerca a 0 es ms
difcil el tem (puesto que fue respondido por un menor nmero de personas) y mientras
ms se acerca a 1 es ms fcil (respondido por un mayor nmero de personas).
Error Estndar de Medida Sem. Es un estadstico que estima la posible magnitud del
error presente en un puntaje individual. El Error Estndar de Medida indica la diferencia
que puede existir entre el Puntaje Obtenido y el Puntaje Real o Verdadero (T), que se
supone que refleja la verdadera posicin del individuo en un continuo subyacente; esa
diferencia se debe a errores de medida. Mientras mayor es el Error Estndar de Medida,
menos confiable es la puntuacin obtenida. El Error Estndar de Medida es una magnitud
tal, que en aproximadamente dos terceras partes de los casos, el puntaje obtenido no
diferir ms de un Error Estndar por encima o por debajo del Puntaje Real. En teora se
puede decir, que en 2 de cada 3 casos, el puntaje obtenido se encuentra en una banda
que se extiende del Puntaje Real ms o menos un Error Estndar de Medida; pero debido
a que el Puntaje Real nunca se puede conocer, la prctica establece que, para la
interpretacin, se puede revertir la relacin Puntaje Verdadero Puntaje Obtenido.
Escala. La sucesin de nmeros en funcin de los cuales se realiza la medicin.
Clsicamente se distinguen cuatro niveles: Nominal, Ordinal, Intervalo, Razn. Tambin
se entiende por escalas, las transformaciones de puntajes que se realizan a escalas de
propiedades conocidas, tales como Estaninas Percentiles, puntaje Z, Puntaje H, etc.
Estadstica Descriptiva e Inferencial. La E. Descriptiva es una rama de la estadstica
aplicada que permite describir las caractersticas de las distribuciones en funcin de los
datos obtenidos. La E. Inferencial es una rama de la estadstica que permite realizar
inferencias sobre el comportamiento de los estadsticos en la poblacin o un segmento de
ella. Ambas son absolutamente necesarias en el trabajo estadstico de los datos
psicomtricos.
Frecuencia. Es el nmero de observaciones que corresponde a un determinado puntaje
en una escala. Usualmente las observaciones son los sujetos que obtuvieron ese puntaje.
Frecuencia Acumulada. Es el nmero de observaciones acumuladas hasta el lmite
superior de un determinado puntaje en una escala. Se acumula siempre desde las
puntuaciones ms bajas en la Escala hacia los ms altos.
Inventario de Personalidad. Es un tipo de Prueba Psicomtrica que consiste en un
cuestionario o lista de chequeo, usualmente autoadministrada, diseada para obtener
informacin de variables no intelectuales de un individuo. Los inventarios usualmente
evalan rasgos tales como intereses, actitudes, motivacin, etc. (vase Pruebas de
Personalidad).
tems. Son los estmulos o reactivos que se presentan a los sujetos para que respondan
y pongan de manifiesto conductas asociadas con un atributo determinado. Dependiendo
del tipo de prueba, los tems varan sustancialmente. Un tipo comn de tem son los de
opciones mltiples, que presentan un problema en el pie y varias opciones de respuesta
de las cuales slo una es la correcta (la clave) y las otras son Distractores, que sirven
para atraer la respuesta de quienes no conocen realmente la respuesta correcta.
Media o Media Aritmtica. Es el promedio de las puntuaciones obtenidas por un grupo
en un test. Se obtiene mediante la suma de las puntuaciones y la divisin
entre el nmero de ellas.
Medicin. Consiste en la asignacin de numerales a las propiedades de los objetos o
eventos de acuerdo a ciertas reglas (Stevens). En medicin psicolgica, los objetos son
las manifestaciones de los atributos psicolgicos o constructos. Se fundamenta en varios
supuestos: a) la asuncin de la existencia de un continuo subyacente con direccionalidad,
b) la existencia de un solo puntaje verdadero para cada sujeto, c) la variabilidad entre
Flix Rodrguez Isidro
Pgina 47
Pgina 48