Está en la página 1de 48

Facultad de Ciencias de la Salud

Escuela Acadmico Profesional de Psicologa Humana

Asignatura

: PSICOMETRIA

Docente

: Flix Rodrguez Isidro

SEMESTRE

:I

Ciclo

:V

HUANCAYO, 2011

Flix Rodrguez Isidro

Pgina 1

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

CAPACIDADES
1. Explica y describe los aspectos fundamentales de la psicometra.
2. Elabora, selecciona y disea los diferentes tems en los tests
psicomtricos.
3. Distingue y reconoce las cualidades de los tests psicomtricos.
4. Aplica la teora psicomtrica a los diversos campos de la psicologa.
5. Maneja los anlisis estadsticos de mayor uso en psicometra.

Flix Rodrguez Isidro

Pgina 2

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

ACTIVIDAD n 01
PSICOMETRIA
FUNDAMENTOS DE LA TEORA Y LA PRCTICA DE LA PSICOMETRA
Es importante la psicometra?
La psicometra cada da nos confirma que todava el hombre es nico y que en nuestra
mismidad, como seres biolgicos y sociales, cada uno es diferente psicolgicamente del
otro; que las diferencias individuales existen de manera evidente y mensurable. El tipo de
anlisis de la personalidad que se hace desde el modelo psicomtrico pretende ser
objetivo y molecular. La objetividad la va a basar en la psicologa matemtica,
enfatizando los aspectos cuantitativos de la evaluacin. Realmente, los desarrollos
realizados en metodologa de la evaluacin por este enfoque han sido significativos, y
definidores de la tarea diagnstica. Los conceptos de fiabilidad y validez han sido y son
criterios clave para juzgar las pruebas psicolgicas.
Modelo psicomtrico, psicologa matemtica.
Qu rea ha contribuido ms para hacer de la psicologa una ciencia? Se pregunta
Nuria Cortada (1999, 2000, 2001), a quien seguimos en lo fundamental en los avances de
la investigacin psicomtrica, su respuesta considera que ha sido la psicometra la que
empez tratando de medir los constructos psicolgicos y sigue en la lucha por la
matematizacin de nuestra ciencia para estar a tono con los avances de las dems
ciencias y con la complicada tecnologa del tercer milenio.
En efecto cuando una ciencia tiene por objeto el estudio de procesos dinmicos necesita
un aparato formal para analizarlos. La psicologa estudia muchos procesos como el
aprendizaje, la percepcin, la memoria, la atencin, los fenmenos cognitivos y
emocionales que son procesos que se refieren al cambio o modificacin de una variable
en funcin de otras, como por ejemplo la evolucin del aprendizaje en funcin de la
prctica, el declive de las huellas de la memoria en funcin del tiempo, el cambio de
niveles de percepcin en funcin de los estmulos, el aumento de las funciones cognitivas
en relacin al crecimiento, etc
Antecedentes histricos de la psicometra:
Las races de la aplicacin de pruebas, se encuentran en la antigedad partiendo de los
exmenes que se hacan en China para el servicio civil, hasta la aplicacin de exmenes
en Grecia para evaluar las habilidades fsicas e intelectuales.
De gran importancia fueron las aportaciones hechas en el siglo XIX por los mdicos
franceses, Esquirol y Seguin. Aporte fundamental para el establecimiento de la
psicometra lo hicieron los investigadores Charles Darwin, Francis Galton, James McKeen
Cattell, Krapelin, Charles Spearman, T.L. Kelly, L.L. Thurstone, E.B. Titchener y otros.
Concepto de psicometra: La Psicometra es la ciencia cuyo objeto es medir los
aspectos psicolgicos de una persona, como son: el conocimiento, las habilidades, las
capacidades, las actitudes o la personalidad. La Psicometra se encarga de los procesos
para la medida de los aspectos "psicolgicos" de una persona, tales como conocimiento,
habilidades, capacidades, o personalidad. Las primeras pruebas psicometras fueron
construidas para medir la inteligencia. Las bases tericas de la psicometra parten de la
teora de los tests y los mtodos de elaboracin de escalas.
Importancia de la medicin en psicologa: La importancia de la medicin psicolgica
radica en su afn por establecer cientficamente la diferencia entre los rasgos y estados
psicolgicos entre individuos para ello se utilizan diferentes escalas que apoyan la
medicin objetiva de los atributos conductuales.
Medicin y estadstica: En 1816 Bessel Astrnomo de Greenwich, con base en sus
investigaciones descubre variaciones considerables entre individuos con respecto de la
Flix Rodrguez Isidro

Pgina 3

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

rapidez con que reaccionaban ante un estmulo visual (lo llamo ecuacin personal), este
suceso tuvo gran relevancia para la psicologa ya que sent las bases para la medicin
de al menos una caracterstica mental (Tyler, 1978)
En la actualidad, la construccin de escalas y el anlisis de datos obtenidos, perderan su
carcter de objetividad sin el uso de los mtodos estadsticos (medidas de tendencia
central). La estadstica permite determinar aproximaciones correlacinales entre
variables. En la determinacin de correlaciones entre dos variables, el anlisis estadstico
es muy til para condensar y analizar los datos.
La estadstica es la disciplina que proporciona una metodologa para recoger, organizar,
resumir, analizar datos y hacer inferencias a partir de ellas. La Estadstica se divide en:
estadstica descriptiva y estadstica Inferencia. En la estadstica descriptiva, se analizan
indicadores como: los porcentajes, la media, la moda, la mediana, la desviacin tpica, los
percentiles, etc. En el caso de la estadstica inferencial, que es en la que se apoya la
psicologa para hacer inferencias, los tpicos a analizar son las leyes del azar y el
concepto de probabilidad, los tipos de muestreo, diferencia de medias y anlisis de
varianza.
La medicin y las teoras psicolgicas: Existen diversas teoras que tratan sobre la
razn por la cual las personas se comportan como lo hacer. Algunos tericos centran el
nfasis en la herencia y el ambiente como modeladores del comportamiento humano. Las
teoras de los tipos, de los rasgos, psicoanalticas, fenomenolgicas, son tiles como gua
hacia la medicin y comprensin de la personalidad.
Principios ticos y deontolgico en la medicin psicolgica: La deontologa refiere a
los deberes relativos a una prctica determinada, los cuales, en su forma de enunciados
normativos se plasman en los llamados "cdigos de tica". La deontologa se aboca al
estudio de los deberes y obligaciones de los psiclogos, lo cual incluye el tratamiento de
ciertas problemticas propias del campo deontolgico, tales como, competencia,
idoneidad, integridad, capacitacin, respeto por los derechos y dignidad de las personas,
responsabilidad profesional y cientfica, mbitos de incumbencia. Tambin se ocupa de
los deberes y obligaciones de los psiclogos en lo referido a declaraciones pblicas,
publicaciones, actividades de investigacin, supervisin, docencia, etc.
Las escalas de medicin en psicologa: Medir es utilizar los procedimientos
matemticos para asignar nmeros e identificar atributos fsicos y psicolgicos que
permitan poner en claro las diferencias individuales. Una escala de medida permite al
investigador determinar el tipo de anlisis estadsticos que deber utilizar para examinar
una prueba y as poder considera a la prueba como buena.
Tipos de escalas: Son cuatro las escalas utilizadas para medir variables fsicas y
psicolgicas. Si se utilizan nmeros para describir o nombrar algo la escala debe ser
nominal. En una escala ordinal los nmeros se refieren a la clasificacin ordenada de
objetos o eventos en funcin del rasgo que se mide. En las escalas de intervalo la
distancia entre intervalos tendr que establecer valores iguales. Este tipo de escalas son
las ms usadas para medir variables psicolgicas y comparar diferencias interindividuales
o intraindividuales.
Las escalas de razn son las que poseen un cero real que significa ausencia total de lo
que se quiere medir (Coolican, 1997).
Mtodos de elaboracin de escalas: Cohen (2001) define elaboracin de escalas
como el proceso de establecimiento de reglas para la asignacin numrica en la
medicin. Es el proceso por el que se disea y calibra un dispositivo de medicin, y la
forma en que se asignan nmeros (u otros ndices), valores de escala a diferentes
cantidades del rasgo, atributo o caracterstica que se este midiendo (Cohen, 2001, pg.
288)
Flix Rodrguez Isidro

Pgina 4

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

Por lo regular existen diferentes mtodos de medicin escalar, los cuales pueden estar
abocados a medir personas, estmulos y tipos de respuesta. La medicin escalar de
estmulos se puede realizar con base a estimaciones subjetivas, ya que se requiere la
tarea evaluativo del sujeto. Los modelos discriminativos son otra opcin, estos modelos
ponen nfasis en la variabilidad de la respuesta a cada estmulo.
En la medicin escalar de sujetos, los estmulos se constituyen en reactivos los cuales se
le presentan al sujeto para que proporcione un tipo de respuesta.
Son 3 los mtodos para medir tipos de respuesta, los ms importantes son: juicios y
sentimientos, respuestas comparativas y absolutas, escala de respuesta.
Escalas multidimensionales: Las tcnicas de elaboracin
de escalas
multidimensionales se usan en caso de que el reactivo englobe ms de una dimensin.
El objetivo primario de los anlisis multivariados es resumir grandes cantidades de datos
en relativamente pocos parmetros (Nuria Cortada de Kohan)
Definicin y funcin de las pruebas: (tests): Una prueba psicolgica es una medida
objetiva y tipificada de una muestra de conducta. Una prueba psicolgica sirve de
estmulo para extraer un segmento de la conducta. Es rigurosamente estandarizada, o
sea se construye, se administra y se califica segn reglas preestablecidas. Permite
comparar estadsticamente la conducta de un sujeto con un grupo de sujetos de una
poblacin definida y clasificarla cuantitativamente, cualitativamente y/o tipolgicamente
(Costa, 1996; pg. 17)
Uso de las pruebas (tests) psicolgicas: Las pruebas o tests se usan con motivo de
evaluar aspectos educativos, clasificacin por ejemplo la inteligencia, en el rea del
trabajo, para la seleccin de personal, las pruebas tambin son utilizadas para
diagnosticar la existencia o ausencia de problemas en el comportamiento, son un recurso
importante para comprobar hiptesis de investigacin, en la clnica es un mtodo para
diagnosticar comportamiento normal o patolgico, o establecer un tratamiento
teraputico.
Clasificacin de las pruebas (tests): Las pruebas pueden clasificarse porsu objetivo
(potencia, ejecucin mxima, ejecucin de rasgos, o proyectivas). Por la forma o tipo de
respuesta que exigen (pruebas objetivas, subjetivas). Por la forma de administracin
(aplicacin individual o colectiva). Por la forma de dar las instrucciones.(Morales, 2002;
pgs. 24-30).
Teora de la Generalizabilidad. Fue desarrollada por Cronbach y sus colegas, esta
teora parte de la idea que las puntuaciones de prueba de una persona varan de una
prueba a otra, debido a variables en la situacin de prueba (Cohen, 2000; pg. 175).
La escuela americana (Thurstone): Thurstone no concordaba con la existencia de un
factor general y afirmaba que factores independientes o factores de grupo integraban la
inteligencia. Desarroll un procedimiento matemtico, denominado anlisis factorial
mltiple, este mtodo permite identificar un sin nmero de aptitudes que constituyen la
inteligencia y correlacionarlos entre s.
La estructura del intelecto de Guilford: El realiz un estudio muy completo de las
aptitudes cognoscitivas, l y su colaboradores encontraron un sinnmero de factores que
podran ser relacionados unos con otros (Tyler, 1978)
Elaboro un modelo estructural de la inteligencia al que llam estructura del intelecto. Este
constaba de tres dimensiones: operaciones (modos de pensar), contenidos (aplicaciones
del pensamiento) y productos (resultado de la aplicacin de una operacin a un
contenido.

Flix Rodrguez Isidro

Pgina 5

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

Teora de la respuesta al tem: Este es un modelo probabilstica y permite conocer la


informacin proporcionada por cada tem o reactivo y as crear tests individualizados. Son
escalas unidimensionales, ya que parten del supuesto de que cada tem (reactivo) de la
prueba o test debe medir una sola aptitud o rasgo.
Teoras cognitivas y psicometra: La informacin almacenada en la memoria, consta de
huellas de actos constructivos anteriores, organizados de modo que corresponda a la
estructura de estos actos, sin embargo estos se relacionan en forma dinmica con la
nueva informacin, provocando transformaciones cognoscitivas en la memoria y el
pensamiento. (Neisser, 1979) Sus dominios son la percepcin, el aprendizaje, la
memoria, la resolucin de problemas y la toma de decisiones y aunque los psiclogos
cognitivos tienden a subrayar la importancia de la variacin de los estmulos y los
psiclogos diferenciales ponen el acento en la
importancia de la variacin individual en ambos casos se estn estudiando
comportamientos similares (Nuria Cortada de Kohan)
Teora triarquica de Stenberg: En esta teora Stenberg combina la cognicin y el
contexto para comprender la inteligencia humana y su desarrollo. La denominacin de
trirquica se debe a que est formada por tres subteoras:

La componencial, (inteligencia acadmica).


La experiencial, (inteligencia creativa), y
La contextual, (inteligencia prctica).

Flix Rodrguez Isidro

Pgina 6

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

ACTIVIDAD n 02
MEDICION - REQUISITOS- PROCEDIMIENTO PARA CONSTRUIR
UN INSTRUMENTO DE MEDICION
QUE IMPLICA LA ETAPA DE RECOLECCION DE DATOS?
Una vez seleccionado el tipo y el diseo de investigacin apropiado y la muestra
adecuada de acuerdo a nuestro problema de estudio, la siguiente etapa consiste en
recolectar los datos pertinentes sobre las variables involucradas en la investigacin.
Recolectar los datos implica tres actividades estrechamente vinculadas entre s:
1.Seleccionar un instrumento de medicin de los disponibles en el estudio del
comportamiento o desarrollare uno que sea vlido y confiable, de lo contrario, no
podremos basarnos en sus resultados para realizar conclusiones.
2.Aplicar ese instrumento de medicin, es decir, obtener las observaciones y mediciones
de las variables que son de inters para nuestro estudio.
3.Codificar, analizar e interpretar estas mediciones.
QU SIGNIFICA MEDIR?
De acuerdo a definiciones clsicas como la de Stevens (1951), significa asignar nmeros
o valores a objetos y eventos de acuerdo a reglas. Sin embargo, como lo seala
Carmines y Zeller (1979), esta definicin es ms apropiada para las ciencias fsicas que
para las ciencias sociales, las cuales trabajan con una serie de conceptos ms abstractos
que no pueden verse directamente o tratarse como productos o resultados.
Este razonamiento nos hace sugerir que es ms adecuado definir medicin como el
proceso de vincular conceptos abstractos con indicadores empricos, proceso que se
realiza mediante un plan explcito y organizado para clasificar y frecuentemente
cuantificar los datos que me puedan suministrar conductas observables relacionadas con
las variables en estudio. El centro de atencin es por lo tanto la respuesta observable
(bien sea una respuesta marcada en un cuestionario, una conducta grabada o una
respuesta dada en una entrevista). Un instrumento de medicin adecuado va a ser aqul
que me registra datos observables que verdaderamente representan los conceptos o
variables (ms abstractas) que el investigador tiene en mente.
QU REQUISITOS DEBE CUBRIR UN INTRUMENTO DE MEDICION?
Toda medicin o instrumento de recoleccin de datos debe reunir dos requisitos
esenciales; confiabilidad y validez.
LA CONFIABILIDAD de un instrumento de medicin se refiere al grado de precisin o
exactitud de la medida, en el sentido de que si aplicamos repetidamente el instrumento al
mismo sujeto u objeto produce iguales resultados. Es el caso de un balanza o de un
termmetro, los cuales sern confiables si al pesarnos o medirnos la temperatura en dos
ocasiones seguidas, obtenemos los mismos datos.
LA VALIDEZ se refiere al grado en que un instrumento mide la variable que pretende
medir. Por ejemplo, un test de inteligencia no ser vlido, si lo que mide es realmente
memoria y no inteligencia. Ciertas variables como el sexo, la nacionalidad, son muy
fciles de observar o de preguntar y obtener una respuesta vlida. Pero cuando se trata
de diversas variables que se trabajan en ciencias sociales como motivaciones, actitudes,
Flix Rodrguez Isidro

Pgina 7

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

sentimientos, emociones, etc, la validez de un instrumento que pretenda medirlas se


torna ms compleja, y por lo tanto, cabe preguntarse si realmente el instrumento estar
midiendo lo que pretende medir?
LA VALIDEZ ES UN CONCEPTO DEL CUAL PUEDEN TENERSE DIFERENTES TIPOS
DE EVIDENCIA:
Evidencia relacionada con el contenido LA VALIDEZ DE CONTENIDO se refiere al grado
en que un instrumento refleja un dominio especfico de contenido de lo que se mide. Por
ejemplo, una prueba de operaciones aritmticas no tendr validez de contenido si explora
suma y divisin y excluye problemas de resta y multiplicacin. Un instrumento de
medicin debe contener representados a todos los items del dominio de contenido de las
variables a medir.
Evidencia relacionada con el criterio. LA VALIDEZ DE CRITERIO implica que la medicin
del instrumento se ajusta o sirve a un criterio externo. Si el criterio se ajusta al futuro se
habla de validez predictiva. Por ejemplo una prueba de admisin en las universidades
puede comparar sus resultados con el rendimiento futuro de los estudiantes en la carrera.
Si el criterio se fija en el presente se habla de validez concurrente; es cuando los
resultados del instrumento correlacionan con el criterio en el mismo momento o punto de
tiempo. Por ej. una encuesta administrada un da antes de las votaciones para detectar
preferencias del electorado, correlaciona con los resultados finales de la eleccin.
Evidencia relacionada con el constructo. LA VALIDEZ DE CONSTRUCTO es
probablemente la ms importante, sobretodo desde la perspectiva cientfica, ya que se
refiere al grado en que una medicin aportada por un instrumento relaciona
consistentemente con otras mediciones que han surgido de hiptesis y construccin de
teoras antecedentes.
VALIDEZ TOTAL = Validez de contenido + validez de criterio + validez de constructo
Cabe agregar que un instrumento de medicin puede ser confiable pero no vlido, puede
medir consistentemente un aspecto ms no medir lo que pretende medir el investigador.
Por ello es requisito que un instrumento de medicin que demuestre ser confiable y
vlido.
FACTORES QUE PUEDEN AFECTAR LA CONFIABILIDAD Y LA VALIDEZ
a)La improvisacin. Algunas personas creen que elegir un instrumento de medicin o
desarrollar uno es algo fcil y que no requiere de supervisin alguna. Para poder construir
un instrumento se requiere conocer muy bien la variable que se pretende medir y la teora
que la sustenta.
b)El no estar validados en el contexto donde se aplican. Traducir un instrumento, an
cuando adaptemos los trminos a nuestro lenguaje no es ni remotamente validarlo. Es
simplemente un primer paso ya que validar un instrumento implica realizar una
investigacin extensa y compleja. Los grupos, las personas cambian y tienen valores
diferentes de acuerdo a la cultura. Por lo tanto, se deben aplicar instrumentos ya
validados en el contexto.
c)El instrumento e inadecuado o no es emptico. Hay instrumentos que tienen un
lenguaje muy elevado para el entrevistado o no toma en cuenta diferencias de sexo, edad
nivel ocupacional y educativo; todo esto puede resultar en errores de validez y
confiabilidad del instrumento de medicin
d)El cuarto factor lo constituyen las condiciones en que se aplica el instrumento. El ruido,
presionar para que una persona conteste un instrumento largo en un perodo de tiempo
Flix Rodrguez Isidro

Pgina 8

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

corto, el hambre o falta de motivacin para responder influir negativamente en la validez


y confiabilidad de la medida.
e)El quinto factor se refiere a los aspectos mecnicos. Que el instrumento tenga
instrucciones precisas, que se lea bien (si se trata de un cuestionario escrito), que no le
falten pginas, que haya un espacio adecuado para contestar.
CMO SE SABE
PROCEDIMIENTOS:

SI

UN

INSTRUMENTO

ES

CONFIABLE

VALIDO?

En la prctica es casi imposible que una medicin sea perfecta, generalmente se tiene un
grado de error. Desde luego, se trata que este error sea el mnimo posible y para ello hay
formas de calcular la confiabilidad y la validez.
Para la confiabilidad, generalmente todos los procedimientos utilizan frmulas que
producen coeficientes de confiabilidad, los cuales pueden oscilar entre 0 y 1, donde 0
significa confiabilidad nula y 1 representa el mximo de confiabilidad. Entre ms se
acerque el coeficiente a 0 habr mayor error en la medicin. Los procedimientos ms
utilizados son:
Medida de estabilidad (confiabilidad por test-retest). Un mismo instrumento es aplicado
dos o ms veces a un mismo grupo de personas. Si la correlacin entre los resultados de
las diferentes aplicaciones es altamente positiva, el instrumento se considera confiable..
Desde luego, el perodo de tiempo entre las mediciones es un factor a considerar. Si es
muy largo, otros factores como maduracin o cambio de condiciones pueden afectar la
segunda medida. Si es muy corto, las personas pueden recordar cmo contestaron la
primera vez y aparecer como ms consistentes la segunda vez.
Medidas paralelas o formas equivalentes de medir. En este procedimiento no se aplica el
mismo instrumento de medicin sino dos o ms versiones equivalentes de ste. Las
versiones deben ser similares en contenido, instrucciones, duracin, etc. Por ej. cuando
un profesor administra 2 o ms modalidades de examen en su grupo de alumnos. El
instrumento es confiable si la correlacin entre los resultados de las dos o ms pruebas
administradas es significativamente positiva.
Mtodo de mitades divididas. Aqu se administra un solo instrumento, una sola vez, pero
se dividen las preguntas o los items (Por ejemplo los items pares con respecto a los
impares, o la primera mitad con respecto a la segunda mitad). Si correlacionan los
resultados de las dos partes, se considera el instrumento confiable. Ahora bien, la
confiabilidad vara de acuerdo al nmero de items de la prueba. Cuantos ms items
mayor es la confiabilidad.
Cotejo entre observadores. Se utiliza fundamentalmente cuando se aplican instrumentos
de observacin y registro. Dos o ms observadores aplican el mismo instrumento al
mismo tiempo. Luego se calcula la correlacin de aspectos coincidentes observados. Se
considera confiable el instrumento si hay un porcentaje de coincidencias superior al 80%.
Por supuesto que este mtodo implica que los observadores tengan el mismo nivel de
preparacin o de entrenamiento para observar.
Para calcular la validez, la validez que ms interesa obtener en una investigacin es la
validez de contenido. Para obtener validez de contenido primero que nada hace falta
revisar como ha sido tratada esta variable por otros investigadores anteriormente.
Segundo, elaborar un universo de items tan amplio como sea posible, para medir la
variable en todas sus dimensiones. Posteriormente, se consulta con investigadores
familiarizados con el tema y la variable a medir para ver si el contenido es exhaustivo.
Esto se conoce con el nombre de validacin por expertos.
Flix Rodrguez Isidro

Pgina 9

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

PROCEDIMIENTO PARA CONSTRUIR UN INSTRUMENTO DE MEDICION


1.El primer paso consiste en listar las variables que se pretenden medir u observar.
Recordemos que las variables son propiedades de los objetos o de los sujetos que
adquieren distintos valores y que son razn de nuestro estudio o fenmeno a investigar.
2.Revisar su definicin conceptual y comprender su significado. Por ejemplo, comprender
qu es integracin escolar y qu dimensiones o grandes aspectos envuelve.
La definicin conceptual se refiere a la descripcin de la esencia o de las caractersticas
propias, reconocidas por consenso de un fenmeno u objeto, a la cual se le llama
cotidianamente definicin real; se reconoce la importancia de una conceptualizacin
terica, dada por autores reconocidos.
3.
Revisar cmo han sido definidas operacionalmente las variables. La
operacionalizacin de las variables se refiere a un conjunto de procedimientos que narran
o describen las actividades que el investigador realiza para medir las variables en
estudio.
Cuando el investigador dispone de varias opciones debe utilizar el procedimiento que le
reporte mayor informacin sobre la esencia del objeto o fenmeno de estudio.
3.Elegir el instrumento o los instrumentos (ya desarrollados) que han sido favorecidos
por la comparacin y adaptacin al contexto de la investigacin. Deben seleccionarse los
instrumentos que reporten mayor validez y confiabilidad. Si se selecciona un instrumento
desarrollado en otro pas deben hacerse pruebas piloto ms extensas. Tampoco debe
olvidarse que traducir no es validar un instrumento, por muy buena que sea la traduccin.
4.En caso de no encontrar un instrumento desarrollado adecuado, vlido y confiable y se
quiera construir o desarrollar uno propio, debe pensarse en cada variable, sus categoras,
los indicadores ms precisos y los items para cada uno de ellos. Un ejemplo de ello
podra ser el siguiente:
Variable
Definicin operacional
Categoras
Indicadores
Items
Integracin escolar
Grado de aceptacin de la comunidad escolar regular para aprender y convivir con nios
especiales
Por parte de los Directivos
Inters y voluntad por aceptar nios especiales en su Institucin
1.Desde hace cuanto tiempo se realiza integracin escolar en este Centro?
2.De qin fue la iniciativa?
3.Cules fueron las estrategias para llevar adelante este proceso?
Por parte de los Docentes
Sensibilizacin y preparacin para trabajar con nios especiales dentro de un aula regular
1.Cmo es su perfil de formacin para trabajar con estos nios?
2.Qu adiestramiento ha recibido?
3.Cmo planifica y evala las actividades con estos nios?
4.Qu estrategias de integracin practica?
Por parte de los Padres
Informacin y opinin sobre el proceso de integrar nios especiales en aulas regulares
1.En qu medida ha sido informado sobre el proceso de integracin escolar que
adelanta la escuela?
2.Cules son a su juicio los aspectos favorables de la integracin?
Flix Rodrguez Isidro

Pgina 10

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

3.Cules son los obstculos o dificultades de este proceso?


En este caso, debemos asegurarnos de tener un nmero suficiente de items para medir
todas las variables en todas sus dimensiones.
El nivel de medicin nominal indica que hay dos o ms categoras de respuesta las
cuales no tienen orden o jerarqua. Por ej. cuando preguntamos el estado civil, la religin,
etc. Las variables nominales pueden ser dicotmicas (admiten solo dos valores, como el
sexo, tipo de escuela a la que asiste : privada u oficial, etc.) y politmicas (cuando
admiten tres valores de medicin o ms).
El nivel de medicin ordinal, indica que hay varias categoras, pero adems estas
mantienen un orden jerrquico, de mayor a menor. Por ejemplo el Grado o Nivel de
Instruccin de las personas, el cargo que una persona ocupa dentro de una empresa o
Institucin, etc. En los dos niveles mencionados no se pueden utilizar las operaciones
matemticas bsicas, porque sera absurdo y no tiene sentido, darle numeracin en
escala a las respuestas.
El nivel de medicin por intervalo, implica crear escalas de medicin donde las distancias
entre las diferentes categoras de respuestas son iguales. El cero o punto de partida, es
arbitrario, es decir no es real, como el caso de la temperatura, donde el cero no significa
que no haya temperatura. Algunas escalas de observacin y de medicin de opinin de
actitudes suelen tratarse como si fueran mediciones de intervalo. Aqu se permite utilizar
las operaciones matemticas bsicas y algunas estadsticas. Ej. las escalas de
evaluacin que los estudiantes llenan sobre sus profesores. Cmo considera el sistema
de evaluacin de la materia? 1 --- 2 --- 3 --- 4 --- 5
(1 = deficiente, 5 = excelente)
El nivel de medicin de razn, adems de tener todas las caractersticas del nivel de
intervalo (distancias iguales entre las categoras de respuesta y aplicacin de
operaciones matemticas bsicas), implica que parte de un cero real y absoluto donde no
existe la propiedad a medir. Por ej. Cuntos hijos tiene usted?
O --- 1 --- 2 --- 3 --- 4 --- 5 --- 6 --- 7 --- 8 --- 9 --- 10 ms
Indicar cmo se han de codificar los datos . La codificacin es necesaria para analizar
cuantitativamente los datos (aplicar anlisis estadsticos). La mayora de las veces se
usan nmeros o cantidades, aunque tambin se pueden utilizar letras o smbolos.
Aplicar una prueba piloto del instrumento de medicin. Es decir, aplicar el instrumento a
personas con caractersticas semejantes a las de la muestra o poblacin objetivo de
nuestra investigacin
En esta prueba se analiza si las instrucciones se comprenden y si los items funcionan
adecuadamente. Los resultados se utilizan para calcular la confiabilidad y de ser posible,
la validez del instrumento de medicin. La prueba piloto se realiza con una pequea
muestra; los investigadores aconsejan un 10% de personas semejantes a las que
integrarn la muestra definitiva.
Sobre la base de la prueba piloto, el instrumento de medicin preliminar, se modifica, se
ajusta y se mejora, para lograr mayor nivel de confiabilidad y validez. En un trabajo de
investigacin habr que narrar el procedimiento, el pilotaje y la reestructuracin del
instrumento posterior al pilotaje.

Flix Rodrguez Isidro

Pgina 11

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

ACTIVIDAD n 03
LOS TESTS PSICOMTRICOS
Desde que la psicologa, separada del corpus filosfico que le dio origen, empieza a
desarrollarse como disciplina cientfica, ha sido atravesada por distintos paradigmas y por
variadas concepciones y epistemologas, que tienen su anclaje en diferentes momentos
socio-histricos. El psicodiagnstico, o, ms especficamente el uso de las tcnicas
diagnsticas, probablemente una de las prcticas ms vinculadas identitariamente a la
psicologa, no escapa a esos cambios, antes bien es causa y a la vez consecuencia de
los mismos.
La creacin de los tests psicolgicos, tiene su origen en la necesidad de medir y
cuantificar para de esta forma poder categorizar a los individuos. Este desarrollo, que
pauta un momento histrico para la disciplina psicolgica, no est por supuesto carente
de ideologas y concepciones acerca del hombre. En tanto inaugura algo, ha dejado una
marca que en cierta medida sigue hasta nuestros das.
Plantearnos hoy que el par psicodiagnstico-evaluacin no slo da cuenta de esa marca
sino que pone en evidencia al mismo tiempo el origen y la historia, en una suerte de
convivencia compleja de distintas concepciones que nos atraviesan en la actualidad.
Realizar una lectura crtica de los diferentes momentos de esa historia nos permitir
pensar sobre las prcticas vigentes de modo que las mismas no queden naturalizadas
per se como cientficas o no cientficas.
Si bien a Francis Galton se le reconoce como precursor del empleo de tests para la
evaluacin psicolgica (1883), James Mckeen Cattell, fue el primero que los aplic para
medir la inteligencia (1890), y Mnsterberg inici los tests de aptitud profesional, no es
menos cierto que ya en 1575 el pregraflogo espaol Juan Huarte de San Juan
reclamaba la necesidad de pruebas especficas (psicotcnicos) para los funcionarios de
la administracin pblica como un medio para conocer las aptitudes psicolgicas
individuales y su correcta adecuacin profesional.
El propio Alfred Binet junto a Vctor Henri (1895) recurri el estmulo perceptivo de las
manchas en lo que sera un antecedente de tcnica proyectiva formulado ms tarde por
H. Rorschach. Ser en 1904, cuando Jung elabore la primera prueba proyectiva: el test
de asociacin de palabras. ste se utiliz en criminologa, intercalando vocablos
vinculados a los hechos inculpatorios, para estudiar la reaccin del sujeto ante esas
palabras con fuerte carga emocional, y sus variaciones fisiolgicas en las respuestas
verbales; Jung le llamaba "indicios de complejo". En contraposicin Freud no consideraba
vlida la prctica de la asociacin libre para detectar a sujetos que han cometido un
delito, puesto que l que ha cometido realmente la accin fraudulenta, en la asociacin
libre, no deja plenamente libertad, hace esfuerzos por controlar la situacin; mientras que
por el contrario el neurtico, por sentimientos de culpa, va a delatarse, por el miedo a que
se den cuenta, precisamente de su miedo a que le crean culpable, es el llamado
delincuente por sentimiento de culpa. (Dr. Jorge Ulnik. Psiquiatra Psicoanalista de la
Facultad de Medicina de la Universidad de Buenos Aires).
En 1920, M. Klein, las emplea en el psicoanlisis de los nios, obteniendo excelentes
resultados, pues stos se expresaban mejor ante el juego y el dibujo, y en 1920, aparece
la tcnica del Rorschah, donde la personalidad de cada uno determina la percepcin de
las manchas.
.- Fiabilidad o constancia de los resultados,

Flix Rodrguez Isidro

Pgina 12

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

sta se verifica mediante varios sistemas (de la particin (Split-test-method), de la


repeticin (test-re-test), de las formas paralelas...) ms aptos para los psicotcnicos que
para las tcnicas proyectivas, puesto que el material de estas ltimas, al no ser un
cuestionario de preguntas, difcilmente puede dividirse a la mitad (Split-test-method) de
manera homognea el total es mayor que la suma de sus partes o el estmulo visual o
creativo en su repeticin (test-re-test) pierde la fuerza y espontaneidad primera, siendo
sustituida por la memoria y el deseo de variacin.
Comencemos con una pregunta inicial: Que es un Test?: Una definicin sencilla es
considerar a un Test como un instrumento de medicin que tiene como finalidad medir,
evaluar algn aspecto puntual de la personalidad humana en particular , o el conjunto de
ella.
Rpidamente vendrn a nuestra mente la idea muy cierta por cierto, vale la redundancia,
de la enorme variedad de reas, aspectos que podremos evaluar de la personalidad tan
rica, multifactico y llena de incgnitas.
Etimologicamente la palabra Test nos hemos encontrado que tiene una raz latina, que
es Testa - Testis cuya acepcin y uso nos remite a la Edad Media, estas se refera a
la vasija de barro que utilizaban los alquimistas para realizar sus experiencias,
recordemos que buscaban transmutar metales comunes en oro. Recordemos que la
Alquimia fue la precursora de la Ciencia conocida luego como Qumica. Hay mas all del
experimento con los metales toda una construccin filosfico- espiritual en torno a los
alquimistas que eran considerados en esa poca como grandes magos. Muchas
simbologas surgen de all y en realidad se dice que lo que en el fondo buscaban como
trasmutacin real era la de la individualidad humana.. As transformar en oro los metales
equivale a transformar al hombre en puro espritu .
Cada Test que los psiclogos e investigadores han construido responden a esta
bsqueda que ha perseguido (positivamente por supuesto) el hombre a lo largo de su
historia , la bsqueda del conocimiento de si mismo, recordemos la famosa y celebre
frase del Orculo de Delfos que le deca al hombre conocete a ti mismo y es esta
necesidad de conocerse la que ha alimentado miles de formas y caminos de acceso a
ese conocimiento en parte posible de conocer y en parte vedado an. Y an mas
trascendiendo ya, la bsqueda individual se amplio al conocimiento de otras personas,
esto en la actualidad se lo llama investigaciones transculturales y muchas de ellas entre
ellas el T.A.T (Test de Apercepcin Temtica de Murray) , se ha aplicado a distintas
poblaciones con distintas culturas con el fin de encontrar semejanzas, y diferencias.
Podramos decir que cuando aplicamos un Test o una serie de ellos, lo que buscamos es
no solo lograr un conocimiento profundo de una persona, aquellas caractersticas que
hacen a su naturaleza bsica y aquellas otras que denotan la presencia se reas
disfuncionales, sino tambin que ese conocimiento se convierta en informacin til no
solo pro-curacin de una determinada sintomatologa cuyo ncleo o fuente intentbamos
identificar con las tcnicas , sino tambin una informacin que a travs de la devolucin
que le otorgamos al paciente o a veces al profesional derivante, ponga de manifiesto
reas potenciales de salud o recursos que a lo mejor esa persona no tiene a nivel
conciente registro de que los tiene. Conocer reas desconocidas pero presentes de la
personalidad de uno provoca , a veces una transformacin de la personalidad hacia un
nivel superior de funcionamiento que mejore la calidad de vida en un sentido amplio del
paciente o consultante, o un punta pie inicial hacia ella.
Esto implica que el uso de los Test no siempre esta al servicio de la Psicopatologa y solo
mente recurrimos a ellos cuando hay alguna disfuncin psicolgica, sino tambin
podemos recurrir a ellos para conocerlo mas. Por supuesto los Test deben ser aplicados
por profesionales idneos en la materia.
Los Test se agrupan en 2 grandes categoras:
1)
2)

Test o tcnicas Proyectivas


Tcnicas Psicometras

Flix Rodrguez Isidro

Pgina 13

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

Las Tcnicas Proyectivas a diferencia de las Psicomtricas apuntan a la exploracin y


diagnostico de la Personalidad Total o integral de un individuo. Las Tcnicas
Psicomtricas buscan explorar algn aspecto puntual de la personalidad , por ej. si una
persona posee un nivel de ansiedad importante, y de que tipo, as tenemos las Escalas
IDARE y STAIC que sirven para ello; las Escalas de Autoestima, Las Escalas para
evaluar presencia de Depresin como por ej. la de Beck, la de Alexitimia (incapacidad
para poner en palabras alizar- lo que se siente), etc. Estas entonces no apuntan y no
permiten explorar la dinmica de la Personalidad como un todo, sino alguna de sus
partes y reas.
Las tcnicas Proyectivas pueden ser de 3 tipos:
a) Grficas
b) Verbales
c) Ldicas.
La diferencia entre ellas gira en torno al estimulo con el que se genera la proyeccin en el
sujeto. Valido es decir que en trminos sencillos, Proyectar es poder poner en el afuera
algo que corresponde al adentro, as en cada Test que le proponemos a nuestro evaluado
algo del mundo interior del sujeto como en una pantalla se proyecta as.
As cada Test mueve en el evaluado distintas cosas cada una diferente pero en un mismo
sentido, la personalidad , su dinmica, sus disfunciones, sus patologas, su manera de
percibir al mundo y as mismo, sus miedos, sus vacilaciones, sus seguridades, sus
potencialidades, su inteligencia, su inteligencia emocional ....la lista es muy extensa por
cierto.
Ampliando un poquito mas podemos decir:
Que en las tcnicas graficas el estimulo que se le propone al sujeto una hoja en blanco ,
se le da un lpiz a veces una goma de borrar, y se le da alguna consigna, tal como
dibuje un rbol, su familia, una casa una persona lo que usted quiera, as es que
estamos frente a una consigna verbal y grfica posteriormente.
En las tcnicas proyectivas Verbales tales como: El test de las relaciones objetales de
Phillipson tambin llamado TRO, el T. A.T de Murray, el CAT-A de Bellack, el Rorschach,
el Test para adolescentes de Simon, el Test de Frustracin de Rosenwaig el estimulo es
visual y verbal, ya que en todos ellos le pedimos al sujeto que nos construya una historia
con lo que ve en la lamina, que invente una historia, o que nos diga que ve en la lamina y
donde Rorschach- .
En las Tcnicas proyectivas ldicas el estimulo es de accin, por ejemplo la terapia de l
juego en donde se le da al nio o a adolescentes distintos elementos con los cuales tiene
que interactuar.Otra tcnica es el Psicodrama, en donde la consigna es que el sujeto
asuma determinados tipos de roles

Flix Rodrguez Isidro

Pgina 14

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

ACTIVIDAD n 04 y 05
ITEMS DEL TEST
Antes tendremos que analizar los items de cualquier instrumento de medicin que
utilizaremos con fines diagnsticos, se exige que ellos satisfagan ciertos requisitos, entre
los principales estn las condiciones siguientes: Ser objetivos, confiables y vlidos.
Por esto la consecuencia prctica es el aspecto ms importante del anlisis de los tems,
cuando al eliminar los inadecuados o revisar los que necesitan mejorarse se garantiza la
confiabilidad y validez futura de la prueba, asegurando adems las mejores condiciones
para su normalizacin.
En el anlisis de los tems se consideran tres criterios fundamentales:
POR DIFICULTAD: se entiende el por ciento de sujetos que responden
correctamente al tem. Este ndice garantizar la dificultad baja, promedio o alta del
test segn sea el objetivo del investigador.
LA DISCRIMINACIN: es la segunda y ms complicada parte del anlisis de los
tems, est caracterizada por el coeficiente de discriminacin, que no es ms que la
correlacin entre la respuesta al tem y la puntuacin total de la prueba. Entonces la
discriminacin se analiza a travs de un criterio interno, por eso el problema ahora, es
averiguar la contribucin del tem a la puntuacin total del test.
LA VALIDEZ: del tem se define mediante la correlacin entre la respuesta
correcta de los sujetos al tem y el grado en que l expresa la caracterstica medida
con un criterio externo.
La importancia de estos criterios y los requisitos que se le imponen al tem con respecto a
ellos, dependen del Test de que se trate y de los que persiga el investigador. Despus de
analizar los tems de un test, es posible tambin indagar sobre el pronstico de la validez
y la confiabilidad de la prueba total. El anlisis de la validez solo es posible hacerlo
cuando en la base de datos del anlisis de los tems, se tiene informacin sobre los
coeficientes de validez adems de los de discriminacin, mientras que la posibilidad de
pronosticar la confiabilidad siempre est garantizada.
ELABORACIN Y SELECCIN DE LOS TEMS:
Segn como seleccionamos los tems el test tendr un contenido. Las preguntas y
alternativas de respuesta son el protocolo del test. Los tems son verbales, grficos o
manipulativos. El tipo de tems tiene que ver con s el sujeto responde de forma libre,
estructurada o de forma mixta
tems de respuesta libre: El sujeto debe responder con sus propias palabras, no
hay una nica respuesta. Es la ms completa. El sujeto desarrolla de forma abierta y
libre una respuesta ante una pregunta que se plantea, desde una perspectiva personal
y su propio lenguaje. Puede ser verbal, manipulativo o grfico.
Ventajas: se recoge la creatividad/originalidad de la respuesta del sujeto, se permiten
varias respuestas verdaderas y se puede valorar no solo lo que dice sino tambin
cmo lo expone y lo construye (informacin adicional).
Desventajas: la subjetividad a la hora de construir y, fundamentalmente, a la hora de
valorar estos tems (diferentes evaluadores no llegan al mismo acuerdo, es diferente
segn el juez, evaluacin sesgada, a no ser que evalu un solo juez).
Sobre los dems tiene la ventaja de tener la mejor manera de valorar la creatividad y
originalidad del sujeto.
tems de respuesta restringida. En los que se le pide una respuesta breve, tiene
menor libertad pero se puede ampliar el nmero de tems (hacer ms preguntas).
Ventajas: correccin rpida y se llega a un acuerdo entre jueces.
Desventajas: perdemos mucho la valoracin de la creatividad del sujeto y sigue
siendo subjetiva.
tems de respuesta estructurada: Se pierde totalmente la posibilidad de valorar
respuestas creativas (p.e. exmenes tipo test), se le dan las respuestas al sujeto y se
Flix Rodrguez Isidro

Pgina 15

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

le pide que elija una alternativa. La muestra es mucho mayor, se hacen ms


preguntas. Se responde a cada tem por separado, son independientes entre s y se
suelen puntuar uno a uno.
Ventajas: permiten la comparacin de grupo por presentar las mismas respuesta a
cada sujeto. Ms fciles de cuantificar, mayor precisin, hay una clave de correccin
clara y por ende, ms acuerdo entre los jueces.
Desventaja: menor libertad a la hora de responder, no se valora la originalidad y
creatividad. Perdemos cualidades, son muy atomistas (analiza una pequea parte del
comportamiento del sujeto). Existen diferentes tipos:
tems de respuesta alterna. Verdadero-falso, s-no:
-Utilizacin de trminos que no sean generales o universales, pues son errneos (nunca,
siempre, todas, ninguna...)
-Evitar el empleo de trminos ambiguos o indefinidos para asignar cantidad (p.e. hace
ejercicio frecuentemente?, la interpretacin de este puede variar de una persona a otra).
Es necesario poner cantidad (3, 4 o ms veces por semana).
-Procurar no utilizar negaciones (enunciados negativos) y muchsimo menos la doble
negacin (pues esto afirma).
-Limitar los enunciados de verdadero-falso a una sola idea (una idea para cada
enunciado)
-Que los enunciados tengan aproximadamente la misma extensin (p.e. generalmente,
un enunciado verdadero es ms extenso que uno falso).
Ventajas: se pueden construir muchos, recoger ms muestras de conducta, son
fciles de corregir y rpidos.
Desventajas: difciles de construir, pierde la capacidad de creatividad.
tems de eleccin de respuesta mltiple:
-Poseen ms de dos alternativas, generalmente de 3 a 5. Son ms flexibles, representan
mejor lo que quieren evaluar, hay ms opciones para el sujeto.
-Es necesario delimitar bien el enunciado de las alternativas de respuesta. El enunciado
debe contener toda la pregunta (saber que estamos preguntando y poner las alternativas
pertinentes). El enunciado puede ser amplio pero las alternativas de respuesta deben ser
breves.
-El enunciado debe ser claro y especfico, claramente expuesto (cul es nuestra
pregunta) y que sea positivo, no utilizar la doble negacin (pues esta evala lo peor de
una persona no lo mejor).
-Asegurarse de que haya solo una respuesta vlida o que expresa mejor lo que se
pregunta (p.e. en los test de personalidad, la respuesta que manifiesta mejor ese rasgo).
Que haya una nica respuesta ptima, evidente sobre las dems y asegurarse de que las
otras tambin sean plausibles.
-No proporcionar indicadores involuntarios para las respuesta (todas tienen que
acercarse a lo que quieren medir).
Ventajas: suele ser ms objetiva la correccin, existe un mayor acuerdo y se puede
corregir mediante el uso del ordenador (p.e. en la seleccin de personal). Se corrige
rpidamente y de forma objetiva se puede comparar y el nmero de tems es amplio
para tener una muestra representativa de la conducta del sujeto. Recogen mucha
informacin en poco tiempo.
Desventajas: para redactarlos bien lleva mucho tiempo (su construccin), no permiten
analizar la creatividad del sujeto. A veces es difcil determinar cundo una respuesta
ptima es correcta sobre las dems. Su utilizacin depende del mbito de trabajo, por
ello puede ser mejor o peor en una determinada situacin (p.e. para aplicaciones
grupales son buenas pero en el mbito clnico no, seran mejores las de ensayo).
tems de completamiento: son semiobjetivos o mixtos: mezclan los tems de
respuesta libre y los estructurados. Hay mayor flexibilidad y hay varias respuestas
correctas.
CARACTERISTICAS

Flix Rodrguez Isidro

Pgina 16

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

Si cada mbito va ser valorado igual habr un mismo nmero de tems para cada
rea (p.e. la asertividad en la familia, el trabajo, con los amigos), si le damos ms
relevancia mayor nmero de tems y obtener ms muestras de conducta.
Cmo elegimos los tems? - La eleccin de los tems la hace el autor de los test,
tomando en cuenta:
Que sean representativos del atributo que quiero medir, cmo se manifiesta ese
atributo? observacin directa, definir cul es la manifestacin, tomar datos de campo.
Hasta que punto necesito una precisin de los datos, cuanto ms estructurado es un
tem ms preciso es pero menos creativo. Qu quiero evaluar y qu precisin quiero;
me interesan los datos cualitativos o cuantitativos, describir (cualidad, ensayo) o
predecir (cantidad, respuesta alternativa).
Las personas, a quien voy a evaluar, considerar edad, nivel sociocultural, acadmico,
contexto, ambiente. Variables del sujeto.
Forma de administracin: individual o colectiva.
Tiempo disponible (las pruebas verbales son ms rpidas de aplicar y corregir que
una manipulativa o grfica)
Longitud (cuntos tems tendr la prueba): Ver la caracterstica que quiero evaluar y lo
amplia que es (p.e. una caracterstica de personalidad es ms amplia que el clima
familiar, ms concreto), y ver si tengo de esa caracterstica tengo ms reas de
evaluacin, si es as necesitar ms tems. Cada uno de los tems es una muestra de
conducta, cuntas ms tengamos mejor podremos entender al sujeto pero sin perder
el equilibrio (no preguntas en exceso).
Tipo de tems elegidos (la prueba es ms larga o corta segn los tems, las pruebas
verbales tienen ms tems, los manipulativos son menos). Demarcar la longitud del
test.
Finalidad del instrumento, segn ella la longitud puede cambiar.
Forma de aplicacin. Los test individuales suelen tener menor nmero de tems, en
los colectivos se pierden la relacin de t a t y otra informacin, hay que tener ms
preguntas, son ms amplios que los individuales (p.e. tiempo de reaccin WAIS,
dificultad de los tems y cunto tiempo necesita para pensar y responder).
Caractersticas del sujeto. Tiempo de aplicacin, si tenemos menos tiempo utilizamos
test cortos. No hay normas fijas, depende de estos apartados y del autor.
dificultad de los tems: Tomar en cuenta el tipo de prueba, en las de personalidad
tendr que ser una dificultad media y media-alta, en los test de manipulativos y de
inteligencia existirn diferentes niveles. Por ende, hay que valorar lo que mide la
prueba y el tipo de sujetos a evaluar (tipo de tems, presentacin, reas de contenido
y caractersticas del sujeto marcarn la dificultad). Es importante que el nivel de
lectura o lenguaje de los sujetos evaluados no sea un obstculo para responder a las
tareas, debe estar adecuado a su nivel de lenguaje. La nica excepcin sera si se
trata de una prueba en que se evalu el rendimiento en el lenguaje, pero en ellas
poco a poco se va aumentado el grado de dificultad para que el sujeto encuentre
tems que pueda resolver. (p.e. para un nio son ms difciles los tems verbales que
los grficos).
APLICACIN, CORRECIN Y PROCEDIMIENTOS ESTADSTICOS DE LOS ITEMS:
Hay que aplicar el test y para ello tenemos que tener en cuenta:
Delimitar unas normas claras de aplicacin.
Tener elegida de forma clara la muestra representativa.
Aplicar el test: Recoger datos significativos.
Ahora hay que hacer un anlisis de los tems a dos niveles:
Cualitativo: anlisis lgico- racional.
Cuantitativo: anlisis emprico de las propiedades estadsticas de cada uno de
los tems.
A. ESTADSTICA DE TEMS: es tan econmica como la anterior. Una sola medida.
Valora la consistencia interna con criterios internos. Comparamos las
puntuaciones de cada tem con la puntuacin obtenida en el test completo.
Flix Rodrguez Isidro

Pgina 17

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

Se considera a cada tem como un test individual. Comparacin de cada tem con
la puntuacin total del test.
Se supone que todos los tems tienen la misma varianza y la misma media
utilizamos la formula de Kuder- Richardson.
Si las varianzas y medias son distintas:
Los distintos mtodos nos dan diferentes medidas de confiabilidad, varan en
cuanto al grado y en cuanto al contenido
INSTRUMENTOS PSICOMETRICOS
A.- DE INTELIGENCIA B.- DE PERSONALIDAD CONSEJOS PARA REALIZAR
ESTAS PRUEBAS TIPOS DE PRUEBAS No evalan ni lo que sabes ni lo que sabes
hacer, sino lo que podras llegar a saber y a hacer, es decir, tu potencial. Lo importante
aqu es no considerar que si no pasas una prueba psicotcnica, es porque eres medio
tonto. En realidad, cada empresa decide qu busca al pasar un psicotcnico (por
ejemplo, para un puesto de trabajo determinado, puede que la empresa no seleccione
a personas con una inteligencia superior a la media -segn el test, claro- porque no
desempeara bien el trabajo). Los test que suelen pasar en una seleccin de
personal, suelen depender del puesto de trabajo, es decir, si te presentas para
administrativo, seguramente pasarn un test numrico (si lo tuyo no son los nmeros,
tendrs que destacar ms en otras habilidades que se requieran, o pensar en otros
puestos de trabajo, en los que los nmeros no sean tan importantes).
B.- DE INTELIGENCIA TEST DE AMPLITUD: Miden el conocimiento y/o el
rendimiento. Pueden valorar la memoria, precisin, destreza, atencin, sentido de la
organizacin, agilidad manual y mental. -MATRICES DE RAVEN: Orientados a la
valoracin de la inteligencia concreta, nivel de observacin y organizacin lgica.
Consiste en descubrir qu figura corresponde al cuadro en blanco de los otros que
aparecen en la parte inferior. Las figuras pueden ser abstractas u objetos que
mantienen un orden lgico. Interesan la identificacin y la diferenciacin de formas.
Son ejercicios en orden de dificultad creciente. El tiempo est limitado, con lo cual hay
que evitar estancarse en un ejercicio. -FICHAS DE DOMIN: Miden la abstraccin
lgica. -TEST DE RAZONAMIENTO: Miden las facultades de adaptacin: agilidad
mental, resolucin de problemas, etc. -TEST DE COMPRENSIN VERBAL: Miden la
comprensin de ideas, facultad de anlisis y sntesis.
C.-DE PERSONALIDAD -TEST DE RORSCHACH: Analiza las dimensiones
intelectual, afectiva y de comportamiento. -TEST DE APERCEPCIN TEMTICA:
Evala los factores y necesidades de la conducta y de las motivaciones, valorando las
emociones y estados internos. -TEST DE RBOL: Revela a la persona en la vida
interior y el desarrollo afectivo. En definitiva en un prueba psicotcnica nos podemos
encontrar los siguientes puntos: Test de informacin: Evalan cuestiones
relacionadas con el vocabulario, fluidez verbal y significado de las palabras.
Problemas aritmticos: Intentan medir la capacidad para resolver problemas
aritmticos y matemticos mediante ejercicios relacionados con nmeros. Series
numricas: Estos ejercicios prueban la capacidad para resolver problemas aritmticos
y matemticos, convirtindose en una buena forma de medir el razonamiento inductivo
o razonamiento abstracto. Las series numricas pueden presentarse de forma que el
individuo complete los nmeros que faltan o bien se les da a elegir el nmero siguiente
entre varias alternativas posibles. Series alfabticas: Del mismo modo que con las
series numricas, se pretende medir tambin el razonamiento abstracto. Problemas
de razonamiento no verbal: Son test que se han creado con figuras o smbolos para
medir la inteligencia general o el razonamiento abstracto. Ejercicios de visualizacin:
Evalan la capacidad para captar relaciones espaciales. Es importante para aquellas
personas que deben manejar objetos, mquinas, planos, etc. Test de capacidad
mecnica: Tienen como finalidad identificar a aquellos individuos con aptitudes para
trabajos de carcter mecnico y trabajos de mantenimiento. Test de personalidad:
Tratan de buscar rasgos de carcter, acordes con el perfil del puesto: introvertido o
extrovertido, dinmico o pasivo, optimista o pesimista, con iniciativa o sumiso,
impulsivo o moderado, etc. Test de aptitudes administrativas: Sirven para medir la
Flix Rodrguez Isidro

Pgina 18

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

capacidad de percepcin, rapidez de lectura, de precisin en actividades especficas,


clculo aritmtico, comprobacin de datos, ortografa, archivo, comprobacin de
errores, etc.

Flix Rodrguez Isidro

Pgina 19

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

AVTIVIDAD 06
INSTRUMENTOS PSICOMTRICOS
El Mini Mental StateExamination (MMSE) de Folstein.
DESCRIPCION:
Diseado por Folstein y McHung en 1975, con la idea de proporcionar un anlisis breve y
estandarizado del estado mental que sirviera para diferenciar, en pacientes psiquitricos,
los trastornos funcionales orgnicos.
Hoy en da, se utiliza sobre todo para detectar y evaluar la progresin del Trastorno
Cognitivo asociado a Enfermedades Neurodegenerativas como la de tipo Alzheimer. El
MEC fue la primera versin en castellano del MMSE, adaptada por Lobo y col. La versin
de 35 puntos, fue la primera y es la ms utilizada actualmente. Se trata de una sencilla
escala estructurada, que no requiere ms de 5 10 minutos para su administracin.
Sus tems exploran 5 reas cognitivas:
Orientacin, Fijacin, Concentracin y Clculo, Memoria y Lenguaje
INSTRUCCIONES GENERALES:
Invitar al entrevistado a colaborar. No corregir nunca al paciente, aunque se equivoque.
Contabilizar los puntos correctos de cada uno de los 5 tems del test.
1. Orientacin: No se permite la Comunidad Autnoma como respuesta correcta
para la provincia ni para nacin o pas(excepto en las comunidades histricas).
2. Fijacin. Repetir claramente cada palabra en un segundo. Le damos tantos puntos
como palabras repita correctamente al primer intento. Hacer hincapi en que las
recuerde, ya que ms tarde se le volvern a preguntar. Asegurarse de que el
paciente repita las tres palabras correctamente hasta que las aprenda. Estn
permitidos seis intentos para que las repita correctamente.
3. Concentracin y Clculo: Sustraccin de 3 en 3. Si no le entiende se puede
reformular la pregunta. Si tiene 30 pesetas y me da tres cuntas le quedan?, y
seguir pero sin repetir cifra que d el paciente. Se dar un punto por cada
sustraccin correcta.
Repetir los dgitos 5 9 2 lentamente: 1 segundo cada uno, hasta que los
aprenda, se le da 1 punto por cada dgito que coloque en posicin inversa
correcta.
4. Memoria: Dar un amplio margen de tiempo para que pueda recordar sin ayudarlo.
1 punto por cada palabra recordada sin tener en cuenta el orden.
5. Lenguaje y construccin: El entrevistador ha de leer la frase poco a poco y
correctamente articulada, un error en la letra, es 0 puntos en el tem:
Semejanzas: En las semejanzas perro-gato las respuestas correctas son
animales de x caractersticas. rdenes verbales, si el paciente coge el papel
con la mano izquierda, se valorar como error, si lo dobla ms de dos veces es
otro error.
Lectura, escritura y dibujo: Si utiliza gafas se solicita que se las ponga.
Frase: Advertir que no se considerar correcta si escribe su nombre. Si es
necesario se le puede poner un ejemplo, pero insistiendo en que ha de escribir
algo diferente. Debe construir una frase con sujeto, verbo y complemento para
valorarla con un punto.
Figura. Cada pentgono ha de tener exactamente 5 lados y 5 ngulos y debe
entrelazarse en dos puntos de contacto.
PUNTUACIN:
La puntuacin total mxima es de 35 puntos.
Flix Rodrguez Isidro

Pgina 20

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

Excluimos las preguntas que hayan sido eliminadas, bsicamente por analfabetismo o
por imposibilidad fsica de cumplir un tem (ej.: ceguera). Entonces calculamos la
puntuacin total corregida: la obtenida por regla de tres despus de corregir la puntuacin
total.
Ejemplo, si el paciente es ciego y no puede acceder a 4 de los 35 puntos posibles, la
puntuacin final se calcular sobre 31 puntos posibles. Imaginemos que la puntuacin
total ha sido 20, aplicando la correccin obtenemos una puntuacin (20x35/21) = 22,5
(redondearemos al nm. entero + prximo, el 23).
INTERPRETACIN:
Instrumento sencillo y breve de aplicacin, no requiere de especiales habilidades para su
administracin. La edad y la escolarizacin influyen en la puntuacin total.
Existen limitaciones a su uso en pacientes con bajo nivel cultural, analfabetos o con
dficit sensoriales.
No explora todas las reas cognitivas. Posibilidad de que pasen inadvertidos los casos
incipientes de deterioro cognitivo.
RANGO de PUNTUACION 0 35.
Lobo y col, proponen:
Pacientes GERIATRICOS:(> de 65 aos), punto de corte 23/24; es decir, 23 menos
igual a caso y 24 ms a no caso.
Pacientes NO GERIATRICOS punto de corte 27/28 (es decir, 27 0 menos igual a caso,
y 28 ms igual a no caso.
Cuestionario de Estado Mental
Portatil de Pfeiffer
DESCRIPCION
Fue diseado por Pfeiffer en 1975 como test de screening de deterioro cognitivo.Se
encuentra validado en nuestro pas por Garca-Moltalvo.
Se trata de un cuestionario heteroaplicado de 10 tems, sobre cuestiones muy generales
y personales. Se puede pasar en 4 5 minutos. Se van anotando las respuestas
errneas. Se permite un fallo de ms si el paciente no ha recibido educacin primaria y
uno de menos si tiene estudios superiores.
Explora la:
Memoria a corto plazo.
Orientacin.
Informacin sobre hechos cotidianos, y la Capacidad de clculo.
INTERPRETACIN.
Detecta tanto la presencia de deterioro cognitivo como el grado del mismo. Las
cuestiones con varias respuestas slo se aceptan como correctas si todos los elementos
de la misma lo son.
Para poblacin de raza blanca y nivel cultural medio se considera:
- NORMAL de 0 a 2 errores.
- Deterioro cognitivo Leve de 3 a 4 errores.
- Deterioro cognitivo MODERADO (Patolgico) de 5 a 7 errores,
- Deterioro cognitivo Importante de 8 a 10 errores.
Sus valores psicomtricos arrojan valores bajos de sensibilidad en estudios realizados
en la comunidad (S 34 48% y E 94- 95 %) y mejorando stos en casos diagnosticados
de grados moderados o severos de demencia.
Flix Rodrguez Isidro

Pgina 21

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

Enfatiza mucho el lenguaje y la memoria y tiene una intensa orientacin verbal. Por lo
que en algunos tipos de dficit sensoriales o trastornos psiquitricos (depresin) podra
dar falsos positivos. A pesar de haber sido diseado para screening, no detecta deterioros
leves ni cambios pequeos en la evolucin del deterioro cognitivo.
Es un test muy rpido de administrar que no requiere especial entrenamiento, lo que lo
hace muy indicado en los CRC... Se ha mostrado especialmente til en invidentes,
personas de edad avanzada y analfabetos. Especialmente til para screening en
poblacin general.
PROPIEDADES PSICOMETRICAS
- Fiabilidad:La fiabilidad test-retest oscila entre 0,82 y 0,85.
- Validez: Los ndices de correlacin con otros instrumentos similares: son 0,76 al 0,88
con el Mental Status Questionnaire.
- Sensiblidad: Segn varios estudios recogidos por Del Ser la sensibilidad, vara del 68 al
82 % y la Especificidad del 92 al 96%.
Trastornos orgnicos: Ansiedad Depresion
Trastornos del ESTADO DEL NIMO
Depresin
Actualmente se conocen ms de 100 escalas, lo que nos da una idea de las limitaciones
de estas herramientas y del hecho de que no existe ningn instrumento "ideal".
En las escalas todos los sntomas son igual de importantes y se suman tems vegetativos
o cognitivos de forma intercambiables. Por eso, estas escalas no permiten realizar el
diagnstico de dapresin y mucho menos especificar de qu tipo de depresin se trata...
Su funcin es evaluar la intensidad de los sntomas una vez que se ha realizado el
diagnstico.
OBJETIVO DE LA ESCALA:
Son 3 los objetivos principales de las escalas para evaluar la depresin:
- Cuantifica la intensidad de la depresin en sujetos ya diagnosticados.
- Evala la efectividad del tratamiento.
- Cribaje en poblacin general o en poblacin clnica.
CARACTERISTICAS ESPECFICAS:
La primera de las escala desarrolladas para evaluar la depresin fue la de HAMILTON, y
con ella naca la moderna psicometra.
1. La Escala de HAMILTON. Es la ms utilizada y sirve de referencia para todas las
dems. Que deben demostrar una buena validez convergente con sta....... Su
mayor limitacin es que requiere cierto entrenamiento por parte del entrevistador
por lo que encarece su uso.
2. La Escala de BECK. Es la ms empleada de las escalas autoadministradas en
depresin.
3. Escala Ansiedad Depresin de GOLDBERG. Es una de los tests utilizado como
instrumento de cribaje en depresin y ansiedad. Es breve, fcil de administrar y
sirve como gua clnica.
4. Escala Ansiedad Depresin Hospitalaria. Especialmente indicada en pacientes
hospitalizados con co-morbilidad orgnica.
Estas dos ltimas escalas no evalan especficamente depresin ya que tambin
incluyen ansiedad. El problema de a ellas es que no discriminan bien ambas
entidades.
El solapamiento entre las escalas de ansiedad y depresin no debe atribuirse
necesariamente a una mala construccin del instrumento, sino a la mala
delimitacin de ambos sndromes clnicos. Por eso se tienden a emplearse como
medidas de malestar general, en la lnea del General HeatthQuestionnaire (GHQ).
Flix Rodrguez Isidro

Pgina 22

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

Trastornos del ESTADO DEL NIMO


Ansiedad.
A la hora de seleccionar una escala para medir la ansiedad es conveniente considerar el
diagnstico. La Ansiedad como sntoma es ubicua y puede presentarse en casi todas las
enfermedades psiquitricas, no solo en los trastornos de ansiedad.
Las escalas que nosotros vamos a utilizar miden fundamentalmente trastornos de
ansiedad y suelen emplearse las escalas AUTO EVALUADA.
CARACTERISTICAS ESPECIFICAS DE CADA INSTRUMENTO.
Escala de HAMILTON:
Es la primera de las escalas desarrolladas para evaluar la ansiedad en sentido
general. Es la ms utilizada, despus del Cuestionario de ansiedad Estado Rango
(STAI) para evaluar la intensidad de los sntomas en los trastornos de ansiedad.
De hecho, sirve de referencia o "patrn oro" para todas las dems escalas de
ansiedad, que deben demostrar una buena validez convergente. Por tanto, puede
emplearse como primera eleccin en cualquier situacin.
Sus mayores limitaciones son:
- Requiere cierto entrenamiento por parte de los entrevistadores.
- Es una escala general, poco til si queremos evaluar Trastornos de ansiedad
especficos como la Fobia,
- Trastornos de angustia y mucho menos Trastornos obsesivo-compulsivos.
Escala de ZUNG.
Es posterior a la de Hamilton y mide la ansiedad general. Se desarrollaron dos
versiones: Una HETEROEVALUADA por un clnico (ASI), y Otra
AUTOEVALUADA, la SAS.
A diferencia de la escala de Zung de depresin, su validez no ha sido tan
cuestionada.
Su principal ventaja es que no incluye ningn tem que evale la depresin,
limitacin que si se observa en la de Hamilton, por lo que el poder discriminativo
ansiedad / depresin es mayor en la escala de Zung.
Escala de BECK.
La escala auto - administrada se utiliza para detectar pacientes con ansiedad en
cualquier poblacin, para medir la intensidad de la ansiedad en pacientes
diagnosticados y para monitorizar tratamientos farmacolgicos o psicolgicos.
Inventario de DEPRESION de BECK
BeckdepressionInventory (BDI) y col, 1961
DESCRIPCION.
El inventario de Depresin de Beck (BAI) fue desarrollado inicialmente como una escala
heteroaplicada de 21 tems para evaluar la gravedad (intensidad sintomtica) de la
depresin, conteniendo cada tem varias fases autoevaluativas que el entrevistador lea al
paciente para que ste seleccionase la que mejor se adaptase a su situacin; sin
embargo, con posterioridad su uso se ha generalizado como escala autoaplicada.. Beck y
cols.(1979) da a conocer una nueva versin revisada de su inventario, adaptada y
traducida al castellano por Vzquez y Sanz (1991), siendo sta la ms utilizada en la
actualidad.
Es un cuestionario autoaplicado de 21 tems que evala un amplio espectro de sntomas
depresivos. Se sistematizan 4 alternativas de respuesta para cada tem, que evalan la
gravedad / intensidad del sntoma y que se presentan igualmente ordenadas de menor a
mayor gravedad. El marco temporal hace referencia al momento actual y a la semana
Flix Rodrguez Isidro

Pgina 23

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

previa. Ni la numeracin de las alternativas de respuesta, ni los enunciados de los


distintos tems deben aparecer en el formato de lectura del cuestionario, ya que al dar
una connotacin clnica objetiva a las frases pueden inflluir en la opcin de respuesta del
paciente.
Su contenido enfatiza ms en el componente cognitivo de la depresin, ya que los
sntomas de esta esfera representan en torno al 50% de la puntuacin total del
cuestionario, siendo los sntomas de tipo somtico/vegetativo el segundo bloque de
mayor peso; de los 21 tems, 15 hacen referencia a sntomas psicolgicos-cognitivos, y
los 6 restantes a sntomas somticos vegetativos.
INTERPRETACION
El paciente tiene que seleccionar, para cada tem, la alternativa de respuesta que mejor
refleje su situacin durante el momento actual y la ltima semana. La puntuacin total se
obtiene sumando los valores de las frases seleccionadas, que van de 0 a 3.
El rango de la puntuacin obtenida es de 0-63 puntos. Como otros instrumentos de
evaluacin de sntomas, su objetivo es cuantificar la sintomatologa, no proporcionar un
diagnstico.
Los puntos de corte usualmente aceptados para graduar la intensidad/ severidad son los
siguientes:
No depresin:
0-9 puntos
Depresin leve:
10-18 puntos
Depresin moderada: 19-29 puntos
Depresin grave:
> 30 puntos
A efectos de cribado o deteccin de casos en poblacin general el punto de corte ha sido
establecido por Lasa L. y cols en > 13 puntos. En pacientes mdicos la validez predictiva
de la escala est peor establecida, por cuento los tems somticos tienden a aumentar el
nmero de falsos positivos si se utiliza un punto de corte bajo y se han utilizado puntos de
corte ms altos ( por ej.: > 16 en pacientes diabticos, > 21en pacientes con dolor
crnico).
A efectos de seleccin de sujetos para investigacin, el punto de corte usualmente
aceptado es > 21 puntos.

Cuestionario de Screning de ANSIEDAD de Wittchen.


DESCRIPCION:
Este cuestionario fue desarrollado por Wittchen y cols con el objeto de detectar trastornos
de ansiedad generalizada y otros trastornos de ansiedad.
Est basado en el Composite International Diagnostic Interview (CIDI). Su versin 1.2 se
desarroll para cubrir criterios diagnsticos DSM-IV y ICD-10. Ha sido diseado para su
uso en atencin primaria.
El cuestionario consta de varias secciones:
1. Motivo de acudir a la consulta: es el tem 1 y recoge una informacin til para el
clnico (dolor, estrs emocional o psicolgico, enfermedad fsica o somtica...)

Flix Rodrguez Isidro

Pgina 24

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

2. Diagnsticos: tems 2 a 7. Cada uno de ellos evala un diagnstico distinto


mediante las llamadas cuestiones llave, que poseen una elevada sensibilidad
operativa para el diagnstico de una patologa.
3. La contestacin negativa a estas cuestiones hacen casi imposible el diagnstico
del cuadro explorado... Los diagnsticos evaluados son: trastorno depresivo
mayor, trastorno y sndrome de pnico, trastorno de ansiedad social, agorafobia,
trastorno de estrs postraumtico y estrs agudo y trastorno de ansiedad
generalizada. Si la respuesta a estos seis tems es negativa se finaliza la
cumplimentacin del cuestionario.
4. Trastorno de ansiedad generalizada: evala tanto los criterios de ansiedad
generalizada como cuadros subclnicos de ansiedad, segn los criterios DSM-IV,
completados con algunas cuestiones recogidas en CIE -10.
Valoran los siguientes aspectos.
contenidos de las preocupaciones y ansiedad (tems 8-10),
dificultad para controlar las preocupaciones (tems 11 y 12),
sntomas fsicos de ansiedad (tem 13, que tiene 11 sub - tem; los 6 primeros son
especficos de trastorno de ansiedad generalizada y los 5 siguientes
corresponden a los incluidos en CIE-10),
impacto sobre la vida del paciente (tem 14) y criterio temporal de duracin de los
sntomas (tem 15).
El marco temporal explorado es distinto para cada tem. El cuestionario es auto
administrado. No se encuentra validado en nuestro medio y la versin que presentamos
es la de Bobes y cols.
INTERPRETACION:
Es un instrumento fcil y rpido de utilizar (en el estudio original de tiempo de
cumplimentacin fue de 3.5 minutos), que no requiere entrenamiento especial.
La Sensibilidad y especificidad de las distintas cuestiones llave es la siguiente:
Trastornos de pnico (S 95% E 62%).
Agorafobia (S 88% E58%),
Fobia Social (S 89% E 51%,
Trastornos por estrs postraumtico (S 82% E 49%),
Trastorno Depresivo Mayor (S 87% E 68%),
Trastornos de Ansiedad generalizada (cuestin llave ms criterio, S 92% E 74%).
Respecto a los criterios de trastorno de ansiedad generalizada, los autores no proponen
ningn punto de corte. Cuantos ms criterios se cumplan mayor posibilidades de
presencia del cuadro.
El cuestionario resulta til tanto en cuadros de ansiedad establecidos como en
situaciones subclnicas.
PROPIEDADES PSICOMETRICAS:
Fiabilidad:
La fiabilidad tetst-retest para cuadros de ansiedad generalizada establecidos fue de
Kappa 0.72 y para ansiedad generalizada subclnica de 0.70.
Validez:
La validez concurrente se estableci con el CIDI, presentando valores de Kappa de 0.88
% , con Sensibilidad global de 88 y Especificidad de 96.3%. Cuando se analizan los
resultados con los criterios DSM-IV la sensibilidad es alta, pero la especificidad alcanza
solo valores moderados.
Instrumentos psicomtricos de Personalidad
1. Para comprender el estudio de la personalidad nos vamos a apoyar en los
mtodos destinados a apreciar los rasgos del comportamiento o las reacciones
individuales.
2. Son los denominados TEST de PERSONALIDAD, y que clasificamos en:
1. - LOS MTODOS o TEST PROYECTIVOS.
El test de Rorschach es el ms representaativo de estos test. Pero por su
Flix Rodrguez Isidro

Pgina 25

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

extensin y por estar fuera del objetivo de este Manual, descartamos


desarrollarlo.
2. - LOS TEST OBJETIVOS de Personalidad.
Estos test intentan determinar los diferentes factores de la personalidad. Son
necesariamente validados segn criterios exteriores a ellos mismos. Por
consiguiente correspondern o bien a una sistematizacin nosolgica de la
psiquiatria, o bien a una concepcin estructuralista o incluso factorialista de
personalidad.
CLASIFICAMOS los test Objetivos en:
(A) los Test clsicos que miden los factores de personalidad como:
Inventario de personalidad de Minessotta (MMPI)
Factores de Personalidad (16 PF)
Cuestionario de Anlisis Clnicos (CAQ).
Inventario de Personalidad de Pinillos (CEP)
Inventario de Personalidad de EYSENCK (EPI).
Todos ellos (el MMPI o el 16Pf, el CAQ, el EPI, o el CEP), nos permiten
diagnosticar trastornos de personalidad segn criterios de las clasificaciones
psiquitricas vigentes como el DSM o CIE.
Estos test (de los que comentaremos sus caractersticas, a groso modo) al estar
protegidos por copyright y comercializados por empresas especializadas, no se
incluirn en su totalidad.
(B) Test Especficos.
Hemos incluido, entre otros, los que miden aspectos especficos de
personalidad y que pueden ser tiles, en los CRC, son:
1) La Escala de Bsqueda de SENSACIONES, que mide este rasgo, se define
como la necesidad de sensaciones y experiencias nuevas, variadas y complejas,
y el deseo de arriesgarse con el fin de obtenerlas.
Se ha empleado en: Individuos con conductas inmaduras. En trastornos de
personalidadad, e incluso en individuos normales que realizan deportes de
riesgo.
2) El Test de Hostilidad de BUSS-DURKEE, que es uno de los cuestionarios
autoaplicados ms empleados para medir la agresin, de especial utilidad para
evaluar impulsividad, intencionalidad suicida y agresin en general.
3) La Escala de Impulsividad de BARRAT. Es autoaplicado y uno delos ms
utilizados en investigacin. Est indicado en trastornos de personalidad
(especialmente lmites), trastornos bipolares y todo trastorno psiquitrico en que
la conducta impulsiva o suicida constituye un problema.
3. Test Especficos de Personalidad
Hemos incluido, entre otros, los que miden aspectos especficos de
personalidad y que pueden ser tiles, en los CRC, son:
1) La Escala de Bsqueda de SENSACIONES.
Esta escala mide este rasgo, se define como la necesidad de sensaciones y
experiencias nuevas, variadas y complejas, y el deseo de arriesgarse con el fin
de obtenerlas.
Se ha empleado en: Individuos con conductas inmaduras. En trastornos de
personalidadad, e incluso en individuos normales que realizan deportes de
Flix Rodrguez Isidro

Pgina 26

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

riesgo.
2) El Test de Hostilidad de BUSS-DURKEE.
Este, es uno de los cuestionarios autoaplicados ms empleados para medir la
agresin, de especial utilidad para evaluar impulsividad, intencionalidad suicida y
agresin en general.
3) La Escala de Impulsividad de BARRAT.
Es una escala autoaplicado y uno de las ms utilizadas en investigacin. Est
indicado en trastornos de personalidad (especialmente lmites), trastornos
bipolares y todo trastorno psiquitrico en que la conducta impulsiva o suicida
constituye un problema.
4. ESCALA de BUSQUEDA de SENSACIONES.
DESCRIPCIN
La escala de bsqueda de sensaciones (Forma V), fue diseada por Zuckerman
y col., siendo la versin ms reciente la de 1978. Su objetivo es valorar la
bsqueda de sensaciones. Este rasgo fue definido por Zckerman como la
necesidad de sensaciones y experiencias nuevas, variadas y complejas y el
deseo de arriesgarse con el fin de obtenerlas.
Es un cuestionario autoadministrado, formado por 40 preguntas con respuestas
dicotmicas (Si No). Cada respuesta afirmativa punta 1 y cada negativa 0.
CONSTA de 4 Escalas:
Bsqueda de Emociones (BEM): tems 1.5.9.13.17.21.25.29.33.37
Bsqueda Excitacin (BEX): tems 2,6,10,14,18,22,26,30,34, 38
Desinhibicin: tems 3,7,11,15,19,23,27,31,35,39.
Susceptibilidad al aburrimiento (SAB):4,8,12,15,20,24,28,32,36,40
Proporciona por tanto 4 puntuaciones distintas (una por escala) y adems una
total. En nuestro medio ha sido validada por Prez y col., en base a trabajos
previos de este mismo autor.
INTERPRETACION.
Se trata de un instrumento adecuado para la investigacin del rasgo bsqueda
de sensaciones en nuestro medio. No existen puntos de corte propuestos por los
autores y debe interpretarse que puntuaciones + elevadas representan mayor
presencia del rasgo.
Al igual que numerosos estudios, en la validacin espaola se observan
puntuaciones ms elevadas en todas las subescalas y la puntuacin total en
varones respecto a las mujeres. En varones las puntuaciones ms altas se
obtienen en la escala BEM y las menores en la SAB. En mujeres las ms altas en
la BEM y las menores en la DES. Existe una relacin inversa entre la edad y la
puntuacin de la escala.
La subescala SAB es la menos homognea, la que presenta menor correlacin
con las otras y es la que menos fiabilidad alfa demuestra. La menor fiabilidad se
obtiene mediante la utilizacin de la puntuacin total. En lugar de la de las
subescalas. A modo orientativo, presentamos los datos normativos en poblacin
espaola
BEM
BEX
DES
SAB
Varones 6.8 (2,6) 5,7 (2,1) 5,1 (2,5) 3, )
,3
Mujeres 6,1 (2,4) 5,4 (1,9) 3,0 (1,9) 3,0 (1,9)
Flix Rodrguez Isidro

TOTAL
(6,4)
17,7 ,3)
Pgina 27

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

PROPIEDADES PSICOMETRICAS.
Fiabilidad
La fiabilidad test- retest en la poblacin espaola con un intervalo de 5 das es en
valores del 0,9 para la puntuacin total y oscila entre 0,68 y 0,94 para las
subescalas. En las mujeres para la puntuacin total es de 0,92 y entre 0,72 y 0,95
para las subescalas. El mismo caso anterior. Pero con un intervalo de 5 semanas
arroja valores similares en varones (0,88 para la puntuacin total y 0,71 0,86
para las subescalas) y mujeres (0,78 para el total y 0,70 0,87 para las
subescalas).
Validez
La
validez
concurrente
observada
con
las
diferentes
escalas
selEysencjPersonalityQuestionnaire son: Las Escalas E (Extraversin) y P
(Psicoticismo) presentan correlaciones superiores con la escala de Busqueda de
Sensaciones que la escala de N (Neuroticismo).
Instrumentos Psicomtricos que nos permiten evaluar la Esquizofrenia y los
Trastornos Psicticos
INTRODUCCION:
Desde la descripcin de Demencia precoz por Kraepelin, que se considera el punto de
partida de la psiquiatra moderna, se han intentado identificar grupo de sntomas que
diagnostiquen de forma fiable este trastorno. De hecho, las clasificaciones psiquitricas
DSM y CIE han intentado, en cada una de sus ediciones, afinar los criterios diagnsticos
en este sentido, sin conseguir acuerdos definitivos.En 1980 Crow y en 1982 Andreasen
defienden la existencia de 2 tipos de sntomas en la esquizofrenia: Positivos y
Negativos, con sus correlatos biolgicos y de neuroimagen.
En 1987, Liddle revisa este modelo y sugiere uno tridimensional con las categoras de
Positivo-paranoide, Negativo-Deficitario y desorganizado y hefebrnico. En 1990, Kay y
Sevy proponen un modelo de 4 factores:: Positivo, Negativo, Agitacin y Depresin.
Por ltimo, Linstrom y Von Knorring entre otros autores, proponen un sistema
pentadimensional
con las siguientes dimensiones: negativo, Positivo, Disfuncin
cognitiva, Ansiedad / Depresin y Excitacin. Todas estas propuestas cuentan con
estudios que poyan y con otras que los invalidan, y cualquier otra alternativa nosolgica
resulta igualmente endeble.
En este momento se acepta que la esquizofrenia es un grupo hetereogneo de
enfermedades cuya clasificacin se encuentra en contnua revisin. La consecuencia es
que no hay un patrn oro, por lo que las escalas de evaluacin , basadas en alguno de
los modelos
descritos, se emplean para validar
o rechazar dichos modelos,
producindose un error autolgico metodolgicamente inaceptable. Este problema casi
especfico de la esquizofrenia, no parece que vaya a subsanarse en los prximos aos,
por lo que va a implicar limitaciones importantes desde el punto de vista de la
Psicometra.
TIPOS DE ESCALAS:
Los principales aspectos que pueden evaluarse en la esquizofrenia son los siguientes:
1)Instrumentos para evaluar la PSICOSIS en general.
Por las caractersticas
especficas de la Psicosis (la falta de conciencia de enfermedad en la mayora de
estos enfermos), las escalas tienen que ser heteroevaluadas ya que el paciente
frecuentemente no va a colaborar.
Dentro de este grupo, la BPRS (ESCALA BREVE DE EVALUACION PSIQUIATRICA)
es no solamente la escala ms utilizada con esta funcin, sino el test psiquitrico
ms empleado a nivel internacional junto a la escala de Hamilton de Depresin.
Flix Rodrguez Isidro

Pgina 28

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

Inicialmente se emple para monitorizar el tratamiento farmacolgico en pacientes


con Psicosis, utilidad en la que se considera de eleccin, pero poco despus
empez a emplearse en la evolucin del sndrome Psictico.
2) Instrumentos para la evaluacin sntomas Positivos y Negativos. En este grupo, la
escala ms empleada internacionalmente con diferencia es la PANSS, (ESCALA
SINDROME POSITIVO Y NEGATIVO EN ESQUIZOFRENIA),
Tambin es
heteroaplicada, basada en la BPRS y fundamentalmente en el modelo Crow. La
utilidad de esta escala ha motivado que se incluya en la Entrevista Clnica
Estructurada (CSID) que recomienda la Asociacin Psiquitrica Americana para
realizar los diagnsticos del DSM III R.
3) Instrumentos para la evaluacin
de otros aspectos relacionados con la
enfermedad.En este grupo, la escala ms importante es la AIMS: (ESCALAS DE
MOVIMIENTOS INVOLUNTARIOS ANORMALES), que evala los efectos
extrapiramidales secundarios al tratamiento neurolptico. stos efectos, constituyen
una de las principales limitaciones a la calidad de vida de estos enfermos y el
principal motivo de abandono del tratamiento.
La AIMS es la escala ms empleada internacionalmente para medir este aspecto,
aunque no se encuentra validada en espaol.
Test de inteligencia:
Los Test de Inteligencia ms que medir la inteligencia en s (posibilidad muy discutible),
valoran los conocimientos, aptitudes y capacidades del individuo, por lo que se tiende
hoy a llamarlos test de aptitudes, de eficiencia o de rendimiento.
CONCEPTOS:
Conjunto de capacidades razonamiento, memoria, asimilacin, percepcin, habilidades
numricas, visualizacin espacial, rapidez mental, etc. que pueden estar en un sujeto
en grados muy distintos. No es algo unitario sino una serie de cualidades que se miden
con pruebas diversas.
TIPOS DE TETS:
1. Individuales. (ms fiables que los grupales).
2. Grupales. Autoadministrados, y de Realizacin.
3. Verbales:
OTIS, varias formas equivalentes destinadas a personas de distintos niveles
mentales. Permite formarse un juicio bastante aproximado sobre el nivel mental y
el desarrollo intelectual de los candidatos.
WECHSLER BELLEVUE, para adultos. Consta de 11 pruebas.
WAIS, aprecia a travs de las pruebas verbales, la inteligencia terica y, a travs
de las pruebas de ejecucin, la inteligencia
4. Tests No Verbales:
Test D - 48, series de domin
Matrices progresivas de RAVEN
PM 38
Desarrollamos los que ms nos puedan ayudar a la hora de valorar el Nivel o Coeficiente
de Inteligencia.

Flix Rodrguez Isidro

Pgina 29

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

ACTIVIDAD 07 y 08
Cualidades que debe tener un test psicomtrico
Confiabilidad
La confiabilidad (o consistencia) de un test es la precisin con que el test mide lo que
mide, en una poblacin determinada y en las condiciones normales de aplicacin.
(Anastasi, 1982; Aiken, 1995). (Las condiciones normales de aplicacin se refieren a las
condiciones especificadas en el manual del test).
La falta de confiabilidad de un test psicomtrico esta en relacin con la intervencin del
error. Se considera que el error es cualquier efecto irrelevante para los fines o resultados
de la medicin que influye sobre la falta de confiabilidad de tal medicin. El error es de
dos tipos: a) Error constante (sistemtico), que se produce cuando las mediciones que se
obtienen con una escala son sistemticamente mayores o menores que lo que realmente
deben ser. b) Error causal (al azar o no sistemtico), que se produce cuando las medidas
son alternativamente mayores o menores de lo que realmente deben ser.
Este ltimo tipo de error interviene cuando se afecta la confiabilidad de un test
psicomtrico. Este error tiene que ver con la salud, fatiga, motivacin, tensin emocional,
fluctuaciones de la memoria, condiciones externas de luz, humedad, ventilacin, calor,
distraccin por problemas del momento, familiaridad con la prueba, que presenta el
examinado al momento de dar el test (Rey, 1972; Brown, 1982).
Cmo se presenta la confiabilidad de un test psicomtrico? La confiabilidad se presenta
por medio del coeficiente de confiabilidad (rxx) y del error estndar de medida (EEM).
Jaime Aliaga 93
A) Coeficiente de confiabilidad
Es un coeficiente de correlacin entre dos grupos de puntajes e indica el grado en que los
individuos mantienen sus posiciones dentro de un grupo. Abarca valores desde 0 a 1.
Cuanto ms se acerque el coeficiente a 1, ms confiable ser la prueba. El coeficiente de
confiabilidad seala la cuanta en que las medidas del test estn libres de errores
casuales o no sistemticos.
Por ejemplo, un coeficiente de 0.95 quiere decir que en la muestra y condiciones fijadas
de aplicacin del test el 95% de la varianza de los puntajes directos se debe a la
autntica medida, y slo el 5%, a errores aleatorios.
Existen cuatro mtodos bsicos para obtener el coeficiente de confiabilidad (rxx): Mtodo
de las formas equivalentes; mtodo del test-retest; mtodo de la divisin por mitades
emparejadas o "Split half method"; y mtodo de la equivalencia racional o de KuderRichardson.
a) Mtodo de las formas equivalentes: Se aplican dos formas equivalentes o paralelas del
test al mismo grupo de individuos, y las dos series de puntajes resultantes se
correlacionan con el coeficiente producto de los momentos de Pearson (r).
b) Mtodo del test-retest: Se aplica dos veces el mismo test (el lapso entre las
aplicaciones se determina previamente), a una misma muestra de individuos. Las dos
series de puntajes resultantes se correlacionan con el coeficiente de correlacin "r" de
Pearson.
c) Mtodo de la divisin por mitades emparejadas o "split half method": Se aplica el test
una sola vez a una muestra. Luego, se califica por separado los temes pares (2, 4, 6, ...,
n) y los temes impares (1, 3, 5, ..., n). A continuacin, las dos series de puntajes
resultantes se correlacionan con el coeficiente "r" de Pearson, pero por haberse dividido
el test en dos partes (temes pares e temes
impares), el "r" resultante debe ser "corregido" para arrojar el "r" para todo el test. Esta
correccin se efecta con la frmula de profeca de Spearman-Brown:
d) Mtodo de la equivalencia racional: En este mtodo se considera que si un test esta
formado por un conjunto de temes estos pueden ser considerados como un conjunto de

Flix Rodrguez Isidro

Pgina 30

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

tests paralelos (tantos como temes tenga el test). Luego se deriva una ecuacin para
computar el coeficiente de confiabilidad. Kuder y Richardson
derivaron varias frmulas para el clculo del coeficiente de 94 Psicometra
confiabilidad, son las ms conocidas la KR20 y la KR21. Actualmente, un coeficiente ms
utilizado es el coeficiente alfa de Cronbach
(1972; Anastasi, 1982; Aiken, 1995).
B) Error estndar de medida
Por medio de este error estndar de medida se estima el intervalo probable de puntajes
en el cual se encontrar el puntaje verdadero de un sujeto examinado con un test
psicomtrico. El error estndar de medida (EEM) se obtiene a travs de la siguiente
frmula:
EEM = s 1- rxx
Donde:
s = Desviacin estndar de los puntajes de la distribucin.
rxx = Coeficiente de confiabilidad del test.
1 = Constante.
Obtenido el EEM, debemos escoger el nivel de confianza:
- Nivel de confianza del 68% = PD 1 EEM.
- Nivel de confianza del 95% = PD 2 EEM.
Para el nivel de confianza del 68% la interpretacin es la siguiente: "Podemos concluir,
con un 68% de confianza, que el puntaje verdadero de un sujeto est en la zona o
intervalo comprendido entre su puntaje directo u obtenido (PD) y 1 EEM".
El nivel de confianza ms usado en psicometra es el del 95%: "el puntaje verdadero de
un sujeto se encontrara en el intervalo comprendido entre su puntaje obtenido o directo
(PD) y 2 EEM".
Validez
Si tenemos una prueba X nos equivocaramos al creer que su titulo nos dice lo que la
prueba mide, pues cualquier persona puede reunir un conjunto de reactivos y esperar a
obtener una medida, por ejemplo, de razonamiento numrico o de las estrategias de
aprendizaje. La averiguacin de lo que la prueba mide no responde a la pregunta cmo
llama el autor a la prueba?, sino ms bien a qu hacen referencia los puntajes obtenidos
en esta?, es vlido el uso o la interpretacin de las puntuaciones de este test?, qu
generalizaciones se pueden hacer apropiadamente a partir de la puntuacin en esta
prueba? (Thorndike, 1989). En esencia, el trasfondo de estas preguntas es determinar
cules son los procesos mentales que pone en juego el test. Ahora bien, el responder a
las Jaime Aliaga 95 citadas interrogantes necesita de una indagacin larga y compleja
que en psicometra se denomina proceso de validacin.
a) Distincin entre la validez y la confiabilidad segn el error.
La distincin entre confiabilidad y validez se basa en lo que consideramos como error. En
la validez interesan los errores constantes o sistemticos y en la confiabilidad los errores
aleatorios o no sistemticos. El siguiente ejemplo nos permitir precisar la diferencia
entre ambos tipos de error: Supongamos que un reloj es adelantado 20 minutos. Si se
trata de un buen cronometro el tiempo
que marca ser confiable (es decir consecuente), pero no ser valido en comparacin
con el tiempo estndar (hora GMT).
b) Definicin de validez.
En trminos estadsticos la validez se define como la proporcin de la varianza
verdadera que es relevante para los fines del examen. Con el trmino relevante nos
referimos a lo que es atribuible a la variable, caractersticas o dimensin que mide la
prueba. En este sentido, generalmente la validez de un test se define ya sea por medio
de (1) la relacin entre sus puntuaciones con alguna medida de criterio externo, o bien (2)
la extensin con la que la prueba mide un rasgo subyacente especfico hipottico o
constructo.
Flix Rodrguez Isidro

Pgina 31

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

En trminos psicomtricos, la validez es un concepto que ha pasado por un largo proceso


evolutivo, desde aquella posicin que sostena que un test es vlido para aquello con lo
que correlaciona (Guilford, 1946, citado en Muiz, 1996, p. 52), hasta la ms reciente
que la entiende como un juicio evaluativo global en que la evidencia emprica y los
supuestos tericos respaldan la suficiencia y lo apropiado de las interpretaciones y
acciones en base a los puntajes de las pruebas, que son funcin no slo de los temes
sino tambin de la forma de responder de las personas as como del contexto de la
evaluacin. Es decir, lo que se valida no es la prueba sino las inferencias hechas a partir
de la misma, lo que tiene dos importantes consecuencias: a) el responsable de la validez
de una prueba ya no es solo su constructor sino tambin el usuario, y b) la validez de una
prueba no se establece de una vez por todas sino que es resultado del acopio de
evidencias y supuestos tericos que se dan en un proceso evolutivo y continuo que
comprende todas las cuestiones 96 Psicometra experimentales, estadsticas y filosficas
por medio de las cuales se evalan las hiptesis y teoras cientficas (Messick, 1995). En
este contexto, el concepto validez refiere a la adecuacin, significado y utilidad de las
inferencias especficas hechas con las puntuaciones del los tests. La validacin de un test
es el proceso de acumular evidencia para apoyar tales inferencias. Una variedad de
evidencias pueden obtenerse de las puntuaciones producidas por un test dado, y hay
muchas formas de acumular evidencia para apoyar una inferencia especfica. La validez,
sin embargo, es un proceso unitario. Aunque la evidencia puede ser acumulada de
muchas formas, la validez se refiere siempre al grado en que esa evidencia apoya las
inferencias que se hacen a partir de las puntuaciones (APA, AERA, NCME, 1985, citado
en Gmez e Hidalgo, 2002). La validez no se puede resumir en un solo indicador o ndice
numrico, al igual que ocurre con la confiabilidad (p.e., el coeficiente de confiabilidad),
sino que la validez de las puntuaciones de un test se asegura mediante la acumulacin
de evidencia terica, estadstica, emprica y conceptual del uso de las puntuaciones.
c) Tipos de evidencia. En 1954 un comit presidido por L. J. Cronbach estableci por
encargo de la Asociacin de Psicologa Americana (APA), que la validez era de cuatro
tipos: validez de contenido, validez predictiva, validez concurrente y validez de
constructo. Actualmente se coincide, desde el punto de vista cientfico, que la nica
validez admisible es la validez de constructo
(Messick, 1995). Validacin que ha de hacerse en un marco terico, pues se trata en
ltima instancia de confirmar o explicar las inferencias que se hagan de los puntajes. La
validez de constructo esta referida al grado en que cada prueba refleja el constructo que
dice medir, elaborndose operativamente cuando el usuario desea hacer inferencias
acerca de conductas o atributos que pueden agruparse bajo la etiqueta de un constructo
particular. Su lgica en muchos aspectos as como en sus mtodos, es esencialmente la
del mtodo cientfico, pudiendo verse como la elaboracin de una miniteora acerca de
una prueba (Kline, 1985) cuyas hiptesis deben someterse a contraste con evidencias
que provengan de diferentes fuentes como la de los tipos de validez propuestos por
Cronbach, entendidas como estrategias de validacin, en vista que cada tipo de
inferencia requerir una Jaime Aliaga 97 estrategia distinta para la obtencin de las
evidencias (Vidal, 1996, en Muiz, 1996).
En el estudio de la validez de constructo estas evidencias estn relacionadas a cinco
aspectos:
a) Contenido (relevancia y representatividad del test);
b) Sustantivo (razones tericas de la consistencia observada de las respuestas);
c) Estructural(configuracin interna del test y dimensionalidad);
d) Generalizacin (grado en que las inferencias hechas a partir del test se pueden
generalizar a otras poblaciones, situaciones o tareas); e) Externo (relaciones del test con
otros tests y constructos); f) Consecuencia (consecuencias ticas y sociales del test)
(Messick, 1995).
d) Categoras de la validez. La validez empieza a considerarse como el grado en que
cada test refleja el constructo que dice medir y que las relaciones entre tests que miden
distintos constructos reflejan las relaciones hipotetizadas entre ellos. En este sentido, al
Flix Rodrguez Isidro

Pgina 32

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

estimarse que la validez de un test es la validez de constructo la que ha de hacerse en un


marco terico, ya no se tiende a hablar de tipos de validez sino de categoras o
estrategias de validacin comprendiendo stas a los tipos tradicionales de validez:
validez de contenido, validez emprica y validez de constructo. Si tenemos en cuenta que
lo que se valida no es el test sino las inferencias hechas a partir del mismo, cada tipo de
inferencia requerir una estrategia distinta. (Vidal, 1996, en Muiz, 1996).
(1) Validez de Contenido (evidencia del contenido).- Los tems que constituyen el test
son realmente una muestra representativa del dominio de contenido o dominio conductual
que nos interesa?
Es conveniente precisar que un dominio o campo conductual es una agrupacin
hipottica de todos los reactivos posibles que cubren un rea psicolgica particular. Al
hablar de este conjunto de reactivos posibles, se emplean los trminos de dominio,
universo o poblacin conductual como sinnimos. Por ejemplo: Un test de vocabulario
debe ser una muestra adecuada del dominio o universo de tems posibles en esta rea.
La validez de contenido consiste en determinar lo adecuado del muestreo de reactivos
del universo de reactivos posibles; en este sentido, es una medida de lo adecuado del
muestreo. Ponemos medida entre comillas debido a que este tipo de validez consiste en
98 Psicometra una serie de estimaciones u opiniones, que no proporcionan un ndice
cuantitativo de validez (para su obtencin no se utiliza procedimientos estadsticos). Este
tipo de validez se asocia fundamentalmente a los tests de aprovechamiento o rendimiento
(test
de matemtica, historia, etctera); aunque no existen razones para que no pueda
aplicarse a los otros tipos de pruebas psicolgicas (pruebas de aptitudes, habilidades,
etctera). Para su determinacin se compara sistemticamente los reactivos del test con
el dominio conductual del contenido postulado. Por ejemplo: si tenemos una lista de 500
palabras que esperamos que los estudiantes de un curso sean capaces de escribirlas
correctamente al final de este, su performance o rendimiento respecto a estas palabras
ser importante solamente en tanto que proporciona una prueba de su habilidad para
escribir correctamente las 500 palabras. El test que construyamos tendr una muestra de
las 500 palabras, pero slo tendr validez de contenido en la medida en que proporcione
una muestra adecuada de las 500 palabras que represente. Si seleccionamos solamente
palabras fciles o difciles, o palabras que representen nicamente ciertos tipos de faltas
comunes de ortografa, estaramos propensos a obtener una validez de contenido muy
baja. En consecuencia, el aspecto clave en la validez de contenido es el muestreo de los
reactivos. En otras palabras, la validez de contenido es cuestin de determinar si la
muestra de sus reactivos es representativa del universo o dominio conductual de tems al
que supuestamente representa. Para hacer esta determinacin se recurre a jueces (o
expertos, generalmente en nmero impar). El proceso es bsicamente lgico y racional,
los distintos jueces pueden no estar de acuerdo en la validez de contenido de un test; por
ejemplo, la falta de claridad en la especificidad del dominio conductual, har que resulten
difciles los juicios de validez de contenido. Existen algunos ndices estadsticos para
valorar el grado de acuerdo de los jueces en torno a los reactivos, por ejemplo el
coeficiente V de Aiken. Un procedimiento para que el proceso de enjuiciamiento de los
reactivos sea lo ms objetivo posible, es el siguiente:
- El constructor de la prueba:
* Define especficamente el dominio del contenido por medio de una descripcin que lo
debe delimitar claramente. Jaime Aliaga 99
* Define, si fuera necesario, subcategoras importantes del dominio, especificando esta
importancia en trminos porcentuales.
- Los jueces:
* Determinan si los reactivos sometidos a su consideracin pertenecen o no al dominio
definido as como tambin si, tomados en conjunto, tienen una proporcin adecuada.
* Tambin enjuician la bondad de la redaccin de los
elementos. Es usual considerar en los tests de aprovechamiento escolar a este tipo de
validez como un concepto similar al de validez curricular. Por otro lado, es necesario
diferenciar la validez de contenido de la llamada validez de facie. Esta ltima se da
Flix Rodrguez Isidro

Pgina 33

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

cuando se revisa superficialmente los reactivos y se consideran que los tems parece
que miden lo que se supone tienen que medir. Esta validez puede ser una consideracin
importante a tener en cuenta, si la apariencia de los tems influye en la motivacin del
sujeto. Por ejemplo, si en un test para adultos se incluyen reactivos en lenguaje y
contenido infantil, se dir que este test no tiene validez de facie; el sujeto puede no
sentirse motivado a obtener buenos resultados al sentir que la prueba es poco importante
para la decisin que se va a tomar.
(2) Validez Predictiva (evidencia externa) - Predicen las puntuaciones del test un
rendimiento o conducta futura? (Junto con la validez concurrente se le denomina tambin
validez emprica del test).
Un uso comn de los tests es predecir la conducta futura; utilizamos el test para
ayudarnos a tomar alguna decisin prctica (seleccin, clasificacin, etc.). En cada una
de estas situaciones, cuanto mayor es la exactitud de prediccin del resultado (es decir
del criterio externo), tanto ms til ser la prueba. Por ejemplo, el test ser un
componente aceptable de un proceso de seleccin de
personal, si sus calificaciones o puntuaciones predicen la ejecucin de algn componente
importante del trabajo (criterio externo); en otras palabras, para que el test se pueda
utilizar como parte de un proceso de seleccin es preciso demostrar la validez de la
prueba relacionndola con los criterios pertinentes. En este sentido, el contenido de la
prueba pasa a tener un lugar secundario, siendo el inters fundamental del psiclogo el
averiguar si el test predice un criterio determinado. 100 Psicometra Para este logro es
necesario que los criterios externos con los cuales se relacionar las puntuaciones del
test sean criterios validos y confiables.
Un criterio es cualquier desempeo que los sujetos tienen en la vida real, por ejemplo, las
medidas de rendimiento acadmico, medidas de rendimiento laboral, clasificaciones
psiquitricas, etctera. En muchos casos resulta imposible hallar un criterio no ambiguo
de un rasgo mental. Por ejemplo, dos psiclogos, Carla y Abel, que investigan el rasgo de
aptitud numrica pueden emplear diferentes criterios externos para correlacionar los
puntajes del test que han creado. As, Carla puede considerar que el criterio externo ms
adecuado son las calificaciones que reciben los sujetos en un curso de mecnica en
taller; mientras que Abel puede considerar como criterio el periodo de tiempo que gastan
los estudiantes en aprender una tarea mecnica y sencilla durante el entrenamiento en
un fabrica. Qu sucede si las pruebas que emplean ambos psiclogos correlacionan
0.006 con uno de los criterios, y 0.70 con el otro?, cmo podemos afirmar que la prueba
es valida cuando arrojan resultados de cierta clase?, se trata en verdad de una prueba
de aptitud mecnica? En razn a situaciones como esta se llego a la conclusin de que la
validacin de un test es un proceso largo y no un hecho aislado. Solamente a travs de
estudios de correlacin con una amplia variedad de criterios podremos comprender que
mide la prueba. As, una serie de investigaciones sobre la prueba de actitud mecnica
nos puede demostrar que en realidad esta midiendo la habilidad para realizar
movimientos fino y cuidadosamente controlados, siendo completamente independiente
para comprender las reacciones complejas de la piezas mecnicas. De esta manera el
test puede tener una alta correlacin con las calificaciones obtenidas en el taller y
ninguna con los trabajos e maquinarias. En el proceso de validacin, la validez predictiva
de un test (y tambin la concurrente) se expresa generalmente por medio de un
coeficiente de correlacin entre los puntajes y los denominados criterios. Este coeficiente
se denomina coeficiente de validacin. La interpretacin de este coeficiente requiere un
dominio excelente del anlisis estadstico utilizado para obtenerlo. Despus del criterio,
los procedimientos estadsticos adquieren vital importancia para obtener esta categora
de validez. Incluso para un mejor anlisis es conveniente contar con el dispersigrama o
scatergrama o nube de Jaime Aliaga 101 puntos (grfica del coeficiente de correlacin
entre las puntuaciones del test X y las del criterio Y).
(3) Validez Concurrente.- Permiten las puntuaciones del test la valoracin de ciertos
hechos presentes? Para estimarla se administra el test y se le correlaciona con el criterio.
La diferencia con la validez predictiva se da en dos aspectos: a) las medidas del test y del
Flix Rodrguez Isidro

Pgina 34

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

criterio son obtenidas contemporneamente, y b) en su uso principal. Respecto a esto


ltimo, se la utiliza principalmente para obtener tests como sustitutos de otros
procedimientos menos convenientes por diversas razones. Ejemplos: un test de
inteligencia colectiva se compara con uno de inteligencia individual. Los diagnsticos de
lesiones cerebrales basados en el test de diseos de bloques (cubos de Kohs) se
comparan con sntomas neurolgicos. El problema principal de este tipo de validez es
encontrar tests que sirvan como criterios vlidos y confiables. Anlogamente a la validez
predictiva requiere un amplio domino de las tcnicas de correlacin y de los
procedimientos estadsticos que se utilizan en su obtencin. Junto con la validez
predictiva es importante en ciertos problemas de psicologa aplicada como en psicologa
clnica, psicologa educacional, psicologa industrial y en general, en la toma de
decisiones que debe hacer el psiclogo en situaciones de seleccin, clasificacin,
hospitalizacin, etc.
(4) Validez de Constructo.- El constructo viene a ser un concepto hipottico que forma
parte de las teoras que intentan explicar la conducta humana: inteligencia, creatividad,
dependencia de campo, etc. La validez de constructo es la obtencin de evidencias que
apoyan que las conductas observadas en un test son (algunos) indicadores del
constructo. Este tipo de validez responde a la
pregunta "cmo se puede explicar psicolgicamente la puntuacin del test?". La
respuesta a esta pregunta puede verse como la elaboracin de una miniteora acerca
de una prueba psicolgica. La lgica de la validez de constructo en muchos aspectos as
como en sus mtodos, es esencialmente la del mtodo cientfico. El proceso de
validacin de constructo implica a partir del
establecimiento de deducciones de la teora:
a) Formular hiptesis y relaciones entre elementos del constructo, de ste con otros
constructos de la teora y con otros constructos externos. 102 Psicometra
b) Seleccionar temes o tests (indicadores) que representen manifestaciones concretas
del constructo.
c) Recogida de datos.
d)Establecer consistencia entre datos e hiptesis, y examinar el grado en que los datos
podran explicarse mediante hiptesis alternativas.
Hay diversos procedimientos para establecer la validez de constructo. Si elaboramos una
miniteora esta tendr tres pasos: (1) en base a la teora sostenida en ese momento
respecto del test, el psiclogo deduce ciertas hiptesis sobre la conducta esperada de las
personas que obtienen puntajes diferentes en el test, (2) se rene datos que confirman o
no esas hiptesis, (3) en base a los datos acumulados, se toma la decisin relativa a si la
teora explica adecuadamente los datos. Si no es as se tiene que revisar la teora y
repetir el proceso hasta lograr una explicacin ms adecuada. El proceso de validacin,
en ese sentido, es de continua reformulacin y refinamiento.
Al determinar la validez de construccin, el propsito es identificar todos los factores que
influyen en la ejecucin del test y determinar el grado que influyen cada uno de ellos.
Ejemplo: Un psiclogo construye un test de ansiedad y elabora una microteora cuya
contrastacin le dir si el test tiene validez de constructo. Las hiptesis a verificar son las
siguientes:
1. Los que obtienen puntuaciones elevadas acabarn probablemente en clnicas
psiquitricas en comparacin con aquellos de puntuaciones ms bajas.
2. Ser ms fcil que les receten drogas psicotrpicas a los que tienen altas
puntuaciones que a los de bajos puntajes.
3. Los hijos de los de puntuaciones altas tendrn mayores probabilidades de tener una
puntuacin alta en el test que los hijos de quienes tuvieron puntuaciones bajas.
4. El test de ansiedad se correlacionar alta y significativamente (ms all de 0.60) con
otros test de ansiedad.
5. El test de ansiedad no se correlacionar con variables que no resulten conexas con la
misma.
6. Los grupos psiquitricos caracterizados como ansiosos alcanzarn en el test unas
puntuaciones ms altas que los del grupo control. Jaime Aliaga 103
Flix Rodrguez Isidro

Pgina 35

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

7. En el test de ansiedad, los sujetos evaluados por supervisores y colegas como


ansiosos, lograrn mayores puntuaciones que quienes estn considerados como no
ansiosos (Kline, 1985).
Los resultados de los estudios que hagamos realmente no validan o prueban la teora
completa, puesto que nunca se puede demostrar una construccin en forma absoluta;
solamente se puede aceptar como la mejor definicin de trabajo. Si los resultados son
negativos, hay por lo menos tres interpretaciones posibles: a) la prueba puede no medir
el constructo, b) el marco terico puede ser errneo, permitiendo que se hicieran
inferencias incorrectas, o bien
c) quiz, el diseo del experimento no permita una prueba apropiada de la hiptesis. La
falla del diseo suele ser la falla ms fcil de detectar, pero no siempre se puede hallar
con facilidad el lugar exacto de la falla. La interpretacin ambigua de los resultados
negativos es un inconveniente evidente del procedimiento de validacin de los
constructos (Crombach, 1972; Kline, 1985).
e) Implicaciones prcticas en la validacin de un test. El psiclogo que utiliza un test debe
tener en cuenta lo siguiente: a) antes de tomar de decisiones sobre individuos o grupos,
debe acumular toda la informacin disponible acerca del test; b) para la prediccin o
seleccin, el test debe estar validado en la situacin especfica donde se va utilizar; c) en
cualquier situacin, el psiclogo debe tener presente que nuestras ideas sobre la
naturaleza de los rasgos y sobre todo lo que miden se modifica constantemente con
nueva informacin hacer
MTODOS EMPLEADOS PARA ESTIMAR LA VALIDEZ
DE CONSTRUCCIN
a) Mtodos intrapruebas, cuyas fuentes de evidencia ms usadas son: la validez de
contenido de la prueba, el anlisis de los procesos psicolgicos empleados al responderla
(p. e., pidiendo que los sujetos razonen en voz alta sus respuestas). Otras tcnicas
estudian la estructura interna de la prueba, mediante el anlisis de los temes y las
correlaciones entre los diferentes subtests; asimismo, tambin mediante el
establecimiento de la homogeneidad a travs del coeficiente alfa de Cronbach o los
coeficientes de Kuder-Richardson (que contribuyen a evaluar la unidimensionalidad del
test).
b) Mtodos interpruebas: Utilizan las tcnicas del anlisis factorial (para evaluar los
factores que subyacen en las intercorrelaciones de las 104 Psicometra pruebas
estudiadas), la validez congruente (en tanto correlaciona los puntajes de la prueba con
los puntajes obtenidos en otra prueba de validez ya establecida), los estudios de validez
convergente y divergentediscriminante
(propuestos por Campbell).
c) El mtodo de los estudios relacionados con los criterios: Que implican la diferenciacin
de grupos (evaluando la capacidad de la prueba para poder diferenciar dos o ms grupos
naturalmente separados o diseados experimentalmente) y los coeficientes de validez
(cuando la prueba es aplicada a un grupo de sujetos en los que se estudian criterios
relacionados con el constructo terico estudiado).
d) El mtodo de la manipulacin experimental: Se manipula experimentalmente una
variable y se observa sus efectos sobre los puntajes de una prueba psicolgica o la
relacin de estos puntajes con algn criterio.
e) El mtodo de los estudios de la capacidad de generalizacin: Estos estudios analizan
sistemticamente la prueba psicolgica en una amplia gama de dimensiones o en
condiciones diferentes de administracin (p. e., la matriz multirasgo-multimtodo
propuesta por Campbell y Fiske).
Teora de respuesta al tem (TRI)
Llamada tambin Teora del Rasgo Latente, es un modelo probabilstico que permite
conocer la informacin proporcionada por cada tem, y as crear tests individualizados, es
decir, a medida. Es un modelo complejo que se ha popularizado como modelo de Rasch
(1980) (aunque especficamente el modelo de Rasch es un parmetro de la dificultad del
tem), pero existe tambin el modelo de dos parmetros, que tiene en cuenta tambin la
discriminacin o pendiente de la curva, y el de tres parmetros que tiene en cuenta el
Flix Rodrguez Isidro

Pgina 36

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

factor azar en la respuesta a temes de alternativas mltiples (Cortada de Kohan, 1999).


La diferencia principal entre el modelo de la Teora Clsica de los Test y este modelo es
que la relacin entre el puntaje observado y el rasgo o la aptitud en la teora clsica es de
tipo lineal (PD = PV + e: puntaje directo del sujeto es igual a su puntaje verdadero ms el
error); mientras que en los diversos modelos de la TRI las relaciones son funciones de
tipo exponencial, principalmente logsticos. Los postulados bsicos de la TRI son:
1) El resultado de un examinado en un tem puede ser explicado por un conjunto de
factores llamados rasgos o aptitudes simbolizados por q.
Jaime Aliaga 105
2) La relacin entre la respuesta a un tem y el rasgo latente se describe como una
funcin monotnica creciente que es la curva caracterstica del tem.
3) En la TRI los parmetros de aptitud y de los temes soninvariantes.
Los supuestos de la TRI son:
1) La unidimensionalidad del rasgo latente, es decir, que los temes de un test deben
medir una sola aptitud o rasgo; y
2) La independencia, es decir, que las respuestas de un examinado a cualquier par de
temes son independientes. Para estimar los parmetros de la TRI se usa el mtodo de
mxima verosimilitud, que es un proceso complejo que se logra con los softwares
apropiados como BILOG, BICAL, y otros. (Cortada de
Kohan, 1998).
CONCLUSIONES
1) La psicometra es una disciplina de la psicologa cuya finalidad intrnseca es la de
aportar soluciones al problema de la medida en cualquier proceso de investigacin
psicolgica; constituye, por ello, un campo metodolgico que incluye teoras, mtodos y
usos de la medicin psicolgica, tanto a nivel terico como a nivel prctico.
2) En psicologa, medir es dar la magnitud de cierta propiedad o atributo, por ejemplo, la
inteligencia, la extraversin, el razonamiento verbal, de una o ms personas, con ayuda
del sistema numrico.
3) El test psicomtrico es un procedimiento estandarizado compuesto por temes
seleccionados y organizados, concebidos para provocar en el individuo ciertas reacciones
registrables; reacciones de toda naturaleza en cuanto a su complejidad, duracin, forma,
expresin y significado.
4) Los requisitos de un test psicomtrico son: Construccin del test; la situacin de
aplicacin del test; el registro del comportamiento provocado en el sujeto examinado, que
debe ser preciso y objetivo; el comportamiento registrado evaluado estadsticamente con
respecto a un grupo de individuos denominado
grupo de referencia o grupo normativo; clasificacin de los sujetos examinados en funcin
de normas resultantes del examen previo del grupo de referencia o normativo (baremo),
lo que permite situar cada 106 Psicometra una de las respuestas, en una distribucin
estadstica (contraste);.las respuestas a las cuestiones planteadas deben dar una medida
correcta del comportamiento al que el test apunta (validez); y por ltimo, la repeticin del
examen debe conducir siempre al mismo resultado (fiabilidad).
5) La estandarizacin es el proceso mediante el cual se establecen procedimientos
unvocos para la aplicacin, calificacin e interpretacin de un test psicomtrico.
6) La interpretacin de los puntajes de un test psicomtrico estandarizado se refiere al
significado que se les da a los puntajes obtenidos por un grupo de sujetos, al compararlos
con una tabla de normas o baremo, estableciendo una clasificacin de acuerdo a la
conversin de sus puntajes directos en puntajes percentiles, eneatipos o decatipos.
7) Los tests psicomtricos se clasifican por lo siguiente: Por su forma de dar las
instrucciones; por su forma de administracin; por la forma o tipo de respuesta que
exigen; por el material de la prueba; por su forma de calificacin; por sus edades lmites
de aplicacin; y por su libertad de ejecucin. En los test psicomtricos utilizados en
educacin existe actualmente un tipo de tests denominado test relacionado con el criterio.
8) El test psicomtrico es empleado como instrumento auxiliar para una mejor toma de
decisiones: En la seleccin, clasificacin, diagnstico, investigacin, y evaluacin de un
determinado grupo de personas.
Flix Rodrguez Isidro

Pgina 37

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

9) Entre las limitaciones en el uso de un test psicomtrico tenemos: Una prueba o test
slo puede medir aquellos aspectos para los que ha sido construido; las normas (baremo)
de una prueba no tienen validez universal; si las condiciones que influyen sobre el
individuo se modifican, existe la posibilidad de que tales cambios durante la aplicacin de
la prueba influyan en los puntajes resultantes
del test; los resultados de un test no deben emplearse para diagnosticar per se estados
patolgicos;.y, finalmente, las categoras descriptivas (inteligencia muy superior, superior,
etc.) slo deben utilizarse para los tests cuyos puntajes le dieron origen.
10) Un test psicomtrico tiene generalmente las siguientes secciones o partes: El test
propiamente dicho, y el manual del test.
11) Entre las cualidades que debe tener un test psicomtrico, hay que tener en cuenta: la
confiabilidad, que puede estimarse a Jaime Aliaga 107
travs de dos procedimientos: el coeficiente de confiabilidad y el error estndar de
medida (EEM); y la validez, que es el grado en que una prueba mide lo que intenta medir.
12) La validez cientfica de un test la da la validez de constructo. La tendencia ya no es
hablar de tipo de validez, sino de categoras de validez en la que la validez de contenido,
validez predictiva, validez concurrente y validez de constructo reconstituyen en
estrategias de validacin.
13) La teora de respuesta al tem (TRI), denominada tambin Teora del Rasgo Latente,
es un modelo probabilstico que permite conocer la informacin proporcionada por cada
tem, y as crear tests individualizados, es decir, a medida. Los supuestos de la TRI son:
la unidimensionalidad del rasgo latente; y la independencia, es decir, que las respuestas
de un examinado a cualquier par de temes son independientes.

Flix Rodrguez Isidro

Pgina 38

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

Actividad 10 y 11
MEDICION Y EVALUACION
Medicin: medida interpretada que es implcita a la medicin de un test.
Objetiva: mtodo y procedimiento en la administracin de un instrumento sin influencia
de factor externo; que al ser repetida en igualdad de circunstancias los resultados deben
ser iguales.
Tipificada: debe ser aplicable a una poblacin diferenciada por ciertas caractersticas.
Muestra de conducta : es muestra ya que ningn tipo de comportamiento es posible de
medir completamente, lo que hacemos es aproximarnos a su medicin a travs de una
muestra.
MEDICIN: Consiste en reglas para asignar smbolos a objetos de manera que:
1. Representen numricamente cantidades de atributos (escalas de medida).
2. Definan si los objetos caen en las mismas categoras o en diferentes con respecto a un
atributo determinado (clasificacin).
Tanto las escalas de medicin como la clasificacin implican la formulacin y evaluacin
de reglas. Estas reglas son usadas para medir atributos de los objetos, por lo general,
pero no de manera exclusiva, sino tambin de personas. Es importante recordar que
podemos medir slo atributos de los objetos, no a los objetos mismos. Entre las
caractersticas de las buenas reglas estn la receptibilidad (confiabilidad) y de modo ms
importante, la validez en los sentidos que se describan. La estandarizacin es un objetivo
importante de la medicin debido a que facilita la objetividad, cuantificacin,
comunicacin, economa y generalizacin cientfica.
La medicin usa matemticas, pero las dos sirven a papeles separados. La medicin
necesita relacionarse con el mundo fsico, pero las matemticas puras slo se ocupan de
la consistencia lgica. Un aspecto tradicionalmente importante, pero controvertido de las
escales de medicin, es que estas por lo general caen en uno de cuatro niveles (han sido
sugeridos otros); nominal, ordinal, de intervalos y de razn. Estos cuatro niveles
representan de manera progresiva reglas mejor articuladas, por ejemplo, las escalas
nominales tan slo definen si dos (2) objetos son equivalentes o no, entre s, con
respecto a un atributo crtico, pero las escalas ordinales determinan si un objeto que no
es equivalente a otro es mayor o menor que el otro; son posibles resultados ms
consistentes con niveles superiores de medicin. El concepto de invarianza es bsico
para estos niveles de medicin, el cual tiene que ver con lo que permanece igual cuando
se realizan cambios permisibles en la escala. Las escalas de niveles superiores estn
ms restringidas en cuanto a la manera en que pueden ser transformadas y an
conservar invarianzas claves.
ESCALAS DE MEDICIN.
Stevens propuso que las mediciones entran en cuatro (4) clases principales de escala de
medicin (nominal, ordinal, de intervalo y de razn), las cuales permitieron que se
ejecutaran en las medidas, procedimientos cuantitativos cada vez ms complicados, pero
a su vez demandaron cada vez ms de las operaciones de medicin.
Escalas de Medicin:
* Nominal: contiene reglas para decidir si dos (2) objetos son equivalentes o no para una
categorizacin. El resultado de una escala nominal, es una serie de clases, a las cuales
podra darse una designacin numrica. Es importante distinguir entre usar categoras
"Nombres" lo cual es impropio y la categora "Frecuencias" la cual es bastante apropiada.
* Ordinal: contiene reglas para decidir si un objeto es diferente a otro es mayor o menor
con respecto a un atributo determinado.
* De Intervalo: relfejan operaciones que definen una unidad de medicin; as como
mayor, igual o menor.
* De Razn: es una escala de intervalo con un cero (0) racional (verdadero), en lugar de
un cero (0) arbitrario. Un cero (0) racional significa la ausencia del atributo y no
simplemente razonable.

Flix Rodrguez Isidro

Pgina 39

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

AREAS DE APLICACIN DE LOS TEST PSICOMTRICOS:


Dentro de las reas aplicadas de la psicologa el uso de test es fundamental en las
siguientes:

PSICOLOGA CLNICA: quizs la ms popularmente relacionada con el uso de tests, ya


sea para la prctica privada o institucional, los tests le permiten al clnico tener una
mayor cantidad de informacin del individuo en un menor tiempo as como acceder a
elementos dificilmente alcanzables por otros mtodos, as como tambin
proporcionan un paneo con respecto a la forma de funcionamiento predominante en
el paciente en determinadas reas lo que cotribuye tanto al proceso de diagnstico y
despistaje, como al momento de planificar determinada intervencin, remisin a otros
profesionales o incluso al inicio de un proceso de psicoterapia.

PSICOLOGA EDUCATIVA Y ORIENTACIN VOCACIONAL : en esta rea permite evaluar de


una forma estandarizada, relativamente sencilla y muy enriquecedora, los procesos
de nios, adolescentes o adultos relacionados con el aprendizaje y las posibles
dificultades que se puedan presentar en ste, tambin es fundamental en las
asesoras de eleccin vocacional, pues permiten visualizar las capacidades, aptitudes
y preferencias que la persona posee pero que realmente no es capaz an de
identificar y de eleborar por s mismo.

PSICOLOGA ORGANIZACIONAL Y LABORAL: al igual que en las reas anteriores, permite


acceder a una gran cantidad de informacin en un tiempo mnimo, permite despistar
trastornos mentales mayores, identificar actitudes, potencialidades y debilidades y
aplicar este perfil en el proceso de seleccin de personal para un cargo determinado.
COMPONENTES DE LOS TEST
MANUAL TCNICO DE DESCRIPTORES DEL TEST

Descripcin del test (para qu sirve?, autor, ao de publicacin, cmo se


comercializa).

Desarrollo de las escalas (qu pasos sigui para elaborar los tems, tareas, qu
modificaciones se han dado, criterios seguidos paras las modificaciones)

Proceso de adaptacin espaola del test..

Justificacin estadstica (tratamiento de los datos, fiabilidad, validez, estudios


comparativos, grupos normativos especiales, estudios transculturales).

Normas de interpretacin (parmetros de cmo valorar cada una de las


puntuaciones que se han obtenido).

Otros (bibliografa).

Tablas de los normativos (estudios de estandarizacin).


A. Estimacin de las capacidades intelectuales de una persona.
B. Adaptacin de un test en otra lengua a la espaola (cmo se han superado los sesgos
culturales p.e. en los subtest de informacin)
C. Datos estadsticos de las caractersticas de la muestra con la que se ha hecho la
estandarizacin (p.e. edad, sexo, nivel educativo) en el WAIS p.e. hay datos de varias
edades.
MANUAL DE APLICACIN Y CORRECCIN (cmo se administran cada una de las
tareas):

mbito de aplicacin (lugar)

Cualificacin del examinador (condiciones psicolgica en individuales, si tiene


dificultad para comprender o algn problema sensorial).

Procedimiento normalizado (reglas, instrucciones, etc.)

Tiempo de aplicacin (para cada subtest, tiempo mnimo esperado en el WAIS


hora y media).

Condiciones ambientales.

Tablas y baremos de correccin y ajustes estadsticos (inicialmente aparecen


diferenciados para cada subgrupo de edad)

Obtencin de puntuaciones tpicas, escalares y CI/ndices.


Cuadernillo/hoja de respuestas, pueden estar o no, Materiales de administracin para
cada test, Plantilla de correccin: manual o informatizada.
Flix Rodrguez Isidro

Pgina 40

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

TIPOS DE PRUEBAS
A.- DE INTELIGENCIA
TEST DE AMPLITUD: Miden el conocimiento y/o el rendimiento. Pueden valorar la
memoria, precisin, destreza, atencin, sentido de la organizacin, agilidad manual y
mental.
-MATRICES DE RAVEN:
Orientados a la valoracin de la inteligencia concreta, nivel de observacin y organizacin
lgica.
Consiste en descubrir qu figura corresponde al cuadro en blanco de los otros que
aparecen en la parte inferior. Las figuras pueden ser abstractas u objetos que mantienen
un orden lgico. Interesan la identificacin y la diferenciacin de formas.
Son ejercicios en orden de dificultad creciente. El tiempo est limitado, con lo cual hay
que evitar estancarse en un ejercicio.
-FICHAS DE DOMIN: Miden la abstraccin lgica.
-TEST DE RAZONAMIENTO: Miden las facultades de adaptacin: agilidad mental,
resolucin de problemas, etc...
-TEST DE COMPRENSIN VERBAL: Miden la comprensin de ideas, facultad de
anlisis y sntesis.
B.- DE PERSONALIDAD
-TEST DE RORSCHACH: Analiza
comportamiento.

las

dimensiones

intelectual,

afectiva

y de

-TEST DE APERCEPCIN TEMTICA: Evala los factores y necesidades de la conducta


y de las motivaciones, valorando las emociones y estados internos.
-TEST DE RBOL: Revela a la persona en la vida interior y el desarrollo afectivo.
En definitiva en un prueba psicotcnica nos podemos encontrar los siguientes puntos:
Test de informacin: Evalan cuestiones relacionadas con el vocabulario, fluidez verbal y
significado de las palabras.
Problemas aritmticos: Intentan medir la capacidad para resolver problemas aritmticos y
matemticos mediante ejercicios relacionados con nmeros.
Series numricas: Estos ejercicios prueban la capacidad para resolver problemas
aritmticos y matemticos, convirtindose en una buena forma de medir el razonamiento
inductivo o razonamiento abstracto. Las series numricas pueden presentarse de forma
que el individuo complete los nmeros que faltan o bien se les da a elegir el nmero
siguiente entre varias alternativas posibles.
Series alfabticas: Del mismo modo que con las series numricas, se pretende medir
tambin el razonamiento abstracto.
Problemas de razonamiento no verbal: Son test que se han creado con figuras o
smbolos para medir la inteligencia general o el razonamiento abstracto.
Ejercicios de visualizacin: Evalan la capacidad para captar relaciones espaciales. Es
importante para aquellas personas que deben manejar objetos, mquinas, planos, etc.
Flix Rodrguez Isidro

Pgina 41

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

Test de capacidad mecnica: Tienen como finalidad identificar a aquellos individuos con
aptitudes para trabajos de carcter mecnico y trabajos de mantenimiento.
Test de personalidad: Tratan de buscar rasgos de carcter, acordes con el perfil del
puesto: introvertido o extrovertido, dinmico o pasivo, optimista o pesimista, con iniciativa
o sumiso, impulsivo o moderado, etc.
Test de aptitudes administrativas: Sirven para medir la capacidad de percepcin, rapidez
de lectura, de precisin en actividades especficas, clculo aritmtico, comprobacin de
datos, ortografa, archivo, comprobacin de errores, etc.
Pruebas psicomtricas y proyectivas:
CLEAVER
Prueba que describe el perfil laboral de cada candidato. Describe el comportamiento y
habilidades del personal en la organizacin, apoyando los programas de Planeacin de
Recursos Humanos, mejorando la comunicacin y el desempeo en el trabajo
AUTODESCRIPCION DEL CANDIDATO
Describe en trminos de comportamiento, la percepcin que el individuo tiene de s
mismo, con relacin al puesto que desempea, clarificando las diferencias existentes
entre el puesto y el ocupante del mismo.
RASGOS A MEDIR EN CADA CANDIDATO:
* COMPORTAMIENTO DIARIO
COMPORTAMIENTO BAJO PRESIN
INDICADORES DE MOTIVACIN
TERMAN MERRIL
Prueba para la medicin del Coeficiente Intelectual I.Q., conocimientos generales,
comprensin, anlisis y sntesis, razonamiento, aritmtica, juicio prctico, sentido comn
y capacidad de deduccin.
Proporciona una medida de la inteligencia para examinados adultos, esta orientado para
personas de nivel escolar bachillerato o superior.
INVENTARIO MULTIFASICO DE LA PERSONALIDAD MMPI- ESPAOL
Prueba de personalidad conocida tambin como MINESOTA, consta de 566 preguntas y
est enfocada a la seleccin de personal, sin embargo la grfica que se obtiene, se
puede usar para un anlisis ms profundo o clnico.
Describe de manera textual las siguientes caractersticas: Hipocondriasis, Depresin,
Histeria, Personalidad psicoptica, Masculinidad-Feminidad, Paranoia, ObsesivoCompulsivo, Esquizofrenia, Mana, Introversin Social, Capacidad de Autocrtica,
Capacidad de Liderazgo, Actitud de Servicio, Capacidad para trabajar bajo presin,
Capacidad para trabajar en equipo, Sentido de la realidad, Metas y logros, Meticulosidad
y Detallismo.
BARSIT
Determina rpidamente el nivel de inteligencia o aptitud para aprender. - Compara la
composicin de grupos, selecciona previamente casos excepcionales. - Adaptabilidad del
sujeto.
HTP: (sigla que proviene de House, Three, person)
El test de la casa/rbol/persona es un test proyectivo basado en la tcnica grfica del
dibujo, a travs del cual podemos realizar una evaluacin global de la personalidad de la
persona, su estado de nimo, emocional, etc. La realizacin de dibujos es una forma de
Flix Rodrguez Isidro

Pgina 42

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

lenguaje simblico que ayuda a expresar de manera bastante inconsciente los rasgos
ms ntimos de nuestra personalidad.
IPV (Inventario de la Personalidad del Vendedor )
Proporciona la medida de la Disposicin General para la Venta (DGV) del candidato en
dos dimensiones amplias las cuales son Receptividad y Agresividad.
KOSTICK:
El Inventario de Preferencias y Percepciones de Kostick es un instrumento diseado para
ayudar a comprender los estilos administrativos de las personas, que permite evaluar a
los candidatos a un puesto y a descubrir gente de xito en las organizaciones.
MACHOVER:
Prueba proyectiva mediante la cual se evala maduracin, organicidad y cuadros
patolgicos.
La personalidad se desarrolla a travs del movimiento, sentimiento y pensamiento de un
cuerpo especfico.
Los mtodos proyectivos han puesto repetidamente determinantes profundos y quizs
inconscientes, de expresin propia, los cuales no podran manifestarse en comunicacin
directa.
Toda actividad creadora lleva el sello especfico de conflicto y necesidades que presionan
sobre el individuo que est creando. La actividad despertada como respuesta a "Dibuje
una persona", es en verdad una experiencia creadora. El dibujo de la figura humana
indica una unin entre la figura y la personalidad del individuo que la realiza.
ZAVIC
Prueba para evaluar los valores e intereses de los individuos: Consta de 20 preguntas
con cuatro opciones cada una, se divide en dos reas : Valores : Moral, Legalidad,
Indiferencia y Corrupcin Intereses : Economico, Politico, Social y Religioso.
Otras....
1.Actividades Instrumentales De La Vida Diaria
2.Audit(alcohol Use Disorders Identification)
3. Barber - Encuesta Deteccion De Ancianos Con Riesgo
4. Barnes Para Evaluacion De Acatisia
5. Bender Koppitz Escala De Maduracion Neuro Motriz
6. Bprs - Escala Breve De Evaluacion Psiquiatrica
7. Cage
8. Clasificacion Rorschach
9. Componentes Obsesivo - Compulsivos De La Bebida
10 Coopersmith
11 Criterios De Ingreso Por Riesgo De Suicidio
12 Cuestionario Apgar Familiar
13 Cuestionario Apoyo Social Funcional
14 Cuestionario De 90 Sintomas - Scl - 90 - R 15 Cuestionario De Actitudes Ante La Alimentacin , Eat - 40 16 Cuestionario De Actitudes Ante La Allimentacin , Eat - 26 17 Cuestionario De Actividad Funcional De Pfeffer
18 Cuestionario De Afrontamiento Del Dolor
19 Cuestionario De Apoyo Social De Sarans
20 Cuestionario De Cambios Vitales Recientes
21 Cuestionario De Dolor De Mcgill
22 Cuestionario De Estado Mental Portatil
23 Cuestionario De Estres Percibido De Leve
24 Cuestionario De Experiencia Traumatica
25 Cuestionario De Miedos
26 Cuestionario De Salud General De Gold
Flix Rodrguez Isidro

Pgina 43

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

Actividad 12 AL 15
ESTADISTICAS QUE SE UTILIZAN PARA LAS MEDICIONES
PSICOLOGICAS
TRATAMIENTO ESTADISTICO
DISTRIBUCION DE FRECUENCIAS LA DISPERSION
LA MEDIANA ( Me )
Dada una distribucin de frecuencias con los valores ordenados de menor a mayor,
llamamos mediana y la representamos por Me, al valor de la variable, que deja a su
izquierda el mismo nmero de frecuencias que a su derecha.
LA MEDIA ARITMTICA ( X )
La media aritmtica o simplemente media, que denotaremos por X , es el nmero
obtenido al dividir la suma de todos los valores de la variable entre el nmero total de
observaciones.
LA DESVIACIN ESTNDAR:
En rigor, esta medida de dispersin es utilizada con ms frecuencia por los estadsticos.
Supongamos las observaciones x1, .., xi, .., xn, entonces la desviacin estndar S se
define como

Observemos como antes que esta desviacin estndar tiene la misma unidad que las
observaciones. En rigor es un promedio de las diferencias cuadrticas de las
observaciones respecto de la media. El cuadrado permite eliminar los signos negativos,
de modo que no se anulen diferencias simtricas en torno de la media.
PERCENTILES (PI)
Son los valores que dividen a la distribucin en 100 partes iguales, cada una de las
cuales engloba el 1 % de las observaciones. En total habr 99 Percentiles. (Q2 = D5 =
Me = P50)
COEFICIENTE DE CORRELACIN
Un coeficiente de correlacin se dice que es significativo si se puede afirmar, con una
cierta probabilidad, que es diferente de cero. Ms estrictamente, en trminos estadsticos,
preguntarse por la significacin de un cierto coeficiente de correlacin no es otra cosa
que preguntarse por la probabilidad de que tal coeficiente proceda de una poblacin
cuyo valor sea de cero. A este respecto, como siempre, tendremos dos hiptesis
posibles.
TRANSFORMACION DE PUNTAJES DIRECTOS A PUNTUACIONES ESTANDAR
Esta tcnica es la ms conocida y utilizada en el marco de la TCT, al punto que muchos
usuarios asumen que es la nica existente para estimar la Puntuacin Verdadera. Se trata de
un procedimiento ampliamente recomendado por muchos autores (e.g. Allen & Yen, 1979;
Anastasi & Urbina, 1998; Felt & Brennan, 1989; Gulliksen, 1950) que consiste en utilizar el
EEM para construir un intervalo de confianza en torno a la Puntuacin Observada.
Tericamente, el procedimiento se fundamenta en asumir que los errores de medida se
distribuyen normalmente. Bajo este supuesto es posible utilizar el EEM para construir un
intervalo de confianza para la Puntuacin Verdadera, en torno a la Puntuacin Observada.
Sin profundizar en la derivacin de la frmula (para tal efecto ver, por ejemplo, Muiz, 2001),
las ecuaciones para el lmite inferior y superior del intervalo de confianza corresponden a:

Flix Rodrguez Isidro

Pgina 44

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

En ambas ecuaciones, x es la Puntuacin Observada de un sujeto y Z representa el valor de


la distribucin normal asociado a la magnitud del intervalo de confianza que se desea
construir. La prctica convencional es construir un intervalo no direccional de un 95% de
confianza, al que corresponde un valor Z = 1.96. Para ilustrar la aplicacin del mtodo,
supongamos que una persona obtiene 55 puntos en el test de autoestima, cuyo error
estndar de medida calculamos en el apartado anterior (EEM = 4.47). Cul ser su
Puntuacin Verdadera en el test? Aplicando las ecuaciones (6a) y (6b) para determinar los
lmites inferior y superior del intervalo de confianza al 95% (Z = 1.96), concluimos que Z
(EEM) = 8.76 y, por tanto, que la Puntuacin Verdadera se encontrar entre 46.2 y 63.8
puntos en el test. Puede observarse que, aun cuando las puntuaciones arrojadas por el test
parecen fiables, el intervalo de confianza que contiene a la Puntuacin Verdadera, con un
95% de confianza, es bastante amplio (17.6 puntos de magnitud).
La interpretacin del intervalo de confianza construido con la metodologa tradicional no es
fcil. Allen & Yen (1979) lo explican de la siguiente manera. Si una persona, que obtuvo un
Puntaje Observado X en el test, fuera evaluada infinitas veces con la misma medida y
construyramos un intervalo de confianza de un 95% despus de cada ocasin, en el 95%
de las veces el intervalo incluira la Puntuacin Verdadera de la persona. Cuando existe slo
un intervalo, hay un 95% de confianza de que ste incluya la Puntuacin Verdadera. En
forma alternativa, se puede imaginar que un gran nmero de personas fueron evaluadas y
se obtuvo un intervalo de confianza para cada una, centrado en la Puntacin Observada para
cada examinado. El 95% de esos intervalos debera incluir la Puntuacin Verdadera del
sujeto.
Cociente Intelectual (CI). Indicador del nivel de inteligencia utilizado en las primeras
pruebas psicomtricas y que se calculaba mediante la divisin de Edad Mental (calculada
por el test) y Edad Cronolgica (edad real del Sujeto) multiplicada por 100. Un valor de
100 (igual edad mental y edad cronolgica) indica normalidad, mientras que por debajo
indica retardo y por encima aceleracin.
Cociente Intelectual de Desviacin (CI Desviacin). Sustituto del Cociente Intelectual
original se desarroll por las diferencias existentes en la varianza de las puntuaciones del
Cociente Intelectual en los diferentes niveles de edad, que dificultaban la interpretacin
de los resultados. Es en realidad una transformacin que tiene una media de 100 y una
desviacin tpica de 15.
Coeficiente de Correlacin. Medida del grado de asociacin que existe entre dos
conjuntos de medidas realizadas en el mismo grupo de individuos. El ms conocido y
utilizado con Pruebas Psicomtricas es Producto Momento de Pearson, aunque existen
otros como correlacin por rangos, biserial, tetracrico, etc. Tiene un recorrido entre
+1.00 y 1.00 (asociacin perfecta positiva o negativa), pasando por 0.00 (ausencia de
relacin entre ambas medidas). La correlacin indica solamente asociacin entre
variables, no relaciones causales.
Competencias. Caractersticas de las personas directamente relacionadas con el
desempeo exitoso de un trabajo o una actividad. Incluyen conocimientos,
habilidades, disposiciones afectivas, rasgos fsicos y conductas de carcter
relativamente estables que se pueden aplicar a diferentes situaciones y tipos
de trabajo o tareas.
Confiabilidad. El grado en que un test es consistente al medir la variable que mide.
Algunas palabras asociadas con la Confiabilidad son estabilidad, exactitud, consistencia y
precisin, as como el Error Estndar de Medida. La Confiabilidad se expresa usualmente
mediante coeficientes de correlacin, obtenidos a partir de los puntajes en dos
aplicaciones de la misma prueba al mismo grupo de Sujetos o haciendo uso de pruebas
paralelas aplicadas al mismo grupo de sujetos. Tambin se define como Consistencia
Interna, que se obtiene mediante la determinacin de las intercorrelaciones o
Covarianzas de los tems.
Construccin de pruebas, fases de la. Las pruebas psicomtricas se construyen
mediante un cuidadoso proceso, que garantiza la calidad de las mismas. Tavella identifica
varias fases: 1) Preparatoria, en la que se define (terica y operacionalmente) la variable
a explorar, se establecen las especificaciones del instrumento, se elaboran los tems, se
depuran cualitativamente mediante el juicio de expertos, se elaboran instrucciones y se
Flix Rodrguez Isidro

Pgina 45

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

estructura el instrumento. 2) Exploratoria, en la cual se aplica a una muestra informal de


sujetos de la misma poblacin a la cual va dirigida, se realiza anlisis de tems para
determinar su calidad y se depura el instrumento. 3) Experimental, en la cual se aplica el
instrumento ya depurado en la fase anterior a muestras formales de sujetos, hasta
conocer mejor el instrumento, elaborar estudios de validez y confiabilidad y normas. 4)
Definitiva, en la cual ya se considera que el instrumento est listo para su uso en grupos
extensos de la poblacin, as como para la realizacin de estudios normativos a gran
escala.
Constructo. Las variables psicolgicas no son observables directamente, por lo que se
infieren a travs de la observacin de la conducta de las personas, y se plantean en
trminos tericos. Son inventados y adoptados en forma deliberada y consciente por la
comunidad cientfica, es decir, construidos por los investigadores y tericos de la
psicologa.
Correccin (puntuacin) de Pruebas. Es la asignacin de puntajes a las respuestas
dadas por un sujeto a las preguntas de una prueba. La mayora de las veces se realiza
mediante la asignacin de un punto por cada respuesta correcta (tems binarios), es
decir, que coincida con la clave de respuestas (ver Clave de Correccin), aunque tambin
son posibles otras formas de correccin, como restar a las respuestas correctas una
proporcin de las incorrectas. Consulte tambin Puntaje Directo o Puntaje Bruto.
Correccin de Puntajes por Azar. Los tems de opciones mltiples permiten responder
al azar y alcanzar un cierto nmero de aciertos, es decir, permiten la adivinacin de las
respuestas. Por ejemplo, en una prueba de 40 tems de cuatro opciones, la probabilidad
de marcar la respuesta correcta por azar es de 25%, lo que permite establecer una media
de puntajes por azar de 10 puntos y una desviacin tpica de 2,73 (en una distribucin
binomial, la media es 0,25x40= 8 puntos y la desviacin tpica raz de 0,25X0,75x40=
2,73). Por ello se han propuesto formas de correccin por puntajes por azar. La ms
comn es la siguiente, en donde Xc es puntaje corregido, C es el nmero de respuestas
correctas, I es el nmero de incorrectas y k es el nmero de opciones. Estas frmulas
asumen que toda respuesta incorrecta es una respuesta al azar; lo usual es que se le
recomiende al Sujeto, que se abstenga de dar respuestas en las que no est
completamente seguro y se le advierta sobre el uso de la frmula de correccin.
Correlacin Mltiple. La correlacin que se establece entre una variable predicha y
varias variables predictoras en contraste con la Correlacin simple. Por ejemplo, el
rendimiento universitario (Criterio) que se predice haciendo uso de los resultados en
varios tests (variables predictoras). La Correlacin Mltiple tiene especial aplicacin en
las Ecuaciones de Regresin Mltiple, que permiten establecer una recta de regresin
que incluye varias variables predictoras de la forma siguiente (en donde K es una
constante, nXn es la ponderacin que se le da a cada una de las variables predictoras):
Correlacin simple. Relacin que se establece entre una variable predictora (o
independiente) y una variable predicha (o Criterio). Es el modelo ms sencillo de
correlacin. Vase Correlacin Producto Momento de Pearson.
Correlacin producto momento de Pearson. Coeficiente de correlacin que permite
establecer el grado de asociacin entre dos variables continuas. Dado que se
fundamenta en los mnimos cuadrados, exige que las variables guarden una relacin
lineal entre ambas y que presenten homocedasticidad.
Criterio de Validacin. Es un estndar mediante el cual se evala la validez de un test.
Se requiere que sean tambin una medida de algn tipo, es decir, que se expresen en
una Escala Cuantitativa. Pueden ser el rendimiento en otra variable como otro test, la
apreciacin de un supervisor en el trabajo, los juicios de un profesor, notas en un curso,
etc. Usualmente se establece una correlacin entre el rendimiento en el test y la
puntuacin en el criterio para decidir cul es el grado de asociacin entre el test y el
criterio, lo que permite predecir el rendimiento a futuro o determinar el nivel actual en el
criterio.
Desviacin Tpica. Es una medida de la variabilidad o dispersin de una distribucin de
puntajes. Mientras menos dispersos estn las puntuaciones alrededor de la Media menor
es la desviacin tpica, mientras ms se dispersan, mayor es la Desviacin Tpica.
Cuando se trata de una Distribucin Normal, existen algunas relaciones importantes. Por
Flix Rodrguez Isidro

Pgina 46

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

ejemplo, a una desviacin tpica por encima y por debajo de la Media se encuentra el
68,26% de la distribucin. El clculo de la Desviacin Tpica se realiza mediante el
clculo de la raz cuadrada de la sumatoria de los desvos de los puntajes con respecto a
la media elevados al cuadrado. Es tambin la raz cuadrada de la Varianza.
Dificultad de los tems. El grado de dificultad de un tem se determina mediante la
proporcin de respuestas correctas (cociente entre respuestas correctas divididas entre el
nmero de respuestas totales). La proporcin que se obtiene se denomina a la media del
tem, o la p del tem y es un indicador directo de su facilidad, o inverso de la dificultad,
ya que su valor, comprendido entre 0 y 1, indica que mientras ms se acerca a 0 es ms
difcil el tem (puesto que fue respondido por un menor nmero de personas) y mientras
ms se acerca a 1 es ms fcil (respondido por un mayor nmero de personas).
Error Estndar de Medida Sem. Es un estadstico que estima la posible magnitud del
error presente en un puntaje individual. El Error Estndar de Medida indica la diferencia
que puede existir entre el Puntaje Obtenido y el Puntaje Real o Verdadero (T), que se
supone que refleja la verdadera posicin del individuo en un continuo subyacente; esa
diferencia se debe a errores de medida. Mientras mayor es el Error Estndar de Medida,
menos confiable es la puntuacin obtenida. El Error Estndar de Medida es una magnitud
tal, que en aproximadamente dos terceras partes de los casos, el puntaje obtenido no
diferir ms de un Error Estndar por encima o por debajo del Puntaje Real. En teora se
puede decir, que en 2 de cada 3 casos, el puntaje obtenido se encuentra en una banda
que se extiende del Puntaje Real ms o menos un Error Estndar de Medida; pero debido
a que el Puntaje Real nunca se puede conocer, la prctica establece que, para la
interpretacin, se puede revertir la relacin Puntaje Verdadero Puntaje Obtenido.
Escala. La sucesin de nmeros en funcin de los cuales se realiza la medicin.
Clsicamente se distinguen cuatro niveles: Nominal, Ordinal, Intervalo, Razn. Tambin
se entiende por escalas, las transformaciones de puntajes que se realizan a escalas de
propiedades conocidas, tales como Estaninas Percentiles, puntaje Z, Puntaje H, etc.
Estadstica Descriptiva e Inferencial. La E. Descriptiva es una rama de la estadstica
aplicada que permite describir las caractersticas de las distribuciones en funcin de los
datos obtenidos. La E. Inferencial es una rama de la estadstica que permite realizar
inferencias sobre el comportamiento de los estadsticos en la poblacin o un segmento de
ella. Ambas son absolutamente necesarias en el trabajo estadstico de los datos
psicomtricos.
Frecuencia. Es el nmero de observaciones que corresponde a un determinado puntaje
en una escala. Usualmente las observaciones son los sujetos que obtuvieron ese puntaje.
Frecuencia Acumulada. Es el nmero de observaciones acumuladas hasta el lmite
superior de un determinado puntaje en una escala. Se acumula siempre desde las
puntuaciones ms bajas en la Escala hacia los ms altos.
Inventario de Personalidad. Es un tipo de Prueba Psicomtrica que consiste en un
cuestionario o lista de chequeo, usualmente autoadministrada, diseada para obtener
informacin de variables no intelectuales de un individuo. Los inventarios usualmente
evalan rasgos tales como intereses, actitudes, motivacin, etc. (vase Pruebas de
Personalidad).
tems. Son los estmulos o reactivos que se presentan a los sujetos para que respondan
y pongan de manifiesto conductas asociadas con un atributo determinado. Dependiendo
del tipo de prueba, los tems varan sustancialmente. Un tipo comn de tem son los de
opciones mltiples, que presentan un problema en el pie y varias opciones de respuesta
de las cuales slo una es la correcta (la clave) y las otras son Distractores, que sirven
para atraer la respuesta de quienes no conocen realmente la respuesta correcta.
Media o Media Aritmtica. Es el promedio de las puntuaciones obtenidas por un grupo
en un test. Se obtiene mediante la suma de las puntuaciones y la divisin
entre el nmero de ellas.
Medicin. Consiste en la asignacin de numerales a las propiedades de los objetos o
eventos de acuerdo a ciertas reglas (Stevens). En medicin psicolgica, los objetos son
las manifestaciones de los atributos psicolgicos o constructos. Se fundamenta en varios
supuestos: a) la asuncin de la existencia de un continuo subyacente con direccionalidad,
b) la existencia de un solo puntaje verdadero para cada sujeto, c) la variabilidad entre
Flix Rodrguez Isidro

Pgina 47

Facultad de Ciencias de la Salud


Escuela Acadmico Profesional de Psicologa Humana

sujetos con relacin al puntaje verdadero y d) la posibilidad de obtener manifestaciones


asociadas con la posicin que la persona ocupa en el continuo subyacente. De esta
manera, se asignan puntuaciones, de acuerdo a ciertas reglas, a las manifestaciones de
conducta asociadas al atributo psicolgico que se desea medir. Las puntuaciones se
interpretan en funcin de la teora psicomtrica y psicolgica, para inferir acerca de la
conducta actual, de la futura o de las potencialidades de la persona. La medicin
usualmente implica la existencia de un propsito y una decisin que debe tomarse con
relacin a los Sujetos de la medicin o de los atributos medidos.
Mediana. Es la puntuacin en una distribucin de puntajes por encima de la cual se
encuentra el cincuenta por ciento de las observaciones.
Medidas de Dispersin. Estadsticos que permiten establecer la variabilidad de un
conjunto de datos. Por ejemplo: la Varianza, y la Desviacin Tpica.
Medidas de Tendencia Central. Estadsticos que permiten conocer la ubicacin de la
distribucin en un continuo, por ejemplo: Media, Mediana y Moda,
Moda. Es la puntuacin que tiene la frecuencia ms alta en una distribucin. Algunas
distribuciones pueden ser bimodales o multimodales.
Muestra. Una parte de una Poblacin o universo; un subconjunto de observaciones de
una poblacin. Si la poblacin est compuesta de individuos, la Muestra constituye un
grupo de individuos provenientes de esa poblacin. Se desea que las Muestras sean
representativas de la poblacin para poder inferir los parmetros de la poblacin a partir
de los estadsticos de la Muestra. La representatividad se logra asegurando que todos los
individuos de la poblacin tienen la misma probabilidad de ser seleccionados para la
Muestra, se habla as de muestreo probabilstico. Esto se logra mediante esquemas de
muestreos entre los que se incluyen como sus elementos bsicos: Muestreo por Azar
Simple, Muestreo por Azar Sistemtico, Muestreo Estratificado, Muestreo por
Conglomerado. Estos esquemas exigen
BIBLIOGRAFA
Arnau, J. (1989). Metodologa de la investigacin y diseo. En J. Arnau y H. Carpintero
(Eds.). Historia, teoria y mtodo. Madrid: Alhambra Universidad.
Canpintero, H. (1996). Historia de las ideas psicolgicas. Madnd: Pirmide.
Martnez-Arias, R (1995). Psicometra: Teora de los tests psicolgicos y educativos.
Madrid: Sntesis.
Meli, J.L. (1990). La construccin de la Psicometra coma ciencia terica y aplicada.
Valencia: Cristbal Serrano.
Muiz, J. (1991). Introduccin a los mtodos psicofsicos. Barcelona: PPU.
Muiz, J. (1998). La teora clsica de los tests. Madrid: Pirmide.
Nunnally, J. C. (1973). Introduccin a la medicin psicolgica. Buenos Aires: Paids.
REFERENCIAS DE LA WEB:
http://www.gestiopolis.com/canales8/rrhh/psicometria-como-ciencia-delcompotamiento-y-los-recursos-humanos.htm
http://www.uam.es/docencia/ace/
http://www.uaim.edu.mx/webcarreras/carreras/Etnopsicologia/07%20TRIMESTRE/PSICOMETRIA.pdf
http://html.rincondelvago.com/psicometria_5.html
http://es.wikipedia.org/wiki/Teora_de_respuesta_al_tem
http://es.wikipedia.org/wiki/Test_psicolgico

Flix Rodrguez Isidro

Pgina 48

También podría gustarte