Introducción:: Tema 1: El Problema de La Medición en Psicología

resumen psicometra
TEMA 1: EL PROBLEMA DE LA MEDICIN EN PSICOLOGA

1. INTRODUCCIN:
La psicometra se ocupa de la medicin por lo que esta relacionada con el psicodiagnstico y la evaluacin
psicolgica.
Nos permite construir test estandarizados
Se ocupa de establecer las reglas de medicin de caractersticas psicolgicas
Para poder medir hay que observar.
MEDIR: asignar nmeros a las cantidades e las propiedades de una persona de acuerdo con reglas
preestablecidas y que se puede comparar; Es decir, cuantificamos cualidades.
En psicologa las caractersticas las inferimos por lo que es importante que los instrumentos de medida
constaten que esas inferencias son reales.
Los instrumentos son los test psicomtricos que pretenden ser una medida objetiva y tipificada de pequeas
muestras de conducta significativas del sujeto.
Para que un test tenga valor debe servir para:
diagnosticar y describir el estado actual del sujeto
predecir el comportamiento futuro
La medida en psicologa es algo concreto: Se miden caractersticas psicolgicas en personas, por lo que son
aspectos individuales y concretos.
2. ELEMENTOS ESENCIALES EN LA MEDICIN
En psicologa medimos para tener datos ms precisos y adems ahorra tiempo, esfuerzo y dinero. Cuanto ms
complejo es lo que se pretende analizar la medida simplifica la realidad compleja.
Cada tem de un test es una pequea muestra de conducta.
Los elementos esenciales para medir en psicologa son:
sealar o definir la cualidad o atributo que queremos medir
operativizar el atributo en base a las manifestaciones del mismo
ver la relacin entre cualidades y cantidades.
Traducir e interpretar los datos cuantitativos para darles una cualidad. Es decir, interpretar los datos
cuantitativos en base a unas normas de interpretacin.
3. EL PROBLEMA DE LA MEDICION EN PSICOLOGA:
Definir claramente la caracterstica a medir. Esto es un problema ya que en psicologa no encontramos una
1
nica definicin de un atributo.

Saber cual es la definicin mas til y cuales son los atributos que representan mejor as la persona evaluada.
Los datos obtenidos son relativos y son solo una parte de la persona evaluada.
Las medidas pretenden llegar a atributos muy complejos e intangibles, por lo que hay una gran diversidad de
manifestaciones. Es necesario que los tems estn basados en muestras muy amplias para que los datos sean
significativos.
4. CRTICAS A LA MEDICIN EN PSICOLOGA Y A SUS INSTRUMENTOS. VENTAJAS E
INCONVENIENTES.
VENTAJAS:
Ahorro
Objetividad
Ayuda a pronosticar aunque con una posibilidad de error
Ayuda a la comunicacin entre profesionales de forma ms precisa y ms significativa.
INCONVENIENTES:
No hay consenso, cada uno mide una cosa diferente dependiendo de su modelo de partida.
El problema de s los tems son representativos o no
Critica social
Muchos test tienen una gran carga cultural y verbal
Hay que tener en cuanta las condiciones de los sujetos de la muestra para saber la representatividad de
los porcentajes
Critica tica: hasta que punto se entromete en la vida privada
Los test favorecen clasificar y etiquetar y esto en psicologa es un error.
5. MTODOS DE MEDICIN:
Mtodo de prueba:
Analizar y controlar de forma estricta la situacin; Hay estandarizacin y la tarea es predeterminada. Ej.
Prueba objetiva
Mtodo observacional:
Trata de medir la conducta en situaciones naturales por lo que no hay estandarizacin.
Mtodo mixto:
Observacin planificada: se estandariza la observacin y el modo de medicin pero hay libertad en cuando a
que se realiza en el medio natural. Permite cuantificar de forma natural.
En base a los mtodos se derivan las escalas de medicin que son los modos de usar los nmeros. Las escalas
de medicin que ms se usan son:
rtulos: poner un numero a un objeto
categoras: representan grupos de objetos

Escalas ordinales: conllevan un mnimo nivel cuantitativo. Permite ordenar objetos. Sirve para analizar la
realidad de forma simple.
Escalas de intervalo: los nmeros dan informacin de las diferencias entre un intervalo y otro, del orden.
Escalas de razn o proporcin: son un tipo de escalas de intervalo que permite ver las diferencias entre cada
persona. Se conoce un punto cero que no es arbitrario y por tanto se puede saber cual es la diferencia. Permite
porcentaje.
NORMAS DE MEDIDA Y ESCALAS NORMATIVAS:
Son necesarias porque lo que medimos no es obvio, medimos de forma indirecta los atributos a travs de sus
manifestaciones.
Las normas permiten saber como asignar los nmeros a las caractersticas con el propsito de que representen
el grado en que se manifiesta el atributo en cada sujeto. La medicin concierne a un atributo particular.
Debemos saber que lo que medimos son manifestaciones de atributos y no personas.
Generalmente medimos para comparar y hay dos modos de comparar:
normas: para comparar grupos
criterios: para comparar individuos consigo mismos
Las normas deben estar especificadas de antemano y son de diferentes tipos
A travs de las reglas hacemos medidas significativas.
Las reglas son convenios que pueden ser cambiados si son incorrectos. Las normas bsicas en psicologa son:
Normas de edad: se extraen eligiendo una muestra normativa a partir de la que extraemos el promedio de
actuacin tpico en las diferentes edades.
Normas de grado: se extraen de un grupo normativo, y en base al grado o nivel se extrae un promedio de
actuacin.
Normas de porcentaje: partimos de un grupo normativo en el que no se realizan comparaciones externas sino
solo internas, dentro del mismo grupo. Se extraen los percentiles.
Normas estndar o tipificadas: siempre tienen el mismo significado. Permiten comparar diferentes grupos y
diferentes caractersticas.
Hay diferentes escalas normativas:
Coeficiente intelectual: pretenda dar idea de la inteligencia en funcin de la comparacin entre la edad
mental y la edad cronolgica.
Problemas: se extrae de un grupo normativo y si el sujeto no es del mismo grupo no se har una comparacin
adecuada.
Ventajas: se ha usado para seleccionar porque es fcil de calcular.
3
Centiles: son escalas ordinales. Se refiere al porcentaje de sujetos que queda por debajo de una
puntuacin determinada.
Ventaja: fcil de calcular y de interpretar.
Tpicas transformadas: transforman la puntuacin bruta en indirectas.
Tpicas normalizadas: puntuaciones tpicas no lineales, no hay una transformacin lineal. Suponemos
que se aproxima a la normal.
Tpicas normalizadas y transformadas:
eneatipos: van de 1 a 9. Se basan en la z normalizada. Se parte de una media de 5 y una desviacin
tpica de 2. Muy fcil de interpretar, no hay puntuaciones negativas, son equivalentes permitiendo
todo tipo de comparaciones.
Decatipo: de 1 a 10. Media 6 y desviacin tpica de 3.
Coeficientes intelectuales tpicos: siempre se redondea. No hay limite superior. Se puede aplicar a
cualquier edad.
tipos de comparaciones:
intrasujeto: comparar a un sujeto consigo mismo en diferentes momentos.
Intersujeto: comparar a un sujeto con otro de su mismo grupo.
Intragrupo: comparar a un grupo consigo mismo en diferentes situaciones.
Intergrupo: comparar a un grupo con otro grupo; Diferencia de medias de dos muestras.
CARACTERSTICAS DE LOS TESTS PSICOMTRICOS COMO INSTRUMENTOS DE MEDIDA
Sirven para conocer mejor el comportamiento recogiendo datos. Pretenden ser medidas tipificadas y objetivas
de muestras de conducta de un sujeto.
Se empezaron a desarrollar para evaluar diferencias individuales y en la actualidad se aplican a diferentes
ambitos para medir diferentes personas y diferentes caractersticas.
Hay que ver si es realmente significativo.
Ventaja: precisin, son voluntarios, no enmascarados y estandarizados
Tambin pretenden servir para predecir por lo que estn elaborados en base a procedimientos estadsticos y
tienen que haber demostrado su fiabilidad, validez y precisin. Pretenden medir caractersticas no manifiestas
en muchas ocasiones. Muchos de ellos aplican anlisis factoriales.
Resumen psicometra
TEMA 2: INTRODUCCIN AL PROCEDIMIENTO DE ELABORACION Y ANALISIS DE UN
INSTRUMENTO PSICOMETRICO
INTRODUCCIN:
El instrumento psicomtrico tiene que estar validado lo que conlleva saber en primer lugar que evaluar, lo que
nos lleva a una definicin lgica del atributo a medir. Tambin hay que definir operativamente como se
manifiesta el atributo, luego hay que saber como dar grado al mismo. Un instrumento psicomtrico consta de
tres elementos:
Manual, pautas de manejo

Protocolo de la prueba(tems y posible hoja de respuestas a parte)
Plantilla de correccin
Estos tres elementos varan en su forma de presentacin dependiendo de la finalidad del test, de su aplicacin,
de su correccin, etc. ... Cuando queremos elaborar un test hay que saber a quien queremos evaluar; la
longitud del test tambin ser diferente. Hay que saber el tiempo del que disponemos para: 1. Elaborar el test
aplicarlo
corregirlo
Dependiendo del tiempo haremos un tipo de test u otro. Hay cuatro criterios segn los que diferenciar los
tests.
1. Forma de presentar los tems: Estos pueden ser verbales (16PF), grficos (Raven) o manipulativos (un
puzzle)
Hay instrumentos que combinan diferentes tipos de tems por ejemplo escalas Wechsler de inteligencia que
combina los tres tipos de tems.
Contenido del test:
mnibus: las preguntas miden diferentes operaciones mentales que se combinan en una sola puntuacin
final(escalas evolutivas de Binet)
Homogneos o de tarea nica: mide solo una habilidad o tarea (Raven)
Batera de test: grupo de subtest tipificados y normalizados en una poblacin que dan diferentes caractersticas
(test de aptitudes de Thurstone), que forman parte de una misma evaluacin o contexto.
Tipo de respuesta que exigiremos al sujeto:
Construccin de respuesta: se le presenta un estmulo y el sujeto elabora su propia respuesta de forma libre.
Eleccin de respuesta: se le presenta el estimulo y se le dan alternativas de respuesta cerradas de las que el
sujeto elige una.
Tipo de aplicacin:
Colectivos: las cuestiones se presentan en un protocolo impreso. El contacto personal con el evaluador es
mnimo. Las tareas a realizar se proponen a todos los sujetos a la vez, hay un tiempo para realizarlo y la tarea
suele ser de eleccin de respuesta. Las habilidades lectoras del sujeto pueden influir a la hora de responder.
No exigen demasiada preparacin del examinador. Resultan econmicos en tiempo.
Individuales: la aplicacin se hace persona a persona. El examinador normalmente presenta oralmente las
preguntas. No hay lmite de tiempo. El examinador necesita mas experiencia; permiten tambin que el sujeto
responda libremente (construccin de respuesta). El sujeto puede pedir explicaciones sobre la tarea por lo que
las influencias de las habilidades lectoras no se dan. El problema es que llevan mucho tiempo.
2. PLANIFICACIN DE LA PRUEBA:
La elaboracin completa de un instrumento dura alrededor de dos aos.
5
lo primero que se planifica es el diseo de la prueba

asignacin de las personas que redactan los tems, donde entrara el tipo de tems
Elegir los expertos(psiclogos, educadores, mdicos...) que analizaran los tems, criticando el
contenido, el impacto estimular, etc. ... para que los tems sean representativos del contenido que se
pretende evaluar.
Hacer un cuaderno de ensayo
Ir construyendo las instrucciones de manejo de la prueba.
Primer estudio emprico: pequea muestra a la que se le aplica el borrador, se aplican los anlisis
estadsticos pertinentes.
Seleccionar los tems ms representativos, desechar los que no lo sean y los que pueden servir pero
tienen algn problema se rehacen.
Desarrollar todos los materiales auxiliares y entregar todo a la imprenta.
Aplicar de nuevo el instrumento, pero a una muestra representativa de la poblacin; Es el segundo
ensayo normativo. Se barema el test, aqu se hacen las tablas de baremacin y se valida el test.
Poner a disposicin de la editorial todo el material.
3.PREPARACIN DEL EJERCICIO:
1 etapa: Enmarcar el instrumento (fundamentacin terica)
Qu pretendo medir? Hay que saber que contenido tiene el atributo y como est construido tericamente.
Hay que definir el atributo y decir su contenido: definicin lgica y operativa. Estas definiciones hay que
posicionarlas tericamente.
Qu inferencias quiero hacer a travs del atributo? Qu utilidad le voy a dar al instrumento? Objetivos y
utilidad del test.
A que poblacin va a dirigirse el instrumento? Decidir a quien voy a evaluar, a que sujetos se destina el test.
2 etapa: Planificacin y delimitacin de la prueba:
Objetivos concretos de la prueba delimitar operativamente la prueba, cuantas reas o contenidos concretos va
a tener la prueba.
Hay que operativizar las reas de contenido, a las que se les pueden dar diferentes pesos, bien de forma
emprica o bien por consenso de expertos. De momento se dan los pesos a priori, pero se est trabajando en
darlos a posteriori. Se puede dar mas tems a un rea que a otra o se puede hacer una correccin con el mismo
nmero de tems en todas las reas.
3 etapa: elaboracin de preguntas, protocolos y normas de aplicacin
Darles un contenido real a las reas: Preguntas para cada rea. Hay que ver la proporcin de tems, su nmero
y el objetivo de cada rea.
Nmero de tems total de la prueba, en funcin del tiempo, del tipo de tems, de la velocidad lectora de los
sujetos... hay que pensar en toda la prueba, en quin va a recibir los tems y en que atributo quiero medir: si es
muy general muchos tems y si es concreto pocos tems. El que elige l nmero de tems es el autor del test.
Los tems se distribuyen en las reas de contenido segn su peso y en cada objetivo.
Seleccionar el tipo o tipos de tems ms convenientes: verbales, manipulativos, grficos...
Formato del instrumento, presentacin.
6
Se selecciona el tipo de tems segn dos criterios: preguntar a expertos o hacer un banco de tems de los que
se elige al azar.
Hay que tener en cuenta unas condiciones:
el tiempo para construir, aplicar y corregir el test
el proceso mental que se exige
La aplicacin individual; se adecua el tiempo al sujeto y el nmero de tems es mayor.
Condiciones del evaluador que delimita el tipo y nmero de los tems.
Dificultades del material.
Las personas a las que se va a evaluar.
Estas condiciones llevan a unas estrategias y a un protocolo determinado. Hay que conocer nuestra capacidad
para redactar los tems.
Elaborar el protocolo y elaborar las instrucciones y las normas de aplicacin y de correccin del
instrumento. Elaborar el material para aplicar, corregir la prueba para que otro profesional pueda
aplicarla.
Todo esto es un borrador, un ensayo en el que se tienen mas tems de los que se necesitaran.
4 etapa: Primer estudio emprico:
Finalidad: saber si el instrumento sirve realmente.
Identificar y seleccionar una muestra de sujetos a la que aplicar el borrador.
Aplicar el instrumento.
Corregir el instrumento: Hay que tener normas de correccin. Esto nos permite obtener unos
resultados.
Anlisis estadstico descriptivo de todos los resultados. As conoceremos la tendencia de las
puntuaciones.
Anlisis de tems: se analiza tem a tem a nivel lgico y a nivel cuantitativo.
Reestructuracin de la prueba: se rechazan los tems, se reestructuran o se dejan como estn.
5 etapa: segundo estudio emprico
objetivo: determinar las caractersticas tcnicas de la prueba.
Demostrar la representatividad cualitativa y cuantitativa de la muestra.
Aplicar a la muestra el instrumento y corregirlo igual que en la anterior etapa.
Anlisis de tems
Estudio de fiabilidad de la prueba
Estudio de validez
Interpretar las puntuaciones
ELABORACIN Y SELECCIN DE LOS TEMS
Segn como seleccionamos los tems el test tendr un contenido. Las preguntas y alternativas de respuesta son
el protocolo del test. Los tems son verbales, grficos o manipulativos. El tipo de tems tiene que ver con s el
sujeto responde de forma libre, estructurada o de forma mixta.
Items de respuesta libre: La tarea es organizar sus propias respuestas y responder con sus propias palabras
desde su propio punto de referencia ante el estmulo presentado. Hay dos tipos de tems de respuesta libre:
ensayo: lo importante es poder evaluar el desarrollo conceptual o global del sujeto. Permite conocer
aspectos muy personales como originalidad o la forma de estructuracin. Problema. subjetividad
Respuesta restringida: se da un problema especifico a responder que delimita la libertad de respuesta.
Items de respuesta estructurada: la tarea es elegir sobre respuestas dadas por el evaluador. Es ms fcil
de cuantificar. Limita la libertad del sujeto. Hay diferentes tipos:
Item objetivo de respuesta alterna: se ofrecen dos opciones y se elige una. Influye mucho el azar. Se
necesita un gran numero de tems para que represente bien lo que se quiere evaluar.
Item objetivo de eleccin de respuesta: tres o ms alternativas de respuesta. Permite mayor flexibilidad y
ms informacin. Permite analizar algunas habilidades del sujeto.
Items objetivos de emparejamiento: son ms complejos pero siguen siendo objetivos. Hay un encabezado,
dos columnas de respuestas, que hay que emparejar. No vale para cualquier edad ni para cualquier nivel socio
cultural.
Items de completamiento: son semiobjetivos o mixtos: mezclan los tems de respuesta libre y los
estructurados. Hay mayor flexibilidad y hay varias respuestas correctas.
APLICACIN, CORRECIN Y PROCEDIMIENTOS ESTADSTICOS PERTINENTES:
Una vez que hemos llegado aqu hay que aplicar el test y para ello hay que:
Delimitar unas normas claras de aplicacin.
Tener elegida de forma clara la muestra representativa.
Aplicar el test: Recoger datos significativos.
Ahora hay que hacer un anlisis de los tems a dos niveles:
cualitativo: anlisis lgico racional.
Cuantitativo: anlisis emprico de las propiedades estadsticas de cada uno de los tems.
TEMA 3: CONFIABILIDAD DEL INSTRUMENTO
INTRODUCCIN:
La confiabilidad es el hecho de que una medida se mantenga en el test. Para medir la estabilidad es necesario
medir y conocer las fluctuaciones (estadsticos de posicin)
La estabilidad es relativa al momento. La confiabilidad se mide en dos ncleos: la media y el instrumento.
Los instrumentos deben aportar algo significativo del sujeto que estamos evaluando y esta ha de ser lo mas
precisa posible.
La confiabilidad es la exactitud de la medida en diferentes ocasiones, en un lapso de tiempo.
Esto se halla estadsticamente mediante la correlacin.
La inconfiabilidad es la noestabilidad o el no acuerdo en la misma medida del mismo sujeto y en las mismas
circunstancias.
Esto nos lleva a deshacer esta medida por no ser significativa.
8
Empricamente la confiabilidad o la inconfiabilidad se miden por los estadsticos de relacin.

Si una medida y otra varan mucho entre s y estn hechos en el mismo sujeto, esas medidas no son
significativas. Inconfiabilidad de la medida, lo podemos obtener empricamente a travs de estadsticos de
relacin.
POSTULADOS BSICOS:
Fiabilidad supone consistencia y por lo tanto informacin estable. Si una medida es fiable nos da
informacin consistente y estable.
razones de tipo externo al instrumento que pertenecen al sujeto (el sujeto madura o cambia de opinin)
Razones que se deben al propio instrumento: el tipo de tareas es demasiado fcil o demasiado difcil.
los tems no son representativos
Influencia del propio evaluador.
El propio azar influye en la inconsistencia de la medida.
2 . La confiabilidad debe ir investigada empricamente para cada instrumento y para cada situacin de
aplicacin.
Cmo comprobar la confiabilidad del instrumento?
El grado de variacin de un conjunto de medidas sucesivas si es bajo medida consistente e
instrumento confiable.
Contrastar la posicin de un sujeto con respecto al grupo.
3. Hay que demostrar empricamente el grado de estabilidad de las puntuaciones a travs de los estadsticos
de relaciones. Estadsticamente la fiabilidad es una correlacin.
Toda media esta compuesta por dos elementos bsicos:
la puntuacin total conlleva una puntuacin verdadera mas la puntuacin del error (
PT=PV2+PE)
El modelo lineal de Sperman (teora clsica de la puntuacin verdadera) si a un sujeto le aplicamos un
numero infinito de veces un mismo test y suponiendo que las aplicaciones sean independientes entre s, la
media de las infinitas puntuaciones sera la puntuacin verdadera del sujeto. Con respecto a esa caracterstica
y para puntuaciones arbitrarias al error se anulan entre s.
Siguiendo esta premisa: PV = PT PE
Elementos fundamentales:
(1) El error es independiente a la puntuacin verdadera e incluso a la variable que estoy midiendo. PT = PV +
PE
(2) No existe correlacin entre las puntuaciones verdaderas y el error.
(3) Los errores afectan a las puntuaciones totales pero afectan de forma distinta cada vez que medimos.
Un conjunto de errores de un grupo influye en la PT de ese grupo pero no en las puntuaciones verdaderas
9
(PV) de ese grupo.

Podemos hallar el error en la puntuacin: cuantos ms errores cometamos y mayor sea el error menos
estabilidad tenemos en la puntuacin y viceversa.
Qu es el error tpico de medida?
Pe = Pt Pv
O
Xi XT= e Xe Se error tpico de medida
.....1 = e1
.....2 = e2
.....3 = e3
Cuanto mayor sea el error tpico de medida menos posibilidades tengo de que mi medida sea significativa.
El error de medida se utiliza para ver si las variables son muy amplias(significativas). El error tpico de
medida es la desviacin tpica de errores (Se)
El error tpico es responsable de que haya variables en la medida. La estabilidad de la medida se define como
la proporcin de la r2 verdadera que se explica por la r2 total.
S2 observada = Sv2 + Se2
El coeficiente de confiabilidad: S2v
R=
S2 observada
FORMAS DE ESTIMAR LA CONFIABILIDAD:
El coeficiente de confiabilidad se halla para cada instrumento y para cada situacin por lo tanto no es
absoluto. Si cambiamos de circunstancias, de poblacin, debemos hallar otro coef. De confiabilidad.
CUATRO FORMAS DE HALLAR EMPRICAMENTE LA CONFIABILIDAD
TEST RETEST
TEST PARALELOS O EQUIVALENTES
TEST SUBDIVIDIDOS O TEST DE LAS DOS MITADES
ESTADISTICOS DE ITEMS.
TEST RETEST: Tenemos que tener un test el cual aplicaremos al menos en 2 situaciones diferentes.
Pueden ser momentos simultneos (sin intervalo) o en un largo periodo (con intervalo). Podemos saber la
consistencia interna del test si la puntuacin es la misma en situaciones diferentes. Ya no controlamos la r
al ser la misma tarea la que pretendemos valorar.
Si controlamos la maduracin y los cambios del sujeto en las dos aplicaciones correlacionamos las dos
10
medidas obtenidas. Si el test est bien hecho y mide lo que he pretendido medir las medias son muy similares.
Medimos pues la consistencia interna del test haciendo este test retest, pero si no es suficiente utilizamos
otros test.
TEST PARALELOS: Tambin con dos momentos de aplicacin: dos medidas de cada individuo pero
elegimos el test y otro equivalente que mide las mismas caractersticas pero desde otro modelo terico.
Son dos medidas de la misma caracterstica pero con tareas diferentes. Podemos comparar nuestra medida con
la de otros test. Estos test tiene que tener medias y varianzas iguales
No sabemos la consistencia interna del instrumento porque no son dos medidas del mismo instrumento pero si
nos da informacin de la consistencia externa.
Podemos aplicar estos dos test sin intervalo de tiempo o con l si lo que queremos es valorar los cambios
madurativos.
El nico mtodo que nos permite conocer la consistencia externa del test, el que ms controles realiza en
relacin a las varianzas debidas al error.
Incluye tambin la varianza de error debida a la diferencia entre las tareas.
TEST SUBDIVIDIDO: Es econmicamente muy til respecto al tiempo y al dinero. Solo necesita una
aplicacin del test; Solo una medida si es consistente o no de forma interna. Una vez aplicado y corregido el
test se divide en dos partes iguales: tems pares (a)
17
30
Items impares (b)
Tambin se puede hacer al azar, repartir en dos todos los tems. Correlacionamos una mitad del test con la otra
pero esa correlacin no es igual a la correlacin total del test (coef. De correlacin)
Por eso para hallar la confiabilidad hay varios mtodos, en este test aplicamos la formula de Spearman
Brown.
Cuando aplicamos el test lo dividimos suponiendo que a y b tienen varianzas iguales:
formulas
Si las varianzas fueran diferentes entre las dos mitades utilizaramos la formula de Rulon y Guttman.
formulas
Este mtodo permite solo una parte de la consistencia interna. Permite aplicar la confiabilidad en test de
velocidad(en intervalo de tiempo corto)
ESTADSTICA DE TEMS: es tan econmica como la anterior. Una sola medida. Valora la consistencia
interna con criterios internos. Comparamos las puntuaciones de cada tem con la puntuacin obtenida en el
test completo.
11
Se considera a cada tem como un test individual. Comparacin de cada tem con la puntuacin total del test.
Se supone que todos los tems tienen la misma varianza y la misma media utilizamos la formula de Kuder
Richardson.
Si las varianzas y medias son distintas:
Los distintos mtodos nos dan diferentes medidas de confiabilidad, varan en cuanto al grado y en cuanto al
contenido
5. CMO SE INTERPRETAN LOS DATOS DE CONFIABILIDAD?
No hay confiabilidad mnima, la mxima es 1. A pesar de no haber un nivel satisfactorio nico si se ha llegado
a un acuerdo; que no baje de 0,6 la confiabilidad de un instrumento.
A veces la prueba que presenta mayor nivel de confiabilidad no es accesible para nosotros bien
econmicamente o porque no la podemos aplicar y tenemos que escoger otra.
Hay que intentar equilibrar el nivel de confiabilidad con este 2 nivel (s es accesible para nosotros, lo
sabemos aplicar)
Hay que fijarse en tres niveles cuantitativos: (estos 3 niveles cuantitativos dependen de un 4 nivel que es el
mtodo utilizado):
nivel de confiabilidad (01)
error tpico de medida
el ndice de confiabilidad
Alto nivel de confiabilidad implica un bajo error tpico de medida y alto ndice de confiabilidad sera lo ideal.
Cada mtodo nos da errores tpicos de medida distintos y niveles de confiabilidad distintos.
Estos tres niveles cuantitativos estn en funcin del mtodo utilizado.
Adems de esto influyen otros aspectos cualitativos en el nivel de confiabilidad:
Como es el grupo, la dispersin del mismo (si es homogneo o heterogneo). Sabemos si un grupo es
homogneo o no por los estadsticos de dispersin (desviacin tpica).
Si un grupo es muy heterogneo (variable) es mas fcil que el instrumento sea fiable.
En un grupo homogneo un error influye mucho en la confiabilidad del instrumento. En un grupo heterogneo
el mismo error no sera tan grave.
Nivel de capacidad del grupo => tiene que decir en el test el nivel de capacidad que tiene el grupo al que se
aplic el test. Hay que tener en cuenta esta capacidad del grupo, las distintas variables que influyen en l.
Extensin del test => cuantos ms tems ms posibilidades de representar bien lo que queremos medir, pero si
son demasiados el sujeto evaluado puede perder la concentracin.
La propia tarea => hasta que punto el sujeto puedo o no realizarla. Si es demasiado difcil para su edad o
demasiado fcil. Hay que leer la prueba antes de aplicarla.
12
La forma de correccin => si las normas de correccin no estn bien estructuradas o bien aplicadas se
`produce una interpretacin subjetiva.
La propia situacin de aplicacin => comprobar si la situacin es normal, habitual, cotidiana. para que no se
produzcan sesgos.
Falta de acuerdo entre las distintas medidas => viene de la falta de acuerdo terico lo que provoca que las
medidas no sean fiables. La fiabilidad es la condicin necesaria para que un instrumento sea valido, pero no es
condicin suficiente.
No puede ser valido si no es fiable. Que el mtodo no sea el adecuado para las personas que estamos
evaluando es la cualidad ms negativa.
6. CONFIABILIDAD Y LONGITUD DEL TEST
Al aumentar el nmero de tems hay ms probabilidades de que el instrumento sea ms confiable.
Hay mtodos que puede que sean poco confiables porque son poco extensos
Si cambiamos la longitud variamos tambin la confiabilidad.
Hacer una prueba excesivamente larga puede resultar malo y puede bajar la confiabilidad. Hay que
tener cuidado.
Hay una formula matemtica que nos dice hasta que punto se puede aumentar l numero de tems para
aumentar su confiabilidad.
En cuanto aumento el test numero de veces que aumento el test. Quiero que la confiabilidad llegue a
0,80:
Hay una relacin entre la confiabilidad y la homogeneidad de la muestra. Cuando aplicamos medidas
en muestras diferentes obtenemos medidas que varan la muestra
Las puntuaciones verdaderas de una muestra no tienen porque coincidir con las puntuaciones
verdaderas de otra.
La varianza de error puede depender de la incapacidad del test para medir puntuaciones verdaderas.
Homognea varianza pequea
Heterognea varianza grande => mayor nivel de confiabilidad.
En muchas ocasiones nos puede interesar mucho en psicologia comparar medidas entre s y ver la
diferencia entre ellas a travs de las puntuaciones.
Existen una serie de peculiaridades:
Los errores que yo cometo en dos medidas diferentes influyen conjuntamente en la puntuacin
de diferencias.
Lo que tienen en comn ambas medidas lo anulamos porque buscamos la diferencia.
Siempre es ms pequea la confiabilidad de las puntuaciones diferenciales que la confiabilidad por
13
separado.
Confiabilidad de la diferencia de puntuacin:
TEMA 4: VALIDEZ DEL INSTRUMENTO
INTRODUCCIN:
El valor de un instrumento reside en que debe demostrar su utilidad. Esto lo consigue mediante la
validacin. La utilidad debe ser permanente. VALIDAR es en que medida un instrumento da datos
significativos, predice acontecimientos.
Un instrumento no tiene un coeficiente de validez fijo, vara y puede tener caducidad. Hay tipos de
validez y tipos de coeficientes de validez, segn la utilidad que le damos al instrumento.
Todos los coeficientes de validez estn basados en correlaciones.
Hay dos cuestiones en la validacin: para quien y para qu es til ese instrumento. La validez est
relacionada con la muestra y si sta cambia la validez tambin.
Dependiendo de la finalidad del test habr diferentes tipos de validez. Segn lo que se quiere medir, se
elige un instrumento u otro. Analizando el contenido (tems) se elige el instrumento ms representativo,
el mejor para lo que queremos medir: esto es la validez. Hay que elegir el test que mide realmente lo
que queremos medir.
CONCEPTO Y DEFINICN:
La validez de un instrumento es la exactitud con la que podemos hacer medidas significativas y
adecuadas a travs de el. Para esto lo primero es saber de antemano qu es lo que quiero medir. La
validez puede ser estimada tanto a nivel cuantitativo como cualitativo. El coeficiente de validez es un
coeficiente de correlacin del nivel cuantitativo. Se correlacionan los datos obtenidos en el test con los
datos de comparacin, del criterio de validacin, que son datos significativos de lo que queremos
evaluar.
La validez no es fija, por lo que hay que revisarla cada cinco o seis aos. El aspecto cualitativo del test
lo da la representatividad del mismo con respecto al sujeto.
EL PROBLEMA DEL CRITERIO DE VALIDACIN
Una forma de demostrar que el instrumento es vlido es tener un punto de comparacin externa. Para
ello necesitamos un criterio, es decir, algo mensurable y no medible porque se miden cosas que no se
ven(inteligencia, sociabilidad). Por esto en psicologa no se pueden medir criterios verdaderos, pero
deben ser lo mas verdaderos posible.
Hay que elegir los criterios que sean unnimemente estables y confiables. Debe ser el ms adecuado
posible e independiente del test y de su autor, por lo que debe ser valorado por personas ajenas al test y
su autor: Jueces de validacin. El criterio debe estar exento de prejuicios; a priori todas las personas
deben de poder estar evaluadas. Debe estar disponible y debe haber demostrado su validez.
A pesar de todo el criterio conlleva un sesgo que hay que controlar. Por eso hay que saber quin evalu
el criterio para poder analizar los coeficientes de validez.
14
Sobre la base del tipo de criterio elegido hay que evaluar la validez.
DIFERENTES TIPOS DE VALIDEZ
VALIDEZ DE APARIENCIA lgica y racional. No tiene datos cualitativos. Es el grado en que un
instrumento parece que mide lo que queremos medir. Lo dan los usuarios de la prueba: hasta que
punto la prueba es aceptada por quienes la usan. Concierne a juicios del instrumento una vez ya
construido. La validez de apariencia no suele tener relacin con la validez real. La imagen suele
sesgar la validez predictiva.
VALIDEZ DE CONTENIDO: (circular intrnseca) tambin es lgica y racional, no tiene ningn
dato cuantitativo. Se analiza tem a tem hasta que puntos estos son muestras de comportamiento
representativas de lo que pretendemos medir y de a quien pretendemos medir. Es un anlisis tem a
tem en cuanto a su estructura gramatical y su presentacin. Es necesario tener descrito de forma
lgica y operativa lo que quiere medir el instrumento. Hay que detallar el procedimiento de los datos
obtenidos en esa prueba. Es un anlisis cualitativo. El juez analiza, critica y reestructura los tems.
Los tems pasan por los filtros, que son el resto del equipo y un juez externo, para luego ordenarse en
base a criterios de ordenacin y se devuelven de nuevo al constructor.
VALIDEZ CONCURRENTE (estadstico emprica) el coeficiente se halla teniendo en cuenta un
criterio de validacin que se da al mismo tiempo que los datos del instrumento. Se emplea esta
validez para saber el estado de una persona en el momento actual, por ello es necesario que el criterio
externo se d en el momento presente. Relacionamos los datos del test con los datos externos que se
estn dando al mismo tiempo. Sirve para clasificar al sujeto en base a esa medida; Conlleva
diagnstico, clasificacin y descripcin. Incluye el error tpico de medida del test como el error de
criterio. Si el criterio no es objetivo o significativo el test no es confiable, la validez concurrente no da
datos significativos. Si mide lo que se quiere medir este coeficiente de validez se acercar a 1 y
significa que el test es vlido para hacer clasificaciones.
VALIDEZ PREDITIVA se halla a travs de un coeficiente de validacin por lo que necesitamos un
criterio externo. El uso del test es predecir la conducta del sujeto en el futuro por lo que el criterio
externo no se va a dar en el presente. Hay que esperar un tiempo para que el criterio se d. Est
influido por el error de medida y por el error de criterio. Cuanto ms cerca est del 1 mejor
predecir la conducta. Test inferencial: Orientacin vocacional, seleccin de personal, consejo
psicolgico... el criterio y el juez deben ser independientes del test. Si tiene buena capacidad
predictiva suele tener capacidad diagnstica pero no viceversa.
VALIDEZ DE CONSTRUCTO conlleva dos niveles de validez: emprica y racional lgica. Es un
proceso continuo. Queremos validar el instrumento y verificar hasta que punto se verifica la teora que est
en la base. Nos interesa saber en que grado ese instrumento nos da una medida adecuada del constructo que
queremos medir. Hay varios mtodos para hallar la validez de constructo, ya que es el tipo de validez ms
complejo al tener dos niveles (cualitativo y cuantitativo): Campbell y Fiske
Cronback y Meehl
Messick
Bentler
Cmo se halla la validez de constructo? Para evaluar una teora:
1) definir cual es el atributo a medir.
2) describir con que otros constructos de inters se puede relacionar.
Tambin hay que saber cuales son las manifestaciones de ese atributo. Campbell y Fiske emplean un
multimtodo multivariable: se aplican 3 mtodos para estudiar las 3 variables y despus se compara cada
mtodo con cada variable hallando una matriz de correlacin. El objetivo es demostrar que mi mtodo es el
que mejor correlaciona con la variable que pretendo medir; tambin ese mtodo debe mantener una
15
correlacin con las otras dos variables.

Cronback y Meehl: hay varios mtodos y varios grupos de personas. La prueba debe demostrar la correlacin
mas alta entre el mtodo, la variable y el grupo de personas a las que se le aplica el mtodo. Al trabajar con
grupos diferentes de personas el instrumento debe discriminar entre los diferentes grupos. La informacin
recogida debe permitir valorar cambios en el sujeto o en el grupo de personas. Otra forma de hallar la validez
es mediante la hiptesis alternativa: pensar que el instrumento mide mejor otra variable y demostrar que no es
as.
Algunos autores hablan de la VALIDEZ FACTORIAL: tipo de validez de constructo que se establece a
partir de anlisis factoriales. El anlisis factorial trata de explicar las interrelaciones de un conjunto mediante
las variables de ese conjunto que se dan en la realidad y constituyen factores.
No hay acuerdo sobre si dentro de los tipos de validez de constructo estn la validez discriminante (permite
discriminar; Mide el nivel de discriminacin que posee un instrumento como por ejemplo determinar quienes
son los mejores de cada clase; se trata de discriminar entre las variables que mide un instrumento y que el test
correlaciona mejor con la variable que quiere medir) y la validez convergente (aquella que se compara con
otras medidas hechas al mismo atributo).
Un instrumento nunca puede ser ms valido que fiable. La fiabilidad siempre es mejor que la validez.
INTERPRETACIN DEL COEFICIENTE DE VALIDEZ:
Adquiere valores entre 0 y 1. Es un coeficiente de correlacin que nos permite saber la validez estadstica del
test. Se correlacionan los datos del test con un criterio externo. No se explica solo a partir de los resultados
sino que hay mas factores:
si est cerca de 1 es muy valido
el error tpico de medida debe ser bajo para ser mas valido
Se interpreta segn un criterio externo que debe aparecer claramente definido. Cuanto ms estricto sea
el criterio mayor ser la validez.
Si el criterio es inconfiable disminuye la validez. Depende quien sea el juez el criterio ser confiable o no. La
confiabilidad bajar ante un juez novato. El criterio no debe tener sesgo, es decir, no debe favorecer a unos
sujetos y desfavorecer a otros.
Si la fiabilidad es alta y la validez baja, puede que el modo de hallar la fiabilidad sea errneo. No hay un nico
coeficiente de validez, es relativo al contexto en el que se va a aplicar el test.
Si el instrumento no es confiable, la validez disminuye. El juez debe ser objetivo, experto y estar entrenado.
Los datos obtenidos tienen que ser significativos y suficientes para que exista validez. Al valorar cosas
insignificantes la validez ser baja.
Es til cuando da informacin significativa y novedosa; cuando permite discriminar; cuando nos permite
hacer predicciones serias, con cierta seguridad; cuando permite tomar decisiones correctas.
TEMA 5: PREDICCIN
INTRODUCCIN:
Hay que hallar la validez predictiva y todos los dems coeficientes para predecir bien. Predecir es
adelantarse. Es una forma de pronstico, a partir de una variable que correlaciona con otra desconocida
16
determinamos esa variable desconocida a travs de una determinada frmula.

Cuanto mejor es la correlacin ms posibilidades hay de que esa prediccin sea exacta. La correlacin
igual a 1 determina una prediccin exacta.
La prediccin es relativa y conlleva un cierto riesgo. Al predecir siempre se comete un error de estimacin
que se junta al error cometido en la medicin.
La prediccin depende de la correlacin entre las variables, del error tpico de medida, del error tpico de
estimacin, del coeficiente de fiabilidad y del coeficiente de validez.
La prediccin es ms fcil hacerla en grandes grupos que en pequeos grupos, porque los errores interfieren
menos y porque un error en un grupo grande se nota menos.
La prediccin es ms fcil en un grupo heterogneo que en un grupo homogneo, porque la variedad de
sujetos favorece esa prediccin.
Es importante conocer la dispersin y la variabilidad ya que en una gran dispersin no es significativa la
media.
A nivel cuantitativo hay una serie de coeficientes que determinan el nivel de precisin del instrumento:
Coeficiente de alienacin, de valor predictivo y de determinacin.
COEFICIENTE DE ALIENACIN (C.A)
Viene expresado por la proporcin del error tpico de estimacin que hay en la descripcin del criterio.
Es un error relativo que cometemos al hacer predicciones teniendo en cuenta la dispersin de los datos.
Tratamos de ver como el error de estimacin influye en la prediccin. Nos impide hacer buenas predicciones
cuanto mayor es su valor.
Si el CA lo multiplicamos por 100 nos da el % de error que se puede cometer en la prediccin, es decir,
hasta que punto est influida la dispersin por el error. Cuanto menos influya en la dispersin mayor ser la
precisin de la prediccin.
CA = 1 La prediccin es igual que si se realiza al azar. Tenemos muchas probabilidades de que no se d la
prediccin.
CA = 0 La prediccin tiene grandes probabilidades de xito, la prediccin es ms exacta.
El CA nos muestra hasta que punto tenemos incertidumbre en la prediccin. CA = K.
COEFICIENTE DE VALOR PREDICTIVO (CVP)
Es hasta que punto un instrumento nos permite una seguridad en nuestros pronsticos.
Si lo multiplicamos por 100 nos da el valor de seguridad de pronostico.
CVP = E = 1 K
COEFICIENTE DE DETERMINACIN:
17
Es el cuadrado del coeficiente de correlacin. Expresa la proporcin de la varianza del criterio que es
pronosticada a partir del test.
Se representa rxy2 = d =. . .
Si la puntuacin pronosticada se da en la realidad, entonces las variaciones de la variable criterio pronosticada
pueden explicar la varianza total de la variable.
VARIANZA RESIDUAL O PARCIAL: es la parte de la varianza que no hemos podido pronosticar. Cuanto
ms grande sea mayor ser la incertidumbre en nuestros pronsticos. Si dejamos mucha parte de la varianza al
azar, tendremos mayor incertidumbre.
El coeficiente de determinacin nos da hasta que punto la varianza pronosticada explica la varianza total del
criterio.
Si es muy cercana ser 1 => xito
Si es mucho ms pequea tendremos menos xito.
Cuanto ms grande es el coeficiente de determinacin ms pequea es la variable residual. Su valor mximo
es de 1 con lo que el % de acierto ser del 100% con un error y una variable residual nulos.
Toda la prediccin en psicologa se basa en la regresin. Con el fin de mejorar nuestras predicciones se
utilizan muestras ms heterogneas y se aumenta la longitud del test. Para esto se utilizan bateras de test, se
valoran las mismas variables. Hay que saber elegir los tests viendo los que correlacionan mejor. Hay formas
matemticas para saber que tests correlacionan mejor para medir una variable.
Cuando una variable se valora a partir de un test ( x predice a y) regresin lineal simple.
Cuando utilizamos varios tests para predecir una nica variable hiperplano de regresin. Si introduzco todos
los datos obtenidos en unos tests pido un hiperplano de regresin y me correlacionan los tests que mejor van a
medir la variable.
FACTORES QUE INFLUYEN EN LA PREDICCIN:
Que haya una correlacin entre el test y la variable que queremos medir. Cuanto ms alta sea la
correlacin mas probabilidades de xito.
Errores cometidos: standard o tpicos
error tpico de medida que cometemos en el test
Error tpico de estimacin cometido en la prediccin.
Cuanto ms alto sea el error mayor incertidumbre habr.
Que el test sea confiable (coeficiente de confiabilidad del test). El mtodo nos va a dar datos sobre la
confiabilidad.
Indice de fiabilidad: hasta que punto muestra limitacin terica, hasta que punto nuestro instrumento es
valido.
La validez predictiva del instrumento
Variabilidad de las medidas: cuanto mayor es la variabilidad de la distribucin de las medidas del grupo,
mayor es la probabilidad de xito en nuestra prediccin.
Cuanto ms bajo es el coeficiente de alienacin y ms alto el coeficiente de prediccin mayores sern
las probabilidades de xito.
18
Con una varianza residual baja y un coeficiente de determinacin alto ser mayor el nivel de
prediccin
Longitud del test: Mayor probabilidad de predecir bien cuanto ms largo sea ya que tenemos mas muestras
de conducta.
Factor de correccin: correccin por inconfiabilidad o por atenuacin. Se intenta corregir tericamente los
errores en la medida. Nos permite saber hasta que punto si yo corrigiera la inexactitud del test y del criterio
se mejorara nuestra prediccin.
correccin del test y del criterio:
correccin del criterio:
correccin del test
Se realiza para saber si merece la pena hacer correcciones en el test que tenemos o hacer otro test.
UTILIDAD DE LA PREDICCIN:
Hacer una prediccin es muy arriesgado porque hay muchos factores que pueden cambiar las circunstancias
internas y externas.
Las predicciones son siempre relativas, estn basadas en la ley de la probabilidad. Son imprecisas ya que
cometemos errores y podemos caer en el error de etiquetar a una persona. Tambin corremos el riesgo de que
s de la profeca autocumplida.
Predecimos en situaciones de orientacin, a nivel de orientacin vocacional o laboral, en seleccin de
personal, al dar un consejo psicolgico, al dar informacin para la roma de decisiones, al intervenir
teraputicamente, al realizar programas de entrenamiento, al investigar...
Apoyamos las predicciones en tcnicas evaluativas (test psicomtricos), es decir, en los datos obtenidos. Cada
test por separado es un indicador parcial, la prediccin ser ms fiable si est buscada en ms de un test.
19

Introducción:: Tema 1: El Problema de La Medición en Psicología

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Introducción:: Tema 1: El Problema de La Medición en Psicología

Cargado por

Copyright:

Formatos disponibles

resumen psicometra

TEMA 1: EL PROBLEMA DE LA MEDICIN EN PSICOLOGA

nica definicin de un atributo.

categoras: representan grupos de objetos

Manual, pautas de manejo

lo primero que se planifica es el diseo de la prueba

Empricamente la confiabilidad o la inconfiabilidad se miden por los estadsticos de relacin.

(PV) de ese grupo.

correlacin con las otras dos variables.

determinamos esa variable desconocida a travs de una determinada frmula.

También podría gustarte