Resumen de Documentos de Psicometria

Resumen evaluación psicológica, historia y antecedentes. Cap 1 y 2.
Antecedentes precientíficos: de la antigüedad al siglo XIX

★ Las primeras evaluaciones de aptitudes datan del año 2.200 a.C en China.
★ Platón: todas la personas difieren de algo, en cada persona están desarrolladas unas
capacidades más que otras.
★ Aristóteles: plantea que hay diferencias en las características mentales y morales de
los individuos de acuerdo con el nivel social, la raza y el sexo, y las atribuye a factores
innatos.
★ Descartes: establece una separación radical entre el mundo material (los cuerpos),
regidos por una necesidad mecánica de moverse, y el alma, que es una propiedad
exclusivamente humana caracterizada por el pensamiento inteligente.
★ Empirismo: la experiencia es la única fuente válida de conocimiento.
★ Locke: el objeto de conocimiento humano son las ideas, pero considera que no hay
más ideas en nuestro entendimiento que las que provienen de la experiencia.
★ Francis Bacon: la única forma de dominar la naturaleza es observándola, es preciso
estudiar lo que sucede, anotar los resultados y hacer experimentos para reforzar las
observaciones realizadas.
★ El empirismo inglés es el antecedente de la doctrina filosófica del positivismo,
iniciada en la primera mitad del siglo XIX, que identifica al verdadero conocimiento
como aquel derivado del método científico o conocimiento positivo.
★ Franz Joseph Gall: planteó que las facultades psíquicas estaban localizadas en el
cerebro y que podrían ponerse al descubierto al analizar las protuberancias
craneales.
Antecedentes pre científicos: siglos XVIII y XIX

★ Quetelet: astrónomo belga, pensó que la distribución normal también podía ser
usada para explicar algunos aspectos de la conducta humana; el afirmaba que era
posible identificar regularidades de comportamiento que caracterizan al hombre
promedio y así contrastarlas contra el comportamiento de individuos aislados a
través de las desviaciones de los mismos sobre una curva normal.
★ Psicofísica: Weber y Fechner.
el primer problema de medición psicológica que el estudio de las sensaciones.
★ Los filósofos y los primeros psicólogos se interesaron por estudiar el umbral de
conciencia, a lo que se le llamó “limen”: que es el punto o el umbral en el cual se
llega a adquirir conciencia visual, auditiva o cinestésica de la existencia de un objeto.
★ Ley de Weber: indica que la cantidad de excitación que se necesita para distinguir
entre una sensación y otra, está en una relación constante con la sensación inicial; si
la cantidad de excitación se aumenta poco a poco, la primera sensación no cambia al
principio, y para que el sujeto pueda percibir el aumento, esto es, experimentar una
sensación diferente, se requiere un aumento importante proporcional a la excitación
primera.
★ La obra de Fechner, a quien se le considera el padre de la psicofísica, es importante
porque demostró de manera concluyente que los problemas de la psicología pueden
analizarse mediante métodos cuantitativos, y además se ve reflejada en el amplio
desarrollo posterior de las pruebas psicológicas. En palabras de Kantor (2005), si bien
Fechner es el fundador de un culto que decía medir la relación entre el cuerpo y la
mente, desde el punto de vista de la psicología científica se le reconoce como
auténtico estudioso de la conducta, y por tanto, como líder del avance científico.
★ Wundt: Psicología experimental=psicología fisiológica.
Aportes de Wundt a la evaluación psicológica:
1. Concentra la experimentación en psicología en la estandarización de las condiciones
y la precisión de la medición, y enfatiza la importancia de realizar las observaciones de
todos los sujetos bajo condiciones tipificadas.
2. Contextualiza a la psicología dentro de las ciencias naturales como ciencia empírica
y, por tanto, separada de la filosofía.
3. Postula el método experimental para el estudio de la conciencia, ya que todo
elemento de ésta se deriva directa o indirectamente de la sensación y toda idea compleja
es una combinación asociativa de elementos más simples.
4. En aras de la objetividad, limita sus observaciones a los procesos más elementales de
la conciencia, tales como tiempos de reacción, sensaciones auditivas y visuales,
percepción, psicofísica, reacciones motrices simples y asociación, al considerar que los
fenómenos mentales más complejos como el pensamiento no podrían ser estudiados en el
laboratorio
★ Teoría de la evolución de Charles Darwin.

La teoría de la evolución de Darwin favoreció el estudio de las diferencias
individuales en psicología, ya que si estas diferencias en las plantas y animales
explicaban su diversa capacidad para adaptarse y sobrevivir, las mismas tendrían en
los seres humanos una importancia funcional; y si las plantas y los animales
heredaban características ancestrales, algunas de las características individuales de
los seres humanos podrían ser explicadas sobre la misma base de la herencia.
★ Galton: primeros estudios sobre las diferencias individuales.

- Intento crear el estudio de la eugenesia, cuyo propósito sería el mejoramiento de la raza
humana y la creación de un mundo de seres humanos superiores por medio del control de
la reproducción.
- Galton creía que la capacidad mental de cualquier tipo dependia de los procesos
psicológicos mas elementales.
- En 1883 publica su obra Inquiries into human faculty and its development, punto de partida
de las pruebas mentales—, donde enfatiza las diferencias individuales de acuerdo con las
facultades mentales.
- karl Pearson: es el primer investigador en psicología que utilizó y desarrolló métodos
estadísticos para analizar los datos provenientes de sus mediciones.
★ Alfred Binet: la primera prueba psicométrica de inteligencia.

- Binet es el primero que plantea un concepto claro de diagnóstico psicológico como sinónimo de
evaluación de la inteligencia, al distinguirlo del examen médico y de la evaluación pedagógica
(análisis de los aprendizajes). Destaca que una prueba psicológica debería contar con tres
requisitos: tareas simples, aplicación rápida y resultados contrastables por otros observadores.
- Binet sentó las bases para la estandarización de las pruebas psicológicas objetivas.
- La prueba elaborada por Binet es el comienzo de la evaluación de la inteligencia como la
conceptualizamos en la actualidad, es todavía el prototipo de las pruebas modernas que miden
inteligencia y, aún más, es la primera prueba realmente psicométrica en la historia de la
psicología.
- En 1916 Terman realizó una traducción para la universidad de Stanford, lo que se conoció como
la prueba de Stanford-Binet.
- Las aportaciones de Binet a la evaluación psicológica son: el interés por la evaluación de las
funciones psicológicas superiores, la consideración del examen psicológico como independiente
del médico y del pedagógico y, desde luego, su aportación más grande, la construcción de la
primera prueba realmente psicométrica de inteligencia.
★ Guerras mundiales: primeras pruebas colectivas de inteligencia y de aspectos emocionales.

- Cuando Estados Unidos participa en la primera guerra mundial, ve la necesidad de evaluar a los
individuos reclutados con la finalidad de detectar su capacidad intelectual y admitirlo en el
ejército, seleccionar a aquellos de alta capacidad para asignarlos a puestos de responsabilidad y
descartar a los de baja capacidad.
- En la APA, Yerkes y Terman elaboran una prueba colectiva de inteligencia, ya que era difícil
evaluar a grandes poblaciones con la prueba de Binet.
- Army Alfa Test era breve y contenía ocho subpruebas con elementos verbales: 1) seguimiento
de instrucciones orales, 2) razonamiento aritmético, 3) juicio en materias prácticas, 4) pares de
sinónimos-antónimos, 5) oraciones en desorden, 6) completar series numéricas, 7) analogías e
8) información general. Posteriormente, se construyó una versión no verbal de la misma, el
Test Beta, para aplicarse a personas analfabetas o bien con poco dominio del idioma inglés.
- Woodworth: construyó un cuestionario de 116 reactivos llamado The Personal Data Sheet, que
esencialmente formulaba la clase de preguntas que se utilizarían en una entrevista para medir
ajuste personal (adaptación del individuo al hogar, a la escuela y con sus amigos).
- Test de Rorschach (o test de las manchas): se le pedía al sujeto que interpretara las manchas, lo
cual servía para conocer los rasgos e impulsos más profundos que determinan la conducta
manifiesta del individuo.
★ Segunda Guerra Mundial: se presentó la necesidad de contar con métodos para clasificar a los
individuos.
- la Segunda Guerra Mundial tuvo como consecuencia la instrumentación del mayor programa de
pruebas jamás emprendido, lo cual permitió la ampliación de los fundamentos lógicos y los
métodos de medición en psicología y el avance de la psicología de las pruebas.
- Han sido las necesidades sociales de cada época las que han determinado la construcción de
pruebas específicas para detectar, en un primer paso, la existencia de un problema, en segundo,
determinar la intensidad o gravedad del mismo y en tercero, con los datos obtenidos de la
aplicación de pruebas, orientar hacia su solución.
★ Thurstone: La psicometría como rama de la psicología
- La historia de la evaluación psicológica por medio de pruebas psicométricas es relativamente
reciente, apenas poco más de un siglo, y el establecimiento de una metodología que garantizara
las propiedades lo es aún más (apenas tres cuartos de siglo).
- Aparece el libro de L. L. Thurstone: The Reability and Validity of Tests y, en 1935, se establece la
Sociedad Psicométrica Americana presidida por él mismo, con el objetivo de estimular el
desarrollo de la psicología como ciencia cuantitativa y racional, y la cual destaca que la
psicometría debería estar al servicio de los problemas psicológicos mediante el estudio de las
propiedades métricas exigibles a las mediciones psicológicas.
- 1921: Cattell, Thorndike y Woodworth fundan la primera editorial importante de pruebas: la
Psychological Corporation.
Meneses, J (2017) La evaluación psicométrica. Editorial UOC. Barcelona. Capítulo 1 (resumen)
★ Aproximación histórica a la psicometría:

- El desarrollo de las primeras dinastías del antiguo imperio chino generó los primeros sistemas
de evaluación de los individuos en función de su habilidad. Durante estos años se desarrolló un
sistema de evaluación imperial que permitió la selección y promoción de los funcionarios de los
diferentes departamentos de la administración.
- Otro antecedente remoto se encontraría en los inicios de la evaluación psiquiátrica a mediados
del siglo XIX. Se desarrollaron los primeros tests para evaluar las consecuencias del daño cerebral,
alguno de ellos tan elaborado que exigía una administración durante periodos de 100 horas.
- Los antecedentes recientes de la psicometría se encontrarían en el desarrollo del estudio
sistemático de las diferencias humanas durante el siglo XIX. Gracias a los trabajos de Friedrich W.
Bessel (1784-1846) y Carl F. Gauss (1777-1855) –que fueron pioneros en el estudio de las
diferencias individuales en la percepción en el campo de la astronomía– y después a las
contribuciones de Gustav T. Fechner (1801-1887) y Hermann von Helmholtz (1821-1894) en el
desarrollo de la psicofísica –que supuso el inicio de la psicología como disciplina académica–,
ambas aproximaciones constituyeron un avance importante en la sistematización de la medida de
las sensaciones psicológicas producidas por la estimulación física.
Pioneros de la psicometría moderna:

- Sir Francis Galton
- James Mckeen Cattell
- Alfred Binet.
- Galton y Cattell: contribuyeron al establecimiento de la psicología experimental con la creación
de los primeros laboratorios antropométricos para el estudio de las diferencias humanas y el
desarrollo de los primeros test para la evaluación de las diferencias sensoriales, perceptivas y de
comportamiento en Europa y Estados Unidos.
- Binet y su colega Théodore Simon recogieron los incipientes movimientos en la evaluación de la
discapacidad cognitiva mediante baterías de tests. En 1905 desarrollaron la primera prueba que
permitió clasificar a los niños según su inteligencia.
- Evaluación de la cognición: Lewis M. Terman (1877-1956), en 1916 publicó la revisión Stanford-
Binet. Ésta contribución estableció un importante hito en el desarrollo de los tests tal y como los
conocemos en la actualidad. Es la escala de referencia para la medida de la inteligencia. El uso de
esta escala se extendió al uso del ejército norteamericano durante la Primera Guerra Mundial.
- Robert Yerkes (1876-1956): desarrolló los test army alfa y beta. que también abordaron una
controversia importante sobre los sesgos culturales de los tests que se fue construyendo durante
estas primeras décadas del siglo XX.
- Charles Spearman (1863-1945): Propuso una importante corriente que concibió la inteligencia
como un único factor –el factor g, según Spearman–, que explicaría las puntuaciones en los
diferentes tests de inteligencia desarrollados hasta el momento.
- Luis León Thurnstone (1887-1955): Propuso una posición alternativa en la cual la inteligencia
estaría compuesta por varios factores específicos.
- Robert S. Woodworth (1869-1962) fue el encargado de desarrollar un nuevo tipo de prueba
que permitiera evaluar la estabilidad emocional de los soldados. Este test, su Personal Data Sheet,
introdujo un conjunto de preguntas con respuesta positiva o negativa que, a diferencia de la
evaluación de la inteligencia, no contenía respuestas necesariamente correctas o incorrectas.
- Thurstone: Desarrolló las primeras pruebas de análisis de consistencia interna de los tests en el
ámbito de la evaluación de la personalidad, hizo otra contribución importante al desarrollo de la
psicometría. Propuso en 1927 la ley del juicio comparativo como el método para la medida de
aptitudes, las preferencias y los valores.
- Fundó y fue el primer presidente de la psychometric society. Fue el impulsor de la primera
revista de psicometría llamada Psychometrika.
★ Psicometría hoy:
- Podríamos definir el periodo entre los años 30 y 60 como la época dorada de la psicometría. En
este periodo es cuando se publican, además, los libros y manuales más importantes que la
vertebrarían. Entre los manuales hay que destacar The reliability and validity of tests, de
Thurstone (1931), que sistematizaba lo que se había desarrollado hasta el momento en relación
con la teoría de los tests y sugería el papel central de la fiabilidad como requisito para la validez de
las medidas en la psicometría.
★ Teoría clásica de los test (Spearman): sobre la estimación de los errores de medida. La TCT
propone un nuevo enfoque basado en el concepto de puntuación verdadera. Partiendo de la
puntuación empírica obtenida mediante los tests, y siguiendo un conjunto determinado de
supuestos, el objetivo es descomponerla en dos partes fundamentales para valorar el error
asociado al proceso de medida y, así, inferir el valor real que se pretende medir.
★ Medir: Consistía en cuantificar, es decir, determinar la magnitud con la que un atributo está
presente en un objeto.
★ Stevens definió la medida como el proceso de asignación de números a objetos o

acontecimientos de acuerdo con unas reglas, producto de las cuales se obtendrían los
diferentes tipos de escalas propuestas: nominal, ordinal, de intervalo y de razón. Medir, en
este sentido, no consistiría únicamente en cuantificar, sino que sería el producto de la
utilización de diferentes reglas que, en último término, determinarían el tipo de operaciones
–o técnicas– estadísticas permitidas en cada escala.
★ Cronbach y col: Teoría de la generalizabilidad: mediante la aplicación del análisis de
varianza, permitiría descomponer el error genérico propuesto por la TCT en la búsqueda de
sus diferentes elementos. Así, de acuerdo con esta teoría, el análisis de la fiabilidad se basa
en el diseño de investigaciones que permiten analizar las diferentes fuentes de error –facetas,
según sus términos– que afectarían al proceso de medida.
★ La psicometría en el contexto de la evaluación psicológica:

- La psicometría, contribuye al desarrollo de la evaluación psicológica proporcionando teorías,
métodos y técnicas que, en última instancia, permiten describir, clasificar, diagnosticar,
explicar o predecir los fenómenos psicológicos objeto de medida.
- Una segunda corriente define la psicometría a partir del objeto al que somete o aplica su
interés. Así, la psicometría se define de manera más o menos genérica como la disciplina
científica orientada a la evaluación o medida de los fenómenos psicológicos.
★ Definición y clasificación de los test.

- Test: un test psicológico es un procedimiento de medida objetiva y estandarizada de una
muestra de comportamientos.
- La medida mediante el desarrollo de test pretende ser objetiva.
- La objetividad hace referencia a la sustitución del juicio personal basado en criterios
subjetivos por un conjunto de normas determinadas y conocidas que permiten obtener e
interpretar las puntuaciones de los individuos en igualdad de condiciones.
- La medida que pretenden los tests es estandarizada, en cuanto a que las puntuaciones
obtenidas dependen de un procedimiento establecido, de administración, corrección e
interpretación que las hacen.
- Los tests se enfrentan a los fenómenos psicológicos no observables mediante una muestra
de comportamientos. En la medida en que esta muestra sea representativa del conjunto, las
puntuaciones obtenidas permitirán a los profesionales establecer adecuadamente sus
inferencias sobre el comportamiento general de las personas más allá de los elementos
específicos evaluados mediante tests.
- El objetivo habitual de la medida de las magnitudes físicas es obtener información sobre un
único objeto. En cambio, La psicometría (magnitudes psíquicas), en cambio, se propone
desarrollar instrumentos que permitan obtenerla sobre un grupo de individuos con el
objetivo de extraer conclusiones sobre cada uno de ellos, sobre el grupo entero, e incluso
extrapolar sus resultados a las poblaciones de referencia de donde provienen estos
individuos.
- Reactivo: Consiste en producir una reacción en el comportamiento de los individuos para
registrarlo y obtener una puntuación como resultado del proceso de medida.
- El valor de un test se encuentra en su capacidad para suscitar y medir comportamientos que
resulten un buen indicador del conjunto global de comportamientos implicados en los
fenómenos de interés.
- Teoría sustantiva : sólida y bien establecida sobre el comportamiento de las personas –ej:
una teoría de la inteligencia–, que dará el soporte teórico necesario para definir los
elementos críticos que conforman estos fenómenos y determinará los comportamientos
implicados que serán empleados como evidencias observables en el proceso de medida.
- Teoría de los tests: permite establecer las inferencias sobre los fenómenos psicológicos no
observables a partir de las puntuaciones obtenidas en el proceso de medida.
- Test de habilidad o de potencia: tienen como objetivo evaluar la competencia, la aptitud o
los conocimientos de los individuos a partir del acierto o la calidad de sus respuestas. Son
pruebas que discriminan respuestas correctas e incorrectas y esta es la base para puntuar las
ejecuciones individuales.
- Test de personalidad: tienen un objetivo diferente y pretenden conocer de manera general
las motivaciones, preferencias, opiniones o actitudes de los individuos frente a un
determinado estímulo. Este segundo tipo de tests no tienen respuestas correctas y por lo
tanto no sirven para evaluar el acierto o el error de los individuos.
- Batería: test compuesto por varias partes, como a una selección de diferentes tests
administrados conjuntamente por un profesional en una evaluación psicológica determinada.
★Clasificación de los test según sus características más importantes:

- Según el propósito: Los test pueden tener diferentes finalidades:
1. El diagnóstico: orientada a la evaluación de las condiciones actuales de los individuos. La
mayoría de pruebas sirven para diagnosticar y para potencialmente hacer predicciones o
inferencias a futuro.
2. La predicción: se propone relacionar la medida actual con el comportamiento de las
personas en situaciones futuras.
- Según el contenido: clasificación de los test según el área de la psicología a la que
pertenecen los fenómenos psicológicos que pretenden medir. En el nivel mas general se
pueden distinguir tres grandes grupos: los tests orientados a la evaluación de las
habilidades cognitivas, la personalidad y las actitudes.
- Según el formato: Test de lápiz y papel, tests computarizados, test de manipulación
(aquellos que presentan una serie de objetos, imágenes o rompecabezas que los
individuos deben resolver demostrar su habilidad, test de medidas fisiológicas.
- Según el tipo de administración: Test individuales o grupales, test verbales y no verbales.
- Según el tratamiento de las respuestas: Evalúan el acierto en las respuestas para determinar
la competencia, la aptitud o los conocimientos de los individuos.
*o si tratan de evaluar motivaciones, preferencias, opiniones o actitudes.
*Pruebas de ejecución máxima: también denominadas tests de habilidad o de potencia–, que
tienen por objetivo evaluar la competencia, la aptitud o los conocimientos de los
individuos a partir del acierto o la calidad de sus respuestas. Este tipo de pruebas
discriminan respuestas correctas e incorrectas. Aquellas donde se califiquen buenos y
malos y donde hayan algunas restricciones como el tiempo o los primeros que entreguen
el ejercicio. Puede o no tener un tiempo límite para la ejecución de la prueba.
*Pruebas de ejecución típica: –o de ejecución de rasgos– son aquellas que miden aspectos no
escalables, o dicho de otra manera, a aquellas cuyas preguntas no tienen respuestas
correctas ni erróneas, sino que se trata de aspectos de opinión, de preferencia o similar.
- Según la interpretación de las puntuaciones:
- Test normativos: permiten comparar la puntuación del individuo con la ejecución observada
en un grupo de referencia que previamente ha respondido al mismo test. Son todos
aquellos en los que se van a utilizar baremos. Baremos: La puntuación directa del sujeto no
es relevante o no dice nada, sino que se debe transformar a la media del grupo. La
interpretación se hace a partir del resultado de un grupo.
- Baremo: Conversión de la puntuación directa a partir de medidas.
- Test referidos a criterio: toman como referencia la definición de un dominio de
conocimientos o habilidades específicos y permiten medir la ejecución del individuo no ya
en comparación con un grupo de referencia, sino en función de su grado de adecuación o
consecución de este criterio.
- Según el estatus comercial:
Test propietarios: se debe hacer un pago para usarlos.
Test abiertos o no comerciales: se obtienen contactando al autor.
Nivel de medición: Presencia-ausencia, grado y diferenciación.
Ejemplo de Ficha técnica (clasificación)

Nombre: Examen cognoscitivo Mini-mental
Administración: Individual
Ámbito de aplicación: Adultos con posible deterioro cognitivo
Duración: 15 minutos aproximadamente
Finalidad: Detección rápida de funciones cognoscitivas
Material: Manual y hoja de anotación
★ Modelos de medida psicométrica:

- Modelo representacional: Define la medida como el proceso de asignación de números a
objetos a partir de unas reglas, de modo que reflejen relaciones empíricas entre los objetos.
Medir no sería únicamente cuantificar, sino la representación numérica de los hechos
empíricos en sentido amplio, y daría como resultado cuatro escalas clásicas para la psicología
según el tipo de relación representada: escala nominal, ordinal, de intervalo y de razón.
- Modelo operacional: La medida es el conjunto de operaciones necesarias para definir un
concepto que, en última instancia, acaban produciendo números.
- Modelo clásico: Define la medida como la determinación de la cantidad –del cuánto– en la
que un atributo esté presente en el objeto medido. Es decir, medir consiste en determinar
cuántas unidades están presentes en el atributo observado. No exige la existencia de una
relación empírica entre los objetos.
- Estos tres modelos de medida: representacional, operacional y clásico, se corresponden con la
teoría representacional, la teoría clásica de los tests y los modelos de variable latente,
respectivamente.
★ Teoría clásica de los test.

- Centra su atención en el análisis de las puntuaciones obtenidas para valorar los errores
cometidos en el proceso de medida indirecta de los fenómenos psicológicos.
- X= V+e
- (X): Es la llamada puntuación empírica
- V: Puntuación verdadera: que sería el resultado ideal o deseado
- (e): error de medida: es la discrepancia entre la puntuación verdadera que se pretende
conseguir y la puntuación empírica obtenida como resultado de la administración del test.
★ Proceso de inferencia matemática: Este es el proceso que la psicometría sigue para

establecer sus inferencias sobre los fenómenos psicológicos no observables a partir de las
puntuaciones obtenidas mediante tests. Se ajusta al método científico.
1. Formular una pregunta de investigación o una hipótesis relevante.
2. Especificar y definir adecuadamente todas las variables involucradas.
3. Desarrollar o elegir los instrumentos y procedimientos necesarios para llevar a cabo las
medidas.
4. Evaluar el funcionamiento de los instrumentos y procedimientos para obtener las garantías
suficientes sobre la calidad del proceso de medida.
5. Recoger las evidencias necesarias que permitan responder a los objetivos de la
investigación.
6. Resumir y, siempre que sea posible, tratar estadísticamente los datos obtenidos para
determinar hasta qué punto los resultados son significativos y, por lo tanto, no son producto del
azar.
● El error es un componente inherente a cualquier proceso de medida y debe ser objeto de un

tratamiento adecuado para conocerlo y minimizarlo.
★ Principios básicos: garantizan la confianza en las inferencias establecidas a partir de las

puntuaciones obtenidas mediante tests. Estos principios sirven para evaluar las propiedades
psicométricas de los ítems y de los tests en su conjunto: fiabilidad y validez.
- Fiabilidad: la precisión con la que los tests llevan a cabo la medida.
- Validez: la confianza en que las medidas se corresponden realmente con lo que se proponen
medir.
★ Construcción: fases fundamentales para la construcción de un test.
1. Delimitación de la finalidad del test: un propósito bien delimitado es la primera condición
que hay que cumplir para garantizar el éxito en la construcción de un nuevo test y permitirá su
introducción en el proceso de evaluación psicológica.
2. Definición de los fenómenos psicológicos objeto de medida: es necesaria una teoría
sustantiva sólida y bien contrastada sobre los fenómenos psicológicos y los comportamientos de las
personas que servirá de referencia en el proceso de medida del nuevo test.
3. Selección y muestreo de los comportamientos observables.
4. Especificación de las características del test: elegir las características del nuevo test para
suscitar y medir adecuadamente los comportamientos de interés.
- Selección del método más adecuado para interpretar las puntuaciones obtenidas.
- Selección del formato del nuevo test.
5. Desarrollo de los ítems que conformarán el test: se lleva a cabo el desarrollo de los
elementos que contendrá el test.
- Selección del formato que adoptarán las respuestas.
6. Elección de la teoría de los test: servirá para relacionar los fenómenos psicológicos objeto de
interés y las puntuaciones obtenidas mediante los ítems que conforman el nuevo test.
7. Realización de un prueba piloto: Servirá para evaluar el grado de comprensión de estas
instrucciones, la viabilidad de las condiciones para administrar el test, detectar posibles dificultades
en el momento de registrar las respuestas y llevar a cabo un primer análisis de las propiedades.
8. Desarrollo del estudio de campo: administración a la población a la que se dirige.
- Selección de la muestra
9. Elaboración del manual del test: Desarrollar la documentación que acompañará el nuevo
test donde se incluye información relevante relativa a las diferentes fases involucradas:
fundamentación teórica, finalidad y población, instrucción de la aplicación, información para la
interpretación de puntuaciones obtenidas y análisis de las propiedades psicométricas.
10. Revisión y mejora del test.
 Cuando yo construyo una prueba: Debo hacer confiabilidad y validez.

 Cuando se trae una prueba de otro contexto cultural se debe hacer: validación, adaptación y
estandarización.
Capítulo 2 Meneses: Fiabilidad

- En psicometría nos referimos a la fiabilidad como aquella propiedad que valora la consistencia y
precisión de la medida.
- No obstante, sabemos que cualquier proceso de medida (se esté midiendo un objeto físico o un
aspecto psicológico) se asocia a algún grado de error.
- La medida perfecta no existe.
- El estudio de la fiabilidad de un instrumento de medida debe permitir conocer hasta qué punto los
resultados que se obtienen a partir de su aplicación están afectados por el error que se ha cometido al
medir.
- Si el error es pequeño, podemos confiar en el resultado del test; si el error es grande, el proceso
de medición deja de tener sentido.
- Fiabilidad desde la perspectiva de la teoría clásica de los test: la fiabilidad de un test está
relacionada con los errores de medida aleatorios presentes en las puntuaciones obtenidas a partir de su
aplicación. Así, un test será más fiable cuantos menos errores de medida contengan las puntuaciones
obtenidas por los sujetos a quienes se les aplica.
29/04/2020
- Confiabilidad: Es la precisión en la medida, es cuando se hace una repetición de la medida, se

busca la disminución del error. entre más grande se la diferencia más grande es el error.
- Errores sistemáticos: errores que se repiten.
- Errores aleatorios: de confiabilidad: del evaluado o del evaluador
- Coeficiente de fiabilidad (TCT de Spearman): el coeficiente de fiabilidad de un test es la correlación

entre las puntuaciones obtenidas por un grupo de sujetos en dos formas paralelas del test. Cualquier
valor inferior a 1 se deberá a los errores aleatorios propios del instrumento de medida. Si las dos
aplicaciones tienen los mismos valores, la correlación va a dar 1. Cuando la correlación de las
aplicaciones da 1 quiere decir que los datos son iguales, lo cual no es normal que dé.
- La diferencia entre una aplicación y otra es lo que me va a dar el margen de error (error de
aplicaciones/errores aleatorios)
- Puntuación verdadera= aquello que el sujeto puede sacar.
- Puntuación empírica= se empieza a dar en las aplicaciones
- En la correlación de confiabilidad, valores cercanos a 0 denotarán una alta proporción de error y
valores cercanos a 1 menos proporción de error hay.
- Un intervalo aceptable en la correlación de confiabilidad estará entre 0,70 y 0,95.
- Coeficiente de correlación: entre los dos resultados de un test, el coeficiente de correlación debe
estar cercano a 1, aunque es muy sospechoso que de 1 exacto, por lo general da 0,9 o 0,7.
- El coeficiente de correlación se saca con Excel
-
- =coeficiente de correlación (resultados de aplicación 1: resultados de aplicación 2)
- La diferencia entre un test y otro me dará el margen de error.
- Teoría clásica de los test de Spearman:
★ Tipos de errores de medida: Estos errores están relacionados con las puntuaciones de los sujetos
individualmente consideradas. El error de medida es la diferencia entre la puntuación obtenida por un
sujeto en el test y su puntuación verdadera en la característica medida por este test.
★ La consistencia interna hace referencia al grado en que cada una de las partes de las que se
compone el instrumento es equivalente al resto.
★ Método de las dos mitades: si dividimos un test en dos mitades, estas deben ser equivalentes para
garantizar una adecuada consistencia interna. El grado de equivalencia de las dos mitades se puede
evaluar calculando la correlación entre las puntuaciones de los sujetos en estas dos mitades.
★ Spearman-Brown: el número de ítems que componen un test incide en su fiabilidad. Cuantos más
ítems contiene un test más elevada es su fiabilidad. Este efecto de la longitud de un test sobre el
coeficiente de fiabilidad hay que tenerlo presente al aplicar el método de las dos mitades.
Confiabilidad:
● Un coeficiente de confiabilidad es un índice de confianza, una proporción que indica la razón
entre la varianza de la puntuación verdadera en una prueba y la varianza total.
● Grado en que un instrumento produce resultados consistentes y coherentes. Es decir en que su
aplicación repetida al mismo sujeto u objeto produce resultados iguales.
● Es la precisión con que el test mide lo que mide, en una población determinada y en las
condiciones normales de aplicación.
● Un instrumento de medida psicológica será confiable si al evaluar a los mismos sujetos con el
mismo instrumento o con uno equivalente, las medidas obtenidas en la segunda aplicación son muy
similares a las obtenidas en la primera, esto es, son estables a través del tiempo, lo cual indicaría que los
errores de medición serían mínimos y, por lo tanto, la confiabilidad sería aceptable.
Estimaciones de confiabilidad: Las medidas de confiabilidad son estimaciones y las

estimaciones están sujetas a error. Permiten revisar un tipo de error específico, son para
revisar la consistencia en el resultado.
Estabilidad en la medida=Consistencia externa
- Test Retest: Es una estimación de la confiabilidad obtenida al correlacionar pares de
puntuaciones de las mismas personas en dos aplicaciones diferentes de la misma prueba. Se hace test
retest cuando se sospecha que hay errores de administración de la prueba. Ej: Hago una aplicación esta
semana y hago otra aplicación la otra semana. Test retest es mismo grupo de sujetos, misma prueba en
tiempos diferentes. La diferencia entre los primeros y los segundos resultados es el margen de error.
- Paralelas: Para cada forma de la prueba, las medias y las varianzas de las puntuaciones
observada son iguales Son dos versiones de la misma prueba que midan el mismo constructo (se hace
cuando se sospecha de hay errores de construcción de la prueba). Es la aplicación de dos versiones de la
misma prueba al mismo grupo de sujetos. No tiene espacio de tiempo, se hace continuamente.
-
- Consistencia interna: se hace cuando se sospecha que hay errores de construcción del test.
- Alternas: Son versiones diferentes de una prueba que se han construido para que sean paralelas.
Es muy complejo tener dos pruebas exactas.
- Mitades: Correlacionar dos pares de puntuaciones obtenidas de mitades equivalentes de una
sola prueba aplicada una sola vez. Se saca el total de los ítems pares e impares, se hace la correlación
entre ambas. por debajo de 0,5
cuando tenemos un test muy pequeño lo que hacemos es
*Una prueba se considera pequeña cuando tiene menos de tres ítems.
Corrección de la fórmula de spearman brown: Se necesita la correlación de las mitades
Coeficiente de confiabilidad = 2 * coeficiente de correlación/ 1+coeficiente de correlación
★ Errores de medida:
- Medida de confiabilidad entre evaluadores: La confiabilidad entre evaluadores es el grado de
acuerdo o consistencia que existe entre dos o más evaluadores.
- Consistencia interna: Grado en que los ítems que hacen parte de una escala se correlacionan
entre ellos, la magnitud en que miden el mismo constructo. Se mide a través de los estadísticos:
- Alfa de cronbach: que se considera como la media de todas las correlaciones que pudieran
obtenerse al dividir la prueba en todas las posibles mitades
- KR-20: Estadística utilizada para determinar la consistencia entre reactivos de tipo dicotómicos,
sobre todo aquellos que pueden ser calificados como correctos o incorrectos.
Modelos psicométricos:
TCT: Teoría de la puntuación verdadera
•X=V+e
• Modelo lineal aditivo
● El psicólogo debe garantizar que el instrumento que utilice mida con precisión y poco error. El
error está mezclado con la verdadera puntuación.
TRI: • Teoría del rasgo latente
• Reactivos individuales darán cuenta de la cantidad del rasgo.
TG: • Las puntuaciones obtenidas por una persona varían de una prueba a otra debido a variables en la
situación de aplicación.
Error estándar de medida: (desviación estándar) Es la herramienta que se usa para estimar o inferir la
distancia hasta la cual una puntuación observada se desvía de una puntuación verdadera.
Validez: Una prueba puede ser confiable sin ser válida. Sin embargo, para que la medida sea válida,
necesita primero ser confiable.
● No se valida el instrumento, sino la interpretación de los datos obtenidos por un procedimiento
específico.
Los tests. Mariano Yela (Resumen de documento)

★ Un test es una situación problemática, previamente dispuesta y estudiada, a la que el sujeto
debe responder siguiendo unas instrucciones y de cuyas respuestas se estima por comparación de la
respuesta de un grupo normativo, de calidad, índole o grado de algún aspecto de su responsabilidad.
★ Significa como sustantivo: reactivo y prueba
- como verbo: ensayar, probar o comprobar
★ Un test o un reactivo aplicado a un sujeto revela y da testimonio de la índole o grado de
instrucción, aptitud o manera de ser.
★ Test de inteligencia: consiste en un conjunto de preguntas, problemas o tareas cuya solución
depende de las capacidades intelectuales del sujeto.
★ Cada una de las tareas o preguntas e llama elemento o ítem.
★ Test psicometricos: su objetivo es medir o determinar el grado de algún rasgo mental.
Los elementos mas frecuentes en los test de inteligencia son:
- opuestos: el sujeto debe elegir los términos opuestos a una lista de palabras.
- Analogías: rojo es a sangre como amarillo es a…. limón
- Palabra que sobra: subraye la palabra que sobra de las siguientes: gris, marrón, amarillo, útil,
rojo.
- Serie de números: tiene una lógica y hay que averiguarla.
- Vocabulario: se presenta una serie de palabras y se le pide al sujeto que diga que significan.
- Información: consiste en una serie de preguntas de cultura general.
- Frases incompletas: es uno de los mejores elementos para apreciar la inteligencia. Consiste en un
texto al que le faltan algunas palabras que el sujeto debe de averiguar y escribir en los espacios en
blanco.
- frases desordenadas, juicios prácticos, absurdos, memoria de números, de palabras, ideas, de
formas, etc.
★ Test de personalidad: utilizan preguntas sobre aspectos de la conducta del sujeto como por
ejemplo sus preferencias y aversiones; actitudes y sentimientos; tendencias e inclinaciones; reacciones
emotivas, etc. Algunos test de personalidad utilizan el trazado de líneas y analizan el valor expresivo de
los trazos.
★ El método general al que se ajustan todos estos tests requiere:
- Hallar elementos reveladores de la característica que se desea medir.
- Plantear estos elementos de manera que puedan ser valorados cuantitativamente.
- Averiguar en un punto normativo las reglas para interpretar las diversas puntuaciones posibles.
★ Test proyectivos: pretenden revelar aspectos de la personalidad. Su objetivo no es tanto la
medida, como el diagnóstico Sus elementos suelen ser: palabras, colores, manchas, material plástico,
fotografías, films, etc.
- Uno de los test proyectivos mas conocidos es el test de la figura humana: el sujeto tiene que
decir que representa cada una y contar una historia acerca de la situación. La personalidad del sujeto se
proyecta en su interpretación. en estos test es importante averiguar la significación de las respuestas.
★ Origen y desarrollo:
- Galton en 1882 inauguró su laboratorio Antropométrico en Londres en el cual estudia la herencia
de aptitudes físicas y mentales, incorporó numerosos tests. Galton cree que la inteligencia puede ser
convenientemente apreciada a través de la actividad sensoriomotora.
- A finales del siglo XIX (1880 ->), esta época se caracteriza por el predominio de los test
sensoriales y motores, se comprobó su ineficacia como medida de la inteligencia. El uso incipiente de
test de procesos mas complejos.
- Segundo periodo: Escalas de inteligencia
Alfred Binet realizó las primeras escalas de inteligencia en los niños de las escuelas de París. Encontró
que los test son característicos de cada edad, es decir si un niño de 12 años resolvía correctamente un
test, revelaba que su edad mental también coincide con su edad cronológica. Y por el contrario, si un
niño de 12 años resuelve incorrectamente un test de su edad quiere decir que está atrasado
mentalmente.
Las características generales de todos los test de inteligencia son:
1. Predominio de elementos que hacen referencia a procesos cognitivos superiores.
2. Variedad de elementos. procurando estimular con ellos las mas diversas funciones mentales.
3. Normas valorativas fundadas en la edad cronológica.
4. Puntuación global indicativa de la inteligencia general del sujeto.
5. Aplicación individual del test.
- Tercer período: Test colectivos
Para el reclutamiento de los soldados estadunidenses de la primera guerra mundial era necesario
realizar test colectivos para clasificarlos según sus capacidades.
Características de los test colectivos:
1. Aplicación colectiva.
2. Predominio de elementos exactamente cuantificables y mayor exactitud en los aspectos
estadísticos del método.
3. Mayor facilidad, rapidez, economía y objetividad en la aplicación e interpretación
4. Generalización del uso de test manipulativos.
- Cuarto período: Test de personalidad.
- Hoja de datos personales de Woodworth (1927)
-Test Psicodiagnóstico de Rorschach(1921): visión comprensiva y dinámica de la personalidad.
-Se han creado innumerables test que pretenden revelar la personalidad o algun aspecto afectivo,
temperamental, social, etc.
- Sus características principales son:
1. Extender el método de los test al campo de la personalidad.
2. Inclinarse más a un análisis cualitativo que a la medición.
3. Crear un nuevo tipo de test: el proyectivo.
- Quinto periodo: el análisis factorial.

- Creador: Spearman.
- El análisis factorial es un método para averiguar experimentalmente lo que un test mide o aprecia.
-El análisis factorial ha influido decisivamente en el método de los test.
-Ha ofrecido una seria fundamentación teórica al uso de los antiguos test de inteligencia general,
mostrando que en la mayor parte de las funciones cognoscitivas intervienen un factor general (factor g)
★ Clasificación de los tests según:

- Normas generales del método.
- El fin que se persigue.
- Quien los da.
- Quien los recibe.
- El material que se emplea.
- La característica que pretenden estimar o medir.
★ Clasificación según su método:

- Psicométrico: se ajustan a normas cuantitativas, sus elementos son valorados por una
puntuación numérica y su resultado final es una medida. Se refieren a características psicológicas mas o
menos independientes. Los psicométricos son más rigurosos y exactos.
- Proyectivo: Se ajustan a normas principalmente cualitativas, sus elementos son valorados
cualitativamente en relación con el test total, su resultado final es un diagnóstico. Evalúan la
personalidad. Los proyectivos son más comprensivos pero a costa de dejar caer en subjetivismos
arbitrarios. Para aplicar test proyectivos se requiere más formación teórica y mayor experiencia clínica
que en los test psicométricos.
★ Clasificación según su fin:

- El fin de los test es doble: diagnosticar y medir.
- Hay test cualitativos y test cuantitativos.
- Los test pueden usarse como método práctico o método de investigación.
- El test se refiere a las características de las personas y el experimento se refiere a las
características de los fenómenos o procesos.
★ Clasificación según el examinador:

- Test personales: Son aquellos en los que la conducta o personalidad del examinador influye en
los resultados. En rigor todos los test son personales, e.j: Los proyectivos.
- Test impersonales: Son aquellos en donde el examinador se limita a establecer un rapport con el
grupo. e.j: los test colectivos
★ Clasificación según el sujeto que recibe el test:

- Individuales.
- Colectivos.
- Test para sujetos normales o anormales.
- Test destinado a una población general o grupos especiales.
- Test destinado a sujetos de todas las edades y a sujetos de edades específicas.
★ Clasificación según el material:

- Impresos
- Test manipulativos.
★ Clasificación según el rasgo que miden:
- Test de rendimiento: miden conocimiento.
- Test de aptitud: evalúan capacidades cognoscitivas y psicomotoras.
- Test de personalidad: evalúan los afectos, inclinaciones y aptitudes. Los tests de personalidad
pueden clasificarse según el fin que se proponen y según el medio que para ello utilizan.
★ El test como instrumento de medida.

- Todo test psicométrico debe reunir como mínimo tres condiciones fundamentales: ser válido, ser
preciso o fiable y estar tipificado: Para conseguirlo la elaboración de un test suele seguir el esquema
siguiente:
a. Definición del rasgo psicológico: rasgo unitario en personalidad
b. Selección de elementos apropiados:
c. Comprobación de la validez y precisión del test: demostrar que es suficientemente válido(eficacia
profesional), alta correlación con el criterio) y que es suficientemente fiable o preciso.
d. Tipificación del mismo: consiste en averiguar y ordenar las puntuaciones de la población, se
necesita seleccionar una prueba representativa de la misma llamada grupo normativo porque de él
se obtienen las normas (normas cronológicas, normas centiles, normas típicas). Las puntuaciones
obtenidas se ordenan en escala cuantitativa
- Normas cronológicas: son puntuaciones promedio según la edad del sujeto a quien se le aplica la
prueba.
★ Aplicación de los tests

Un test es un instrumento de medida y diagnóstico. Su eficacia depende de su validez y precisión como la
competencia y pericia del que lo usa. El resultado de un test puede y debe expresarse mediante un
número. Pero este número debe ser interpretado en relación con el comportamiento del sujeto
durante el examen y en función de las circunstancias de su conducta, todo test por exacto y válido
que sea, refleja solo un aspecto parcial de la personalidad del sujeto en su momento, arbitrariamente
fijado, de su vida. En el estudio del sujeto y de sus características psicológicas, el test es un medio
riguroso y fecundo, si se utiliza con discreción, pero no el único. sus resultados deben interpretarse y
ser complementados por otros métodos, a la luz de la historia personal del sujeto.
★ La medición de lo psicológico. José Muñiz, 1998 (Resumen de documento)
- Psicología científica: Es el estudio de la conducta humana y las leyes que la rigen. Como ocurre
con cualquier otra realidad, para una comprensión adecuada de la conducta humana hay que
entender tanto sus aspectos cualitativos como cuantitativos.
- Medir es inherente a todas las ciencias, y la psicología no es una excepción.
- El fin general de toda teoría de la medición, trátese de la ciencia que se trate, es estimar los
errores aleatorios de las mediciones, pues toda medición, mayor o menor, conlleva un cierto error.
¿Cuáles son las características esenciales que definen a lo psicológico como campo de estudio?
- Interacción entre la mente del organismo (aspectos neurobiológicos) y el ambiente (aspectos
socioculturales).
- Hay que comprobar que las mediciones son fiables y válidas
Inicios de la medición.
- Fechner fue el responsable de los primeros intentos de medición, investigó sobre la estimulación
y las sensaciones físicas.
- La tradición psicofísica constituye un campo con grandes implicaciones aplicadas. En la
actualidad gran parte de las investigaciones psicofísicas se llevan a cabo dentro del marco general de
la Teoría de la Decisión y de la Teoría de la Detección de Señales.
- La conducta humana responde a las leyes de la psicología y no de la lógica, por eso se ocupan de
ella los psicólogos y no los expertos en lógica.
- Otro campo de la medición psicológica en la que desembocan estos estudios psicofísicos es la
medición de las actitudes, en cuyo caso desaparece el continuo físico. Medir actitudes es averiguar
las preferencias de las personas hacia determinados estímulos, bien sean objetos, ideas o conceptos.
Las actitudes constituyen un entramado clave para entender a los humanos, son el cristal a través del
que miramos el mundo.
- La otra gran línea de progreso de la medición son los tests. El origen de éstos hay que ubicarlo en
las primeras pruebas sensomotoras utilizadas por Galton en su famoso laboratorio antropométrico
de Kensington. El primero en utilizar la palabra “test mental” será James McKeen Cattell.
- El verdadero inicio de los tests se producirá tras la primera guerra mundial. Estados Unidos
decide entrar en la guerra pero no dispone de ejército, y la selección y clasificación de los soldados se
lleva a cabo confiando en los test Alfa y Beta, diseñados a tal efecto por un comité dirigido por el
psicólogo Yerkes.
- Escalamiento de estímulos (Psicofísica y Actitudes) y escalamiento de sujetos (Tests).
¿Qué condiciones deben de reunir esas mediciones para que su uso sea el adecuado?
- Fiabilidad: Son los métodos y técnicas utilizadas por los psicólogos para estimar el grado de
precisión con el que están midiendo sus variables.
- Para el caso de las variables psicológicas, la propuesta pionera y más fructífera para la estimación
de los errores fue hecha ya a principios de siglo por Spearman (1904, 1907, 1913) y la denominamos
hoy Modelo Lineal Clásico, dando origen a todo un enfoque general sobre los tests que suele
conocerse como Teoría Clásica de los Tests.
- Modelo lineal clásico: A partir del modelo, mediante los desarrollos correspondientes, que aquí
se omiten, va a ser posible llegar a fórmulas operativas para la estimación de los errores (e), y por
ende de las puntuaciones verdaderas (V) de los sujetos.
- A principios del siglo XX Spearman propone un modelo muy simple para las puntuaciones de las
personas en los test: el modelo lineal clásico.
- Este modelo consiste en asumir que la puntuación que una persona obtiene en un test, que
denominamos su puntuación empírica, y que suele designarse con la letra X, está formada por dos
componentes. El primero, es la puntuación verdadera (V) y el segundo el error (e). Este último puede
ser debido a muchas causas que no podemos controlar. Es por eso que la TCT se ocupa de determinar
precisamente el error de medición.
- Esto podría expresarse de la siguiente manera: X = V + e
Hay tres razones por las cuales suceden los errores en la medición psicológica:
a. la propia persona evaluada, que viene con determinado estado de ánimo, actitudes y temores
ante el test, ansiedad, o cualquier tipo de evento previo a su evaluación, todo lo cual puede influir en
la cuantía de los errores.
b. el instrumento de medida utilizado, que con sus características específicas puede influir
diferencialmente en los evaluados.
c. la aplicación, corrección e interpretación hecha por los profesionales.
- Teoría de la Generalizabilidad propuesta por Cronbach y colaboradores: Mediante el uso de

complejos diseños de Análisis de Varianza, este modelo permite hacer estimaciones sobre el tamaño
de distintas fuentes de error previamente contempladas en el proceso de medición.
- Teoría de las respuestas a los ítems:
Validez: Es el grado en el que la evidencia empírica y la teoría apoyan la interpretación

de las puntuaciones de los test relacionada con un uso específico.
 Validez es la confianza en que las medidas se corresponden realmente con lo que se proponen
medir.
 Una prueba puede ser confiable sin ser válida. Sin embargo, para que la medida sea válida,
necesita primero ser confiable
 No se valida el instrumento, sino la interpretación de los datos obtenidos por un
procedimiento específico.
 La validez de una prueba concierne a lo que ésta mide, su eficacia y lo que se puede inferir
de los puntajes obtenidos en la prueba.
 La validez aplicada a una prueba, es un juicio o una estimación acerca de qué tan bien una
prueba mide lo que pretende medir en un determinado contexto. Ninguna prueba ni técnica
de medición es «universalmente valida» para todo tiempo, para todo uso, ni con todo tipo
de población.
 La validez de una prueba disminuye debido a cambios en la cultura o en la época, esa validez
debe ser probada de nuevo en diferentes periodos.
 Se considera que un test es válido para evaluar cualquier aspecto con el que correlacione.
 La validez revisa los indicadores o el constructo de la prueba, a diferencia de la confiabilidad
en la que se revisan los resultados de la prueba. Se hacen análisis internos de cómo se
comportan los ítems (el constructo teórico en determinada población)
 Lo primero que yo voy a tener en una prueba es el constructo y el constructo se va a definir
por esos factores que conforman la prueba. Cuando yo hago un ejercicio de validez de
constructo lo que estoy esperando es que la prueba me confirme esos factores en los cuales
se ha configurado la prueba. A partir de los ítems que conforman la prueba se debe revisar si
eso es real o no.
 Comunalidades: me dicen como está variando cada ítem en relación al análisis completo, es
que tanto le aporta o no le aporta a ese factor.
 Varianza total explicada:
 Correlación positiva: es que tanta similitud se encuentran los ítem entre sí y que tanta
similitud hay en la varianza de los ítems. Que tanto se puede equiparar unos ítems con
otros.
 Correlación negativa: Son ítems que tiene poca variabilidad y hay que eliminarlo porque casi
no aportan información. Si todos los ítems dan 0 o 1, quiere decir que uno hubo variabilidad.
Percepción trinitaria.
 Validez aparente: Es un juicio concerniente a cuán relevantes parecen ser los reactivos de la
prueba. Si una prueba definitivamente parece medir lo que pretende medir. Los juicios son
considerados desde quien responde la prueba.
 Validez de contenido: hace referencia a que los ítems que componen el cuestionario sean
representativos de aquello que se pretende evaluar. Es el grado en que un instrumento
abarca una muestra representativa de las conductas de un objeto de evaluación. Se realiza
un análisis (de dificultad) de los ítems/reactivos  lo realizan los jueces expertos, quienes
miran 4 características del ítem:
- Pertinencia: en relación al indicador, que el reactivo pertenezca al indicador para el cual
fue diseñado.
- Relevancia: que tan importante es ese reactivo, con respecto al atributo que esté
midiendo.
- Claridad: Está relacionado con la redacción del ítem enfocada a la población a la que va
dirigida.
- Suficiencia: ¿Son suficientes esos reactivos?
 Validez relacionada con el criterio: Está relacionada a que el test sirva para predecir. Se
utiliza para estimar a futuro una conducta, a la que se llama criterio una vez determinado el
criterio, se elaboran los reactivos que estarán correlacionados con él. Se suele realizar la
comparación del instrumento con otras variables ya sea, un grupo, un Dx o una prueba. Se
hace un análisis de los resultados.
 Validez de constructo: Debe explicar el modelo teórico empírico que subyace a la variable
de interés. Técnicas estadísticas:
- Análisis factorial exploratorio: explora como se agrupan los ítems. Interesa conocer los
factores que componen la prueba, cuántos son esos factores y después nos fijamos
cuantos factores quedaron conformados.
- Análisis factorial confirmatorio: confirma la estructura factorial de análisis a partir de la
respuesta de los evaluados.
- Matriz tipo Varimax:
 Validez convergente: correlación entre puntuaciones del test con otras medidas del mismo
constructo realizadas a partir de diferentes técnicas o indicadores.
 Validez concurrente o simultánea: Obtendremos validez concurrente al obtener valores
altos de coeficientes de correlación entre las puntuaciones del test y del criterio. Por tanto,
nos permite validar el test, inicialmente elaborado para la medida de otra variable, para la
medida del criterio.
 Validez retrospectiva: La validez concurrente entre uno o varios tests y el criterio, que
puede ser útil para la predicción futura de la variable criterio, también en ciertas situaciones
puede servir para, dadas ciertas consecuencias medidas a través del criterio, encontrar las
causas a los valores obtenidos.
 La prueba reina de validez es la evidencia de validez basada en la estructura interna del

constructo.
PARA COMPROBAR LA VALIDEZ SE DEBE ATENDER A CINCO EVIDENCIAS.
1. Validez de contenido: Los ítems que constituyen el test son relevantes y representativos del
constructo psicológico que se desea medir.
2. Validez aparente: es el proceso que siguen las personas al contestar al test permite extraer
respuestas indicadoras de lo que se quiere evaluar.
3. Validez de constructo: Las relaciones de los ítems entre sí son congruentes con el modelo
teórico empleado a la hora de definir el constructo que evaluar.
4. Validez de criterio: Las relaciones que se establecen entre el constructo que se evalúa y
otros constructos son las esperadas según el marco teórico en el que se haya definido el
constructo que evaluar.
5. Evidencia basada en las consecuencias de aplicación: Las consecuencias tanto positivas
como negativas que se extraen al emplear un test son las previstas. Los tests se aplican
esperando que de la información obtenida se extraiga algún tipo de beneficio (poder
seleccionar el mejor tratamiento terapéutico, ubicar a los trabajadores de una empresa en
el puesto más adecuado, mejorar las técnicas didácticas empleadas, etc.). Uno de los
propósitos fundamentales de la validación es indicar en qué casos se pueden obtener estos
beneficios.
Construcción de pruebas 03/06/2020
Conceptualización: consiste en hacerse preguntas antes de sentarme a escribir teoría

 Atributo – constructo:
 Alcance: nivel de medición
 Clasificación:
 Restricción: Delimitación de la población, restricciones teóricas
 Interpretación de resultados: Va a depender de lo que se quiera lograr con la prueba,
Elaboración del marco teórico

 Revisión teórica
 Conceptualización del constructo
 Identificación de las variables que componen el constructo psicológico
 Especificación de la estructura (elaboración de la matriz)
 Construcción del objetivo de la prueba: siempre va a iniciar con medir/evaluar
 Especificación de las características del test: Descripción de la prueba
1. Delimitación de categorías
2. Revisión de la literatura
3. Adopción de un modelo o perspectiva teórica
4. Delimitación de subcategorías
5. Redacción (Fundamental la conceptualización y operacionalización de la variables)
Características del marco teórico

 Describir: definir el fenómeno, sus características, componentes, así como definir las
condiciones en que se presenta y las distintas maneras en que puede manifestarse.
 Consistencia: Es decir, las proposiciones que la integran deberán estar interrelacionadas
(no puede contener proposiciones sobre fenómenos que no están relacionados entre sí),
ser mutuamente excluyentes (no puede haber repetición o duplicación) y no caer en
contradicciones internas o incoherencias (Black y Champion, 1976).
 Perspectiva: Se refiere al nivel de la generalidad (Ferman y Levin, 1979). Una teoría posee
más perspectivas cuanto mayor, cantidad de fenómenos explique y mayor número de
aplicaciones admita.
 Fructificación: es “la capacidad que tiene una teoría de generar nuevas interrogantes
descubrimientos”
 Una teoría parsimoniosa es una teoría simple, sencilla. Éste no es un requisito, sino una
cualidad deseable de una teoría. Desde luego, sencillez no significa superficialidad.
Funciones
1. Ayuda a prever errores que se han cometido anteriormente
2. Permite la definición de dimensiones y la elaboración de la matriz de la prueba
3. Provee un marco de referencia para interpretar resultados
4. Orienta sobre cómo habrá de llevarse a cabo el estudio.
Operacionalizar el constructo
 Una definición operacional proporciona el significado a un constructo o a una
variable especificando las actividades u “operaciones” necesarias para medirlo.
 Una definición operacional de un constructo se refiere a las operaciones mediante
las cuales un investigador determina la presencia o la ausencia de un fenómeno.
 Se operacionaliza el constructo para poder estudiarlo.
Proceso de elaboración
1. Conceptualización: elaboración del marco teórico va a tener unas características
particulares que van a dar respuesta a elementos tales como: Atributo/Constructo,
alcance, clasificación, restricción e interpretación de resultados.
2. Construcción
3. Ensayo
4. Análisis de reactivos
5. Revisión de la prueba: confiabilidad y validez
6. Manual de la prueba: cuadernillo de instrucciones para el evaluador.
Elaboración del marco teórico

 Revisión teórica.
 Conceptualización del constructo.
 Identificación de las variables que componen el constructo psicológico.
 Especificación de la estructura (elaboración de la matriz).
 Construcción del objetivo de la prueba.
 Especificación de las características del test.
1. Delimitación de categorías
2. Revisión de la literatura
3. Adopción de un modelo o perspectiva teórica
4. Delimitación de sub categorías
5. Redacción (Fundamental la Conceptualización y Operacionalización de la Variable)
Funciones del marco teórico

 Ayuda a prever errores que se han cometido anteriormente.
 Orienta sobre cómo habrá de llevarse a cabo el estudio.
 Provee un marco de referencia para interpretar resultados.
 Permite la definición de dimensiones y la elaboración de la matriz de la prueba.
Características del MC
 Describir: definir al fenómeno, sus características y componentes, así como definir las
condiciones en que se presenta y las distintas maneras en que puede manifestarse.
 Consistencia: Es decir, las proposiciones que la integran deberán estar interrelacionadas
(no puede contener proposiciones sobre fenómenos que no están relacionados entre sí),
ser mutuamente excluyentes (no puede haber repetición o duplicación) y no caer en
contradicciones internas o incoherencias (Black y Champion, 1976).
 Perspectiva: Se refiere al nivel de generalidad (Ferman y Levin, 1979). Una teoría posee
más perspectiva cuanto mayor cantidad de fenómenos explique y mayor número de
aplicaciones admita.
 Fructificación es “la capacidad que tiene una teoría de generar nuevas interrogantes y
descubrimientos” (Férman y Levin, 1979, p. 34).
 Una teoría parsimoniosa es una teoría simple, sencilla. Éste no es un requisito, sino una
cualidad deseable de una teoría. Desde luego, sencillez no significa superficialidad.
¿Qué es una definición operacional?

Especificación de aquellos aspectos o indicadores de la variable que serán medidos a fin de
determinar la magnitud de la misma.
• Debe responder puntualmente a aquello que va a medir la prueba
 Construcción de una prueba: es la construcción de los reactivos o los items que me

van a conformar el instrumento.
Elaboración de escalas
La elaboración de escalas puede ser explicada como el proceso para establecer reglas y con
ello lograr la asignación numérica en la medición realizada con base en el constructo. Dicho
de otra manera, la elaboración de escalas es el proceso por el cual se diseña y calibra un
dispositivo de medición, y la forma en que se asignan números (u otros índices) valores de
escala, a diferentes cantidades del rasgo, atributo o característica que se esté midiendo.
Escalas: son las formas que se tiene para hacer preguntas

 De edad: se mide de acuerdo a la edad.
 De grado: bajo, moderado, alto De acuerdo al resultado obtenido en los ítems
 Escalas estaninas: permiten la calificación a partir de la suma de los ítems.
 Escalas de estimación: Agrupamiento de palabras, afirmaciones o símbolos a través de
los cuales el sujeto indica la intensidad de sus juicios relativos a un rasgo, actitud o
emoción particular.
 Escala sumatoria: son los parciales
 Escalas Likert: van en grado, con varias opciones. Nivel de acuerdo, la frecuencia de
determinada actividad, Nivel de importancia, valoración de un servicio, la probabilidad de
realizar una acción futura.
 Comparación de pares: es cuando le colocamos a la derecha una columna de información
al otro lado opciones (apareamiento)
 Escalas categóricas
 Escalas de Guttman
Redacción de reactivos
 Selección del tipo de reactivo (típica o máxima)
 Reserva de reactivos/banco de ítems
Características de los ítems
Claridad
• Calidad de los elementos semánticos y sintácticos de la pregunta.
• Adecuación del lenguaje al nivel de la población
• Precisión en las instrucciones.
Pertinencia
• Relación del ítem con lo que la prueba pretende medir.
• Se considera que un ítem es pertinente si está en armonía con el plan general de la prueba y
si pertenece al dominio definido o al atributo que mide la prueba.
Relevancia
• Hace referencia al contenido específico de la pregunta en relación con la estructura de prueba.
Se asimila a significancia en contraste con detalles superficiales, observaciones incidentales o
comentarios tangenciales de acuerdo con la definición del dominio o atributo.
Características de los ítems (consistencia)
Dificultad: Apreciación del nivel de maestría o magnitud de atributo necesario para responder la
pregunta. (Alta – Media – Baja)
Discriminación: Es el grado en que, como unidad, permite diferenciar algunos grupos de interés,
para quienes tiene alta habilidad en el dominio de quienes no, o quienes poseen mayor
magnitud del atributo de quienes poseen menos.
Aspectos para la elaboración de ítems (E. T.)

 Afirmaciones cortas
 Utilizar primera persona
 No usar “y” u “o”
 Evitar usar las palabras «siempre o nunca» en la base o enunciado.
 Deben ser “relevantes”, en el sentido de que su contenido debe relacionarse claramente con el rasgo.
 En escalas de actitudes, no plantear la existencia o no de hechos, sino el posicionamiento personal
sobre la afirmación. Redactar ítems que discriminen entre los de actitud positiva y los de actitud
negativa.
 Para minimizar la aquiescencia (tendencia a responder afirmativamente, independientemente del
contenido por el que se pregunta) conviene redactar ítems de modo directo e inverso (declaraciones
tanto en sentido positivo como en sentido negativo
¿Cómo redactar ítems?
Selección múltiple con única respuesta

 Base o enunciado Es una expresión que presenta la situación o problema, planteada
como una pregunta, afirmación o enunciado incompleto.
 Opciones Son las posibles respuestas, de las cuales solamente una es la correcta o la que
mide el atributo y las otras tres funcionan como distractores.
Transformación de variables
Es un dato único aislado que me permite transformarlo para que me hable de una generalidad.
Transformar las puntuaciones de una medida
 Los percentiles: es esa información que me permite revisar esa posición que ocupa el sujeto
en una muestra en nivel de porcentajes. El percentil 50 indica que el sujeto está 50 % por
encima de la población general.
 Es una medida de posición en porcentaje (medidas de posición de un dato con respecto a un
grupo de referencia) Se saca con Excel.
 Qué posición ocupa el sujeto con respecto al resto de la población.
 Cuartiles: Dividen una distribución en cuatro partes. Se suelen identificar como cuartil 1,
cuartil 2 y cuartil 3. Coinciden con los percentiles 25, 50 y 75, respectivamente.
 Los quintiles, que al dividir la distribución en cinco partes se equiparan a los percentiles 20,
40, 60 y 80.
 La división de la distribución indica si la puntuación fue baja, media o alta.
 Puntuación estandarizada: La puntuación estandarizada o puntuación típica es aquella que
permite expresar cuántas desviaciones típicas por encima o por debajo de una media se sitúa
una observación. Este proceso de estandarización tiene su sentido cuando la distribución de
valores objeto de interés se ajusta esencialmente a una curva normal.
 Puntuación z: es la puntuación estandarizada y se revisa cuantas desviaciones por encima o
por debajo se encuentra un sujeto. Es cuanto se alejó el dato en relación a la mediana.
Se lee: se alejó 2 desviaciones, se alejó 3 desviaciones.
 Las inferencias a las que podemos llegar mediante el uso de estas puntuaciones dependen de
la muestra que es empleada, dado que es de ella de donde se obtienen la media y desviación
típica que permiten el cálculo de las puntuaciones transformadas. Elegir cuidadosamente la
muestra de referencia resulta imprescindible.
 Puntuaciones T: Consiste en partir de una constante, en este caso 50, y sumarle diez
veces el valor de la puntuación típica z. Para interpretar debidamente esta puntuación
solo hay que tener presente que la media de esta puntuación es 50 y su desviación típica
10.
Pasos
1. Sumatoria de los datos, puntuación directa
2. Se sacan medidas de tendencia central, lo que se suele utilizar es la mediana (punto medio, nos
va a dar información sobre el percentil)
3. Desviación estándar
Puntuación z que es la estándar

Puntuación T:
Baremación
 Es un proceso de escalamiento, y se debe hacer de forma rigurosa para la interpretación de
los datos.
 La baremación, también conocida como escalamiento de una medida, es un elemento de gran
relevancia en el proceso de elaboración y uso de un instrumento de medida. Como se ha visto
en el presente capítulo, la transformación de una puntuación ayuda al usuario a inyectar
significado a un determinado valor de acuerdo con el comportamiento de un conjunto de
observaciones.
Para hacer un buen proceso de baremación se recomienda en este caso hacer todo un trabajo
para la selección de la muestra. La selección de la muestra va a tener unas características
fundamentales. Debe ser una muestra:
 Relevante: significa que esa población que yo elija debe ser significativa de acuerdo con el
atributo que se vaya a medir. Es población debe tener el atributo.
 Representativa: que sea un número de personas significativo que represente la muestra.
 Homogénea: personas que serán evaluadas mediante una determinada medida deberían ser
comparables a las personas que formaron parte de la muestra de participantes que
constituyeron el baremo de esta. Es decir una población con características iguales para la
medición del atributo.
Cuando traemos una prueba de otro contexto cultural, se hace:

 Estandarización: Procesos de baremación. Se busca que
 Validación: revisión del marco teórico y como se aplica en nuestro contexto.
 Adaptación: Cambio del lenguaje.
 Cuando voy a baremar una prueba, lo que hago es retomar toda esa muestra
representativa.
 Cada prueba tiene un proceso de baremación diferente.
 Los baremos deben ser actualizados constantemente, ya que se asume que por defecto,
los datos contenidos en un baremo caducan. Se suelen usar baremos muy viejos. Las
pruebas deben ser utilizadas con muchísimo cuidado.
 Las pruebas, al igual que sus baremos deben ser actualizados constantemente. Cada que
se vaya a trabajar con un prueba, es necesario revisar su actualidad.
 Es recomendable no usar cualquier prueba de internet sin antes conocer a profundidad
su marco teórico y su proceso de administración. Se recomienda más fácil, realizar una
buena entrevista que permitirá recoger mucha información.
Equiparación de puntuaciones
Equiparar las puntuaciones de dos o más medidas consiste en establecer una correspondencia
entre las puntuaciones de estas. Esta estrategia debe permitir que, recogida la puntuación en
una de las medidas, sea posible estimar la puntuación de las otras medidas.
Las variables van a ser esos elementos que hacen parte del constructo, van a restringir la
medición del constructo teórico. ES todo eso que yo tengo en cuenta al momento de hacer una
prueba
Conceptos de psicometría
1. Atributo: lo que se quiere medir.

2. Análisis factorial confirmatorio: sirve para confirmar la estructura de la prueba y los
factores que la componen.
3. Análisis factorial exploratorio: exploraron de cómo se agrupan los ítems.
4. Baremo: mediante investigaciones sistemáticas en un gran número de personas se
establecen los valores centrales o medios y valores de dispersión para determinadas
prácticas contenidas en un test psicológico. Estas normas o valores normales sirven para
evaluar las observaciones efectuadas en un individuo particular o en grupos de
individuos.
5. Batería: test compuesto por varias partes o selección de diferentes test administrados
conjuntamente por un profesional. [CITATION Men13 \p 43 \l 9226 ]
6. Coeficiente alfa de Cronbach: es la expresión de la consistencia interna de un test a
partir de la covariación entre sus ítems. Cuanto más elevada sea la proporción de la
covariación entre estos ítems respecto a la varianza total del test, más elevado será el
valor del coeficiente alfa de Cronbach, y más elevada su fiabilidad. [CITATION Men13 \p
91 \l 9226 ]
7. Concepto: definición teórica del atributo. [ CITATION Ace18 \l 9226 ]
8. Consistencia interna: hace referencia al grado en que cada una de las partes de las que
se compone el instrumento es equivalente al resto.[CITATION Men13 \p 84 \l 9226 ]
9. Constructo: operacionalización del atributo a través de conductas observables.
[ CITATION Ace18 \l 9226 ]
10. Correlación: qué tanto se parecen los ítems entre sí.[ CITATION Ace18 \l 9226 ]
11. Cuantificar: determinar la magnitud con la que un atributo está presente en un objeto.
[CITATION Men13 \p 33 \l 9226 ]
12. Diagnóstico: identificación de la naturaleza de una enfermedad mediante la observación
de sus signos y síntomas característicos.
13. Dificultad: capacidad del sujeto para responder la prueba. [ CITATION Ace18 \l 9226 ]
14. Discriminación: cómo está constituido el ítem (lenguaje específico de los ítems).
15. El coeficiente de determinación: es el cociente entre la varianza explicada por la
regresión y la varianza total de la variable de criterio. [CITATION Men13 \p 182 \l 9226 ]
16. Entrevista: encuentro y conversación entre dos o más personas para tratar un asunto
determinado.
17. Error de estimación de la puntuación verdadera - se define como la diferencia entre la
puntuación verdadera de un sujeto y su puntuación verdadera pronosticada mediante el
modelo de la regresión. [CITATION Men13 \p 81 \l 9226 ]
18. Error de medida: es la diferencia entre la puntuación obtenida por un sujeto en el test y
su puntuación verdadera en la característica medida por este test. [CITATION Men13 \p
80 \l 9226 ]
19. Error de sustitución: Se define el error de sustitución como la diferencia entre las
puntuaciones de un sujeto en dos formas paralelas de un test. [CITATION Men13 \p 81 \l
9226 ]
20. Escalas: es un sinónimo de test, está conformado por diferentes partes y estas reflejan
dimensiones o características específicas que miden en el contexto del test global.
21. Estandarización: las puntuaciones obtenidas dependen de un procedimiento establecido
de administración, corrección e interpretación que las hacen o las deberían hacer,
invariantes del profesional que administra los test, las condiciones específicas en las que
lo hacen y el modo como obtienen e interpreta las puntuaciones resultantes de la
medida.[CITATION Men13 \p 40 \l 9226 ]
22. Estudio piloto: investigación preliminar entorno a la creación de un prototipo de la
prueba. [CITATION Coh20 \p 193 \l 9226 ]
23. Fiabilidad: propiedad que valora la consistencia y precisión de la medida, se asocia
siempre a un grado de error.[CITATION Men13 \p 75 \l 9226 ]
24. Habilidad: capacidad, inteligencia y disposición para realizar algo.
25. Hipótesis: la que se formula provisionalmente para guiar una investigación científica que
debe demostrarla o negarla.
26. Índice de fiabilidad: se define como la correlación entre las puntuaciones empíricas de
un test y las puntuaciones verdaderas.[CITATION Men13 \p 79 \l 9226 ]
27. Inferencia: deducción de una cosa a partir de otra, conclusión. [ CITATION Wor05 \l 9226
]
28. Medida: proceso de asignación de números a objetos o acontecimientos de acuerdo con
unas reglas, producto de las cuales se obtendrían los diferentes tipos de escalas
propuestas: Nominal, ordinal, de intervalo y de razón. [CITATION Men13 \p 33 \l 9226 ]
29. Método de las dos mitades: es la correlación entre las puntuaciones de un grupo de
sujetos en las dos mitades en las que podemos dividir un test, este es un indicador del
grado de consistencia interna de este, y por lo tanto de su fiabilidad. [CITATION
Men13 \p 84 \l 9226 ]
30. Método test-retes: es la aplicación de un test a una misma muestra de sujetos en dos
ocasiones diferentes.[CITATION Men13 \p 84 \l 9226 ]
31. Muestra de comportamientos: En la medida en que esta muestra sea representativa del
conjunto, las puntuaciones obtenidas permitirán a los profesionales establecer
adecuadamente sus inferencias sobre el comportamiento general de las personas más
allá de los elementos específicos evaluados mediante tests. [CITATION Men13 \p 40 \l
9226 ]
32. Objetividad: sustitución del juicio personal basado en criterios subjetivos por un
conjunto de normas determinadas y conocidas que permiten obtener e interpretar las
puntuaciones de los individuos en igualdad de condiciones. [CITATION Men13 \p 40 \l
9226 ]
33. Personalidad: conjunto de las características y diferencias individuales que distingue a
una persona de otra.
34. Probabilidad: cálculo o determinación cuantitativa de la posibilidad de que se verifique
un suceso.
35. Prueba: examen para demostrar conocimientos o aptitudes.
36. Psicometría: es la disciplina encargada del desarrollo de teorías, métodos y técnicas que
dan apoyo a los procesos de construcción y administración de tests. Su objetivo es
proporcionar las garantías científicas necesarias para la medida objetiva y estandarizada
de los fenómenos psicológicos no observables a partir de una muestra de
comportamientos. [CITATION Men13 \p 13 \l 9226 ]
37. Reactivos: medida indirecta de los fenómenos psicológicos mediante test, busca
producir una reacción en el comportamiento de los individuos para registrarlo y obtener
una puntuación. [CITATION Men13 \p 13 \l 9226 ]
38. Sesgo por falta de relevancia: cuando los ítems que componen el test evalúan aspectos
no relevantes para el dominio. [CITATION Men13 \p 151 \l 9226 ]
39. Sesgo por falta de representatividad: cuando los ítems no representan de manera
adecuada todo el dominio que se pretende evaluar. [CITATION Men13 \p 151 \l 9226 ]
40. Teoría de los test: permite establecer las inferencias sobre los fenómenos psicológicos
no observables a partir de las puntuaciones obtenidas en el proceso de medida.
41. Teoría sustantiva: teoría sólida y bien establecida de comportamiento de las personas
para definir los elementos de conforman los fenómenos; determinará los
comportamientos implicados que serán empleados como evidencias observables en el
proceso de medida. [CITATION Men13 \p 42 \l 9226 ]
42. Test de personalidad: pretende conocer de manera general las motivaciones,
preferencias, opiniones o actitudes de los individuos frente a un determinado estímulo.
43. Test psicológico: es un procedimiento de medida objetiva y estandarizada de una
muestra de comportamientos.[CITATION Men13 \p 39 \l 9226 ]
44. tests de habilidad o de potencia: Son pruebas que discriminan respuestas correctas e
incorrectas y tienen como objetivo evaluar la competencia, la aptitud o los
conocimientos de los individuos a partir del acierto o la calidad de sus respuestas.
[CITATION Men13 \p 42-43 \l 9226 ]
45. Unívoco: que es de un solo significado, tiene igual naturaleza o valor que otra cosa.
46. Validación: proceso mediante el cual se recoge toda la información posible y necesaria
para poder hacer inferencias adecuadas a partir de las puntuaciones obtenidas en los
tests.
47. Validez aparente: se espera que las personas que responde a un test consideren que las
preguntas realizadas son adecuados para el conocimiento que se pretende medir.
48. Validez concurrente: sirve para predecir el comportamiento en un constructo que es
evaluado simultáneamente a la aplicación del test. [CITATION Men13 \p 142 \l 9226 ]
49. Validez convergente: es la validez que determina diferentes pruebas que miden el
mismo constructo.
50. Validez de constructo: es cuando la prueba representa el constructo que se pretende
medir, es considerada la principal forma de validez. [CITATION Men13 \p 143 \l 9226 ]
51. Validez de contenido: hace referencia a que los ítems que componen el cuestionario
sean representativos de aquello que se pretende evaluar. [CITATION Men13 \p 143 \l
9226 ]
52. Validez discriminativa: esta viene determinada por la medida de diferentes constructos
dentro de la misma prueba.[CITATION Men13 \p 170 \l 9226 ]
53. Validez predictiva: sirve para predecir el comportamiento en un constructo que será
evaluado posteriormente a la aplicación del cuestionario. [CITATION Men13 \p 142 \l
9226 ]
54. Validez: grado en el que la evidencia empírica y la teoría apoyan la interpretación de las
puntuaciones de los test relacionada con un uso específico. [CITATION Men13 \p 145 \l
9226 ]
Taller de revisión de conocimientos

1. Según el tratamiento de las respuestas, los test de personalidad se puede clasificar en
pruebas de: ejecución típica.
2. “Se procedió a la construcción de una tabla de percentiles y de conversión de las puntuaciones
naturales a puntuaciones Z y T equivalentes con el fin de guiar en la interpretación normativa de
las puntuaciones directas de la escala de desesperanza de Beck cuando así se estime
conveniente” De acuerdo a la información anterior, la prueba puede clasificarse de acuerdo a: La
interpretación de resultados.
3. La percepción trinitaria de la validez enmarca los procesos de validez: de constructo, contenido y
criterio.
4. De acuerdo con Meneses los verdaderos pioneros de la psicometría moderna son: Francis
Galton, James Cattel y Alfred Binet.
5. Alfred Binet y su colega Theodore Simón, recogieron los incipientes movimientos en la
evaluación de la discapacidad cognitiva mediante baterías de test. A partir de ellos, y a petición
del ministerio de educación francés, desarrollaron la primera prueba que permitió clasificar a los
niños según su: Inteligencia.
6. La psicometría alcanzo su época dorada en el siglo XX, más exactamente en los años: treinta y
sesenta.
7. La psicometría es una rama de la psicología que mediante teorías, métodos y técnicas vincularon
al desarrollo y la administración de test. Se ocupa de la medida indirecta de los fenómenos
psicológicos con el objetivo de hacer descripciones, clasificaciones, diagnósticos, explicaciones o
predicciones que permitan: Tomar decisiones sobre el comportamiento de las personas.
8. Para comprobar la estabilidad la estabilidad se realizó una segunda aplicación del instrumento
entre dos y cuatro meses después de la primera con 21 participantes.
9. El estudio de la incidencia de los sesgos culturales de los test, se dio a partir del desarrollo de los
test: army.
10. Los coeficientes de dificultad obtenidos permiten observar un desequilibrio en las respuestas
obtenidas, en cuanto a las respuestas esperadas: los comienzos de todas las series resultan
sumamente sencillos, respondiendo los sujetos de manera exitosa en casi todos los casos. La
descripción anterior, hace parte de la justificación de: Consistencia interna.
11. El examen cognoscitivo mini mental, es una prueba dirigida a adultos con posible deterioro, cuya
finalidad es la detección rápida del deterioro de funciones cognoscitivas.
Las instrucciones de la prueba son las siguientes: lo escrito en negrita debe ser leído al
entrevistado en voz alta, de manera clara y despacio.
El entrevistador deberá marcar con una x el 0 si la respuesta es incorrecta, o el 1 si la respuesta
es correcta.
De acuerdo a la información anterior, la clasificación de la prueba por tratamiento de respuestas
es: Ejecución máxima.
12. Durante la II guerra mundial, las fuerzas de aviación administraron un conjunto de baterías de
test para seleccionar y clasificar a los pilotos, ingenieros de vuelo y otros técnicos encargados de
los instrumentos de navegación. Quien estuvo a cargo de este proceso fue: John C. Flanagan
13. La fiabilidad es la propiedad que permite determinar la: consistencia y precisión de la medida.
14. Durante la II guerra mundial se realizó un esfuerzo importante para identificar candidatos
susceptibles de sufrir trastornos psicológicos. El encargado de desarrollar un nuevo tipo de
pruebas que permitiera evaluar la estabilidad emocional de los soldados fue: Robert S.
Woodworth.
15. De acuerdo con Meneses, la medida mediante el desarrollo y a administración de los test deberá
cumplir con las siguientes características: objetiva, estandarizada y muestra de
comportamientos.
16. El objetivo de la medición en psicología es: estimar ausencia o presencia de un atributo en
determinada persona
17. De acuerdo a los aportes de Friedrich Bessel: los instrumentos de las ciencias psicológicas poseen
un margen de error.
18. Los errores implicados en el proceso de fiabilidad son los: aleatorios.
19. La segunda guerra mundial tuvo como consecuencia la instrumentación del mayor programa
jamás emprendido, lo cual permitió: la consolidación de la psicometría como disciplina de la
psicología.
20. El cuestionario de actividad de Jenkins, cuenta con un sistema de respuesta tipo Liert con 6
opciones en escla de intensidad graduada, indicando en el 1 que el individuo no se identifica en
absoluto con la cuestión y el que se identifica totalmente. De acuerdo a la información anterior,
la forma adecuada para estimar la discriminación de los ítems es a través del estadísticos: alfa de
cronbach
21.
Notas de clase
Ficha técnica de la prueba de estrés
Nombre: cuestionario para la evaluación del estrés tercera versión

Autores: Pontificia Universidad Javeriana
Adaptación en español: Pontificia universidad javeriana
Aplicación: Individual y grupal
Ámbito de aplicación: Adultos
Ejecución tipica
Finalidad: evaluar el estrés
Material: Lápiz y papel
Interpretación de resultados: de norma (tiene baremos)
Matriz
ATRIBUTO FACTORES ITEMS
Estrés Fisiológico 1, 2, 3, 4, 5, 6, 7, 8, 17, 26,
Cognitivo 10, 14, 15, 21, 24,
Social 9, 11, 12,
Emocional 13, 16, 18, 19, 20, 22, 23, 24, 25, 27, 29, 31
Conductual 26, 28, 30
Clase 06/05/2020 Confiabilidad

 Artículos de validez y confiabilidad, cualidades psicométricas.
Consistencia Interna.
 Estadísticos que se utilizan para el análisis de los datos: Sirve para revisar la
correlación de los ítems.
 Alfa de cronbach: Es un análisis de consistencia interna en donde se utiliza la
fórmula de alfa de Cronbach. Cuando se utiliza esta prueba se asume que se hace
una calificación mucho más grande de las pruebas. Permite hacer un análisis de
valores más grandes, no solo limitar la prueba a unos y ceros. Alfa de cronbach
incluye unos y ceros y pruebas que se califican con escala de Likert.
Kuder Richardson (KR-20): ítems que se pueden calificar como ceros y unos (0 y 1). A
partir de la sumatoria de toda la dificultad puedo dar la información de kr-20. Es ver
como se comportó la prueba. Análisis de dificultad del ítem.
 Spearman Brown: Longitud del ítem
Para revisar la consistencia interna de la prueba primero se revisa el ítem.
Consistencia externa: es aquella que se da en los resultados del instrumento
test- retest: Aplicación de un instrumento en dos momentos diferentes a un grupo de

sujetos (aplicación post aplicación)
- Aprendizaje
- Tiempo de aplicación
- Condiciones ambientales
- Atributo
Pruebas paralelas: Son dos pruebas que han sido construidas para ser aplicadas al mismo
sujeto y medir un mismo constructo o se tiene dos versiones de la misma prueba. Sirve para
revisar que no existan errores en la formulación de los ítems de la prueba.
 Mitades.
Factores que afecta la fiabilidad:
Variabilidad: que tanta variación que tanta diferencia se puede establecer en la respuesta
que dan los sujetos. Variabilidad o cambios en los resultados de una prueba. Se busca la
diferencia para determinar cuales tienen el atributo y cuáles no. La variabilidad son las
diferentes respuestas que hay en una prueba. Permite determinar si el atributo está o no. La
variabilidad se revisa desde alfa de cronbach, kr20 no me permite revisar variabilidad, es
una formula básica.
Cuando no hay variabilidad: cuando todos ganan o cuando todos pierden.
Puntuación verdadera: es el puntaje que puede sacar un individuo en una prueba.

A medida que se va a aplicando la prueba, los sujetos no llegan al máximo de los ítems.
Error de medida: son todas esas predicciones que puedo hacer a partir de la puntuación de
los sujetos.
Error típico de medida.
Error máximo.
Se pueden hacer muchos análisis de una prueba, sin embargo casi siempre nos limitamos a
alfa de cronbach.
Un test referido a la norma me va a dar información de la posición del sujeto en una prueba
específica.
Test referidos al criterio: nos da información sobre como el sujeto se comporta en una
prueba, el coeficiente más utilizado es el de “Kappa de cohen”, hace los análisis a partir del
comportamiento del sujeto en las pruebas. Es donde yo hago un análisis mucho más
profundo del comportamiento del sujeto.
Intervalos de confianza: nos dicen si el sujeto es competente o no es competente.
Hay varias formas de determinar la fiabilidad: Correlación de Pearson, se revisan los
totales.
Puntos de corte: Se establecen para que la información no quede subjetiva a partir de la
puntuación de la prueba.
Dificultad, discriminación y correlación
¿Qué se necesita para revisar la confiabilidad/ consistencia interna de una prueba (alfa de
cronbach/KR20)?
Lista de chequeo
2. El atributo
3. Número de ítems
4. Como fue contestado el ítem (1 o 0, o varias opciones de respuesta)
5. Tamaño de la muestra
6. Características básicas del tributo
7. Estabilidad del ítem: test retest, paralelas o alternas)
8. Conocer si la prueba es homogénea o heterogénea
9. El objetivo de la prueba
10. Atributo estable o no estable en el tiempo

Resumen de Documentos de Psicometria

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Resumen de Documentos de Psicometria

Cargado por

Copyright:

Formatos disponibles

Resumen evaluación psicológica, historia y antecedentes. Cap 1 y 2.

Antecedentes precientíficos: de la antigüedad al siglo XIX

Antecedentes pre científicos: siglos XVIII y XIX

★ Teoría de la evolución de Charles Darwin.

★ Galton: primeros estudios sobre las diferencias individuales.

★ Alfred Binet: la primera prueba psicométrica de inteligencia.

★ Guerras mundiales: primeras pruebas colectivas de inteligencia y de aspectos emocionales.

Meneses, J (2017) La evaluación psicométrica. Editorial UOC. Barcelona. Capítulo 1 (resumen)

★ Aproximación histórica a la psicometría:

Pioneros de la psicometría moderna:

★ Stevens definió la medida como el proceso de asignación de números a objetos o

★ La psicometría en el contexto de la evaluación psicológica:

★ Definición y clasificación de los test.

★Clasificación de los test según sus características más importantes:

Nivel de medición: Presencia-ausencia, grado y diferenciación.

Ejemplo de Ficha técnica (clasificación)

★ Modelos de medida psicométrica:

★ Teoría clásica de los test.

★ Proceso de inferencia matemática: Este es el proceso que la psicometría sigue para

● El error es un componente inherente a cualquier proceso de medida y debe ser objeto de un

★ Principios básicos: garantizan la confianza en las inferencias establecidas a partir de las

 Cuando yo construyo una prueba: Debo hacer confiabilidad y validez.

Capítulo 2 Meneses: Fiabilidad

- Confiabilidad: Es la precisión en la medida, es cuando se hace una repetición de la medida, se

- Coeficiente de fiabilidad (TCT de Spearman): el coeficiente de fiabilidad de un test es la correlación

Estimaciones de confiabilidad: Las medidas de confiabilidad son estimaciones y las

Los tests. Mariano Yela (Resumen de documento)

- Quinto periodo: el análisis factorial.

★ Clasificación de los tests según:

★ Clasificación según su método:

★ Clasificación según su fin:

★ Clasificación según el examinador:

★ Clasificación según el sujeto que recibe el test:

★ Clasificación según el material:

★ El test como instrumento de medida.

★ Aplicación de los tests

★ La medición de lo psicológico. José Muñiz, 1998 (Resumen de documento)

- Teoría de la Generalizabilidad propuesta por Cronbach y colaboradores: Mediante el uso de

Validez: Es el grado en el que la evidencia empírica y la teoría apoyan la interpretación

 La prueba reina de validez es la evidencia de validez basada en la estructura interna del

PARA COMPROBAR LA VALIDEZ SE DEBE ATENDER A CINCO EVIDENCIAS.

Construcción de pruebas 03/06/2020

Conceptualización: consiste en hacerse preguntas antes de sentarme a escribir teoría

Elaboración del marco teórico

Características del marco teórico

Elaboración del marco teórico

Funciones del marco teórico

¿Qué es una definición operacional?

 Construcción de una prueba: es la construcción de los reactivos o los items que me

Escalas: son las formas que se tiene para hacer preguntas

Características de los ítems

Aspectos para la elaboración de ítems (E. T.)

¿Cómo redactar ítems?

Selección múltiple con única respuesta

Puntuación z que es la estándar

Cuando traemos una prueba de otro contexto cultural, se hace:

1. Atributo: lo que se quiere medir.

Taller de revisión de conocimientos

Ficha técnica de la prueba de estrés

Nombre: cuestionario para la evaluación del estrés tercera versión

Clase 06/05/2020 Confiabilidad

Consistencia externa: es aquella que se da en los resultados del instrumento