Está en la página 1de 13

Universidad Abierta Para Adultos (UAPA).

Participante:

Ismery Núñez Rodríguez.

Matricula:

2018-08277

Asignatura:

Teoría de los Tests y fundamentos de Medición.

Facilitador:

Aníbal M. Ureña.

Tarea:

Unidad V y VI.

Fecha:

Miércoles, 20 de agosto del 2019,

Santiago de los Caballeros,

República Dominicana.
Introducción

En este trabajo estudiaremos, con la realización de una lectura interpretada y


argumentada sobre el proceso e estandarización de un cuestionario, me permitido
conocer y explicar sobre la importancia, la validez y la confiabilidad en dicho proceso,
sin embargo permite tener gran conocimiento y domino de los criterios de valoración
para los proceso de valoración de los ítems en las pruebas.

Por medio de los textos recopilados pondremos de manifiesto los puntos previamente
mencionados. La recopilación de los datos se hizo valiéndose de los materiales de
apoyo proporcionados en esta asignatura y de enlaces obtenidos de internet. Se
espera que este trabajo resulte nutritivo y que se puedan satisfacer las expectativas
que se tiene del mismo.
1. Redacta un ensayo argumentativo, con un mínimo de tres páginas sobre
la confiabilidad y validez.

 Confiabilidad:

“grado en que un instrumento produce resultados consistentes”

La confiabilidad se refiere al grado en que una técnica es consistente con lo que


pretende medir, es decir, la confianza que esa técnica amerita. Se pueden distinguir
diferentes formas de confiabilidad:

Test re- test: consiste en usar la misma técnica en dos momentos diferentes con un
lapso entre 1 y 6 meses (se recomienda que no sea menor a un mes porque la persona
recordaría la técnica ni mayor a seis meses por la evolución que podría haber sufrido el
paciente). Esto también depende de si lo que se mide es o no estable a través del
tiempo.

Formas equivalentes, alternas o paralelas: se toman dos versiones diferentes (pero


equivalentes en cuanto a contenido y dificultad) de la misma técnica. Esto permite
evaluar la confiabilidad interna de la técnica. Por ejemplo en los exámenes suele haber
un tema 1 y un tema 2.

División por mitades: se divide la misma técnica en dos partes iguales (por ejemplo
ítems pares e impares). Esto también permite medir la confiabilidad interna de la
técnica.

Confiabilidad entre evaluadores o calificadores: es el grado de acuerdo o


consistencia que existe entre dos o más evaluadores.

La confiabilidad y la validez son cualidades esenciales que deben estar presentes en


todos los instrumentos de carácter científico para la recogida de datos. En palabras de
Pérez (1998:71), si el instrumento o instrumentos reúnen estos requisitos habrá cierta
garantía de los resultados obtenidos en un determinado estudio y, por lo tanto, las
conclusiones pueden ser creíbles y merecedoras de una mayor confianza.

Uno de los mayores problemas que se debe evitar, es que la información obtenida no
le permita responder a los objetivos de la investigación. Si los instrumentos no son
validados, podrá encontrar una variada información pero sin ninguna articulación con
los propósitos y compromisos asumidos en la investigación.

Ningún instrumento psicométrico puede considerarse de valor a menos que sea una
medida consiste, o confiable. En consecuencia, una de las primeras cosas que será
necesario determinar acerca de una prueba de elaboración reciente es si resulta lo
suficientemente confiable como para medir lo que fue diseñada para medir. Si, en
ausencia de cualquier cambio permanente en una persona debido al crecimiento, el
aprendizaje, alguna enfermedad o lesión, las puntuaciones en una prueba varían con la
ocasión o la situación, es probable que la prueba no sea lo suficientemente confiable
como para ser usada en describir y evaluar a la gente y hacer predicciones sobre su
conducta.

Note que confiabilidad no es lo mismo que estabilidad: al determinar la


confiabilidad se asume que la prueba mide una característica relativamente estable. A
diferencia de la inestabilidad, la falta de confiabilidad es resultado de errores de
medición producidos por estados internos temporales, como la baja motivación o la
falta de disposición, o de condiciones externas como un ambiente de prueba incomodo
o con distracciones.

 Tipos de pruebas para determinar la confiabilidad:

Pre- post prueba- se administra el instrumento en dos ocasiones distintas a la misma


población para estimar la correlación entre la primera y segunda, si el instrumento mide
lo correcto, deberá producir los resultados similares en las dos.

Splif-HalfMethod- se construye el instrumento con dos grupos de preguntas (pares y


nones) que midan igual. Se administra el instrumento se determina el puntaje de los
pares y nones. Se le estima la correlación y puntuación. A mayor la correlación más
confiable se considera el instrumento porque las preguntas pares y nones reflejan
puntaciones casi iguales.

Forma equivalente- se administra el instrumento dos veces a la misma población. La


segunda se cambia el orden de preguntas y se construye una versión equivalente a la
primera se comparan para determinar si son similares o discrepantes.

 Validez:

Validez del proceso- procedimientos empleados en la investigación están en armonía


con el objetivo del estudio significa que la forma de conducir la investigación no altera
los datos del fenómeno que se estudia. En pocas palabras, la forma de realizar la
investigación no incide con la forma de actuar o pensar.

Validez del análisis de datos- técnicas utilizadas en el análisis de los datos son
sensitivas a la información recopilada en el estudio. Significa que las técnicas no
producen falsas impresiones de los datos.

La constatación de la validez de un instrumento de medida no ofrece mayores


problemas cuando se trata de cuantificar variables objetivas, como el peso, la estatura
o el volumen. Pero en el caso de variables psicológicas es necesario probar de forma
empírica que el instrumento es válido para aquello que dice evaluar. No obstante, más
que el test en sí mismo, lo que se somete a validación son las posibles inferencias que
se vayan a realizar a partir de los resultados obtenidos. Tanto la fiabilidad como la
validez son dos propiedades psicométricas que deben cumplir las interpretaciones e
inferencias que se hagan de los resultados obtenidos por los tests psicológicos. La
validez, pues, no debe ser una característica propia del test, sino de las
generalizaciones y usos específicos de las medidas que el test proporciona.

 Elaboración de un mapa conceptual sobre el tema de la validez:

Con la validez demostramos la utilidad del instrumento, se halla en un proceso


permanente, en continua revisión, se ve el uso que se le da. Es válido para una
persona, sistema y tiempo determinado. Si le vamos a dar un uso diferente al test tiene
que ser adaptado. La validación tiene una caducidad (10-15 años), no hay garantías de
que el test sea igualmente útil, hay que revisar si aún los datos de validez son
aceptables.

 Al aplicar un test buscamos tres propósitos:

1. Establecer una relación funcional con una variable.

2. Medimos para analizar rasgos psicológicos.

3. Analizar comportamientos manifiestos.

 Todas esas medidas con diferentes propósitos, tienen diferentes tipos de


validez:

a. Validez predictiva, predecir un comportamiento.

b. Validez de contenido (ítems).

c. Validez de constructo (rasgo).

Un mismo test si tiene diferentes usos necesita diferentes tipos de validez. La validez
nos tiene que dar la utilidad de un instrumento, hasta qué punto es útil y es más útil que
otros instrumentos que están en el mercado.
Tipos de validez:

La validez es un concepto del cual pueden tenerse diferentes tipos de evidencia:

1. Evidencia relacionada con el contenido:


Grado en que un instrumento refleja un dominio especifico de contenido de lo
que se mide.

2. Evidencia relacionada con el criterio:


La validez criterio establece la validez de un instrumento de medición al
comparar sus resultados con los de algún criterio externo que pretende medir lo
mismo.

3. Evidencia relacionada con el constructo:


Es la más importante, sobre todo desde una perspectiva científica, y se refiere a
que tan exitosamente un instrumento representa y mide un concepto teórico.

 Validez de contenido:

El dominio de contenido de una variable normalmente esta definido o establecido por la


literatura (teoría y estudios antecedentes).

 Instrumento:

Si el dominio del test es demasiado estrecho con respecto a al dominio de la variable.

 Validez de criterio:

Cuanto más se relacionen los resultados del instrumento de medición con el criterio, la
validez de criterio será mayor.

 Validez concurrente:

Los resultados del instrumento se correlacionan con el criterio en el mismo momento o


punto de tiempo.

 Validez predictiva:

Si se fija en el futuro, se habla de validez predictiva.

 Validez de constructo:

Se interpreta la evidencia empírica de acuerdo con el nivel en el que clarifica la validez


de constructo de una medición en particular.
El proceso de validación de un constructo esta vinculado con la teoría. No es idóneo
llevar a cabo tal validación, a menos que existe un marco teórico que soporte la
variable en relación con otras variables.

 Validez de experto:

El grado en que aparentemente el instrumento mide la variable en cuestión, de acuerdo


con expertos.

Se encuentra vinculada a la validez de contenido y por muchos años se vio como parte
de ella.

Pero actualmente se considera como otro tipo de evidencia.

 Objetividad:

Se refiere al grado en que este es permeable a la influencia de los sesgos y tendencias


del investigador o investigadores que lo administran, califican e interpretan.

La objetividad se refuerza mediante la estandarización en la aplicación del instrumento


(mismas instrucciones y condiciones para todos los participantes) y en la evaluación de
los resultados; así como al emplear personal capacitado y experimentando en el test.

 Diferencia entre confiabilidad y validez:

La validez se refiere al grado en que el instrumento mide lo que se pretende medir. La


confiabilidad se refiere a la confianza que se concede a los datos. Esta última está
relacionada con la estabilidad o constancia, con la coherencia o consistencia interna y la
precisión de las medidas que se obtienen con el instrumento. La c. del instrumento se
estima a través del coeficiente α de Cronbach. La ventaja de este coeficiente reside en
que requiere de una sola administración del instrumento de medición.
2. Elabora un ensayo argumentativo, de cuatro páginas, sobre el proceso
de estandarización de un cuestionario, explicando la importancia de la
validez y confiabilidad en dicho proceso. No olvide los criterios de
valoración para el proceso de validación de los Ítems en las pruebas.

El presente ensayo muestra argumentos eficaz y constructivo, también permite


establecer valoración significativa para la idoneidad y comentario de un test.

Los argumentos explicados son muestra del conocimiento lógico adquirido con tan
relevante tema, donde nos conlleva a fortalecer nuestro aprendizaje.

Además cabe destacar que la estandarización pose elementos elementales en la que


se aspira la elaboración de un test, ósea que en la determinación del puntuaje permite
la puntuación significativa y coherente del puntuaje

Enjuiciamiento mediante el cual se establecen el sentimentalismo oportuno y acorde


para la dedicación, idoneidad y comentario de un test.

Cuando las condiciones de administración y calificación del test están bien definida y su
asimilación es identificada en todas las personas examinadas, entonces el aspecto más
importante que queda por resolver es la función de las puntuaciones logradas por los
sujetos evaluados. Esta función es interpretada y se realiza comparando el puntaje
unidos por el sujeto con la puntuación contenida en las tablas de norma.

La interpretación de un puntaje de test estandarizado arrojan números en medición de


un atributo psíquico y mental realizada con un test psicométrico se denominan
puntajes o calificaciones directas. Estos puntajes, adquieren un significado
psicométrico cuando se les compara con una tabla de normas o baremo, que ha sido
previamente construida con las puntuaciones que en el test han obtenido un grupo de
persona llamado grupo académico. Al realizar estas similitudes se puede hacer la
clasificación de los sujetos examinados con lo cual se llega a cumplir la intención del
test, que es clasificar a los sujetos examinados.

Las puntuaciones directas se alteran en varios tipos de puntuaciones derivados o


unidades de medición que se presentan solos tablas de normas o baremos. Un baremo
es una tabla que sistematiza las normas que trasforman los puntajes directos en
puntajes derivados que son interpretables estadísticamente. Puntajes derivados son los
siguientes: a) percentiles, puntaje derivado que transforman el puntaje directo en una
escala del 1 al 100, llamándose cada uno de los puntos un centil.

Un examinado que tiene un puntaje directo equivalente al percentil 80, se dice que
supera al 80% del grupo académico en el aspecto evaluado; b) puntajes estándar, que
son aquellos que tienen como unidad a fracciones de la desviación estándar, ejemplos:
el puntaje CI, el puntaje decatipo (escala del 1 al 9), el puntaje decatipo, entre otros.
También es un puntaje derivado la edad mental.

En los test utilizados en educación ha aparecido en los últimos años un tipo de test
denominados Test relacionados con las reglas, que siendo psicométricos defieren de
los otros tests que utilizan el pensamiento de norma fundamentado en la distribución
normal o curva de Gauss. En un test relacionado con el criterio el examinador fija un
puntaje que determinara a los aprobados de los desaprobados en un examen.

Los test proyectivos ponen en marcha los procesos mentales de las personas, cuyos
puntos terminales son sus reacciones. En la concepción de estas reacciones participan,
en mayor o menor grado, procesos asociativos, procesos perceptuales, actitudes
críticas de control y también sus interacciones. Asimismo los test proyectivos se
convierte en una indagación de procesos mentales.

La técnica proyectiva supone la objetividad de aspectos no conscientes de la


personalidad. Los materiales de prueba y las instrucciones son preguntas indirectas,
con respuestas también indirectas, las cuales son representadas por las reacciones de
las personas, con relación a los aspectos de su estructura psicológica de los cuales no
tiene reparo y es incapaz de comunicar directamente.

Una prueba o test debe aplicarse solamente para apreciar los aspectos para las cuales
se ha elaborado. Los baremos de una prueba no tienen validez. Sólo son válidas si los
sujetos que toman el test poseen cualidades similares a las de las personas que
formaron la muestra que sirvió para obtener dichas normas.

La confiabilidad de un test es el acierto y rigor con que el test mide lo que mide, en un
pueblo determinado y en las condiciones normales de aplicación.

La falta de confiabilidad de un test psicométrico está en relación con la intromisión del


error. Se considera que el error es cualquier efecto irrelevante para los fines o
resultados de la medición que influye sobre la falta de confiabilidad de tal medición. El
error es de dos tipos:

Error constante, que se produce cuando las mediciones que se obtienen con una
escala son sistemáticamente mayores o menores que lo que realmente deben ser, sin
embargo Error causal, se produce cuando las medidas son mayores o menores de lo
que efectivamente deben ser.

Es una prueba que ha sido normalizada o normatizada; es decir, que ha sido probada
en una población con distribución normal para la característica a estudiar, ya sea
el cociente intelectual, un ensayo químico como la determinación de la glucosa en la
sangre, conocimientos de historia, etcétera, puesto que un test estandarizado es una
herramienta empleada por diversas áreas de estudio, como algunas que pertenecen,
por ejemplo, a las Ciencias de la Salud.
En el proceso de estandarización se determinan las normas para su aplicación e
interpretación de resultados. Es así que para la aplicación de una prueba debe
hacerse bajo ciertas condiciones, las cuales deben cumplir, tanto quienes la aplican,
como a quienes se les aplica.
Esta estandarización persigue que los resultados sean útiles para la toma de
decisiones, si se realiza una prueba para decidir si una persona es o no aceptada en
determinada disciplina, la prueba debe garantizar lo mejor posible, que aquellos que se
aceptan llenan los requisitos requeridos y aquellos que se rechazan, verdaderamente
no los cumplen.
Para que una prueba sea aplicable a nivel poblacional debe cumplir ciertos requisitos:

 Validez: Una prueba es válida cuando mide lo que se quiere medir, una prueba de
conocimientos, por ejemplo, debe discernir, con un pequeño margen de error, entre
los que saben y los que no.

 Fiabilidad: Al aplicarse varias veces, la prueba reproduce resultados similares.


Interviene en ésta, el instrumento aplicado (un aparato de análisis de sangre, un
cuestionario, una prueba psicológica, etc.), éste debe producir resultados similares
cuando se aplica en los mismos individuos bajo las mismas condiciones,
independientemente del observador que lo administre.

 Exactitud: El resultado es el más cercano al valor real. Si una persona tiene 80


mg/dL de glucosa en sangre, esperamos que la prueba reproduzca valores muy
cercanos a este valor. Sería inadmisible que reportara 50 mg/dL ó 105 mg/dL. La
exactitud se refiere a la fineza del instrumento, así un cronómetro será más exacto
que un reloj de pulsera. Dicho de otra manera la exactitud es una medida de la
calidad de calibración del instrumento respecto de patrones de medida aceptados
internacionalmente. Se incluye aquí la sensibilidad y especificidad.
 Método Test-Retest:

Una forma de estimar la confiabilidad de un test o cuestionario es administrarlo dos


veces al mismo grupo y correlacionar las puntuaciones obtenidas. Este método tiene la
desventaja de que los puntajes pueden verse afectados por el recuerdo, la práctica,
etc. Este procedimiento no es adecuado para aplicarlo a pruebas de conocimientos
sino para la medición de aptitudes físicas y atléticas, tests de personalidad y motores.
El coeficiente que se obtiene recibe el nombre de coeficiente de estabilidad porque
denota la coherencia de las puntuaciones en el tiempo. Para un desarrollo adecuado y
sean confiables deben variar entre 0,80 y 0,95 (Popham, 1980, citado por Fuentes, op.
cit.).

 Método común de división por mitades o Hemitest:

Este método computa el coeficiente de correlación entre los puntajes de las dos
mitades del test o cuestionario aplicado. Esto supone que las dos test mitades son
paralelos, tienen igual longitud y varianza entre sí. Se estima a través del coeficiente de
confiabilidad de Spearman-Brown:i) Se establece la correlación entre los dos puntajes
de las dos mitades del test a través del método de los puntajes directos, Correlación r
de Pearson.

Se interpreta la prueba de Hemitest como coeficiente de consistencia interna, ya que


una sola prueba contiene las dos formas equivalentes y su énfasis lo pone en las
puntuaciones de los sujetos, no en los ítemes.

 El método de división por mitades de Rulon:

Utiliza la división del test en mitades, pero su método no supone necesariamente


varianzas iguales en los sub-tests. Coeficiente de consistencia interna.

 El método de división por mitades de Guttman:

También se denomina coeficiente de consistencia interna.

 Coefiente Alfa de Cronbach:

Para evaluar la confiabilidad o la homogeneidad de las preguntas o ítemes es común


emplear el coeficiente alfa de Cronbach cuando se trata de alternativas de respuestas
policotómicas, como las escalas tipo Likert; la cual puede tomar valores entre 0 y 1,
donde: 0 significa confiabilidad nula y 1 representa confiabilidad total.

 Método de Kuder-Richarson 20:

Permite obtener la confiabilidad a partir de los datos obtenidos en una sola aplicación
del test. Coeficiente de consistencia interna. Puede ser usada en cuestionarios de
ítemes dicotómicos y cuando existen alternativas dicotómicas con respuestas correctas
e incorrectas.

 Método de Kuder-Richarson 21:

Permite obtener la confiabilidad a partir de los datos obtenidos en una sola aplicación
del test. La suposición básica es considerar que todos los ítemes presentan igual
varianza. Coeficiente de consistencia interna.
 Interpretación del Coeficiente de Confiabilidad:

El coeficiente de confiabilidad es un coeficiente de correlación, teóricamente significa la


correlación del test consigo mismo. Sus valores oscilan entre 0 y 1.

Como colofón, cabe destacar que, existen instrumentos para recabar datos que por su
naturaleza no ameritan el cálculo de la confiabilidad, como son: entrevistas, escalas de
estimación, listas de cotejo, guías de observación, hojas de registros, inventarios,
rúbricas, otros. A este tipo de instrumentos, sin embargo, debe estimarse o
comprobarse su validez, a través del juicio de expertos, para establecer si los reactivos
que los configuran o integran se encuentran bien redactados y miden lo que se
pretende medir. Igualmente, instrumentos como la Historia Clínica no ameritan el
cálculo de la confiabilidad; debido a que, usualmente, ya se encuentra validada por su
uso frecuente y su confiabilidad se ha comprobado por sus aciertos, en otras palabras,
es un instrumento ya estandarizado. Al respecto, la Historia Clínica es definida por
Guzmán Mora (2006) como una de las formas de registro del acto médico y, en
esencia, son los profesionales de la salud quienes están en capacidad de practicar una
buena Historia Clínica; conceptualizada como el documento médico y clínico por
excelencia.
Conclusión

Con la información anteriormente proporcionada podemos concluir que los argumentos


explicados son muestra del conocimiento lógico adquirido con tan relevante tema,
donde nos conlleva a fortalecer nuestro aprendizaje. Además cabe destacar que la
estandarización pose elementos elementales en la que se aspira la elaboración de un
test, ósea que en la determinación del puntuaje permite la puntuación significativa y
coherente del puntuaje. Enjuiciamiento mediante el cual se establecen el
sentimentalismo oportuno y acorde para la dedicación, idoneidad y comentario de un
test.

También podría gustarte