Está en la página 1de 14

VALIDEZ DE INSTRUMENTOS DE MEDICIN EDUCATIVA

Conceptualizacin
Cuando se analiz en el captulo anterior la confiabilidad, se dijo que sta
determina si los puntajes provenientes de la aplicacin de un instrumento son estables
en el tiempo si se aplica el instrumento dos veces; son equivalentes si se aplican dos
versiones de un mismo instrumento; y consistentes, si quienes responden un
instrumento lo hacen homogneamente. La confiabilidad determina si los puntajes de un
instrumento son los mismos en el tiempo y en situaciones similares; pero no determina
si lo que est midiendo es lo que realmente se quiere medir. Puede ocurrir que un
instrumento sea estable, equivalente y homogneo; pero no mide la variable que se
desea medir, ejemplo, una balanza puede medir en repetidas mediciones un peso de un
objeto o sujeto en forma consistente. Las veces que se pesa, ste es el mismo. Esto
determina por lo tanto confiabilidad; pero puede ser que ste no sea el peso del objeto o
sujeto, es decir, mide algo en forma consistente, pero no lo que realmente queremos
medir.
La validez tiene como propsito determinar si el instrumento mide exactamente lo
que se quiere medir. Es por esta razn que suele afirmarse que la confiabilidad de un
instrumento es una condicin necesaria para evaluarlo, pero no suficiente; porque un
instrumento puede ser confiable, sin ser vlido; pero al ser vlido es necesariamente
confiable.
El lector puede preguntar, si un instrumento que es vlido, tambin es confiable
Por qu no concentrar la evaluacin del instrumento en la validez y nos olvidamos de
la confiabilidad?. La respuesta a la pregunta, es que hallar evidencias de validez es ms
difcil que calcular la confiabilidad, la cual se reduce a un mero tecnicismo, a calcular
un coeficiente de confiabilidad. La validez tambin aplica coeficientes, pero requiere la
presencia de evidencias que determinan la validez del instrumento, las cuales en la
mayora de las veces es muy difcil de obtenerlas, porque las mismas implica determinar
aspectos tericos de lo que se quiere medir y relacionarlos con evidencias empricas; las
cuales no siempre son accesibles en el proceso de validacin de instrumento.
Mtodos de Validez
Los mtodos para determinar la validez son: Validez de contenido (a travs de la
tcnica de Juicio de expertos), Validez de criterio (la cual se subdivide en validez

concurrente y predictiva) y la validez de constructo (a travs de sus dos clases:


convergente y discriminante, aunque adems de stas hay otras evidencias de validez de
constructo, las cuales tambin se analizarn). A continuacin se explican los diferentes
mtodos de validez:
Validez de Contenido
La validez de contenido es la ms usual entre los tipos de validez. Esto se explica,
porque se le puede aplicar a cualquier instrumento independiente de la escala de
medicin. Los otros tipos de validez exigen como mnimo una escala de medicin
ordinal. El otro aspecto que favorece la aplicacin de este mtodo, es que la tcnica
empleada para obtener la validez de contenido es la tcnica de Juicio de Experto, la cual
consiste en la revisin del instrumento por expertos en la variable en estudio, quienes en
la mayora de los casos se localizan fcilmente.
Para la evaluacin del contenido del instrumento, el investigador o diseador del
instrumento, debe proporcionarle al experto un formato para evaluar el instrumento,
donde ste realiza las observaciones y recomendaciones sobre el contenido del
instrumento.
A continuacin se presentan algunos modelos de formato

MODELO 1.-FORMATO PARA EVALUAR EL INSTRUMENTO


tem
1
2
3
.
.
.
.
.
.
.
.

Congruencia
S ----- No -----

Claridad
S------ No -----

Tendenciosidad
S ------ No -----

Observaciones

.
.
n

MODELO 2.- FORMATO PARA EVALUAR EL INSTRUMENTO


tem
1
2
3
.
.
.
.
.
n

Esencial

til pero no esencial

No necesario

A continuacin se presenta y ejemplifica la razn de validez de contenido, la cual


se puede aplicar cuando el formato de evaluacin es el modelo 2:
Razn de Validez de Contenido

Ne N 2
CVR
N
2
CVR = razn de validez de contenido
Ne = Nmero de expertos que indican "Esencial"
N = Nmero total de expertos.
Ejemplo
1.- CVR negativo: cuando menos de la mitad de expertos indica esencial.
Supngase que cuatro (4) de once (11) expertos indicaron esencial.
CVR

4 (11 2)
0,27
11 2

2.- CVR cero = Cuando

exactamente la mitad de los expertos indican

"esencial" . Supngase que cinco (5) de diez (10) expertos indican que es
esencial
CVR

5 (10 2)
0
10 2

3.-CVR positivo = cuando ms de la mitad; pero no todos los expertos indican


"esencial". Supngase que nueve (9) de once (11) expertos indican que es esencial.
CVR

9 (11 2)
0.64
11 2

Para interpretar los resultados debe consultarse la tabla que se presenta a


continuacin:

Valores mnimos de la razn de validez de contenido para asegurar que es


improbables que el acuerdo se debe al azar.
Nmero de expertos
5
6
7
8
9
10
11
12
13
14
15
20
25
30
35
40

Valor mnimo
0.99
0.99
0.99
0.75
0.78
0.62
0.59
0.56
0.54
0.51
0.49
0.42
0.37
0.33
0.31
0.29

Fuente: Cohen, R y Swerdlik, M. (2.000). Pruebas y Evaluacin Psicolgicas, 4


edicin: Mc Graw Hill, pg. 189.
Al consultar en esta tabla los resultados de los tres ejemplos desarrollados, los
mismos se interpretan de la manera siguiente: en el primer ejemplo, el resultado es
negativo por lo tanto se rechaza el tem; ya que la tabla no tiene valores mnimos
negativos. En el segundo ejemplo es cero, al consultar la tabla, se observa que tampoco
tiene valores mnimos de cero, lo cual debe llevar a tomar como decisin excluir el tem
del instrumento. En el tercer ejemplo el resultado es mayor a cero; para interpretar el
resultado consultamos la tabla, procediendo de la manera siguiente: se consulta en la
tabla el valor mnimo cuando hay 11 expertos, el cual es 0,59. Se compara con el valor
calculado que es 0,64. Este valor est por encima del valor mnimo exigido, por lo tanto,
se acepta el tem.
Adems del Formato de evaluacin del instrumento, es recomendable anexar al
instrumento, el cuadro de operacionalizacin de la variable, los objetivos de la
investigacin y las bases tericas de la variable en estudio. Esta informacin ampliar el
conocimiento del experto sobre la variable que se quiere medir y le permitir
proporcione mejores observaciones y recomendaciones sobre el instrumento evaluado.

Validez de Criterio
Determina la relacin existente entre las puntuaciones de un instrumento de
medicin y una variable (conocida como criterio).
Qu es un criterio?
Para Hurtado (2.000) un criterio es: ... una medida externa, independiente al
instrumento (en evaluacin), con el cual se supone que ste est correlacionado y que en
definitiva es la caracterstica o conducta que el instrumento intenta predecir... [pretende
medir] (p. 435).
Un ejemplo es predecir el rendimiento que tendr un estudiante en su futura
carrera universitaria (criterio) a travs de una prueba de aptitud acadmica (instrumento
en evaluacin). Para validar el instrumento, se aplica a un grupo de estudiantes que
aspiran ingresar a la Universidad, se espera que haya transcurrido un semestre o un ao
acadmico para correlacionar las puntuaciones obtenidas en el instrumento con la
calificaciones promedio del mismo grupo despus de finalizar el semestre o ao
acadmico.
El estadstico que se emplea es el coeficiente de correlacin de Pearson (si la
escala de medicin de las puntaciones se considera como mnimo en intervalo) o el
coeficiente de correlacin de Spearman (si la escala de medicin es ordinal). Para
conocer el procedimiento exigido en el clculo de ambos coeficientes puede consultar
las secciones de la Unidad sobre confiabilidad de instrumento de medicin educativa
(Unidad anterior) que aborda el mtodo de confiabilidad de reaplicacin de la prueba.
Caractersticas que debe reunir un criterio
1. Pertinencia: debe juzgarse si el criterio representa realmente un rendimiento
adecuado de la variable que se desea medir.
2. Debe ser confiable.
3. Debe estar libre de tendenciosidad.
4. Debe poseer validez.
Coeficiente de validez de criterio.

El coeficiente de validez de criterio se determina correlacionando los puntajes del


instrumento en evaluacin con los puntajes del criterio. La

interpretacin de los

resultados es similar a la del coeficiente de confiabilidad. A continuacin se presenta los


valores para su interpretacin:
Rango
0.81 ----------- 1
0.61 ----------- 0.80
0.41 ----------- 0.60
0.21 ----------- 0.40
0.00 ----------- 0,20

Interpretacin
Muy alta
Alta
Moderada
Baja
Muy baja

Clase de validez de criterio


Se conocen dos clases de validez de criterio:
Validez concurrente. Cuando las puntuaciones del instrumento en evaluacin se
obtienen ms o menos al mismo tiempo que las medidas del criterio. Ejemplo: cuando
se utilizan los resultados de una prueba de habilidades numricas y verbales
(instrumento en evaluacin) para determinar el rendimiento acadmico (criterio).
Validez predictiva. Cuando el criterio est en tiempo futuro. Ejemplo: cuando se
utilizan los resultados de una prueba de aptitud acadmica (instrumento en evaluacin)
para predecir el desempeo acadmico (criterio) del alumno en un curso.
Validez de construccin (o de constructo)
Definicin de constructo
Se est en presencia de un constructo cuando la variable a investigar no se puede
medir directamente; pero muchas de las conductas que se consideran como aspecto de
ella son descriptibles y medibles.
Definicin de validez de constructo
Grado en que un instrumento es una medida de un constructo en particular.

Clases de validez de constructo


Validez Convergente. Se determina correlacionando los puntajes del instrumento
que mide el constructo en estudio con los puntajes de otro instrumento que mide el
mismo constructo u otro con el cual debera correlacionarse positivamente. La
correlacin para que exista validez de constructo convergente debe ser alta o muy alta y
la aplicacin de ambos instrumentos debe ser a la misma muestra de sujetos.
Validez Discriminante. Se determina correlacionando las puntuaciones

del

instrumento que mide el constructo en estudio con las puntuaciones de otro instrumento
que mide otro constructo o variables, con la cual el constructo en estudio no debera
correlacionarse. El coeficiente de correlacin en la medida que se aproxime a cero (0)
indica mayor validez discriminante.
Etapas para Calcular la Validez de Constructo
1. Establecer la relacin terica entre los conceptos, basndose en el marco terico, en
que se fundamentan ambos instrumentos.
2. Correlacionar los puntajes de los sujetos en ambos instrumentos.
3.

Determinar qu clase de validez de constructo posee el instrumento.

Otras Evidencias de Validez de Constructo


Adems de las evidencias obtenidas por la validez convergente y discriminante,
hay otras evidencias de validez de constructo, las cuales se explican a continuacin:
1. Evidencia de homogeneidad o consistencia interna: se refiere a lo bien que
mide un instrumento un solo concepto. Se puede determinar a travs de: (a) Correlacin
item-test: se determina la correlacin existente entre cada tem que conforma el
instrumento con el total de puntajes del instrumento. El programa SPSS dispone de este
indicador. Se debe rechazar todos aquellos temes con un coeficiente de correlacin
tem-test inferior o igual a 0,25; (b) Capacidad de discriminacin de los temes: mide el
grado en que los sujetos de altas calificaciones y los sujetos de bajas calificaciones
responden en forma diferenciada los temes.
2. Evidencias de cambios con la edad: Se somete un instrumento a este indicador
cuando cuanto hay certeza que la edad influye en su comportamiento. Ejemplo: se
puede aplicar una prueba de rapidez en la lectura a escolares de grupos de edades

diferentes. La prueba evidenciar validez de constructo si los grupos de grados


superiores obtienen calificaciones ms altas que los grupos de grados inferiores. Esto
debe ser de esta manera, porque est demostrado que el incremento de la escolaridad
mejora la rapidez en la lectura.
3. Evidencias de cambios preprueba-posprueba: Si se aplica una estrategia
instruccional, la cual ha demostrado eficacia para incrementar el rendimiento
acadmico, los puntajes de un instrumento que mide el rendimiento acadmico, deben
tener diferencias significativas al comparar los resultados de la preprueba, aplicada
antes de comenzar la estrategia instruccional, con los resultados de la posprueba,
aplicada despus de concluir el curso sometido a la estrategia. Si las diferencias entre la
preprueba y posprueba son significativas, se puede asegurar que el instrumento tiene
validez de construccin.
4. Evidencia de grupos distintos: Si se disea un instrumento que mide la actitud
del estudiante hacia la matemtica y se aplica el instrumento a dos grupos claramente
diferenciados: grupo de alumnos que aprobaron la asignatura matemtica y grupo de
alumnos reprobados en esa asignatura, un instrumento con validez de constructo debe
presentar como resultado estudiantes que aprobaron la asignatura con una actitud hacia
las matemticas ms favorable y los estudiantes reprobados con una actitud menos
favorable.
5. Anlisis Factorial: El anlisis factorial es una tcnica que a travs de un
procedimiento matemtico y estadstico complejo, determina si los temes de un
instrumento miden solamente un aspecto de la variable en estudio. Asimismo identifica
aquellos temes que no miden ningn aspecto de la variable en estudio, los cuales deben
excluirse del instrumento. El anlisis factorial es un indicador tan importante en el
proceso de validacin de un instrumento que se dedicar la prxima unidad a desarrollar
paso a paso su procedimiento.
Ejercicios Propuestos
Actividad 1
1. Revise un trabajo de grado, evale los temes del instrumento aplicado para la
recoleccin de datos; y llene el formato presentado a continuacin:

Formato para Evaluar el Instrumento

tem

Aspectos a evaluar del Instrumento


Congruencia (1)
Claridad (2)
Tendenciosidad (3)
Si
No
Si
No
Si
No

Observaciones (4)

1
2
3

Fecha:
Nombre del Experto:

Firma:

Institucin donde trabaja:

Cargo que desempea:

(1)
(2)
(3)
(4)

Congruencia: S el tem se relaciona con el indicador, subdimensin, dimensin y


variable que se pretender medir o describir.
Claridad: Redaccin del tem
Tendenciosidad: Si induce a responder en forma favorable, indecisa o desfavorable.
Observaciones: Recomendaciones sobre el tem que es evaluado desfavorablemente:
modificarlo, sustituirlo por otro, excluirlo del instrumento, etc.

Actividad 2
Determine la razn de validez de contenido:
Un Jurado lo integran nueve (9) expertos.
Qu decisin debe tomarse con respecto al tem?
1. Siete (7) expertos indican que el tem es "esencial".
2. Tres (3) expertos indican que el tem es "esencial".

3. Tres (3) expertos indican que el tem "no es necesario" y dos que es " til pero
no esencial", el resto respondieron que es "esencial".
4. Cinco (5) expertos indican que el tem es "til pero no esencial ", uno (1) que
"no es necesario" y el resto que es "esencial".
5. Todos los expertos indicaron que no es esencial.
6. Slo un (1) experto indic que es esencial.
Actividad 3
Determine el coeficiente de validez de criterio e interprete el resultado.
Instrumento en evaluacin

Criterio

(puntajes)

(puntajes)

19

19

18

17

15

15

20

20

16

15

17

14

18

18

20

19

20

19

10

14

15

11

14

14

12

14

14

13

16

15

14

16

17

15

15

14

16

18

19

17

14

14

18

17

17

19

20

20

20

18

18

21

14

13

sujetos

22

15

16

23

18

18

24

19

19

25

15

16

ACTIVIDAD 4
Determine en los siguientes ejercicios si existe validez convergente o
discriminante:
Situacin 1
Se ha demostrado tericamente que la actitud hacia las innovaciones educativas y
la motivacin al logra se correlacionan positivamente. Tomando en cuenta esta relacin
el Constructor de una escala de actitud hacia las innovaciones educativas desea
determinar si el instrumento diseado tiene validez de constructo. En este sentido aplica
a una misma muestra de sujeto este instrumento, conjuntamente con otro instrumento
que mide la motivacin al logro; el cual

tiene debidamente comprobado validez.

Calcule el coeficiente de validez e interprete los resultados que se muestran en la


siguiente tabla:

Sujetos
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

Actitud hacia las


innovaciones educativas
(Puntajes)
3
5
5
2
4
1
2
3
5
5
5
4
2
2
1
1
4
4
5
1

Motivacin al logro
(Puntajes)
3
4
5
2
5
2
2
3
5
5
5
5
2
2
1
2
5
5
5
2

Situacin 2
Se ha demostrado tericamente que el coeficiente de inteligencia y el nivel de
ingreso no se correlacionan; tomando en cuenta esta afirmacin el constructor de una
prueba de inteligencia, correlaciona los puntaje de un test de inteligencia aplicado a un
grupo de sujetos con el nivel de ingreso que posee cada uno de ellos. Calcule e
interprete el coeficiente de validez.

sujetos
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28

Coef. de Inteligencia
(C.I)
98
120
111
115
125
85
95
99
115
100
115
130
125
114
105
100
100
98
95
65
80
75
98
95
89
110
95
100
Referencias

Ingreso/mensual
(Bs.)
100.000
700.000
990.000
1.200.000
3.500.000
1.100.000
1.090.000
900.000
1.100.000
1.100.000
1.300.000
1.040.000
900.000
1.200.000
1.500.000
905.500
1.300.000
900.000
1.000.000
2.290.000
800.000
800.000
2.500.000
900.000
1.100.000
970.000
2.700.000
3.000.000

Cohen, R., Y Swerdlik, M. (2.001). Pruebas y Evaluacin Psicolgicas. Mxico: Mc


Graw Hill.

Hurtado, J. (2.000). Metodologa de la investigacin holstica. (Tercera edicin)


Caracas. Sypal.
Lecturas Sugeridas
Aiken, L. (1.996). Test psicolgicos y evaluacin. Mxico: Prentice Hall. Se recomienda
el Captulo 4: Estandarizacin, confiabilidad y validez. Punto: Validez.
Ary, D., Jacobs, L.., Y Razavieh, A. (1.994). Investigacin pedaggica. (Segunda
Edicin). Mxico: Mc Graw Hill. Se recomienda el Captulo 8: Validez y
confiabilidad. Punto: Validez.
Cohen, R., Y Swerdlik, M. (2.001). Pruebas y Evaluacin Psicolgicas. Mxico: Mc
Graw Hill.
Hurtado, J. (2.000). Metodologa de la Investigacin Holstica. (Tercera edicin).
Caracas: Sipal. Se recomienda el Captulo 24: Construccin y validacin de
instrumentos. Seccin 24.3: Validez de instrumentos.
Kerlinger, F. (1.988). Investigacin del comportamiento (Segunda edicin en espaol):
Mxico: Mc Graw Hill. Se recomienda el Captulo 27: Validez.
Ruiz, B (2001) Instrumento de Investigacin Educativa. Barquisimeto: Ediciones
CIDEG. C.A.

También podría gustarte