Documentos de Académico
Documentos de Profesional
Documentos de Cultura
LECTURA
Lima, Perú
2020
Índice
INTRODUCCIÓN.................................................................................................. iii
1. Consideraciones previas.............................................................................. 4
2. Validez......................................................................................................... 4
ii
2.1. Definición.................................................................................................... 4
3. Confiabilidad............................................................................................. 10
4. REFERENCIAS............................................................................................ 21
iii
INTRODUCCIÓN
2. Validez
2.1. Definición
Ebel (1977, citado por Fuentes, 1989) establece que validez “…designa la
coherencia con que unos conjuntos de puntajes de una prueba miden aquello que
deben medir” (p. 103). La validez se refiere al grado en que una prueba proporciona
información que es apropiada a la decisión que se toma. La validez responde a la
pregunta ¿con qué fidelidad corresponde el universo o población al atributo que se va a
medir? Por ejemplo: Una prueba de conocimientos de regresión lineal tiene que medir
esto y no conocimientos de regresión cuadrática.
4
seleccionan al menos cinco expertos o jueces, para juzgar de manera independiente.
Cada experto debe recibir la información escrita suficiente sobre: el propósito de la
prueba (objetivos), conceptualización del universo de contenido, tabla de
especificaciones o de operacionalización de las variables del estudio y la ficha de
validación del instrumento. Se recogen y analizan los instrumentos de validación y se
decide: Un resultado de validez mayor al 61% es considerado aceptable y por lo tanto,
el instrumento es aplicable. El porcentaje de validez menor a 61% implicará que el
investigador deberá revisar el instrumento para que sea evaluado nuevamente.
La validez cuantitativa de contenido se puede efectuar mediante el estadístico
V de Aiken o la prueba binomial.
Ejemplo:
La tabla muestra la base de datos de la pertinencia y no pertinencia de 31
ítems valuados por Jueces de expertos en investigación. Hallamos la validez de
contenido del instrumento con la V de Aiken.
5
El coeficiente V de Aiken para cada Juez se obtiene reemplazando los datos en
la expresión matemática
S 4
V= = =0,88
[ n ( c−1 ) ] [ 5 ( 2−1 ) ]
6
c) Se interpreta la evidencia empírica de acuerdo con el nivel en el que se
clarifica la validez de constructo de una medición en particular.
Para efectuar la validez de constructo podemos emplear: análisis factorial,
análisis de cofactores, análisis de covarianza. Además, la correlación por rangos (Rho)
de Spearman, la correlación por puntuaciones netas r de Pearson y el coeficiente Alfa
de Cronbach.
Ejemplo:
7
Tabla. Tabla de correlaciones de validez de constructo
Lenguaje
Aprendizaje de Lenguaje algebraic Lenguaje Lenguaje
regresión lineal verbal o numérico gráfico
Aprendizaje de Correlación de 1 ,942** ,929** ,940** ,812**
regresión Pearson
lineal Sig. (bilateral) ,000 ,000 ,000 ,000
N 15 15 15 15 15
** ** **
Lenguaje Correlación de ,942 1 ,868 ,993 ,635*
verbal Pearson
Sig. (bilateral) ,000 ,000 ,000 ,011
N 15 15 15 15 15
** ** **
Lenguaje Correlación de ,929 ,868 1 ,881 ,697**
algebraico Pearson
Sig. (bilateral) ,000 ,000 ,000 ,004
N 15 15 15 15 15
** ** **
Lenguaje Correlación de ,940 ,993 ,881 1 ,599*
numérico Pearson
Sig. (bilateral) ,000 ,000 ,000 ,018
N 15 15 15 15 15
** * ** *
Lenguaje Correlación de ,812 ,635 ,697 ,599 1
gráfico Pearson
Sig. (bilateral) ,000 ,011 ,004 ,018
N 15 15 15 15 15
**. La correlación es significativa en el nivel 0,01 (bilateral).
*. La correlación es significativa en el nivel 0,05 (bilateral).
8
Si hay validez de criterio, las puntuaciones obtenidas por ciertos casos
en un instrumento deben estar correlacionadas y predecir las puntuaciones de
estos mismos casos logradas en otro criterio. La pregunta que se responde con
la validez de criterio es: ¿en qué grado el instrumento comparado con otros
criterios externos mide lo mismo?
Si el criterio se fija en el presente de manera paralela, se habla de
validez concurrente (Kaplan y Saccuzzo, 2013) (los resultados del instrumento
se correlacionan con el criterio en el mismo momento o punto de tiempo)
Si el criterio se fija en el futuro, se habla de validez predictiva (The SAGE
Glossary of the Social and Behavioral Sciences, 2009d).
Ejemplo:
Los resultados, en puntuaciones, obtenidos por los estudiantes en la prueba
sobre objetivos en la investigación científica, simbolizados por la variable “x”, y los
logrados en la redacción de objetivos de la investigación, considerados como variable
criterio por la variable “y”, pueden observarse en la siguiente tabla.
9
La correlación de producto momento de Pearson resultó 0,93 indica que la
validez de criterio del instrumento es alta.
3. Confiabilidad
La confiabilidad tiene que ver con la exactitud y precisión del procedimiento
de medición. Los coeficientes de confiabilidad proporcionan una indicación de la
extensión, en que una medida es consistente y reproducible. La utilidad práctica está
relacionada con factores, tales como: economía, conveniencia e interpretación para
determinar si una prueba es práctica para usarla ampliamente.
La confiabilidad de un instrumento de medición se refiere al grado en que su
aplicación repetida al mismo individuo u objeto produce resultados iguales, Hernández,
et al (2014, p. 200).
A continuación, se muestran cuatro métodos para determinar la confiabilidad
del instrumento.
10
n ( ∑ XY ) −( ∑ X )( ∑ Y )
r xy =
2 2
√[ n ∑ X −(∑ X ) ][ n∑ Y −(∑ Y ) ]
2 2
Donde:
Ejemplo:
Un grupo de 16 alumnos fue sometido en dos ocasiones a una misma prueba
de resistencia física. Los minutos que cada alumno logró durar en la ejecución de lo
ejercicio solicitados se señalan en la tabla. Determinar la confiabilidad de la
estabilidad.
11
El coeficiente de correlación de Pearson resultó 0,75; indica que la
confiabilidad del instrumento es alta, por lo tanto, es aplicable a la muestra de
investigación.
n ( ∑ XY ) −( ∑ X )( ∑ Y )
r xy =
2 2
√[ n ∑ X −(∑ X ) ][ n∑ Y −(∑ Y ) ]
2 2
Ejemplo
Se administró dos pruebas similares en contenido sobre conocimiento de
Metodología de Investigación a un grupo de estudiantes, para probar la confiabilidad
del instrumento.
12
En este caso se hará la confiabilidad con el método de paralelas, siempre
usando SPSS.
a) Coeficiente de Pearson:
n ( ∑ XY ) −( ∑ X )( ∑ Y )
r xy =
2 2
√[ ][
n ∑ X 2 − ( ∑ X ) n ∑ Y 2− ( ∑ Y ) ]
2 ∙r EM
r dm =
1+r EM
13
r EM =
∑ (Zi ∙ Z p)
n
d) Determinación de Z:
X− X́
Z=
σ
2
Donde X = cada una de las puntuaciones
X́ = promedio de puntuaciones
σ=
√ ∑ X2 − ∑ X
N ( )
N
σ = desviación estándar
e) Coeficiente de Rulón
S 2d
r tt =1−
S2t
Donde:
r tt : Coeficiente de confiabilidad
S2d : Varianza de la diferencia entre las puntuaciones de las mitades
S2t : Varianza de las puntuaciones del test total
f) Coeficiente de Guttman
S 2a +S 2b
[
r tt =2 1−
S2t ]
Donde:
r tt : Coeficiente de confiabilidad
S2a : Varianza de las puntuaciones de los ítems pares
S2b : Varianza de las puntuaciones de los ítems impares
S2t : Varianza de las puntuaciones del test total
Ejemplo: la base de datos en la tabla adjunta, corresponde a los resultados del
posprueba de 50 ítems; el código 0 indica respuesta incorrecta y el código 1 indica
respuesta correcta, efectuamos la prueba de confiabilidad con la prueba de dos
mitades.
14
Estadísticos de fiabilidad Resultados
Alfa de Cronbach Parte 1 Valor ,902
N de elementos 25a
Parte 2 Valor ,902
N de elementos 25b
N total de elementos 50
Correlación entre formularios ,887
Coeficiente de Longitud igual ,940
Spearman-Brown Longitud desigual ,940
Coeficiente de dos mitades de Guttman ,939
a. Los elementos son: I1, I2, I3, I4, I5, I6, I7, I8, I9, I10, I11, I12, I13, I14, I15, I16,
b. Los elementos son: I26, I27, I28, I29, I30, I31, I32, I33, I34, I35, I36, I37, I38, I39,
I40, I41, I42, I43, I44, I45, I46, I47, I48, I49, I50.
15
medición y se calcula el coeficiente de confiabilidad, Hernández et al. (2014). Para
obtener el coeficiente se emplea:
2
K ∑ Si
α=
K−1
1−
(St 2 )
Si2 = varianza de las puntuaciones en cada ítem por todos los examinados.
St2 = varianza total de las puntuaciones de filas de todos los examinados.
K = número de ítems
ŽŵŽĐƌŝƚĞƌŝŽŐĞŶĞƌĂů͕' ĞŽƌŐĞLJD ĂůůĞƌLJ;ϮϬϬϯ ͕ Ɖ ͘Ϯϯ ϭ ͿƐƵŐŝĞƌĞŶůĂƐ
ƌĞĐŽŵĞŶĚĂĐŝŽŶĞƐƐŝŐƵŝĞŶƚĞƐƉĂƌĂĞǀ ĂůƵĂƌůŽƐĐŽĞĨŝĐŝĞŶƚĞƐĚĞĂůĨĂĚĞ
ƌŽŶďĂĐŚ ͗
Ͳ
ŽĞĨŝĐŝĞŶƚĞĂůĨĂх͘ ϵĞƐĞdž
ĐĞůĞŶƚĞ
Ͳ
ŽĞĨŝĐŝĞŶƚĞĂůĨĂх͘ ϴĞƐďƵĞŶŽ
Ͳ
ŽĞĨŝĐŝĞŶƚĞĂůĨĂх͘ ϳ ĞƐĂĐĞƉƚĂďůĞ
Ͳ
ŽĞĨŝĐŝĞŶƚĞĂůĨĂх͘ ϲĞƐĐƵĞƐƚŝŽŶĂďůĞ
Ͳ
ŽĞĨŝĐŝĞŶƚĞĂůĨĂх͘ ϱĞƐƉŽďƌĞ
Ͳ
ŽĞĨŝĐŝĞŶƚĞĂůĨĂф͘ ϱĞƐŝŶĂĐĞƉƚĂďůĞ
16
La tabla muestra la confiabilidad de un instrumento compuesto por 20 ítems
con escala de Likert, administrados a 12 sujetos que tienen la misma característica que
la muestra:
Resumen de procesamiento de
casos
N %
Casos Válido 12 100,0
a
Excluido 0 ,0
Total 12 100,0
a. La eliminación por lista se basa en todas las
variables del procedimiento.
Estadísticas de fiabilidad
Alfa de Cronbach N de elementos
,882 20
17
K
∗S 2t −∑ pq
K −1
KR 20=
S2t
Donde:
K: número de ítems
St2 = varianza total de las puntuaciones obtenidas por todos los examinados.
P = proporción de examinados que responde adecuadamente a cada ítem.
N ° persona que respondieron elítem correcto
p=
N ° de personas examinadas
q = proporción de examinados que responde en forma incorrecta u omiten
cada ítem. Como: p + q = 1 entonces q = 1 – p
∑ pq = suma total de los productos resultantes de multiplicar p por q, para
cada ítem.
El método Kuder-Richardson, Se trata de la misma fórmula que el Alfa de
Cronbach solo que esta última es expresada para ítems continuos y Kuder- Richardson
para ítems dicotómicos.
Coeficiente KR-20 de Kuder – Richardson. “Desarrollaron un coeficiente para
estimar la confiabilidad de una medición, su interpretación es la misma que la del
coeficiente alfa” (Hernández, et al., 2003b). “Permite calcular la confiabilidad con una
sola aplicación del instrumento, no requiere el diseño de pruebas paralelas, y es
aplicable sólo en instrumentos con ítems dicotómicos, que pueden ser codificados con
1 – 0 (correcto – incorrecto, presente – ausente, a favor – en contra, etc.)” (Silva,
2009d).
Los instrumentos donde se puede aplicar el KR20, pueden ser en pruebas, test
de conocimientos, lista de cotejo y otros instrumentos que el investigador elabore,
dependiendo del diseño y muestra de su investigación.
Ejemplo:
La tabla muestra la confiabilidad de un instrumento compuesto por 20 ítems
con escala de Guttman, administrados a 20 sujetos que tienen la misma característica
que la muestra. La base de datos corresponde a una prueba de conocimientos.
18
El coeficiente KR20 de Kuder-Richardson resultó 0,86 indica que el
instrumento tiene alta confiabilidad. Por lo tanto, el instrumento se puede aplicar a la
muestra.
19
4. REFERENCIAS
Alvarado, E., Canales, F. y Fineda, E. (1994). Metodología de la Investigación (2ª ed.).
Washington D. C: Organización Panamericana de la Salud
Bostwick, G.J. y Kyte, N.S. (2005). Measurement. En Grinell, R.M. y Unrau, Y.A. (Eds.).
Social work: Research and evaluation. Quantitative and qualitative
approaches(7ª ed., pp.97-111). Nueva York: Oxford University Press
Carmines, N. y Zeller, R. (1979) Reliability and validity assessment. Londres: Sage.
Cronbach, L. (1951) “Coefficient alpha and the internal structure of
test”.Psychometrika, 16, 3, 297-334.
De Arquer, M. I. (2011). NTP 401: Fiabilidad humana: métodos de cuantificación, juicio
de expertos. Centro nacional de condiciones de trabajo, España.
Hernández, S., Fernández, C., & Baptista, L. (2014). Metodología de la Investigación.
6ta edición (5ta ed.). México: McGraw-Hill/Interamericana.
Kaplan, R. M., & Saccuzzo, D. P. (2013). Psychological Testing: Principles, Applications,
and Issues. MINDTAP.
Palella, S. y Martins, F. (2003). Metodología de la Investigación cuantitativa. Caracas:
Fedupel.
Sherman, R. R., & Webb, R. B. (1988). Qualitative research in education: A focus.
Qualitative research in education: Focus and methods, 2-21.
20