Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Copyright © 2020
ISBN: 9798606711741
A: Mi madre Mercedes,
Johanna, Diego y Emilio
AV. JAVIER PRADO ESTE 4921 OF. 07, CAMACHO –LA
MOLINA- LIMA-PERÚ DIRECTOR: EFER SOTO
http://editorialapogeo.blogspot.com/
Índice
I
Conceptos preliminares
Tipos de validación
Medición y evaluación
Instrumentos de acopio de datos.
Tratamiento de variables
II
Elaboración de pruebas y el proceso de validez interna.
Determinación de los propósitos y usos de pruebas.
Validez de contenido.
Validez de constructo o de concepto.
Validez predictiva.
Validez concurrente.
Validez estadística o empírica
Confiabilidad el coeficiente Alpha (Cronbach).
Evaluación de pruebas de diagnóstico (la curva ROC).
Terminología y sus derivados a partir de una matriz
Índice de discriminación de un ítem.
Índice de fiabilidad y error de medición.
Error estándar de media.
III
Aplicación del proceso de validación y confiabilidad
Para el proceso de sensibilización y especificidad.
Procedimientos técnicos de validez y confiabilidad para un cuestionario.
Aspectos conceptuales del instrumento
Proceso de validación del instrumento.
Descripción de la aplicación del instrumento.
Análisis exploratorio
Proceso de confiabilidad.
Modelo del análisis factorial confirmatorio
Validez confirmatoria
Introducción
Elaboración de
Programación del trabajo Determinación de la
instrumentos para
de campo población que va a validar
recoger la información
Medición y evaluación
Observado Atributo.
Ser humano Inteligencia
Estudiante Logro alcanzado
Empresa de producción Cantidad de productos
Municipalidad Recaudación de impuestos
Paciente (trillaje) Talla
Por. S. Stevens (1951; citado por Carballo y Guelmes, 2016)7 La
medición es, conocer la verdadera magnitud del fenómeno, de ahí que
resulta muy importante que toda auténtica medición sea isomórfica
con la realidad que se está midiendo; aunque en realidad no se mide el
fenómeno directamente, sino los indicadores de sus características
(atributos).
- Ingeniero. (1)
- Abogado (2)
Carrera profesional - Profesor (3)
- Medico (4)
- Psicólogo (5)
- Administrador (6)
La medición de la escala nominal, podría representarse a nivel de
comparación entre las cualidades de su categoría.
c. Escala de intervalo.
Es la escala de medición de valores reales mas no relativas, intervalo, en
el que se establecen distancias iguales para cada puntuación, es decir, se
diseña una escala con intervalos iguales.
Niveles de medición.
Tratamiento de variables
Indicador
satur
…………… …………… …………… …………… ación
REACTIVOS …………… …………… …………… ……………
.. .. .. ..
a. Bandura ( 1 )
b. Skinner ( 2 ) INDICE
c. Bruner ( 3 )
d. Norman ( 4 ) DATOS
Son muchas las cualidades que deben poseer los instrumentos de acopio
de datos, pero las más importantes son las siguientes: validez,
confiabilidad, objetividad, amplitud, practicabilidad, sensibilidad,
especificidad y adecuación11 que mas adelante tocaremos con más detalle
a. Validez de contenido.
Denominada también validez lógica o de “muestreo”. Consiste en que los
contenidos o conceptos planteados en los ítems correspondan con los
previstos del marco teórico. La validez de contenido adquiere mayor
importancia cuando se trata de comprobar resultados del aprendizaje.12
En otras palabras, la validez de contenido es el grado de fidelidad con el
que una prueba refleja el universo de reactivos del cual se extrajeron los
ítems. Por ejemplo, si se desea explorar cuánto saben los estudiantes de
geometría acerca de triángulos. Así, la prueba de trazos auxiliares en un
triángulo, será capaz de medir realmente los conocimientos de triángulos
y de sus elementos y no otro tipo de conocimientos.
Procesos Si No
F0 9 1
Ft 5 5
(F0-Ft ) 4 -4
(F0-Ft )2 16 16
(F0-Ft )2 / Ft 3,2 3,2
X2c 6,4
Como X2c> X2t, (6,4 > 3,84) se acepta los reactivos del instrumento, caso
contrario se procede a su reformulación o eliminación si el caso fuera
necesario
Donde
: Promedio alcanzado de la prueba.
Pm : Puntuación máxima de alcanzar en la prueba
Gd : Grado de dificultad del instrumento; indizado por Kuder y
Richardsón.
ítems
1 2 … 20
Encuestado 1 1 0 0
Encuestado
lumno 1 2 0 0 1
Encuestado 3 1 1 1
Encuestado 4 1 1 1
……
Encuestado 1 0 1
Correctas
40 10 24 30
Incorrectas 30 16 10
Grado de dificultad.
Categorización
c. Validez predictiva.
La validez predictiva es la capacidad que tienen las pruebas de
predecir acontecimientos futuros, tales como el éxito que un individuo
alcanzará en sus estudios o en su trabajo.13 Para determinar la validez
predictiva, se procede bajo la siguiente secuencia.
- Administración de la prueba.
- Se espera que se produzcan los desempeños pronosticados.
- Se compara los puntajes de la prueba con los desempeños reales
del sujeto.
Procedimiento:
- Se administra la prueba; al inicio del año administramos el test
“x” y cuando se cumplió el tiempo de entrenamiento se
obtienen los resultados de la evaluación.
- Se compara los puntajes de la prueba con los desempeños
reales del sujeto.
- Se determina la correlación r (Pearson)
EP = 72,18%
d. Validez concurrente.
La validez concurrente es la correlación que puede hallarse
entre las puntuaciones logradas luego de la aplicación de la prueba,
con respecto a las puntuaciones obtenidas por los mismos sujetos en
otras mediciones realizadas simultáneamente.13
El procedimiento para determinar la validez concurrente es similar al
que se emplea para verificar la validez predictiva, sólo que la
correlación puede hallarse casi de inmediato, ya que los datos se
obtienen simultáneamente.
Donde:
R21 : Coeficiente de confiabilidad
n : Número de ítems.
: Promedio.
𝜎 : Desviación estandar de las puntuaciones de la prueba.
Entonces:
Índice Clasificación
0,53 a menos = Confiabilidad nula
0,54 a 0,59 = Confiabilidad baja
0,60 a 0,65 = Confiable
0,66 a 0,71 = Muy confiable
0,72 a 0,99 = Excelente confiabilidad
1,0 = Confiabilidad perfecta
n = 98,
= 70
𝜎 = 6,8
Donde.
k : Número de ítems
σ2 : Varianza de las puntuaciones de la prueba
p : Es la proporción de respuestas correctas al ítem I.
q : Es la proporción de respuestas correctas al ítem I.
∑p.q : Sumatoria de la multiplicación de todos los reactivos.
Nombres A B C D E F G H I J Puntuación
Eric 1 1 1 1 1 1 0 0 0 0 6
Tomasa 1 1 1 1 1 1 1 0 0 0 7
Johanna 1 1 1 1 0 1 0 1 1 0 7
Paul 1 0 0 0 0 0 0 0 0 0 1
Mercedes 1 1 1 1 0 0 1 0 0 0 5
Diego 1 1 1 0 1 0 1 1 0 0 6
Pascual 1 1 1 1 1 1 0 1 1 1 9
Martin 1 1 0 0 1 0 0 1 1 1 6
Andrés 1 1 1 1 1 0 1 0 0 0 6
Emilio 1 1 1 1 1 1 1 0 0 0 7
RC 10 9 8 7 7 5 5 4 3 2 60
RINCI 0 1 2 3 3 5 5 6 7 8
p 1.0 0,9 0,8 0,7 0,7 0,5 0,5 0,4 0,3 0,2
q 0 0,1 0,2 0,3 0,3 0,5 0,5 0,6 0,7 0,8
pIqI 0 0,09 0,16 0,21 0,21 0,25 0,25 0,24 0,21 0,16 p.q =1,78
Donde
RC : Total de las respuestas correctas para cada pregunta.
RINCI : Total de las respuestas incorrectas para cada pregunta.
pI : Proporción de éxito para cada pregunta.
qI : Proporción de incidente para cada pregunta.
piqj : Variación de cada pregunta.
Estadísticos
N Válidos 10
Media 6,0000
Desv. típ. 2,05480
Varianza 4,222
Donde:
α : Coeficiente alpha de Cronbach,
2
S i : Varianza del instrumento
S2t : Varianza de la suma de los ítems,
K : Número de ítems que se considera en el
instrumento
Ejemplo.
Se quiere medir la confiabilidad del instrumento que consta de 5 ítems
aplicando a 6 personas, dos datos se muestran en la tabla
Ítems
Sujetos
X Y Z W V ∑
Juan 3 5 5 4 5 22
Pedro 5 4 5 4 4 22
Ana 4 4 5 5 5 23
Diego 4 5 3 3 3 18
Emilio 1 2 2 2 2 9
Johanna 4 3 3 3 4 17
∑ 21 23 23 21 23 111
3,5 3,83 3,83 3,5 3,83
; ; ; ;
Varianza total del instrumento.
α = 0,91
El valor encontrado de α es muy bueno. De acuerdo a la tabla de
calificación; el instrumento presenta alta confiabilidad
17
Donde.
Sr: son las sumas que resultan de comparar cada rango de la
variable “y” con sus rangos sucesivos. Toma como referente
un número y a la derecha contar los números que son mayores
al referente, y restarle de este resultado el número de
términos menores al referente.
n : Son los números de la serie.
Aplicación.
Dos jueces efectúan una evaluación sobre la presentación de 12
ítems de un instrumento para la determinación de la secuencia
lógica, que a continuación se indica la secuencia de ellos.
(x) 1 2 3 4 5 6 7 8 9 10 11 12
(y) 2 1 4 8 6 3 5 7 12 9 10 11
- Mayores que 1 = 10
Menores que 1 = 0; el rango (10 – 0) = 10
- Mayores que 4 = 8
Menores que 4 = 1; el rango (8 – 1) = 7
- Mayores que 8 = 4
Menores que 8 = 4; el rango (4 – 4) = 0
- Mayores que 6 = 5
Menores que 6 = 2; el rango (5 – 2) = 3
- Mayores que 3 = 6
Menores que 3 = 0; el rango (6 – 0) = 6
- Mayores que 5 = 5
Menores que 5 = 0; el rango (5 – 0) = 5
- Mayores que 7 = 4
Menores que 7 = 0; el rango (4 – 0) = 4
- Mayores que 12 = 0
Menores que 12 = 3; el rango (0 – 3)= -3
- Mayores que 9 = 2
Menores que 9 = 0; el rango (2 – 0) = 2
- Mayores que 10 = 1
Menores que 10 = 0; el rango (1 – 0) = 1
Sr = 9 + 10 + 7 + 0 + 3 + 6 + 5 + 4 + -3 + 2 + 1 = 44
Entonces
Si
n = 12 y
Tk = 0,67
Se requiere saber si los rangos establecidos por los dos jueces (x, y)
están significativamente correlacionados para prueba de dos colas a un
nivel de significación del 0,05
Z(1-α/2) = 1,69
Donde:
t = Número de ítems del instrumento.
k = Número de categorías del ítem.
Total de eventos
n(n 1)
C2n
2
C = Combinación
n = Número de jueces
Tabla de valoración
DESACUERDO ACUERDO
Fuertísimo Fuerte Regular Pobre Pobre Regular Fuerte Fuertísimo
-1 -0,75 -0,5 -0,25 0 0,25 0,5 0,75
1
Ejemplo.
A continuación se presentan una fracción del instrumento con 15 ítems
para ser validados por 3 jueces; donde cada ítem presenta cuatro
categorías (alternativas) etiquetadas con 1, 2, 3, y 4.
Total, de eventos
n(n 1)
C2n
2
Indica que haremos tres combinaciones con las decisiones de los jueces
para cada valor etiquetado del ítem.
Nº Jueces Combinaciones
ítems A B C Avs B Avs C Bvs C
1 2 2 2 0 0 0
2 3 1 2 4 1 1
3 2 2 2 0 0 0
4 2 2 2 0 0 0
…… … .. … … … …
Total ∑ 8 11 7
Donde
rxx : Confiabilidad estimada de la prueba completa
r1/2,1/2 : Correlación de Pearsón entre las dos mitades del instrumento
Observación. Éste método no es recomendable en los test de
sentimiento; puesto que los ítems no guarda direccionalidad
Ejemplo.
Para una correlación de r = 0,85
La confiabilidad por mitades o Spearman Brown será.
Cuanto más próxima es una curva ROC a la esquina superior izquierda, mas alta es la
exactitud global de la prueba, por lo que el valor de la especificidad adecuada debe superar
al 80%.
Verdadero Diagnostico
Presenta Ëxito en su
problemas de aprendizaje
aprendizaje
Prueba Positivo VP FP
Negativo FN VN
Ejemplo.
Mediante un instrumento de diagnóstico sobre pandillaje, se tomo a
134 estudaintes de una institución educativa, encontrandoce los
siguientes casos.
Verdadero Diagnostico
Tendencia a Rechazo a
pandillaje pandillaje
Evaluación Positivo 45 15
Negativo 21 53
- Sensibilidad. Es la probabilidad de clasificar correctamente a un
individuo enfermo, es decir, la probabilidad de que para un sujeto
enfermo se obtenga en la prueba un resultado positivo.
Verdaderos positivos
Sensibilidad= Verdaderos Positivos + Falsos Negativos
Es decir
Verdaderos positivos
Sensibilidad=
Enfermos
Verdaderos Negativo
Especificidad =
Verdaderos Negativo + Falsos
Positivo
Es decir
Verdaderos Negativo
Especificidad =
Sanos
Interpretación.
Donde:
Dd : Poder discriminativo de la prueba
GS : % del grupo superior que contestó correctamente el ítem
GI : % del grupo inferior que contestó correctamente el ítem
Índice Clasificación
40% a más Alto índice de discriminación.
30 al 39% Índice de discriminación bueno.
20 al 29% Índice de discriminación regular.
Menos del 19% Deficiente índice de
discriminación
Ejemplo
De 100 alumnos que respondieron una prueba, los 27 (27%) alumnos
que obtuvieron puntuaciones más altas serán considerados miembros
del grupo superior y los 27 (27%) que obtuvieron puntuaciones más
bajas, serán considerados miembros del grupo inferior.
Averiguaremos luego cuántos alumnos del 27% del grupo superior
respondieron el ítem correctamente y cuántos alumnos del 27% del
grupo inferior también lo hizo correctamente. Luego se obtiene la
diferencia.
Si los 27 alumnos del grupo superior respondieron correctamente el
ítem, o sea el 100%, y en el grupo inferior sólo 12 de los 27 también lo
hicieron correctamente, o sea el 44%, estableciendo la diferencia
tenemos:
Donde:
Id : Índice de discriminación.
Pms : Puntaje máximo alcanzado por el grupo superior.
Pmi : Puntaje máximo alcanzado por el grupo inferior.
n : Número de participantes.
Ejemplo:
Hallar el índice de discriminación de un ítem cuyas respuestas correctas del
grupo superior son 25 y las respuestas correctas del grupo inferior son
12. El número de examinados en los dos grupos es 50.
El Índice de discriminación resulta el 26 %, indica que el índice de
discriminación de éste ítem es regular.
Procedimiento
- Se totaliza el número de respuestas correctas de cada ítem y
por cada grupo.
- En este caso, el grupo superior es 20 y el inferior es 20. El número
total de alumnos es 40.
- Se ha ordenado a los estudiantes en función de su rendimiento
académico, de mayor a menor. Para hallar el índice de
discriminación del ítem Nº 1 se hacen los siguientes cálculos:
,
Id= 17,5%, Según la tabla, éste es un ítem deficiente y debe
descartarse.
Entonces:
Donde.
FE : Fiabilidad y error de medición
r : Coeficiente de correlación Pearsón
FE = 7,8%
El 7,8% es el error de medición del instrumento, es un buen margen de
error ya que es menos al 15%; por lo que la fiabilidad del instrumento
es del 92,2%; por lo que afirmamos que le instrumento presenta alta
confiabilidad.
-4 -3 -2 -1 0 +1 +2 +3 +4
Puntuación verdadera o más probable
Ubicación gráfica de la puntuación del error estándar.
ESm = 1,743
III
APLICACIÓN DEL PROCESO DE VALIDACIÓN Y CONFIABILIDAD
A partir de un instrumento de investigación, se desea encontrar los
indicadores para el proceso de validación y confiabilidad bajo el
programa del SPSS; es posible encontrar de manera directa la
confiabilidad del instrumento bajo la técnica del α de Cronbach, Dos
mitades, Gutman, entre otros y así mismo permite realizar el análisis
por ítem del instrumento bajo la técnica ítem test total.
Ejemplo.
Con la siguiente base de datos realizamos nuestro proceso de validación
y confiabilidad, análisis del instrumento, así mismo de los ítems.
a. Base de datos.
a.1. Vista de variables. Ingresamos los ítems de nuestro
instrumento, para el caso el instrumento consta de 20 ítems
como se presenta.
Estadísticos de fiabilidad
Alfa de Cronbach N de elementos
,831 20
Estadísticos total-elemento
Media de la Varianza de la Correlación Alfa de
escala si se escala si se elemento- Cronbach si se
elimina el elimina el total eleimina el
elemento elemento corregida elemento
item01 13,87 17,223 ,424 ,823
item02 13,90 17,403 ,356 ,826
item03 13,93 17,651 ,280 ,830
item04 13,93 16,754 ,515 ,818
item05 13,93 17,789 ,244 ,832
item06 13,73 17,306 ,550 ,819
item07 13,87 17,568 ,328 ,827
item08 13,80 17,821 ,297 ,828
item09 13,73 17,444 ,500 ,821
item10 13,90 17,334 ,375 ,825
item11 13,90 16,369 ,642 ,811
item12 13,93 16,133 ,686 ,809
item13 13,80 17,614 ,359 ,826
item14 13,87 17,016 ,482 ,820
item15 13,90 18,369 ,105 ,838
item16 13,87 17,361 ,385 ,825
item17 13,83 18,006 ,224 ,832
item18 13,87 17,016 ,482 ,820
item19 13,93 17,168 ,405 ,824
item20 13,90 16,783 ,526 ,817
jx x j
j ( x j )
2j x2 2 jx j x
Donde:
ρj(x-j) :Correlación entre el ítem j y el test tras descontar el
ítem (x – j)
ρjx :Correlación ítem-test cuando el ítem está incluido en
el test
σx : Desviación típica del test
σj : Desviación típica del ítem
I.E:
Aula Sexo Código
M (1): masculino F(2): femenino
Siempre= 5 Casi siempre= 4 A veces= 3 Casi nunca= 2 Nunca= 1
3 1 2 3 4 5
culturas
4 Me siento bien al tratar con estudiantes de la zona andina 1 2 3 4 5
5 Me siento bien al tratar con estudiantes de la zona amazónica 1 2 3 4 5
Niveles y rango:
Los niveles y rangos fueron asumidos de acuerdo a la escala valorativa
del instrumento de carácter literal y descriptivo: A (logro previsto), B (en
proceso) y C (en inicio). El punto de corte de cada nivel obedece a los
procedimientos con respecto a la media y la desviación estándar.
Técnicas: Aiken
V = Si
n(c-1)
Siendo:
Si= la sumatoria de si
s1= valor asignado por el juez i,
n= número de jueces
c= número de valores de la escala de valoración (2. en este caso)
Convivencia democrática
exp_1 exp_2 exp_3 exp_4 exp_5 SI V
it_1 1 1 1 1 1 5 1
it_2 1 1 1 1 1 5 1
it_3 1 1 1 1 1 5 1
it_4 1 1 1 1 1 5 1
it_5 1 1 1 1 1 5 1
it_6 1 1 1 1 1 5 1
it_7 1 1 1 1 1 5 1
it_8 1 1 1 1 1 5 1
t_9 1 1 1 1 1 5 1
it_10 1 1 1 1 1 5 1
It_11 1 1 1 1 1 5 1
It_12 1 1 1 1 1 5 1
It_13 1 1 1 1 1 5 1
It_14 1 1 1 1 1 5 1
It_15 1 1 1 1 1 5 1
It_16 1 1 1 1 1 5 1
It_17 1 1 1 1 1 5 1
It_18 1 1 1 1 1 5 1
It_19 1 1 1 1 1 5 1
It_20 1 1 1 1 1 5 1
It_21 1 1 1 1 1 5 1
consenso de jueces = 1
Fuente: Cuantificación de la validez de contenido por criterio de jueces (Luis Miguel Escurra M.)
Técnica binomial
La distribución binomial es una probabilidad discreta que mide el
número de éxitos si la variable es una variable aleatoria, es decir, sólo
puede tomar los valores 0, 1, 2, 3, 4, ..., n.
Bajo los supuestos mencionados, asumiremos los argumentos
matemáticos de la prueba binomial; para el procedimiento de validación
del instrumento a partir de la postura del juez, donde se espera que el
ítem presenta éxito si se encuentra bien formulado o fracaso en caso no
se encuentra bien formulado.
P(x,n,p)= n C x.px.qn-x
Donde:
P= probabilidad
x= número de éxitos
n= número de ensayos
p= probabilidad de éxito en cada ensayo
q= probabilidad de fracaso en cada ensayo
Análisis exploratorio
Esta técnica provee una visión previa del nivel de precisión que tiene
cada ítem en la medición del objeto ya que por muy cuidadosa que sea
la selección de los ítems es imposible que sean medidas perfectas del
factor común correspondiente22. No obstante, debe precisarse que
mediante esta etapa de validez solamente se puede determinar el
número de factores esperado con los ítems del instrumento.
Validez de Constructo
Secuencia para la obtención de la validez a partir del reporte del SPSS.
Analizar>reducción de dimensiones>factor
Prueba KMO (Kaiser-Meyer-Olkin)
Identifica las correlaciones parciales entre los items del
cuestionario; a mayor correlación (> 0,5), el instrumento permite
el análisis factorial y es posible la ejecución de las pruebas para el
análisis factorial
Descriptivos> KMO
Prueba de KMO y Bartlett
Medida Kaiser-Meyer-Olkin de adecuación de muestreo ,923
Prueba de esfericidad de Aprox. Chi-cuadrado 11948,767
Bartlett gl 210
Sig. ,000
Sedimentación de los
ítems. En el grafico se
muestran la
agrupación de ítems;
es aprecian que se
tienen dos
componentes
distribuidos de manera
concordante entre
ellos.
Componente 1 2
1 ,794 ,608
2 -,608 ,794
Método de extracción: análisis de componentes principales.
Método de rotación: Varimax con normalización Kaiser.
Proceso de confiabilidad.
Estadísticas de fiabilidad
,913 21
IV Fase final
Por otra parte, cuando ya se tiene una idea clara sobre las variables
objeto de estudio, el uso del análisis confirmatorio permite probar la
estructura hipotetizada, poniendo a prueba si el modelo hipotetizado se
ajusta adecuadamente a los datos21. Actualmente hay dos tendencias: la
primera, clásica, que recomienda el uso secuencial de ambos tipos de
análisis (Teniendo en cuenta que el tamaño de muestra lo permita); la
segunda cuestiona el uso de ambos análisis con respecto a su finalidad22
de modo que ambos análisis, en vez de considerarse como dos
categorías cualitativamente diferentes, deberían considerarse más bien
los dos polos de un continuo.
Analizar>Amos
En el resultado CMIN
AF Exploratorio AF Confirmatorio
Método heurístico Fuerte base teórica
Halla el nº de factores Nº de factores a priori
Halla la relación entre los factores Se establece la relación entre los factores a priori
Variables con pesos en todos los factores Variables con pesos en factores determinados
Técnica de reducción de dimensionalidad Técnica de reducción
Ficha técnica
Nombre: Prueba de evaluación del lenguaje oral - ELO
Autores: Ramos y Cuadrado (2004)
Adaptado por: Gamarra, E. (2018)
Lugar de aplicación: Institución Educativa “Rey Juan Carlos de Borbón”
de Villa el Salvador
Forma de aplicación: Directa
Duración de la aplicación: 20 minutos aproximadamente.
Descripción del instrumento: Este instrumento es una lista de cotejo que
consta de 97 ítems.
Inicio 00 – 04 00 – 17 00 – 06 00 – 03 00 – 37
Proceso 05 - 05 18 – 28 07 – 10 04 – 06 38 – 51
Logro 06 - 07 29 – 39 11 – 11 07 – 10 52 – 66
Logro 07 - 12 40 - 45 12 - 20 11 - 20 67 – 97
destacado
Muestra piloto
La muestra para la prueba piloto fue de 45 estudiantes entre varones y
mujeres de la Institución Educativa N° 602031 “Santa Rosa” del distrito
de Lurín. Una de las características es que todos los estudiantes
pertenecen al primer grado de primaria de la Educación Básica Regular,
sus edades fluctúa entre los seis y siete años y estudian en el turno
mañana.
Validez
Para Sanchez y Reyes (2015), es la propiedad señala que todo
instrumento debe medir lo que propone medir, es decir,demmsotaar de
manera efectiva, los resultados d els capacidad que se propone medir.
Validez interna
Tejedor, toma el concepto de Campell y Stanley (1978), quienes
sostienen que la validez interna “Nos determina hasta que punto el
investigador puede atribuir la variación observada en la variable
dependiente a la precencia de la variable independiente.
Historia
se refiere a los sucesos que ocurrieron durante la aplicación del
programa rimas y trabalenguas en la I.E Losey Juan Carlos, la historia se
sitúa entre el pre test y el post test, el experimento tuvo una duración
de 5 semanas, se aplicó dos sesiones por semana, se dio de manera
regular, en la Institución educativa hubo una actividad extra curricular la
celebración del día de la madre, pero que no fue una amenaza para el
experimento ya que esta se realizó un día viernes en la que no se aplicó
el experimento ya que no correspondía hacerlo.
Cada sesión fue evaluada en una lista de cotejo donde se registró los
avances de cada uno de los estudiantes de manera individual y grupal y
estos resultados fueron exclusivamente de la experimentación.
Maduración
La maduración se convierte en una amenaza en la medida en que los
participantes ganan experiencia y se hacen mayores. Esta afecta
principalmente a estudios hechos con niños durante un tiempo
relativamente largo.
En el presente estudio, la experimentación se realizó con niños del
segundo grado que sus edades flutuan entre los 7 y 8 años, durante un
periodo corto de un mes, en el cual no hubo cambios sustanciales en
cuanto a su madurez u otros factores que pudieran afectar el
aprendizaje.
Selección
La selección es una amenaza cuando el experimentador no puede
seleccionar a los participantes al azar y hay diferencias importantes
entre el grupo experimental y el grupo control.
El presente estudio se realizó con todos los estudiantes del aula del
segundo y tercer grado en el cual no se presentó ningún inconveniente
ya que ambos grupos presentan características similares en su
desarrollo cognitivo, por encontrarse en la etapa de operaciones
concretas tal como lo sostiene la Teoría de Piaget.
Mortalidad
Se refiere a la cantidad de participantes que abandonan el experimento.
Durante el estudio , no se registro el abandono de ningún estudiante de
ambos grupos, por lo que se mantuvo la cantidad de 27 estudiantes en
el grupo experimental y 27 estudiantes en grupo control, por tanto no
hubo amenaza en la investigación.
Prueba
La prueba puede ser una amenaza cuando el pre test proporciona
información que contribuye a que el participante obtenga una mejor
calificación en el post test.
Validez de contenido.
Sanchez y Reyes (2015), afirmaron que un instrumento logra ser válido
en su contenido, cuando los items que está cpompuesto, son una
muestra represnetativa de los iondicadores de la variable que se mide.
Donde:
S : Sumatoria de valoraciones positivas emitidas por los jueces.
n : Número de jueces.
c : Número de valores de la escala de valoración (2 en el caso
dicotómico)
Todos los ítems son válidos según la apreciación de los jueces, por lo tanto:
V= 5___ = 1
5(2– 1)
Validez de contenido del instrumento o Aiken = 1
Juicio de expertos
Nº Expertos Decisión
1 Dr. Si hay suficiencia.
2 Dr. Hay suficiencia.
3 Dr. Aplicable.
4 Dr. Aplicable.
5 Dr. Aplicable el instrumento.
Tabla 7
Prueba binomial; reporte del Spss
Prop. Prop. de Significación
Categoría N observada prueba exacta (bilateral)
EXP_1 Grupo 1 1 97 1.00 0.50 0.000
Total 97 1.00
EXP_2 Grupo 1 1 97 1.00 0.50 0.000
Total 97 1.00
EXP_3 Grupo 1 1 97 1.00 0.50 0.000
Total 97 1.00
EXP_4 Grupo 1 1 97 1.00 0.50 0.000
Total 97 1.00
EXP_5 Grupo 1 1 97 1.00 0.50 0.000
Total 97 1.00
Validez de constructo
Sanchez y Reyes (2015) afirmaron que la validez de constructo está
referida al nivel de aceptaciópn de un instrumento que mide la
construcción teórica con respecto a la conducta que se mide, posee
valides si el resultado es el eséado acorde con la teoría formulada
Para el instrumento en estudio, se ha considera como la validez de
constructo al grado de dificultad de la prueba, siendo este, el porcentaje
de veces que se responde correctamente a cada ítem. Cuanto más alto
sea el porcentaje obtenido, menor será la dificultad del ítem o de la
prueba.
Gd = x 100%
Pm
Donde:
Gd: Grado de dificultad del instrumento; indizado por Kuder y
Richarrdson.
Promedio alcanzado de la prueba.
Pm: puntuación máxima a alcanzar en la prueba.
De la prueba piloto se obtuvo los siguientes datos:
: 51. 96
Pm: 97
Reemplazando en la formula se obtiene
Confiabilidad
Hernández, Fernández y Baptista (2014) señalaron que está referido al
nivel en que la aplicación repetida a la misma unidad de análisis,
produce iguales resultados. Para efectos de la investigación, se utilizó el
KR2P, por ser un instrumento dicotómico.
Validez de criterio
El presente instrumento está constituido por 97 ítems de dificultad
variable. Tal como pudo reconocer a través de la prueba piloto, algunos
ítems fueron respondidos correctamente por los estudiantes mientras
que otros tuvieron respuestas erradas. Cada ítem tuvo solo una
respuesta correcta válida. En consecuencia, el indicador KR-20 es el
apropiado para este tipo de prueba.
Donde:
K: número de ítems
σ²: varianza de los puntajes por participante
p: % de aciertos por ítem
q: % de desaciertos por ítem
Confiabilidad - KR20
Instrumento Fiabilidad N° de ítems
De contenido: Aiken = 1
De constructo: Gd = 0,54
De criterio: KR-20 = 0,92
Total = 1 + 0,54 + 0,92_
3
Validez total de la prueba = 0,82
Entonces:
µ – 2σ = 23,5
µ – σ = 37,73
µ = 51,96
µ + σ = 66,19
µ + 2σ = 80,42
Por lo que se consideran los siguientes rangos:
Donde:
donde:
ESm = 3,18
Error standard
Numero de ítems del test Error estándar
Menos de 24 2
24 – 47 3
48 – 89 4
90 – 109 5
110 – 129 6
130 – 150 7
r = coeficiente de correlación
n=número de encuestados
En la prueba piloto, el número de participantes fue de 45 estudiantes,
obteniéndose un coeficiente de correlación r = 0.95 a través de la
técnica de aplicación de la prueba en dos mitades. Por lo tanto:
n = 45, r = 0,95
EP = 68 %
Referencias.
1
Leyva, Y.E. (2011). Una reseña sobre la validez de constructo de
pruebas referidas a criterio. Perfiles educativos, 33(131), 131-154.
Recuperado de https://bit.ly/2V1oTNy
2
Delgado, A., Escurra, L. & Torres, W. (2006). La Medición Psicología
y Educación: Teoría y Aplicación. Perú: Hozlo.
3
Urrutia, M., Barrios, S., Gutiérrez, M. & Mayorga, M. (2014). Métodos
óptimos para determinar validez de contenido. Educación Médica
Superior, 28(3), 547-558. Recuperado de https://bit.ly/2sIvSyj.
4
Valero, S. (2013). Transformación e interpretación de las puntuaciones.
España: UOC-Universidat Oberta de Catalunya. Recuperado de
https://bit.ly/2LsaZzJ
5
Joya, (2003).
6
Escobar-Pérez, J. & Cuervo-Martínez, A. (2008). Validez de contenido
y juicio de expertos: una aproximación a su utilización. Avances en
Medición, 6(1), 27–36. Recuperado de https://bit.ly/11l533x
7
Carballo, M. & Guelmes. C. E. L. (2016). Algunas consideraciones
acerca de las variables en las investigaciones que se desarrollan en
educación. Revista Universidad y Sociedad, 8(1), 40-150. Recuperado
de https://bit.ly/2LwCbgD
8
Stevens, S. (1951). Handbook of experimental psychology. N. York:
Wiley.
9
López Feal, R. (1986). Construcción de instrumentos de medida en
Ciencias conductuales y sociales. España: Alamex.
10 Fernández, A. (2008). La evaluación de los aprendizajes en la
universidad: nuevos enfoques. Valencia, España: Instituto de Ciencias
de la Educación. Recuperado de https://bit.ly/2OqKgaq
11
Cohen, R.J. & Swerdlik, M.E. (2000) Pruebas y evaluación
psicológicas. Introducción a las pruebas y a la medición. McGraw Hill.
México.
12 Messsick, S. (1995) Validity of psychological assessment. American
Psychologist, 50, pp.741-749.
13
Cohen, R.J. & Swerdlik, M.E. (2000) Pruebas y evaluación
psicológicas. Introducción a las pruebas y a la medición. México:
McGraw Hill.
14
Kuder, G. F. & Richardson, M. W. (1937). The theory of the
estimation of reliability. Psychometryca, 2, 151-160.
15
Cronbach, L. J. (1951). Coefficient alpha and the internal structure of
tests. Psychometryca, 16, 297-334.
16
Cronbach, l. & Glaser, G. (1972) The dependability of behavioral
measurements. Theory of generalizability for scores and profiles. New
York; Willey.
17
Badii, M.H., Guillen, A., Lugo, O.P. & Aguilar, J. J. (2014).
Correlación No-Paramétrica y su Aplicación en la Investigaciones
Científica. Daena: International Journal of Good Consciencie, 9(2), 31
– 40. Recuperado de https://bit.ly/2lz3Hzh
18
Nunnally, J. & Bernstein, I. (1995) Teoría Psicométrica. México.
McGraw Hill.
19
Anastasi, A. & Urbina, S. (1998) Tests Psicológicos. (7ma ed.).
Mexico: Prentice Hall.
20
Lloret-Segura, S., Ferreres-Traver, A., Hernández-Baeza, A. & Tomás-
Marco, I. (2014). El Análisis Factorial Exploratorio de los Ítems: una
guía práctica, revisada y actualizada. Anales de Psicología, 30(3),
1151-1169. Recuperado de http://sci-
hub.tw/10.6018/analesps.30.3.199361
21
Edwards, J. R. (2011). The Fallacy of formative measurement.
Organizational Research Methods, 14, 370-388. Doi:
10.1177/1094428110378369
22
Ferrando, P. J. y Anguiano-Carrasco, C. (2010). El análisis factorial
como técnica de investigación en psicología. Papeles del Psicológo, 31
(1), 18-33. Recuperado de http://psiqu.com/2-19656