Documentos de Académico
Documentos de Profesional
Documentos de Cultura
- Disear un proyecto
Objetivos Especficos:
146
1. Determinar la necesidad de un plan (o proyecto)
2. Determinar la factibilidad del plan (o proyecto)
3. Disear el plan (o proyecto)
Cuando se operacionaliza la variable en los proyectos factibles, sta se formula
en trminos de necesidad, ya que la realizacin de un proyecto factible requiere
determinar la necesidad del proyecto. Al respecto la UPEL (2.003) expresa lo
siguiente: El proyecto factible consiste en la investigacin, elaboracin y desarrollo
de una propuesta de un modelo operativo viable para solucionar problemas,
requerimientos o necesidades de organizaciones o grupos sociales (p. 16). Se
deduce que el proyecto factible justifica su elaboracin y ejecucin en determinar la
existencia de un problema que requiere como necesidad un proyecto de solucin al
mismo. De ah que en las investigaciones bajo la modalidad de proyecto factible se
crea una variable para determinar la necesidad de la propuesta. Esta variable permite
tambin la elaboracin del diagnstico que es la primera fase de un proyecto factible.
Es importante hacer referencia a la polmica existente sobre los objetivos 2 y 3
de un proyecto factible. Hay quienes afirman que es incorrecto desarrollar primero la
factibilidad del proyecto y luego disear el proyecto. Sealan como ejemplo que
cuando se construye un edificio antes de determinar la factibilidad hay que elaborar el
proyecto; porque es en funcin de ste que se determina la factibilidad. De acuerdo a
este criterio, no se puede determinar la factibilidad sin elaborar el proyecto.
Igualmente (expresan) sucede cuando se disea un programa de formacin docente,
para determinar la factibilidad del programa hay que hacerlo en funcin del programa
de formacin docente ya elaborado.
Se considera este criterio equivocado, porque cuando se habla de estudio de
factibilidad, es para referirse a una apreciacin general del proyecto o programa en
estudio. A esta etapa corresponde el estudio de mercado, estudio tcnico y estudio
financiero. En esta fase se estudia la demanda y oferta del producto (se entiende por
producto el bien o servicio que se ofrece, en el caso educativo el producto son
docentes capacitados, laboratorio construido, etc.). Asimismo se estudia las
especificaciones del producto e insumos y la disponibilidad de recursos financieros,
147
tambin los aspectos organizacionales y jurdicos en lneas generales. Si estos tres
aspectos son viables (demanda y oferta del producto, estudio tcnico y financiero) se
considera factible el plan, programa o propuesta en estudio y se puede pasar al
cumplimiento del objetivo 3: Disear el proyecto, programa, plan o propuesta. En
esta ltima fase, se elabora la propuesta que puede ser un plan, programa o proyecto,
para lo cual hay que desarrollarla al mayor nivel de concrecin y considerando el
mnimo detalle. Si la propuesta es un plan de formacin docente, debe detallarse los
costos bien especificados, as como la inversin. Tambin debe disearse los cursos y
talleres a nivel de detalle, as como todos los aspectos involucrados en la propuesta.
Hay quienes denominan a esta fase Factibilidad del Proyecto, y la fase anterior
prefactibilidad del proyecto, pero ambas fases: prefactibilidad y factibilidad,
equivalen en este caso a la factibilidad y propuesta definitiva respectivamente.
Se desea reafirmar el graso error en el cual incurren quienes desarrollan primero
la propuesta o proyecto definitivo para posteriormente desarrollar la factibilidad de la
propuesta. Imaginemos un arquitecto e ingeniero que primero realiza el proyecto
definitivo: la maqueta, microlocalizacin de un edificio, estudio de suelos, planos de
ingeniera civil, electricidad y de aguas blancas y servidas. En resumen elabora el
proyecto de ingeniera, realiza una preinversin millonaria, y posteriormente
determina el estudio de mercado, disponibilidad de recursos tcnicos y financieros, es
decir, el estudio de factibilidad; concluyendo que el proyecto realizado no es factible.
Es por esta razn que se considera incorrecto desarrollar primero la propuesta para
despus determinar la factibilidad de la misma. Se ha enfatizado en este aspecto,
porque es frecuente en el mundo de los proyectos pasar de la idea a la propuesta o
proyecto definitivo, obviando la factibilidad (o prefactibilidad) del proyecto. Este
error ha originado que los proyectos fracasen; porque demuestran inviabilidad en su
fase de ejecucin y funcionamiento.
En cuanto al proceso de operacionalizacin, sta se realiza para satisfacer el
cumplimiento del primer objetivo especfico: Determinar la necesidad de la
propuesta, porque es este objetivo el que requiere un instrumento para su
cumplimiento. El desarrollo de los otros objetivos: el estudio de factibilidad y diseo
148
de la propuesta, siguen un proceso metodolgico diferente. La determinacin de la
necesidad, adems de cumplir con un requisito de la UPEL, permite, como fue
mencionado, realizar el diagnstico que es la primera fase de los proyectos factibles.
Para concluir este punto se recomienda a quienes realizan el proceso de
operacionalizacin formular los temes en funcin de la necesidad o importancia de la
propuesta. Es comn en un nmero importante de instrumentos; cuyo propsito es
determinar la necesidad de la propuesta, observar temes redactados en trminos que
no determinan necesidad, lo cual origina el no cumplimiento del propsito del
instrumento.
Proyecto Especial
Los proyectos especiales es otra modalidad de investigacin incluida en el
Manual de Trabajo de Grado de Especializacin y Maestra y Tesis Doctrales de la
UPEL. La presentacin de los objetivos que se recomienda para esta modalidad son
los siguiente:
1. Determinar la necesidad de un software ( estrategia, carta geogrfica, texto,
etc.)
2. Disear el software ( estrategia, carta geogrfica, texto, etc.)
3. Validar un software ( estrategia, carta geogrfica, texto, etc.)
Segn el Manual de Trabajos de la UPEL, se habla de proyectos especiales
cuando se est en presencia de creaciones tangibles, como un software educativo,
una estrategia instruccional, un manual, gua o carta sobre algn aspecto determinado.
Para la UPEL, los proyectos especiales deben ser utilizados como soluciones a
problemas demostrados o que responden a necesidades e intereses de tipo cultural
(p. 8).
Al igual que los proyectos factibles, los proyectos especiales deben demostrar
que la creacin (software, manual, gua, etc.), obedece a una necesidad o que la
misma es considerada importante por potenciales usuarios. Al respecto la UPEL
(2.003) expresa: Los proyectos especiales, en todos los casos, deben incluir la
149
demostracin de la necesidad de la creacin o de la importancia del aporte segn el
caso(p. 17). Tomando en cuenta esta exigencia de la UPEL sobre los proyectos
especiales es que se recomienda formular el primer objetivo: Determinar la necesidad
de un software ( estrategia, carta geogrfica, etc.) Para cumplir este objetivo se
aplica un instrumento a los usuarios o beneficiarios de la creacin, siendo el propsito
del mismo determinar la necesidad de la creacin. El segundo objetivo consiste en
disear la creacin, y el tercero, en validar la creacin, para ello, debe someterse la
creacin, a la validacin tecnolgica (a travs de la evaluacin de la creacin por
expertos en la materia) y de campo (aplicacin de la creacin a una muestra de los
usuarios de la misma, para posteriormente determinar su viabilidad).
Al igual que en los proyectos factibles, debe tenerse sumo cuidado que los
instrumentos diseados para determinar la necesidad de una creacin, estn
conformados por temes orientados a determinar la necesidad de esa creacin, porque
de no ser as, el instrumento no cumplir con su propsito. La formulacin de los
temes debe estar en correspondencia con la variable que se desea determinar, sus
dimensiones e indicadores, porque entre todos estos aspectos existe un proceso
interdependiente.
Estudios para determinar actitudes
La actitud se puede determinar, tal como se analiz en el captulo IV, a travs
de diferentes mtodos; pero el ms usual es la escala de nmero y de sta la escala
Likert. Es por esta razn que se desarrollarn los objetivos de los estudios de actitud
cuando corresponden a una escala de actitud tipo Likert.
A diferencia de los proyectos factibles y los proyectos especiales, donde
generalmente se determina la variable a travs de un cuestionario de opinin (aunque
no necesariamente, porque en estas modalidades de investigacin se puede aplicar
como instrumento una escala de necesidad o utilidad), una escala de actitud se aplica
para describir o evaluar un aspecto de inters y puede corresponder a un estudio de
carcter descriptivo, bajo la modalidad de campo, tipo encuesta (si se desea estimar
150
estadsticamente la actidud de una poblacin determinada), o un estudio de carcter
evaluativo, tipo diseo cuasiexperimental (si se desea determinar el efecto de una
estrategia instruccional sobre la actitud, aplicando una escala de actitud como pretest
y postest) un estudio de casos, de carcter exploratorio o descriptivo, donde se toma
una muestra no probabilstica.
De acuerdo a lo planteado, los objetivos de estudios de actitudes, aunque sea
una escala de actitud tipo Likert, varan en consideracin a la modalidad o tipo de
investigacin.
A continuacin se desarrolla un ejemplo ilustrativo:
Caso de estudio de actitud, de carcter descriptivo, modalidad de campo y tipo
encuesta
Objetivo General:
Determinar la actitud del docente de la I etapa de Educacin Bsica del Estado
Lara hacia la investigacin cualitativa.
Objetivos Especficos:
1. Describir la actitud del docente de acuerdo a variables personas (sexo, edad) y
profesionales (nivel acadmico, grado que administra, medio geogrfico donde labora
del docente, aos de servicio).
2. Estimar la actitud promedio del docente a nivel del Estado Lara hacia la
investigacin cualitativa.
3. Estimar la actitud promedio del docente por dimensiones (cognoscitiva, afectiva y
conductual).
4. Estimar la actitud promedio del docente hacia la investigacin cualitativa por
Municipio.
151
Estudios Tipo Cuasiexperimental
Si se tiene como tema de estudio una Estrategia Innovadora de Comprensin
Lectora en Alumnos de Sexto Grado de Educacin Bsica y el tipo de investigacin a
realizar es Cuasiexperimental (porque se contrastar la eficacia de la estrategia a
travs de un grupo experimental, a quien se le aplicar la estrategia de comprensin
lectora innovadora, y un grupo control, a quien se le aplicar la estrategia de
comprensin lectora tradicional), los objetivos comnmente formulados son los
siguientes:
Objetivo General
Evaluar el efecto de la estrategia de comprensin lectora en el rendimiento de
Castellano y Literatura de alumnos de sexto grado de Educacin Bsica
Objetivos Especficos
1. Diagnosticar el nivel de comprensin lectora de los alumnos
2. Disear la estrategia tomando como referencia el programa de Castellano y
Literatura, correspondiente al sexto grado de Educacin Bsica
3. Ejecutar la estrategia de comprensin lectora
4. Comparar el nivel de comprensin lectora del grupo experimental y control,
antes y despus de la aplicacin de la estrategia.
En este caso se requiere un instrumento para diagnosticar el nivel de
compresin lectora (vinculado al objetivo 1) y para comparar el nivel de
compresin lectora en los grupos experimental y control antes y despus de
aplicar la estrategia (objetivo 4). En ambas situaciones (en el diagnstico y
comparacin de las calificaciones del grupo experimental y control) se aplica el
mismo instrumento que en este caso es una prueba de nivel de conocimiento
152
sobre compresin lectora o sobre una asignatura donde la estrategia puede tener
un efecto directo ( en este caso la asignatura Lengua y Literatura).
Correspondencia de la Operacionalizacin de la Variable con las Bases Tericas de la
Investigacin
Se afirm que los temes deben formularse en correspondencia con los
indicadores, dimensiones y la variable en estudio. El lector seguramente se preguntar
En funcin de qu se plantean las dimensiones e indicadores? Es importante
dilucidar esta interrogante, porque en algunos casos las dimensiones e indicadores se
plantean sin tomar en cuenta lo abordado en las bases tericas de la investigacin y
tanto las dimensiones e indicadores de una variable deben reflejar la concepcin
terica que el investigar o tesista asumi cuando elabor las bases tericas.
Por ejemplo s se operacionaliza la variable actitud del docente de la I etapa de
Educacin Bsica hacia la evaluacin de los aprendizajes de acuerdo al Currculo
Bsico Nacional, se plantean las dimensiones en funcin de los componentes de la
actitud: (a) cognitiva (b) afectiva, y (c) conductual; y los indicadores se plantean de
acuerdo a lo abordado en el Currculo Bsico Nacional sobre evaluacin de los
aprendizajes. En las bases tericas debe analizarse las tres dimensiones, las cuales
estn en correspondencia a la actitud, y el contenido del Currculo en lo referente a la
evaluacin de los aprendizajes, lo cual sustenta a los indicadores.
Construccin de los temes
Los criterios para la construccin de temes depende en gran medida del tipo de
instrumento del cual forman parte. El lector puede consultar los captulos anteriores a
ste donde se analiza el diseo de diferentes tipos de instrumentos. Slo se quiere
enfatizar lo mencionado en puntos anteriores de que los temes deben formularse en
correspondencia a la variable en estudio, las dimensiones e indicadores; para lo cual
el investigador debe apoyarse en los objetivos de la investigacin y las bases tericas.
153
Matriz (Cuadro) de Operacionalizacin de la Variable
La matriz de operacionalizacin, o cuadro de operacionalizacn como se conoce
tambin, es el producto obtenido del proceso de operacionalizacin de la variable. En
ella debe presentarse a manera sinptica el nombre y definicin de la variable
variables a operacionalizar, el propsito del instrumento, las dimensiones, indicadores
y la identificacin de los temes que conforman el instrumento.
A continuacin se presentan ejemplos de la matrices de operacionalizacin:
Ejemplo 1
Operacionalizacin de la variable Comprensin Lectora
Variable Propsito del
Instrumento
Dimensiones Indicadores Item
Comprensin
lectora
Determinar
el nivel de
conocimiento
de alumnos
de sexto
grado de
Educacin
Bsica sobre
comprensin
lectora.
Nivel de
descodificacin.
Nivel de
comprensin literal.
Nivel de
comprensin
inferencial
Nivel de
metacomprensin.
Reconocimiento de
palabras.
Asignacin de
significado de lxico.
Comprensin explcita
en el texto.
Elaboracin semntica
profunda.
Reflexin.
Nota: Tomado de Laguna, 2001.
154
Ejemplo 2
Operacionalizacin de la variable Conocimiento del Docente de la Segunda
etapa de Educacin Bsica sobre orientacin de la sexualidad
Variable Propsito del
Instrumento
Dimensiones Subdimensiones Indicadores Item
Conocimiento
del Docente de
la Segunda
etapa de
Educacin
Bsica sobre
orientacin de
la sexualidad
Determinar el
nivel de
conocimiento
del Docente de
la Segunda
etapa de
Educacin
Bsica sobre
orientacin de
la sexualidad
Conocimientos
tericos sobre
sexualidad.
Aspectos bsicos
de sexualidad.
-Sexualidad
-Sexo
-Identificacin sexual
-Desarrollo sexual
-Madurez sexual
Aspectos bsicos del
aparato genital
masculino y
femenino
Consideraciones
anatmicas
-Estructura del aparato
genital masculino y
femenino
Estrategia de
abordaje de la
sexualidad
Actividades de
orientacin
-Conversaciones i-
informativas
-Discusiones grupales
-Realizacin de talleres
informativos
Fsicos -Desarrollo pondo-estatural.
-Caracteres sexuales
primarios.
-Caracteres sexuales
secundarios.
Biolgicos -Cambios hormonales
-Menarqua
-Ciclo menstrual
-Eyaculacin
Psicolgicos -Elaboracin de la propia
identidad.
-Planteamientos de metas.
-Afianzamiento de
relaciones interpersonales.
Aspectos
relacionados con el
alumno,
considerados por el
docente para la
orientacin sexual.
Salud -Enfermedades de
transmisin sexual.
-Embarazo precoz.
-Prostitucin infantil.
Nota: Tomado de Torres, 2001.
155
Ejemplo 3
Conceptualizacin y Operacionalizacin de las Variables Actitud del docente de la
primera etapa de Educacin Bsica hacia la evaluacin de acuerdo al Currculo Bsica
Nacional
Variables Definicin de la
Variable
Dimensiones Sub-Dimensiones Indicadores Items
(versin
preliminar)
Fundamentacin Evaluacin
Cualitativa.
Evaluacin Integral.
Evaluacin Continua.
Evaluacin
Cooperativa.
4,16
20,27
8,36
13,11
Tipos de evaluacin Explorativa.
Formativa.
Final.
23,1
40,38
26,7
Formas de
evaluacin
Autoevaluacin
Coevaluacin
Heteroevaluacin
9,29
6,37
2,33
Planificacin de la
evaluacin
El qu evaluar.
El cmo evaluar.
El cundo evaluar
El con qu evaluar
35,10
31,39
18,5
22,14
Actitud del
docente hacia
la evaluacin
de los
aprendizajes
Predisposicin
del docente (a
creer, sentir y
actuar) hacia la
evaluacin de los
aprendizajes
Componente
Cognoscitivo
Procedimientos e
instrumentos de
evaluacin
-Observacin
sistemtica
-Anlisis de
produccin de los
alumnos
-Pruebas utilizadas en
el aula
-Intercambios orales
con el alumno.
-Autoreportes
-Tcnicas
sociomtricas
15,17
28,19
32,24
34,30
21,12
25,3
156
Ejemplo 3 (cont.)
Variables Definicin de la
Variable
Dimensiones Sub-Dimensiones Indicadores Items
(versin
preliminar)
Fundamentacin Evaluacin Cualitativa.
Evaluacin Integral.
Evaluacin Continua.
Evaluacin
Cooperativa.
49,74
65,66
71,59
47,61
Tipos de evaluacin Explorativa.
Formativa.
Final.
68,60
70,57
43,44
Formas de
evaluacin
Autoevaluacin
Coevaluacin
Heteroevaluacin
45,67
42,55
52,64
Planificacin de la
evaluacin
El qu evaluar.
El cmo evaluar.
El cundo evaluar
El con qu evaluar
54,53
58,62
76,80
56,77
Componente
Afectivo
Procedimientos e
instrumentos de
evaluacin
-Observacin
sistemtica
-Anlisis de produccin
de los alumnos
-Pruebas utilizadas en el
aula
-Intercambios orales
con el alumno.
-Autoreportes
-Tcnicas sociomtricas
41,73
72,63
50,75
78,48
79,51
46,69
157
Ejemplo 3 (cont.)
Variables Definicin de la
Variable
Dimensiones Sub-Dimensiones Indicadores Items
(versin
preliminar)
Fundamentacin Evaluacin Cualitativa.
Evaluacin Integral.
Evaluacin Continua.
Evaluacin
Cooperativa.
95,96
94,93
89,86
85,82
Tipos de evaluacin Explorativa.
Formativa.
Final.
92,83
90,87
81,99
Formas de
evaluacin
Autoevaluacin
Coevaluacin
Heteroevaluacin
88,91
98,97
84,101
Planificacin de la
evaluacin
El qu evaluar.
El cmo evaluar.
El cundo evaluar
El con qu evaluar
108,114
102,107
113,118
106,100
Componente
Conductual
Procedimientos e
instrumentos de
evaluacin
-Observacin
sistemtica
-Anlisis de produccin
de los alumnos
-Pruebas utilizadas en el
aula
-Intercambios orales
con el alumno.
-Autoreportes
-Tcnicas sociomtricas
104,111
110,105
116,103
119,117
120,115
112,109
158
Ejemplo 3 (cont.)
Variables Definicin de la Variable Indicadores Items
1. 18 a 23 aos
2. 24 a 29 aos
3. 30 a 39 aos
4. 40 a 49 aos
5. 50 a 59 aos
Edad
Tiempo transcurrido del
docente desde su nacimiento
hasta el momento de aplicacin
del instrumento de esta
investigacin.
6. 60 y ms aos
6
1. Masculino
Sexo
Diferencia fsica y constitutiva
del hombre y de la mujer
2. Femenino
7
4. Profesor o Lic. en educacin
3. T.S.U. en educacin
2. Maestro / Br. Docente
Nivel de Instruccin
Grado acadmico alcanzado por
el docente
1. No graduado
8
1. Urbana
Ubicacin geogrfica de
la Escuela
Se refiere a si la escuela donde
labora el docente est ubicada
en una zona considerada como
urbana o rural
2. Rural
3
1. Menos de 5 aos
2. 5 a 10 aos
3. 11 a 15 aos
4. 16 a 20 aos
Aos de servicio como
docente
Se refiere a los aos que tiene el
docente trabajando como
docente
5. Ms de 20 aos
9
Nota: Tomado de Surez, 2001
159
Ejemplo 4
Definir las variables
o constructo en
estudio
Dimensiones Subdimensiones Indicadores Item
Nivel socio
econmico de la
cohorte 2000, II
lapso de Postgrado,
mencin Educacin
Superior, UPEL-
IPB
Nivel Social
Nivel
Econmico
Grado de
Instruccin
Ingresos, tipo de
vivienda, zona de
residencia
Rendimiento
acadmico
Calificaciones
Actitud hacia la
prevencin del
cncer
Cognoscitiva,
Afectiva,
Conductual
Enfermedades
cancergenas
Causas de cada
enfermedad
Necesidades de
prevencin de
enfermedades por el
uso del computador.
Enfermedades
por el uso del
computador.
Prevencin de
enfermedades
por el uso del
computador.
Sntomas de cada
enfermedad.
Medidas
preventivas.
Se observa en los ejemplos, que la operacionalizacin se realiza tomando en
cuenta la especificidad de la variable. En algunos casos se requiere formular
dimensiones, subdimensiones e indicadores, como es el caso del ejemplo 2 y 3.
Cuando la variable que se operacionaliza es actitud, tiene dos descriptores, uno
correspondiente a la actitud y el otro referido al objeto de la actitud (ejemplo 3). Es
recomendable en este caso, formular las dimensiones en funcin de los componentes
de la actitud; y los componentes del objeto o sujeto a quien se desea medir la actitud,
considerarlo como subdimensin y los indicadores disearlos de acuerdo a como se
descompone o subdivide el objeto de la actitud. Al formular los temes se debe tener
160
cuidado de tomar en cuenta no slo los indicadores, sino las dimensiones y
subdimensiones.
El ejemplo 2, es un caso donde tambin se incluyen subdimensiones, con la
diferencia que el tipo de instrumento diseado es una prueba de nivel de
conocimiento. En el ejemplo 1, la variable operacionalizada es tambin el nivel de
conocimiento y el instrumento es igualmente una prueba de nivel de conocimiento;
pero en este caso, la autora no formul subdimensiones. En el ejemplo 4, se presenta
un resumen de casos de operacionalizacin variables. Se observa un caso donde se
operacionaliza la variable, rendimiento acadmico, solamente con indicadores,
porque su nivel de concrecin se obtiene con calificaciones, sin necesidad de plantear
niveles ms generales como son las dimensiones y subdimensiones.
Los ejemplos ilustrados representan una muestra de cuadros de operalizacin de
variables en trabajos de grados presentados en la Universidad Pedaggica
Experimental Libertador, especficamente en el Instituto Pedaggico Luis Beltrn
Prieto Figueroa de Barquisimeto.
A continuacin se presenta un cuadro de Operacionalizacin presentado por
Ramrez (1.999), el cual tiene ligeras modificaciones con respecto a los anteriores.
Variables Dimensiones Indicadores Fuentes Tcnicas Instrumentos
B1 M
N
L
Y
Y
S
Encuesta
Encuesta
Observaciones
Cuestionario
Cuestionario
Lista de cotejo A
B2 F
D
0
0
Documental
Documental
Ficha de registro
Ficha de registro
Tomando de Ramrez (1.999), P.139
Respecto al cuadro de Operacionalizacin de la variable, Ramrez (1.999)
expresa lo siguientes:
Incorporados estos elementos, nos ha de resultar un cuadro mucho ms
completo, el cual le har al lector una idea ms abarcarte y total de la
161
investigacin que personas llevan a cabo. A esto se le agrega el hecho de
obligar al investigador a pensar estrategias metodolgicas y tcnicas en
funcin no de ideas preconcebidas acerca de los mtodos y tcnicas ms
adecuadas, sino en funcin de los indicadores, fuentes de informacin y
estrategias de bsquedas que se derivan del anlisis de las variables que
de hecho se van a estudiar. (P. 136)
De este cuadro se puede interpretar que toda variable debe operacionalizarse,
incluso aqullas cuya modalidad de investigacin es documental o de tipo cualitativo.
A Manera de Conclusiones
1.- La operacionalizacin de la variable es un proceso necesario para planificar
la obtencin de datos requeridos para la descripcin y/o evaluacin de una variable en
estudio.
2.- La operalizacin de la variable debe realizarse en todos los casos que se
requiere obtener informacin sobre una variable, incluso en aquellos casos de
variables cualitativas. Cuando se trata de una prueba de rendimientos acadmico, la
Operacionalizacin es sustituida por la tabla de especificaciones de la prueba, donde
se planifican las preguntas en funcin de los dominios y niveles de aprendizaje
3.- Los tem en el proceso de operacionalizacin de la variable, deben
formularse tomando en cuenta los objetivos y las bases tericas de la investigacin,
as como las dimensiones e indicadores de la variable en estudio.
EJERCICIOS PROPUESTOS
Evale en un trabajo de grado la operacionalizacin de la variable. Analice si
hay correspondencia de los objetivo y las bases tericas de la investigacin con las
dimensiones, indicadores e temes
162
Referencias
Laguna, Y. (2001). Estrategia innovadora de comprensin lectora en estudiantes de
sexto grado de Educacin Bsica de la U.E.E Jos Flix Ribas del Municipio
Palavecino, del Estado Lara. Trabajo de grado no publicado. Universidad
Pedaggica Experimental Libertado, Instituto Pedaggico Luis Beltrn Prieto
Figueroa, Barquisimeto.
Ramrez, T. (1.999). Cmo hacer el proyecto un investigacin. Caracas: Panapo.
Surez, J. A. (2001). Actitud del docente de la primera etapa de Educacin Bsica
hacia la evaluacin de los aprendizajes de acuerdo al Currculo Bsico Nacional.
Trabajo de grado no publicado. Universidad Pedaggica Experimental
Libertador, Instituto Pedaggico Luis Beltrn Prieto Figueroa, Barquisimeto.
Torres, J. (2001). Programa de capacitacin para la orientacin de la sexualidad
Dirigido a Docentes de la segunda etapa de Educacin Bsica, de la Parroquia
Juan de Villegas, del Municipio Iribarren, Estado Lara. Trabajo de grado no
publicado. Universidad Pedaggica Experimental Libertador, Instituto
Pedaggico Luis Beltrn Prieto Figueroa, Barquisimeto.
Universidad Pedaggica Experimental Libertador. Vicerrectorado de Investigacin y
Postgrado. (2.003). Manual de Trabajos de Grado de Especializacin y Maestras
y Tesis Doctrales. Caracas: Autor.
Lecturas Sugeridas
Sobre operacionalizacin de la variable, la bibliografa es escasa. Se recomienda
consultar Trabajos de Grado de Especializacin y Maestra y Tesis Doctorales en
los Centros de informacin de las universidades que oferten postgrado en
educacin.
Ramrez, T. (1.999). Como hacer el proyecto un investigacin. Caracas: Panapo. Se
recomienda el captulo 4: Diseo de investigacin. Apartado: Las variables y la
operacionalizacn.
163
DISEO Y VALIDACIN DE INSTRUMENTOS EDUCATIVOS
TERCERA PARTE
VALIDACIN DE INSTRUMENTOS EDUCATIVOS
164
CAPTULO IX
ANLISIS DE LOS TEMES
Objetivo
Al concluir este captulo el estudiante ser capaz de calcular el ndice de
dificultad de los temes, realizar el anlisis de discriminacin de los temes e
interpretar ambos indicadores.
ndice de Dificultad de los temes
Conceptualizacin
El ndice de dificultad de los temes determina el grado de dificultad de un
tem. Su aplicacin exige dos condiciones: (a) Slo es aplicable a temes de
instrumentos que miden conocimiento, ejemplo, pruebas de aprovechamiento y
pruebas de nivel de conocimiento (test de habilidades). Cuando los temes del
instrumento no miden conocimiento, el ndice se interpreta como porcentaje de
respuestas afirmativas y negativas, de acuerdo y en desacuerdo, a favor o en contra,
(b) La codificacin o valoracin de las alternativas de respuestas deben ser
dicotmicas: correcta (1) e incorrecta (0). Esto se explica, porque la frmula del
ndice de dificultad de los temes es un proporcin entre el nmero de sujetos que
respondieron correctamente el tem y el nmero de sujetos que respondieron la
prueba. Se puede aplicar este ndice a temes de alternativas de respuestas no
dicotmicas, como tems de objetivos de respuestas mltiples; pero asignando dos
posibles valores o cdigos: 1 (correcta) y 2 (incorrecta).
165
Frmula para Calcular el ndice de Dificultad de los temes
ID= SRCI x 100
N
ID: ndice de dificultad del tem
SRCI: Nmero de sujetos que respondieron correctamente el tem
N: Nmero de sujetos que respondieron la prueba
Categoras de Interpretacin del ndice de Dificultad del tem
Rango Interpretacin
81 a 100 Muy fcil
61 a 80 Fcil
41 a 60
Moderadamente fcil o moderadamente difcil
21 a 40 Difcil
0 a 20 Muy difcil
Ejemplos
Caso 1: de 35 alumnos de un curso, respondieron correctamente 18 alumnos
Cul es el ndice de dificultad y la interpretacin del resultado?
ID: 18 x 100 = 51
35
El ndice se ubica en el rango 41 a 60; lo cual se interpreta como
moderadamente fcil o moderadamente difcil
Caso 2: de 35 alumnos de un curso, respondieron correctamente el tem 35 alumnos
ID: El ndice se ubica en el rango 81 a 100, lo cual se interpreta
como un tem muy fcil
35 x 100=100
35
166
Caso 3: de 35 alumnos de un curso, ninguno respondi correctamente el tem.
ID: El ndice se ubica en el rango 0 a 20, lo cual se interpreta como
un tem muy difcil
0 x 100 = 0
35
Se observa que entre mayor es el ndice de dificultad, ms fcil es el tem;
explicndose, porque al establecer el ndice como una proporcin de sujetos con
respuestas correctas/total sujeto que respondieran la prueba, al aumentar el nmero de
sujeto con respuestas correctas, el ndice tambin se incrementa, convirtiendo al tem
en ms fcil
ndice Promedio de Dificultad de la Prueba
Para obtener este ndice se promedian los ndices de la dificultad de todos los
temes que contiene la prueba.
Ejemplo en los tres casos anteriores
51+100+1=151= 50
3 3
El ndice se ubica en el rango 41 a 60, lo cual se interpreta que
la dificultad de la prueba en su conjunto (promedio) es
moderada.
.
Para calcular el ndice de dificultad a travs del programa Excel se recomienda ver
anexo A
Grado de Dificultad Adecuado para Aceptar un tem
Cuando se calcula el ndice de dificultad de una prueba es usual que el
evaluador, se pregunte: Es aceptable este ndice?. Al respecto se afirma que la
respuesta depende del propsito de la prueba. Si es una prueba de aptitud acadmica,
que persigue seleccionar una cantidad de aspirante a ingresar al nivel Superior de
Educacin, donde la demanda supera la oferta de cupos disponible, el nivel de la
prueba debe ser difcil o muy difcil para rechazar un mayor nmero de aspirantes. Si
la prueba de admisin es un mero requisito, donde el nivel de conocimientos del
167
aspirante no es importante, se puede pensar en disear una prueba fcil, para as
permitir el acceso a un mayor nmero de aspirantes.
En el caso de las pruebas aplicadas por el docente, ste puede tener inters en
obtener una prueba moderadamente difcil, tambin se puede presentar el caso, donde
el docente no le interesa el nivel de dificultad de la prueba, porque su diseo lo hace
en funcin de un dominio absoluto que debe poseer el alumno sobre el contenido
evaluado. En este caso no interesa calcular el ndice de dificultad de la prueba.
Anlisis de discriminacin de los temes
Conceptualizacin
El anlisis de discriminacin tiene como propsito determinar si los grupos con
las calificaciones ms altas y las calificaciones ms bajas (grupo superior e inferior
respectivamente), difieren entre si. Si hay diferencias significativas entre las
calificaciones de ambos grupos, el item discrimina, y por lo tanto, mide
adecuadamente el constructo en estudio, siendo recomendable incluirlo en el
instrumento. Si las calificaciones no difieren entre ambos grupos, el tem no
discrimina, y por lo tanto, no mide adecuadamente el constructo en estudio. En este
caso debe excluirse del instrumento. Al respecto Cohen y Swerdlik (2.000) expresa
lo siguiente:
El ndice de discriminacin de reactivos es una medida de la diferencia entre
la proporcin de personas que obtienen puntuaciones altas que responden un
reactivo en forma correcta y la proporcin de personas que obtienen
puntuaciones bajas que responden el reactivo en forma correcta, entre mayor
es el valor de d (del ndice de discriminacin), ser mayor el nmero de
personas que obtienen puntuaciones altas que respondieron el reactivo en
forma correcta. Un valor d negativo en un reactivo particular es una bandera
roja debido a que indica una situacin donde los examinados que obtienen
puntuaciones bajas tienen mayor probabilidades de responder el reactivo en
forma correcta que los examinados que obtienen puntuaciones altas. Esta
situacin exige alguna accin como una revisin del reactivo o su eliminacin
(p.p 244 y 245).
168
Cohen y Swerdlik (2000) ejemplifican de manera muy clara el anlisis de
discriminacin en el siguiente extracto:
Las medidas de discriminacin de reactivos indican qu tan adecuadamente
separa o discrimina un reactivo a quienes obtienen puntuaciones altas y a
quienes obtienen puntuaciones bajas en una prueba. En este contexto, un
reactivo de opcin mltiple en una prueba de rendimiento es un buen reactivo
si la mayora de los que obtienen puntuaciones altas lo responden en forma
correcta y la mayora de los que obtienen puntuaciones bajas la responden en
forma incorrecta (...) El sentido comn dicta que un reactivo en una prueba de
rendimiento acadmico no est haciendo su trabajo si es respondido en forma
correcta por quienes entienden menos la materia. Del mismo modo, un
reactivo en una prueba que pretende medir un rasgo de personalidad particular
no est haciendo su trabajo si la respuesta indican que las personas que por
ejemplo, obtienen puntuaciones muy bajas en la prueba en conjunto (lo que
indicara una ausencia o nivel bajo del rasgo en cuestin) tienden a obtener
una puntuacin muy alta en el reactivo (lo que indica que estn muy altos en el
rasgo en cuestin, lo que es contrario a lo que indica la prueba en conjunto).
(P.243 y 244).
Es importante clarificar que el anlisis de discriminacin no puede realizarse a
cualquier instrumento. Su aplicacin implica que la variable a la cual pretende medir
el instrumento, debe estar en una escala de medicin como mnimo en ordinal, porque
el anlisis de discriminacin exige conformar grupos con las calificaciones ms altas
y las ms bajas, lo cual implica como mnimo una relacin de orden. Una escala de
medicin nominal, no permite agrupar sujetos de acuerdo a las calificaciones ms alta
y calificaciones ms baja, porque su propiedad es slo clasificatoria. Esto explica,
porque un cuestionario de opinin, por ejemplo (el cual mide una variable en escala
de medicin nominal); aunque la forma de respuesta sea de preguntas cerradas y
todas tengan las mismas alternativas de respuestas, es incorrecta aplicarle el anlisis
de discriminacin.
Criterios para Determinar el Tamao de los Grupos (Grupo Superior e
Inferior).
El criterio establecido por diferentes autores para determinar el tamao de la
muestra, es asignar el 27% de los sujetos a la muestra de cada grupo extremo, si los
169
datos se distribuyeron normalmente. Si se alejan de la distribucin normal, el
porcentaje debe incrementarse a 33% del total de sujetos en cada grupo extremo.
Sobre este punto Anastasi y Urbina (1.998) expresan lo siguiente:
Aunque la diferencia sea obviamente mayor, entre ms extremos sean los
grupos, el uso de grupos muy extremos ( como el 10% superior e inferior)
puede reducir la confiabilidad de los resultados por el pequeo nmero de
casos utilizados. En una distribucin normal, el punto ptimo en el que las dos
condiciones se equilibran es el 27% superior e inferior... Cuando la
distribucin es ms plana que la curva normal, el porcentaje ptimo es
ligeramente mayor al 27% y se aproxima al 33% ... Con los grupos pequeos,
como los que se encuentran en un saln de clase, el error estadstico del
muestreo es tan grande que slo es posible obtener resultados aproximados;
por lo tanto, en estas condiciones no es necesario preocuparse por el
porcentaje exacto de casos en los grupos de contraste. Cualquier nmero
conveniente entre 25 y 33 por cierto resultar adecuado. (P.182)
En el cuadro 6, se visualiza la conformacin de los tres grupos: superior,
intermedio e inferior. En este caso, tomando en consideracin que es un grupo
pequeo y los resultados por lo tanto son aproximados, se tom el 27% como
porcentaje para la conformacin de los grupos extremos (superior e inferior).
Procedimientos para Determinar la Discriminacin de los temes.
El procedimiento para determinar la discriminacin de los tem vara de
acuerdo al tipo de respuestas de los tem, si el tem tiene alternativas de respuestas
dicotmicas se aplica una frmula para determinar el ndice de discriminacin, pero si
son ms de dos alternativas de respuestas, el procedimiento adecuado es la aplicacin
de la prueba estadstica T de Student para muestras independientes, con el propsito
de determinar si los grupos poseen medias significativamente iguales o diferentes.
A continuacin se explican ambos casos:
170
Anlisis de discriminacin en temes dicotmicos (*)
Pasos para calcular el ndice de discriminacin en forma manual(*). Cuando
se procede manualmente para calcular el ndice de discriminacin, los pasos son las
siguientes:
1. Se conforman los grupos extremos (superior e inferior) tomando en cuenta
los criterios establecidos (ver cuadro 6).
2. Se aplica la frmula para calcular el ndice de discriminacin.
ID: RCGS-RCCI
NG
ID: Indice de discriminacin
RCGS: Respuestas correctas grupo superior
RCGI: Respuestas correctas grupo inferior
NG: Tamao de uno de los grupos.
Ejemplos. A continuacin se calculan los ndices de discriminacin de la matriz
de datos del cuadro 6
ID item 1= 4 0 = 1 ID item 2= 4 4 = 0 ID item 3= 0 0 = 0
4 4 4
ID item 4= 2 3 = -0,25 ID item 5= 3 2 = 0,25 ID tem 6= 4 0 = 1
4 4 4
ID tem 7 = 4 0 = 1 ID tem 8 = 4 - 0 = 1
4 4
(*) En el anexo B se explica la rutina para calcular los ndices de discriminacin para
datos dicotmicos a travs del programa Excel.
171
Cuadro 6
Conformacin de los grupos
ITEM
GRUPOS SUJETOS
1 2 3 4 5 6 7 8 TOTAL
1
V V X V V V V V 7
2 V V X V X V V V 6
3 V V X X V V V V 6
4 V V X X V V V V 6
S
U
P
E
R
I
O
R
TOTAL 4 4 0 2 3 4 4 4
5 V V X X X V V V 5
6 V V X X X V V V 5
7 V X X X V V V V 5
8 V V X X V V V X 5
9 V X X X V V V V 5
10 V X X X X V V V 4
I
N
T
E
R
M
E
D
I
O
11 V V X X X X V V 4
12 X V X V V X X X 3.
13 X V X V V X X X 3
14 X V X V X X X X 2
15 X V X X X X X X 1
I
N
F
E
R
I
O
R
TOTAL 0 4 0 3 2 0 0 0 -
172
3.- Calculados los ndices de discriminacin de todos los tem, se interpretan los
resultados considerando los siguientes intervalos.
Rango Interpretacin
0,81 ----------- 1 Muy alta
0,61 ----------- 0,80 Alta
0,41 ----------- 0,60 Moderada
0,21 ----------- 0,40 Baja
0,00 ----------- 0,20 Muy Baja
Negativo Extremadamente Baja
Interpretando los ndices de discriminacin, se tiene que los tem 1 ,6, 7 y 8
tienen un nivel de discriminacin muy alto, lo que sirve de base para aceptarlos. Los
tem 2 y 3 tiene una discriminacin muy baja, ya que ambos grupos lo responden en
forma similar, se recomienda en este caso excluirlos del instrumento. El tem 5 tiene
una discriminacin baja, recomendndose, al igual que en el caso de los tem 2 y 3,
excluirlos del instrumentos. Por ltimo est el tem 4, el cual discrimina en forma
negativa. Cuando la discriminacin es negativa, debe excluirse el tem del
instrumento, porque significa que el grupo inferior obtiene calificaciones ms altas
que las del grupo superior. Este tem, como se explic en el punto de la
conceptualizacin del anlisis de discriminacin, no mide adecuadamente el
constructo en estudio, recomendndose su exclusin del instrumento.
Para aceptar un tem, la discriminacin debe ser en el caso que la variable a
medir sea conocimiento, como mnimo moderada. En el caso de test de personalidad
o afectivos, el nivel de discriminacin debe ser muy alto, auque pueden aceptarse
temes con discriminacin alta, si est cerca del lmite superior del rango, es decir
cercano a 0,80.
173
Anlisis de discriminacin en el caso de temes multictomos (ms de 2 alternativas
de respuestas).
El anlisis de discriminacin para datos no dicotmicos, al igual que el caso de
temes dicotmicos se desarrolla en forma manual y automatizada.
Pasos para calcular el ndice de discriminacin de los temes multictomos
1. Se conforman los grupos extremos (superior e inferior)
2. Se calcula la T de Student para muestras independientes de los grupos
extremos en cada item que conforman el instrumento.
3. Se interpretan los resultados. En este punto hay 2 opciones (a) en clculos
manuales o en el programa Excel, se compara la T calculada con el T crtico o
terico (T de la tabla), si el T calculado es mayor al T terico, las medias de ambos
grupos son significativamente diferentes, por lo tanto, el tem discrimina; en caso
contrario, el T calculado menor al T terico, no hay diferencias significativas entre las
medias de ambos grupos, por lo tanto, el tem no discrimina, (b) En clculos
realizados a travs del Programa Estadstico para Ciencias Sociales (SPSS), se
compara el valor de significacin (sig) con un valor alfa (o) que usualmente es 0,05
0,01, si el valor de significacin (asociado a la hiptesis nula) es mayor al valor alfa
(o ) no hay diferencias significativas, por lo tanto el tem no discrimina, si es el caso
contrario, el valor de significacin menor a alfa, hay diferencias significativas entre
las medias de ambos grupos, por lo tanto el tem discrimina (ver anexo C, donde se
explica la rutina para realizar el anlisis de discriminacin a travs del programa
SPSS).
174
EJERCICIOS PROPUESTOS
ACTIVIDAD 1
1. ANLISIS DE DISTRIMINACIN E NDICE DE DIFICULTAD DE TEMES
DICOTMICOS
Usando como herramienta tecnolgica el programa Excel, calcule e interprete el ndice de
dificultad y el ndice de discriminacin de los temes en la siguiente matriz de datos (ver
anexos A y B).
SUJETOS
I
T
E
M
0
1
I
T
E
M
0
2
I
T
E
M
0
3
I
T
E
M
0
4
I
T
E
M
0
5
I
T
E
M
0
6
I
T
E
M
0
7
I
T
E
M
0
8
I
T
E
M
0
9
I
T
E
M
1
0
I
T
E
M
1
1
I
T
E
M
1
2
I
T
E
M
1
3
I
T
E
M
1
4
I
T
E
M
1
5
I
T
E
M
1
6
1 0 0 1 0 1 1 1 1 1 1 1 1 1 1 1 1
2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
3 1 0 0 0 0 0 0 1 1 1 1 1 0 1 1 1
4 0 1 1 1 1 1 1 0 0 1 1 1 1 0 1 1
5 1 0 1 1 0 1 1 0 1 1 1 1 1 0 1 0
6 0 0 0 1 1 1 0 0 1 1 1 1 1 1 0 0
7 1 1 1 0 0 0 1 0 1 1 0 1 0 1 0 0
8 0 0 0 1 1 1 0 0 0 1 0 1 1 0 0 0
9 1 1 0 0 0 0 1 1 1 0 0 0 0 0 0 0
10 0 0 1 1 0 0 0 0 0 1 0 0 0 1 1 0
11 0 0 0 0 1 1 0 0 0 0 0 0 0 1 1 0
12 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0
175
ACTIVIDAD 2
2.1.- Disee una base de datos a partir de la matriz anexa, usando como herramienta
tecnolgica el Programa Estadstico de Ciencias Sociales (SPSS). En el Diseo tome
en cuenta las siguientes variables cualitativas:
Sexo: 1.- Masculino 2.- Femenino
Edad
1= "18 a 23" 2="24 a 29" 3= "30 a 39" 4= "40 a 49" 5="50 a 59" 6="> de 60"
Profesin
4="Prof/Lic." 3="Tec.Sup.Educ." 2=" Maest/Br.Doc." 1="No graduado"
Aos de Servicios
1="<5" 2="5 a 10" 3="11 a 15" 4="16 a 20" 5="> a 20"
2.2.- Determine los temes que discriminan y no discriminan, usando la T de Student
para muestras independiente como estadstico de prueba y el programa SPSS como
herramienta (ver anexo C).
I
T
E
M
0
1
I
T
E
M
0
2
I
T
E
M
0
3
I
T
E
M
0
4
I
T
E
M
0
5
I
T
E
M
0
6
I
T
E
M
0
7
I
T
E
M
0
8
I
T
E
M
0
9
I
T
E
M
1
0
E
D
A
D
S
E
X
O
P
R
O
F
E
S
I
O
N
S
E
R
V
I
C
I
O
5 5 5 4 5 5 5 5 5 4 1 1 4 1
2 1 2 1 1 1 1 1 1 1 2 1 1 4
2 4 2 3 4 5 5 5 4 4 4 2 1 3
5 5 5 4 5 4 5 5 5 4 3 1 3 2
4 5 5 5 4 4 4 5 5 5 2 2 2 2
5 5 5 5 5 5 5 5 5 5 1 1 3 5
5 5 3 5 4 5 4 5 5 5 3 2 1 1
1 4 2 5 2 4 4 5 5 4 3 1 1 4
2 5 4 5 5 5 5 5 5 5 3 2 1 1
4 5 1 4 4 4 5 4 4 2 3 2 1 2
176
Formato para analizar e interpretar los resultados del anlisis de discriminacin
realizado a travs del programa SPSS
Determine los temes que discriminan o no, tomando como referencia un valor
alfa = 0.05 (ver anexo C).
Varianza
T de Student
Item
Sig Tipo
(1)
Sig. Contraste
Hiptesis
nula
(2)
Conclusin
(3)
Decisin
sobre el
item
(4)
(1) Tipo: Si las varianzas son iguales desiguales
(2) Contrate de Hiptesis: Se acepta o rechaza la hiptesis nula
(3) Conclusin: Si el tem discrimina o no discrimina
(4) Decisin sobre el tem: Se acepta o se rechaza.
177
Referencias
Anastasi, A., y Urbina , S. (1.998). Test psicolgicos. Mxico: Prince Hall.
Cohen, R., y Swerdlik, M (2.000). Pruebas y evaluacin psicolgicas, Mxico: MC
Graw Hill
Lecturas Sugeridas
Aiken, L. (1.996). Tests psicolgicas y evaluacin. Mxico: Prince Hall. Se
recomienda del captulo 3: Administracin, calificacin y anlisis de reactivos de
test, apartado Anlisis de reactivos, sub-apartado ndices de dificultad y
discriminacin de los reactivos.
Anastasi, A., y Urbina, S. (1.998). Test psicolgicos. Mxico. Prince Hall. Se
recomienda el captulos 7: Anlisis de reactivos, apartados: Dificultad de
reactivos y Discriminacin de reactivos.
Cohen, R., y Swerdlink, M. (2.000). Pruebas y evaluacin psicolgicas. Mxico: MC
Graw Hill. Se recomienda captulo 7: Elaboracin de pruebas, apartado: Anlisis
de reactivos. Sub-apartado: ndices de dificultad e ndice de discriminacin
178
CAPTULO X
CONFIABILIDAD DE INSTRUMENTO DE MEDICIN EDUCATIVA
Objetivo
Al concluir este captulo, el estudiante ser capaz de calcular el coeficiente de
confiabilidad ms adecuado de un instrumento de medicin educativa e interpretar los
resultados.
Conceptualizacin
La confiabilidad es una medida de consistencia y uniformidad de un
instrumento de recoleccin de datos. Permite determinar si las calificaciones
provenientes de la aplicacin de un instrumento son estables en el tiempo y en lugares
diferentes. Se comprueba la confiabilidad de una balanza, si una persona que se pesa
en ella en lugares y momentos diferentes, obtienen un peso similar, es decir, sin
diferencias significativas. En el caso de los instrumentos educativos, se dice que ste
es confiable si al aplicar el instrumento dos veces a las mismas personas o al aplicar
dos versiones de un mismo instrumento a los mismo sujetos se obtiene los mismos
resultados. Asimismo un instrumento es confiable si los sujetos a quienes se le aplica
el instrumento lo responden homogneamente (consistentemente) en cuanto a la
variable que se desea medir.
A continuacin se revisan algunas definiciones de confiabilidad. Se comienza
con Anastasi y Urbina (1.998) quienes al respecto expresa lo siguiente: ...El trmino
de confiabilidad se refiere a la consistencia de las puntuaciones obtenidas por las
mima personas cuando se las examina en distintas ocasiones con el mismo test, con
conjunto equivalentes de reactivos o en otras condiciones de examinacin...(P.84).
Ms adelante las autoras mencionadas definen la confiabilidad: ....en trminos ms
tcnicos, la confiabilidad de una prueba permite estimar qu proporcin de la
varianza verdadera total de las puntuaciones se debe a varianzas del error ...(P.84).
179
Es importante expresar que cuando se realizan mediciones en diferentes
ocasiones, siempre existen diferencias, por ejemplo, si nos pesamos hoy y luego lo
volvemos hacer el da siguiente siempre existe una diferencia, auque a veces es
mnima, la cual es originada por factores fortuitos como haber tomando el peso
inmediatamente despus de consumir alimentos. Este tipo de diferencias se conocen
como varianza del error y es originada por factores aleatorios, los cuales el
investigador cuando aplica un instrumento debe controlar.
La teora del error de medicin en la confiabilidad de los instrumentos se
expresa de la manera siguiente:
Y= T+E; donde:
Y= Puntuacin observada
T= Puntuacin verdadera
E= Error de la medicin
Transformndose la ecuacin en:
V= Vv+ Ve; donde:
V= Varianza total
Vv= Varianza verdadera
Ve= Varianza del error
Interpretacin del Coeficiente de Confiabilidad
La confiabilidad se interpreta a travs de un coeficiente que tiene los siguientes
rangos:
Rango Interpretacin
0.81 ----------- 1 Muy alta
0.61 ----------- 0.80 Alta
0.41 ----------- 0.60 Moderada
0.21 ----------- 0.40 Baja
0.00 ----------- 0,20 Muy baja
Cuando es negativa Extremadamente baja
Cuando es mayor 1 Extremadamente alta
180
Lo normal es que el coeficiente de confiabilidad est entre 0 y 1; pero en
algunos casos traspasa est intervalo. Cuando un instrumento tiene una confiabilidad
negativa, significativa que sta es extremadamente baja, lo cual debe llevar a tomar la
decisin de rechazar el instrumento. Cuando sucede el caso contrario, el coeficiente
mayor a 1, la confiabilidad es extremadamente alta. Debe aceptarse el instrumento.
Lo recomendable cuando ocurre alguno de estos dos casos es revisar
determinadamente las respuestas del instrumento y los clculos. Es comn cuando
esto ocurre que el resultado se debe a incorrecta codificacin de las alternativas de
respuestas o clculos aritmticos incorrectos cuando el coeficiente se calcula en
forma manual.
Mtodos de Confiabilidad
Los mtodos de confiabilidad son tres, los cuales se desarrollan a continuacin:
Reaplicacin de la Prueba (Test-Retest)
Este mtodo de confiabilidad consiste en aplicar el instrumento a los mismo
sujetos en dos momentos diferentes. Es aconsejable que el intervalo de tiempo, entre
los dos aplicaciones no sea muy prolongado ni muy breve. Lo recomendable es entre
15 y 30 das. Debe tenerse cuidado que en el periodo entre ambas aplicaciones, los
sujetos no reciban algn estmulo que pudiera influir en la segunda aplicacin. Este
mtodo genera medida de estabilidad, porque garantiza que los resultados del
instrumento sean estables en el tiempo.
El procedimiento para aplicarlo es el siguiente:
1. Se aplica el instrumento en dos momentos a los mismos sujetos.
2. Se correlacionan los puntajes de ambas mediciones, a travs de un
coeficientes de correlacin; cuando la variable est en una escala de medicin
de intervalo o de razn se aplican el coeficiente de correlacin de Pearson. Si
181
la variable est expresada en una escala de medicin ordinal, el coeficiente de
correlacin apropiado es el Spearrman.
A continuacin se presentan dos (2) ejemplos que ilustran ambos casos:
Ejemplo 1
Aplicacin del Coeficiente de Correlacin de Pearson
Sujetos Puntuacin X
(1 aplicacin)
Puntuacin y
(2 aplicacin)
2
X
2
Y
X.Y
1 10 12 100 144 120
2 20 19 400 361 380
3 15 15 225 225 225
4 13 15 169 225 195
5 8 9 64 81 72
6 10 12 100 144 120
7 11 11 121 121 121
8 17 16 289 256 272
9 20 19 400 361 380
10 5 4 25 16 20
N= 10 X= 129 Y= 132
2
X=1.893
2
Y=1.934
XY=1.905
( )( )
( ) ( )
1
]
1
1
]
1
N
y
y
N
x
x
N
Y X
XY
r
2
2
2
2
182
( )( )
( ) ( )
97 , 0
42 , 209
20 , 202
10
132
934 . 1
10
129
893 . 1
10
132 129
905 . 1
2
2
= =
1
]
1
1
]
1
|
.
|
\
|
= r
El coeficiente de confiabilidad es 0,97; lo cual indica una confiabilidad muy
alta (ver rangos de interpretacin).
Ejemplo 2
Aplicacin del Coeficiente de Correlacin de Spearman
Sujetos Primeros
puntajes
Rango
(RI)
Segundos
Puntajes
Rango
(R2)
Di
(R1-R2)
2
D1
1 83 2 43 3 -1 1
2 99 6 47 4 2 4
3 88 5 40 2 3 9
4 41 1 38 1 0 0
5 117 10 66 8 2 4
6 114 9 89 11 -2 4
7 112 8 87 10 -2 4
8 84 3 57 6 -3 9
9 86 4 63 7 -3 9
10 127 12 93 12 0 0
11 107 7 55 5 2 4
12 118 11 83 9 2 4
Total 52
183
( ) ( )
( )
82 . 0
12
52 6 6
1
3
3
2
=
=
N N N
Di
r
La confiabilidad es muy alta, aceptndose sin reservas el instrumento
Cuando dos o mas sujetos reciben el mimos puntaje, se le asignaba a cada uno
el promedio de los rangos de los sujetos empatados. A continuacin se muestra un
ejemplo:
Sujetos Rango1
(R1)
Puntuaciones Rango 2
(R2)
D
(R1-R2)
2
Di
1 1 20 1 0 0
2 2 18 3,5 -1,5 2,25
3 3 19 2 1 1
4 4 18 3,5 0,5 0,25
5 5 16 6 -1 1
6 6 15 8 -2 4
7 7 16 6 1 1
8 8 16 6 2 4
9 9 13 10 -1 1
10 10 14 9 1 1
11 11 9 11 0 0
12 12 6 12 0 0
Total 15,5
( )
( )
95 , 0
12 12
5 , 15 6
1
3
=
= r
La confiabilidad es muy alta, por lo tanto, debe aceptarse el instrumento.
Hay programa estadstico, como Excel, STATISTICA, SPSS, etc., que calculan
ambos coeficientes de correlacin, lo cual facilita considerablemente la obtencin de
estos coeficientes. La rutina para obtenerlos es muy fcil de manejar y presenta
184
adems la prueba de contraste de hiptesis que complementa los resultados obtenidos
a travs de los coeficientes.
Pruebas de formas Equivalentes y formas altenas
Este mtodo consiste en elaborar dos versiones de un instrumento que miden
la misma variable, las cuales se aplican a un mismo grupo de sujetos. Genera en el
instrumento medidas de equivalencia, porque garantiza la obtencin de resultados
confiables cuando la variable se mide en dos versiones diferentes del instrumento.
Cuando las dos versiones no se aplican simultneamente al grupo de sujetos, sino que
se aplican en momentos diferentes; adems de generar medida de equivalencia,
tambin genera medida de estabilidad.
El procedimiento para obtener el coeficiente de confiabilidad de equivalencia es
el siguiente.
1. Elaborar las dos versiones equivalente del instrumento.
2. Correlacionar los puntajes de ambas versiones de la prueba de la misma
manera que en el caso del mtodo de reaplicacin de la prueba, es decir a travs del
coeficiente de correlacin de Pearson, si la escala de medicin de la variable es de
intervalo o de razn; si la escala de medicin de la variable es ordinal, se aplica el
coeficiente de correlacin de Spearman.
Hay autores que establecen diferencias entre pruebas equivalentes y pruebas
alternas, argumentado que solamente puede hablarse de pruebas equivalentes cuando
ambas versiones no tiene diferencias significativas en la media y la varianza de las
puntuaciones obtenidas. Cuando slo se asume que hay dos versiones equivalentes de
una prueba, sin comprobar la igualdad de medias y varianzas, se est en presencia de
una prueba paralela.
Al respecto Cohen y Swerdlik (2.000) expresan lo siguiente:
Formas alternas y formas equivalentes son trminos que en ocasiones se
usan en forma indiscriminada, aunque hay una diferencia tcnicas entre
185
ellos . Existen formas equivalentes de una prueba cuando para cada forma
de la prueba son iguales las medias y las varianzas de las puntuaciones de
pruebas observadas. ... Las formas alternas tan slo son versiones
diferentes de una prueba que se han construido con el fin de ser
equivalentes. Aunque no cumplen con los requisitos para la designacin
legtima de equivalentes, las formas alternas de una prueba estn
diseadas generalmente para ser equivalentes con respecto a variables (o
tems) como contenido y nivel de dificultad. (p. 160)
Mtodo de Consistencia Interna
Este mtodo tiene como propsito determinar la homogeneidad en las
respuestas de sujetos a quienes se le aplic el instrumento, puede aplicarse a pruebas
que miden habilidades como prueba de aprovechamiento, aptitud, inteligencia, de
nivel de conocimiento, etc, y a pruebas afectivas (o de personalidad) como las escalas
de actitud, test de personalidad, escalas de motivacin, etc. Es incorrecto aplicar este
mtodo a los cuestionario de opinin; porque al medir homogeneidad en las respuesta
de los sujetos a quienes se aplica el instrumento, es apropiado para aquellos
instrumento que persiguen obtener una calificacin nica, con alternativas de
respuestas en grado de intensidad.
En los cuestionarios de opinin no hay inconsistencia si los sujetos responden
las preguntas en forma heterogneas, porque las mismas no son para obtener una
puntuacin nica que indica una alta, media o baja presencia del atributo (variable) en
los sujetos. En el caso de los cuestionarios de opinin, cada pregunta como se
mencion en el captulo V, se analiza por separado. No es posible una calificacin
nica, porque, primero, las opiniones estn en una escala de medicin nominal (slo
son clasificatorias), y en segundo lugar, generalmente este tipo de instrumento,
aunque describa una sola variable, incluye preguntas con las cuales no se puede
obtener una calificacin nica, porque los temes miden o describen aspectos
diferentes de la variable.
A continuacin se presentan varias frmulas para calcular la consistencia
interna de un instrumento.
186
Datos dicotmicos
Frmula Kuder-Richardson (K-R20)
Rt= Coeficiente de Confiabilidad
n= Nmero de temes que contiene el instrumento.
Vt: Varianza total de la prueba
p.q= Sumatoria de la varianza individual de los temes
Se puede aplicar cualquiera de ambas frmulas, obtenindose resultados
similares.
Determinar el coeficiente de la confiablidad Kuder-Richardson (Matriz de
temes dicotmicos).
temes
Sujetos
1 2 3 4 5
Total
(x)
X2
1 1 1 1 1 1 5 25
2 1 1 1 1 1 5 25
3
1
1 1 1 1 5 25
4 1 1 1 1 1 5 25
5 0 1 1 1 1 4 16
6 1 0 0 1
1
3 9
7 1 1 1 1 1 5 25
8 1 1 1 1 1 5 25
9 0 1 1 1 0 3 9
Total 7 8 8 9 8 40 184
P 0,78 0,89 0,89 1 0,89 - -
q= 1-P 0,22 0,11 0,11 0 0,11 - -
p.q 0,17 0,10 0,10 0 0,10 0,47 -
)
.
( )
1
(
vt
q p vt
n
n
Rt
-
= )
.
1 ( )
1
(
vt
q p
n
n
Rt
-
187
Clculo de la varinza
p.q = 0.47
Vt= Varianza total
n= nmero de sujetos
La varianza, al igual que el coeficiente de confiabilidad de Kuder-Richardson,
se puede calcular por dos frmulas. Se recomienda calcular el promedio por la
segunda frmula que lo calcula abreviado y es menos susceptible a errores de
redondeo, los cuales cuando se calculan coeficientes pueden afectar
significativamente los resultados.
Clculo del Coeficiente Kuder-Richardson
Rt= Coeficiente de confiabilidad Kuder-Richardson
n= nmero de temes que contiene el instrumento
Al interpretar los resultados de acuerdo a los rangos explicados, se concluye
que la confiabilidad de consistencia interna es moderada. Si el instrumento evaluado
es un test afectivo (como una escala de actitud, escala de motivacin, test de
personalidad, etc.) debe rechazarse el instrumento. Si es un instrumento que mide
habilidades (como una prueba de conocimiento, prueba de rendimiento acadmico,
prueba de aptitud, etc.) se puede aceptar el instrumento, complementando el anlisis
con otros indicadores de validacin. Cuando la confiabildad es baja, muy baja o
50 , 0 )
78 . 0
47 . 0
1 ( )
1 5
5
( =
= x Rt
)
.
1 ( )
1
(
vt
q p
n
n
Rt
-
=
1
) (
2
=
n
x x
Vt 78 . 0
1 9
9
) 40 (
184
1
) (
2 2
2
=
n
n
x
x
188
extremadamente baja (negativa) debe rechazarse el instrumento, aunque sea un test de
habilidades.
Datos en Escalas no Dicotmicas (ms de 2 Alternativas de Respuestas)
Frmula Alfa de Cronbach
rt = Coeficiente de confiabilidad
n = Nmero de temes que contiene el instrumento
Vt St= varianza total
Vi= varianzas individuales
Se puede aplicar cualquiera de las dos frmulas, obtenindose resultados
similares
Determinar el coeficiente Alfa de Cronbach (matriz de temes con cinco (5)
alternativas de respuestas).
temes Sujetos
1 2 3 4 5 6
Total
(X)
X2
1 4 4 3 2 1 1 15 225
2 3 1 3 3 1 2 13 169
3 4 5 4 4 4 4 25 625
4 4 3 2 3 1 1 14 196
5 5 2 4 4 3 1 19 361
6 5 4 3 2 4 2 20 400
7 4 4 2 3 2 3 18 324
8 4 4 2 5 2 4 21 441
Total (x) 33 27 23 26 18 18 145 2.741
X2 139 103 71 92 52 52 - -
Vi2 0.41 1,70 0,70 1.07 1,64 1,64 7,16 -
) 1 ( )
1
(
Vt
Vi
n
n
rt
-
=
) ( )
1
(
Vt
Vi St
n
n
rt
-
=
189
Clculo de la varianza
Varianza total
Clculo de las varianzas individuales
Coeficiente de Confiabilidad
rt=( n ) *( 1- Vi ) =( 6 )* (17,16/16,13)
n- 1 VT 6-1
rt=0,67
rt= Coeficiente de confiabilidad
n= nmero de temes que contiene el instrumento
VT= Varianza total
Vi= Varianzas individuales
13 , 16
1 8
8
) 145 (
741 . 2
2
=
= Vt
41 , 0
1 8
8
) 33 (
139
1
2
2
=
= V
70 , 1
1 8
8
) 27 (
103
2
2
2
=
= V
70 , 0
1 8
8
) 23 (
71
3
2
2
=
= V
07 , 1
1 8
8
) 26 (
92
4
2
2
=
= V
64 , 1
1 8
8
) 18 (
52
5
2
2
=
= V
64 , 1
1 8
8
) 18 (
52
3
2
2
=
= V
190
En este ejemplo la confiabilidad es alta. Si el instrumento mide habilidades se
debe aceptar el instrumento; pero cuando es una prueba afectiva, el coeficiente como
mnimo debe ser 0.81, es decir, poseer una confiabilidad muy alta.
La formula alfa de Cronbach tambin es aplicable a datos dicotmicos. Al
respecto Cohen y Swerdlik (2.000) expresa lo siguientes: ..... el coeficiente alfa
tambin puede ser usado en pruebas con reactivos dicotmicos. Adems, el
coeficiente alfa es apropiado para ser usado en pruebas que contienen reactivos que
no son dicotmicos ...(P.166). Los resultados de la confiabilidad de datos
dicotmicos, aplicando la frmula Alfa de Cronback, son similares a los obtenidos
aplicando la formula Kuder-Richardson, si las respuestas de los sujetos a quienes se
aplic el instrumento son muy homogneas. En la medida que se incrementa la
homogeneidad, mayor ser la similitud de los resultados de ambas frmulas. Si las
respuestas de los sujetos son heterogneas, la diferencia de los resultados obtenidos
por ambas frmulas ser considerable. En este ltimo caso no es recomendable
aplicar la frmula Alfa de Cronbach a temes de respuestas dicotmicas. Se puede
proceder en el clculo de la confiabilidad de datos dicotmica de la manera siguiente:
se calcula el coeficiente de confiabilidad alfa de Cronbch a travs de SPSS, si el
coeficiente es muy alto, se acepta como indicador adecuado de la confiabilidad (en
este caso los datos son muy homogneos). Si es bajo, se considera heterogneo,
siendo aconsejable determinar el coeficiente por la frmula Kuder- Richardson,
porque indica diferencias entre los resultados de ambas frmulas. Cuando se calcula
el coeficiente Kuder-Richardson hay que hacerlo maual; porque el Programa SPSS
no lo calcula. Se puede calcular tambin a travs del programa Excel, siguiendo la
rutina que se incluye en el anexo D. Se justifica la aplicacin de este programa
cuando el nmero de tems del instrumento es alto.
CORRELACIN TEM-TEST Y CONFIABILIDAD SIN EL TEM
CORRELACIN TEM-TEST
Este indicador de homogeneidad del test, permite establecer la correlacin
entre el tem y el total de la escala. Pardo y Ruiz (2.002) Expresan que ...lo deseable
191
es que esas correlaciones sean altas; una correlacin baja estara indicando que el
elemento [el tem] en cuestin no apunta en la misma direccin que el resto de los
elementos. (p. 605)
El paquete estadstico SPSS, lo presenta como opcional cuando se calcula el
coeficiente de confiabilidad. Ruiz (1998) recomienda que el tem aceptado debe
poseer una relacin con el total, superior a 0,25; porque de lo contrario la relacin no
es aceptable.
Confiabilidad del Instrumento si se Excluye el tem Analizado
Este indicador de confiabilidad del instrumento, permite determinar si el tem
analizado aporta confiabilidad al instrumento. El criterio que se estable es excluir el
tem y observar el comportamiento de la confiabilidad del instrumento. Si la
confiabilidad sube o permanece igual a la obtenida con el tem incorporado, se toma
la decisin de excluirlo del instrumento; porque se demuestra que el mismo no aporta
confiabilidad al instrumento, en caso contrario, cuando la confiabilidad baja, debe
aceptarse el tem; porque indica que si ste se excluye del instrumento, la
confiabilidad ser afectada (disminuir).
Cclculo de Ambos Indicadores
Su clculo manual es muy engorroso y complejo; pero el programa SPSS lo
calcula, siguiendo la siguiente rutina: Men Estadstico ( o Men Analizar)
EscalasAnlisis de fiabilidadEstadstico: activar la opcin Escala si se elimina
el elemento ContinuarAceptar.
Confiabilidad de Dos Mitades
Es un mtodo que determina consistencia interna del instrumento. Consiste en
dividir el instrumento en dos mitades y proceder a determinar si existen relacin entre
192
ambas, aplicando el coeficiente de Spearman-Brown, el cual introduce en la frmula
una correccin, porque al dividir el instrumento en dos mitades se reduce el nmero
de temes, afectando la confiabilidad.
Cmo se constituyen las dos mitades?
Las dos mitades pueden conformarse de varias formas; las ms usuales son las
siguientes:
1. Itemes pares e temes impares
2. Procedimientos aleatorios para seleccionar los temes de cada mitad
Pasos para calcular el coeficiente de las dos mitades
1. Se constituyen las dos mitades
2. Se calcula el coeficiente de correlacin de Pearson, correlacionando las dos
mitades
3. Se aplica la frmula de Spearman-Broawn
El procedimiento para calcularlo es similar a los mtodos de reaplicacin de la
prueba y al de confiabilidad de formas equivalentes y formas alternas. Se aplica la
frmula del coeficiente de correlacin de Pearson cuando la escala de medicin de la
variable es de intervalo o de razn. Si la escala de medicin de la variable es ordinal,
el coeficiente de correlacin adecuado es el de Speraman (ver en este mismo captulo
la subseccin correspondiente al mtodo de reaplicacin de la prueba).
Frmula de Spearman Brown
rsp=coeficiente de correlacin Spearman-Brown
r1,2= coeficiente de correlacin de las dos mitades
2 , 1
2 , 1
1
2
r
r
r
sp
-
=
193
Ejemplo
Calificaciones de 10 estudiantes de un curso
Estudiantes Calificaciones
primera mitad de la
prueba
Calificaciones
segunda mitad prueba
1 15 16
2 14 13
3 20 20
4 8 10
5 17 16
6 19 19
7 14 15
8 12 13
9 20 20
10 8 6
En este ejemplo el coeficiente de correlacin de Pearson (r1,2) de las dos
mitades es 0,96. El procedimiento para calcularlo es similar al correspondiente a los
mtodos de confiabilidad de reaplicacin de la prueba y al de pruebas equivalentes y
de formas alternas. Se aplica la frmula del coeficiente de Pearson cuando la escala
de medicin de la variable es de intervalo. Si la escala es ordinal, la frmula adecuada
es la de Spearman (ver en este mismo captulo el apartado correspondiente al mtodo
de reaplicacin de la pruebas.
Se procede a calcular el coeficiente de confiabilidad aplicando la frmula de
Spearman-Brown. Los resultados son los siguientes:
98 . 0
96 . 0 1
96 . 0 2
=
-
-
= rsp
194
4. Se interpreta la confiabilidad como muy alta (0,98), por lo tanto, el
instrumento tiene consistencia interna.
Diferencias entre Dos Mitades de la Prueba y Formas Paralelas
Pardo (2.000) al referirse a ambos indicadores de evaluacin de un instrumento,
expresa lo siguiente:
Dos Mitades. Divide la escala en dos partes y calcula la fiabilidad a partir de
la correlacin entre ambas partes. (p. 596). Al referise a las formas paralelas de un
instrumento, expresa: ...Asume que todos los elementos [tms o variables] tienen
iguales varianzas observadas y error. (p. 596). Pardo, tambin establece diferencias
entre las formas paralelas de una prueba y el paralelo estricto. Al referirse a este
ltimo expresa: ...Asume los supuestos del modelo paralelo y, adems, que las
medias de todos los elementos son iguales." (p.596)
Para acceder a estos tres modelos incorporados en el programa SPSS desde la
Base de datos que se analiza, se sigue la siguiente rutina: Clic en analizar
EscalaAnlisis de fiabilidaden Modelo cambiar Alfa (opcin por defecto)
por Dos Mitades o Paralelo o Paralelo estricto.
Factores que Incrementan la Confiabilidad
1. Exclusin del instrumento temes ambiguos: las temes deben
formularse de manera clara y precisa, para evitar a quienes los
responden interpretaciones diferentes al sentido para el cual fue
formulado.
2. Instrucciones claras tienden a reducir los errores de medicin: el
instrumento de recoleccin de datos, debe ir acompaado de
instrucciones donde se especifique la manera de responder las
preguntas y donde se aclare posibles dudas del respondiente en el
momento de contestar las preguntas formuladas.
195
3. Control de las condiciones del espacio fsico y el personal responsable
de aplicar el instrumento: cuando se aplica un instrumento debe
disponerse de condiciones de espacio fsico similares para todas
aquellas personas a quienes se le aplicar la prueba. Asimismo el
personal responsable de aplicarlas debe poseer el mismo entrenamiento
y las mismas instrucciones.
Estableciendo estos mecanismos de control se puede reducir la varianza del
error, la cual es causada por factores externos a la prueba. Si este tipo de varianza no
se controla, puede afectar considerablemente los resultados de la prueba, y por lo
tanto, la confiabilidad del instrumento.
Incremento de la Confiabilidad de un Instrumento
Si el instrumento posee baja confiabilidad, sta puede incrementarse agregando
temes de igual tipo y calidad
A continuacin se presenta ejemplos de cmo incrementar la confiabilidad
aumentando el nmero de temes:
Cuantos temes deben agregarse a un instrumento para alcanzar la
confiabilidad deseada?
Frmula
N= CD(1-CI)
CI(1-CD)
N= nmero de temes necesarios para lograr la confiabilidad desea
CI = Confiabilidad del test inicial
CD = Confiabilidad deseada
196
Ejercicios Resueltos para incrementar la confiabilidad.
Si la confiabilidad de un instrumento de 10 temes es 0.46 Cuantos temes
deben agregarse para alcanzar una confiabilidad de 0.81?
N= 0,81(1-0,46) = 5 veces ms largo, es decir, necesita 50 temes para lograr la
0,46(1-0,81) confiabilidad deseada
Si la confiabilidad de un instrumento de 30 temes es 0.05. Cuntos temes deben
agregarse para alcanzar una confiabilidad de 0.90?
N= 0,90(1-0,05) = 171 veces ms largo. Tendra que tener 5.130 temes
0,05(1-0,90)
Si la confiabilidad de un instrumento de 30 temes es 0.55. Cuantos temes deben
agregarse para incrementarla a 0.61?
N= 0,61(1-0,55) = 1,28 veces ms largo. Tendra que tener 38 temes.
0,55(1-0,61)
197
EJERCICIOS PROPUESTOS
Actividad 1
CONFIABILIDAD POR REAPLICACIN DE LA PRUEBA Y POR PRUEBAS EQUIVALENTES
Calcule el coeficiente de estabilidad y equivalencia en las siguientes situaciones e interprete los resultados:
(Las pruebas F1 y F2 son dos versiones del mismo instrumento que miden la misma variable y
se asume los datos en una escala de medicin de intervalo)
Prueba (F1) aplicada
el 29/02/04
Prueba (F1) aplicada
el 22/03/04
Prueba (F2) aplicada
el 22/03/04
Sujetos
(Puntaje total) (Puntaje Total) (Puntaje total)
1 267 275 272
2 246 236 240
3 246 229 260
4 244 267 265
5 274 267 270
6 264 280 275
7 274 276 260
8 275 257 270
9 264 269 230
10 248 231 255
11 277 256 250
12 246 253 252
13 224 236 240
14 247 272 271
15 241 258 257
16 240 247 250
17 251 262 260
18 254 266 265
198
Actividad 2
Desarrolle el procedimiento manual exigido para calcular el coeficiente de
consistencia interna en los siguientes ejercicios e interprete los resultados
EJERCICIO 1
temes
Sujetos
1 2 3 4 5
1 1 1 1 1 1
2 1 0 1 1 1
3 1 1 0 0 0
4 1 1 1 1 1
5 1 1 1 1 1
6 1 1 1 1 1
7 1 0 1 0 1
8 1 0 1 0 0
9 0 1 1 1 0
EJERCICIO 2
Items Sujetos
1 2 3 4 5 6
1 4 4 4 4 4 4
2 5 4 4 5 4 2
3 5 5 5 5 5 5
4 4 5 4 4 5 4
5 4 4 4 4 5 4
6 4 4 5 5 5 5
7 4 5 2 3 5 5
8 5 5 4 5 4 5
9 4 4 4 4 4 4
10 5 5 5 5 5 5
199
Actividad 3
Aplicando el programa SPSS como herramienta tecnolgica, calcule e
interprete en la siguente base de datos el coeficiente de confiabilidad alfa de
Cronbach y excluye del instrumento los tems que no aportan confiabilidad y
presenten una correlacin tem-test menor o igual a 0.25:
TEMS
sujetos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
1 5 4 5 5 2 4 4 5 4 1 5 5 4 4 5 5 5 5 5
2 4 4 4 4 1 4 4 4 4 1 4 5 5 4 4 4 5 4 4
3 2 1 3 2 2 2 2 2 1 2 1 1 1 2 2 3 4 5 2
4 4 4 4 4 4 4 4 4 4 2 4 4 4 4 1 4 4 4 4
5 5 4 4 4 2 5 3 4 4 4 5 5 2 4 4 4 5 5 4
6 5 5 5 5 2 5 5 5 5 2 5 5 5 5 5 5 1 5 5
7 5 4 4 4 4 4 1 4 4 2 4 4 4 5 5 4 5 5 4
8 3 4 5 2 5 5 3 3 3 2 5 2 5 2 4 4 5 4 4
9 4 4 4 4 4 4 1 4 4 2 4 4 4 4 1 4 4 4 4
10 4 4 4 4 4 4 1 4 4 4 4 4 4 4 4 4 4 4 4
11 5 5 5 4 4 4 1 5 5 5 4 4 4 5 1 5 4 2 3
12 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4
13 2 2 2 2 2 2 3 2 2 2 2 2 2 2 2 1 1 2 2
14 4 5 4 4 4 4 5 5 5 1 5 5 5 5 5 5 5 5 5
15 4 4 3 2 4 4 3 2 4 5 4 4 4 4 1 4 5 4 5
16 3 2 2 2 2 2 1 2 4 1 2 4 2 4 2 4 2 4 2
17 4 4 4 4 1 4 1 4 4 1 4 4 4 4 2 4 4 4 4
18 2 4 4 4 1 4 1 4 4 1 5 5 4 2 1 4 2 5 5
19 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
20 4 4 5 5 1 5 5 4 4 2 5 1 4 4 4 2 5 5 5
21 2 1 1 1 1 1 1 1 1 1 1 1 2 2 1 2 2 1 1
200
Referencias
Anastasi, A., Y Urbina, U. (1.998). Test psicolgicos. Mxico: Prentice Hall.
Cohen, R., y Swerdlik, M. (2.001). Prueba y evaluacin psicolgicas. Mxico: Mc.
Graw Hill
Pardo, A. (2.000). SPSS 11: Gua para el anlisis de datos. Madrid: Mc Graw
Hill.
Lecturas Sugeridas
Aiken, L. (1.996). Tests psicolgicos y evaluacin (octava edicin), Mxico; Prentice
Hall. Se recomienda el capitulo 4: Estandarizacin, confiabilidad y validez.
Apartado de confiabilidad.
Anastasi, A., Y Urbina, U. (1.998). Test psicolgicos. Mxico: Prentice Hall.
Captulo 4: confiabilidad. Apartado: tipos de confiabilidad.
Ary, D., Jacobs, L., Y Razavieh, A. (1.989). Introduccin a la investigacin
pedaggico. Mxico: Mc Graw Hill. Se recomienda el captulo 8: validez y
confiabilidad. Apartado: confiabilidad.
Cohen, R., y Sswerdlik,, M. (2.001). Pruebas y evaluacin psicolgicas. Mxico: Mc
Graw Hill. Se recomienda el captulo 5: Confiabilidad. Apartado: Estimaciones
de confiabilidad.
Kerlinger, F. (1.988). Investigacin del comportamiento (tercera edicin en espaol).
Mxico: MC Graw Hill.. Se recomienda el captulo 26. El contenido es el
siguiente: definiciones de confiabilidad, teora de la confiabilidad,
interpretaciones del coeficiente de confiabilidad, error estndar de la media y el
error estndar de la medicin, mejoramiento de la confiabilidad y el valor de la
confiabilidad.
Pardo, A. (2.000). SPSS 11: Gua para el anlisis de datos. Madrid: Mc Graw Hill.
Se recomienda leer el captulo 25: Fiabilidad de las escalas: Procedimiento.
Anlisis de Fiabilidad. Exxplicaeste libro los mtodos de confiabilidad
analizados en este captulo y el procedimiento para calcularlos a travs del
programa SPSS.
201
CAPITULO XI
VALIDEZ DE INSTRUMENTOS DE MEDICIN EDUCATIVA
Objetivo
El estudiante al terminar esta Unidad ser capaz de realizar el proceso de
validez de instrumentos de medicin educativa.
Conceptualizacin
Cuando se analiz en el captulo anterior la confiabilidad, se dijo que sta
determina si los puntajes provenientes de la aplicacin de un instrumento son estables
en el tiempo si se aplica el instrumento dos veces; son equivalentes si se aplican dos
versiones de un mismo instrumento; y consistentes, si quienes responden un
instrumento lo hacen homogneamente. La confiabilidad determina si los puntajes de
un instrumento son los mismos en el tiempo y en situaciones similares; pero no
determina si lo que est midiendo es lo que realmente se quiere medir. Puede ocurrir
que un instrumento sea estable, equivalente y homogneo; pero no mide la variable
que se desea medir, ejemplo, una balanza puede medir en repetidas mediciones un
peso de un objeto o sujeto en forma consistente. Las veces que se pesa, ste es el
mismo. Esto determina por lo tanto confiabilidad; pero puede ser que ste no sea el
peso del objeto o sujeto, es decir, mide algo en forma consistente, pero no lo que
realmente queremos medir.
La validez tiene como propsito determinar si el instrumento mide exactamente
lo que se quiere medir. Es por esta razn que suele afirmarse que la confiabilidad de
un instrumento es una condicin necesaria para evaluarlo, pero no suficiente; porque
un instrumento puede ser confiable, sin ser vlido; pero al ser vlido es
necesariamente confiable.
El lector puede preguntar, si un instrumento que es vlido, tambin es confiable
Por qu no concentrar la evaluacin del instrumento en la validez y nos olvidamos
202
de la confiabilidad?. La respuesta a la pregunta, es que hallar evidencias de validez es
ms difcil que calcular la confiabilidad, la cual se reduce a un mero tecnicismo, a
calcular un coeficiente de confiabilidad. La validez tambin aplica coeficientes, pero
requiere la presencia de evidencias que determinan la validez del instrumento, las
cuales en la mayora de las veces es muy difcil de obtenerlas, porque las mismas
implica determinar aspectos tericos de lo que se quiere medir y relacionarlos con
evidencias empricas; las cuales no siempre son accesibles en el procceso de
validacin de instrumento
Mtodos de Validez
Los mtodos para determinar la validez son: Validez de contenido (a travs de
la tcnica de Juicio de expertos), Validez de criterio (la cual se subdivide en validez
concurrente y predictiva) y la validez de constructo (a travs de sus dos clases:
convergente y discriminante, aunque adems de stas hay otras evidencias de validez
de constructo, las cuales tambin se analizarn). A continuacin se explican los
diferentes mtodos de validez:
Validez de Contenido
La validez de contenido es la ms usual entre los tipos de validez. Esto se
explica, porque se le puede aplicar a cualquier instrumento independiente de la escala
de medicin. Los otros tipos de validez exigen como mnimo una escala de medicin
ordinal. El otro aspecto que favorece la aplicacin de este mtodo, es que la tcnica
empleada para obtener la validez de contenido es la tcnica de Juicio de Experto, la
cual consiste en la revisin del instrumento por expertos en la variable en estudio,
quienes en la mayora de los casos se localizan fcilmente.
Para la evaluacin del contenido del instrumento, el investigador o diseador
del instrumento, debe proporcionarle al experto un formato para evaluar el
203
instrumento, donde ste realiza las observaciones y recomendaciones sobre el
contenido del instrumento.
A continuacin se presentan algunos modelos de formato:
MODELO 1.-FORMATO PARA EVALUAR EL INSTRUMENTO
tem Congruencia
S ----- No -----
Claridad
S------ No -----
Tendenciosidad
S ------ No -----
Observaciones
1
.
.
.
.
.
.
.
.
.
.
.
.
n
MODELO 2.- FORMATO PARA EVALUAR EL INSTRUMENTO
tem Esencial til pero no esencial No necesario
1
.
.
.
.
.
.
.
n
204
2
2
N
Ne
CVR
N
=
27 , 0
2 11
) 2 11 ( 4
=
= CVR
64 . 0
2 11
) 2 11 ( 9
=
= CVR
0
2 10
) 2 10 ( 5
=
= CVR
A continuacin se presenta y ejemplifica la razn de validez de contenido, la
cual se puede aplicar cuando el formato de evaluacin es el modelo 2:
Razn de Validez de Contenido
CVR = razn de validez de contenido
Ne = Nmero de expertos que indican "Esencial"
N = Nmero total de expertos.
Ejemplo
1.- CVR negativo: cuando menos de la mitad de expertos indica esencial.
Supngase que cuatro (4) de once (11) expertos indicaron esencial.
2.- CVR cero = Cuando exactamente la mitad de los expertos indican
"esencial" . Supngase que cinco (5) de diez (10) expertos indican que es
esencial
3.-CVR positivo = cuando ms de la mitad; pero no todos los expertos indican
"esencial". Supngase que nueve (9) de once (11) experos indican que es esencial.
Para interpretar los resultados debe consultarse la tabla que se presenta a
continuacin:
205
Valores mnimos de la razn de validez de contenido para asegurar que es
improbables que el acuerdo se debe al azar.
Nmero de expertos Valor mnimo
5 0.99
6 0.99
7 0.99
8 0.75
9 0.78
10 0.62
11 0.59
12 0.56
13 0.54
14 0.51
15 0.49
20 0.42
25 0.37
30 0.33
35 0.31
40 0.29
Fuente: Cohen, R y Swerdlik, M. (2.000). Pruebas y Evaluacin Psicolgicas, 4
edicin: MC Graw Hill, pg. 189.
Al consultar en esta tabla los resultados de los tres ejemplos desarrollados, los
mismo se interpretan de la manera siguiente: en el primer ejemplo, el resultado es
negativo por lo tanto se rechaza el tem; ya que la tabla no tiene valores mnimos
negativos. En el segundo ejemplo es cero, al consultar la tabla, se observa que
tampoco tiene valores mnimos de cero, lo cual debe llevar a tomar como decisin
excluir el tem del instrumento. En el tercer ejemplo el resultado es mayor a cero;
206
para interpretar el resultado consultamos la tabla, procediendo de la manera siguiente:
se consulta en la tabla el valor mnimo cuando hay 11 expertos, el cual es 0,59. Se
compara con el valor calculado que es 0,64. Este valor est por encima del valor
mnimo exigido, por lo tanto, se acepta el tem.
Adems del Formato de evaluacin del instrumento, es recomendable anexar al
instrumento, el cuadro de operacionalizacin de la variable, los objetivos de la
investigacin y las bases tericas de la variable en estudio. Esta informacin ampliar
el conocimiento del experto sobre la variable que se quiere medir y le permitir
proporcior mejores observaciones y recomendaciones sobre el instrumento evaluado.
Validez de Criterio
Determina la relacin existente entre las puntuaciones de un instrumento de
medicin y una variable (conocida como criterio).
Qu es un criterio?
Para Hurtado (2.000) un criterio es: ... una medida externa, independiente al
instrumento (en evaluacin), con el cual se supone que ste est correlacionado y que
en definitiva es la caracterstica o conducta que el instrumento intenta predecir...
[pretende medir] (p. 435).
Un ejemplo es predecir el rendimiento que tendr un estudiante en su futura
carrera universitaria (criterio) a travs de una prueba de aptitud acadmica
(instrumento en evaluacin). Para validar el instrumento, se aplica a un grupo de
estudiantes que aspiran ingresar a la Universidad, se espera que haya transcurrido un
semestre o un ao acadmico para correlacionar las puntuaciones obtenidas en el
instrumento con la calificaciones promedio del mismo grupo despus de finalizar el
semestre o ao acadmico.
El estadstico que se emplea es el coeficiente de correlacin de Pearson (si la
escala de medicin de las puntaciones se considera como mnimo en intervalo) o el
207
coeficiente de correlacin de Spearman (si la escala de medicin es ordinal). Para
conocer el procedimiento exigido en el clculo de ambos coeficientes puede consultar
el aprtado del captulo sobre confiabilidad de instrumento de medicin educativa
(Unidad anterior) que aborda el mtodo de confiabilidad de reaplicacin de la prueba.
Caractersticas que debe reunir un criterio
1. Pertinencia: debe juzgarse si el criterio representa realmente un rendimiento
adecuado de la variable que se desea medir.
2. Debe ser confiable.
3. Debe estar libre de tendenciosidad.
4. Debe poseer validez.
Coeficiente de validez de criterio.
El coeficiente de validez de criterio se determina correlacionando los puntajes
del instrumento en evaluacin con los puntajes del criterio. La interpretacin de los
resultados es similar a la del coeficiente de confiabilida. A continuacin se presenta
los valores para su interpretacin:
Rango Interpretacin
0.81 ----------- 1 Muy alta
0.61 ----------- 0.80 Alta
0.41 ----------- 0.60 Moderada
0.21 ----------- 0.40 Baja
0.00 ----------- 0,20 Muy baja
208
Clase de validez de criterio
Se conocen dos clases de validez de criterio:
Validez concurrente. Cuando las puntuaciones del instrumento en evaluacin
se obtienen ms o menos al mismo tiempo que las medidas del criterio. Ejemplo:
cuando se utilizan los resultados de una prueba de habilidades numricas y verbales
(instrumento en evaluacin) para determinar el rendimiento acadmico (criterio).
Validez predictiva. Cuando el criterio est en tiempo futuro. Ejemplo: cuando
se utilizan los resultados de una prueba de aptitud acadmica (instrumento en
evaluacin) para predecir el desempeo acadmico (criterio) del alumno en un curso.
Validez de construccin (o de constructo)
Definicin de constructo
Se est en presencia de un constructo cuando la variable a investigar no se
puede medir directamente; pero muchas de las conductas que se consideran como
aspecto de ella son descriptibles y medibles.
Definicin de validez de constructo
Grado en que un instrumento es una medida de un constructo en particular.
Clases de validez de constructo
Validez Convergente. Se determina correlacionando los puntajes del
instrumento que mide el constructo en estudio con los puntajes de otro instrumento
que mide el mismo constructo u otro con el cual debera correlacionarse
209
positivamente. La correlacin para que exista validez de constructo convergente debe
ser alta o muy alta y la aplicacin de ambos instrumentos debe ser a la misma muestra
de sujetos.
Validez Discriminante. Se determina correlacionando las puntuaciones del
instrumento que mide el constructo en estudio con las puntuaciones de otro
instrumento que mide otro constructo o variables, con la cual el constructo en estudio
no debera correlacionarse. El coeficiente de correlacin en la medida que se
aproxime a cero (0) indica mayor validez discriminante.
Etapas para Calcular la Validez de Constructo
1. Establecer la relacin terica entre los conceptos, basndose en el marco terico,
en que se fundamentan ambos instrumentos.
2. Correlacionar los puntajes de los sujetos en ambos instrumentos.
3. Determinar qu clase de validez de constructo posee el instrumento.
Otras Evidencias de Validez de Constructo
Adems de las evidencias obtenidas por la validez convergente y discriminante,
hay otras evidencias de validez de constructo, las cuales se explican a continuacin:
1. Evidencia de homogeneidad o consistencia interna: se refiere a lo bien que
mide un instrumento un solo concepto. Se puede determinar a travs de: (a)
Correlacin item-test: se determina la correlacin existente entre cada tem que
conforma el instrumento con el total de puntajes del instrumento. El programa SPSS
dispone de este indicador. Se debe rechazar todos aquellos temes con un coeficiente
de correlacin tem-test inferior o igual a 0,25; (b) Capacidad de discriminacin de
los temes: mide el grado en que los sujetos de altas calificaciones y los sujetos de
bajas calificaciones responden en forma diferenciada los temes. (Ver captulo IX).
2. Evidencias de cambios con la edad: Se somete un instrumento a este
indicador cuando cuanto hay certeza que la edad influye en su comportamiento.
210
Ejemplo: se puede aplicar una prueba de rapidez en la lectura a escolares de grupos
de edades diferentes. La prueba evidenciar validez de constructo si los grupos de
grados superiores obtienen calificaciones ms altas que los grupos de grados
inferiores. Esto debe ser de esta manera, porque est demostrado que el incremento de
la escolaridad mejora la rapidez en la lectura.
3. Evidencias de cambios preprueba-posprueba: Si se aplica una estrategia
instruccional, la cual ha demostrado eficacia para incrementar el rendimiento
acadmico, los puntajes de un instrumento que mide el rendimiento acadmico, deben
tener diferencias significativas al comparar los resultados de la preprueba, aplicada
antes de comenzar la estrategia instruccional, con los resultados de la posprueba,
aplicada despus de concluir el curso sometido a la estrategia. Si las diferencias entre
la preprueba y posprueba son significativas, se puede asegurar que el instrumento
tiene validez de construccin.
4. Evidencia de grupos distintos: Si se disea un instrumento que mide la
actitud del estudiante hacia la matemtica y se aplica el instrumento a dos grupos
claramente diferenciados: grupo de alumnos que aprobaron la asignatura matemtica
y grupo de alumnos reprobados en esa asignatura, un instrumento con validez de
constructo debe presentar como resultado estudiantes que aprobaron la asignatura con
una actitud hacia las matemticas ms favorable y los estudiantes reprobados con una
actitud menos favorable.
5. Anlisis Factorial: El anlisis factorial es una tcnica que a travs de un
procedimiento matemtico y estadstico complejo, determina si los temes de un
instrumento miden solamente un aspecto de la variable en estudio. Asimismo
identifica aquellos temes que no miden ningn aspecto de la variable en estudio, los
cuales deben excluirse del instrumento. El anlisis factorial es un indicador tan
importante en el proceso de validacin de un instrumento que se dedicar la prxima
unidad a desarrollar paso a paso su procedimiento.
211
Ejercicios Propuestos
Actividad 1
3. Revise un trabajo de grado, evale los temes del instrumento aplicado para la
recoleccin de datos; y llene el formato presentado a continuacin:
Formato para Evaluar el Instrumento
Aspectos a evaluar del Instrumento
Congruencia (1) Claridad (2) Tendenciosidad (3)
tem
Si No Si No Si No
Observaciones
(4)
1
2
3
Fecha:
Nombre del Experto: Firma:
Institucin donde trabaja: Cargo que desempea:
(1) Congruencia: S el tem se relaciona con el indicador, subdimensin, dimensin y variable
que se pretender medir o describir.
(2) Claridad: Redaccin del tem
(3) Tendenciosidad: Si induce a responder en forma favorable, indecisa o desfavorable.
(4) Observaciones: Recomendaciones sobre el tem que es evaluado desfavorablemente:
modificarlo, sustituirlo por otro, excluirlo del instrumento, etc.
212
Actividad 2
Determine la razn de validez de contenido:
Un Jurado lo integran nueve (9) expertos.
Qu decisin debe tomarse con respecto al tem?
1. Siete (7) expertos indican que el tem es "esencial".
2. Tres (3) expertos indican que el tem es "esencial".
3. Tres (3) expertos indican que el tem "no es necesario" y dos que es " til
pero no esencial", el resto respondieron que es "esencial".
4. Cinco (5) expertos indican que el tem es "til pero no esencial ", uno (1) que
"no es necesario" y el resto que es "esencial".
5. Todos los expertos indicaron que no es esencial.
6. Slo un (1) experto indic que es esencial.
213
Actividad 3
Determine el coeficiente de validez de criterio e interprete el resultado.
sujetos Instrumento en evaluacin
(puntajes)
Criterio
(puntajes)
1 19 19
2 18 17
3 15 15
4 20 20
5 16 15
6 17 14
7 18 18
8 20 19
9 20 19
10 14 15
11 14 14
12 14 14
13 16 15
14 16 17
15 15 14
16 18 19
17 14 14
18 17 17
19 20 20
20 18 18
21 14 13
22 15 16
23 18 18
24 19 19
25 15 16
214
ACTIVIDAD 4
Determine en los siguientes ejercicios si existe validez convergente o
discriminante:
Situacin 1
Se ha demostrado tericamente que la actitud hacia las innovaciones educativas
y la motivacin al logra se correlacionan positivamente. Tomando en cuenta esta
relacin el Constructor de una escala de actitud hacia las innovaciones educativas
desea determinar si el instrumento diseado tiene validez de constructo. En este
sentido aplica a una misma muestra de sujeto este instrumento, conjuntamente con
otro instrumento que mide la motivacin al logro; el cual tiene debidamente
comprobado validez. Calcule el coeficiente de validez e interprete los resultados que
se muestran en la siguiente tabla:
Sujetos Actitud hacia las
innovaciones educativas
(Puntajes)
Motivacin al logro
(Puntajes)
1 3 3
2 5 4
3 5 5
4 2 2
5 4 5
6 1 2
7 2 2
8 3 3
9 5 5
10 5 5
11 5 5
12 4 5
13 2 2
14 2 2
15 1 1
16 1 2
17 4 5
18 4 5
19 5 5
20 1 2
215
Situacin 2
Se ha demostrado tericamente que el coeficiente de inteligencia y el nivel de
ingreso no se correlacionan; tomando en cuenta esta afirmacin el constructor de una
prueba de inteligencia, correlaciona los puntaje de un test de inteligencia aplicado a
un grupo de sujetos con el nivel de ingreso que posee cada uno de ellos. Calcule e
interprete el coeficiente de validez.
sujetos Coef. de Inteligencia
(C.I)
Ingreso/mensual
(Bs.)
1 98 100.000
2 120 700.000
3 111 990.000
4 115 1.200.000
5 125 3.500.000
6 85 1.100.000
7 95 1.090.000
8 99 900.000
9 115 1.100.000
10 100 1.100.000
11 115 1.300.000
12 130 1.040.000
13 125 900.000
14 114 1.200.000
15 105 1.500.000
16 100 905.500
17 100 1.300.000
18 98 900.000
19 95 1.000.000
20 65 2.290.000
21 80 800.000
22 75 800.000
23 98 2.500.000
24 95 900.000
25 89 1.100.000
26 110 970.000
27 95 2.700.000
28 100 3.000.000
216
Referencias
Cohen, R., Y Swerdlik, M. (2.001). Pruebas y Evaluacin Psicolgicas. Mxico: Mc
Graw Hill.
Hurtado, J. (2.000). Metodologa de la investigacin holstica. (Tercera edicin)
Caracas. Sypal.
Lecturas Sugeridas
Aiken, L. (1.996). Test psicolgicos y evaluacin. Mxico: Prentice Hall. Se
recomienda el Captulo 4: Estandarizacin, confiabilidad y validez. Punto:
Validez.
Ary, D., Jacobs, L.., Y Razavieh, A. (1.994). Investigacin pedaggica. (Segunda
Edicin). Mxico: Mc Graw Hill. Se recomienda el Captulo 8: Validez y
confiabilidad. Apartado: Validez.
Cohen, R., Y Swerdlik, M. (2.001). Pruebas y Evaluacin Psicolgicas. Mxico: Mc
Graw Hill.
Hurtado, J. (2.000). Metodologa de la Investigacin Holstica. (Tercera edicin).
Caracas: Sipal. Se recomienda el Captulo 24: Construccin y validacin de
instrumentos. Apartado 24.3: Validez de instrumentos.
Kerlinger, F. (1.988). Investigacin del comportamiento (Segunda edicin en
espaol): Mxico: Mc Graw Hill. Se recomienda el Captulo 27: Validez.
217
CAPITULO XII
ANLISIS FACTORIAL COMO TCNICA DE VALIDEZ DE
CONSTRUCTO EN ESCALAS PARA MEDIR ACTITUDES
Objetivo
Familiarizar al estudiante con el procedimiento exigido para cumplir la
aplicacin del anlisis factorial
A Manera de Introduccin
Estudiar actitudes, considerando sus tres componentes, implica elaborar un
instrumento con un alto nmero de temes, porque se debe redactar temes que
representen los tres componentes de la actitud y los indicadores del objeto de la
actitud. Cada indicador debe estar representado por temes redactados en forma
cognoscitiva, afectivo y conductual, porque de lo contrario no medir la actitud en
consideracin a sus tres componentes. Este procedimiento, que es el adecuado,
origina instrumentos constituidos por un alto nmero de temes, cuando la variable
posee un extenso nmero de indicadores. Es en este caso, cuando el anlisis factorial
representa una poderosa herramienta para reducir el nmero de temes de un
instrumento.
El anlisis factorial es una tcnica que genera validez de constructo, tanto
convergente como discriminante; porque identifica a los temes que miden slo un
factor, aquellos que miden a varios y los que no miden ninguno. Sus resultados
permiten tomar la decisin de aceptar solamente los temes que miden un factor.
El procedimiento para la aplicacin del anlisis factorial, implica el uso de
tcnicas matemticas y estadsticas muy complejas, como son el coeficiente de
correlacin parcial, lgebra matricial y la rotacin de factores; tcnicas que al
realizarlas manualmente exigen poseer slidos conocimientos sobre estas dos
disciplinas y realizar laboriosos clculos. Afortunadamente existen programas
218
computarizados, como el Programa Estadstico para Ciencias Sociales (SPSS), que
presenta en forma automatizada los resultados, evitando la laboriosa tarea de realizar
clculos manuales de tan complejas tcnicas matemticas y estadsticas.
Validacin Preliminar de Actidoc. I
Descripcin de Actidoc. I
Es una escala de actitud, usando el mtodo de Likert; y cuyo propsito es
determinar la actitud del docente de la primera etapa de Educacin Bsica hacia la
evaluacin de los aprendizajes, de acuerdo al Currculo Bsico Nacional. Este
instrumento tiene cinco (5) alternativas de respuestas: totalmente de acuerdo, de
acuerdo, indeciso, en desacuerdo y totalmente en desacuerdo. La valoracin de cada
alternativa depende del sentido de redaccin del item. Si es en sentido positivo hacia
la evaluacin de los aprendizajes la mxima valoracin (5 puntos) corresponde a la
alternativa totalmente de acuerdo. Si por el contrario, el item se expresa en sentido
negativo hacia la evaluacin de los aprendizajes, la mxima valoracin ser
totalmente en desacuerdo.
La versin preliminar del instrumento estuvo conformada por 120 temes. El
criterio establecido fue redactar 2 temes por indicador. El total de indicadores suma
veinte; pero como cada indicador se expres en forma cognoscitiva, afectiva y
conductual, esta cifra ascendi a 60 indicadores, que al redactar la mitad en sentido
positivo y la otra mitad en sentido negativo, totaliza 120 temes.
En cuanto al nmero de sujetos para aplicar la encuesta piloto, se seleccionaron
240 docentes que laboran en 30 escuelas de la primera etapa de Educacin Bsica del
Estado Lara. El criterio para calcular el tamao de la muestra piloto de docentes, fue
tomar el doble de sujetos por item.
219
Validez de Contenido
Antes de aplicar la prueba piloto, se realiz la validez de contenido del
instrumento a travs de la tcnica de juicio de expertos. En este sentido el instrumento
fue evaluado por siete (7) expertos: 3 metodlogos, 1 experto en construccin de
instrumentos educativos y muestreo, 1 experto en diseo curricular y 2 maestros de
aula de la primera etapa de Educacin Bsica; estos ltimos evaluaron
fundamentalmente la claridad, nivel de comprensin de los temes y la duracin en el
llenado del instrumento. Las observaciones realizadas por los siete (7) expertos
contribuyeron sustancialmente a mejorar y enriquecer el instrumento.
Anlisis de Discriminacin de los temes
El anlisis de discriminacin de los temes se realiz calculando la t de student
para muestras independientes. El procedimiento consisti en comparar en cada item
el 27% de los sujetos (65 docentes) con el puntaje total de actitud ms alto (grupo
superior) y el 27% de sujetos (65 docentes) con el puntaje total de actitud ms bajo.
Con este propsito se calcularon a travs del paquete estadstico computarizado SPSS
120 T de student correspondientes a cada uno de los temes que constituyeron la
versin preliminar del instrumento.
Se contrastaron las 120 pruebas estadsticos, a un nivel de significacin bilateral
y al 0,01 de rechazo de la hiptesis nula (H
0
). Los resultados fueron los siguientes:
hubo 108 temes donde la hiptesis nula se rechaz, aceptndose por lo tanto la
hiptesis alternativa que afirma la existencia de diferencias significativas entre el
grupo superior e inferior, en consecuencia, estos temes demostraron capacidad de
discriminacin. Los temes donde los grupos no presentaron diferencias significativas
fueron doce (12): 1, 12, 21, 26, 27, 35, 40, 70, 79, 82, 106 y 108. En estos temes se
evidenci baja capacidad de discriminacin, lo cual permiti excluirlos del
instrumento.
220
Anlisis de Confiabilidad de Instrumento
Para evaluar la confiabilidad del instrumento se analizaron dos (2) mtodos:
1. reaplicacin de la prueba: el procedimiento fue el siguiente: se aplic la
versin preliminar a 240 docentes y se seleccion aleatoriamente el 10% de los
docentes de la muestra piloto (24 docentes); a quienes se aplic por segunda vez el
mismo instrumento, dos meses despus de la primera aplicacin. Se procedi a sumar
el total de actitud de cada uno en ambos aplicaciones, se calcul a travs del
programa estadstico computarizado SPSS, el coeficiente de correlacin de Pearson
(la actitud se considera expresada en una escala de medicin de intervalo; por lo tanto
este coeficiente es adecuado), correlacionando los puntajes del test y el retest. Los
resultados (coeficiente de 0,78) demuestran alta correlacin entre ambos puntajes y
estabilidad del instrumento, garantizando que los resultados se pueden generalizar a
travs del tiempo.
2. Confiabilidad de consistencia interna: esta confiabilidad mide la
homogeneidad o consistencia que presentan las respuestas de los sujetos a quienes se
le aplic el instrumento. Para que el instrumento tenga consistencia interna es
necesario respuestas homogneas, es decir, obtener puntajes similares en los
diferentes temes. Para el clculo de esta confiabilidad se us las frmulas de Alfa de
Cronbach y Dos Mitades. En ambos casos el procedimiento fue a travs del programa
estadstico SPSS. Los resultados fueron coeficientes de confiabilidad de 0,95 y 0,91
respectivamente, lo cual demuestra alta confiabilidad de consistencia interna del
instrumento.
Contribucin de los temes a la Confiabilidad del Instrumento.
Para determinar si los temes que constituyen el instrumento contribuyen a la
confiabilidad o si por el contrario afectan la confiabilidad del instrumento, se aplic
la opcin de SPSS para conocer la confiabilidad del instrumento si se excluye el item
del anlisis de confiabilidad. Los resultados demostraron que hubo 10 temes que no
221
aportaban confiabilidad al instrumento y en algunos casos la confiabilidad se
incrementaba al excluir el item. Los temes que no contribuyeron a la confiabilidad
son los siguientes: 17, 22, 32, 53, 75, 76, 100, 113, 116 y 120.
Considerando que el propsito en la evaluacin de un instrumento es obtener
validez y confiabilidad, se decidi excluir estos temes del instrumento, porque no
cumplan con el propsito de aportar confiabilidad al instrumento. La confiabilidad
sin estos temes ascendi un (1) punto, ubicndose el coeficiente Alfa de Cronbach en
0,96.Correlacin
Relacin tem-Total-Corregido
Este indicador de confiabilidad lo presenta el paquete estadstico SPSS, como
opcional cuando se calcula el coeficiente de confiabilidad. Ruiz (1990) recomienda
que el item aceptado debe poseer una relacin con el total, superior a 0,254 (p.91);
porque de lo contrario la relacin no es aceptable. En la presente investigacin todos
los temes aceptados, poseen una relacin con el total superior al 0,25. Slo los temes
que no contribuyen a la confiabilidad, a excepcin del 17, presentan una relacin
inferior o igual a 0,25.
El Anlisis Factorial
Coceptualizacin
El anlisis factorial es una tcnica de validez de constructo que por su
complejidad es de uso limitado; pero de gran utilidad cuando se requiere reducir
variables o temes; ya sea porque miden varios factores o simplemente no miden
ninguno. Kerlinger (1988) al referirse al anlisis factorial expresa lo siguiente:
El anlisis factorial sirve a la causa de la circunspeccin cientfica.
Reduce la multiplicidad de pruebas y medidas a una mayor simplicidad.
Nos dice, en efecto, qu pruebas o medidas pertenecen conjuntamente:
con cules podra medirse la misma cosa, en otras palabras, y en qu
medida pueden hacerlo. De este modo, reduce el nmero de variables que
222
debe tratar el cientfico. Tambin ayuda al cientfico a localizar e
identificar las unidades o propiedades bsicas que fundamentan las
pruebas y medidas. (p. 648)
Ms adelante Kerlinger define los factores, los cuales constituyen el soporte del
anlisis factorial. Al respecto seala que:
Un factor es un constructo, una entidad hipottica, una variable latente
que se supone fundamenta las pruebas, escalas, reactivos y, en realidad,
las medidas de casi cualquier tipo. Se ha encontrado que ciertos nmeros
de factores fundamentan la inteligencia; por ejemplo, habilidad verbal.
Habilidad numrica, razonamiento abstracto, razonamiento espacial,
memoria y otros. De manera similar, se han aislado e identificado los
factores aptitud, actitud y personalidad. An las naciones y la gente han
sido factorizada. (p. 648)
El procedimiento para realizar el anlisis factorial consiste en los siguientes
pasos: (a) Formar la matriz de correlaciones, en la cual se correlacionan todas las
pruebas o temes; (b) Se identifican los temes que se relacionaron con cada factor;
(c) Se rotan los factores para obtener una solucin factorial ms confiable; (d) Se
excluyen del instrumento aquellos temes que cargan (o se correlacionan) con ms de
un factor o no tiene cargas altas (correlacin alta) en ningn factor; (e) Se construye
la versin definitiva del instrumento, con aquellos temes que slo se correlacionan
altamente con un factor y con correlaciones bajas en el resto. Con este criterio se
persigue que los temes midan exactamente lo que deben medir, de ah que se
considere al anlisis factorial como una tcnica para generar la validez de constructo
del instrumento.
Caso Hipottico de Anlisis Factorial
A continuacin se presenta el procedimiento manual para desarrollar un
ejemplo hipottico de anlisis factorial:
223
1. Matriz de correlacin de temes
Pruebas 1 2 3 4 5 6
1 1 0.72 0.63 0.09 0.09 0.00
2 0.72 1 0.57 0.15 0.16 0.09
3 0.63 0.57 1 0.14 0.15 0.09
4 0.09 0.15 0.14 1 0.57 0.63
5 0.09 0.16 0.15 0.57 1 0.72
6 0.00 0.09 0.09 0.63 0.72 1
En negritas: Factor 1 (Pruebas 1, 2 y 3 ) y factor 2 (Pruebas 4, 5 y 6)
Prueba 1: Vocabulario Prueba 4:lgebra
Prueba 2: Lectura Prueba 5: Aritmtica (Prueba estandarizada)
Prueba 3: Sinnimos Prueba 6: Aritmtica (Prueba hecha por el docente)
Tomado de Kerlinger. (1998), p 649
Se correlacionan los resultados de cada prueba con el resto y se obtienen 36
coeficientes de correlacin. El tipo de coeficiente de correlacin que se aplica es el
parcial.
2. Obtencin de la matriz factorial original.
Pruebas Factor 1 Factor 2
1 0.90 0.00
2 0.80 0.10
3 0.70 0.10
4 0.10 0.70
5 0.10 0.80
6 0.10 0.90
Tomado de Kerlinger. (1.998), p 652
Se correlaciona cada prueba con el factor y se obtiene los coeficientes de correlacin
parcial de cada prueba en ambos factores
224
3. Matriz factorial con solucin rotadas
Pruebas Factor 1 Factor 2
1 0.83 0.01
2 0.79 0.10
3 0.70 0.10
4 0.10 0.70
5 0.10 0.79
6 0.01 0.83
Tomado de Kerlinger. (1.998), p 651
Considerando que la solucin no rotada, presenta resultados ambiguos, se rotan los
factores para obtener una solucin nica. En la interpretacin de los resultados, se
aceptan aquellas pruebas que tienen un coeficiente de correlacin alto en un factor
(mayor a 0,50) y bajo en el resto de los factores (menor o igual a 0,30). En este
ejemplo hipottico, las pruebas que se correlacionan con el factor 1, son la 1, 2 y 3.
Con el factor 2, se correlacionan las pruebas 4, 5 y 6. Si alguna de ellas se
correlacionaran en forma alta en ambos factores o no se correlacionaran con ninguno,
se debe excluir de la investigacin en estudio. En el primer caso (correlacin de la
prueba con ms de un factor), indica que la prueba est midiendo ms de factor y slo
debe medir un factor. En el segundo caso (la prueba no se correlaciona con ningn
factor), no mide ningn factor.
Rutina para Realizar el Anlisis Factorial en SPSS
1. Abrir el archivo
2. Clic en el men analizar ( si es la versin 11) o en Estadstico (si es
la versin 7.5)
3. Clic en reduccin de datos.
4. Clic en anlisis factorial
225
5. Pasar todos los temes (no las variables cualitativas) al recuadro
variables.
6. Clic en descriptivos: activar las opciones Determinante y KMO y
prueba de esfericidad de Bartlett, clic en continuar.
7. Clic en extraccin: Dejar activada la opcin poor defecto Mtodo
Componentes principales, activar la opcin autovalores mayores que 1. Clic
en continuar.
8. Clic en rotacin: activar la opcin varimax. Clic en continuar.
9. Clic en opciones: activar las opciones Ordenadas por tamao y
suprimir valores absolutos menores a 0.10. Clic en continuar.
10. Clic en aceptar.
Para informacin ms amplia sobre la rutina del anlisis facttorial a
travs del progrma SPSS, consultar el anexo E de este Mdulo, donde se
suministra informacin sobre el propsito que cumplen cada uno de los
indicadores que presentan las diferentes opciones.
El Anlisis Factorial en un Caso Prctico: Actidoc. I
En el caso particular de esta investigacin, el anlisis factorial se realiz a
travs del programa estadstico computarizado SPSS, seleccionando el Mtodo de
Componentes Principales como Extraccin de Factores y el Mtodo Varimax para la
rotacin de factores. Como opcin que presenta SPSS, se realiz una ordenacin de
las cargas factoriales de acuerdo al tamao y se suprimieron los valores absolutos
menores 0,10.
Para determinar si es viable aplicar el anlisis factorial en el instrumento
Actidoc. I, se calcul a travs de SPSS, el Determinante de la matriz; el cual se
interpreta de la siguiente manera: valores cercanos a cero (0) indican que los temes
de la matriz se correlacionan linealmente, siendo viable por lo tanto aplicar el anlisis
factorial, cuando ocurre lo contrario, es aconsejable no continuar con el anlisis. En el
226
caso de Actidoc. 1, el Determinante se ubica en 6,187E-30 (se interpreta que antes del
nmero 6 se anteponen 30 ceros). Este resultado evidencia que Actidoc. 1 tiene una
interrelacin lineal alta entre los temes.
Asimismo se calcul a travs de este mismo programa, el coeficiente KMO
(Kiser-Meyer-Olkin) y el Test de Bartlett. Segn Visuata (1998) ...el ndice KMO
nos compara los coeficientes de correlacin de Pearson obtenidos (en la matriz de
correlacin)... con los coeficientes de correlacin parcial entre variables... (p. 224)
El criterio para interpretar los resultados del ndice KMO son los siguientes:
1 > KMO > 0,90 son considerados excelentes.
0,90 > KMO > 0,80 son considerados buenos.
0,80 > KMO > 0,70 son considerados aceptables.
0,70 > KMO > 0,60 son considerados mediocres o regulares.
0,60 > KMO > 0,50 son considerados malos
KMO s 0,50 son considerados inaceptables o muy malos.
En el caso especfico de esta investigacin el KMO es igual a 0,81,
considerndose por lo tanto como bueno.
En el caso del test de Bartlett, Visuata (1998) expresa que ste:
...es utilizado para verificar si la matriz de correlaciones es una matriz
identidad, es decir, si todos los coeficientes de la diagonal principal son
iguales a la unidad y los externos a la diagonal iguales a 0. Este
estadstico se obtiene a partir de la transformacin x
2
del determinante de
la matriz de correlaciones y cuanto mayor sea y por lo tanto menor el
grado de significacin ms improbable que la matriz sea una matriz
identidad... un grado de significacin p = 0 resulta evidente que no se
trata de una matriz identidad. En el supuesto de que no pudiese rechazar
esta hiptesis, se desaconseja proceder a realizar el anlisis factorial con
los datos. (p. 224)
En el caso de esta investigacin, la prueba Bartlett tiene una significacin igual
a 0,00, lo que indica aconsejable aplicar el anlisis factorial en la validacin del
instrumento.
Las tres pruebas aplicadas (el Determinante, el ndice KMO y la prueba de
Bartlett), consideradas como aconsejables aplicarlas para determinar la conveniencia
227
de realizar el anlisis factorial, son favorables; lo que indica la conveniencia y la
viabilidad de aplicar en esta investigacin la tcnica de anlisis factorial. En este
sentido se procedi a realizar (despus de extraer los factores, a travs del mtodo de
componentes principales, y la rotacin de factores, a travs del mtodo Varimax) la
seleccin de los temes entre 28 factores extrados. El criterio para seleccionar los
temes se tom de Nunnally y Bernstein (1988), quienes al respecto expresan lo
siguiente:
...cada factor debe tener algunas variables que se correlacionen con l casi
exclusivamente (la mayora de las variables que se correlacionan
altamente con ese factor no deben correlacionarse ms de 0,3 con
cualquier otro factor, y las variables marcadoras... deben correlacionarse
por encima de 0,5...(p. 603)
Tomando en cuenta este criterio, la cantidad de temes se reduce de 98 a 49,
excluyndose temes, unos, porque tenan alta correlacin en ms de un factor (mayor
a 0.50), lo cual indica que miden ms de un factor, los otros temes excludos fueron
aquellos que no tenan correlacin mayor a 0,5 en ningn factor, indicando que no
medan ningn factor. En resumen se descartaron aquellos temes que medan ms de
un aspecto del objeto de estudio (en este caso la actitud del docente hacia la
evaluacin de los aprendizajes) o aqullos que no medan ninguno. El anlisis
factorial permite precisamente determinar que los temes de un instrumento miden
realmente lo que se quiere medir y cada uno de ellos deben medir slo un aspecto
(factor) del objeto de estudio.
En el caso de esta investigacin se aplic el criterio de aceptar factores con
extraccin de autovalores mayores que 1. Se obtuvo, tomando en cuenta este criterio,
28 factores que acumularon una varianza explicada de 72,26% (Ver Cuadro 7), es
decir que esta cantidad de factores explican 72,26% de la varianza del total de temes
del instrumento, porcentaje que se considera alto y aceptable para realizar el anlisis
factorial del instrumento.
228
Cuadro 7
Varianza total explicada
Suma de las saturaciones al cuadrado de la rotacin
Componente
Total % de la varianza % acumulado
1 6,212 6,339 6,339
2 3,849 3,928 10,267
3 3,748 3,825 14,091
4 3,544 3,616 17,707
5 3,383 3,452 21,159
6 3,287 3,355 24,514
7 3,105 3,168 27,682
8 2,878 2,937 30,619
9 2,521 2,572 33,191
10 2,499 2,550 35,740
11 2,433 2,482 38,223
12 2,425 2,475 40,697
13 2,422 2,472 43,169
14 2,236 2,282 45,451
15 2,188 2,233 47,684
16 2,135 2,178 49,863
17 2,057 2,099 51,952
18 2,047 2,089 54,050
19 1,982 2,022 56,072
20 1,892 1,931 58,004
21 1,881 1,920 59,923
22 1,850 1,887 61,810
23 1,833 1,870 63,681
24 1,749 1,785 65,465
25 1,677 1,712 67,177
26 1,673 1,707 68,884
27 1,658 1,692 70,576
28 1,648 1,682 72,257
Nota: Datos tomados de la matriz de resultados de la encuesta piloto (preliminar)
Actidoc. I y clculos realizados a travs del programa estadstico SPSS.
229
Aproximacin a una Nueva Operacionalizacin de la Variable Actitud del
Docente hacia la Evaluacin de los Aprendizajes a travs del Anlisis Factorial
Entre los beneficios que genera la aplicacin de la tcnica del anlisis factorial
es descubrir factores que reemplazan la estructura original de operacionalizacin de la
variable, fundamentada en dimensiones, subdimensiones e indicadores. En el caso de
esta investigacin se mencionan los factores y los temes que lo explican. Cada factor
se le asign un nombre en consideracin al elemento comn de los temes que lo
constituyen. Hay algunos factores que no fue posible identificar el elemento comn
en el cual convergen. Sobre la identificacin del factor comn, Cohen y Swerdlik
(1988) comentan lo siguiente:
...si un anlisis factorial identific un factor comn que est midiendo los
instrumentos hipotticos, una prueba de bulimia y una prueba de
anorexia, surgira una interrogante concerniente a la forma de nombrar
este factor. Una analista factorial que observara los datos y reactivos de
cada prueba podra bautizar al factor comn como un factor de trastorno
alimenticio. Otro analista factorial que examinara exactamente los
mismos materiales podra denominar el factor comn factor de
preocupacin por el peso corporal. Un tercer analista podra nombrarlo
factor de trastornos de la percepcin de s mismo y as en forma
sucesiva. El punto aqu es que la denominacin de factores que surgen de
una anlisis factorial tiene ms que ver con el conocimiento, juicio y
capacidad de abstraccin verbal que con la destreza matemtica. No hay
un libro de reglas para designar factores; los analistas factoriales ejercen
su propio juicio concerniente a cul nombre del factor comunica mejor el
significado del factor... (p. 212)
Tomando en cuenta los comentarios de Cohen y Swerdlik, se procedi a
factorizar los resultados del instrumento definitivo, compuestos por 49 temes. Se
aplic el mismo criterio de la factorizacin de los resultados de la encuesta piloto:
extraer factores con autovalores superior a 1. Los resultados fueron 15 factores y 30
temes que se correlacionaron casi exclusivamente con un factor determinado. Este
230
procedimiento es conocido como anlisis factorial de segundo orden. Al respecto
Kerlinger (1988) expresa que ... un anlisis factorial de segundo orden... es un
mtodo para encontrar los factores detrs de los factores... [calculando]... las
correlaciones entre los factores y nuevamente... [analizar]... factorialmente... (p. 663)
A continuacin se presentan los 15 factores con la asignacin de su nombre,
considerando el elemento comn presente en los temes que conforman cada
factor.
Factores Comunes
Factor 1: Animadversin hacia la evaluacin de acuerdo al Currculo Bsico
Nacional
Item 28 Me angustia tener que planificar cmo evaluar a mis alumnos cuando
desarrollo una actividad en el aula.
Item 29 Evaluar las producciones de mis alumnos (escritas, orales, dramatizaciones,
producciones plsticas o musicales, investigaciones), es sumamente
aburrido.
Item 26 Es fastidioso tener que indagar aprendizajes de mis alumnos cada vez que
inicio un tema.
Item 25 Tener que evaluar todo el tiempo me fastidia.
Factor 2: Actitud hacia la evaluacin participativa
Item 36 Promuevo en el alumno evaluar su propio desempeo en las actividades
desarrolladas en el proceso enseanza aprendizaje.
Item 37 En la evaluacin de mis alumnos tomo en cuenta tanto sus aspectos
psicosociales como el progreso en su aprendizaje.
Item 49 Propicio entre mis alumnos intercambios orales (dilogos, entrevistas,
debates).
Factor 3: Actitud hacia las estrategias de evaluacin
Item 08 Explorar el nivel de disposiciones, sentimientos, valores, actitudes y
aptitudes antes de comenzar un tema, contribuye al aprendizaje del alumno.
231
Item 07 El proceso enseanzaaprendizaje debe fundamentarse en evaluaciones
permanentes sobre la actuacin del alumno.
Item 31 Disfruto evaluando integralmente a mis alumnos.
Factor 4: Actitud hacia la heteroevaluacin
Item 05 En la evaluacin de los aprendizajes deben participar, adems del docente,
los alumnos, padres y representantes y la comunidad educativa.
Item 04 El alumno al evaluar su propio desempeo, contribuye a mejorar su
proceso de aprendizaje.
Factor 5: No se descubre el elemento comn de los temes
Item 14 Al evaluar los aprendizajes no debo tomar en cuenta la opinin de los
alumnos.
Item 44 Cmo evaluar al alumno lo decido en el transcurso de las actividades que
ste desarrolla.
Item 13 Slo debe evaluarse al alumno al finalizar cada lapso.
Factor 6: Actitud hacia la evaluacin cualitativa
Item 39 Estoy ganado para trabajar con la evaluacin cualitativa.
Item 33 Me desagrada evaluar los intercambios orales entre mis alumnos (dilogos,
entrevistas, debates).
Item 22 Me encanta aplicar instrumentos de evaluacin cualitativa.
Factor 7: Actitud hacia las tcnicas de evaluacin sociomtricas
Item 09 Las tcnicas sociomtricas, tales como el sociograma, mapa de conceptos y
el portafolio, permiten obtener progresos importantes en los aprendizajes
del alumno.
Item 47 Oriento a mis alumnos cuando realizan tcnicas sociomtricas (sociograma,
mapas de conceptos, portafolios).
Factor 8: No se puede determinar el elemento comn, porque slo hay un tem.
Item 16 Es entretenido evaluar aplicando la tcnica de la observacin mediante el
uso de escalas de estimacin, listas de cotejo, registro anecdtico y diario
de clase.
Factor 9: No se puede determinar el elemento comn, porque slo hay un tem.
232
Item 11 Es innecesario utilizar intercambios orales entre los alumnos (dilogos,
entrevistas, debates), para evaluar su aprendizaje.
Factor 10: No se puede determinar el elemento comn, porque slo hay un tem.
Item 20 Me desagrada tener que aplicar escalas y cuestionarios de actitud para
explorar las actitudes de mis alumnos.
Factor 11: Actitud hacia la evaluacin cuantitativa
Item 06 Los mejores instrumentos para evaluar al alumno son las pruebas objetivas.
Item 42 Es usual que yo aplique pruebas objetivas (verdadero y falso,
completacin, apareamiento, seleccin), para evaluar los aprendizajes.
Factor 12: No se puede determinar el elemento comn, porque slo hay un tem.
Item 03 La evaluacin del alumno debe realizarse constantemente durante el
perodo que comprende el ao escolar.
Factor 13: Actitud hacia los tipos de evaluacin.
Item 35 Yo en la evaluacin de mis alumnos solamente tomo en cuenta los
conocimientos adquiridos.
Item 48 Slo evalo cuando termina la actividad.
Factor 14: No se puede determinar el elemento comn, porque slo hay un tem.
Item 01 El docente debe evaluar slo en aquellos momentos del proceso
enseanza aprendizaje que considere relevante.
Factor 15: No se puede determinar el elemento comn, porque slo hay un tem.
Item 40 Me cuesta evaluar cualitativamente a mis alumnos.
En la medida que se obtiene un nuevo factor, la tendencia es a disminuir los
temes que lo constituyen, explicndose este hecho; porque el siguiente factor
generado, aporta una cantidad menor de varianza explicada. Tambin se observa en
algunos factores que el elemento comn a los temes correlacionados con el factor, no
emergen claramente, impidiendo su reconocimiento, siendo necesario realizar un
nuevo anlisis factorial hasta que la estructura factorial completa aparezca con
claridad. En este caso se requiere volver aplicar el instrumento con los temes
seleccionados del primer anlisis factorial. La estructura factorial que se realiza tiene
233
el propsito de presentar una aproximacin a una nueva operacionalizacin de la
variable en estudio tomando en cuenta el anlisis factorial.
Se observa en el cuadro 8 que los factores determinados (15) explican la
varianza total de los temes en un 67,16 %, porcentaje considerado favorable para
aplicar anlisis factorial de segundo orden en esta investigacin. El nmero de tems
aceptados tomando en cuenta el anlisis factorial de segundo orden, es 30 tems
Cuadro 8
Varianza total explicada
Componente
Suma de las saturaciones al
cuadrado de la rotacin
% de la varianza % acumulado
1 8,643 8,643
2 5,909 14,552
3 5,188 19,740
4 5,048 24,788
5 4,860 29,648
6 4,596 34,244
7 4,298 38,542
8 4,162 42,704
9 3,949 46,653
10 3,791 50,444
11 3,747 54,191
12 3,552 57,743
13 3,531 61,274
14 2,978 64,252
15 2,911 67,163
Nota: Cuadro elaborado con los datos de la encuesta definitiva Actidoc. I y clculos
realizados a travs del programa estadstico computarizado SPSS.
Con el propsito de continuar la operacionalizacin de la variable a travs de
anlisis factorial de segundo orden, se fijaron el nmero de factores en 8 (no
considerando valores mayores a 1), acumulando una varianza explicada del 55,61 %,
porcentaje que an se considera viable para aplicar el anlisis factorial bajo este
234
criterio. El nmero de temes aceptados usando el mismo criterio de los casos
anteriores, es de 21 temes.
A continuacin se identifican los factores y los temes que los constituyen:
Factores Comunes
Factor 1: Animadversin hacia la evaluacin de acuerdo al Currculo Bsico
Nacional
Item 23 Me desagrada tener que revisar constantemente el aprendizaje de mis
alumnos.
Item 26 Es fastidioso indagar los aprendizajes de mis alumnos cada vez que inicio
un tema.
Item 28 Me angustia tener que planificar cmo evaluar a mis alumnos cuando debo
desarrollar alguna actividad en el aula.
Item 29 Evaluar las producciones de mis alumnos (escrita, orales, dramatizaciones,
producciones plsticas o musicales, investigaciones), es sumamente
aburrido.
Factor 2: Actitud hacia la evaluacin explorativa
Item 08 Explorar el nivel de disposiciones, sentimientos, valores, actitudes y
aptitudes antes de comenzar un tema contribuye al aprendizaje del alumno.
Item 10 Las producciones del alumno (escrita, orales, dramatizaciones,
producciones plsticas o musicales, investigaciones), permiten evaluar
eficientemente el aprendizaje adquirido.
Item 20 Me desagrada tener que aplicar escalas y cuestionarios para explorar las
actitudes de mis alumnos.
Item 38 Indago sobre el nivel de los aprendizajes de mis alumnos antes de iniciar
un tema o actividad.
Factor 3: Actitud hacia la evaluacin cualitativa
Item 16 Es entretenido evaluar aplicando la tcnica de observacin mediante el uso
de escalas de estimacin, lista de cotejo, registro anecdtico y diario de
clase.
Item 22 Me encanta aplicar instrumentos de evaluacin cualitativa.
235
Item 33 Me agrada evaluar los intercambios orales entre mis alumnos (dilogos,
entrevistas, debates).
Item 39 Estoy ganado para trabajar con la evaluacin cualitativa.
Factor 4: Actitud hacia la heteroevaluacin
Item 05 En la evaluacin de los aprendizajes deben participar, adems del docente,
los alumnos, padres y representantes y la comunidad educativa.
Item 21 Me gusta la evaluacin recproca entre padres y representantes, alumnos y
docentes para evaluar los aprendizajes de mis alumnos.
Factor 5: No se puede determinar el elemento comn, porque slo hay un tem.
Item 13 Slo debe evaluarse el alumno al finalizar cada lapso.
Factor 6: No se puede determinar el elemento comn, porque slo hay un tem.
Item 35 Yo en la evaluacin de mis alumnos solamente tomo en cuenta los
conocimientos adquiridos.
Factor 7: Actitud hacia la evaluacin cuantitativa
Item 06 Los mejores instrumentos para evaluar al alumno son las pruebas objetivas.
Item 42 Es usual que yo aplique pruebas objetivas (verdadero y falso,
completacin, pareo, seleccin), para evaluar los aprendizajes.
Factor 8: No se descubre el elemento comn entre los temes
Item 01 El docente debe evaluar slo en aquellos momentos del proceso
enseanza-aprendizaje que considera relevantes.
Item 41 Asigno a cada alumno evaluar la actuacin del resto de sus compaeros en
las actividades desarrolladas durante el ao escolar.
Item 44 Cmo evaluar al alumno lo decido en el transcurso de las actividades que
ste desarrolla.
La aplicacin del anlisis factorial de segundo orden, origina una nueva
operacionalizacin de la variable, la cual no se fundamenta, como en la
operacionalizacin inicial, en dimensiones e indicadores de la variable; sino en
factores constituidos por temes interrelacionados entre s. Con esta nueva concepcin
de medir la actitud, se genera validez de constructo, porque aquellos temes que
miden varios factores (se correlacionan con ms de un factor) y los que no miden
236
ninguno (no se correlacionan con ningn factor) se excluyen del instrumento; pues
los temes para que aporten validez de constructo slo deben medir un aspecto
(factor) de la variable en estudio.
Anlisis Factorial Versus? Confiabilidad
Est comprobada que una reduccin sustancial de los tem de un instrumento,
como es el caso de Actidoc I, disminuye la confiabilidad del instrumento, es por esta
razn que cuando se est en presencia de un caso, donde la confiabilidad es afectada
despus de reducir temes, como consecuencia de la aplicacin del anlisis factorial,
surge el dilema: validez versus confiabilidad, y la pregunta: Vale la pena generar
validez en detrimento de la confiabilidad?. Esta pregunta se debe responder con
cautela, porque est demostrado que un instrumento vlido, es tambin confiable;
(aunque lo contrario no es cierto, es decir, un instrumento confiable no es
necesariamente vlido), esto significa que si la confiabilidad es afectada hasta el
punto de considerar al instrumento poco confiable, se debe tomar con cautela el
anlisis factorial como tcnica generadora de validez. Es necesario revisar y analizar
dnde est el problema. Con estos comentarios, se desea expresar que los modelos
matemticos y estadsticos en Ciencias Sociales no se pueden aplicar
irreflexivamente, sino que los mismo deben considerarse dentro del contexto donde
interactan las variables en estudio.
En el caso de Actidoc I, la confiabilidad antes de aplicar el anlisis de discriminacin
de los temes, se sito en 0,9465; al excluir los temes que no discriminaron, subi a
0,9554; despus de excluir aquellos temes que afectaban la confiabilidad del
instrumento, sube al 0,9556; al aplicar el anlisis factorial, desciende a 0,9045,
disminucin no significativa, a pesar de reducir los temes a la mitad ( de 98 temes,
cantidad antes de aplicar el anlisis factorial, a 49 temes). A este nivel el
instrumento an se mantienen muy confiable, es decir, en el rango de 0.81 a 1.
Despus de aplicar el anlisis factorial de segundo orden (anlisis que se realiza
con los datos obtenidos de la aplicacin del instrumento con 49 temes y 190
237
docentes), el instrumento queda constituido por 30 temes, el cual presenta una
confiabilidad de 0,8207; siendo a este nivel la confiabilidad muy alta; porque an se
sita en el rango de 0,81 y 1. Considerando que la confiabilidad se ubica muy cerca
del el lmite inferior del rango, es aconsejable no continuar aplicando anlisis
factorial, porque en la siguiente aplicacin es probable que la confiabilidad descienda
de muy confiable a confiable y es recomendable que los instrumentos; cuyo propsito
sea medir actitudes, tengan una confiabilidad muy alta. Despus de aplicar el anlisis
factorial dos veces a este instrumento se debe aceptar esta versin, constituida por 30
temes, como la definitiva.
A Manera de Conclusin
1. La aplicacin del anlisis factorial a los datos obtenidos en la versin
preliminar del instrumento, permiti identificar los tem que miden un solo factor,
ms de uno y ninguno. Tomando en cuenta los resultados se aceptaron para
conformar la versin definitiva del instrumento solamente aquellos temes que
midieron a un solo factor. Con este procedimiento se logr excluir de la versin
inicial la cantidad de 48 tem, que representa la mitad de 98 tem, a los cuales se
aplic el anlisis factorial. Al aplicar el anlisis factorial de segundo orden, se
logra reducir los temes de 49 a 30, recomendndose esta versin como la
definitiva.
2. Al aplicar el anlisis factorial de segundo orden, se produce una mejor
identificacin de los factores en relacin a los resultados obtenidos de la
aplicacin inicial, auque se requiere una nueva aplicacin del anlisis factorial
para obtener la identificacin de aquellos factores an sin la claridad evidente.
3. Los resultados de aplicacin del anlisis factorial de segundo orden,
aproximan la variable en estudio a una nueva Operacionalizacin, en funcin de
la identificacin de los factores obtenidos. Esta nueva Operacionalizacin puede
mejorar si se descubre el elemento comn que identifica a los factores an sin
emerger claramente. Como se mencion en la conclusin anterior, la
238
identificacin plena de los factores, puede surgir de la reaplicacin del anlisis
factorial hasta lograr plena identificacin de todos ellos.
4. La reduccin tan sustancial de los temes del instrumento, no afecta
confiabilidad. Esta se mantienen muy alta antes y despus de la exclusin de los
temes, lo que permiti generar validez de constructo, sin sacrificar la
confiabilidad.
Ejercicio Propuesto
Usando el programa SPSS como herramienta tecnolgica, aplique el anlisis
factorial a los resultados de Actidoc. I. Fije el nmero de factores en 4 y elimine
valores en los coeficientes inferiores a 0,10. El anlisis factorial se realizar con los
temes que discriminan y aportan confiabilidad al instrumento. Se anexa en disquete
matriz original (120 temes y 240 sujetos) de Actidoc. I
239
Referencias
Cohen, R. y Swerdlik. (1998). Pruebas y evaluacin psicolgica (introduccin a las
pruebas y la medicin). Cuarta edicin. Mxico: Mc Graw-Hill.
Kerlinger, F. (1.988). Investigacin del comportamiento (segunda edicin). Mxico:
Mc Graw Hill
Nunnally, J. Y Bernstein, I. (1995). Teora psicomtrica. Tercera edicin. Mxico:
Mc Graw-Hill.
Rodrigues, A. (1990). Cambio de Actitudes. En J. Whittaker (Comp.), La psicologa
social en el mundo de hoy. (p.p. 265-284). Mxico: Trillas.
Ruz Bolvar, C. (1990). Desarrollo de una escala de actitud hacia la Innovacin
Educativa. Trabajo de Ascenso para optar a la categora de profesor agregado,
Universidad Pedaggica Experimental Libertador, Vicerrectorado de
Investigacin y Postgrado, Caracas.
Stahlberg, D. Y Frey, D. (1990). Actitudes I: Estructura, Medida y Funciones. En M.
Hewstone, W. Stroede, J.P. Codal y G.M. Stephenson (Comp.), Introduccin a la
psicologa social (una perspectiva europea). (p.p. 149-197). Barcelona Espaa:
Editorial Ariel.
Thurstone, L. (1928). Las actitudes pueden medirse. En C. Wainerman (Comp.),
Escalas de medicin en Ciencias Sociales. (p.p. 261-289). Buenos Aires: Nueva
Visin.
Triandis, H. (1974). Actitudes y cambio de actitudes. Barcelona - Espaa: Toray.
Visuata, B. (1998). Anlisis estadstico con SPSS para Windows (Volumen II:
Estadstica Multivariante). Madrid: Mc Graw-Hill.
Lecturas Sugeridas
Cohen, R y Swerdlik. M. (2.001). Pruebas y evaluacin psicolgicas, Mxico, Mc.
Graw Hill. Se recomienda el captulo 6: Validaz. Seccin Validez de constructo.
Subpunto: Anlisis factorial.
Kerlinger, F. (1.988). Investigacin del comportamiento (segunda edicin). Mxico:
Mc Graw Hill. Se recomienda el captulo 25: Anlisis factorial. Su contenido es el
240
siguiente: Fundamentos, Extraccin y rotacin de factores, calificaciones
factoriales y anlisis factorial de segundo orden, ejemplos de investigacin,
anlisis factorial e investigacin cientfica, apndice.
Nunnally, J. y Bernstein, I. (1.995). Teora psicomtrica (segunda edicin). Mxico:
Mc Graw Hill. Se recomienda el captulo 12: Anlisis factorial exploratorio II.
Seccin: una expectativa del anlisis factorial exploratorio. Subseccin:
Consideraciones prcticas del anlisis factorial.
Pardo, A. (2.000). Gua para el anlisis de datos Madrid: Mc Graw Hill. Se
recomienda el captulo 20: Anlisis Facorial: El procedimiento Anlisis
Factorial. Este captulo explica en detalle todas las opciones del anlisis factorial
que contiene el programa SPSS.
Visuata, B. (1998). Anlisis estadstico con SPSS para Windows (Volumen II:
Estadstica Multivariante). Madrid: Mc Graw-Hill. Se recomienda el captulo 6:
Anlisis factorial. Su contenido es el siguiente: Aspectos introductorio,
descriptivos y matriz de correlaciones, extraccin de factores, rotacin y
puntuaciones factoriales. Este captulo presenta en forma muy didctica los pasos
necesarios para aplicar el anlisis factorial, usando el programa SPSS como
herramienta tecnlogica.
Yela, M. (1.997). La tcnica del anlisis factorial: Un mtodo de investigacin en
psicologa y pedagoga. Madrid: Biblioteca Nueva. Para quienes desea conocer
el procedimiento manual de esta tcnica, se recomienda este libro; cuyo
contenido es el siguiente: Capitulo I: Los conceptos fundamentales; captulo II:
Las ecuaciones fundamentales; captulo III: Un ejemplo sencillo; captulo IV: La
factorizacin. Lgica del mtodo centroide; captulo V: La factorizacin.
Aplicacin del mtodo centroide; captulo VI: La estructura simple; captulo VII:
La rotacin. Un ejemplo de dos dimensiones; capitulo VIII: La rotacin. Un
ejemplo centroide; y captulo IX: La rotacin. Un ejemplo de tres dimensiones.
...El libro est ... destinado a estudiantes universitarios que no poseen una
preparacin matemtica especial... (Yela, M, p.20)
241
CAPITULO XIII
VALIDACIN DE INVESTIGACIONES CUALITATIVAS
Objetivo
El estudiante se introducir en el proceso requerido para obtener confiabilidad y
validez en investigaciones cualitativas
Confiabilidad
Confiabilidad Interna y Externa
La confiabilidad en investigaciones cualitativas tiene la misma acepcin que la
aplicada en los instrumentos cuantitativos, es decir, est asociada a la estabilidad,
equivalencia y homogeneidad de los datos. Su diferencia se fundamenta en el
planteamiento y la forma como ambos paradigmas abordan la realidad.
A continuacin se presentan las opiniones de tres autores (destacados en temas
cualitativos) sobre confiabilidad. Al primero en referirnos es Martnez (1.996), quien
expresa lo siguiente:
Una investigacin con buena confiabilidad es aqulla que es estable,
segura, congruente... La confiabilidad tiene dos caras, una externa y otra
interna: hay confiabilidad externa cuando investigadores independientes,
al estudiar una realidad en tiempo y situaciones diferentes llegan a los
mismos resultados; hay confiabilidad interna cuando varios observadores
(investigadores que realizan el estudio), al estudiar la misma realidad,
concuerdan en sus conclusiones. (p.p. 204 y 205).
Goetz y LeCompte (1.988) expresan sobre la confiabilidad de los estudios
etnogrficos, lo siguiente:
...lo que se pretende, en efecto, es coincidir en la descripcin y
composicin de los acontecimientos y no en la determinacin de la
frecuencia... Un escenario puede admitir slo a uno o unos pocos
observadores. Sin una corroboracin aportada por otros, la investigacin
realizada puede ser acusada de idiosincrsica y carente de un registro
242
cuidadoso y sistemtico de los fenmenos para proteger sus estudios de
las amenazas a su fiabilidad interna, los etngrafos suelen utilizar una de
estas cinco estrategias: Descriptores de bajo nivel inferencial, varios
investigadores, participantes ayudantes, revisin por otros investigadores
y datos registrados automticamente. (p. 221).
Estrategias para Asegurar Confiabilidad
A continuacin se explica cada una de las cinco estrategias para asegurar la
confiabilidad de los estudios etnogrficos:
(a) Descriptores de bajo nivel inferencial: se refiere a la transcripcin exacta
(palabra por palabra) de las entrevistas con los informantes o sujetos del estudio,
(b) varios investigadores: a pesar de que Goetz y LeCompte reconoce la dificultad de
realizar una investigacin con varios investigadores, recomienda esta estrategia como
garanta de confiabilidad del estudio, (c) participante ayudante: involucrar en la
investigacin a ayudantes (pueden ser estudiantes) permite comprobar que lo
percibido por el investigador es real, (d) Revisin de otros investigadores: esto se
puede lograr con la realizacin de investigaciones simultneas en escenarios
diferentes o publicando las conclusiones de la investigacin en revistas especializadas
para que otros investigadores la evalen, y (e) Datos registrados automticamente: se
refiere a la conveniencia de grabar las entrevistas y observaciones realizadas. Con
este propsito el investigador debe disponer de grabadores de audio y video, cmara
fotogrfica, etc.
Confiabilidad Quijotesca, Diacrnica y sincrnica
Kurt y Miller, citado por Prez Serrano (1.998), establece una clasificacin
diferente, a la de confiabilidad interna y externa presentada por Martnez y Goetz y
LeCompte. A continuacin se presenta la mencionada clasificacin:
(a) Fiabilidad quijotesca: se refiere a las circunstancias en las que un
nico mtodo de observacin da lugar de forma continuada a una medida
invariable..., (b) Fiabilidad diacrnica: consiste en la estabilidad de una
observacin a travs del tiempo que puede comprobarse al repetir las
medidas, pero teniendo en cuenta que slo tendr utilidad en aspectos
243
inalterables de un determinado perodo, (c) Fiabilidad sincrnica: implica
la semejanza de la observacin dentro del mismo perodo de tiempo.
Raramente implica observaciones idnticas, sino el hecho de que sean
consistentes respecto a rasgos relevantes. (p.p. 77 y 78).
La diferencia entre ellos es que la fiabilidad (o confiabilidad) quijotesca implica
la estabilidad de los datos en el tiempo; la diacrnica, la estabilidad de la tcnica (o
mtodo) en el tiempo; y la confiabilidad sincrnica, implica que las observaciones
realizadas en un determinado perodo de tiempo (en el mismo perodo de tiempo),
deben tener resultados similares.
Validez
Validez Interna y Externa
Para Martnez (1.996):
...Una investigacin tiene un alto nivel de validez si al observar, medir o
apreciar una realidad, se observa, mide o aprecia esa realidad y no otra
cosa. Este hecho constituye la validez interna. Hay otro criterio de
validez, validez externa, que consiste en averiguar hasta qu punto las
conclusiones de un estudio son aplicables a grupos similares. (P. 206.)
La triangulacin, saturacin y la negociacin como forma de validez
Prez Serrano (1.998) identifica tres tipos de validez:
1. Triangulacin: Implica reunir una variedad de datos y mtodos para
referirnos al mismo tema o problema... Implica tambin que los datos se recojan
desde un punto de vista distinto y realizar comparaciones mltiples de un fenmeno
nico, de un grupo y en varios momentos- utilizando perspectivas diversas y
mltiples procedimientos. (p. 81).
2. Saturacin: ...consiste en reunir las pruebas y evidencias suficientes para
garantizar la credibilidad de la investigacin. Se consigue revisando el proceso o
repitiendo de nuevo el estudio para comprobar si los resultados se mantienen. (p.
84).
244
3. Validez respondente o negociacin: consiste en validar los resultados e
informes de la investigacin bsicamente mediante contraste de los puntos o
resultados obtenidos por el investigador con los de otros compaeros, informadores,
observadores, as como con las personas implicadas. (p.p. 84 y 85).
Amenazas a la Validez Interna
Goetz y LeCompte (1.988) sealan algunas amenazas contra la validez interna,
las cuales los investigadores deben enfrentarlas y evitarlas. Estas amenazas tambin
se plantean en la investigacin experimental, pero en forma diferente. A continuacin
se explican:
1. Historia y maduracin: A diferencia de la investigacin experimental que
trata de establecer controles en el ambiente, la investigacin cualitativa asume
ambientes naturales, y analiza los datos que cambian y aquellos estables en el tiempo.
El investigador debe tener cuidado con aquellos datos donde la maduracin
(transformacin en el tiempo) tiene efectos que pudieran afectar los resultados de la
investigacin.
2. Influencia del observador: cuando el informante o personal del grupo en
estudio se sabe observado, es posible que oculten su verdadero comportamiento. Se
debe para evitar obtener informacin falsa, contrastar los datos entre varios
informantes o personas integrantes del grupo en estudio.
3. Seleccin y regresin: en los estudios cualitativos, se evita que los sujetos de
investigacin sean controlados para garantizar que los cambios se deban al
tratamiento. Los sujetos de estudio se analizan tal cual como se comportan en su
ambiente natural.
4. Mortalidad: En la investigacin cualitativa, a diferencia de la investigacin
experimental que puede sustituir a los sujetos que desaparecen de la investigacin, la
mortalidad de sujetos en la investigacin cualitativa no se reemplaza, sino que se
estudian sus efectos en el problema o fenmeno estudiado.
245
5. Conclusiones espurias: cuando se realiza una investigacin, incluso es vlido
para la investigacin experimental, el investigador debe ser sumamente cuidadoso y
analtico cuando elabora las conclusiones del estudio, porque en esta fase tan
importante de un trabajo, muchos investigadores establecen relaciones y conclusiones
equivocadas.
Factores que Afectan la Validez Externa
1. Efectos de seleccin: afecta la validez cuando los investigadores seleccionan
grupos, a los cuales no se puede comparar con el grupo en estudio.
2. Efectos escenario: cuando se trata de comparar un constructo en otros
escenarios que no permite la comparacin.
3. Efectos de la historia: cuando se pretende comparar constructos en pocas
histricas diferentes, pero sin descubrir que es una experiencia histrica nica y muy
circunscrita a un determinado perodo histrico.
4. Efectos de constructo: cuando se crea un constructo muy ajustado a un grupo
especfico, lo cual imposibilita realizar comparaciones intergrupal.
La validacin de instrumentos de medicin tiene en comn con la validacin de
investigaciones cualitativas, el hecho de que la confiabilidad y validez en ambos
casos se definen en forma similar; pero su conceptualizacin y orientacin es
diferente. Mientras que los instrumentos de medicin soportan sus procedimientos en
el llamado paradigma cientfico o paradigma experimental, fundamentado en la
objetividad de las investigaciones y en la ley de las probabilidades, la validacin de
investigaciones cualitativas se apoyan en el paradigma naturalista y holstica, donde
la realidad se analiza, tal como se presenta: intacta. Esta concepcin del mundo tan
diferente, origina que la validacin de instrumentos cualitativos difiera en cuanto a su
procedimiento. En este tipo de investigacin; la validacin se fundamenta, ms que
en anlisis numricos, en patrones descriptivos y observacionales, donde la
diversidad de instrumentos y opiniones de diferentes observadores e investigadores,
determina la confiabilidad y validez de las investigaciones. A diferencia de las
246
investigaciones insertas dentro del paradigma cientfico, donde se valida es el
instrumento; en la investigacin naturalista y holstica, se valida es la investigacin
como un todo, apoyndose en la descripcin e interpretacin de los datos, ms que en
el anlisis numrico de los mismos.
Ejercicios propuestos
1. Establezca las diferencias entre la confiabilidad de los estudios cuantitativos
y cualitativos.
2. Establezca las diferencias entre la validez de los estudios cuantitativos y
cualitativos.
247
Referencias
Goetz, J. P., Y LeCompte, M.D. (1.988). Etnografa y diseo cualitativo en
investigacin educativa. Madrid: Morata.
Martnez, M. (1.996). Comportamiento humano (Segunda Edicin). Mxico: Trillas.
Prez Serrano, G. (1.998). Investigacin cualitativa: Retos e Interrogantes II:
Tcnicas y anlisis de datos (Segunda edicin). Madrid: La Muralla.
Lecturas Sugeridas
Goetz, J. P., Y LeCompte, M.D. (1.988). Etnografa y diseo cualitativo en investigacin
educativa. Madrid: Morata. Se recomienda el Captulo VII: Evaluacin del diseo
etnogrfico. Se recomiendan los apartados: Exigencias de la fiabilidad etnogrfica,
fiabilidad externa y fiabilidad interna.
Martnez, M. (1.996). Comportamiento humano (Segunda Edicin). Mxico: Trillas. Se
recomienda el captulo 6: Postulados para una metodologa estructural. Postulados
18, 19 y 21. Captulo 10: El mtodo etnogrfico. Seccin: El proceso de
investigacin. Subseccin: Confiabilidad y validez : El Captulo 12: El Mtodo de la
Investigacin-Accin. Seccin: Validez y confiabilidad..
Prez Serrano, G. (1.998). Investigacin cualitativa: Retos e Interrogantes II: Tcnicas y
anlisis de datos. (Segunda edicin). Madrid: La Muralla. Captulo II: El problema
de la fiabilidad y la validez. Se recomienda leer el captulo completo cuyo contenido
es el siguiente: Introduccin, la fiabilidad y validez en los estudios cuantitativos,
Fiabilidad y validez en los estudios cualitativos, Perspectivas para el anlisis de la
fiabilidad y validez en la investigacin cualitativa.
248
ANEXOS
249
ANEXO A
ndice de dificultad de los temes a travs del programa excel.
Pasos:
1. Abrir el programa de excel
2. Transcribir la Base original de datos en una hoja nueva (ver tabla 1)
3. Recuerde grabar el archivo en su disquete 3 o en el disco duro del computador
4. Copie y pegue en una hoja nueva la Base de Datos.
5. Sume los totales de los temes.
Escriba la frmula de la suma debajo de la celda que contiene el ltimo sujeto y el primero
tem (ver tabla 2). La frmula de la suma es =suma (primera celda que deseamos sumar:
ltima celda que deseamos sumar). En nuestro ejemplo (tabla 2) la frmula es
=suma(B3:B14). Al terminar de escribir la frmula presione enter. Luego copie y pegue la
frmula para el restos de los temes.
6. Debajo de la celda del total y el primer tem escriba la frmula del ndice de dificultad
=(total del primer tem nmero de persona que respondieron correctamente el item/Nmero
de sujetos que respondieron el item)/*100. Al terminar de escribir la frmula presione enter.
En el ejemplo ilustrado la frmula es =(B15/12)*100. Luego copie y pegue la frmula para el
resto de los temes.
7. Calcule el ndice de dificultad promedio. Escriba la frmula en la ltima lnea en blanco
(ver tabla 2). La frmula es =promedio(ndice de dificultad del primer tem:ndice de
dificultad del ltimo tem). En nuestro ejemplo la frmula es =promedio (B16:G16).
8. Recuerde grabar los cambios introducidos en su disquete de 3 o en disco duro del
computador
9. Interprete los resultados, tomando en cuenta la escala siguiente.
81 a 100 Muy fcil
61 a 80 Fcil
41 a 60 Moderadamente fcil
21 a 40 Difcil
01 a 20 Muy difcil
COPIAR Y PEGAR FRMULAS
-Seleccione la celda que desea copiar y y presione el botn derecho del mouse
(ratn) y oprima copiar
-Seleccione (sombree) las celdas donde desea pegar la frmula y presione el
botn derecho del mouse (ratn) y oprima pegar
CENTRAR TTULOS
Clic en men herramientas---clic en personalizar---clic en comandos---clic en formato---clic
en combinar y centrararrastre con el mouse (ratn) el icono de combinar y centrar hacia las
barras de herramientasseleccione (sombree) el espacio donde desea escribir y centrar el
ttulo---clic en el icono de combinar y centrar.
250
A B C D E F G
1 TABLA 1. MATRIZ ORIGINAL DE DISCRIMINACIN DE DATOS DICOTMICOS
2 item1 item2 item3 item4 item5 item6
3 0 0 1 0 1 1
4 1 1 1 1 1 1
5 1 0 0 0 0 0
6 0 1 1 1 1 1
7 1 0 1 1 0 1
8 0 0 0 1 1 1
9 1 1 1 0 0 0
10 0 0 0 1 1 1
11 1 1 0 0 0 0
12 0 0 1 1 0 0
13 0 0 0 0 1 1
14 1 1 1 1 1 1
A B C D E F G
1 TABLA 2. INDICE DE DIFICULTAD DE LOS ITEMES
2 item1 item2 item3 item4 item5 item6
3 0 0 1 0 1 1
4 1 1 1 1 1 1
5 1 0 0 0 0 0
6 0 1 1 1 1 1
7 1 0 1 1 0 1
8 0 0 0 1 1 1
9 1 1 1 0 0 0
10 0 0 0 1 1 1
11 1 1 0 0 0 0
12 0 0 1 1 0 0
13 0 0 0 0 1 1
14 1 1 1 1 1 1
15 TOTAL 6 5 7 7 7 8
16 INDICE DIF./ITEM 50.00 41.67 58.33 58.33 58.33 66.67
17 INDICE DIF./PROMEDIO 55.56
251
ANEXO B
Anlisis de discriminacin de datos dicotmicos a travs del programa Excel.
PASOS
1. Abrir el programa Excel
2. Transcribir la Base original de Datos en una hoja nueva (Ver tabla 1)
3. Recuerde grabar el archivo en su disquete 3
4. Copie en una hoja nueva la base da dato original.
5. Calcule los totales de los sujetos:
Procedimientos:
Etiquete la ltima columna en blanco como : totales, y en la celda correspondiente al
sujeto 1, escriba la frmula de la suma, = suma (primera celda que deseamos sumar:
ultima celda que deseamos sumar). En este caso particular la frmula ser =suma
(B3:G3). Al terminar de introducir la frmula, presione Enter. Luego copie y pegue
esta frmula para el resto de los sujetos (ver tabla 2).
6. Ordene los totales en orden decreciente (de mayor a menor)
Rutina:
Clic en el men datos
Clic en ordenar
Clic ordenar por totales
Clic en descendente
Clic en aceptar
Observar los datos iguales a los que contiene la tabla 3, ordenados por el total y en
forma descendente.
7. Conforme los grupos superior e inferior, tomando como referencia el 27% de los
sujetos en muestra grandes y el 34% de los sujetos en muestra pequeas (ver tabla 4).
En nuestro caso el tamao de ambos grupos ser cuatro (4) sujetos con los puntajes
ms altos (grupos superior) y cuatro (4) sujetos con los puntajes ms bajo (grupo
inferior). Para determinar el tamao de los grupos ver la seccin Criterios para
determinar el tamao de los grupos, captulo IX: Anlisis de los temes.
Rutina:
Suprimir los sujetos que tienen puntuaciones intermedios (en nuestro caso los sujetos
intermedios estn comprendidos entre el sujeto 5 y el sujeto 10). Para realizar este
procedimiento seleccione (sombree) los sujetos a borrar y haga Clic en el men
edicin Clic en borrar.
-Calcule el total tanto del grupo superior como del inferior (ver tabla 4). Para
calcular el total del grupo superior, escriba la frmula de la suma debajo de la lnea
del ltimo sujeto del grupo superior y presione Enter. Copie y pegue la frmula para
el resto de los temes. Proceda de la misma forma para calcular el total de los temes
del grupo inferior (ver tabla 4). La frmula suma para el ejemplo ilustrado y
correspondiente al grupo superior es =SUMA(B3:B6). La formula para el grupo
252
inferior es =SUMA(B11:B14). Al calcular los totales de ambos grupos se puede
aplicar la frmula que determina el ndice de discriminacin de los temes.
8. Debajo de la lnea que contiene los totales del grupo inferior (debajo de la celda
que contiene los totales del primer tem) escriba la frmula para calcular el ndice de
discriminacin (ver tabla 4). La frmula es la siguiente: (total GS-total GI)/tamao de
uno de los grupos. En el ejemplo ilustrado la frmula es la siguiente =(B7-B15)/4. Al
escribirla oprimir Enter. Luego copie y pegue la frmula para el resto de los temes.
9. Recuerde grabar en su disquete 3 , los cambios introducidos
10. Interprete los resultados, tomando en cuenta la siguiente escala:
0.81 - 1 Muy alta
0.61 - 0.80 Alta
0.41 - 0.60 Moderada
0..21 - 0.40 Baja
0.00 - 0.20 Muy baja
Negativa Extremadamente baja
Copiar y pegar frmulas
-Seleccione la celda que contiene la frmula que desea copiar oprima copiar
seleccione (sombree) las celdas donde desea pegarr la frmula presione el botn
derecha del mouse (ratn) y haga clic en pegar
CENTRAR TTULOS
Clic en men herramientas---clic en personalizar---clic en comandos---clic en
formato---clic en combinar y centrararrastre con el mouse (ratn) el icono de
combinar y centrar hacia las barras de herramientasseleccione (sombree) el
espacio donde desea escribir y centrar el ttulo---clic en el icono de combinar y
centrar.
253
A B C D E F G
1 TABLA 1. MATRIZ ORIGINAL DE DISCRIMINACIN DE DATOS DICOTMICOS
2 item1 item2 item3 item4 item5 item6
3 0 0 1 0 1 1
4 1 1 1 1 1 1
5 1 0 0 0 0 0
6 0 1 1 1 1 1
7 1 0 1 1 0 1
8 0 0 0 1 1 1
9 1 1 1 0 0 0
10 0 0 0 1 1 1
11 1 1 0 0 0 0
12 0 0 1 1 0 0
13 0 0 0 0 1 1
14 1 1 1 1 1 1
A B C D E R G H
1
TABLA 2. CLCULOS DE TOTALES
2 item1 item2 item3 item4 item5 item6 TOTAL
3 0 0 1 0 1 1 3
4 1 1 1 1 1 1 6
5 1 0 0 0 0 0 1
6 0 1 1 1 1 1 5
7 1 0 1 1 0 1 4
8 0 0 0 1 1 1 3
9 1 1 1 0 0 0 3
10 0 0 0 1 1 1 3
11 1 1 0 0 0 0 2
12 0 0 1 1 0 0 2
13 0 0 0 0 1 1 2
14 1 1 1 1 1 1 6
254
A B C D E F G
1 TABLA 3. ORDENACIN DE TOTALES
2 item1 item2 item3 item4 item5 item6
3 1 1 1 1 1 1
4 1 1 1 1 1 1
5 0 1 1 1 1 1
6 1 0 1 1 0 1
7 0 0 1 0 1 1
8 0 0 0 1 1 1
9 1 1 1 0 0 0
10 0 0 0 1 1 1
11 1 1 0 0 0 0
12 0 0 1 1 0 0
13 0 0 0 0 1 1
14 1 0 0 0 0 0
A B C D E F G H
1 TABLA 4. CONFORMACIN DE LOS GRUPOS Y RESULTADOS DEL ANLISIS DE DISCRIMINACIN
2 item1 item2 item3 item4 item5 item6 TOTAL
3 1 1 1 1 1 1 6
4 1 1 1 1 1 1 6
5 0 1 1 1 1 1 5
6 1 0 1 1 0 1 4
7 total GS 3 3 4 4 3 4
8
9
10
11 1 1 0 0 0 0 2
12 0 0 1 1 0 0 2
13 0 0 0 0 1 1 2
14 1 0 0 0 0 0 1
15 TOTAL GI 2 1 1 1 1 1
16 ID 0.25 0.50 0.75 0.75 0.50 0.75
255
ANEXO C
ANLISIS DE DISCRIMINACIN DE INSTRUMENTOS CON DATOS MULTICTOMOS
(MAS DE DOS ALTERNATIVA DE RESPUESTAS) A TRAVS DEL PROGRAMA SPSS EN
AMBIENTE WINDOWS
RUTINA:
Abrir el archivo que contiene la base de datos en SPSS
FASE 1
CMO CALCULAR LOS TOTALES DE LOS SUJETOS?
Para calcular los totales de los sujetos presentamos dos procedimientos, el primero de ellos, es a travs
del Men Transformar. Este procedimiento es fcil de desarrollar; pero es muy laboriosa cuando el
nmero de temes es elevado. Hay otro procedimiento siguiendo un artificio informtico que consiste
en transponer la matriz de datos, procedimiento que presenta cierto nivel de dificultad para quienes no
poseen conocimientos bsicos de computacin; pero es sumamente rpido para aquellas personas con
cierta destreza informtica. Este segundo procedimiento no es recomendable si el usuario posee un
adiestramiento insuficiente en computacin.
Para el clculo de los totales se deben seleccionar uno de los dos procedimientos:
I. CLCULO DE LOS TOTALES A TRAVS DEL MEN TRANSFORMAR
1. Clic en el Men Transformar
2. Clic en Calcular...
3. Escribir total en la Variable de destino
4. Transferir los tem desde tipo y etiqueta hacia Expresin numrica. Los datos deben
presentarse en Expresin numrica de la siguiente manera:
Opcin 1:
Suma(item001,item002,item003,.........................................................,itemN)
Opcin 2:
Item001+item002+item003++itemN
5. Al transferir todos los tem al recuadro Expresin numrica, clic en aceptar.
II. CLCULO DE LOS TOTALES TRANSPONIENDO LA MATRIZ DE DATOS
1. Clic en el men Datos
2. Clic en Transponer
256
3. En el cuadro que aparece se transfieren todos los tem al rectngulo Variables. Debe tener cuidado
de no transferir otras variables (como por ejemplo edad, sexo, grado, etctera.) diferentes a tem
4. Clic en Aceptar
5. Si en la matriz de datos hay otras variables diferentes a tem, aparece una advertencia que dice:
...se perdern las variables no transpuestas. Hacer Clic en Aceptar. Luego aparecen los resultados de
transponer la matriz. Clic en Cerrar.
6. Aparece un cuadro de dilogo que dice: Desea guardar el contenido del navegador de
resultados en Resultados?. Clic en no.
7. Aparece la nueva matriz de datos con los sujetos en las columnas y las variables en las filas. Hacer
clic en el Men Estadsticos clic resumen clic en descriptivas. Al aparecer el cuadro,
transferir las var (que son los tems) al rectngulo variables clic en opciones: dejar slo
activado el estadstico suma y desactivar el resto Clic en continuar clic en aceptar. Se
visualizan los resultados con los tem y sus respectivos N (total tems/sujeto) y la suma de las
calificaciones totales de cada sujeto.
8. Se seleccionan los resultados, haciendo clic en cualquier parte de los mismos. Se vern dentro de
un recuadro..
9. Nota: Vlido solamente cuando no se visualizan todos los resultados en la ventana activa . Cuando
no es el caso, omitir y pasar al paso siguiente
Hacer doble clic dentro del recuadro. Debe aparecer un cuadro de dilogo. Active la segunda opcin
del cuadro de dilogo que dice: editar este elemento en su lugar con barras de desplazamiento
clic en aceptar.
10. Clic donde aparece el total del primer sujeto (deber asegurarse que el cursor est en la celda que
corresponde al total del primer sujeto). Mantenga oprimida la tecla (o shift), sin soltarla. Luego
arrastre (sombrear) los totales desde el primer sujeto hasta el ltimo sujeto. En el proceso de arrastre
con la tecla (flecha de desplazamiento hacia abajo) debe mantener sin soltar la tecla ( o shift) hasta
que termine de sombrear todos los totales de los sujetos. Cuando tengamos seguridad que todos los
valores estn sombreados podemos soltar la tecla, hacemos clic con el botn derecho del ratn y
elegimos la opcin cortar o copiar. Luego cerramos los resultados.
11. En el cuadro de dilogo donde se pregunta si desea guardar los resultados, haga clic en no.
12. Aparece la matriz transpuesta. La cerramos y en el cuadro que dice: Desea guardar el
contenido editor de datos en sin titulo? , hacemos clic en no.
13. Abrimos el archivo donde se quiere pegar los totales.
14. En el archivo abierto creamos una nueva variable: Totales. Hacemos clic en la casilla en blanco,
correspondiente al primer sujeto y de nuevo hacemos clic pero con el botn derecho del ratn. Se elige
la opcin pegar. Aparecern todos los totales de los sujetos en su casilla correspondiente.
257
FASE II
CMO CREAR LOS GRUPOS SUPERIOR E INFERIOR Y CALCULAR LAS T DE
STUDENT?
1. Clic en el men Datos
2. Clic en la opcin Ordenar casos
3. Transferimos la variable total al recuadro Ordenar por.
4. En la opcin orden de clasificacin: clic en descendente. Esta opcin permite ordenar los
totales de mayor a menor.
5. Clic en aceptar. Se Observar los totales de los sujetos desde la mayor a menor puntuacin.
6. Incluir en la matriz slo el 27% de los sujetos con las calificaciones ms altas y el 27% de los
sujetos con las calificaciones ms bajas. Excluir los sujetos con calificaciones intermedias. Para
realizar este procedimiento, seleccionamos (sombreamos) los sujetos con calificaciones intermedias y
se oprime la tecla suprimir (SUPR o deleite).
7. Se procede a crear una nueva variable: grupo, asignndole a los sujetos del grupo superior un
nmero (que puede ser 1) y al grupo inferior otro nmero (que puede ser 2).
8. Ahora estamos en condiciones de calcular las T de Student, correspondientes a los tems del
instrumento: comparar en cada tem las calificaciones promedio del grupo superior e inferior. Los
resultados de las T de Student determinarn cules tems discriminan.
Para calcular las T de Student se procede de la manera siguiente:
8.1. Clic en el men estadsticos
8.2. Clic en comparar medias
8.3. Clic en pruebas para muestras independientes
8.4. Pasamos al recuadro Contrastar variables, todos los tems, teniendo cuidado de no pasar otras
variables que no sean tems.
8.5. Transferir la variable grupo a la casilla: Variable de agrupacin. Clic en definir grupos. En
grupo 1: colocar 1 (si el nmero asignado al grupo superior fue 1). En grupo 2: colocar 2 (si el nmero
asignado al grupo inferior fue 2). Clic en continuar. Clic en aceptar.
8.6. Aparecern los resultados que contienen las T de Student, donde se comparan las calificaciones
promedias de los grupos (superior e inferior) en cada tem.
258
FASE III
CMO INTERPRETAR LOS RESULTADOS?
En los resultados aparecen dos cuadros: el primero presenta estadsticos descriptivos de los grupos. El
segundo cuadro presenta la prueba T de Student para muestras independientes. Este cuadro presenta
dos partes sucesivas. En la primera se determina la homogeneidad de las varianzas en los grupos
sometidos a contraste de hiptesis y, luego, dependiendo si presentan varianzas iguales o desiguales, se
presentan los resultados de la prueba T de Student. Se procede a comparar el nivel de significacin
(sig. bilateral), asociado a la hiptesis nula, con un valor alfa (o ), asociado a la hiptesis alterna; el
cual comnmente se le asigna los valores 0,05 0,01.
Si el valor de significacin (sig. bilateral) es mayor a alfa (o), indica que se acepta la hiptesis nula de
no diferencia entre el grupo superior e inferior, evidencindose que el tem no discrimina. Si ocurre el
caso contrario, que el nivel de significacin es menor o igual a alfa, entonces se rechaza la hiptesis
nula de no diferencias entre los grupo. Este ltimo resultado indica que el tem tiene capacidad de
discriminacin.
Pasos para interpretar los resultados del anlisis de discriminacin, usando el
programa SPSS.
1. Determine si las varianzas son iguales o desiguales: compare el valor significacin (sig.) con
un valor de rechazo alfa (). Si sig > (en este caso = 0.05) se acepta la hiptesis nula,
demostrndose que las varianzas son iguales. En caso contrario (sig. a ), se rechaza la
hiptesis nula, siendo las varianzas desiguales.
2. Despus de determinar la condicin de las varianzas, se contrasta los grupos (superior e
inferior), a travs de la T de Student para muestras independientes, tomando el nivel de
significacin (sig. Bilateral) de acuerdo a la condicin de la varianza (es decir, s son iguales
desiguales). Se compara el sig. Bilateral con un valor de rechazo alfa, si sig. Bilateral mayor
a alfa (sig. bilateral > ) se acepta la hiptesis nula, concluyndose por lo tanto que el tem
no discrimina. Si sucede el caso contrario, (sig. bilateral a ), se rechaza la hiptesis nula.
Se determina en este caso que las medias tienen diferencias significativas y por lo tanto el
tem tiene capacidad de discriminacin.
259
ANEXO D
Pasos para calcular el coeficiente de confiabilidad KuderRichardson (caso de datos
dicotmicos)
1. Abrir el programa excel
2. Transcribir la matriz original (tabla 1)
3. Grabe el archivo en su disquete o en el disco duro del computador
4. Calcule los totales de los sujetos para obtener el coeficiente de confiabilidad KuderRichardson (Ver tabla
2)
Rutina:
Crear una nueva variable (columna en blanco) con el nombre de total. En la celda G3 (total del primer sujeto)
escribir la frmula de suma. La frmula en este caso es =suma(B3:F3). Al escribir oprima enter, luego copie y
pegue la frmula para el resto de los sujetos.
5. Calcule los totales de los temes para obtener el coeficiente de confiabilidad KuderRichardrson (ver tabla
2)
Rutina:
En la celda A12 escribir la palabra total. En la celda B12 (total del primer tem) escribir la frmula de suma. La
frmula en este caso es =suma(B3:B11).
6. Calcule las varianzas individuales para obtener el coeficiente de confiabilidad KuderRichardson (ver
tabla 3)
a) En la celda A13 escribir la etiqueta: p=respuesta correcta/ total sujetos (en este caso 9 sujetos).
b) En la celda B13 (P correspondiente al primer tem) escriba la frmula de P. La frmula en este caso es =B12/9.
Oprimir enter, luego copie y pegue la frmula para el resto de los temes, incluyendo la suma de la columna total.
c) En la celda A14 escriba la etiqueta q=1-p
d) En la celda B14 escriba la frmula de q. En nuestro caso la frmula de q es =1-B13, luego oprimir enter. Copie
y pegue la frmula al resto de los itemes.
e) En la celda A15 escriba la etiqueta varianzas individuales=p*q. En la celda B15 escriba la frmula de varianzas
individuales. La frmula es =B13*B14. Presione enter. Luego copie y pegue la frmula al resto de los temes
f) En la celda G15 escriba la frmula de la sumatoria de las varianzas individuales. La frmula es =suma
(B15:F15). Presione enter
7. Calcule la varianza total para obtener el coeficiente KuderRichardrson (ver tabla 4)
Rutina:
En la columna A16 escriba la etiqueta; varianza total. Luego escriba en la celda G16 la frmula para obtener la
varianza total. La frmula es =VAR (G3:G11), presione enter.
8. Calcule el coeficiente de confiabilidad KuderRichardson (ver tabla 5)
Rutina:
En la celda A17 escriba la etiqueta : KR=(n/(n-1))*((Vt-p*q)/(Vt)). En la celda B17 escriba la frmula del
coeficiente KuderRichardson. La frmula es =(5/(5-1))*((g16-g15)/g16)
260
a b c d e f
1 Tabla 1. Matriz original de datos para calcular el coeficiente de confiabilidad Kuder-Richardson
2 item1 item2 item3 item4 item5
3 1 1 1 1 1
4 1 1 1 1 1
5 0 1 1 1 1
6 1 0 1 1 1
7 0 1 1 1 1
8 1 1 1 1 0
9 1 1 1 0 0
10 0 0 1 1 1
11 0 1 1 0 0
a b c d e f g
1 Tabla 2. Clculo de los totales de sujetos e temes para obtener el coeficiente de confiabilidad Kuder-Richardson
2 item1 item2 item3 item4 item5 total
3 1 1 1 1 1 5
4 1 1 1 1 1 5
5 0 1 1 1 1 4
6 1 0 1 1 1 4
7 0 1 1 1 1 4
8 1 1 1 1 0 4
9 1 1 1 0 0 3
10 0 0 1 1 1 3
11 0 1 1 0 0 2
12 total 5 7 9 7 6 34
261
a b c d e f g
1 Tabla 3. Clculo de las varianzas individuales para obtener el coeficiente de confiabilidad Kuder-Richardson
2 item1 item2 item3 item4 item5 total
3 1 1 1 1 1 5
4 1 1 1 1 1 5
5 0 1 1 1 1 4
6 1 0 1 1 1 4
7 0 1 1 1 1 4
8 1 1 1 1 0 4
9 1 1 1 0 0 3
10 0 0 1 1 1 3
11 0 1 1 0 0 2
12 Total respuestas 5 7 9 7 6 34
13 p=Total respuestas/total sujetos 0,56 0,78 1,00 0,78 0,67
14 q=1-p 0,44 0,22 0,00 0,22 0,33
15 varianzas individuales=p*q 0,25 0,17 0,00 0,17 0,22 0,81
a b c d e f g
1 Tabla 4. Clculo de la varianza total para obtener el coeficiente de confiabilidad Kuder-Richardson
2 item1 item2 item3 item4 item5 total
3 1 1 1 1 1 5
4 1 1 1 1 1 5
5 0 1 1 1 1 4
6 1 0 1 1 1 4
7 0 1 1 1 1 4
8 1 1 1 1 0 4
9 1 1 1 0 0 3
10 0 0 1 1 1 3
11 0 1 1 0 0 2
12 Total respuestas 5 7 9 7 6 34
13 p=Total respuestas /total sujetos 0,56 0,78 1,00 0,78 0,67
14 q=1-p 0,44 0,22 0,00 0,22 0,33
15 varianzas individuales=p*q 0,25 0,17 0,00 0,17 0,22 0,81
16 varianza total 0,94
262
a b c d e f g
1 Tabla 5. Clculo el coeficiente de confiabilidad Kuder-Richardson
2 item1 item2 item3 item4 item5 total
3 1 1 1 1 1 5
4 1 1 1 1 1 5
5 0 1 1 1 1 4
6 1 0 1 1 1 4
7 0 1 1 1 1 4
8 1 1 1 1 0 4
9 1 1 1 0 0 3
10 0 0 1 1 1 3
11 0 1 1 0 0 2
12 Total respuestas 5 7 9 7 6 34
13 p=Total respuestas/total sujetos 0,56 0,78 1,00 0,78 0,67
14 q=1-p 0,44 0,22 0,00 0,22 0,33
15 varianzas individuales=p*q 0,25 0,17 0,00 0,17 0,22 0,81
16 varianza total (Vt) 0,94
17 KD=(n/(n-1))*((Vt-p*q)/Vt) 0,1715686
263
ANEXO E
RUTINA PARA REALIZAR EL ANLISIS FACTORIA L A TRAVS DEL
PROGRAMA SPSS
-Abrir el archivo que contiene la base de datos del instrumento en proceso de validacin.
Antes de realizar el anlisis factorial debe excluir del instrumento los tem que no discriminan
ni aportan confiabilidad al instrumento. A continuacin realice la siguiente rutina:
RUTINA:
-Clic en Estadsticos (versin 7.5) o en Analizar (versiones posteriores a la 7.5, como la
10.05 y 11).
-Clic en Reduccin de datosClic en Anlisis factorialtransferir los tem hacia el
recuadro Variables. (A partir de este momento debe tomar decisiones sobre las opciones
que se presentan: Variable de seleccin, Descriptivo, Extraccin, Rotacin, Puntaciones y
Opciones. Para tomar decisiones sobre estas opciones debe documentarse leyendo las
referencias sugeridas en el captulo XII: Anlisis Factorial).
-Clic en aceptar.
ALGUNAS CONSIDERACIONES SOBRE LAS OPCIONES QUE
PRESENTA SPSS CON RESPECTO AL ANLISIS FACTORIAL
Opcin Variable de seleccin: es una variable filtro que tiene como funcin
realizar el anlisis factorial en submuestras de una variable, por ejemplo, si se tiene la
variable sexo, cuyos valores son: masculino=1 y femenino=2; y se est interesado en
determinar como se comporta el anlis factorial en el sexo femenino, se hace clic en
valor y se coloca en Valor para la variable de seleccin el nmero 2. Si no interesa
determinar el comportamiento de submuestras de una variable se omite esta opcin.
Opcin Descriptivo: se puede activar slo las opciones: Determinante y KMO y
prueba de esfericidad de Bartlett. Ambas opciones permiten determinar si es viable
realizar el anlisis factorial al instrumento que se est validando.
En el caso de la opcin Determinante, el valor presentado debe estar prximo a
cero, lo cual expresa que los tem analizados se correlacionan linealmente. Valores alejados
de cero indican que los tem no estn correlacionados linealmente entre si, lo cual aconseja no
continuar con el anlisis factorial del instrumento.
264
Cuando el determinante es exactamente cero, el programa SPSS no presenta los
resultados del KMO ni de la prueba de Bartlett. En este caso se asume que la intercorrelacin
entre los tem es perfectamente lineal, y por lo tanto, es viable proseguir con el anlisis
factorial.
En el caso de del ndice KMO el criterio para interpretar los resultados es el
siguientes:
1 > KMO > 0,90 son considerados excelentes.
0,90 > KMO > 0,80 son considerados buenos.
0,80 > KMO > 0,70 son considerados aceptables.
0,70 > KMO > 0,60 son considerados mediocres o regulares.
0,60 > KMO > 0,50 son considerados malos
KMO s 0,50 son considerados inaceptables o muy malos.
En el caso del test de Bartlett, Visuata (1998) expresa que ste:
...es utilizado para verificar si la matriz de correlaciones es una matriz identidad,
es decir, si todos los coeficientes de la diagonal principal son iguales a la unidad
y los externos a la diagonal iguales a 0. Este estadstico se obtiene a partir de la
transformacin x
2
del determinante de la matriz de correlaciones y cuanto mayor
sea y por lo tanto menor el grado de significacin ms improbable que la matriz
sea una matriz identidad... un grado de significacin p = 0 resulta evidente que
no se trata de una matriz identidad. En el supuesto de que no pudiese rechazar
esta hiptesis, se desaconseja proceder a realizar el anlisis factorial con los
datos. (p. 224)
Opcin Extraccin: En Mtodo dejar la opcin que por defecto tiene el programa
SPSS: Componentes principales. Con respecto al resto de las opciones, se
recomienda dejar activada: Autovalores mayores a 1 (que est por defecto) y en
cuanto a la opcin Nmero de factores se puede activar, si se est interesado en fijar
un lmite de factores para analizar, es decir, cuando no se desea tomar en cuenta el
mximo de factores que genera la aplicacin del anlisis factorial. Si se desea limitar el
nmero de factores, se debe analizar la varianza total explicada por los factores
(presentada por defecto), la cual no debe ser menor del 50% acumulada por el ltimo
factor. En caso de ser menor a este porcentaje, se debe aumentar el nmero de factores;
con el propsito de incrementar la varianza total explicada.
265
Opcin Rotacin: se recomienda activar la opcin Varimax, el cual es el mtodo de
rotacin de mayor aplicacin cuando se calcula la matriz de componentes rotados.
Cuando se calculan los factores, es recomendable una solucin rotada; porque la
solucin no rotada es ambigua y puede presentar varias soluciones, hecho que no
ocurre cuando se rotan los factores.
Opcin Puntuaciones: en esta opcin, en consideracin a la simplicidad de la
explicacin y tomando en cuenta que su incorporacin en el anlisis no es
indispensable, se recomienda no activar ninguna opcin.
Opcin Opciones: Se recomienda dejar activada la opcin por defecto Excluir
casos segn lista y activar las opciones: Ordenados por su tamao y Suprimir
valores absolutos menores que 10. Estas dos ltimas opciones permiten una mejor
presentacin de los resultados y facilitan el anlisis e interpretacin de los mismos.
CMO INTERPRETAR LOS RESULTADOS Y SELECCIONAR LOS TEM
QUE CONFORMARN LA VERSIN DEFINITIVA DEL INSTRUMENTO?
Para seleccionar los temes Nunnally y Bernstein (1988), expresan lo siguiente:
...cada factor debe tener algunas variables que se correlacionen con l casi
exclusivamente (la mayora de las variables que se correlacionan altamente con
ese factor no deben correlacionarse ms de 0,3 con cualquier otro factor), y las
variables marcadoras... deben correlacionarse por encima de 0,5...(p. 603)
En resumen, el criterio de seleccin de los tem es el siguiente:
Incluir a conformar la versin definitiva del instrumento aquellos tem que se
correlacionan por encima de 0.50 (> 0.50) con un factor (slo con un factor) y menor o igual
a 0.30 (< =) con el resto de los factores. Si el tem analizado no cumple con estas
condiciones debe excluirse del instrumento.