Validez y Confiabilidad (2012)

METODOLOGA CUANTITATIVA II
2 SEMESTRE 2012
Mdulo 3
Evaluacin calidad del instrumento:
confiabilidad y validez
Sebastin Ibarra Gonzlez
I. Introduccin
Cuando realizamos la medicin de conceptos

complejos a travs de un instrumento
estructurado inevitablemente surge la siguiente
pregunta: cun confiable y vlido es nuestro
instrumento de medicin (ndice o escala)?
I. Introduccin
Confiabilidad: grado en que la aplicacin repetida de un

instrumento en los mismos sujetos u objetos produce los
mismos resultados, es decir, que los resultados sean estables
en el tiempo.
Ejemplo: que los resultados obtenidos en la medicin de inteligencia sean
similares si aplico el instrumento hoy y lo vuelvo a aplicar en un mes ms.
Validez: grado en que el instrumento mide las variables que

pretende medir.
Ejemplo: que un instrumento diseado para medir inteligencia mida
realmente esa variable y no otra (por ejemplo capacidad de memoria).
I. Introduccin
La preocupacin por la confiabilidad y validez de un instrumento de medicin

surge a partir de la identificacin de las limitaciones y problemas implicados en
todo proceso de medicin (y ms an en las ciencias sociales).
Se debe asumir que nunca alcanzaremos un grado total de confiabilidad y

validez.
Lo ms relevante es tener conciencia de cules son los errores ms comunes

en el proceso de medicin:
Errores de medicin
- Problemas del diseo del instrumento.

- Influencia del entrevistador.
- Actitud negativa del entrevistado.
- Condiciones de aplicacin (distractores)
Errores de no observacin
- Problemas de representatividad de la muestra.

- Errores de no muestreo.
- Errores de no respuesta.
Errores de procesamiento de
datos
- Errores de digitacin.
- Errores de codificacin.
II. La confiabilidad de un instrumento

De acuerdo a Asn (2006) existen dos problemas especficos que disminuyen la
confiabilidad de un instrumento, es decir, su capacidad para obtener siempre
el mismo resultado al aplicarse a un sujeto que no ha cambiado en la propiedad
que deseamos medir:
1. Impacto de variables externas y coyunturales sobre las respuestas de
los sujetos: experiencias recientes, estado de animo, etc. Hay preguntas que
se ven ms afectadas por este problema:
Preguntas que miden fenmenos afectivos o emocionales.
Preguntas que tienen poco especificadas las alternativas de respuesta.
2. La influencia del azar en la seleccin de las respuestas. Si el sujeto no
encuentra una respuesta que se ajuste adecuadamente a su opinin,
recuerdo o percepcin intentar encontrar otra respuesta cercana a su opcin
ideal. Se trata de una seleccin aleatoria entre opciones equidistantes a su
opinin verdadera. Hay que preguntas que se ven ms afectadas por este
problema:
Preguntas sobre temas que resulten poco pertinentes a los sujetos.
II. La confiabilidad de un instrumento

La confiabilidad se puede interpretar de 3 modos distintos, existiendo para cada uno
de ellos procedimientos de chequeo especficos.
ESTABILIDAD
Confiabilidad
CONSISTENCIA
INTERNA
EQUIVALENCIA
III. La confiabilidad de un instrumento

1. Estabilidad (confiabilidad test - retest): el instrumento presenta en
forma consistente los mismos resultados en dos o ms ocasiones
sucesivas.
El instrumento se debe aplicar dos o ms veces en una misma muestra
despus de un periodo de tiempo.
Si la correlacin entre los resultados es positiva el instrumento se considera
confiable.
Se debe tener en consideracin el factor tiempo.
Desventaja: doble aplicacin y el factor memorizacin del instrumento.

2. Equivalencia (formas alternativas o paralelas): se evala la
equivalencia de dos versiones de un mismo instrumento que se ha
comprobado que miden lo mismo.
La aplicacin de las versiones del instrumento se debe realizar con una
distancia temporal.
Las versiones del instrumento deben ser similares en contenido, instrucciones,
duracin, dificultad, etc.
El instrumento ser confiable si los resultados de ambos instrumentos estn

correlacionados.
Ventaja: no existe problemas de memorizacin del instrumento.
Desventaja: costos adicionales relacionados con la elaboracin de dos o ms
versiones del instrumento.

3. Consistencia Interna: para evaluar este tipo de confiabilidad slo se
requiere una aplicacin del instrumento. Existen dos
procedimientos para evaluar este tipo de confiabilidad:
3.1. Mtodo de mitades partidas: el conjunto de tems se divide en dos mitades
y los resultados de ambas se comparan. Si estn correlacionados se puede
afirmar que el instrumento presenta consistencia interna.
Supuesto: un sujeto con baja puntuacin en una mitad, tender a tener tambin
una baja puntuacin en la otra mitad.
Ventaja: se requiere una sola aplicacin del instrumento.
Desventaja: costos asociados a la generacin de un instrumento ms extenso y
cansancio del encuestado debido a la extensin del cuestionario.
1 Mitad: 2-5-7-8
Resultado
Instrumento (tems):
Correlacin
1-2-3-4-5-6-7-8
21 Mitad: 1-3-4-6
Resultado

3.2. Universo de tems: anlisis de la interrelacin entre el conjunto de tems
del instrumento.
Se aplica cuando hay homogeneidad entre los tems de un instrumento: cuando
miden un mismo constructo.
Cuando todos los tems miden un solo concepto se espera una alta consistencia
interna.
Cuando un instrumento mide mltiples dimensiones de un concepto complejo, se
espera que un conjunto de tems relacionadas a una dimensin estn ms
relacionadas entre s que con el resto del instrumento.
Para evaluar este tipo de confiabilidad se utilizan dos coeficientes estadsticos:
- Coeficiente Alfa de Cronbach.
- Coeficiente Kunder Richarson (se utiliza para ndices dicotmicos).
- Ambos coeficientes van de 0 (nula consistencia interna) a 1 (mxima
consistencia interna).
IV. Evaluacin de la confiabilidad en SPSS

1. Encuesta de Opinin Pblica de la Universidad Diego Portales (2009).
2. Conjunto de preguntas en las que se centra el anlisis: preguntas 72 (1-15) y
preguntas 92 (1-10).
3. Anlisis descriptivo de preguntas 72 (1-15): ndice de consumo responsable.
4. Anlisis descriptivo de preguntas 92 (1-10): ndice de satisfaccin con la vida.

5. Construccin de ndices sumatorios.
6. Anlisis de confiabilidad de ndices (Coeficiente alfa de Cronbach).

Elementos a considerar en la interpretacin del coeficiente Alfa de Cronbach:
El puntaje del coeficiente va de 0 (nula consistencia interna) a 1 (mxima
consistencia interna). Criterios de interpretacin de los puntajes:
PUNTAJE
INTERPRETACIN
0.9 o ms
Excelente
0.8 8.9
Bueno
0.7 0.79
Aceptable
0.6 0.69
Bajo
0.5 0.59
Muy bajo
Menos de 0.5
Inaceptable

Salida de resultados en SPSS:
Anlisis descriptivos.
Estadstico de confiabilidad.
Matriz de correlaciones.
Estadstico total elemento: alfa de Cronbach si se elimina el
elemento.
Cmo se puede mejorar la confiabilidad ?

Eliminar tems que se correlacionan poco con la escala.
Eliminar tems con poca variabilidad.
Aumentar nmero de tems que se relacionan con la escala.
V. La validez de un instrumento
La validez hace referencia a si el instrumento (test) efectivamente mide el
concepto que dice medir y no otros conceptos.
La validez es siempre parcial, ya que siempre estaremos midiendo
parcialmente otros conceptos distintos a los buscados.
De acuerdo a Asn (2006) existen un conjuntos de limitaciones de la medicin

que pueden afectar la validez de un instrumento de medicin cuantitativa:
1. El autoreporte.
2. Influencia de las caractersticas particulares de cada pregunta.
3. Adaptacin de los sujetos a las respuestas.
4. Cristalizacin.
5. Adopcin de roles por parte del encuestado.
6. Ambigedad en la interpretacin de los puntajes.
7. Omisin de preguntas.
8. Incomprensin de preguntas.
La validez se puede interpretar de 3 modos distintos, existiendo para cada uno de
ellos procedimientos de chequeo especficos.
CONTENIDO
VALIDEZ
CONSTRUCTO
CRITERIO
1. Validez de contenido: grado en que el instrumento refleja un
dominio especfico del contenido de la variable que se mide. La
medicin debe representar el concepto medido en todas sus
dimensiones.
Ejemplo:
Concepto: Capital social
1. Nivel de informacin
2. Participacin
3. Redes de ayuda
4. Confianza
5. Accin colectiva
6. Cooperacin
Instrumento para
medir Capital social
1.Redes de ayuda
2.Confianza
3.Accin colectiva
4.Cooperacin
7. Empoderamiento
8. Liderazgo
9. Accin poltica
Se trata de un instrumento que

no tiene validez de contenido
Procedimiento para determinar la validez de contenido: anlisis de

jueces y anlisis de tems y preguntas.
Definicin conceptual
y de dimensiones
Anlisis de jueces
Diseo del instrumento
Anlisis de jueces
- Distribucin de respuestas.
Construccin definitiva
del instrumento
- Asociacin o correlacin entre tems.

- Relacin entre tems y puntaje global.
- Anlisis de dimensiones (anlisis

factorial)
2. Validez de criterio: se establece comparando los resultados del
instrumento (test) con un criterio externo. Mientras mayor sea la
asociacin o correlacin entre los resultados del instrumento
(test) y el criterio establecido, mayor ser la validez de criterio.
Un criterio es una variable distinta del test que se toma como referencia,
que se sabe que es un indicador de aquello que el test pretende medir o
que se sabe que debe presentar una relacin determinada con lo que el
test pretende medir.
2.1. Validez concurrente: los resultados del instrumento se correlacionan
con el criterio establecido en el mismo punto del tiempo. Ejemplo:
- Instrumento: Intencin de voto / Criterio: Resultado de las elecciones.
- Criterio: Promedio de notas en el colegio / Instrumento: PSU
2.2. Validez de predictiva: los resultados del instrumento se correlacionan

con un criterio medido en el futuro. Ejemplo:
- Instrumento: Prueba de capacidad administrativa / Criterio:
Desempeo de los ejecutivos.
**Es el caso de todas las pruebas de seleccin y clasificacin de
personal.
3. Validez de constructo: grado en que una medicin se relaciona
consistentemente con otras mediciones de acuerdo con hiptesis
sustentadas tericamente.
Un constructo es una variable medida y que se enmarca dentro de
una teora o esquema terico.
Ejemplo:
Instrumento que
mide MOTIVACIN
LABORAL
Revisin de antecedentes y
marco terico: relacin
positiva entre motivacin
laboral y persistencia en
el desarrollo de una tarea
Se miden ambas variables

y se correlacionan. Si la
correlacin es positiva
se aporta evidencia para
la validez de constructo
del instrumento
Procedimiento para determinar la validez de constructo:
1. Establecer y especificar la relacin terica entre los conceptos.
2. Correlacionar las mediciones de ambos conceptos.

3. Interpretacin de la evidencia emprica: aporta o no a la validez de
constructo del instrumento, para finalmente poder afirmar que el
instrumento realmente mide lo que se propone medir.
VI. Aplicacin del Anlisis Factorial para

evaluar la validez de un instrumento
El Anlisis Factorial es una tcnica de reduccin de datos que sirve para

encontrar grupos homogneos de variables a partir de un conjunto numeroso
de variables.
Los grupos de variables homogneas se forman a partir de las variables que

se correlacionan entre s (interdependencia de variables). De esta manera se
descubren las diferentes dimensiones de variabilidad comn existente en un
cierto campo de fenmenos.
Su objetivo final es buscar el menor nmero de dimensiones (factores,

componentes o variables latentes) capaces de explicar el mximo de
informacin contenida en los datos.
VI. Aplicacin del Anlisis Factorial para

evaluar la validez de un instrumento
Usos del Anlisis Factorial:
Explorar cmo se interrelacionan un grupo de variables entre s.
Determinar qu factores o dimensiones latentes hay detrs de un conjunto de

variables (anlisis factorial exploratorio).
Evaluar validez de contenido (anlisis factorial confirmatorio). Para estudiar

un concepto determinado se han observado una serie de indicadores, el
anlisis factorial permite ver si el comportamiento de estos indicadores
responde a una dimensin comn (concepto que queremos medir).
Referencia bibliogrfica
- Asn, R. (2006). Construccin de cuestionarios y escalas: el proceso de la
produccin de informacin cuantitativa. En Canales, M. (ed). Metodologas de
Investigacin Social. Introduccin a los oficios. Santiago de Chile: LOM. (Extracto:
La validez y fiabilidad de la investigacin con cuestionarios).
- Hernndez, R., Fernndez, C. y Baptista, P. (1991). Metodologa de la
Investigacin. Mxico: McGraw-Hill. Captulo 9: Recoleccin de datos (pp. 241251).

Validez y Confiabilidad (2012)

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Validez y Confiabilidad (2012)

Cargado por

Copyright:

Formatos disponibles

METODOLOGA CUANTITATIVA II

Sebastin Ibarra Gonzlez

Cuando realizamos la medicin de conceptos

Confiabilidad: grado en que la aplicacin repetida de un

Validez: grado en que el instrumento mide las variables que

La preocupacin por la confiabilidad y validez de un instrumento de medicin

Se debe asumir que nunca alcanzaremos un grado total de confiabilidad y

Lo ms relevante es tener conciencia de cules son los errores ms comunes

- Problemas del diseo del instrumento.

- Problemas de representatividad de la muestra.

II. La confiabilidad de un instrumento

II. La confiabilidad de un instrumento

III. La confiabilidad de un instrumento

III. La confiabilidad de un instrumento

El instrumento ser confiable si los resultados de ambos instrumentos estn

III. La confiabilidad de un instrumento

III. La confiabilidad de un instrumento

IV. Evaluacin de la confiabilidad en SPSS

4. Anlisis descriptivo de preguntas 92 (1-10): ndice de satisfaccin con la vida.

IV. Evaluacin de la confiabilidad en SPSS

IV. Evaluacin de la confiabilidad en SPSS

Cmo se puede mejorar la confiabilidad ?

De acuerdo a Asn (2006) existen un conjuntos de limitaciones de la medicin

Se trata de un instrumento que

Procedimiento para determinar la validez de contenido: anlisis de

Diseo del instrumento

- Asociacin o correlacin entre tems.

- Anlisis de dimensiones (anlisis

2.2. Validez de predictiva: los resultados del instrumento se correlacionan

Se miden ambas variables

Procedimiento para determinar la validez de constructo:

1. Establecer y especificar la relacin terica entre los conceptos.

2. Correlacionar las mediciones de ambos conceptos.

VI. Aplicacin del Anlisis Factorial para

El Anlisis Factorial es una tcnica de reduccin de datos que sirve para

Los grupos de variables homogneas se forman a partir de las variables que

Su objetivo final es buscar el menor nmero de dimensiones (factores,

VI. Aplicacin del Anlisis Factorial para

Explorar cmo se interrelacionan un grupo de variables entre s.

Determinar qu factores o dimensiones latentes hay detrs de un conjunto de

Evaluar validez de contenido (anlisis factorial confirmatorio). Para estudiar

También podría gustarte