Jhonson en Español

Título: Los bloques de construcción de la investigación científico-social: medición
EN LOS CAPÍTULOS ANTERIORES, DISCUTAMOS las etapas iniciales de

proyectos de investigación en ciencias políticas: la elección de temas de investigación, la
formulación
de explicaciones científicas, el desarrollo de hipótesis verificables, y
La definición de conceptos. En este capítulo, damos el siguiente paso hacia la prueba.
Hipótesis empíricas. Antes de probar hipótesis, hay que entender.
Algunos temas relacionados con la medición de los conceptos que hemos decidido.
para investigar y cómo registramos observaciones sistemáticas utilizando números o
Puntuaciones para crear variables que representan los conceptos para el análisis.
En el capítulo 2, dijimos que el conocimiento científico se basa en la investigación empírica.
Para probar empíricamente la precisión y utilidad de una explicación científica o un fenómeno
político, tendremos que observar y medir la presencia.
Los conceptos que estamos utilizando para entender ese fenómeno. Además,
Esta prueba es ser adecuada, nuestras medidas del fenómeno político.
Solo sé lo más preciso y preciso posible. El proceso de medición es
Es importante porque proporciona el puente entre nuestras explicaciones propuestas y el
mundo empírico que se supone que deben explicar. Cómo miden los investigadores
sus conceptos pueden tener un impacto significativo en sus hallazgos; diferencias en la medida
Puede llevar a conclusiones totalmente diferentes.
Kenworthy y Jonas Pontusson . s investigación qf desigualdad de ingresos en los ricos
Los países ilustran bien el impacto en los resultados de la investigación de cómo es un
concepto
mesurado. 1 Una forma de medir la distribución del ingreso es observar las ganancias de
empleados de tiempo completo y para comparar los ingresos de aquellos en la parte superior
y el fondo de la distribución de ganancias. Kenworthy y Pontusson discutieron
que es más apropiado comparar los ingresos de los hogares que los ingresos de
individuos Los desempleados quedan excluidos de los cálculos de ingresos individuales.
La desigualdad, pero los hogares incluyen a los desempleados. Además, el trabajo de bajos
ingresos-.
Los egresados desproporcionadamente de la fuerza laboral empleada. Utilizando la edad
laboral
El ingreso familiar refleja los cambios en el empleo entre los miembros del hogar.
Kenworthy y Pontusson encontraron que cuando el ingreso individual se usaba como base
Para medir la desigualdad, la desigualdad había aumentado más en los Estados Unidos,
Nueva Zelanda y el Reino Unido, todas economías de mercado liberales. Ellos, además
encontraron que la desigualdad de ingresos había aumentado significativamente más en estos
países
que en las economías sociales .s Europa del mercado y Japón. Cuando el ingreso familiar era
utilizado, los datos indicaron que la desigualdad había aumentado en todos los países con
excepción de los países bajos.
Otro ejemplo involucra la medición de las tasas de participación (discutido en
Capítulo 1). Los científicos políticos han investigado si las tasas de participación en los Estados
Unidos
Los estados han disminuido en las últimas décadas.2 La respuesta puede depender de cómo el
número
de los votantes elegibles se mide. ¿Debería ser el número de todos los ciudadanos votantes?
edad, o si este número se ajusta para tener en cuenta a los que no están
elegibles para votar, o si la tasa de participación se calcula utilizando solo el número de
¿Yoters registrados como la potencial población votante?
Los investigadores discutidos en el capítulo 1 midieron una variedad de fenómenos políticos,
Algunos de los cuales plantearon mayores desafíos que otros. Milner, Poe y Leblang querían
medir.
Tres tipos diferentes de derechos humanos: integridad personal o derechos de seguridad,
subsistencia
Derechos, y derechos civiles y políticos. Cada uno de estos tipos de derechos tiene
múltiples dimensiones. Por ejemplo, los derechos civiles y políticos consisten en
libertades, como la libertad de expresión, así como las libertades económicas, incluidas las
privadas
derechos de propiedad. Jeffrey A. Segal y Albert D. Cover midieron tanto lo político como lo
político.
Las ideologías y las opiniones escritas de los jueces de la Corte Suprema de los Estados Unidos
en casos
involucrando derechos civiles y libertades.3 Valerie]. Hoekstra medía las opiniones de la gente.
sobre cuestiones relacionadas con los casos del Tribunal Supremo y sus opiniones sobre la
Corte. 4 Richard L. Hall y Kristina Miler querían medir la actividad de supervisión
por los miembros del Congreso, el número de veces que fueron contactados por cabilderos,
y si los miembros del Congreso y los cabilderos eran pro-regulación o antirregulación.
5 Y Stephen Ansolabehere, Shanta Iyengar, Adam Simon y Nicholas
Valentino midió la intención de votar informada por los participantes del estudio para ver
si se vio afectado por la exposición a la publicidad negativa de la campaña.6 En cada caso,
algunos · comportamiento político o atributo se midió de manera que una explicación
científica
podría ser probado Todos estos investigadores tomaron decisiones importantes con respecto a
su
mediciones.
Diseñar estrategias de medición
Como señalamos en el capítulo 4, los investigadores deben definir los conceptos que utilizan
En sus hipótesis a través de la conceptualización. También deben decidir cómo
mida la presencia, ausencia o cantidad de estos conceptos en el mundo real.
Los científicos políticos se refieren a este proceso como operacionalización, o para
Definición operacional de sus conceptos. La operacionalización es decidir cómo
registrar observaciones empíricas de la ocurrencia de un atributo o un comportamiento
usando
numerales o puntajes.
Consideremos, por ejemplo, a un investigador que intenta explicar la existencia de la
democracia.
en diferentes naciones. Si el investigador tuviera la hipótesis de que tasas más altas
La alfabetización hace que la democracia sea más "probable", luego una definición de dos
conceptos: alfabetización.
Y la democracia, sería necesaria. El investigador podría entonces desarrollar una estrategia,
basada en las definiciones de los dos conceptos, para medir la existencia.
y la cantidad de ambos atributos en las naciones.
Supongamos que la alfabetización se define como "la finalización de seis años de educación
formal"
y la democracia fue definida como "un sistema de gobierno en el cual los funcionarios públicos
son seleccionados en elecciones competitivas ". Estas definiciones se utilizarían para
Desarrollar definiciones operativas de los dos conceptos. Estas definiciones operativas
indicaría lo que debe observarse empíricamente para medir tanto la alfabetización como la
democracia, e indicarían específicamente qué datos deberían recopilarse para
Poner a prueba la hipótesis de los investigadores. En este ejemplo, la definición operativa de
alfabetización.
podría ser "aquellas naciones en las que al menos el 50 por ciento de la población ~ ha tenido
seis años de educación formal, como se indica en una publicación de las Naciones Unidas, "
y la definición operativa de democracia puede ser "aquellos países en los que el
El segundo clasificado en las elecciones para la oficina del jefe ejecutivo ha recibido al menos
25 por ciento de los votos al menos una vez en los últimos ocho años ".
Cuando un investigador especifica la definición operativa de un concepto, los conceptos
precisos
El significado en un estudio de investigación particular se vuelve claro. En el ejemplo anterior,
ahora sabemos exactamente lo que el investigador quiere decir con alfabetización y
democracia.
Dado que diferentes personas a menudo significan cosas diferentes por el mismo concepto,
operativas
Las definiciones son especialmente importantes. Alguien podría argumentar que definir la
alfabetización
En términos de educación formal, ignora la posibilidad de que las personas que completan seis
Los años de educación formal aún podrían ser incapaces de leer o escribir bien. Del mismo
modo,
Podría argumentarse que la definición de democracia en términos de elecciones competitivas
ignora
Otras características importantes de la democracia, como la libertad de expresión y la
ciudadanía.
Participación en la actividad del gobierno. Además, la definición operativa de competitiva.
La sección es claramente discutible. Es la "competitividad" de las elecciones basada en
el número de candidatos que compiten, el tamaño del margen de victoria o el número
¿De las victorias decisivas de un solo partido en una serie de elecciones? Desafortunadamente,
las definiciones operacionales rara vez son absolutamente correctas o absolutamente
incorrectas; más bien,
se evalúan de acuerdo con lo bien que corresponden a los conceptos que son
destinado a medir.
Es útil pensar que llegar a la definición operativa es la última etapa en
El proceso de definir un concepto con precisión. A menudo empezamos con un concepto
abstracto.
(como la democracia), luego intente definirla de manera significativa, y finalmente
Decida en términos específicos cómo lo vamos a medir. Al final de este proceso,
esperamos alcanzar una definición que sea sensata, cercana a nuestro significado del
concepto,
y exacto en lo que nos dice sobre cómo ir, sobre cómo medir el concepto.
Consideremos otro ejemplo: imagine que un investigador está interesado en por qué.
Algunas personas son más liberales que otras. El concepto de liberalismo podría ser
Definido como "creer que el gobierno debe perseguir políticas que brinden beneficios
para los menos acomodados ". La tarea, entonces, es desarrollar una definición operacional
que pueda usarse para medir si los individuos en particular son liberales o no.
La siguiente pregunta de Generiil Social Survey podría usarse para operacionalizar.
el concepto:
73A. Algunas personas piensan que el gobierno de Washington debería
reducir las diferencias de ingresos entre los ricos y los pobres, tal vez por
Aumentar los impuestos de las familias ricas o dar asistencia de ingresos a la
pobre. Otros piensan que el gobierno no debería preocuparse por
Reduciendo esta diferencia de ingresos entre los ricos y los pobres.
Aquí hay una tarjeta con una escala del 1 al 7. Piense en una puntuación de 1 como significado
que el gobierno debe reducir las diferencias de ingresos entre
ricos y pobres, y una puntuación de 7 en el sentido de que el gobierno debería
No se preocupa por reducir las diferencias de ingresos. Qué puntuación entre
1 y 7 se acerca más a la forma en que te sientes? (UN CÍRCULO)
Un concepto abstracto, el liberalismo ahora ha recibido una definición operativa que
Se puede utilizar para asegurar el concepto para individuos. Esta definición también está
relacionada.
a la definición original del concepto, e indica precisamente qué observaciones
hay que hacer No es, sin embargo, la única definición operacional posible.
Otros podrían sugerir que las preguntas sobre la acción afirmativa, el matrimonio entre
personas del mismo sexo,
Los vales escolares, la pena de muerte, las prestaciones sociales y la pornografía podrían
Ser utilizado para medir el liberalismo.
Lo importante es pensar cuidadosamente sobre la definición operativa que
Elija y trate de asegurarse de que la definición coincida estrechamente con el significado
del concepto original. Cómo se opera un concepto. afecta cómo las generalizaciones
Se hacen e interpretan. Por ejemplo, declaraciones generales sobre liberales o
Los conservadores se aplican a los liberales o conservadores solo como han sido
operativamente
Definido, en este caso por esta pregunta sobre la participación del gobierno.
En la reducción de las diferencias de ingresos. Como consumidor de investigación, debes
familiarizarte.
usted mismo con las definiciones operativas utilizadas por los investigadores para que usted
sea mejor
Capaz de interpretar y generalizar resultados de investigación.
Ejemplos de medidas políticas: llegar a la operacionalización;
Echemos un vistazo más de cerca a algunas definiciones operativas utilizadas por los políticos
Los investigadores científicos mencionados en el capítulo 1, así como algunos otros. Para medir
el
la fuerza de la intervención de un legislador en los reglamentos de contaminación del aire
propuestos por la Agencia de Protección Ambiental, Hall y Miler codificaron y contaron el
número
de comentarios sustanciales hechos por legisladores que desafían o defienden los
regulaciones de calidad del aire propuestas durante cinco audiencias de supervisión en el
Congreso
y durante el periodo de comentario público. Se requieren 8 agencias para mantener un
expediente público que contiene todos los comentarios recibidos durante el período de
comentarios.
Las transcripciones estaban disponibles para cada una de las audiencias. Los investigadores
terminaron.
con dos variables: una fue el número de comentarios de apoyo; el otro era
El número de comentarios en oposición al reglamento propuesto. Para medir
Los intereses de los electores en cada uno de los distritos de los miembros, midieron el
número
de trabajos de manufactura en cada distrito y creó un índice de contaminación del aire basado
en
niveles de partículas PM 10 en el distrito y ozono a nivel del suelo (los contaminantes
abordado por la normativa propuesta). Porque Hall y Miler estaban interesados en
investigando si los cabilderos dirigieron sus esfuerzos hacia los miembros del Congreso
amigables hacia las posiciones de los cabilderos, necesitaban medir el pro-
Posiciones de política antiambiental para cada miembro del Congreso, y esta variable
Tenía que medir la posición antes de las audiencias de supervisión y el comentario
reglamentario.
período. Afortunadamente para los investigadores, los líderes de la salud y el medio ambiente.
coalición había clasificado a los miembros en términos de su probable apoyo a la regla anterior
al período de cabildeo y estaban dispuestos a compartir sus calificaciones. Estas medidas
fueron
Basado en el historial de votación de los legisladores en temas de salud y medio ambiente.
La investigación realizada por Segal y Cover sobre el comportamiento de la Corte Suprema de
EE. UU.
Los jueces son un buen ejemplo de un intento de superar un problema serio de medición.
Para poner a prueba una hipótesis científica. 9 Recordemos que Segal y Cover estaban
interesados,
como muchos otros han estado antes que ellos, en la medida en que los votos emitidos por
Los jueces de la Corte Suprema dependían de las actitudes políticas personales de los jueces.
La medición de los votos de los jueces en los casos resueltos por el Tribunal Supremo no es
problema; Los votos son información pública. Pero midiendo las actitudes políticas personales.
de jueces, independientemente de sus voces , hay un problema (recuerde la discusión en
capítulo 4 sobre cómo evitar las tautologías, o declaraciones que vinculan dos conceptos que
significan
esencialmente lo mismo). Muchos de los jueces cuyo comportamiento es de interés tienen
murió, y es difícil lograr que los jueces vivos de la Corte Suprema revelen sus políticas
Actitudes a través de entrevistas personales o cuestionarios. Además, uno idealmente
quisiera una medida de actitudes que sea comparable entre muchos jueces y que
Medidas de actitudes relacionadas con los casos resueltos por el Tribunal.
Segal y Cover limitaron su investigación a los votos sobre casos de libertades civiles entre 1953
y 1987, por lo que necesitaban una medida de actitudes políticas relacionadas para los jueces
sirviendo en la Corte Suprema durante ese mismo período. Decidieron inferir el
Las actitudes de los jueces de los editoriales de los periódicos se publicaron sobre ellos en
cuatro de los principales diarios, desde el momento en que cada juez fue designado por el
presidente hasta
Los jueces de confirmación de voto por el Senado. Seleccionaron los editoriales que aparecían.
En dos periódicos liberales y en dos periódicos conservadores. Analistas entrenados leen los
editoriales.
y codificó cada párrafo para determinar si afirmaba que un juez designado era
liberal, moderado o conservador (o si el párrafo no era aplicable) con respecto a
"Apoyo a los derechos de los acusados en casos penales, mujeres y minorías raciales.
en casos de igualdad, y el individuo contra el gobierno en privado y First
Casos de enmienda. "10
Debido a las barreras prácticas para la medición ideal, Segal y Cover tuvieron que
Confiar en una medida indirecta de las actitudes judiciales según lo percibido por los
periódicos.
Más que en una medida de las actitudes mismas. Aunque este enfoque puede
han dado lugar a medidas defectuosas, también permitió la prueba de un interesante y
hipótesis importante sobre el comportamiento de los jueces de la Corte Suprema que no
habían
ha sido probado previamente. Sin tales medidas, la hipótesis no podría haber sido
sido probado
A continuación, consideremos la investigación realizada por Bradley y sus colegas sobre la
relación
Entre el control de partido del gobierno y la distribución y redistribución.
de salud. 11 Los investigadores confiaron en el Estudio de Ingresos de Luxemburgo (LIS)
base de datos, que proporciona datos de ingresos transnacionales a lo largo del tiempo en la
OCDE (Organización
para la Cooperación Económica y el Desarrollo) los países. 12 Decidieron,
sin embargo, para hacer ajustes a los datos LIS publicados sobre la desigualdad de
ingresos. Ese
Datos incluidos: jubilados. Porque algunos países hacen provisiones integrales.
para los jubilados, los jubilados en estos países hacen pocas provisiones por su cuenta para la
jubilación.
Por lo tanto, muchas de estas personas se considerarían "pobres" antes que cualquier
gobierno
transferencias La inclusión de los jubilados inflaría el nivel de pobreza anterior a la
transferencia
así como el grado de transferencia de ingresos para estos países. Por lo tanto, Bradley y
sus colegas limitaron su análisis a los hogares con una cabeza de veinticinco años para
cincuenta y nueve (excluyendo así también a la población en edad de estudiar) y calcularon su
Mediciones propias de la desigualdad de ingresos a partir de los datos del LIS. Argumentaron
que sus datos
mediría la redistribución entre crecimientos de ingresos , no redistribuciones del ciclo de vida
de ingresos, tales como transferencias a estudiantes y personas jubiladas. Los ingresos se
definieron como
ingresos provenientes de sueldos y salarios, ingresos del trabajo por cuenta propia, ingresos de
propiedad, y
Ingresos de pensiones privadas. Los investigadores también hicieron ajustes para el tamaño
del hogar.
utilizando una escala de equivalencia, que ajusta el número de personas en un hogar
a un número equivalente de adultos. La escala de equivalencia tiene en cuenta la
Economías de escala resultantes de compartir los gastos del hogar.
Martin P Wattenberg y Craig Leonard Brians midieron la exposición por respuestas
¿ O una pregunta de la encuesta que preguntaba a los encuestados si recordaban un anuncio
de campaña y
Si fue o no negativo o positivo en el tono. Finalmente, Ansolabehere y su
colegas midieron la exposición a anuncios de campaña negativos en las elecciones del Senado
de 1990
accediendo a artículos periodísticos y de revistas sobre las campañas y determinando
Cómo se describe el tono de las campañas en estos artículos.
Los casos discutidos aquí son buenos ejemplos de los intentos de los investigadores por medir
Fenómenos políticos importantes (comportamientos o atributos) en el mundo real.
Si el fenómeno en cuestión era la actitud política de los jueces, los ingresos.
desigualdad, el tono de la campaña publicitaria, o las actitudes y comportamientos de
legisladores, los investigadores idearon estrategias de medición que podrían detectar y
Medir la presencia y cantidad del concepto en cuestión. Estas observaciones
luego se usaron generalmente como base para una prueba empírica de los investigadores
hipótesis
Para ser útil en proporcionar explicaciones científicas para el comportamiento político,
medidas.
de los fenómenos políticos debe corresponderse estrechamente con el significado original de
una
Conceptos del investigador. También deben proporcionar al investigador suficiente
información.
para hacer comparaciones y contrastes valiosos. De ahí, la calidad de las medidas.
Se juzga con respecto tanto a su exactitud como a su precisión.
La exactitud de las mediciones
Porque vamos a utilizar nuestras medidas para comprobar si nuestra
Las explicaciones de los fenómenos políticos son válidas, esas medidas deben ser tan
Lo más preciso posible. Las mediciones inexactas pueden llevar a conclusiones erróneas,
ya que interferirán con nuestra capacidad para observar la relación real entre
Dos o más variables.
Hay dos amenazas principales a la exactitud de las mediciones. Las medidas pueden ser
inexactos porque son poco confiables y / o porque no son válidos.
Confiabilidad
La confiabilidad describe la consistencia de los resultados de un procedimiento o medida en
Pruebas repetidas o ensayos. En el contexto de la medición, una medida confiable es una
que produce el mismo resultado cada vez que se usa la medida. Una medida poco fiable
es uno que produce resultados inconsistentes, a veces superiores, a veces inferiores.15
Supongamos, por ejemplo, que quiere medir el apoyo para el presidente entre la universidad
estudiantes Selecciona dos preguntas de encuesta similares (Ql y Q2) y pregunta al
Participantes en una muestra aleatoria de alumnos para responder a cada pregunta. Los
resultados
de esta muestra hubo 50 por ciento de apoyo para el presidente usando Ql y 50 por ciento
Apoyo para el presidente utilizando Q2. Pero, ¿qué podrías encontrar si preguntas al
¿Las mismas preguntas de múltiples muestras aleatorias de estudiantes? Serán los resultados
de cada uno.
¿La pregunta sigue siendo consistente, asumiendo que las muestras son idénticas? Si un
segundo
una muestra de estudiantes es encuestada, puede encontrar el mismo resultado, 50 por
ciento, para Ql pero
60 por ciento para Q2. Si tuviera que pedir Ql de múltiples muestras aleatorias de estudiantes
y el resultado fue consistentemente del 50 por ciento, podría afirmar que su medida, Ql,
es confiable. Si se solicitó Q2 a múltiples muestras aleatorias de estudiantes y cada muestra
De los estudiantes respondieron diferentes respuestas que oscilan entre el 40 por ciento
y 60 por ciento, podría concluir que Q2 es menos confiable que Ql porque Q2
Genera resultados inconsistentes cada vez que se usa.
Del mismo modo, puede evaluar la fiabilidad de los procedimientos también. Supongamos que
te dan
La responsabilidad de contar una pila de mil papeletas de voto para algunos públicos.
oficina. La primera vez que los cuentas, obtienes un resultado particular. Pero como eras
contando las boletas, usted podría haber sido interrumpido, dos o más boletas podrían
se han pegado, algunos pueden haber sido soplados en el suelo, o puede haber
anotó los totales incorrectamente: Como precaución, entonces, cuente cinco más
veces y consigue que otras cuatro personas las cuenten una vez cada una. La similitud de
Los resultados de los diez conteos serían una indicación de la confiabilidad o del conteo.
proceso.
Del mismo modo, suponga que desea probar la hipótesis de que el New York Times es
Más crítico con el gobierno federal que el Wall Street Journal. Esto sería
requiere que mida el nivel de crítica que se encuentra en los artículos de los dos documentos.
Necesitaría desarrollar criterios o instrucciones para identificar o medir
crítica. La confiabilidad de su esquema de medición podría evaluarse teniendo
Dos personas leen todos los artículos, calificando independientemente el nivel de crítica en
ellos.
de acuerdo a sus instrucciones, y luego comparar sus resultados. La fiabilidad sería
demostrado si ambas personas llegaron a conclusiones similares con respecto al contenido de
Los artículos en cuestión.
La fiabilidad de las medidas de la ciencia política se puede calcular de muchas maneras
diferentes.
formas. Aquí describimos tres métodos que a menudo se asocian con una prueba escrita.
Artículos o preguntas de la encuesta, pero las ideas pueden aplicarse en otros contextos de
investigación.
El método test-retest implica aplicar el mismo "test" a las mismas observaciones.
después de un período de tiempo y luego comparando los resultados de las diferentes
mediciones.
Por ejemplo, si se hace a un grupo una serie de preguntas que miden el liberalismo.
de los encuestados en dos días diferentes, una comparación de sus puntuaciones en ambos
momentos
podría ser utilizado como una indicación de la fiabilidad de la medida del liberalismo. Nosotros
Con frecuencia se involucran en el comportamiento de prueba-re-prueba en nuestra vida
cotidiana. Con que frecuencia tienes
¿Ha pisado la báscula de baño dos veces en cuestión de segundos?
El método test-retest para medir la confiabilidad puede ser difícil y problemático,
ya que hay que medir el fenómeno en dos puntos diferentes. Es posible
que se pueden obtener dos resultados diferentes porque lo que se está midiendo tiene
Cambiado, no porque la medida no sea confiable. Por ejemplo, si tu baño
la escala le da dos pesos diferentes en unos pocos segundos, la escala no es confiable,
como tu peso no puede haber cambiado. Sin embargo, si te pesas una vez a la semana.
durante un mes y descubre que obtiene resultados diferentes cada vez, la escala no es
confiable,
¿O ha cambiado su peso entre medidas? Otro problema con el
La verificación de la prueba de la prueba de confiabilidad es que la administración de la
primera medida puede
Afectar los resultados de la segunda medida. Por ejemplo, la diferencia entre el razonamiento
SAT
Los puntajes de la prueba la primera y segunda vez que los individuos toman la prueba pueden
no
suponer que es una medida de la fiabilidad de la prueba, ya que los examinados podrían
alterar
su comportamiento la segunda vez como resultado de tomar la prueba la primera vez (por
ejemplo,
Podría aprender de su primera experiencia con la prueba).
El método alternativo de medir la confiabilidad también implica medir la
mismo atributo más de una vez, pero utiliza dos medidas diferentes de la misma
Concepto en lugar de la misma medida. Por ejemplo, un investigador podría idear
dos conjuntos diferentes de preguntas para medir el concepto de liberalismo, pregunte lo
mismo
las preguntas de los encuestados en dos momentos diferentes utilizando un conjunto de
preguntas la primera
tiempo y el otro conjunto de preguntas la segunda vez, y compare las respuestas de los
encuestados
puntuaciones. El uso de dos formas diferentes de la medida reduce la posibilidad de que la
segunda
los puntajes están influenciados por la primera medida, pero aún requiere que el fenómeno
medirse dos veces. Dependiendo de la duración del tiempo entre las dos mediciones, lo que se
mide puede cambiar.
El método de medición de la confiabilidad de las mitades divididas consiste en aplicar dos
medidas
Del mismo concepto al mismo tiempo. Los resultados de las dos medidas son entonces.
comparado. Este método evita el problema de que el concepto que se está midiendo puede
Cambio entre medidas. El método de las mitades divididas se usa a menudo cuando un artículo
múltiple
La medida se puede dividir en dos mitades equivalentes. Por ejemplo, un investigador
puede concebir una medida de liberalismo consistente en las respuestas a diez preguntas
sobre
una encuesta de opinión pública. La mitad de estas preguntas podrían seleccionarse para
representar una
medida del liberalismo, y la otra mitad seleccionada para representar una segunda medida de
liberalismo. Si las puntuaciones individuales en las dos medidas del liberalismo son similares,
entonces
la medida de los diez elementos puede decirse que es confiable por el enfoque de las mitades
divididas.

Los métodos de prueba-retest, forma alternativa y mitades divididas proporcionan una base
para el cálculo
La similitud de resultados de dos o más aplicaciones del mismo o equivalente.
medidas Cuanto menos consistentes son los resultados, menos confiable es la medida. Político
Los científicos toman muy en serio la fiabilidad de las medidas que utilizan. Encuesta
A los investigadores a menudo les preocupa la fiabilidad de las respuestas que reciben. por
Por ejemplo, las respuestas de los encuestados a las preguntas de la encuesta a menudo varían
considerablemente cuando
Los instrumentos se dan en dos momentos diferentes. 16 Si los encuestados no se están
concentrando.
o tomando la encuesta en serio, las respuestas que brindan también pueden tener
ha sido sacado de un sombrero.
Ahora, volvamos al ejemplo de medir su peso con una balanza doméstica.
Si te pesas en la balanza de tu casa, ve al gimnasio y pesa
de nuevo allí, y obtenga el mismo número (prueba de confiabilidad de formas alternativas),
Puede concluir que su escala de casa es confiable. Pero que tal si obtienes dos diferentes.
¿números? Suponiendo que su peso no haya cambiado, ¿cuál es el problema? Si vas
Regrese a casa de inmediato y retroceda en la escala de su casa y descubra que da
una medida que sea diferente de la primera que te dio, podrías concluir
que su báscula tiene un mecanismo defectuoso, es inconsistente y, por lo tanto, no es
confiable.
Sin embargo, ¿qué pasa si la báscula de baño le da el mismo peso que la primera vez?
Parecería ser confiable. Tal vez la escala de gimnasio no sea confiable. Podrias probar
esto volviendo al gimnasio y pesándote a ti mismo. Si la escala de gimnasio da una
Lectura diferente a la que dio la primera vez, entonces no es confiable. Pero que si
La escala de gimnasia da lecturas consistentes? Cada escala parece ser confiable (las escalas
no le están dando diferentes pesos al azar), pero al menos uno de ellos está dando
una medida incorrecta (es decir, no le da su peso correcto). Esto es un
Problema de validez.
Validez
Esencialmente, una medida de yalid es una que mide lo que se supone que debe medir.
A diferencia de la fiabilidad, que depende de si las aplicaciones repetidas del mismo o
Las medidas equivalentes dan el mismo resultado, la validez se refiere al grado de
correspondencia. entre la medida y el concepto se piensa medir.
Consideremos primero un ejemplo de una medida cuya validez ha sido cuestionada:
participación electoral. Muchos estudios examinan los factores que afectan la participación de
los votantes y, por lo tanto, requieren una medición precisa de la participación de los
votantes. Una forma de medir el elector.
la participación es preguntar a las personas si votaron en la última votación autodeclarada en
las elecciones.
Sin embargo, dada la conveniencia social de votar en los Estados Unidos, usar el "I
votado "pegatina o publicación" voté "en un sitio de redes sociales puede traer recompensas
socialeswill
¿Los no votantes admiten que no votaron a un entrevistador? Algunos no votantes pueden
reclamar en las encuestas que han votado, lo que resulta en una medida no válida de la
participación de votantes tqat
exagera el número de votantes. De hecho, esto es lo que suele pasar. Encuestas de votantes
Se suele sobrestimar la participación en varios puntos porcentuales. 17
Una medida también puede ser inválida si mide un concepto ligeramente diferente.
de lo previsto Por ejemplo, supongamos que un investigador pretende medir la ideología,
conceptualizado como las opiniones políticas de un individuo en un continuo entre
conservadores,
moderado, y liberal. El investigador propone medir la ideología preguntando.
encuestados, '¿A qué partido se siente más cercano, el Partido Demócrata o
¿El Partido Republicano? "Esta medida sería inválida porque no mide
La ideología como conceptualizada. Afinidad partidista, aunque a menudo consistente con la
ideología,
No es lo mismo que la ideología. Esta medida podría ser una medida válida de identificación de
la parte,
Pero no la ideología.
Una medida de validez es más difícil de demostrar empíricamente que su confiabilidad
Porque la validez implica la relación entre la medición de un concepto.
y la presencia o cantidad real del propio concepto. Información sobre el
la correspondencia rara vez es abundante. No obstante, hay maneras de evaluar el
Validez de cualquier medida particular. En los siguientes párrafos explicamos varias
formas de pensar acerca de la validez, incluyendo cara, contenido, construcción e interitem
validez.
La validez de la cara puede ser afirmada (no demostrada empíricamente) cuando la medición
El instrumento parece medir el concepto que se supone que mide. A
evaluar la validez nominal de una medida, necesitamos saber el significado del concepto
siendo medido y si la información que se recopila es "pertinente a ese
concepto. "18 Por ejemplo, volvamos a pensar en cómo podríamos medir.
ideología política, es decir, si alguien es conservador, moderado o liberal.
Tal medida podría ser tan simple como una pregunta utilizada por el Centro de Investigación
Pew:
" ¿Te consideras conservador, moderado o liberal? " 19 En su cara,
Esta medida parece captar el concepto deseado, por lo que tiene validez aparente. Eso
podría ser tentador utilizar las respuestas de los individuos a una pregunta sobre la
identificación de la parte,
pero uno supondría que todos los demócratas son liberales y todos los republicanos son
conservadores Además, si la variable de identificación del partido incluía una categoría para
Independientes, ¿cuál sería su ideología? ¿Puedes asumir que todos son moderados?
Por estas razones, una pregunta que mide la identificación del partido carecería de cara
La validez como medida de la ideología.
En general, las medidas carecen de validez aparente cuando existen buenas razones para
cuestionar la
Correspondencia de la medida al concepto en cuestión. En otras palabras, evaluar
La validez de la cara es esencialmente una cuestión de juicio. Si no existe consenso sobre la
significado del concepto a medir, la validez aparente de la medida está limitada
ser problematico
La validez de contenido es similar a la validez de cara, pero implica determinar el dominio
completo
o el significado de un concepto particular y luego asegurarse de que todos los componentes de
El significado se incluye en la medida. Por ejemplo, supongamos que quisieras
diseñar una medida de la medida en que el sistema político de una nación es democrático.
Como se señaló anteriormente, la democracia significa muchas cosas para muchas
personas. Raymond D. Gastil
Construyó una medida de democracia que incluía dos dimensiones, derechos políticos.
y libertades civiles. Sus listas de verificación para cada dimensión constaban de once ítems. 20
Los científicos políticos a menudo están interesados en conceptos con múltiples dimensiones o
dominios complejos, como la democracia, y pasan bastante tiempo discutiendo y
Justificando el contenido de sus medidas. Para una medida de la concepción de Gastil.
de la democracia para lograr la validez de contenido, la medida debe capturar los once
Componentes en la definición.
Una tercera forma de evaluar la validez de una medida es demostrar empíricamente
validez de constructo La validez de construcción se puede entender de dos maneras
diferentes:
Validez constructiva convergente y validez constructiva divergente. Convergente const1:
La validez de 11cvt es cuando una medida de un concepto se relaciona con una medida de otro
Concepto con el que se piensa que el concepto original está relacionado. En otras palabras,
un investigador puede especificar, en términos teóricos, que dos conceptos deben ser
relacionados de manera positiva (por ejemplo, eficacia política con participación política o
educación con ingresos) o de manera negativa (por ejemplo, democracia y derechos
humanos).
abusos). El investigador luego desarrolla una medida de cada uno de los conceptos y examina
La relación entre ellos. Si las medidas son positivas o negativas.
correlacionada, entonces una medida tiene validez convergente para la otra medida. En el
En caso de que no haya una relación entre las medidas, entonces la relación ~ teórica
está en error, al menos una de las medidas no es una representación precisa de
El concepto, o el procedimiento utilizado para probar la relación es defectuoso. La ausencia
de una relación hipotética no significa que una medida sea inválida, pero la presencia
De una relación da cierta garantía de la validez de las medidas.

La validez de constructo discriminante implica dos medidas que teóricamente son
espera no estar relacionado; por lo tanto, se espera que la correlación entre ellos sea
bajo o débil Si las medidas no se correlacionan unas con otras, entonces discrimina
Se demuestra la validez de constructo.
Volvamos a la cuestión de medir el poder de los líderes legislativos porque
Proporciona un buen ejemplo de la importancia de la validez de constructo. Como señalamos
antes, el enfoque de influencia percibida para medir el poder es más difícil de
uso que el enfoque de poderes formales. Por lo tanto, si las dos medidas se muestran para
Tener validez de constructo, operacionalizando el poder de liderazgo utilizando los poderes
formales.
El enfoque por sí mismo podría ser una forma válida de medir el concepto. Si las dos medidas
no tienen validez de constructo, entonces estaría claro que los dos enfoques son
No midiendo lo mismo. Por lo tanto, qué medida se utiliza podría afectar en gran medida la
Resultados de la investigación sobre los factores asociados con la presencia de un liderazgo
fuerte.
poder o sobre las consecuencias de tal poder. Estas fueron las mismas preguntas.
planteado por el politólogo James Coleman Battista.21 Construyó varias medidas
de poder de liderazgo percibido y los correlacionó con una medida de formal
poder. Los resultados, mostrados en la tabla 5-1, muestran que la medida del poder formal
se correlaciona débilmente con tres medidas de poder percibido (que , como se esperaba,
correlacionar w ~ l entre sí). Por lo tanto, las medidas de poder percibido y la
Medida de poder formal no demostrada, validez de constructo convergente .
Una cuarta forma de demostrar la validez es a través de la asociación interitem Este es el
Tipo de prueba de validez más utilizada por los científicos políticos. Se basa en la similitud.
de resultados_ de más de una medida de un concepto para demostrar la validez de
Todo el esquema de medición. A menudo es preferible usar más de un elemento para
medir un concepto de confianza en una sola medida es más propenso a errores o errores de
clasificación
de un caso.22
Volvamos al investigador que quiere desarrollar una medida válida del liberalismo.
Primero, el investigador puede medir las actitudes de la gente hacia (1) bienestar, (2) militar
gastos, (3) aborto, (4 ) niveles de beneficios del Seguro Social, (5) acción afirmativa,
(6) un impuesto a la renta progresivo, (7) vales escolares, y (8) protección de los derechos
de los acusados. Entonces el investigador podría determinar cómo responden las respuestas
a cada uno.
La pregunta se relaciona con las respuestas a cada una de las otras preguntas. La validez de la
Se demostraría un esquema de medición si existieran relaciones fuertes entre
Las respuestas de las personas a través de las ocho preguntas.
Los resultados de dichas pruebas de asociación interemínica se muestran a menudo en una
correlación
matriz. Una pantalla de este tipo muestra la relación entre cada elemento y los elementos de
la medición.
esquema es a todos los demás elementos. En los datos hipotéticos mostrados en la tabla.
5-2, podemos ver que las respuestas de las personas a seis de las ocho medidas fueron
fuertemente
relacionadas entre sí, mientras que las respuestas a las preguntas sobre la protección de los
derechos
de los acusados y los vales escolares no formaban parte del patrón general. Por lo tanto, la
El investigador probablemente concluiría que los primeros seis elementos miden el liberalismo
y que, en conjunto, son una medida válida del liberalismo.
· Las cifras en la tabla 5-2 son correlaciones producto-momento: números que pueden variar
en valor de -1.0 a + LO y que indican la medida en que una variable es
Relacionado con otro. Cuanto más cercana sea la correlación a ± 1, más fuerte será la relación;
cuanto más cercana sea la correlación a 0.0, más débil será la relación (vea el capítulo 13 para
una explicación completa). Las cifras en las dos últimas filas están considerablemente más
cerca de 0.0
que las otras entradas, lo que indica que las personas responden a las preguntas sobre
vales escolares y los derechos de los acusados no siguieron el mismo patrón que su
Respuestas a las otras preguntas. Por lo tanto, parece que los vales escolares y los derechos
de los acusados no están conectados con el mismo concepto de liberalismo como medido por
las otras preguntas
El contenido y la validez nominal son difíciles de evaluar cuando falta un acuerdo sobre el
significado de un concepto, y validez de constructo, que requiere un desarrollo teórico bien
desarrollado.
Perspectiva, generalmente da un resultado menos que definitivo. La asociación interitem
La prueba requiere múltiples medidas del mismo concepto. Aunque estas vigencias
Las "pruebas" proporcionan evidencia importante, y es probable que ninguna de ellas respalde
un enfoque inequívoco.
Decisión sobre la validez de medidas particulares.
Problemas con la fiabilidad y la validez
en la medición de la ciencia política
Los investigadores de la encuesta a menudo quieren medir el ingreso familiar de los
encuestados. Medición
de esta variable básica ilustra las amenazas del número a la confiabilidad y
Validez de las medidas de la ciencia política. La siguiente es una pregunta utilizada en el 2004.
Estudio Electoral Nacional Americano (ANES):
Por favor, mire el folleto y dígame la carta del grupo de ingresos.
eso incluye los ingresos de todos los miembros de su familia que viven aquí en
2003 antes de impuestos. Esta cifra debe incluir salarios, salarios, pensiones,
Dividendos, intereses y todos los demás ingresos. Por favor dime la carta de la
grupo de ingresos · que incluye los ingresos que tenía en 2003 antes de impuestos.
Los encuestados recibieron las siguientes opciones:
A. Ninguna, o menos de $ 2,999 M. $ 30,000- $ 34, 999
B. $ 3,000- $ 4,999 N. $ 35,000- $ 39,999
C. $ 5,000- $ 6,999 0. $ 40, 000- $ 44, 999
D. $ 7,000- $ 8,999 P. $ 45,000- $ 49,999
E. $ 9,000- $ 10,999 Q. $ 50,000- $ 59, 999
E $ 11,000- $ 12,999 R. $ 60,000- $ 69,999
G. $ 13,000- $ 14,999 S. $ 70,000- $ 79, 999
H. $ 15,000- $ 16,999 T. $ 80,000- $ 89, 999
I. $ 17, 000- $ 19, 999 U. $ 90,000- $ 104,999
J. $ 20,000- $ 21,999 V $ 105,000- $ 119,999
K. $ 22,000- $ 24,999 w $ 120,000 y más
L. $ 25,000- $ 29,999
Tanto la fiabilidad como la validez de este método de medición de ingresos son cuestionables.
Las amenazas a la confiabilidad de la medida incluyen las siguientes:
• Los encuestados pueden no saber cuánto dinero ganan y, por lo tanto,
Adivina incorrectamente sus ingresos.
• Los encuestados pueden no saber cuánto dinero otros miembros de la familia
hacer "y adivinar incorrectamente. ·
• Los encuestados pueden saber cuánto ganan, pero seleccionan sin cuidado el
categorías incorrectas
• Los entrevistadores pueden rodear las categorías equivocadas al escuchar el
Selecciones de los encuestados.
• El personal de entrada de datos puede tocar los números incorrectos al ingresar el
respuestas en la computadora.
• Los entrevistadores deshonestos pueden adivinar incorrectamente los ingresos de un
encuestado
Quien no completa la entrevista.
• Los encuestados pueden no saber qué miembros de la familia incluir en el
ingreso total; algunos encuestados pueden incluir solo algunos miembros de la familia,
mientras que otros pueden incluir incluso relaciones distantes.
• Los encuestados cuyos ingresos se encuentran en la frontera entre dos categorías pueden
No sé cuál elegir. Algunos pueden elegir la categoría superior; otros,
la inferior
Debido a estos problemas de medición, si esta medida se aplicara a la misma
en dos momentos diferentes, podemos esperar que los resultados varíen, lo que resulta
en medidas inexactas que son demasiado altas para algunos encuestados y demasiado bajas
para otros.
Es probable que ocurra alguna cantidad de error de medición aleatoria con cualquier medición
esquema.
Además de estas amenazas a la confiabilidad, existen numerosas amenazas a la validez
de esta medida:
• Los encuestados pueden tener ingresos ilegales que no quieren revelar y_
por lo tanto, puede subestimar sistemáticamente sus ingresos.
• Los encuestados pueden tratar de mejorar al entrevistador, oa ellos mismos,
Sobreestimando sistemáticamente sus ingresos.
• Los encuestados pueden subestimar sistemáticamente sus ingresos antes de impuestos
porque piensan en su salario neto y subestiman cuánto
el dinero está siendo retenido de sus cheques de pago.
• Los encuestados pueden omitir sistemáticamente la pregunta debido a la privacidad
Se preocupa por proporcionar un número preciso, incluso si lo saben.
Observe que esta segunda lista de problemas contiene la palabra sistemáticamenteT. estos
los problemas no son simplemente causados por inconsistencias aleatorias en las mediciones,
con
algunos bein, g. demasiado alto y otros demasiado bajo por razones impredecibles. Facilitación
Sistemática
el error introduce un error que puede sesgar los resultados de la investigación,
comprometiendo así
La confianza que tenemos en ellos.
Esta larga lista de problemas con la fiabilidad y la validez de este bastante
La medida directa de un concepto relativamente concreto es preocupante. Imagina como
mucho más difícil es desarrollar medidas confiables y válidas cuando el concepto
es abstracto (por ejemplo, tolerancia, conciencia ambiental, autoestima o liberalismo)
Y el esquema de medición es más complicado.
La fiabilidad y validez de las medidas utilizadas por los científicos políticos rara vez son
demostrado a la satisfacción de todos. La mayoría de las medidas de los fenómenos políticos
son
ni completamente inválido o válido ni completamente poco confiable o confiable sino, más
bien,
son en parte precisos. Por lo tanto, los investigadores generalmente presentan la justificación
y evidencia
disponible en apoyo de sus medidas e intento de persuadir a su audiencia
que sus medidas son al menos tan precisas como lo serían las medidas alternativas.
No obstante, una postura escéptica por parte del lector hacia la fiabilidad y
La validez de las medidas de la ciencia política es a menudo justificada.
Tenga en cuenta, finalmente, que la fiabilidad y la validez no son lo mismo. Una medida puede
Ser confiable sin ser válido. Uno puede idear una serie de preguntas a medida.
El liberalismo, por ejemplo, que produce el mismo resultado para las mismas personas cada
vez.
pero eso identifica erróneamente a los individuos. Una medida válida, sin embargo, también
será confiable: si
mide con precisión el concepto en cuestión, luego lo hará, de manera consistente en
Las mediciones permiten, por supuesto, un error de medición aleatorio que puede
ocurrir. Es más importante, entonces, demostrar la validez que la fiabilidad, pero la fiabilidad
Por lo general, se prueba con mayor facilidad y precisión.
La precisión de las mediciones.
Las mediciones no solo deben ser precisas sino también precisas; es decir, medidas
Debe contener tanta información como sea posible sobre el atributo o comportamiento
siendo medido. Cuanto más precisas sean nuestras medidas, más completas e informativas.
Puede ser nuestra prueba de las relaciones entre dos o más variables.
Supongamos, por ejemplo, que quisiéramos medir la altura de los candidatos políticos
Para ver si los candidatos más altos suelen ganar las elecciones. La altura se puede medir en
muchos
diferentes caminos. Podríamos tener dos categorías de la variable "altura" -tall y
corto y asignar diferentes candidatos a las dos categorías en función de si
eran de altura por encima de la media o por debajo de la media. O podríamos comparar las
alturas.
de candidatos que se postulan para el mismo cargo y en qué medida el candidato fue el
Más alto, que el siguiente más alto, y así sucesivamente. O podríamos tomar una cinta métrica
y medir
La altura de cada candidato es en pulgadas y registra esa medida. El último método de
La medición captura la mayor cantidad de información sobre la altura de cada candidato y es,
Por lo tanto , la medida más precisa del atributo.
Niveles de Medición
Cuando consideramos la precisión de nuestras mediciones, nos referimos al nivel de
medición. El nivel de medición involucra el tipo de información que nosotros
Creo que nuestras medidas contienen y las propiedades matemáticas que determinan.
el tipo de comparaciones que se pueden hacer a través de una serie de observaciones en el
misma variable El nivel de medición también se refiere a la reclamación que estamos
realizando para
Hacer cuando asignamos números a nuestras medidas.
Hay cuatro niveles diferentes de medición: nominal, ordinal, intervalo y relación.
Si bien pocos conceptos utilizados en la investigación en ciencias políticas requieren de manera
inherente una
nivel de medición, hay limitaciones metodológicas porque algunas medidas
Proporcionar más información y mejores propiedades matemáticas que otros. Entonces el
El nivel de medición utilizado para medir cualquier concepto particular es una función de
ambos.
La imaginación y los recursos del investigador, y las necesidades metodológicas.
Comenzamos con la medición nominal, el nivel que tiene la menor cantidad de matemática.
Propiedades de los cuatro niveles. Una medida de nivel nominal indica que los valores
asignados a una variable representan solo diferentes categorías o clasificaciones para ese
variable. En tal caso, ninguna categoría es más o menos que otra categoría; ellos
son simplemente diferentes ... Por ejemplo, supongamos que medimos la religión de los
individuos
pidiéndoles que indiquen si son cristianos, judíos, musulmanes u otros.
Dado que las cuatro categorías o valores para la religión variable son simplemente diferentes,
La medida se encuentra en un nivel nominal. Otros ejemplos comunes de medidas de nivel
nominal son el género, el estado civil y el estado de residencia. Una medida nominal
de afiliación partidista podría tener las siguientes categorías: demócrata, republicano,
Verde, libertario, otro, y ninguno. Los números serán asignados a las categorías.
cuando los datos se codifican para el análisis estadístico, pero estos números no representan
diferencias matemáticas entre las categorías - cualquiera de las partes podría ser
asigna cualquier número, siempre que esos números sean diferentes entre sí. En
En este sentido, las medidas de nivel nominal proporcionan la menor cantidad de información
sobre un concepto. Una medida ordinaria tiene todas las propiedades de una medida nominal
pero también asume que las observaciones pueden compararse en términos de tener más o
menos de un atributo particular. Por lo tanto, el nivel ordinal de medición capta más
Información sobre el concepto medido y tiene más propiedades matemáticas que una medida
de nivel nominal. Por ejemplo, podríamos crear una medida ordinal de educación formal
completada con las siguientes categorías: "octavo grado o menos"
"algo de escuela secundaria", "graduado de escuela secundaria", "algo de universidad" y
"título universitario o
más. "Aquí no nos preocupa la diferencia exacta entre las categorías
de educación, pero solo con si una categoría es más o menos que otra.
Al codificar esta variable, asignamos números más altos a categorías más altas
de Educación. Los intervalos entre los números no tienen significado; todo lo que importa
es que los números más altos representan más del atributo que los números más bajos.
Una variable ordinal que mide la afiliación partidista con las categorías "fuerte
Republicano, "republicano débil", "ni republicano ni demócrata inclinado"
A los "débiles demócratas" y "fuertes demócratas" se les pueden asignar los códigos 1, 2, 3, 4,
5 o 1,
2, 5, 8, 9 o cualquier otra combinación de números, siempre y cuando estén en ascenso
o orden descendente.
Variables nominales dicotómicas, es decir, variables de nivel nominal con solo dos
categorías - son medidas de nivel nominal, pero con frecuencia tratadas como nivel ordinal
medidas Por ejemplo, podríamos medir la capacidad nuclear con dos categorías,
donde un país que tiene capacidades nucleares se codificaría como uno y como país
Eso no sería codificado como un cero. Se podría interpretar esta variable como
La capacidad nuclear está presente o ausente en un país y, por lo tanto, uno representa
Más del concepto, capacidad nuclear. Para dar otro ejemplo, una persona
Quien no votó en la última elección carece o tiene menos del atributo de tener
Votado que una persona que votó.
Debido a que las medidas nominales y ordinales se basan en categorías, es importante hacer
Seguro que estas variables son exhaustivas y exclusivas. E xhaustive re fiere al hacer
Asegúrese de que todas las categorías posibles, o opciones de respuesta, se tienen en
cuenta. Lo más simple
La solución para asegurarse de que una variable sea exhaustiva es incluir una categoría "otro".
que se puede utilizar para valores que no están representados en las categorías identificadas.
Los beneficios exclusivos se aseguran de que un solo valor o respuesta solo pueda caber en
uno
categoría. Cada categoría debe ser distinta de las demás, sin superposición.
Debatiendo el nivel de medida
El siguiente nivel de medición, una medición • de intervalo, incluye las propiedades
del nivel nominal (las características son diferentes) y el nivel ordinal (características
se puede poner en un orden significativo). Pero a diferencia de los niveles de medición
anteriores,
los intervalos Entre las categorías o valores asignados a las observaciones se hace.
tiene significado El valor de una observación particular es importante no solo en términos de
ya sea mayor o menor que otro valor (como en las medidas ordinales) pero también en
términos de cuánto más grande o más pequeño es. Por ejemplo, supongamos que grabamos el
año.
en el que ocurrieron ciertos eventos. Si tenemos tres observaciones-1950, 1962, y
1977-sabemos que el evento en 1950 ocurrió doce años antes que el de 1962.
y veintisiete años antes del de 1977. Un cambio de una unidad (el intervalo) todo
a lo largo de esta medida es idéntico en significado: el paso de un año.
Otra característica de un intervalo de nivel de medida que lo distingue.
del siguiente nivel de medición (relación) es que una medición de nivel de intervalo tiene una
Punto cero asignado arbitrariamente que no representa la ausencia del atributo.
siendo medido. Por ejemplo, muchas escalas de tiempo y temperatura tienen arbitrario
cero puntos. Por lo tanto, el año O CE no indica el comienzo del tiempo, si esto
si fueran ciertas, no habría fechas BCE. Tampoco 0 ° C indica la ausencia de calor;
más bien, indica la temperatura a la cual el agua se congela. Por este motivo, con
Las mediciones a nivel de intervalo no podemos calcular las relaciones; es decir, no podemos
decir eso
60 ° F es dos veces más cálido que 30 ° E Entonces, mientras que el nivel de intervalo de
medición se captura
Más información y propiedades matemáticas que los niveles nominales y ordinales.
No tiene todas las propiedades de las matemáticas.
El nivel final de medición es una medida de relación. Este tipo de medida
implica las propiedades matemáticas completas de los números y contiene la mayor cantidad
posible
Información sobre un concepto medido. Es decir, una medida de nivel de relación incluye
Los valores de las categorías, el orden de las categorías y los intervalos entre
las categorias también indica con precisión las cantidades relativas de la variable que
Las categorías representan porque su escala incluye un cero significativo. Si, por ejemplo,
un investigador está dispuesto a afirmar que una observación con diez unidades de una
variable
Posee exactamente el doble de ese atributo que una observación con cinco
unidades de esa variable, entonces existe una medida de nivel de relación. La clave para hacer
esto.
El supuesto es que un valor de cero en la variable en realidad representa la ausencia
de esa variable. Debido a que las medidas de relación tienen un punto cero verdadero, tiene
sentido
Digamos que una medida es x veces otra. Tiene sentido decir que un niño de sesenta años
persona tiene el doble de edad que una persona de treinta años (60/30 = 2), mientras que no
tiene
tiene sentido decir que 60 ° C es dos veces más cálido que 30 ° C. 23
Los investigadores de la ciencia política han medido muchos conceptos en el nivel de
relación. De la gente
edades, tasas de desempleo, porcentaje del voto para un candidato en particular,
y las tasas de crim'e son todas las medidas que contienen un punto cero y poseen la
matemática completa
Propiedades de los números utilizados. Sin embargo, más investigación en ciencias políticas.
probablemente se haya basado en medidas de nivel nominal y ordinal que en intervalos o
Medidas a nivel de ratio. Esto ha restringido los tipos de hipótesis y técnicas de análisis.
que los científicos políticos han estado dispuestos y capaces de usar.
Identificar el nivel de medición de las variables es importante, ya que afecta la
Análisis de datos, técnicas que se pueden utilizar y las conclusiones que se pueden extraer.
sobre las relaciones entre variables. Los métodos de orden superior a menudo requieren una
mayor
Niveles de medición, mientras que otros métodos han sido desarrollados para niveles más
bajos. de la medida. La decisión de qué nivel de medición usar no es siempre una
una directa, y la incertidumbre y el desacuerdo a menudo existen entre los investigadores
en relación con estas decisiones. Pocos fenómenos requieren inherentemente uno en
particular
Nivel de medida. A menudo, un fenómeno se puede medir con cualquier nivel de
Medición, dependiendo de la técnica particular diseñada por el investigador.
y las afirmaciones que el investigador está dispuesto a hacer sobre la medida resultante.
Trabajar con precisión: muy poco o demasiado
Los investigadores usualmente tratan de diseñar un alto nivel de medición para sus conceptos.
como sea posible (siendo nominal el nivel más bajo de medición y la relación más alta).
Con un nivel más alto de medición, las técnicas de análisis de datos más avanzadas pueden
ser utilizados, y se pueden hacer declaraciones más precisas sobre las relaciones entre
variables Así, los investigadores miden actitudes o conceptos con múltiples operativas.
Las definiciones a menudo construyen una escala o un índice a partir de medidas de nivel
nominal
que permite al menos comparaciones a nivel ordinal entre observaciones. Discutimos
La construcción de índices y escalas con mayor detalle en los siguientes párrafos.
Es fácil transformar la información a nivel de relación (p. Ej., Edad en número de años) en un
nivel ordinario
información (por ejemplo, grupos de edad). Sin embargo, si empiezas con el nivel ordinal
medida, grupos de edad, no tendrá la edad real de cada persona. Si tu decides
Si desea utilizar la edad real de una persona, tendrá que recopilar que d ~ ta-it no puede ser
creado a partir de una medida de nivel ordinal. Del mismo modo, un investigador que investiga
el
El efecto del gasto de la campaña en los resultados electorales podría usar una variable de
nivel de relación
medir cuánto gastó cada candidato en su campaña. Esta informacion
Podría usarse para construir una nueva variable que indique cuánto más uno
candidato gastado que el otro, o simplemente si un candidato gastó más
que su oppone ~ t. Los gastos de los candidatos también podrían agruparse en rangos.
Variables nominales y ordinales con muchas categorías o intervalo y nivel de relación
Las medidas que usan más decimales son más precisas que las medidas con menos
categorías o lugares decimales, pero a veces el resultado puede proporcionar más información
que puede ser utilizado Los investigadores frecuentemente comienzan con medidas a nivel de
razón o
~ medidas ordinales y nominales con bastantes categorías pero luego colapso
o combinar los datos para crear grupos o menos categorías. Ellos hacen esto así que Jh ~ t
tener suficientes casos en la categoría e · ach para el análisis estadístico o para hacer
comparaciones
más fácil de seguir. Por ejemplo, uno podría querer presentar comparaciones simplemente
entre demócratas y republicanos en lugar de presentar datos desglosados en
Categorías de fuerte, moderado y débil para cada parte.
Puede parecer contradictorio ahora señalar algunas medidas extremadamente precisas
Puede crear problemas. Por ejemplo, las medidas con muchas posibilidades de respuesta
toman
espacio si son preguntas en un cuestionario escrito o requieren más tiempo para explicar si
están incluidos en una encuesta telefónica. Tales preguntas también pueden confundir
o encuestados encuestados. Un problema más serio es que pueden llevar a la medición.
error. Piense en las posibles respuestas a una pregunta que hacen los encuestados
usar una escala de 100 puntos (llamada escala de termómetro) para indicar su apoyo
Para u oposición a un candidato político, suponiendo que 50 es considerado como el neutral
la posición y 9 es la menos favorable o "más fría" y 100 la más favorable. Algunos encuestados
no puede usar la escala completa (para ellos, ningún candidato merece más que
un 80 o menos que un 20), mientras que otros pueden usar los fines y la mitad de
La escala e ignora las puntuaciones intermedias. Podríamos predecir que una persona que
le da a un candidato un 100 es más probable que vote por ese candidato que una persona
quien le da al mismo candidato un 80, pero en realidad les puede gustar el candidato
de la misma manera y sería igualmente probable que voten por el candidato.
Otro problema con las mediciones demasiado precisas es que pueden no ser confiables.
Si se les pide que califiquen a los candidatos en más de una ocasión, los encuestados pueden
variar
ligeramente el número que elijan, incluso si su opinión no ha cambiado.
Medidas de varios artículos
Muchas medidas consisten en un solo elemento. Por ejemplo, las medidas de fiesta.
identificación, ya sea que una parte controle el Congreso, el porcentaje de
el voto recibido por un candidato, cuán preocupado por un tema es una persona, el
área de política de un caso judicial, y la edad se basa en una sola medida de cada
Fenómeno en cuestión. A menudo, sin embargo, los investigadores necesitan idear
medidas. de
Fenómenos más complicados que tienen más de una faceta o dimensión. por
Ejemplo, internacionalismo, ideología política, conocimiento político, dispersión de
El poder político y la medida en que una persona es políticamente activa son complejos.
Fenómenos o conceptos que pueden ser medidos de muchas maneras diferentes.
En esta situación, los investigadores a menudo desarrollan una estrategia de medición que les
permite
para capturar numerosos aspectos de un fenómeno complejo al tiempo que representa la
existencia de este fenómeno en casos particulares con un solo valor representativo.
Por lo general, esto implica la construcción de un índice o escala de varios elementos "que
representa
Las varias dimensiones del fenómeno. Estas medidas de elementos múltiples son útiles
porque mejoran la precisión de una medida, simplifican los datos de un investigador
Reduciéndolos a un tamaño más manejable, y aumentar el nivel de medición.
de un fenomeno. En el resto de esta sección, describimos varias
Tipos de índices y escalas.
Índices
Un índice de resumen es un método para acumular puntajes en ítems individuales para
formar una medida compuesta de un fenómeno complejo. Un índice se construye asignando
un rango de puntuaciones posibles para un cierto número de elementos, determinando el
puntuación para cada elemento para cada observación, y luego combinando las puntuaciones
para cada elemento
Observación a través de todos los elementos. El puntaje sumario resultante es el
representante.
Medida del fenómeno.
Un investigador interesado en medir cuánta libertad existe en diferentes países,
por ejemplo, podría construir un índice de libertad política elaborando una lista de elementos
de acuerdo con el concepto, determinando dónde puntúan los países individuales en cada
ítem,
y luego agregando estos puntajes para obtener una medida de resumen. En la tabla 5-3, tal
hipotética
El índice se utiliza para medir la cantidad de libertad en los países A a E.
El índice en la tabla 5-3 es simple y aditivo; es decir, cada elemento cuenta igualmente
hacia el cálculo de la puntuación del índice, y la puntuación total es la suma de
las puntuaciones de los elementos individuales. Sin embargo, los índices se pueden construir
con más complicados.
procedimientos de agregación y contando algunos elementos como más importantes
que otros. En el ejemplo anterior, un investigador podría considerar algunos indicadores
La libertad es más importante que otras y desea que contribuyan más.
Para el cálculo de la puntuación del índice final. Esto se puede hacer ya sea
ponderando (multiplicando) algunas puntuaciones de elementos por un número que indique
su importancia o por
asignando una puntuación más alta que 1 a los atributos considerados más importantes.
Los índices se utilizan a menudo con encuestas de opinión pública para medir las actitudes
políticas.
Esto se debe a que las actitudes son fenómenos complejos y por lo general no sabemos.
suficiente sobre ellos para diseñar medidas de un solo elemento. Así que a menudo nos
hacemos varias preguntas.
de personas sobre una sola actitud y agregue las respuestas para representar el
actitud. Un investigador podría medir las actitudes hacia el aborto, por ejemplo, por
pidiendo a los encuestados que elijan una de las cinco posibles respuestas: estoy totalmente
de acuerdo
Indeciso, en desacuerdo y totalmente en desacuerdo con las siguientes tres afirmaciones:
(1) Los abortos deben permitirse en los primeros tres meses de embarazo. (2) Abortos
Debe permitirse si la vida de la mujer está en peligro. (3) Se deben permitir los abortos.
cada vez que una mujer quiere uno.
Se podría calcular un índice de actitudes hacia el aborto asignando números
valores para cada respuesta (como 1 para stronga gree, 2 para acuerdo, 3 para undecideda, nd
y luego agregando los valores de las respuestas de un encuestado a estas tres preguntas.
(El investigador tendría que decidir qué hacer cuando un encuestado no lo hizo
responda a una o más de las preguntas.) El puntaje más bajo posible en este caso
ser un 3, indicando la actitud pro-aborto más extrema, y la más alta posible
El puntaje sería 15, lo que indica la actitud anti-aborto más extrema. Puntuaciones en
entre se indicarían diversos grados de aprobación del aborto.
Los índices suelen ser formas bastante simples de producir puntuaciones únicas
representativas de
Fenómenos complicados como las actitudes políticas. Probablemente sean más precisos.
que la mayoría de las medidas de un solo elemento, pero también pueden tener defectos
importantes
formas. La agregación de puntajes en varios elementos supone, por ejemplo, que cada
elemento
es igualmente importante para la medida de resumen del concepto y que los elementos
Usado fielmente abarca el dominio del concepto. Altho.ugh artículo individual
los puntajes se pueden ponderar para cambiar su contribución a la medida de resumen, la
El investigador a menudo tiene poca información sobre la cual basar un esquema de
ponderación.
Varios índices estándar se utilizan a menudo en la investigación de la ciencia política. El crimen
del FBI
. índice, el Índice de confianza del consumidor y el Índice de precios al consumidor, por
ejemplo,
Han sido utilizados por muchos investigadores. Antes de usar estos o cualquier otro disponible
índice, debe familiarizarse con su construcción y ser consciente de cualquier
Preguntas planteadas sobre su validez. Aunque los índices de sumas simples son generalmente
más precisa que las medidas de un solo elemento de fenómenos complicados, a menudo es
No está claro qué tan válidos son o qué nivel de medición representan. Por ejemplo,
es el índice de libertad una medida de nivel ordinal, o podría ser un nivel de intervalo
o incluso una medida de nivel de relación? Otro posible problema con los índices, como el
El índice de precios al consumidor es que lo que entra en su cálculo puede cambiar con el
tiempo.
Escamas
Aunque los índices son generalmente una mejora con respecto a las medidas de un solo
elemento, su
La construcción también contiene un elemento de arbitrariedad. Tanto la selección de
particular
Elementos que componen el índice y la forma en que los puntajes en elementos individuales
Los agregados se basan en el criterio de los investigadores. Las escalas también son múltiples
elementos
medidas, pero la selección y combinación de elementos en ellos se logra más
sistemáticamente de lo que suele ser el caso de los índices. Con los años, varios diferentes
tipos de escalas de múltiples elementos se han utilizado con frecuencia en la investigación de
ciencias políticas.
Discutimos tres de ellos: escalas Likert, escalas Guttman y escalas Mokken.
Una puntuación de la escala de Likert se calcula a partir de las puntuaciones obtenidas en
elementos individuales.
Cada ítem generalmente le pide al encuestado que indique un grado de acuerdo o desacuerdo
con el artículo, como con las preguntas sobre el aborto discutidas anteriormente. Sin embargo,
una escala Likert difiere de un índice en que una vez que los puntajes en cada uno de los ítems
se obtienen, solo algunos de los ítems se seleccionan para su inclusión en el cálculo de
El puntaje final. Aquellos ítems que le permiten al investigador distinguir más fácilmente
aquellos
puntuación alta en un atributo de aquellos puntuación baja se mantendrá, y un nuevo
el puntaje de la escala se calculará basándose únicamente en esos ítems.
Por ejemplo, considere al investigador interesado en medir el liberalismo de un
grupo de encuestados. Dado que las definiciones de liberalismo, el investigador no puede ser
¿Cuántos aspectos del liberalismo necesitan ser medidos? Con la escala Liken, la
El investigador comenzaría con un gran grupo de preguntas pensadas para expresar diversos
Aspectos del liberalismo con los que se pediría a los encuestados que estuvieran de acuerdo o
en desacuerdo.
Una escala de Liken provisional para el liberalismo, entonces, podría parecerse a la de la tabla
5-4.
En la práctica, un conjunto de preguntas como esta se dispersaría a lo largo de un cuestionario.
Para que los encuestados no los vean como relacionados. Algunas de las preguntas podrían
También puede redactarse de la manera opuesta (es decir, una respuesta "de acuerdo" es
conservadora).
respuesta) para asegurar respuestas genuinas.
Las respuestas de los encuestados a estas ocho preguntas se sumarían para producir
Un puntaje provisional. Las puntuaciones en este caso pueden variar de 8 a 40. Luego,
las respuestas de las personas más liberales y más conservadoras a cada pregunta
sería comparado Cualquier pregunta con respuestas similares de los encuestados dispares
serían eliminadas, tales preguntas no distinguirían a los liberales
conservadores Se calcularía una nueva puntuación de escala de resumen para todos los
encuestados
De las preguntas que quedaron. Una estadística llamada alfa de Cronbach, que
mide la consistencia interna de los elementos en la escala y tiene un valor máximo de
1.0, se utiliza para determinar qué elementos se deben eliminar de la escala. La regla de oro es
que el alfa de Cronbach debería ser 0,8 o superior; los objetos se caen de la escala uno
a la vez hasta que se alcance este valor. 25
Las escalas de Liken son mejoras sobre los índices de varios elementos porque los elementos
que
Las medidas de varios elementos se seleccionan en parte en función de la información de los
encuestados.
comportamiento más que en el juicio de los investigadores. Las escalas Likert sufren dos de las
Otros defectos de los índices, sin embargo. El investigador no puede estar seguro de que todas
las dimensiones
de un concepto se ha medido, y la importancia relativa de cada elemento es
Aún se determina arbitrariamente.
La escala de Guttman también usa una serie de elementos para producir una puntuación de
escala para los encuestados.
Sin embargo, a diferencia de la escala de Likert, una escala de Guttman presenta a los
encuestados una
gama de opciones de att, que son cada vez más difíciles de acordar; es decir, los elementos
componiendo el rango de escala de aquellos con los que es fácil estar de acuerdo con aquellos
que están de acuerdo
con. Los encuestados que estén de acuerdo con uno de los puntos de actitud "más difíciles"
también
En general están de acuerdo con los "menos difíciles". (Las escalas de Guttman también se han
usado para
medir atributos distintos de las actitudes. Su principal aplicación ha sido en la zona.
de la investigación de actitudes, sin embargo, aquí se utiliza un ejemplo de ese tipo.)
Volvamos al investigador interesado en medir las actitudes hacia el aborto.
Él o ella puede diseñar una serie de artículos que van desde "fácil de estar de acuerdo con" a
"difícil"
para estar de acuerdo con. "Tal enfoque podría estar representado por los siguientes ítems:
¿Está de acuerdo con que no esté de acuerdo con los abortos?
1. La vida de la mujer está en peligro.
2. En caso de incesto o violación.
3. Cuando el feto parece ser insalubre.
4. Cuando el padre no quiere tener un bebé.
5. Cuando la mujer no puede darse el lujo de tener un bebé.
6. Cuando la mujer quiera uno.
Este conjunto de elementos parece dar lugar a respuestas consistentes con Guttman
escalada. Un encuestado que esté de acuerdo con cualquiera de los ítems también estará de
acuerdo con
esos artículos numerados más bajos que ese. Esto daría lugar a la "paso a paso"
Patrón de respuestas característico de una escala de Guttman.
Supongamos que seis encuestados respondieron a esta serie de preguntas, como se muestra
en la tabla 5-5.
En términos generales, el patrón de respuestas es el esperado; los que estuvieron de acuerdo
con
las preguntas "más difíciles" también coincidían con las "menos difíciles".
Sin embargo, las respuestas de tres personas (2, 4 y 5) a la pregunta sobre el padre
Las preferencias no se ajustan al patrón. En consecuencia, la pregunta sobre el padre hace
Parece que no encaja con el patrón y se eliminaría de la escala. Una vez que eso ha sido
Hecho, el patrón paso a paso se vuelve claro.
Con datos reales, es poco probable que cada encuestado dé respuestas que se ajusten a la
patrón perfectamente Por ejemplo, en la tabla 5-5, el encuestado 6 dio una respuesta de
"acuerdo"
A la pregunta sobre el incesto o la violación. Esta respuesta es inesperada y no encaja
el patrón. Por lo tanto, estaríamos cometiendo un error si asignáramos una puntuación de
escala de 0
al encuestado 6. Cuando los datos se ajustan bien al patrón de escala (el número de errores es
pequeño),
los investigadores asumen que la escala es una medida adecuada y que el encuestado
El "error" puede ser "corregido" (en este caso, ya sea el "acuerdo" en el caso de incesto
o la violación o el "desacuerdo" en el caso de la vida de la mujer). Hay estandar
procedimientos a seguir para determinar cómo corregir los datos para que se ajusten a los
patrón de escala Destacamos, sin embargo, que esto se hace. Solo si los cambios son pocos.
Las escalas de Guttman difieren de las de Likert en que, en el primer caso, generalmente solo
un conjunto de respuestas dará una puntuación de escala particular. Es decir: - para obtener
una puntuación de 3 en la escala de aborto, un patrón particular de respuestas (o algo muy
cercano a
it) es necesario: en el caso de una escala Likert, sin embargo, muchos patrones diferentes de
Las respuestas pueden dar la misma puntuación de escala. Una escala Guttman también es
mucho más difícil.
para alcanzar una escala Likert, ya que los artículos deben haber sido ordenados y
percibido por los encuestados como representando respuestas cada vez más difíciles
Reflejando la misma actitud.
Las escalas Likert y Guttman tienen deficiencias en su nivel de medición.
El nivel de medición producido por las escalas de Likert es, en el mejor de los casos, ordinal (ya
que
· No sé la importancia relativa de cada elemento y, por lo tanto, no puedo estar seguro de que
5
la respuesta en un elemento es la misma que la respuesta 5 en otro), y el nivel de medición
producido por escalas de Guttman se asume generalmente como ordinal.
Otro tipo de procedimiento de escalado, llamado escalado Mokken, también analiza las
respuestas
a múltiples elementos por los encuestados para ver si, para cada elemento, los encuestados
pueden ser
ordenados y si los artículos pueden ser ordenados.26 Saundra K. utilizó la escala Mokken.
Schneider, William G. Jacoby y Daniel C. Lewis para ver si había estructura y
coherencia en la opinión pública sobre la distribución de responsabilidades entre
El gobierno federal y los gobiernos estatales y locales. Se preguntó a los encuestados.
si los gobiernos estatales o locales pensaron que "deberían tomar la iniciativa" en lugar de
El gobierno nacional para trece ámbitos políticos diferentes. El procedimiento de escala
permitió a los investigadores ver si surgía una secuencia específica de políticas mientras se
movía
De un extremo a otro de la escala. Un extremo de la escala indicaría
apoyo máximo para la actividad política nacional, mientras que el otro extremo indicaría
Máximo apoyo a la responsabilidad política del gobierno subnacional.
Los resultados de su análisis se muestran en la figura 5-1. La escala va desde Oto 13,
con O indicando que el gobierno nacional debería tomar la iniciativa en los trece
áreas de política y una puntuación de 13 que indica que el encuestado cree que el estado y
Los gobiernos locales deben tomar la iniciativa en todas las áreas políticas. Una persona a
cualquier escala
Score cree que los gobiernos estatales y locales deben tomar la iniciativa en todas las políticas
áreas que caen por debajo de esa puntuación. Por lo tanto, una persona con una puntuación
de 9 cree que
El gobierno nacional debe tomar la iniciativa en el cuidado de la salud, la igualdad para las
mujeres,
la protección del medio ambiente y la igualdad de oportunidades, y que los gobiernos estatales
y locales
Debería tomar la responsabilidad principal de los desastres naturales hasta las zonas urbanas.
desarrollo. Las barras en la figura corresponden al porcentaje de encuestados que recibieron
una puntuación particular. Así, apenas un poco más del 5 por ciento de la
los encuestados pensaron que los gobiernos estatales y locales deberían tomar la iniciativa en
todos
políticas, mientras que solo el 1% de los encuestados pensaba que el gobierno nacional
debe tomar la iniciativa en las trece áreas políticas. La mayoría de los encuestados divididos
arriba las responsabilidades. Los autores concluyeron de su análisis que el público sí tiene una
razón detrás de sus preferencias para la distribución de responsabilidades políticas
entre gobiernos nacionales y estatales y locales.
Los procedimientos descritos hasta ahora para construir medidas de múltiples elementos son
bastante
sencillo. Existen otras técnicas estadísticas avanzadas para resumir
o combinando elementos individuales o variables. Por ejemplo, es posible que varias
Las variables están relacionadas con algún concepto subyacente. El análisis factorial es un
estadístico.
Técnica que puede usarse para descubrir patrones a través de medidas. Es especialmente
Es útil cuando un investigador tiene un gran número de medidas y cuando hay incertidumbre.
Sobre cómo las medidas están interrelacionadas.
Un ejemplo es el análisis de Daniel D. Dutcher, quien realizó una investigación sobre el
Actitudes de los propietarios de la propiedad del arroyo hacia la mejora de la calidad del agua.
estrategia de plantar árboles en una banda ancha (llamados amortiguadores ribereños) a lo
largo de los arroyos.28 Pidió a los terratenientes que calificaran la importancia de doce
elementos pensados
para afectar la disposición de los terratenientes para crear y mantener amortiguadores
ribereños. Él
Quería saber si las actitudes podían agruparse en distintas dimensiones.
que podrían usarse como variables de resumen en lugar de usar cada uno de los once
elementos
por separado. Usando el análisis factorial, encontró que los elementos se dividieron en tres
dimensiones.
Estas dimensiones y los elementos incluidos en cada dimensión se enumeran en
tabla 5-6. La primera dimensión, que él denominó "manteniendo la estética de la propiedad".
elementos incluidos, como mantener una vista de la secuencia, pulcritud y mantenimiento
espacio abierto. Una segunda dimensión contenía elementos relacionados con la preocupación
por el agua.
calidad. La tercera dimensión relacionada con la protección de la propiedad contra daños o
pérdidas.
El análisis factorial es solo una de las muchas técnicas desarrolladas para explorar la
dimensionalidad.
de medidas y para construir escalas multi-ítems. Las lecturas listadas al final.
de este capítulo incluyen algunos recursos para estudiantes que están especialmente
interesados en
Este aspecto de la medida variable.
A través de índices y escalas, los investigadores intentan mejorar tanto la precisión como la
La precisión de sus medidas. Aunque estas medidas de múltiples elementos han recibido
la mayoría de los usos en la investigación de actitudes, a menudo también son útiles en otros
esfuerzos. Ambos
Los índices y escalas requieren que los investigadores tomen decisiones con respecto a la
selección de
elementos individuales y la forma en que se combinarán las puntuaciones en esos elementos
Producir medidas más útiles de los fenómenos políticos.

Conclusión
En gran medida, un proyecto de investigación es tan bueno como las mediciones que son
Desarrollado y utilizado en él. Las mediciones inexactas interferirán con las pruebas
de explicaciones científicas de los fenómenos políticos y puede conducir a errónea
conclusiones Las mediciones imprecisas limitarán el alcance de las comparaciones que
Se puede hacer entre las observaciones y la precisión del conocimiento que se obtiene.
De la investigación empírica.
A pesar de la importancia de una buena medición, los investigadores de la ciencia política a
menudo
Encuentra que sus esquemas de medición son de incierta precisión y exactitud.
Los conceptos abstractos son difíciles de medir de manera válida, y las restricciones prácticas
El tiempo y el dinero a menudo ponen en peligro la fiabilidad y precisión de las mediciones.
La calidad de las mediciones de un investigador hace una importante contribución.
a los resultados de su investigación empírica y no debe ser ligera o rutinariamente
sacrificado A veces, la precisión de las mediciones se puede mejorar mediante el uso de
Medidas multi-item. Con índices y escalas, los investigadores seleccionan múltiples
indicadores.
de un fenómeno, asigne puntajes a cada uno de estos indicadores y combine esos
Puntúa en una medida de resumen. Aunque estos métodos han sido los más utilizados
Con frecuencia en la investigación de actitudes, también se pueden utilizar en otras situaciones
para mejorar
La exactitud y precisión de las medidas de un solo elemento.
Medición. El proceso por el cual los fenómenos son.
Observaciones observadas y representadas.
numerales
Escala de Mokken. Un tipo de procedimiento de escala que evalúa.
La medida en que hay orden en las respuestas de
los encuestados a varios elementos. Similar a la escala de Guttman.
Medida nominal. Una medida para la cual diferentes.
Las puntuaciones representan categorías diferentes, pero no ordenadas.
Definición operacional. Las reglas por las que un concepto.
Se mide y se asignan puntuaciones.
Operacionalización. El proceso de asignación de números.
o puntuaciones a una variable para representar los valores de un concepto.
Medición ordinal. Una medida para la cual los puntajes.
representan categorías ordenadas que no son necesariamente
equidistantes entre sí.
Error de medición aleatoria. Errores en la medida
Que no tienen dirección o causa sistemática.

Jhonson en Español

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Jhonson en Español

Cargado por

Copyright:

Formatos disponibles

Título: Los bloques de construcción de la investigación científico-social: medición

EN LOS CAPÍTULOS ANTERIORES, DISCUTAMOS las etapas iniciales de

También podría gustarte