Título: Los bloques de construcción de la investigación científico-social: medición
EN LOS CAPÍTULOS ANTERIORES, DISCUTAMOS las etapas iniciales de
proyectos de investigación en ciencias políticas: la elección de temas de investigación, la formulación de explicaciones científicas, el desarrollo de hipótesis verificables, y La definición de conceptos. En este capítulo, damos el siguiente paso hacia la prueba. Hipótesis empíricas. Antes de probar hipótesis, hay que entender. Algunos temas relacionados con la medición de los conceptos que hemos decidido. para investigar y cómo registramos observaciones sistemáticas utilizando números o Puntuaciones para crear variables que representan los conceptos para el análisis. En el capítulo 2, dijimos que el conocimiento científico se basa en la investigación empírica. Para probar empíricamente la precisión y utilidad de una explicación científica o un fenómeno político, tendremos que observar y medir la presencia. Los conceptos que estamos utilizando para entender ese fenómeno. Además, Esta prueba es ser adecuada, nuestras medidas del fenómeno político. Solo sé lo más preciso y preciso posible. El proceso de medición es Es importante porque proporciona el puente entre nuestras explicaciones propuestas y el mundo empírico que se supone que deben explicar. Cómo miden los investigadores sus conceptos pueden tener un impacto significativo en sus hallazgos; diferencias en la medida Puede llevar a conclusiones totalmente diferentes. Kenworthy y Jonas Pontusson . s investigación qf desigualdad de ingresos en los ricos Los países ilustran bien el impacto en los resultados de la investigación de cómo es un concepto mesurado. 1 Una forma de medir la distribución del ingreso es observar las ganancias de empleados de tiempo completo y para comparar los ingresos de aquellos en la parte superior y el fondo de la distribución de ganancias. Kenworthy y Pontusson discutieron que es más apropiado comparar los ingresos de los hogares que los ingresos de individuos Los desempleados quedan excluidos de los cálculos de ingresos individuales. La desigualdad, pero los hogares incluyen a los desempleados. Además, el trabajo de bajos ingresos-. Los egresados desproporcionadamente de la fuerza laboral empleada. Utilizando la edad laboral El ingreso familiar refleja los cambios en el empleo entre los miembros del hogar. Kenworthy y Pontusson encontraron que cuando el ingreso individual se usaba como base Para medir la desigualdad, la desigualdad había aumentado más en los Estados Unidos, Nueva Zelanda y el Reino Unido, todas economías de mercado liberales. Ellos, además encontraron que la desigualdad de ingresos había aumentado significativamente más en estos países que en las economías sociales .s Europa del mercado y Japón. Cuando el ingreso familiar era utilizado, los datos indicaron que la desigualdad había aumentado en todos los países con excepción de los países bajos. Otro ejemplo involucra la medición de las tasas de participación (discutido en Capítulo 1). Los científicos políticos han investigado si las tasas de participación en los Estados Unidos Los estados han disminuido en las últimas décadas.2 La respuesta puede depender de cómo el número de los votantes elegibles se mide. ¿Debería ser el número de todos los ciudadanos votantes? edad, o si este número se ajusta para tener en cuenta a los que no están elegibles para votar, o si la tasa de participación se calcula utilizando solo el número de ¿Yoters registrados como la potencial población votante? Los investigadores discutidos en el capítulo 1 midieron una variedad de fenómenos políticos, Algunos de los cuales plantearon mayores desafíos que otros. Milner, Poe y Leblang querían medir. Tres tipos diferentes de derechos humanos: integridad personal o derechos de seguridad, subsistencia Derechos, y derechos civiles y políticos. Cada uno de estos tipos de derechos tiene múltiples dimensiones. Por ejemplo, los derechos civiles y políticos consisten en libertades, como la libertad de expresión, así como las libertades económicas, incluidas las privadas derechos de propiedad. Jeffrey A. Segal y Albert D. Cover midieron tanto lo político como lo político. Las ideologías y las opiniones escritas de los jueces de la Corte Suprema de los Estados Unidos en casos involucrando derechos civiles y libertades.3 Valerie]. Hoekstra medía las opiniones de la gente. sobre cuestiones relacionadas con los casos del Tribunal Supremo y sus opiniones sobre la Corte. 4 Richard L. Hall y Kristina Miler querían medir la actividad de supervisión por los miembros del Congreso, el número de veces que fueron contactados por cabilderos, y si los miembros del Congreso y los cabilderos eran pro-regulación o antirregulación. 5 Y Stephen Ansolabehere, Shanta Iyengar, Adam Simon y Nicholas Valentino midió la intención de votar informada por los participantes del estudio para ver si se vio afectado por la exposición a la publicidad negativa de la campaña.6 En cada caso, algunos · comportamiento político o atributo se midió de manera que una explicación científica podría ser probado Todos estos investigadores tomaron decisiones importantes con respecto a su mediciones. Diseñar estrategias de medición Como señalamos en el capítulo 4, los investigadores deben definir los conceptos que utilizan En sus hipótesis a través de la conceptualización. También deben decidir cómo mida la presencia, ausencia o cantidad de estos conceptos en el mundo real. Los científicos políticos se refieren a este proceso como operacionalización, o para Definición operacional de sus conceptos. La operacionalización es decidir cómo registrar observaciones empíricas de la ocurrencia de un atributo o un comportamiento usando numerales o puntajes. Consideremos, por ejemplo, a un investigador que intenta explicar la existencia de la democracia. en diferentes naciones. Si el investigador tuviera la hipótesis de que tasas más altas La alfabetización hace que la democracia sea más "probable", luego una definición de dos conceptos: alfabetización. Y la democracia, sería necesaria. El investigador podría entonces desarrollar una estrategia, basada en las definiciones de los dos conceptos, para medir la existencia. y la cantidad de ambos atributos en las naciones. Supongamos que la alfabetización se define como "la finalización de seis años de educación formal" y la democracia fue definida como "un sistema de gobierno en el cual los funcionarios públicos son seleccionados en elecciones competitivas ". Estas definiciones se utilizarían para Desarrollar definiciones operativas de los dos conceptos. Estas definiciones operativas indicaría lo que debe observarse empíricamente para medir tanto la alfabetización como la democracia, e indicarían específicamente qué datos deberían recopilarse para Poner a prueba la hipótesis de los investigadores. En este ejemplo, la definición operativa de alfabetización. podría ser "aquellas naciones en las que al menos el 50 por ciento de la población ~ ha tenido seis años de educación formal, como se indica en una publicación de las Naciones Unidas, " y la definición operativa de democracia puede ser "aquellos países en los que el El segundo clasificado en las elecciones para la oficina del jefe ejecutivo ha recibido al menos 25 por ciento de los votos al menos una vez en los últimos ocho años ". Cuando un investigador especifica la definición operativa de un concepto, los conceptos precisos El significado en un estudio de investigación particular se vuelve claro. En el ejemplo anterior, ahora sabemos exactamente lo que el investigador quiere decir con alfabetización y democracia. Dado que diferentes personas a menudo significan cosas diferentes por el mismo concepto, operativas Las definiciones son especialmente importantes. Alguien podría argumentar que definir la alfabetización En términos de educación formal, ignora la posibilidad de que las personas que completan seis Los años de educación formal aún podrían ser incapaces de leer o escribir bien. Del mismo modo, Podría argumentarse que la definición de democracia en términos de elecciones competitivas ignora Otras características importantes de la democracia, como la libertad de expresión y la ciudadanía. Participación en la actividad del gobierno. Además, la definición operativa de competitiva. La sección es claramente discutible. Es la "competitividad" de las elecciones basada en el número de candidatos que compiten, el tamaño del margen de victoria o el número ¿De las victorias decisivas de un solo partido en una serie de elecciones? Desafortunadamente, las definiciones operacionales rara vez son absolutamente correctas o absolutamente incorrectas; más bien, se evalúan de acuerdo con lo bien que corresponden a los conceptos que son destinado a medir. Es útil pensar que llegar a la definición operativa es la última etapa en El proceso de definir un concepto con precisión. A menudo empezamos con un concepto abstracto. (como la democracia), luego intente definirla de manera significativa, y finalmente Decida en términos específicos cómo lo vamos a medir. Al final de este proceso, esperamos alcanzar una definición que sea sensata, cercana a nuestro significado del concepto, y exacto en lo que nos dice sobre cómo ir, sobre cómo medir el concepto. Consideremos otro ejemplo: imagine que un investigador está interesado en por qué. Algunas personas son más liberales que otras. El concepto de liberalismo podría ser Definido como "creer que el gobierno debe perseguir políticas que brinden beneficios para los menos acomodados ". La tarea, entonces, es desarrollar una definición operacional que pueda usarse para medir si los individuos en particular son liberales o no. La siguiente pregunta de Generiil Social Survey podría usarse para operacionalizar. el concepto: 73A. Algunas personas piensan que el gobierno de Washington debería reducir las diferencias de ingresos entre los ricos y los pobres, tal vez por Aumentar los impuestos de las familias ricas o dar asistencia de ingresos a la pobre. Otros piensan que el gobierno no debería preocuparse por Reduciendo esta diferencia de ingresos entre los ricos y los pobres. Aquí hay una tarjeta con una escala del 1 al 7. Piense en una puntuación de 1 como significado que el gobierno debe reducir las diferencias de ingresos entre ricos y pobres, y una puntuación de 7 en el sentido de que el gobierno debería No se preocupa por reducir las diferencias de ingresos. Qué puntuación entre 1 y 7 se acerca más a la forma en que te sientes? (UN CÍRCULO) Un concepto abstracto, el liberalismo ahora ha recibido una definición operativa que Se puede utilizar para asegurar el concepto para individuos. Esta definición también está relacionada. a la definición original del concepto, e indica precisamente qué observaciones hay que hacer No es, sin embargo, la única definición operacional posible. Otros podrían sugerir que las preguntas sobre la acción afirmativa, el matrimonio entre personas del mismo sexo, Los vales escolares, la pena de muerte, las prestaciones sociales y la pornografía podrían Ser utilizado para medir el liberalismo. Lo importante es pensar cuidadosamente sobre la definición operativa que Elija y trate de asegurarse de que la definición coincida estrechamente con el significado del concepto original. Cómo se opera un concepto. afecta cómo las generalizaciones Se hacen e interpretan. Por ejemplo, declaraciones generales sobre liberales o Los conservadores se aplican a los liberales o conservadores solo como han sido operativamente Definido, en este caso por esta pregunta sobre la participación del gobierno. En la reducción de las diferencias de ingresos. Como consumidor de investigación, debes familiarizarte. usted mismo con las definiciones operativas utilizadas por los investigadores para que usted sea mejor Capaz de interpretar y generalizar resultados de investigación. Ejemplos de medidas políticas: llegar a la operacionalización; Echemos un vistazo más de cerca a algunas definiciones operativas utilizadas por los políticos Los investigadores científicos mencionados en el capítulo 1, así como algunos otros. Para medir el la fuerza de la intervención de un legislador en los reglamentos de contaminación del aire propuestos por la Agencia de Protección Ambiental, Hall y Miler codificaron y contaron el número de comentarios sustanciales hechos por legisladores que desafían o defienden los regulaciones de calidad del aire propuestas durante cinco audiencias de supervisión en el Congreso y durante el periodo de comentario público. Se requieren 8 agencias para mantener un expediente público que contiene todos los comentarios recibidos durante el período de comentarios. Las transcripciones estaban disponibles para cada una de las audiencias. Los investigadores terminaron. con dos variables: una fue el número de comentarios de apoyo; el otro era El número de comentarios en oposición al reglamento propuesto. Para medir Los intereses de los electores en cada uno de los distritos de los miembros, midieron el número de trabajos de manufactura en cada distrito y creó un índice de contaminación del aire basado en niveles de partículas PM 10 en el distrito y ozono a nivel del suelo (los contaminantes abordado por la normativa propuesta). Porque Hall y Miler estaban interesados en investigando si los cabilderos dirigieron sus esfuerzos hacia los miembros del Congreso amigables hacia las posiciones de los cabilderos, necesitaban medir el pro- Posiciones de política antiambiental para cada miembro del Congreso, y esta variable Tenía que medir la posición antes de las audiencias de supervisión y el comentario reglamentario. período. Afortunadamente para los investigadores, los líderes de la salud y el medio ambiente. coalición había clasificado a los miembros en términos de su probable apoyo a la regla anterior al período de cabildeo y estaban dispuestos a compartir sus calificaciones. Estas medidas fueron Basado en el historial de votación de los legisladores en temas de salud y medio ambiente. La investigación realizada por Segal y Cover sobre el comportamiento de la Corte Suprema de EE. UU. Los jueces son un buen ejemplo de un intento de superar un problema serio de medición. Para poner a prueba una hipótesis científica. 9 Recordemos que Segal y Cover estaban interesados, como muchos otros han estado antes que ellos, en la medida en que los votos emitidos por Los jueces de la Corte Suprema dependían de las actitudes políticas personales de los jueces. La medición de los votos de los jueces en los casos resueltos por el Tribunal Supremo no es problema; Los votos son información pública. Pero midiendo las actitudes políticas personales. de jueces, independientemente de sus voces , hay un problema (recuerde la discusión en capítulo 4 sobre cómo evitar las tautologías, o declaraciones que vinculan dos conceptos que significan esencialmente lo mismo). Muchos de los jueces cuyo comportamiento es de interés tienen murió, y es difícil lograr que los jueces vivos de la Corte Suprema revelen sus políticas Actitudes a través de entrevistas personales o cuestionarios. Además, uno idealmente quisiera una medida de actitudes que sea comparable entre muchos jueces y que Medidas de actitudes relacionadas con los casos resueltos por el Tribunal. Segal y Cover limitaron su investigación a los votos sobre casos de libertades civiles entre 1953 y 1987, por lo que necesitaban una medida de actitudes políticas relacionadas para los jueces sirviendo en la Corte Suprema durante ese mismo período. Decidieron inferir el Las actitudes de los jueces de los editoriales de los periódicos se publicaron sobre ellos en cuatro de los principales diarios, desde el momento en que cada juez fue designado por el presidente hasta Los jueces de confirmación de voto por el Senado. Seleccionaron los editoriales que aparecían. En dos periódicos liberales y en dos periódicos conservadores. Analistas entrenados leen los editoriales. y codificó cada párrafo para determinar si afirmaba que un juez designado era liberal, moderado o conservador (o si el párrafo no era aplicable) con respecto a "Apoyo a los derechos de los acusados en casos penales, mujeres y minorías raciales. en casos de igualdad, y el individuo contra el gobierno en privado y First Casos de enmienda. "10 Debido a las barreras prácticas para la medición ideal, Segal y Cover tuvieron que Confiar en una medida indirecta de las actitudes judiciales según lo percibido por los periódicos. Más que en una medida de las actitudes mismas. Aunque este enfoque puede han dado lugar a medidas defectuosas, también permitió la prueba de un interesante y hipótesis importante sobre el comportamiento de los jueces de la Corte Suprema que no habían ha sido probado previamente. Sin tales medidas, la hipótesis no podría haber sido sido probado A continuación, consideremos la investigación realizada por Bradley y sus colegas sobre la relación Entre el control de partido del gobierno y la distribución y redistribución. de salud. 11 Los investigadores confiaron en el Estudio de Ingresos de Luxemburgo (LIS) base de datos, que proporciona datos de ingresos transnacionales a lo largo del tiempo en la OCDE (Organización para la Cooperación Económica y el Desarrollo) los países. 12 Decidieron, sin embargo, para hacer ajustes a los datos LIS publicados sobre la desigualdad de ingresos. Ese Datos incluidos: jubilados. Porque algunos países hacen provisiones integrales. para los jubilados, los jubilados en estos países hacen pocas provisiones por su cuenta para la jubilación. Por lo tanto, muchas de estas personas se considerarían "pobres" antes que cualquier gobierno transferencias La inclusión de los jubilados inflaría el nivel de pobreza anterior a la transferencia así como el grado de transferencia de ingresos para estos países. Por lo tanto, Bradley y sus colegas limitaron su análisis a los hogares con una cabeza de veinticinco años para cincuenta y nueve (excluyendo así también a la población en edad de estudiar) y calcularon su Mediciones propias de la desigualdad de ingresos a partir de los datos del LIS. Argumentaron que sus datos mediría la redistribución entre crecimientos de ingresos , no redistribuciones del ciclo de vida de ingresos, tales como transferencias a estudiantes y personas jubiladas. Los ingresos se definieron como ingresos provenientes de sueldos y salarios, ingresos del trabajo por cuenta propia, ingresos de propiedad, y Ingresos de pensiones privadas. Los investigadores también hicieron ajustes para el tamaño del hogar. utilizando una escala de equivalencia, que ajusta el número de personas en un hogar a un número equivalente de adultos. La escala de equivalencia tiene en cuenta la Economías de escala resultantes de compartir los gastos del hogar. Martin P Wattenberg y Craig Leonard Brians midieron la exposición por respuestas ¿ O una pregunta de la encuesta que preguntaba a los encuestados si recordaban un anuncio de campaña y Si fue o no negativo o positivo en el tono. Finalmente, Ansolabehere y su colegas midieron la exposición a anuncios de campaña negativos en las elecciones del Senado de 1990 accediendo a artículos periodísticos y de revistas sobre las campañas y determinando Cómo se describe el tono de las campañas en estos artículos. Los casos discutidos aquí son buenos ejemplos de los intentos de los investigadores por medir Fenómenos políticos importantes (comportamientos o atributos) en el mundo real. Si el fenómeno en cuestión era la actitud política de los jueces, los ingresos. desigualdad, el tono de la campaña publicitaria, o las actitudes y comportamientos de legisladores, los investigadores idearon estrategias de medición que podrían detectar y Medir la presencia y cantidad del concepto en cuestión. Estas observaciones luego se usaron generalmente como base para una prueba empírica de los investigadores hipótesis Para ser útil en proporcionar explicaciones científicas para el comportamiento político, medidas. de los fenómenos políticos debe corresponderse estrechamente con el significado original de una Conceptos del investigador. También deben proporcionar al investigador suficiente información. para hacer comparaciones y contrastes valiosos. De ahí, la calidad de las medidas. Se juzga con respecto tanto a su exactitud como a su precisión. La exactitud de las mediciones Porque vamos a utilizar nuestras medidas para comprobar si nuestra Las explicaciones de los fenómenos políticos son válidas, esas medidas deben ser tan Lo más preciso posible. Las mediciones inexactas pueden llevar a conclusiones erróneas, ya que interferirán con nuestra capacidad para observar la relación real entre Dos o más variables. Hay dos amenazas principales a la exactitud de las mediciones. Las medidas pueden ser inexactos porque son poco confiables y / o porque no son válidos. Confiabilidad La confiabilidad describe la consistencia de los resultados de un procedimiento o medida en Pruebas repetidas o ensayos. En el contexto de la medición, una medida confiable es una que produce el mismo resultado cada vez que se usa la medida. Una medida poco fiable es uno que produce resultados inconsistentes, a veces superiores, a veces inferiores.15 Supongamos, por ejemplo, que quiere medir el apoyo para el presidente entre la universidad estudiantes Selecciona dos preguntas de encuesta similares (Ql y Q2) y pregunta al Participantes en una muestra aleatoria de alumnos para responder a cada pregunta. Los resultados de esta muestra hubo 50 por ciento de apoyo para el presidente usando Ql y 50 por ciento Apoyo para el presidente utilizando Q2. Pero, ¿qué podrías encontrar si preguntas al ¿Las mismas preguntas de múltiples muestras aleatorias de estudiantes? Serán los resultados de cada uno. ¿La pregunta sigue siendo consistente, asumiendo que las muestras son idénticas? Si un segundo una muestra de estudiantes es encuestada, puede encontrar el mismo resultado, 50 por ciento, para Ql pero 60 por ciento para Q2. Si tuviera que pedir Ql de múltiples muestras aleatorias de estudiantes y el resultado fue consistentemente del 50 por ciento, podría afirmar que su medida, Ql, es confiable. Si se solicitó Q2 a múltiples muestras aleatorias de estudiantes y cada muestra De los estudiantes respondieron diferentes respuestas que oscilan entre el 40 por ciento y 60 por ciento, podría concluir que Q2 es menos confiable que Ql porque Q2 Genera resultados inconsistentes cada vez que se usa. Del mismo modo, puede evaluar la fiabilidad de los procedimientos también. Supongamos que te dan La responsabilidad de contar una pila de mil papeletas de voto para algunos públicos. oficina. La primera vez que los cuentas, obtienes un resultado particular. Pero como eras contando las boletas, usted podría haber sido interrumpido, dos o más boletas podrían se han pegado, algunos pueden haber sido soplados en el suelo, o puede haber anotó los totales incorrectamente: Como precaución, entonces, cuente cinco más veces y consigue que otras cuatro personas las cuenten una vez cada una. La similitud de Los resultados de los diez conteos serían una indicación de la confiabilidad o del conteo. proceso. Del mismo modo, suponga que desea probar la hipótesis de que el New York Times es Más crítico con el gobierno federal que el Wall Street Journal. Esto sería requiere que mida el nivel de crítica que se encuentra en los artículos de los dos documentos. Necesitaría desarrollar criterios o instrucciones para identificar o medir crítica. La confiabilidad de su esquema de medición podría evaluarse teniendo Dos personas leen todos los artículos, calificando independientemente el nivel de crítica en ellos. de acuerdo a sus instrucciones, y luego comparar sus resultados. La fiabilidad sería demostrado si ambas personas llegaron a conclusiones similares con respecto al contenido de Los artículos en cuestión. La fiabilidad de las medidas de la ciencia política se puede calcular de muchas maneras diferentes. formas. Aquí describimos tres métodos que a menudo se asocian con una prueba escrita. Artículos o preguntas de la encuesta, pero las ideas pueden aplicarse en otros contextos de investigación. El método test-retest implica aplicar el mismo "test" a las mismas observaciones. después de un período de tiempo y luego comparando los resultados de las diferentes mediciones. Por ejemplo, si se hace a un grupo una serie de preguntas que miden el liberalismo. de los encuestados en dos días diferentes, una comparación de sus puntuaciones en ambos momentos podría ser utilizado como una indicación de la fiabilidad de la medida del liberalismo. Nosotros Con frecuencia se involucran en el comportamiento de prueba-re-prueba en nuestra vida cotidiana. Con que frecuencia tienes ¿Ha pisado la báscula de baño dos veces en cuestión de segundos? El método test-retest para medir la confiabilidad puede ser difícil y problemático, ya que hay que medir el fenómeno en dos puntos diferentes. Es posible que se pueden obtener dos resultados diferentes porque lo que se está midiendo tiene Cambiado, no porque la medida no sea confiable. Por ejemplo, si tu baño la escala le da dos pesos diferentes en unos pocos segundos, la escala no es confiable, como tu peso no puede haber cambiado. Sin embargo, si te pesas una vez a la semana. durante un mes y descubre que obtiene resultados diferentes cada vez, la escala no es confiable, ¿O ha cambiado su peso entre medidas? Otro problema con el La verificación de la prueba de la prueba de confiabilidad es que la administración de la primera medida puede Afectar los resultados de la segunda medida. Por ejemplo, la diferencia entre el razonamiento SAT Los puntajes de la prueba la primera y segunda vez que los individuos toman la prueba pueden no suponer que es una medida de la fiabilidad de la prueba, ya que los examinados podrían alterar su comportamiento la segunda vez como resultado de tomar la prueba la primera vez (por ejemplo, Podría aprender de su primera experiencia con la prueba). El método alternativo de medir la confiabilidad también implica medir la mismo atributo más de una vez, pero utiliza dos medidas diferentes de la misma Concepto en lugar de la misma medida. Por ejemplo, un investigador podría idear dos conjuntos diferentes de preguntas para medir el concepto de liberalismo, pregunte lo mismo las preguntas de los encuestados en dos momentos diferentes utilizando un conjunto de preguntas la primera tiempo y el otro conjunto de preguntas la segunda vez, y compare las respuestas de los encuestados puntuaciones. El uso de dos formas diferentes de la medida reduce la posibilidad de que la segunda los puntajes están influenciados por la primera medida, pero aún requiere que el fenómeno medirse dos veces. Dependiendo de la duración del tiempo entre las dos mediciones, lo que se mide puede cambiar. El método de medición de la confiabilidad de las mitades divididas consiste en aplicar dos medidas Del mismo concepto al mismo tiempo. Los resultados de las dos medidas son entonces. comparado. Este método evita el problema de que el concepto que se está midiendo puede Cambio entre medidas. El método de las mitades divididas se usa a menudo cuando un artículo múltiple La medida se puede dividir en dos mitades equivalentes. Por ejemplo, un investigador puede concebir una medida de liberalismo consistente en las respuestas a diez preguntas sobre una encuesta de opinión pública. La mitad de estas preguntas podrían seleccionarse para representar una medida del liberalismo, y la otra mitad seleccionada para representar una segunda medida de liberalismo. Si las puntuaciones individuales en las dos medidas del liberalismo son similares, entonces la medida de los diez elementos puede decirse que es confiable por el enfoque de las mitades divididas.
Los métodos de prueba-retest, forma alternativa y mitades divididas proporcionan una base para el cálculo La similitud de resultados de dos o más aplicaciones del mismo o equivalente. medidas Cuanto menos consistentes son los resultados, menos confiable es la medida. Político Los científicos toman muy en serio la fiabilidad de las medidas que utilizan. Encuesta A los investigadores a menudo les preocupa la fiabilidad de las respuestas que reciben. por Por ejemplo, las respuestas de los encuestados a las preguntas de la encuesta a menudo varían considerablemente cuando Los instrumentos se dan en dos momentos diferentes. 16 Si los encuestados no se están concentrando. o tomando la encuesta en serio, las respuestas que brindan también pueden tener ha sido sacado de un sombrero. Ahora, volvamos al ejemplo de medir su peso con una balanza doméstica. Si te pesas en la balanza de tu casa, ve al gimnasio y pesa de nuevo allí, y obtenga el mismo número (prueba de confiabilidad de formas alternativas), Puede concluir que su escala de casa es confiable. Pero que tal si obtienes dos diferentes. ¿números? Suponiendo que su peso no haya cambiado, ¿cuál es el problema? Si vas Regrese a casa de inmediato y retroceda en la escala de su casa y descubra que da una medida que sea diferente de la primera que te dio, podrías concluir que su báscula tiene un mecanismo defectuoso, es inconsistente y, por lo tanto, no es confiable. Sin embargo, ¿qué pasa si la báscula de baño le da el mismo peso que la primera vez? Parecería ser confiable. Tal vez la escala de gimnasio no sea confiable. Podrias probar esto volviendo al gimnasio y pesándote a ti mismo. Si la escala de gimnasio da una Lectura diferente a la que dio la primera vez, entonces no es confiable. Pero que si La escala de gimnasia da lecturas consistentes? Cada escala parece ser confiable (las escalas no le están dando diferentes pesos al azar), pero al menos uno de ellos está dando una medida incorrecta (es decir, no le da su peso correcto). Esto es un Problema de validez. Validez Esencialmente, una medida de yalid es una que mide lo que se supone que debe medir. A diferencia de la fiabilidad, que depende de si las aplicaciones repetidas del mismo o Las medidas equivalentes dan el mismo resultado, la validez se refiere al grado de correspondencia. entre la medida y el concepto se piensa medir. Consideremos primero un ejemplo de una medida cuya validez ha sido cuestionada: participación electoral. Muchos estudios examinan los factores que afectan la participación de los votantes y, por lo tanto, requieren una medición precisa de la participación de los votantes. Una forma de medir el elector. la participación es preguntar a las personas si votaron en la última votación autodeclarada en las elecciones. Sin embargo, dada la conveniencia social de votar en los Estados Unidos, usar el "I votado "pegatina o publicación" voté "en un sitio de redes sociales puede traer recompensas socialeswill ¿Los no votantes admiten que no votaron a un entrevistador? Algunos no votantes pueden reclamar en las encuestas que han votado, lo que resulta en una medida no válida de la participación de votantes tqat exagera el número de votantes. De hecho, esto es lo que suele pasar. Encuestas de votantes Se suele sobrestimar la participación en varios puntos porcentuales. 17 Una medida también puede ser inválida si mide un concepto ligeramente diferente. de lo previsto Por ejemplo, supongamos que un investigador pretende medir la ideología, conceptualizado como las opiniones políticas de un individuo en un continuo entre conservadores, moderado, y liberal. El investigador propone medir la ideología preguntando. encuestados, '¿A qué partido se siente más cercano, el Partido Demócrata o ¿El Partido Republicano? "Esta medida sería inválida porque no mide La ideología como conceptualizada. Afinidad partidista, aunque a menudo consistente con la ideología, No es lo mismo que la ideología. Esta medida podría ser una medida válida de identificación de la parte, Pero no la ideología. Una medida de validez es más difícil de demostrar empíricamente que su confiabilidad Porque la validez implica la relación entre la medición de un concepto. y la presencia o cantidad real del propio concepto. Información sobre el la correspondencia rara vez es abundante. No obstante, hay maneras de evaluar el Validez de cualquier medida particular. En los siguientes párrafos explicamos varias formas de pensar acerca de la validez, incluyendo cara, contenido, construcción e interitem validez. La validez de la cara puede ser afirmada (no demostrada empíricamente) cuando la medición El instrumento parece medir el concepto que se supone que mide. A evaluar la validez nominal de una medida, necesitamos saber el significado del concepto siendo medido y si la información que se recopila es "pertinente a ese concepto. "18 Por ejemplo, volvamos a pensar en cómo podríamos medir. ideología política, es decir, si alguien es conservador, moderado o liberal. Tal medida podría ser tan simple como una pregunta utilizada por el Centro de Investigación Pew: " ¿Te consideras conservador, moderado o liberal? " 19 En su cara, Esta medida parece captar el concepto deseado, por lo que tiene validez aparente. Eso podría ser tentador utilizar las respuestas de los individuos a una pregunta sobre la identificación de la parte, pero uno supondría que todos los demócratas son liberales y todos los republicanos son conservadores Además, si la variable de identificación del partido incluía una categoría para Independientes, ¿cuál sería su ideología? ¿Puedes asumir que todos son moderados? Por estas razones, una pregunta que mide la identificación del partido carecería de cara La validez como medida de la ideología. En general, las medidas carecen de validez aparente cuando existen buenas razones para cuestionar la Correspondencia de la medida al concepto en cuestión. En otras palabras, evaluar La validez de la cara es esencialmente una cuestión de juicio. Si no existe consenso sobre la significado del concepto a medir, la validez aparente de la medida está limitada ser problematico La validez de contenido es similar a la validez de cara, pero implica determinar el dominio completo o el significado de un concepto particular y luego asegurarse de que todos los componentes de El significado se incluye en la medida. Por ejemplo, supongamos que quisieras diseñar una medida de la medida en que el sistema político de una nación es democrático. Como se señaló anteriormente, la democracia significa muchas cosas para muchas personas. Raymond D. Gastil Construyó una medida de democracia que incluía dos dimensiones, derechos políticos. y libertades civiles. Sus listas de verificación para cada dimensión constaban de once ítems. 20 Los científicos políticos a menudo están interesados en conceptos con múltiples dimensiones o dominios complejos, como la democracia, y pasan bastante tiempo discutiendo y Justificando el contenido de sus medidas. Para una medida de la concepción de Gastil. de la democracia para lograr la validez de contenido, la medida debe capturar los once Componentes en la definición. Una tercera forma de evaluar la validez de una medida es demostrar empíricamente validez de constructo La validez de construcción se puede entender de dos maneras diferentes: Validez constructiva convergente y validez constructiva divergente. Convergente const1: La validez de 11cvt es cuando una medida de un concepto se relaciona con una medida de otro Concepto con el que se piensa que el concepto original está relacionado. En otras palabras, un investigador puede especificar, en términos teóricos, que dos conceptos deben ser relacionados de manera positiva (por ejemplo, eficacia política con participación política o educación con ingresos) o de manera negativa (por ejemplo, democracia y derechos humanos). abusos). El investigador luego desarrolla una medida de cada uno de los conceptos y examina La relación entre ellos. Si las medidas son positivas o negativas. correlacionada, entonces una medida tiene validez convergente para la otra medida. En el En caso de que no haya una relación entre las medidas, entonces la relación ~ teórica está en error, al menos una de las medidas no es una representación precisa de El concepto, o el procedimiento utilizado para probar la relación es defectuoso. La ausencia de una relación hipotética no significa que una medida sea inválida, pero la presencia De una relación da cierta garantía de la validez de las medidas.
La validez de constructo discriminante implica dos medidas que teóricamente son espera no estar relacionado; por lo tanto, se espera que la correlación entre ellos sea bajo o débil Si las medidas no se correlacionan unas con otras, entonces discrimina Se demuestra la validez de constructo. Volvamos a la cuestión de medir el poder de los líderes legislativos porque Proporciona un buen ejemplo de la importancia de la validez de constructo. Como señalamos antes, el enfoque de influencia percibida para medir el poder es más difícil de uso que el enfoque de poderes formales. Por lo tanto, si las dos medidas se muestran para Tener validez de constructo, operacionalizando el poder de liderazgo utilizando los poderes formales. El enfoque por sí mismo podría ser una forma válida de medir el concepto. Si las dos medidas no tienen validez de constructo, entonces estaría claro que los dos enfoques son No midiendo lo mismo. Por lo tanto, qué medida se utiliza podría afectar en gran medida la Resultados de la investigación sobre los factores asociados con la presencia de un liderazgo fuerte. poder o sobre las consecuencias de tal poder. Estas fueron las mismas preguntas. planteado por el politólogo James Coleman Battista.21 Construyó varias medidas de poder de liderazgo percibido y los correlacionó con una medida de formal poder. Los resultados, mostrados en la tabla 5-1, muestran que la medida del poder formal se correlaciona débilmente con tres medidas de poder percibido (que , como se esperaba, correlacionar w ~ l entre sí). Por lo tanto, las medidas de poder percibido y la Medida de poder formal no demostrada, validez de constructo convergente . Una cuarta forma de demostrar la validez es a través de la asociación interitem Este es el Tipo de prueba de validez más utilizada por los científicos políticos. Se basa en la similitud. de resultados_ de más de una medida de un concepto para demostrar la validez de Todo el esquema de medición. A menudo es preferible usar más de un elemento para medir un concepto de confianza en una sola medida es más propenso a errores o errores de clasificación de un caso.22 Volvamos al investigador que quiere desarrollar una medida válida del liberalismo. Primero, el investigador puede medir las actitudes de la gente hacia (1) bienestar, (2) militar gastos, (3) aborto, (4 ) niveles de beneficios del Seguro Social, (5) acción afirmativa, (6) un impuesto a la renta progresivo, (7) vales escolares, y (8) protección de los derechos de los acusados. Entonces el investigador podría determinar cómo responden las respuestas a cada uno. La pregunta se relaciona con las respuestas a cada una de las otras preguntas. La validez de la Se demostraría un esquema de medición si existieran relaciones fuertes entre Las respuestas de las personas a través de las ocho preguntas. Los resultados de dichas pruebas de asociación interemínica se muestran a menudo en una correlación matriz. Una pantalla de este tipo muestra la relación entre cada elemento y los elementos de la medición. esquema es a todos los demás elementos. En los datos hipotéticos mostrados en la tabla. 5-2, podemos ver que las respuestas de las personas a seis de las ocho medidas fueron fuertemente relacionadas entre sí, mientras que las respuestas a las preguntas sobre la protección de los derechos de los acusados y los vales escolares no formaban parte del patrón general. Por lo tanto, la El investigador probablemente concluiría que los primeros seis elementos miden el liberalismo y que, en conjunto, son una medida válida del liberalismo. · Las cifras en la tabla 5-2 son correlaciones producto-momento: números que pueden variar en valor de -1.0 a + LO y que indican la medida en que una variable es Relacionado con otro. Cuanto más cercana sea la correlación a ± 1, más fuerte será la relación; cuanto más cercana sea la correlación a 0.0, más débil será la relación (vea el capítulo 13 para una explicación completa). Las cifras en las dos últimas filas están considerablemente más cerca de 0.0 que las otras entradas, lo que indica que las personas responden a las preguntas sobre vales escolares y los derechos de los acusados no siguieron el mismo patrón que su Respuestas a las otras preguntas. Por lo tanto, parece que los vales escolares y los derechos de los acusados no están conectados con el mismo concepto de liberalismo como medido por las otras preguntas El contenido y la validez nominal son difíciles de evaluar cuando falta un acuerdo sobre el significado de un concepto, y validez de constructo, que requiere un desarrollo teórico bien desarrollado. Perspectiva, generalmente da un resultado menos que definitivo. La asociación interitem La prueba requiere múltiples medidas del mismo concepto. Aunque estas vigencias Las "pruebas" proporcionan evidencia importante, y es probable que ninguna de ellas respalde un enfoque inequívoco. Decisión sobre la validez de medidas particulares. Problemas con la fiabilidad y la validez en la medición de la ciencia política Los investigadores de la encuesta a menudo quieren medir el ingreso familiar de los encuestados. Medición de esta variable básica ilustra las amenazas del número a la confiabilidad y Validez de las medidas de la ciencia política. La siguiente es una pregunta utilizada en el 2004. Estudio Electoral Nacional Americano (ANES): Por favor, mire el folleto y dígame la carta del grupo de ingresos. eso incluye los ingresos de todos los miembros de su familia que viven aquí en 2003 antes de impuestos. Esta cifra debe incluir salarios, salarios, pensiones, Dividendos, intereses y todos los demás ingresos. Por favor dime la carta de la grupo de ingresos · que incluye los ingresos que tenía en 2003 antes de impuestos. Los encuestados recibieron las siguientes opciones: A. Ninguna, o menos de $ 2,999 M. $ 30,000- $ 34, 999 B. $ 3,000- $ 4,999 N. $ 35,000- $ 39,999 C. $ 5,000- $ 6,999 0. $ 40, 000- $ 44, 999 D. $ 7,000- $ 8,999 P. $ 45,000- $ 49,999 E. $ 9,000- $ 10,999 Q. $ 50,000- $ 59, 999 E $ 11,000- $ 12,999 R. $ 60,000- $ 69,999 G. $ 13,000- $ 14,999 S. $ 70,000- $ 79, 999 H. $ 15,000- $ 16,999 T. $ 80,000- $ 89, 999 I. $ 17, 000- $ 19, 999 U. $ 90,000- $ 104,999 J. $ 20,000- $ 21,999 V $ 105,000- $ 119,999 K. $ 22,000- $ 24,999 w $ 120,000 y más L. $ 25,000- $ 29,999 Tanto la fiabilidad como la validez de este método de medición de ingresos son cuestionables. Las amenazas a la confiabilidad de la medida incluyen las siguientes: • Los encuestados pueden no saber cuánto dinero ganan y, por lo tanto, Adivina incorrectamente sus ingresos. • Los encuestados pueden no saber cuánto dinero otros miembros de la familia hacer "y adivinar incorrectamente. · • Los encuestados pueden saber cuánto ganan, pero seleccionan sin cuidado el categorías incorrectas • Los entrevistadores pueden rodear las categorías equivocadas al escuchar el Selecciones de los encuestados. • El personal de entrada de datos puede tocar los números incorrectos al ingresar el respuestas en la computadora. • Los entrevistadores deshonestos pueden adivinar incorrectamente los ingresos de un encuestado Quien no completa la entrevista. • Los encuestados pueden no saber qué miembros de la familia incluir en el ingreso total; algunos encuestados pueden incluir solo algunos miembros de la familia, mientras que otros pueden incluir incluso relaciones distantes. • Los encuestados cuyos ingresos se encuentran en la frontera entre dos categorías pueden No sé cuál elegir. Algunos pueden elegir la categoría superior; otros, la inferior Debido a estos problemas de medición, si esta medida se aplicara a la misma en dos momentos diferentes, podemos esperar que los resultados varíen, lo que resulta en medidas inexactas que son demasiado altas para algunos encuestados y demasiado bajas para otros. Es probable que ocurra alguna cantidad de error de medición aleatoria con cualquier medición esquema. Además de estas amenazas a la confiabilidad, existen numerosas amenazas a la validez de esta medida: • Los encuestados pueden tener ingresos ilegales que no quieren revelar y_ por lo tanto, puede subestimar sistemáticamente sus ingresos. • Los encuestados pueden tratar de mejorar al entrevistador, oa ellos mismos, Sobreestimando sistemáticamente sus ingresos. • Los encuestados pueden subestimar sistemáticamente sus ingresos antes de impuestos porque piensan en su salario neto y subestiman cuánto el dinero está siendo retenido de sus cheques de pago. • Los encuestados pueden omitir sistemáticamente la pregunta debido a la privacidad Se preocupa por proporcionar un número preciso, incluso si lo saben. Observe que esta segunda lista de problemas contiene la palabra sistemáticamenteT. estos los problemas no son simplemente causados por inconsistencias aleatorias en las mediciones, con algunos bein, g. demasiado alto y otros demasiado bajo por razones impredecibles. Facilitación Sistemática el error introduce un error que puede sesgar los resultados de la investigación, comprometiendo así La confianza que tenemos en ellos. Esta larga lista de problemas con la fiabilidad y la validez de este bastante La medida directa de un concepto relativamente concreto es preocupante. Imagina como mucho más difícil es desarrollar medidas confiables y válidas cuando el concepto es abstracto (por ejemplo, tolerancia, conciencia ambiental, autoestima o liberalismo) Y el esquema de medición es más complicado. La fiabilidad y validez de las medidas utilizadas por los científicos políticos rara vez son demostrado a la satisfacción de todos. La mayoría de las medidas de los fenómenos políticos son ni completamente inválido o válido ni completamente poco confiable o confiable sino, más bien, son en parte precisos. Por lo tanto, los investigadores generalmente presentan la justificación y evidencia disponible en apoyo de sus medidas e intento de persuadir a su audiencia que sus medidas son al menos tan precisas como lo serían las medidas alternativas. No obstante, una postura escéptica por parte del lector hacia la fiabilidad y La validez de las medidas de la ciencia política es a menudo justificada. Tenga en cuenta, finalmente, que la fiabilidad y la validez no son lo mismo. Una medida puede Ser confiable sin ser válido. Uno puede idear una serie de preguntas a medida. El liberalismo, por ejemplo, que produce el mismo resultado para las mismas personas cada vez. pero eso identifica erróneamente a los individuos. Una medida válida, sin embargo, también será confiable: si mide con precisión el concepto en cuestión, luego lo hará, de manera consistente en Las mediciones permiten, por supuesto, un error de medición aleatorio que puede ocurrir. Es más importante, entonces, demostrar la validez que la fiabilidad, pero la fiabilidad Por lo general, se prueba con mayor facilidad y precisión. La precisión de las mediciones. Las mediciones no solo deben ser precisas sino también precisas; es decir, medidas Debe contener tanta información como sea posible sobre el atributo o comportamiento siendo medido. Cuanto más precisas sean nuestras medidas, más completas e informativas. Puede ser nuestra prueba de las relaciones entre dos o más variables. Supongamos, por ejemplo, que quisiéramos medir la altura de los candidatos políticos Para ver si los candidatos más altos suelen ganar las elecciones. La altura se puede medir en muchos diferentes caminos. Podríamos tener dos categorías de la variable "altura" -tall y corto y asignar diferentes candidatos a las dos categorías en función de si eran de altura por encima de la media o por debajo de la media. O podríamos comparar las alturas. de candidatos que se postulan para el mismo cargo y en qué medida el candidato fue el Más alto, que el siguiente más alto, y así sucesivamente. O podríamos tomar una cinta métrica y medir La altura de cada candidato es en pulgadas y registra esa medida. El último método de La medición captura la mayor cantidad de información sobre la altura de cada candidato y es, Por lo tanto , la medida más precisa del atributo. Niveles de Medición Cuando consideramos la precisión de nuestras mediciones, nos referimos al nivel de medición. El nivel de medición involucra el tipo de información que nosotros Creo que nuestras medidas contienen y las propiedades matemáticas que determinan. el tipo de comparaciones que se pueden hacer a través de una serie de observaciones en el misma variable El nivel de medición también se refiere a la reclamación que estamos realizando para Hacer cuando asignamos números a nuestras medidas. Hay cuatro niveles diferentes de medición: nominal, ordinal, intervalo y relación. Si bien pocos conceptos utilizados en la investigación en ciencias políticas requieren de manera inherente una nivel de medición, hay limitaciones metodológicas porque algunas medidas Proporcionar más información y mejores propiedades matemáticas que otros. Entonces el El nivel de medición utilizado para medir cualquier concepto particular es una función de ambos. La imaginación y los recursos del investigador, y las necesidades metodológicas. Comenzamos con la medición nominal, el nivel que tiene la menor cantidad de matemática. Propiedades de los cuatro niveles. Una medida de nivel nominal indica que los valores asignados a una variable representan solo diferentes categorías o clasificaciones para ese variable. En tal caso, ninguna categoría es más o menos que otra categoría; ellos son simplemente diferentes ... Por ejemplo, supongamos que medimos la religión de los individuos pidiéndoles que indiquen si son cristianos, judíos, musulmanes u otros. Dado que las cuatro categorías o valores para la religión variable son simplemente diferentes, La medida se encuentra en un nivel nominal. Otros ejemplos comunes de medidas de nivel nominal son el género, el estado civil y el estado de residencia. Una medida nominal de afiliación partidista podría tener las siguientes categorías: demócrata, republicano, Verde, libertario, otro, y ninguno. Los números serán asignados a las categorías. cuando los datos se codifican para el análisis estadístico, pero estos números no representan diferencias matemáticas entre las categorías - cualquiera de las partes podría ser asigna cualquier número, siempre que esos números sean diferentes entre sí. En En este sentido, las medidas de nivel nominal proporcionan la menor cantidad de información sobre un concepto. Una medida ordinaria tiene todas las propiedades de una medida nominal pero también asume que las observaciones pueden compararse en términos de tener más o menos de un atributo particular. Por lo tanto, el nivel ordinal de medición capta más Información sobre el concepto medido y tiene más propiedades matemáticas que una medida de nivel nominal. Por ejemplo, podríamos crear una medida ordinal de educación formal completada con las siguientes categorías: "octavo grado o menos" "algo de escuela secundaria", "graduado de escuela secundaria", "algo de universidad" y "título universitario o más. "Aquí no nos preocupa la diferencia exacta entre las categorías de educación, pero solo con si una categoría es más o menos que otra. Al codificar esta variable, asignamos números más altos a categorías más altas de Educación. Los intervalos entre los números no tienen significado; todo lo que importa es que los números más altos representan más del atributo que los números más bajos. Una variable ordinal que mide la afiliación partidista con las categorías "fuerte Republicano, "republicano débil", "ni republicano ni demócrata inclinado" A los "débiles demócratas" y "fuertes demócratas" se les pueden asignar los códigos 1, 2, 3, 4, 5 o 1, 2, 5, 8, 9 o cualquier otra combinación de números, siempre y cuando estén en ascenso o orden descendente. Variables nominales dicotómicas, es decir, variables de nivel nominal con solo dos categorías - son medidas de nivel nominal, pero con frecuencia tratadas como nivel ordinal medidas Por ejemplo, podríamos medir la capacidad nuclear con dos categorías, donde un país que tiene capacidades nucleares se codificaría como uno y como país Eso no sería codificado como un cero. Se podría interpretar esta variable como La capacidad nuclear está presente o ausente en un país y, por lo tanto, uno representa Más del concepto, capacidad nuclear. Para dar otro ejemplo, una persona Quien no votó en la última elección carece o tiene menos del atributo de tener Votado que una persona que votó. Debido a que las medidas nominales y ordinales se basan en categorías, es importante hacer Seguro que estas variables son exhaustivas y exclusivas. E xhaustive re fiere al hacer Asegúrese de que todas las categorías posibles, o opciones de respuesta, se tienen en cuenta. Lo más simple La solución para asegurarse de que una variable sea exhaustiva es incluir una categoría "otro". que se puede utilizar para valores que no están representados en las categorías identificadas. Los beneficios exclusivos se aseguran de que un solo valor o respuesta solo pueda caber en uno categoría. Cada categoría debe ser distinta de las demás, sin superposición. Debatiendo el nivel de medida El siguiente nivel de medición, una medición • de intervalo, incluye las propiedades del nivel nominal (las características son diferentes) y el nivel ordinal (características se puede poner en un orden significativo). Pero a diferencia de los niveles de medición anteriores, los intervalos Entre las categorías o valores asignados a las observaciones se hace. tiene significado El valor de una observación particular es importante no solo en términos de ya sea mayor o menor que otro valor (como en las medidas ordinales) pero también en términos de cuánto más grande o más pequeño es. Por ejemplo, supongamos que grabamos el año. en el que ocurrieron ciertos eventos. Si tenemos tres observaciones-1950, 1962, y 1977-sabemos que el evento en 1950 ocurrió doce años antes que el de 1962. y veintisiete años antes del de 1977. Un cambio de una unidad (el intervalo) todo a lo largo de esta medida es idéntico en significado: el paso de un año. Otra característica de un intervalo de nivel de medida que lo distingue. del siguiente nivel de medición (relación) es que una medición de nivel de intervalo tiene una Punto cero asignado arbitrariamente que no representa la ausencia del atributo. siendo medido. Por ejemplo, muchas escalas de tiempo y temperatura tienen arbitrario cero puntos. Por lo tanto, el año O CE no indica el comienzo del tiempo, si esto si fueran ciertas, no habría fechas BCE. Tampoco 0 ° C indica la ausencia de calor; más bien, indica la temperatura a la cual el agua se congela. Por este motivo, con Las mediciones a nivel de intervalo no podemos calcular las relaciones; es decir, no podemos decir eso 60 ° F es dos veces más cálido que 30 ° E Entonces, mientras que el nivel de intervalo de medición se captura Más información y propiedades matemáticas que los niveles nominales y ordinales. No tiene todas las propiedades de las matemáticas. El nivel final de medición es una medida de relación. Este tipo de medida implica las propiedades matemáticas completas de los números y contiene la mayor cantidad posible Información sobre un concepto medido. Es decir, una medida de nivel de relación incluye Los valores de las categorías, el orden de las categorías y los intervalos entre las categorias también indica con precisión las cantidades relativas de la variable que Las categorías representan porque su escala incluye un cero significativo. Si, por ejemplo, un investigador está dispuesto a afirmar que una observación con diez unidades de una variable Posee exactamente el doble de ese atributo que una observación con cinco unidades de esa variable, entonces existe una medida de nivel de relación. La clave para hacer esto. El supuesto es que un valor de cero en la variable en realidad representa la ausencia de esa variable. Debido a que las medidas de relación tienen un punto cero verdadero, tiene sentido Digamos que una medida es x veces otra. Tiene sentido decir que un niño de sesenta años persona tiene el doble de edad que una persona de treinta años (60/30 = 2), mientras que no tiene tiene sentido decir que 60 ° C es dos veces más cálido que 30 ° C. 23 Los investigadores de la ciencia política han medido muchos conceptos en el nivel de relación. De la gente edades, tasas de desempleo, porcentaje del voto para un candidato en particular, y las tasas de crim'e son todas las medidas que contienen un punto cero y poseen la matemática completa Propiedades de los números utilizados. Sin embargo, más investigación en ciencias políticas. probablemente se haya basado en medidas de nivel nominal y ordinal que en intervalos o Medidas a nivel de ratio. Esto ha restringido los tipos de hipótesis y técnicas de análisis. que los científicos políticos han estado dispuestos y capaces de usar. Identificar el nivel de medición de las variables es importante, ya que afecta la Análisis de datos, técnicas que se pueden utilizar y las conclusiones que se pueden extraer. sobre las relaciones entre variables. Los métodos de orden superior a menudo requieren una mayor Niveles de medición, mientras que otros métodos han sido desarrollados para niveles más bajos. de la medida. La decisión de qué nivel de medición usar no es siempre una una directa, y la incertidumbre y el desacuerdo a menudo existen entre los investigadores en relación con estas decisiones. Pocos fenómenos requieren inherentemente uno en particular Nivel de medida. A menudo, un fenómeno se puede medir con cualquier nivel de Medición, dependiendo de la técnica particular diseñada por el investigador. y las afirmaciones que el investigador está dispuesto a hacer sobre la medida resultante. Trabajar con precisión: muy poco o demasiado Los investigadores usualmente tratan de diseñar un alto nivel de medición para sus conceptos. como sea posible (siendo nominal el nivel más bajo de medición y la relación más alta). Con un nivel más alto de medición, las técnicas de análisis de datos más avanzadas pueden ser utilizados, y se pueden hacer declaraciones más precisas sobre las relaciones entre variables Así, los investigadores miden actitudes o conceptos con múltiples operativas. Las definiciones a menudo construyen una escala o un índice a partir de medidas de nivel nominal que permite al menos comparaciones a nivel ordinal entre observaciones. Discutimos La construcción de índices y escalas con mayor detalle en los siguientes párrafos. Es fácil transformar la información a nivel de relación (p. Ej., Edad en número de años) en un nivel ordinario información (por ejemplo, grupos de edad). Sin embargo, si empiezas con el nivel ordinal medida, grupos de edad, no tendrá la edad real de cada persona. Si tu decides Si desea utilizar la edad real de una persona, tendrá que recopilar que d ~ ta-it no puede ser creado a partir de una medida de nivel ordinal. Del mismo modo, un investigador que investiga el El efecto del gasto de la campaña en los resultados electorales podría usar una variable de nivel de relación medir cuánto gastó cada candidato en su campaña. Esta informacion Podría usarse para construir una nueva variable que indique cuánto más uno candidato gastado que el otro, o simplemente si un candidato gastó más que su oppone ~ t. Los gastos de los candidatos también podrían agruparse en rangos. Variables nominales y ordinales con muchas categorías o intervalo y nivel de relación Las medidas que usan más decimales son más precisas que las medidas con menos categorías o lugares decimales, pero a veces el resultado puede proporcionar más información que puede ser utilizado Los investigadores frecuentemente comienzan con medidas a nivel de razón o ~ medidas ordinales y nominales con bastantes categorías pero luego colapso o combinar los datos para crear grupos o menos categorías. Ellos hacen esto así que Jh ~ t tener suficientes casos en la categoría e · ach para el análisis estadístico o para hacer comparaciones más fácil de seguir. Por ejemplo, uno podría querer presentar comparaciones simplemente entre demócratas y republicanos en lugar de presentar datos desglosados en Categorías de fuerte, moderado y débil para cada parte. Puede parecer contradictorio ahora señalar algunas medidas extremadamente precisas Puede crear problemas. Por ejemplo, las medidas con muchas posibilidades de respuesta toman espacio si son preguntas en un cuestionario escrito o requieren más tiempo para explicar si están incluidos en una encuesta telefónica. Tales preguntas también pueden confundir o encuestados encuestados. Un problema más serio es que pueden llevar a la medición. error. Piense en las posibles respuestas a una pregunta que hacen los encuestados usar una escala de 100 puntos (llamada escala de termómetro) para indicar su apoyo Para u oposición a un candidato político, suponiendo que 50 es considerado como el neutral la posición y 9 es la menos favorable o "más fría" y 100 la más favorable. Algunos encuestados no puede usar la escala completa (para ellos, ningún candidato merece más que un 80 o menos que un 20), mientras que otros pueden usar los fines y la mitad de La escala e ignora las puntuaciones intermedias. Podríamos predecir que una persona que le da a un candidato un 100 es más probable que vote por ese candidato que una persona quien le da al mismo candidato un 80, pero en realidad les puede gustar el candidato de la misma manera y sería igualmente probable que voten por el candidato. Otro problema con las mediciones demasiado precisas es que pueden no ser confiables. Si se les pide que califiquen a los candidatos en más de una ocasión, los encuestados pueden variar ligeramente el número que elijan, incluso si su opinión no ha cambiado. Medidas de varios artículos Muchas medidas consisten en un solo elemento. Por ejemplo, las medidas de fiesta. identificación, ya sea que una parte controle el Congreso, el porcentaje de el voto recibido por un candidato, cuán preocupado por un tema es una persona, el área de política de un caso judicial, y la edad se basa en una sola medida de cada Fenómeno en cuestión. A menudo, sin embargo, los investigadores necesitan idear medidas. de Fenómenos más complicados que tienen más de una faceta o dimensión. por Ejemplo, internacionalismo, ideología política, conocimiento político, dispersión de El poder político y la medida en que una persona es políticamente activa son complejos. Fenómenos o conceptos que pueden ser medidos de muchas maneras diferentes. En esta situación, los investigadores a menudo desarrollan una estrategia de medición que les permite para capturar numerosos aspectos de un fenómeno complejo al tiempo que representa la existencia de este fenómeno en casos particulares con un solo valor representativo. Por lo general, esto implica la construcción de un índice o escala de varios elementos "que representa Las varias dimensiones del fenómeno. Estas medidas de elementos múltiples son útiles porque mejoran la precisión de una medida, simplifican los datos de un investigador Reduciéndolos a un tamaño más manejable, y aumentar el nivel de medición. de un fenomeno. En el resto de esta sección, describimos varias Tipos de índices y escalas. Índices Un índice de resumen es un método para acumular puntajes en ítems individuales para formar una medida compuesta de un fenómeno complejo. Un índice se construye asignando un rango de puntuaciones posibles para un cierto número de elementos, determinando el puntuación para cada elemento para cada observación, y luego combinando las puntuaciones para cada elemento Observación a través de todos los elementos. El puntaje sumario resultante es el representante. Medida del fenómeno. Un investigador interesado en medir cuánta libertad existe en diferentes países, por ejemplo, podría construir un índice de libertad política elaborando una lista de elementos de acuerdo con el concepto, determinando dónde puntúan los países individuales en cada ítem, y luego agregando estos puntajes para obtener una medida de resumen. En la tabla 5-3, tal hipotética El índice se utiliza para medir la cantidad de libertad en los países A a E. El índice en la tabla 5-3 es simple y aditivo; es decir, cada elemento cuenta igualmente hacia el cálculo de la puntuación del índice, y la puntuación total es la suma de las puntuaciones de los elementos individuales. Sin embargo, los índices se pueden construir con más complicados. procedimientos de agregación y contando algunos elementos como más importantes que otros. En el ejemplo anterior, un investigador podría considerar algunos indicadores La libertad es más importante que otras y desea que contribuyan más. Para el cálculo de la puntuación del índice final. Esto se puede hacer ya sea ponderando (multiplicando) algunas puntuaciones de elementos por un número que indique su importancia o por asignando una puntuación más alta que 1 a los atributos considerados más importantes. Los índices se utilizan a menudo con encuestas de opinión pública para medir las actitudes políticas. Esto se debe a que las actitudes son fenómenos complejos y por lo general no sabemos. suficiente sobre ellos para diseñar medidas de un solo elemento. Así que a menudo nos hacemos varias preguntas. de personas sobre una sola actitud y agregue las respuestas para representar el actitud. Un investigador podría medir las actitudes hacia el aborto, por ejemplo, por pidiendo a los encuestados que elijan una de las cinco posibles respuestas: estoy totalmente de acuerdo Indeciso, en desacuerdo y totalmente en desacuerdo con las siguientes tres afirmaciones: (1) Los abortos deben permitirse en los primeros tres meses de embarazo. (2) Abortos Debe permitirse si la vida de la mujer está en peligro. (3) Se deben permitir los abortos. cada vez que una mujer quiere uno. Se podría calcular un índice de actitudes hacia el aborto asignando números valores para cada respuesta (como 1 para stronga gree, 2 para acuerdo, 3 para undecideda, nd y luego agregando los valores de las respuestas de un encuestado a estas tres preguntas. (El investigador tendría que decidir qué hacer cuando un encuestado no lo hizo responda a una o más de las preguntas.) El puntaje más bajo posible en este caso ser un 3, indicando la actitud pro-aborto más extrema, y la más alta posible El puntaje sería 15, lo que indica la actitud anti-aborto más extrema. Puntuaciones en entre se indicarían diversos grados de aprobación del aborto. Los índices suelen ser formas bastante simples de producir puntuaciones únicas representativas de Fenómenos complicados como las actitudes políticas. Probablemente sean más precisos. que la mayoría de las medidas de un solo elemento, pero también pueden tener defectos importantes formas. La agregación de puntajes en varios elementos supone, por ejemplo, que cada elemento es igualmente importante para la medida de resumen del concepto y que los elementos Usado fielmente abarca el dominio del concepto. Altho.ugh artículo individual los puntajes se pueden ponderar para cambiar su contribución a la medida de resumen, la El investigador a menudo tiene poca información sobre la cual basar un esquema de ponderación. Varios índices estándar se utilizan a menudo en la investigación de la ciencia política. El crimen del FBI . índice, el Índice de confianza del consumidor y el Índice de precios al consumidor, por ejemplo, Han sido utilizados por muchos investigadores. Antes de usar estos o cualquier otro disponible índice, debe familiarizarse con su construcción y ser consciente de cualquier Preguntas planteadas sobre su validez. Aunque los índices de sumas simples son generalmente más precisa que las medidas de un solo elemento de fenómenos complicados, a menudo es No está claro qué tan válidos son o qué nivel de medición representan. Por ejemplo, es el índice de libertad una medida de nivel ordinal, o podría ser un nivel de intervalo o incluso una medida de nivel de relación? Otro posible problema con los índices, como el El índice de precios al consumidor es que lo que entra en su cálculo puede cambiar con el tiempo. Escamas Aunque los índices son generalmente una mejora con respecto a las medidas de un solo elemento, su La construcción también contiene un elemento de arbitrariedad. Tanto la selección de particular Elementos que componen el índice y la forma en que los puntajes en elementos individuales Los agregados se basan en el criterio de los investigadores. Las escalas también son múltiples elementos medidas, pero la selección y combinación de elementos en ellos se logra más sistemáticamente de lo que suele ser el caso de los índices. Con los años, varios diferentes tipos de escalas de múltiples elementos se han utilizado con frecuencia en la investigación de ciencias políticas. Discutimos tres de ellos: escalas Likert, escalas Guttman y escalas Mokken. Una puntuación de la escala de Likert se calcula a partir de las puntuaciones obtenidas en elementos individuales. Cada ítem generalmente le pide al encuestado que indique un grado de acuerdo o desacuerdo con el artículo, como con las preguntas sobre el aborto discutidas anteriormente. Sin embargo, una escala Likert difiere de un índice en que una vez que los puntajes en cada uno de los ítems se obtienen, solo algunos de los ítems se seleccionan para su inclusión en el cálculo de El puntaje final. Aquellos ítems que le permiten al investigador distinguir más fácilmente aquellos puntuación alta en un atributo de aquellos puntuación baja se mantendrá, y un nuevo el puntaje de la escala se calculará basándose únicamente en esos ítems. Por ejemplo, considere al investigador interesado en medir el liberalismo de un grupo de encuestados. Dado que las definiciones de liberalismo, el investigador no puede ser ¿Cuántos aspectos del liberalismo necesitan ser medidos? Con la escala Liken, la El investigador comenzaría con un gran grupo de preguntas pensadas para expresar diversos Aspectos del liberalismo con los que se pediría a los encuestados que estuvieran de acuerdo o en desacuerdo. Una escala de Liken provisional para el liberalismo, entonces, podría parecerse a la de la tabla 5-4. En la práctica, un conjunto de preguntas como esta se dispersaría a lo largo de un cuestionario. Para que los encuestados no los vean como relacionados. Algunas de las preguntas podrían También puede redactarse de la manera opuesta (es decir, una respuesta "de acuerdo" es conservadora). respuesta) para asegurar respuestas genuinas. Las respuestas de los encuestados a estas ocho preguntas se sumarían para producir Un puntaje provisional. Las puntuaciones en este caso pueden variar de 8 a 40. Luego, las respuestas de las personas más liberales y más conservadoras a cada pregunta sería comparado Cualquier pregunta con respuestas similares de los encuestados dispares serían eliminadas, tales preguntas no distinguirían a los liberales conservadores Se calcularía una nueva puntuación de escala de resumen para todos los encuestados De las preguntas que quedaron. Una estadística llamada alfa de Cronbach, que mide la consistencia interna de los elementos en la escala y tiene un valor máximo de 1.0, se utiliza para determinar qué elementos se deben eliminar de la escala. La regla de oro es que el alfa de Cronbach debería ser 0,8 o superior; los objetos se caen de la escala uno a la vez hasta que se alcance este valor. 25 Las escalas de Liken son mejoras sobre los índices de varios elementos porque los elementos que Las medidas de varios elementos se seleccionan en parte en función de la información de los encuestados. comportamiento más que en el juicio de los investigadores. Las escalas Likert sufren dos de las Otros defectos de los índices, sin embargo. El investigador no puede estar seguro de que todas las dimensiones de un concepto se ha medido, y la importancia relativa de cada elemento es Aún se determina arbitrariamente. La escala de Guttman también usa una serie de elementos para producir una puntuación de escala para los encuestados. Sin embargo, a diferencia de la escala de Likert, una escala de Guttman presenta a los encuestados una gama de opciones de att, que son cada vez más difíciles de acordar; es decir, los elementos componiendo el rango de escala de aquellos con los que es fácil estar de acuerdo con aquellos que están de acuerdo con. Los encuestados que estén de acuerdo con uno de los puntos de actitud "más difíciles" también En general están de acuerdo con los "menos difíciles". (Las escalas de Guttman también se han usado para medir atributos distintos de las actitudes. Su principal aplicación ha sido en la zona. de la investigación de actitudes, sin embargo, aquí se utiliza un ejemplo de ese tipo.) Volvamos al investigador interesado en medir las actitudes hacia el aborto. Él o ella puede diseñar una serie de artículos que van desde "fácil de estar de acuerdo con" a "difícil" para estar de acuerdo con. "Tal enfoque podría estar representado por los siguientes ítems: ¿Está de acuerdo con que no esté de acuerdo con los abortos? 1. La vida de la mujer está en peligro. 2. En caso de incesto o violación. 3. Cuando el feto parece ser insalubre. 4. Cuando el padre no quiere tener un bebé. 5. Cuando la mujer no puede darse el lujo de tener un bebé. 6. Cuando la mujer quiera uno. Este conjunto de elementos parece dar lugar a respuestas consistentes con Guttman escalada. Un encuestado que esté de acuerdo con cualquiera de los ítems también estará de acuerdo con esos artículos numerados más bajos que ese. Esto daría lugar a la "paso a paso" Patrón de respuestas característico de una escala de Guttman. Supongamos que seis encuestados respondieron a esta serie de preguntas, como se muestra en la tabla 5-5. En términos generales, el patrón de respuestas es el esperado; los que estuvieron de acuerdo con las preguntas "más difíciles" también coincidían con las "menos difíciles". Sin embargo, las respuestas de tres personas (2, 4 y 5) a la pregunta sobre el padre Las preferencias no se ajustan al patrón. En consecuencia, la pregunta sobre el padre hace Parece que no encaja con el patrón y se eliminaría de la escala. Una vez que eso ha sido Hecho, el patrón paso a paso se vuelve claro. Con datos reales, es poco probable que cada encuestado dé respuestas que se ajusten a la patrón perfectamente Por ejemplo, en la tabla 5-5, el encuestado 6 dio una respuesta de "acuerdo" A la pregunta sobre el incesto o la violación. Esta respuesta es inesperada y no encaja el patrón. Por lo tanto, estaríamos cometiendo un error si asignáramos una puntuación de escala de 0 al encuestado 6. Cuando los datos se ajustan bien al patrón de escala (el número de errores es pequeño), los investigadores asumen que la escala es una medida adecuada y que el encuestado El "error" puede ser "corregido" (en este caso, ya sea el "acuerdo" en el caso de incesto o la violación o el "desacuerdo" en el caso de la vida de la mujer). Hay estandar procedimientos a seguir para determinar cómo corregir los datos para que se ajusten a los patrón de escala Destacamos, sin embargo, que esto se hace. Solo si los cambios son pocos. Las escalas de Guttman difieren de las de Likert en que, en el primer caso, generalmente solo un conjunto de respuestas dará una puntuación de escala particular. Es decir: - para obtener una puntuación de 3 en la escala de aborto, un patrón particular de respuestas (o algo muy cercano a it) es necesario: en el caso de una escala Likert, sin embargo, muchos patrones diferentes de Las respuestas pueden dar la misma puntuación de escala. Una escala Guttman también es mucho más difícil. para alcanzar una escala Likert, ya que los artículos deben haber sido ordenados y percibido por los encuestados como representando respuestas cada vez más difíciles Reflejando la misma actitud. Las escalas Likert y Guttman tienen deficiencias en su nivel de medición. El nivel de medición producido por las escalas de Likert es, en el mejor de los casos, ordinal (ya que · No sé la importancia relativa de cada elemento y, por lo tanto, no puedo estar seguro de que 5 la respuesta en un elemento es la misma que la respuesta 5 en otro), y el nivel de medición producido por escalas de Guttman se asume generalmente como ordinal. Otro tipo de procedimiento de escalado, llamado escalado Mokken, también analiza las respuestas a múltiples elementos por los encuestados para ver si, para cada elemento, los encuestados pueden ser ordenados y si los artículos pueden ser ordenados.26 Saundra K. utilizó la escala Mokken. Schneider, William G. Jacoby y Daniel C. Lewis para ver si había estructura y coherencia en la opinión pública sobre la distribución de responsabilidades entre El gobierno federal y los gobiernos estatales y locales. Se preguntó a los encuestados. si los gobiernos estatales o locales pensaron que "deberían tomar la iniciativa" en lugar de El gobierno nacional para trece ámbitos políticos diferentes. El procedimiento de escala permitió a los investigadores ver si surgía una secuencia específica de políticas mientras se movía De un extremo a otro de la escala. Un extremo de la escala indicaría apoyo máximo para la actividad política nacional, mientras que el otro extremo indicaría Máximo apoyo a la responsabilidad política del gobierno subnacional. Los resultados de su análisis se muestran en la figura 5-1. La escala va desde Oto 13, con O indicando que el gobierno nacional debería tomar la iniciativa en los trece áreas de política y una puntuación de 13 que indica que el encuestado cree que el estado y Los gobiernos locales deben tomar la iniciativa en todas las áreas políticas. Una persona a cualquier escala Score cree que los gobiernos estatales y locales deben tomar la iniciativa en todas las políticas áreas que caen por debajo de esa puntuación. Por lo tanto, una persona con una puntuación de 9 cree que El gobierno nacional debe tomar la iniciativa en el cuidado de la salud, la igualdad para las mujeres, la protección del medio ambiente y la igualdad de oportunidades, y que los gobiernos estatales y locales Debería tomar la responsabilidad principal de los desastres naturales hasta las zonas urbanas. desarrollo. Las barras en la figura corresponden al porcentaje de encuestados que recibieron una puntuación particular. Así, apenas un poco más del 5 por ciento de la los encuestados pensaron que los gobiernos estatales y locales deberían tomar la iniciativa en todos políticas, mientras que solo el 1% de los encuestados pensaba que el gobierno nacional debe tomar la iniciativa en las trece áreas políticas. La mayoría de los encuestados divididos arriba las responsabilidades. Los autores concluyeron de su análisis que el público sí tiene una razón detrás de sus preferencias para la distribución de responsabilidades políticas entre gobiernos nacionales y estatales y locales. Los procedimientos descritos hasta ahora para construir medidas de múltiples elementos son bastante sencillo. Existen otras técnicas estadísticas avanzadas para resumir o combinando elementos individuales o variables. Por ejemplo, es posible que varias Las variables están relacionadas con algún concepto subyacente. El análisis factorial es un estadístico. Técnica que puede usarse para descubrir patrones a través de medidas. Es especialmente Es útil cuando un investigador tiene un gran número de medidas y cuando hay incertidumbre. Sobre cómo las medidas están interrelacionadas. Un ejemplo es el análisis de Daniel D. Dutcher, quien realizó una investigación sobre el Actitudes de los propietarios de la propiedad del arroyo hacia la mejora de la calidad del agua. estrategia de plantar árboles en una banda ancha (llamados amortiguadores ribereños) a lo largo de los arroyos.28 Pidió a los terratenientes que calificaran la importancia de doce elementos pensados para afectar la disposición de los terratenientes para crear y mantener amortiguadores ribereños. Él Quería saber si las actitudes podían agruparse en distintas dimensiones. que podrían usarse como variables de resumen en lugar de usar cada uno de los once elementos por separado. Usando el análisis factorial, encontró que los elementos se dividieron en tres dimensiones. Estas dimensiones y los elementos incluidos en cada dimensión se enumeran en tabla 5-6. La primera dimensión, que él denominó "manteniendo la estética de la propiedad". elementos incluidos, como mantener una vista de la secuencia, pulcritud y mantenimiento espacio abierto. Una segunda dimensión contenía elementos relacionados con la preocupación por el agua. calidad. La tercera dimensión relacionada con la protección de la propiedad contra daños o pérdidas. El análisis factorial es solo una de las muchas técnicas desarrolladas para explorar la dimensionalidad. de medidas y para construir escalas multi-ítems. Las lecturas listadas al final. de este capítulo incluyen algunos recursos para estudiantes que están especialmente interesados en Este aspecto de la medida variable. A través de índices y escalas, los investigadores intentan mejorar tanto la precisión como la La precisión de sus medidas. Aunque estas medidas de múltiples elementos han recibido la mayoría de los usos en la investigación de actitudes, a menudo también son útiles en otros esfuerzos. Ambos Los índices y escalas requieren que los investigadores tomen decisiones con respecto a la selección de elementos individuales y la forma en que se combinarán las puntuaciones en esos elementos Producir medidas más útiles de los fenómenos políticos.
Conclusión En gran medida, un proyecto de investigación es tan bueno como las mediciones que son Desarrollado y utilizado en él. Las mediciones inexactas interferirán con las pruebas de explicaciones científicas de los fenómenos políticos y puede conducir a errónea conclusiones Las mediciones imprecisas limitarán el alcance de las comparaciones que Se puede hacer entre las observaciones y la precisión del conocimiento que se obtiene. De la investigación empírica. A pesar de la importancia de una buena medición, los investigadores de la ciencia política a menudo Encuentra que sus esquemas de medición son de incierta precisión y exactitud. Los conceptos abstractos son difíciles de medir de manera válida, y las restricciones prácticas El tiempo y el dinero a menudo ponen en peligro la fiabilidad y precisión de las mediciones. La calidad de las mediciones de un investigador hace una importante contribución. a los resultados de su investigación empírica y no debe ser ligera o rutinariamente sacrificado A veces, la precisión de las mediciones se puede mejorar mediante el uso de Medidas multi-item. Con índices y escalas, los investigadores seleccionan múltiples indicadores. de un fenómeno, asigne puntajes a cada uno de estos indicadores y combine esos Puntúa en una medida de resumen. Aunque estos métodos han sido los más utilizados Con frecuencia en la investigación de actitudes, también se pueden utilizar en otras situaciones para mejorar La exactitud y precisión de las medidas de un solo elemento. Medición. El proceso por el cual los fenómenos son. Observaciones observadas y representadas. numerales Escala de Mokken. Un tipo de procedimiento de escala que evalúa. La medida en que hay orden en las respuestas de los encuestados a varios elementos. Similar a la escala de Guttman. Medida nominal. Una medida para la cual diferentes. Las puntuaciones representan categorías diferentes, pero no ordenadas. Definición operacional. Las reglas por las que un concepto. Se mide y se asignan puntuaciones. Operacionalización. El proceso de asignación de números. o puntuaciones a una variable para representar los valores de un concepto. Medición ordinal. Una medida para la cual los puntajes. representan categorías ordenadas que no son necesariamente equidistantes entre sí. Error de medición aleatoria. Errores en la medida Que no tienen dirección o causa sistemática.