Resumen Cuantitativas Parte 1

TECNICAS CUANTITATIVAS DE LA INVESTIGACIÓN
CÁTEDRA CHITARRONI
PRÁCTICOS: DANISA RIERA - TM/TT
LA MEDICIÓN: EL DATO EN LAS CIENCIAS SOCIALES
Unidades de análisis: fragmentos de la realidad que pueden ser personas individuales, o bien
organizaciones como los partidos políticos
Variables: ciertas propiedades de los objetos que son de nuestro interés: permiten clasificar,
ordenar o medir a las unidades de análisis o, lo que es lo mismo, las unidades de análisis
asumen cierta posición –cierto valor o categoría– en las variables
La confluencia de estos tres elementos (unidades de análisis, variables y posición que ocupan
las primeras en las segundas) es lo que denominamos un dato Esta estructura tripartita del dato
cobra materialidad en una matriz de datos
La matriz de datos: unidades de análisis en las filas; variables en las columnas; valores o
categorías en las celdas
Tipos de matrices de datos
Unidades de análisis Variables
Muchas Pocas
Muchas Estudios extensos

(paradigma: censos)
Pocas Estudios profundos (paradigma:

estudio de caso)
Las variables: capacidad o nivel de medición

Variables categóricas o cualitativas
• Nominales: clasifican
• Ordinales: clasifican y ordenan
Variables numéricas o cuantitativas
• De intervalos iguales: clasifican, ordenan y miden distancias entre casos (cero
convencional)
• De razones o cocientes: clasifican, ordenan, miden distancias entre casos y establecen
relaciones entre valores (cero absoluto)
UNIDADES DE DISTINTO NIVEL DE AGREGACIÓN Y ATRIBUCIÓN DE

PROPIEDADES A DIFERENTES NIVELES
Tipos de propiedades de unidades de Propiedades de los...
análisis de distinto nivel de agregación
Miembros Colectivos
Que dependen de los...Miembros Absolutas Analíticas
Colectivos Contextuales Globales
Que dependen de Miembros Relacionales Estructurales

relaciones entre los...
Colectivos Comparativas ------
Propiedades de los miembros
• Absolutas: son un atributo propio del individuo, como la edad, el sexo o el nivel
educativo
• Contextuales: son un atributo que el individuo adquiere del colectivo, tal como
pertenecer a un hogar pobre o ser alumno de una escuela pública
• Relacionales: depende de la relación del individuo con otros miembros del mismo
colectivo, tal como la posición en el hogar (jefe, cónyuge, hijo, etc.)
• Comparativas: propiedades que caracterizan a un miembro comparando su valor en
alguna propiedad (absoluta o relacional) y la distribución de esta propiedad en el colectivo al
que pertenece. Si decimos que alguien es el hijo mayor o el principal perceptor de ingresos en
un hogar, estamos fijando su posición en relación con la distribución de la variable edad o
ingresos entre el total de los miembros del hogar.
Propiedades de los colectivos

• Analíticas: propiedades de los colectivos construidas a través de operaciones con
propiedades de los miembros, tal como la tasa de desempleo de una provincia, el ingreso per
capita de un hogar o la tasa de repitencia de una escuela
• Globales: propiedades de los colectivos que no dependen de propiedades de los
miembros tal como el tipo de gobierno o la extensión de un país, o el tamaño de un hogar o el
tipo de vivienda que ocupa
• Estructurales: propiedades de los colectivos que son construidas a partir de las
relaciones entre los miembros. Sería el caso de la variable que clasifica a los hogares en
nucleares, extensos o compuestos. Ello depende de las relaciones de parentesco que guardan
entre sí los miembros convivientes (tipo de hogar)
EJEMPLO:
El desempeño escolar de los niños que provienen de un hogar con jefe de alta educación es
más satisfactorio
• Esta proposición se refiere a individuos: los niños
• Y vincula una variable individual (el desempeño escolar, que es propio de los niños),
con una variable contextual (la pertenencia a un hogar con jefe altamente educado, que es una
característica del hogar)
• Y adviértase que, a su vez, la alta educación se ha transferido, por “carácter transitivo”,
del jefe al hogar, para concluir en el niño.
La falacia ecológica
• Las relaciones observadas a nivel de unidades colectivas no siempre reflejan que iguales
relaciones tienen lugar entre los miembros
• Así, el hecho de que los robos a viviendas aumenten en los barrios donde hay más
hogares de ingresos altos, no significa que sean los ricos los que roban viviendas de sus vecinos
• Y el hecho de que ciertos delitos contra las personas sean más frecuentes en los barrios
de ingresos más bajos, no significa tampoco que sean los pobres los que cometen esos delitos
La falacia atomista
• Es la falacia de inferir conclusiones sobre la variabilidad entre unidades de nivel superior
con datos correspondientes a unidades de nivel inferior
• La falacia atomista surge porque las asociaciones entre dos variables individuales pueden
ser diferentes de las asociaciones entre variables análogas pero grupales. Por ejemplo, en un
estudio con individuos puede observarse que el mayor ingreso individual se asocia a una
menor mortalidad por cardiopatía coronaria
• Si se infiere de estos datos que a escala de país el mayor ingreso per cápita se asocia con la
reducción de la mortalidad por cardiopatía coronaria, el investigador quizá esté incurriendo
en una falacia atomística (porque entre países, los mayores ingresos per cápita pueden, en
realidad, asociarse con una mayor mortalidad por cardiopatía coronaria).
¿Qué son los datos secundarios?

• Aquellos que fueron recogidos o producidos por otros y que pueden ser
empleados por nosotros
• Por oposición a los que uno mismo recoge o produce
• Así, cuando una consultora hace una encuesta de intención de voto, se trata de
datos primarios
• Pero si uno emplea los datos de la encuesta de hogares que hace el INDEC para
hacer una investigación sobre la pobreza o el empleo, se trata de datos secundarios
Ejemplo: para un historiador que investigue la historia del sindicalismo, fuentes

secundarias son los libros de otros investigadores sobre el tema: Rotondaro, Matsushita
o Julio Godio
En tanto que los periódicos sindicales, las solicitadas de la CGT, aunque sean material
escrito hace tiempo, son datos primarios, pues no fueron producidos como datos: el
investigador los convierte en tales
Ventajas
Disponibilidad, Accesibilidad, Economía, Amplia cobertura territorial, Muestras con
alta representatividad y posibilidad de desagregación, Comparabilidad a lo largo del
tiempo, Comparabilidad entre países (convenciones internacionales)
Desventajas
Temáticas estandarizadas, No relevan temas específicos, A veces hay módulos
especiales que no se repiten. No cubren localidades pequeñas (salvo el censo o –
limitadamente– las estadísticas vitales). Los tamaños muestrales impiden focalizar en
subpoblaciones muy pequeñas
Censo es un relevamiento total y –casi– simultáneo de la población de un país, sus

finalidades: planificación, asignación de representación política, recursos humanos,
marcos muestrales para las encuestas
¿De facto o de jure?: un censo de facto registra a las personas que pasaron la noche
previa en cada vivienda, un censo de jure registra a los que viven habitualmente en la
vivienda
La EPH (Encuesta Permanente de Hogares) del INDEC

• Es una encuesta por muestreo
• Que se releva en 24 aglomerados urbanos (todas las capitales provinciales, y
otras ciudades importantes como Rosario, Mar del Plata, Bahía Blanca y Río IV)
• Representa al 60% de la población total del país y al 70% de la población
urbana)
• Se puede desagregar geográficamente por aglomerados y dentro del GBA
permite separar la CABA
Los datos de fuentes internacionales: una cantera de información

• Los organismos internacionales consolidan bases de datos sobre la mayor parte
de los países del mundo sobre vastas temáticas económicas y sociales
• En general provienen de las fuentes estadísticas oficiales de cada país
• Están generalmente disponibles en las páginas web
MUESTREO
Una población es un conjunto de elementos definidos por ciertas especificaciones: por

ejemplo, las personas que votaron en las últimas elecciones, los habitantes de la Ciudad
de Buenos Aires de 14 y más años
Una muestra: un subconjunto de los elementos que componen la población (casi
siempre una pequeña proporción de ellos) obtenidos bajo ciertos recaudos de manera
que satisfagan nuestras necesidades. Las muestra probabilísticas o aleatorias, que son
aquellas en cuya selección entran procedimientos de azar. A ellas nos referiremos en
primer término.
Las muestras no probabilísticas, o sea aquellas en las que los elementos que las
componen son elegidos por procedimientos que no incluyen el azar.
Marco muestral: todos los elementos que componen la población.

Una muestra más grande tiende a ser mejor, pero que el tamaño muestral es
independiente de la magnitud del universo. Con una muestra más grande se consigue
aumentar la precisión o, en otras palabras, achicar el error de estimación.
La confianza en que la muestra obtenida no difiere en demasía de la población, también
crece apreciablemente así como aumenta el tamaño muestral.
Principales factores que se tienen en cuenta al determinar el tamaño de las muestras:

• Uno de ellos es la precisión con que queremos estimar: ¿aceptaremos
equivocarnos por un punto, por dos o por tres?
• Otro es la confianza que pretendemos asignar a nuestras estimaciones: esta
confianza también se puede cuantificar, puesto que es posible decidir, antes de
elegir la muestra, si queremos afirmar algo con una seguridad de 99% o nos
conformaremos con una de 95%.
• Un tercer elemento estriba en una característica de la población: su
heterogeneidad: los universos más heterogéneos requieren muestras más
grandes.
Tamaño muestral = (Confianza * heterogeneidad) / Error de estimación
Muestras probabilísticas
La muestra al azar simple

En las muestras de azar simple, hemos de contar con un listado completo de los N
elementos que componen la población
Estos elementos deben ser numerados y, a continuación, se eligen mediante una tabla de
números al azar, un bolillero o cualquier otro medio aleatorio, n elementos que
integrarán la muestra
El procedimiento es, pues, similar al que aplica quien saca papelitos numerados de una
galera
Muestras al azar sistemático
El paso inicial consiste en obtener un cociente entre N (cantidad de elementos que
componen la población) y n (cantidad de ellos que hemos de incluir en la muestra).
Si este cociente fuera 3000/300 = 10, se determina un primer número al azar entre 1 y
N (en este caso, entre 1 y 3000). Supongamos que salga el 115: pues bien, el primer
elemento elegido será el n° 115 en el listado.
A partir de él elegiremos los otros 299 con intervalo igual a N/n, es decir igual a 10.
De manera que hecha la primera selección (115), le seguirá la 125, luego la 135, etc.
Las muestras estratificadas

Antes de seleccionar la muestra, se separa el universo en estratos o subuniversos.
Para ello debemos disponer un marco muestral, que contenga la información suficiente
como para hacer tal división. Por ejemplo, si fuera necesario seleccionar una muestra de
alumnos de la facultad de ciencias sociales, con el propósito de entrevistarlos y
averiguar sus opiniones y expectativas, podríamos decidir estratificar por carrera.
De manera que elegiríamos submuestras separadas de alumnos de cada carrera
El muestreo estratificado puede ser proporcional, si distribuimos los casos muestrales
en proporción al peso que adquieren los estratos en la población
Así, si tenemos un estrato que representa la mitad de la población, otro el 30% y el
tercero el 20% restante, seleccionamos la mitad de la muestra en el primero, el 30% en
el segundo y el 20% en el tercero
El muestreo de conglomerados
Esta es una muestra por conglomerados de etapa única: hemos seleccionado al azar sólo
una vez. La muestra será tanto mejor cuanto más se parezcan los conglomerados entre
sí.
Conglomerados de múltiples etapas Es el tipo de muestreo del que suelen valerse las
encuestas de hogares, así como las de opinión y los sondeos electorales
En este caso se seleccionan al azar conglomerados geográficos (por ejemplo, barrios o
radios censales) Luego, dentro de ellos, manzanas.Y dentro de las manzanas, se
seleccionan viviendas…
El muestreo no probabilística
Muestreo coincidental: Se trata de seleccionar –por ejemplo para realizar una encuesta–
a las personas que pasan casualmente por el sitio donde se ha ubicado el encuestador:
generalmente un punto por donde pasa mucha gente, tal como una estación ferroviaria o
una esquina céntrica
Muestreo por cuotas: El muestreo por cuotas es tenido por la mejor alternativa para
sustituir al muestreo probabilístico en procura de obtener una razonable réplica “en
pequeño” de la población, cuando no se cuenta con la posibilidad de llevar a cabo un
muestreo al azar. Guarda alguna semejanza con el muestreo estratificado.
Muestreo intencional: En este tipo de muestreo no buscamos en modo alguno que la

muestra se parezca a la población. Por el contrario, nos interesamos exclusivamente en
cierto tipo de casos, que nos resulten relevantes desde el punto de vista teórico
EL ANÁLISIS EXPLICATIVO Y LOS VÍNCULOS CAUSALES EN LAS CIENCIAS

Establecer “leyes” (regularidades empíricas repetidamente comprobadas) que vinculen a unos
fenómenos con otros
La explicación nomológico deductiva (Carl Hempel, epistemólogo alemán del Círculo de

Viena)
Explanans
-L1, L2, …Ln (leyes generales) El deterioro de las condiciones de vida, genera estallidos
sociales
-C1, C2, …Cn (condiciones antecedentes) Alto desempleo, aumento de la desigualdad y la
pobreza, exclusión social de ciertos grupos -por ejemplo de origen migratorio-, reducción de
ayuda social
Explanandum
-E (descripción del fenómeno empírico a ser explicado) Estallido social (en España en 2012 o
en Londres en 2011 o en París en 2005 o en Buenos Aires en 2001)
Las reglas de Mill:

- Método de la concordancia y de la diferencia
• Método de la concordancia (causa suficiente)
X, A, B, C ®Y
X, (A, B, C) ®Y
• Método de la diferencia (causa necesaria)
X, A, B, C ®Y
(X), A, B, C ® (Y)
-Método de la coincidencia y la discrepancia
X, A, B, C ®Y
X, (A, B, C) ®Y
(X), A, B, C ® (Y)
La objeción a las reglas de Mill: La eventual existencia existencia de un factor oculto D
X, A, B, C; D ®Y
X, (A, B, C), D ®Y
(X), A, B, C (D) ® (Y)
Condiciones que requiere la causalidad
 Presencia conjunta o covariación empírica
 Sucesión temporal (primero la causa; luego la consecuencia)
 Nexo teórico
 Control de otros factores (el factor oculto D)
El experimento estocástico
Es el principal modo que tiene la ciencia para poner a prueba relaciones causales es el
denominado diseño experimental, también denominado experimento estocástico moderno.
Condiciones:
• Debe contarse con un grupo experimental y un grupo de control cuya igualdad inicial
pueda garantizarse
• El factor experimental o estímulo debe poder ser introducido por el investigador
• Si el factor experimental no es dicotómico (presencia/ausencia), podemos contar con
diferentes grupos
• Una medición de la variable dependiente, posterior a la introducción del estímulo, debe
arrojar diferencias significativas entre ambos grupos
Procedimiento de igualación:
Lo ideal es la igualación al azar o ramdomización: es decir, ambos debieran ser seleccionados
como muestras probabilísticas de una misma población, o bien resultar de la partición al azar de
una misma muestra
También se recurre al sistema denominado matching o apareamiento: en este caso, pueden
formarse, a partir de la muestra original, pares de casos que se asemejen en los valores de un
conjunto de variables que se consideren cruciales en la investigación. Por ejemplo, sujetos de
igual edad, sexo, nivel educativo y situación ocupacional
Experimentos antes/después: En algunas ocasiones en que no es posible garantizar la igualdad
inicial por procedimientos de azar, es posible acudir a una medición previa de la variable
dependiente en ambos, Luego de introducido el estímulo sobre uno de los grupos, es posible
realizar una segunda medición de la variable dependiente. Luego de introducido el estímulo
sobre uno de los grupos, es posible realizar una segunda medición de la variable dependiente
Aplicación del diseño experimental: Es difícil replicar fenómenos sociales, económicos,
políticos, etc. en condiciones de laboratorio y bajo control. Las causas no pueden manipularse y
están fuera de nuestro control. Se suele recurrir a un grupo de comparación, estadísticamente
construido, que presente condiciones similares a los beneficiarios: los llamados experimentos de
campo
Se habla de cuasi experimentos cuando falta alguno de los requisitos exigidos: o bien la
posibilidad de igualación inicial o bien la medición previa (en ausencia de tal igualación) o bien
la introducción deliberada del estímulo
La validez en los diseños experimentales:
 validez interna se refiere a si se han podido aislar eficazmente las eventuales influencias
de otras variables ajenas al estímulo experimental
 La validez externa hace referencia a las posibilidades de generalización de los efectos o
relaciones causales observadas
La aproximación mediante el control de variables: La investigación controlada se emplea como
sustituto del experimento apela a la simulación estadística del estímulo y la igualación de
grupos. Se emplea cuando no se cuenta con grupos previamente igualados en forma aleatoria, ni
se puede introducir el factor experimental generalmente, porque este ya ha actuado
El modelo de control de variables desarrollado por Paul Lazarsfeld como aproximación al

experimento
El modelo de análisis multivariado de Lazarsfeld nos proporciona elementos para discernir el
papel que cumple cada variable en la relación:
• Si una de ellas está causando la relación entre las otras
• Si está intermediando la relación entre ellas
• Si actúa como condición para que esa relación se produzca
• Si es la verdadera causa de la que suponemos independiente...
Y en función de ello, realimentamos el conocimiento previo
Partimos de una relación bivariada (x-y)
Que reproducimos para cada categoría de la variable independiente por separado: las relaciones
parciales
T1 T2
X1 X2 Marg.T1 X1 X2 Marg.T2
Y1 FX1Y1T1 FX2Y1T1 FY1T1 Y1 FX1Y1T2 FX2Y1T2 FY1T2
Y2 FX1Y2T1 FX2Y2T1 FY2T1 Y2 FX1Y2T2 FX2Y2T2 FY2T2
Subtotal FX1T1 FX2T1 NT1 Subtotal FX1T2 FX2T2 NT2
La posición lógica de la variable de control: antecedente o interviniente: En esta fase del análisis
cobra importancia el orden temporal de las variables que mencionábamos al principio. Según T
sea variable antecedente o interviniente, pasará a ocupar en los marginales el lugar de la variable
independiente (y en este caso encabezará las columnas de los cuadros) o bien quedará situada en
las filas de los mismos, y de ésa manera la variable independiente original conservará o su lugar
en los mismos
Relaciones marginales con T como variable antecedente (antes que X)
Relaciones marginales con T como variable interviniente (entre X e Y)
La tipología de Lazarsfeld: cuatro alternativas (Ver ejemplos de cada uno en libro)
1. Que la relación entre las variables (X e Y) se mantenga en los cuadros parciales (aunque
acrecentada en uno de ellos y debilitada en el otro) y la variable introducida como control
(T) fuera una variable antecedente con relación a X. Esta situación se denominaba, en la
nomenclatura de Lazarsfeld, parcial antecedente y equivaldría a una condición bajo la cual
tenía lugar la relación XY.
2. Que la relación XY permaneciera en los parciales (también acrecentada en uno y debilitada
en el otro), pero T fuera una variable intermediaria, situada entre X e Y. En este caso,
denominado parcial interviniente, habría de pensarse que la relación entre X e Y se produce
sólo por mediación de cierto valor de T, que operaría como una contingencia:
3. Que la relación entre X e Y desapareciera en los parciales y, en cambio, se revelaran
relaciones fuertes en los marginales. Si T fuera una variable antecedente con relación a X,
se trataría de una situación marginal antecedente, donde habría de presumirse que T fuese
la verdadera determinante de las variaciones de X e Y. Esta configuración correspondería a
al caso de una relación aparente o espuriedad)
4. Por fin, podría suceder que desapareciera la relación en los parciales y se observaran
relaciones marginales intensas, pero con T como variable intermediaria entre X e Y. A
esta situación, denominada marginal interviniente, Lazarsfeld la distinguía con el término
de interpretación intermediación o interpretación
Recomendaciones:
Primero observar los parciales:
• ¿Se mantienen similares a la relación original?
• ¿Aumenta uno y baja el otro?
• ¿En ambos se debilitan o desaparecen las relaciones?
Luego mirar los marginales:
• La variable de control ¿tiene relación con X o con Y?
• Si el marginal TY es más fuerte que la relación original, debe presumirse que T es la
variable explicativa principal
• En ese caso habría que rotar el análisis, comenzando por TY
ANÁLISIS DE DATOS CUANTITATIVOS: PROCEDIMIENTOS BÁSICOS DE ESTADÍSTICA
DESCRIPTIVA
De la recolección de la información cuantitativa al análisis:
Los datos de las encuestas o de los registros secundarios van a conformar la matriz de
datos, donde confluyen unidades de análisis, variables, valores o categorías
La estadística y la “desaparición del caso”: la matriz cuantitativa no puede ser “leída”.
Requiere de operaciones de resumen que son posibles mediante el uso de la estadística
Un ejemplo: Los argentinos y su relación con el mercado de trabajo

1-¿Cuántos trabajan?: distribución de frecuencias de una variable nominal
Población de 10 años y más según condición de actividad
Condición de actividad Total %
Ocupado 9.113.667 47,1
Desocupado 1.556.716 8,1
Inactivo 8.664.919 44,8
Total 19.335.302 100
Fuente: elaboración propia en base a EPH-INDEC (semestre I
de 2004)
2- De qué trabajan: distribución de frecuencias de una variable nominal

Población ocupada de 10 años y más según categoría ocupacional. Total de aglomerados
urbanos
Categoría ocupacional Total %
Patrón o empleador 357.158 3,5
Trabajador por cuenta 2.155.463 21,1
propia
Obrero o empleado 7.524.365 73,8
Trabajador sin 163.177 1,6
remuneración
Total 10.200.163 100
Las razones: cocientes entre frecuencias de diferentes categorías de una variable

Desocupados / (ocupados + desocupados) = 8,1 / 55,2 = 0,147 (14,7%: la tasa de
desempleo)
Una razón entre los desocupados y los económicamente activos (desocupados y
ocupados), nos devuelve la tasa de desempleo.
• Obrero o empleado / patrón o empleador = 73,8 / 3,5 = 21,1
• Autónomos / asalariados = (21,1 + 3,5) / 73,8 = 0,33
Estas razones nos revelan que hay 21 asalariados por cada empleador. O, lo que es lo
mismo, cada patrón emplea, en promedio, a 21 trabajadores. Asimismo, si sumamos a
los empleadores y los cuentapropistas, advertiremos que hay 0,33 trabajadores no
dependientes por cada asalariado. Sería más claro decir que hay 33 de los primeros por
cada 100 personas que trabajan en relación de dependencia.
3-Distribución de frecuencias de una variable ordinal: frecuencias acumuladas
Tabla 3.2.1: Población de 14 años y más según máximo nivel educativo alcanzado (en
%). Total de aglomerados urbanos.
Nivel educativo % % acumulado % acumulado
(A) (D)
Hasta primaria incompleta10,8 10,8 100
Hasta secundaria 49,2 60 89,2

incompleta
Hasta superior incompleta 29,8 89,8 40
Superior completa 10,2 100 10,2
Total 100
El caso particular de las respuestas múltiples y su tabulación

¿Cuáles de los siguientes temas desearía que encare el próximo gobierno?
1) Inseguridad
2) inflación
3) Desempleo
4) Educación
(marque hasta tres alternativas)
Elecciones de los encuestados:

A 1 2 3
B 1 2 4
C 3 1 2
D 4 1 3
E 4 2 1
El porcentaje de encuestados nos dice qué proporción de los sujetos interrogados se

inclinó por cada una de las alternativas (no se suma)
El porcentaje de respuestas nos dice qué alternativas fueron más preferidas por los
sujetos interrogados
% %
Alternativas Encuestados Respuestas encuestados respuestas
Inseguridad 5 5 100 33,3
Inflación 4 4 80 26,7
Desempleo 3 3 60 20
Educación 3 3 60 20
Total 5 15 300 100
EL CASO DE LAS VARIABLES CUANTITATIVAS: ¿CÓMO RESUMIR LA INFORMACIÓN?
Cuando se quiere mostrar la distribución de frecuencias de una variable cuantitativa
suelen construirse intervalos de clase o tramos
• Estos intervalos deben ser exhaustivos y excluyentes y no necesariamente deben
ser de igual amplitud
• Las edades, en los censos, suelen representarse en grupos quinquenales
• Pero si representáramos una distribución de ingresos, los tramos tenderían a ser
menores al principio y a ampliarse a medida que los ingresos son más altos. La
razón es que una diferencia de $ 1000 es significativa entre $ 2000 y $ 3000
Pero pierde importancia entre $ 10000 y $11000
Ejemplo:
Las medidas de resumen para variables cuantitativas

Hay tres subconjuntos de medidas estadísticas de resumen para las variables
cuantitativas o numéricas:
 Medidas de tendencia central:
El modo o moda es el valor de variable que más se repite: el que presenta la frecuencia
más elevada (puede obtenerse también en variables categóricas)
La mediana es el valor de variable que deja por encima y por debajo igual cantidad de
casos
La media aritmética es el promedio de todos los valores
 Medidas de posición u orden
La mediana (Md)
Los cuartiles (C1)
Los quintiles (Q1)
Los deciles (D1)
Los percentiles (P1)
 Medidas de dispersión
El rango o recorrido (RG)
El rango relativo (RR)
El rango semi-intercuartílico (RSIC)
El desvío medio (DM)
La varianza (S2)
El desvío estándar (S)
El coeficiente de variación (CV)
APLICACIONES CONJUNTAS DE LAS MEDIDAS DE RESUMEN

La investigación sobre el mercado de trabajo
• ¿Difieren los ingresos de los ocupados según sean asalariados (registrados o no
registrados) o cuentapropistas?
• ¿Quiénes ganan más?
• ¿Entre quiénes hay mayor desigualdad?
LA MEDICIÓN DE ACTITUDES
Hay varios modos de resolver metodológicamente la medición de actitudes
Escalas tipo Lickert: clasifican sujetos en cuanto al grado en que poseen o no cierta
actitud, es decir a las unidades medidas
Escala tipo Thurstone clasifican objetos o items, que luego se emplean para medir a los
sujetos según la actitud –de aceptación o rechazo– que manifiestan frente a dichos
objetos.
Los procedimientos de jerarquización y pareo permiten el escalamiento de objetos
según las actitudes que suscitan en las personas
Por ejemplo, podría tratarse de cuatro temas a incluir en la agenda gubernamental:
Educación – Desempleo – Inflación - Seguridad
Podríamos someter estos cuatro “objetos” al juicio de un conjunto amplio de personas,
solicitándoles que los puntuaran de uno a cuatro según la preferencia que les otorgan
Las puntuaciones otorgadas por los jueces
Una vez otorgadas las puntuaciones por los N jueces, es posible obtener un promedio
vertical para cada una de las actividades considerada
El sistema de pareo da unos resultados parecidos. En este caso, se forman con los cuatro
objetos tantos pares como sea posible: Con cuatro elementos se pueden formar seis
pares. Se solicita a los diferentes jueces que elijan uno de los dos elementos, desechando
el restante, cada objeto obtendrá una puntuación promedio otorgada por cada juez, en
base al número de veces en que lo prefirió frente a los otros. La puntuación final es el
promedio de los puntajes otorgados por los N jueces
Preferencias de a pares:
Puntuaciones de los objetos
La escala de Lickert: mide la posición de un sujeto sobre un continuo con respecto a un

objeto de estudio que sería casi imposible medir de otra manera por involucrar
prejuicios, propios de la vida en sociedad
La principal ventaja que presenta es que contiene en su proceso de construcción su
propia prueba de unidimensionalidad o, lo que es lo mismo, de su validez. Esto es, de
que todos los items incluidos miden una misma dimensión latente, que no es otra que la
actitud que se pretende medir
Se reúnen afirmaciones (entre 20 y 40) que suponemos que expresan ideas positivas o
negativas con relación a la dimensión que pretendemos medir. Deben formularse
siguiendo las siguientes recomendaciones: Estar enunciados en presente, No suministrar
información sobre hechos, Evitar la ambigüedad, No enunciar ideas sobre las cuales
todos o nadie concuerde, No colocar expresiones que necesiten ser explicadas, No usar
dobles negaciones
Una vez enunciado el listado de sentencias, se procede a realizar la prueba de

unidimensionalidad para medir la validez de las mismas a fin de incorporarlas a lo que
será la “escala definitiva”.Es decir, cuáles de las que enunciamos discriminan o separan
a la población entre los que presentan o no presentan la actitud discriminatoria
Jueces: personas perteneciente a la población que sobre la cual se aplicará la escala
definitiva
Puntuaciones:
El total acuerdo con la afirmación “Los inmigrantes limítrofes ocupan puestos de

trabajo que deberían ser para los argentinos” recibiría una puntuación de 4, en tanto que
el total acuerdo con el item “La Argentina siempre recibió con generosidad a los
extranjeros y debe seguir haciéndolo” merecería un puntaje de cero.
Selección de jueces: Cada juez obtendrá un puntaje total que resultará de sumar los
puntajes que manifiesten frente a las afirmaciones
Ordenamos al conjunto de los jueces en forma decreciente según sus puntajes
Dividimos luego la distribución en cuatro partes de tal manera que en los extremos
queden el 25 % inferior y el 25 % superior. Con estos dos grupos nos interesara trabajar
para analizar la unidimensionalidad de los ítems
Selección de ítems: Si un ítem discrimina correctamente –si mide adecuadamente el
grado en que está presente al actitud de rechazo a los migrantes– se supone que debería
ser contestado de modo diferente por los jueces del grupo “alto” y por los jueces del
grupo “bajo”. Si ambos grupos los contestaran de manera semejante, significará que ese
ítem no mide adecuadamente
Entonces, para cada uno de los ítems, hemos de promediar las puntuaciones recogidas
en los jueces del grupo “bajo” (5 y 1) y en los jueces del grupo “alto” (4 y 2)
Se calcula la diferencia entre ambos promedios
Se toma como criterio de diferenciación para distinguir aquellas afirmaciones válidas
para incluir en la escala definitiva, aquellas cuya diferencia de promedios resulte de 3 en
adelante
La construcción de la escala: En nuestro caso, después de aplicar el procedimiento con
todos los ítems, veremos que los únicos que pasan la prueba de validez son el 1 y el 2.
Lo que se analiza en principio es la actitud (graduada por grados de conformidad) de la
población
Las puntuaciones: Si hubiéramos aplicado diez items puntuados entre cero y cuatro, los
encuestados podrían haber obtenido puntuaciones en un rango de cero a cuarenta. En
este caso, podríamos establecer cuatro intervalos sobre ese rango:
0 a 10: muy en desacuerdo
11 a 20: en desacuerdo
21 a 30: de acuerdo
31 a 40: muy de acuerdo
A pesar de que aparecen intervalos numéricos estamos frente a una variable ordinal y
que lo que hicimos es “cuantificarla” a través de los procedimientos arriba expuestos
La escala de tipo Thurstone
Se requiere del concurso de “jueces” que evalúen ítems: sin embargo estos jueces no
son personas del común, de perfil semejante al de los destinatarios finales de la escala,
sino que ha de tratarse de “expertos”, que reúnan calificaciones especiales sobre la
temática que se pretende medir, requiere la construcción de un amplio número de
afirmaciones o ítems –un centenar o más– deliberadamente redactados de modo tal que
su contenido sea, respectivamente, positivo, negativo y neutral respecto de la actitud a
medir. Un ejemplo: medir el conservadurismo político. Para ello se redactará un amplio
conjunto de ítems que se repartan –en forma equilibrada– entre “progresistas”,
“neutrales” y “conservadores”
“La desigualdad social ha existido siempre y es necesaria para el funcionamiento de la
sociedad” (conservador)
“El gobierno debe procurar una mejor distribución de la riqueza sin vulnerar la
propiedad privada” (neutral)
“Los trabajadores deben tener una creciente influencia en el control del Estado”
(progresista)
Los jueces deberán puntuar los ítems sobre un continuo de uno a once puntos, donde el
uno corresponde a la actitud menos conservadora (----) y el once a la más
extremadamente conservadora (++++):
Si los ítems están adecuadamente redactados y libres de ambigüedad, debería esperarse

que los juicios de los jueces discrepen poco y lo hagan en una banda relativamente
estrecha: miden adecuadamente aquellos ítems en torno de los cuales hubo relativa
coincidencia
¿Cómo seleccionar items?
Es necesario medir el grado de consenso o disenso que genera cada item entre los
diferentes jueces: ello es posible mediante una medida de dispersión, como lo es la
desviación media.
Conceptualmente, consiste en la sumatoria bruta (sin considerar el signo) de las
diferencias que pueden calcularse –para cada ítem entre la puntuación otorgada por cada
uno de los jueces y el promedio de ellas mismas, dividido por el número de jueces.
Si los jueces acuerdan mucho, esta sumatoria será muy pequeña: en el extremo de
homogeneidad, si todos asignaran 10 puntos a un ítem, no habría diferencias y la suma
sería cero
En el ejemplo, los jueces otorgaron puntuaciones diferentes (10, 11 y 8) y el promedio

de estas puntuaciones resultó 9,7. La suma bruta de las diferencias entre cada
puntuación y ese promedio es 3,3, que dividido por 3 (pues son tres los jueces), arroja
un desvío medio de 1,1 (Esta operación deberá repetirse con cada uno de los ítems)
Hecho esto, se tratará de retener dos ítems cuya puntuación promedio quede incluida en
cada uno de los intervalos de la escala, seleccionando, en cada caso, aquellos cuya
dispersión sea menor: Por ejemplo, el ítem 1 –cuya puntuación media es 9,7– queda en
el intervalo cuyos límites son 9,1 y 10.
Se adopta un criterio general: por ejemplo, consistente en desechar todo ítem cuya
desviación media supere 1,5. Ahora bien, es posible que todos los ítems muestren una
dispersión excesiva. Ello podría pasar, con mayor razón, en los tramos medios de la
escala, donde la ambigüedad es por fuerza mayor. Si así fuera, habría que redactar
nuevos ítems y ponerlos a prueba, hasta lograr un resultado adecuado.
Supongamos, sin embargo, que por uno u otro medio logramos reunir quince ítems
satisfactoriamente homogéneos, cinco de cada clase (conservadores, neutrales,
progresistas) Estos ítems serán finalmente sometidos al acuerdo/desacuerdo de los
encuestados cuya actitud se desea medir
Para obtener la puntuación de cada encuestado en la escala, se suman y promedian los
puntajes de los ítems con los cuales la persona manifiesta acuerdo
Si el primer encuestado acuerda con los items 1 y 2 y se manifiesta en desacuerdo con el

tercero, entonces promediaríamos las puntuaciones de los dos primeros:
Promedio del encuestado = (9,7 + 6,5) / 2 = 8,1
Así, el encuestado asumirá una puntuación de 8,1 puntos en una escala que va de 0 a 11
Se supone que los items miden un continuo psicológico subyacente, que va desde el
progresismo al conservadurismo político
FALTAN 3 TEMAS
1- EL ANALISIS DE LA RELACION ENTRE VARIABLES
2- EL CUESTIONARIO
3- EL INFORME DE INVESTIGACIÓN

Resumen Cuantitativas Parte 1

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Resumen Cuantitativas Parte 1

Cargado por

Copyright:

Formatos disponibles

TECNICAS CUANTITATIVAS DE LA INVESTIGACIÓN

LA MEDICIÓN: EL DATO EN LAS CIENCIAS SOCIALES

Muchas Estudios extensos

Pocas Estudios profundos (paradigma:

Las variables: capacidad o nivel de medición

UNIDADES DE DISTINTO NIVEL DE AGREGACIÓN Y ATRIBUCIÓN DE

Que dependen de los...Miembros Absolutas Analíticas

Colectivos Contextuales Globales

Que dependen de Miembros Relacionales Estructurales

Propiedades de los colectivos

¿Qué son los datos secundarios?

Ejemplo: para un historiador que investigue la historia del sindicalismo, fuentes

Censo es un relevamiento total y –casi– simultáneo de la población de un país, sus

La EPH (Encuesta Permanente de Hogares) del INDEC

Los datos de fuentes internacionales: una cantera de información

Una población es un conjunto de elementos definidos por ciertas especificaciones: por

Marco muestral: todos los elementos que componen la población.

Principales factores que se tienen en cuenta al determinar el tamaño de las muestras:

Tamaño muestral = (Confianza * heterogeneidad) / Error de estimación

La muestra al azar simple

Las muestras estratificadas

Muestreo intencional: En este tipo de muestreo no buscamos en modo alguno que la

EL ANÁLISIS EXPLICATIVO Y LOS VÍNCULOS CAUSALES EN LAS CIENCIAS

La explicación nomológico deductiva (Carl Hempel, epistemólogo alemán del Círculo de

Las reglas de Mill:

El modelo de control de variables desarrollado por Paul Lazarsfeld como aproximación al

Partimos de una relación bivariada (x-y)

Relaciones marginales con T como variable antecedente (antes que X)

Relaciones marginales con T como variable interviniente (entre X e Y)

La tipología de Lazarsfeld: cuatro alternativas (Ver ejemplos de cada uno en libro)

Un ejemplo: Los argentinos y su relación con el mercado de trabajo

2- De qué trabajan: distribución de frecuencias de una variable nominal

Las razones: cocientes entre frecuencias de diferentes categorías de una variable

Hasta secundaria 49,2 60 89,2

Superior completa 10,2 100 10,2

El caso particular de las respuestas múltiples y su tabulación

Elecciones de los encuestados:

El porcentaje de encuestados nos dice qué proporción de los sujetos interrogados se

Las medidas de resumen para variables cuantitativas

APLICACIONES CONJUNTAS DE LAS MEDIDAS DE RESUMEN

Puntuaciones de los objetos

La escala de Lickert: mide la posición de un sujeto sobre un continuo con respecto a un

Una vez enunciado el listado de sentencias, se procede a realizar la prueba de

El total acuerdo con la afirmación “Los inmigrantes limítrofes ocupan puestos de

Si los ítems están adecuadamente redactados y libres de ambigüedad, debería esperarse

En el ejemplo, los jueces otorgaron puntuaciones diferentes (10, 11 y 8) y el promedio

Si el primer encuestado acuerda con los items 1 y 2 y se manifiesta en desacuerdo con el

También podría gustarte