Capitulo 5
Metodologia cuantitativa: herramientas basicas
Introduccion
En este capitulo, nos adentramos con las estadisticas, si. Sabemos
que en algunas carreras los estudiantes le escapan a la matematica.
Pero no se asusten, al contrario, es la oportunidad para aprender
conceptos basicos que tienen una enorme utilidad. Van a encontrar
poquisimas formulas y muy sencillas. Después de acostumbrarnos
aun par de simbolos que al principio pueden parecer extrafios, esto
se vuelve reiterativo, sin complicaciones.
Como saben, las estadisticas estan por todas partes. Nosotros las
usaremos en dos sentidos basicos: 1) para analizar nuestros datos,
tal como lo haremos en el Capitulo 9; y 2) para analizar datos pre-
sentados en otras investigaciones, lo cual debemos hacer cada vez
que tomamos datos de otras fuentes. No se trata de ir demasiado
lejos en este tema, pues no es este un libro de estadistica, sino de
ir seguros. Por tal motivo, luego de la primera parte (“Estadistica:
datos e informacién” y “Estadistica descriptiva”) donde se intro-
ducen una serie de conceptos, se encontraran con dos apartados
para prevenirlos en la lectura de este tipo de datos: “Cémo mentir
con estadisticas” y “Falacias de probabilidad”. Todo con ejemplos
para mayor claridad.
Estadistica: datos e informacion
La estadistica es la disciplina cientifica que desarrolla y aplica
métodos para la recopilacién y el procesamiento de datos, que
permiten convertirlos en informacion. A su vez, dicha informa-
cion sera utilizada para la descripcién de fendmenos, el analisis
y prediccion del comportamiento de variables y modelos y, por
ultimo, pero no menos importante, para la toma de decisiones bajo
incertidumbre. La importancia y utilidad de la ciencia estadistica enestos aspectos es enorme, ya que involucra desde la investigacion
cientifica y las decisiones de mercado, hasta la implementacién de
politicas publicas.
Como veremos en detalle en el Capitulo 7, los datos seran re-
copilados de distintas fuentes y seguin su naturaleza pueden ser:
1. Poblacionales: cuando se recopilan para todas las unidades de
interés (p. ej., censos),
2. Muestrales: cuando se recopila informacién de cierto subcon-
junto de las unidades de interés (p. ej., encuestas).
3. Experimentales: cuando se obtiene informacién de un disefo
experimental (p. ej., tratamientos diferenciales).
El objetivo general de la estadistica es, entonces, transformar
datos, recopilados de una o varias fuentes, en informacion “Util”, lo
cual implica, en general, una serie de etapas o niveles de analisis. En
el nivel mas basico, nos interesa entender los datos, pudiendo dar
una descripcién de los mismos, es decir, encontrar su estructura,
estudiar su centralidad, y su variabilidad.
Las herramientas utilizadas para este nivel de estudio se cono-
cen, en consecuencia, como estadistica descriptiva. Todos estamos
familiarizados con este nivel elemental de andlisis pues es con el
que nos encontramos en las revistas deportivas y las infografias
periodisticas.
Por otro lado, si queremos realmente entender los datos, la mera
descripcidn sera insuficiente. El estudio de correlaciones de eventos,
es decir, el analisis de probabilidades conjuntas y condicionales de
ocurrencia nos dara una idea de cémo se asocian las ocurrencias
de diversos eventos. También, encontramos estas herramientas con
frecuencia en la vida cotidiana: las encuestadoras, por ejemplo, le
presentan a los candidatos politicos diversas opciones (sobre apo-
yo a ciertas causas, personas, opiniones, etc.) que asocian con una
mayor probabilidad de obtener el voto de un sector de la poblacién.
Una aplicacién mas avanzada de la ciencia estadistica sera la
inferencia, donde trabajamos a partir de datos de la muestra 0 ex-
perimento para inferir caracteristicas de la poblacién o el modelo
subyacente. Por ultimo, la estadistica apunta a la prediccién, esto
es, intenta anticipar los posibles comportamientos de las variables
v su probabilidad de ocurrencia futura. valores esperados, etcétera.Estas aplicaciones son més especializadas, tipicas de la
investigacion cientifica, aunque también utilizada para la toma
de decisiones en casos como el andlisis técnico de los mercados
financieros y la implementacidn de politicas y programas publicos.
Estadistica descriptiva
Variables, histogramas y proporciones
Qué tienen en comin una encuesta de opinién, un experimento
de laboratorio y la lectura de un medidor de radiacién solar? En
todos los casos, hay ciertas propiedades o caracteristicas de los sis-
temas 0 sujetos observados que nos interesa medir. En la encuesta,
por ejemplo, nos interesa saber en qué porcentaje la gente tiene una
opinién positiva sobre cierto personaje publico; en el experimento,
veremos qué porcentaje de los sujetos son curados por un medica-
mento, y al observar la radiacién solar estudiaremos su variacion
a lo largo del tiempo.
Por supuesto, cada experimento o encuesta puede relevar una
o mas variables y el investigador, a su vez, utilizar los datos obte-
nidos de diversas maneras y con distintos propésitos, ya sea para
el modelado de un fendmeng, el contraste de una hipotesis o la
prediccion de un resultado electoral. En este sentido, el diseiio de
la encuesta o experimento, el llamado proceso de medicién, no sera
un proceso aislado, sino que sera parte del plan de investigacién
que se esté implementando.
En esta seccién y las siguientes, intentaremos resumir aquellos
métodos y técnicas que, siendo de aplicacién amplia en diversos
campos de estudio, resultardn de utilidad general para el investiga-
dor. La idea es que, mediante la incorporacién de un herramental
universal, el investigador se encuentre en condiciones de encarar el
disefio e implementacién de un plan de investigacién, para luego
incorporar las herramientas especificas a su campo de estudio que
fueran necesarias.
Recordemos que aquellas caracteristicas o propiedades de interés
que relevamos las llamamos variables. Y que estas podian ser cuan-
titativas 0 cualitativas. La mayoria de las técnicas de la estadistica,desde las basicas (p. ej, promedios) hasta las mas avanzadas (p. ej,
regresiones) requieren la utilizacion de variables numéricas. Pero
también existen herramientas estadisticas basicas, validas aun para
mediciones cualitativas.
Supongamos que nos ubicamos cerca de la entrada de un esta-
cionamiento y anotamos en una planilla el color de cada automévil
que va ingresando. Finalizamos nuestra medici6n al ingresar 100
vehiculos y disponemos entonces de una planilla con anotaciones
puramente cualitativas, del tipo blanco, rojo, azul, marron, etcétera.
Sin embargo, podemos realizar un andlisis estadistico de los resul-
tados al observar las frecuencias de ocurrencia de cada color. Al
procesar los datos, los tabulamos y obtenemos la siguiente tabla:
Color #0bservaciones (n) Frecuencia relativa (f)
Blanco 33 0,33
Rojo “4 0,14
‘Azul 2 0,12
Marron 8 0,08
Negro 26 0,26
Verde 1 0.07
Total (N) 100 1
Frecuencias observadas
En la columna “Frecuencia relativa”, computamos el cociente
fe a es decir, el ntimero de autos observados de cada color, dividido
por el total de observaciones, en nuestro ejemplo 100. Como en este
ejemplo las observaciones son justo 100, la columna f puede parecer
redundante, pero en general con un numero cualquiera de observacio-
nes totales, resulta practica para determinar el peso de cada categoria.
Una representacion grafica bastante practica sera el grafico de
frecuencias, que en el caso de las variables numéricas llamaremos
histograma. Para los datos resumidos en la tabla anterior, podemos
hacer tanto un grafico de frecuencias absolutas (1) como uno de
frecuencias relativas (f), como se observan en los siguientes graficos
(Figuras 5.1 v 5.2):Blanco. Rojo Azul Marrén Negro Verde
Figura 5.1 Frecuencias absolutas (1)
0,35 +
03 +
0,25 +
02 +
os +
oa 4
0.05 +
Blanco Rojo azul Marron Negro. — Verde
Figura 5.2 Frecuencias relatives (f)
Estos graficos son muy similares, pero el de las frecuencias re-
lativas es mas interesante, pues nos muestra las proporciones de
ocurrencia de cada valor de la variable, en este caso, el color. Estas
proporciones de ocurrencia son titiles, por ejemplo, en el modelado,
pues podemos usarlas como una aproximacion empirica de la pro-
babilidad de ocurrencia del proximo valor de la variable. En base a
nuestra experiencia, por ejiemplo, asumiriamos que la probabilidad
de aue el préximo automdvil aue inerese al estacionamiento sea
blanco es de 0,33, mientras que sera ‘negro con una probabilidad
de 0,26, etcétera.Por otro lado, el grafico de frecuencias 0 proporciones relativas
esta muy relacionado con otro que es de aplicacion muy usual, el
conocido grafico circular o de torta. En este grafico, podemos usar
tanto las frecuencias relativas como las absolutas, ya que la propor-
cién de cada valor estara muy claraa partir de la porcién del grafico
que ocupa, como se ve en este grafico (Figura 5.3):
Blanco
Rojo
Total —e
Azul
Marrén
Negro
Verde
Figura 5.3 Grafico circular
De hecho, para las variables cualitativas como en este caso, el
grafico circular es mas claro. El grafico de frecuencias (Figura 5.2)
introduce un ordenamiento de izquierda a derecha que es totalmente
artificial, pues depende de como hayamos ordenado los colores, para
lo cual no hay una regla universal. Esa “oscilacién’” que observamos
en la Figura 5.2, al bajar desde blanco y luego, subir en negro, es
espuria, pues si reordenamos las columnas queda un grafico como
el de la Figura 5.4, donde se observa un crecimiento sostenido, por
supuesto también espurio. En este sentido, para proporciones de una
variable que no tienen un orden natural 0 aceptado por convenci6n,
el grafico circular o de torta brinda una informacion mas clara.
Cuando tratamos con variables cualitativas que son ordinales,
por ejemplo, si la respuesta es una opinion buena, mala o neutral, el
grafico de frecuencias de las Figuras 5.1 0 5.2 tiene mayor utilidad,
pues nos dara una idea de hacia donde se inclina la mayor parte
de las respuestas.