Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
Mateo Machín
Métodos y técnicas cuantitativas
Prólogo
Antes de dar comienzo, he aquí algunas aclaraciones preliminares.
El presente escrito trata de ser un recopilado de contenidos bibliográficos
de manera breve y acortada, que, en otras palabras, es conocido como un
resumen. La única intención de este escrito es introducir y abordar un
determinado conjunto de temáticas de manera clara y concisa, sin
pretender bajo ninguna circunstancia ser un reemplazo de la bibliografía
que da sustento a este documento.
Debido a que solo es un recopilado de contenidos, el documento no cuenta
con un estilo de escritura académico ni referencias bibliográficas formales.
Tampoco es una copia exacta de lo que han escrito los autores que aquí
se encuentran, sino que se han realizado modificaciones, cambiando
palabras, acortando párrafos, agregando anotaciones, entre otras cosas.
En consecuencia, se advierte que cada quien se hace responsable de
cualquier uso que se le realice a este documento. Como autor del mismo,
aclaro desde el principio que no me haré cargo de ninguna situación que
comprometa este archivo y que pueda darse en cualquier lugar, tiempo y
circunstancias.
Habiendo aclarado estas cuestiones, y asumiendo que el lector ha
entendido y asumido las aclaraciones, se puede dar comienzo a los
contenidos aquí presentes.
2
Mateo Machín
Métodos y técnicas cuantitativas
3
Mateo Machín
Métodos y técnicas cuantitativas
Variables
Concepto y generalidades
Una variable es la representación numérica de una característica
sometida a medición. Dicho de otro modo, las variables son características
que pueden ser medidas y que en cada medición pueden cambiar (variar).
En los análisis cuantitativos de datos, los datos corresponden
esencialmente con números. Esto significa que para llevar adelante los
análisis es práctico asignar números a las características de las personas,
objetos, lugares, etc., que se quiere estudiar. Lo que representen los
números asignados a los distintos valores de una variable dependerá de
la variable que estemos midiendo.
Tipos de variables
• Variables categóricas
Una variable categórica es una variable que puede tomar un conjunto de
valores posibles, asignando cada observación a un grupo o categoría
nominal de acuerdo con una propiedad de interés. Ejemplos de variables
categóricas son: color, sexo, grupo sanguíneo, estado civil, etc.
• Variables cuantitativas o numéricas
Una variable cuantitativa es una variable que puede tomar valores
numéricos. Las variables cuantitativas se clasifican en discretas o
continuas. En las variables discretas existe una distancia mínima entre
los valores posibles, es decir, no puede darse un valor intermedio (ejemplo:
número de hijos). En las variables continuas no existe distancia mínima
entre valores posibles, es decir, puede tomarse cualquier valor de la escala
de medición que estemos usando (ejemplo: temperatura).
Niveles o escalas de medida
En las variables categóricas los niveles de medida pueden ser nominales
u ordinales.
• La medida nominal consiste en clasificar en categorías a los
sujetos u objetos que se desea medir haciendo que todos los sujetos
u objetos clasificados dentro de la misma categoría sean
equivalentes a la característica que se está midiendo. Un ejemplo
de variable nominal son las especies.
• La medida ordinal consiste en asignar a los sujetos u objetos
medidos un número que permita ordenarlos según la cantidad que
poseen de la característica medida. En la escala ordinal, además de
estar presente la relación de igualdad-desigualdad propia de la
escala nominal, los números asignados permiten saber si la
4
Mateo Machín
Métodos y técnicas cuantitativas
5
Mateo Machín
Métodos y técnicas cuantitativas
6
Mateo Machín
Métodos y técnicas cuantitativas
7
Mateo Machín
Métodos y técnicas cuantitativas
8
Mateo Machín
Métodos y técnicas cuantitativas
de los 200 sujetos mostrados en las tablas 10.1 para formar una tabla de
frecuencia bivariada con ambas variables.
9
Mateo Machín
Métodos y técnicas cuantitativas
10
Mateo Machín
Métodos y técnicas cuantitativas
11
Mateo Machín
Métodos y técnicas cuantitativas
12
Mateo Machín
Métodos y técnicas cuantitativas
13
Mateo Machín
Métodos y técnicas cuantitativas
Dispersión
Los estadísticos de dispersión de una distribución de datos me informan
sobre qué tan concentradas o alejadas están las puntuaciones del centro
de dicha distribución.
En el caso de los datos categóricos lo que me informan estos estadísticos
es qué tan heterogéneas son las puntuaciones, es decir, qué tanto varían
la distribución de las categorías. Se calculan examinando los porcentajes
y concentración de los datos.
Una forma de cuantificar esa dispersión es a través del Índice de
Variación Cualitativa (IVC). Este índice expresa el grado en que los casos
están dispersos en las diferentes categorías de las variables. Tiene un
valor máximo de 1 y un valor mínimo de 0.
• Cuanto más cercano al 1, mayor igualdad de las frecuencias
relativas (distribución uniforme). Ejemplo: Igual proporción de
fumadores, de exfumadores y de no fumadores.
• Cuanto más cercano al 0, menor igualdad de frecuencias relativas
(distribución con dispersión nula). Ejemplo: Todos fumadores,
ningún exfumador y ningún no fumador.
14
Mateo Machín
Métodos y técnicas cuantitativas
15
Mateo Machín
Métodos y técnicas cuantitativas
16
Mateo Machín
Métodos y técnicas cuantitativas
4 casos
y medio
4 casos
y medio
Cuartiles
Los cuartiles (Q) son los tres valores de la variable que dividen al total de
las medidas (ordenadas) en cuatro partes iguales.
Q1: 21 años
17
Mateo Machín
Métodos y técnicas cuantitativas
Quintiles
Los quintiles son los cuatro valores de la variable que dividen al total de
las medidas (ordenadas) en cinco partes iguales.
Quintil 1: 21 años
18
Mateo Machín
Métodos y técnicas cuantitativas
19
Mateo Machín
Métodos y técnicas cuantitativas
20
Mateo Machín
Métodos y técnicas cuantitativas
21
Mateo Machín
Métodos y técnicas cuantitativas
Tendencia central
Una buena manera de identificar el centro de una variable consiste en
elegir el valor que mejor representa al resto de valores. Anteriormente
habíamos elegido como mejor representante de una variable categórica el
valor que más se repite, es decir, la moda. Pero en una variable
cuantitativa o numérica se dan muy pocas repeticiones y el valor que más
se repite no tiene por qué estar en el centro; consecuentemente, la moda
puede resultar engañosa.
El centro de una variable cuantitativa, entonces, hay que intentar
encontrarlo de otra manera. Y lo cierto es que existen diferentes formas de
hacerlo; todo depende de qué aspectos de la variable se consideren
relevantes.
22
Mateo Machín
Métodos y técnicas cuantitativas
Media
La media es, sin duda, el estadístico de tendencia central más utilizado.
Se define como la suma de todas las puntuaciones dividida por el número
de puntuaciones.
= 508 / 5 = 101.6
= 693 / 6 = 115.5
23
Mateo Machín
Métodos y técnicas cuantitativas
Dispersión
Describir un conjunto de datos a partir de un solo número conlleva,
obviamente, una importante pérdida de información: un estadístico de
tendencia central informa sobre el centro de la distribución, pero no dice
nada sobre el resto de los valores. La consecuencia de esta limitación es
que un mismo valor puede ser el centro de conjuntos de datos muy
diferentes.
Los estadísticos de dispersión nos permiten conocer el grado de
alejamiento que existe entre las diferentes observaciones. Esto es
particularmente útil cuando trabajamos con la media que es un estadístico
poco robusto, como vimos momentos atrás.
La dispersión es un concepto esencialmente positivo: pueden todos los
valores ser iguales y, consecuentemente, no existe dispersión (en cuyo
caso no estaríamos hablando de una variable sino de una constante), o
unos valores son distintos de otros y, consecuentemente, existe dispersión
(en cuyo caso se puede cuantificar si es baja, media o alta; pero nunca
podría ser negativa).
Rango o amplitud
El estadístico de dispersión más simple de todos consiste en calcular la
diferencia entre el valor más grande y el valor más pequeño. A esta
diferencia se la llama rango o amplitud.
24
Mateo Machín
Métodos y técnicas cuantitativas
Varianza
La varianza es el promedio de las desviaciones cuadráticas de la media,
es decir, el promedio de las desviaciones de la media elevadas al
cuadrado. Se trata, por tanto, de una media de cuadrados o media
cuadrática.
25
Mateo Machín
Métodos y técnicas cuantitativas
Desviación típica
La varianza no permite formarse una idea acertada del grado de dispersión
de una variable. Por esta razón, lo que suele hacerse es utilizarla raíz
cuadrada de la varianza. A este valor se le llama desviación típica.
26
Mateo Machín
Métodos y técnicas cuantitativas
Histogramas
Entre los gráficos disponibles para describir la forma de la distribución de
una variable cuantitativa, los más utilizados son: el histograma, el polígono
de frecuencias, el diagrama de tallo y hojas, y el diagrama de caja.
El histograma consiste en una representación gráfica de la distribución de
frecuencias de una variable cuantitativa continua en un gráfico con forma
de barras. El histograma es parecido entonces al gráfico de barras, pero
con las barras juntas, dando así una impresión de continuidad. Se
constituye sobre el plano definido por dos ejes cartesianos: en el eje
horizontal se colocan los valores de la variable ordenados de menor a
mayor (comenzando por la izquierda), en el eje vertical se colocan las
frecuencias (número de veces que se repite cada valor) y sobre cada valor
se levanta una barra de altura proporcional a su frecuencia.
27
Mateo Machín
Métodos y técnicas cuantitativas
28
Mateo Machín
Métodos y técnicas cuantitativas
29
Mateo Machín
Métodos y técnicas cuantitativas
30
Mateo Machín
Métodos y técnicas cuantitativas
31
Mateo Machín
Métodos y técnicas cuantitativas
32
Mateo Machín
Métodos y técnicas cuantitativas
Distribución normal
Gráfica de puntuaciones directas
33
Mateo Machín
Métodos y técnicas cuantitativas
34
Mateo Machín
Métodos y técnicas cuantitativas
35
Mateo Machín
Métodos y técnicas cuantitativas
36
Mateo Machín
Métodos y técnicas cuantitativas
37
Mateo Machín
Métodos y técnicas cuantitativas
Muestreo
El muestreo se refiere al proceso seguido para extraer una muestra de
una población. El muestreo puede ser de dos tipos: probabilístico y no-
probabilístico. En el probabilístico se conoce la probabilidad de que salga
cada muestra y cada elemento, en el no-probabilístico se desconocen
dichas probabilidades.
Un subtipo de muestreo probabilístico es el muestreo aleatorio. En el
muestreo aleatorio todos los elementos poblacionales tienen la misma
probabilidad de ser elegidos, y el resultado de cada extracción no afecta
ni depende del resultado de cualquier otra, es decir son independientes
entre sí.
Es importante destacar que, dado que las poblaciones con las que
trabajamos son desconocidas, no hay manera de saber si la muestra
elegida es representativa o no de la población muestreada. Lo que
podemos saber es si se ha utilizado un método de selección que garantiza
que la muestra elegida sea representativa de la población.
38
Mateo Machín
Métodos y técnicas cuantitativas
Distribución muestral
La distribución muestral es un constructo teórico que nos permite
conocer de qué forma y qué tanto varían las medias muestrales. Uno de
los estadísticos más útiles y utilizados en el contexto de la inferencia
estadística es la media aritmética. En tanto es un estadístico, su valor
concreto depende de la muestra concreta en la que se calcula. Si en cada
una de esas muestras calculamos la media aritmética, podremos
comprobar que no siempre toma el mismo valor, sino que varía de una
muestra a otra. La discrepancia entre los valores que toma el estadístico
en las muestras y el valor real del parámetro que nos interesa saber se
denomina error. Pueden llegar a variar bastante (por ejemplo, oscilar entre
18 y 26 puntos de una escala cuando en realidad la media poblacional es
de 22). Esta variabilidad se captura en un parámetro llamado error
estándar.
Entonces, ¿cómo se reduce el error?
Las muestras erran tanto por arriba como por debajo, así el promedio de
muchísimas muestras es justamente la media poblacional y el desvío de
esta distribución es justamente cuánto suelen errarle en promedio cada
una de esas muestras. Por eso el desvío estándar de la distribución
muestral se conoce como error estándar.
Error estándar
Un error estándar grande significa que las medias muestrales erran por
mucho a la media poblacional. Como casi siempre tengo una única
muestra, mi media muestral puede estar cerca o lejos del valor que quiero
estimar. Para que esto no ocurra se busca reducir el error estándar.
39
Mateo Machín
Métodos y técnicas cuantitativas
40
Mateo Machín
Métodos y técnicas cuantitativas
41
Mateo Machín
Métodos y técnicas cuantitativas
42
Mateo Machín
Métodos y técnicas cuantitativas
IC = 80 ± 2
Estimamos, con una confianza del 95%, que el verdadero valor del
parámetro estimado se encuentra entre los límites del intervalo construido.
Esto significa que de cada 100 intervalos que se construyan en las mismas
condiciones, 95 de ellos incluirán el verdadero valor del parámetro,
mientras que 5 de ellos no lo harán.
43
Mateo Machín
Métodos y técnicas cuantitativas
Ejemplo: Ejemplo:
H0: π ≤ 0,5 H1: π > 0,5
44
Mateo Machín
Métodos y técnicas cuantitativas
P Valor
El P Valor es la probabilidad de haber obtenido mis datos, si la hipótesis
nula fuera verdadera.
Si la probabilidad de haber obtenido mis datos en una distribución es
suficientemente pequeña, entonces es improbable que la hipótesis nula
sea verdadera y decido rechazarla; y si mi probabilidad es más grande,
mantengo la hipótesis.
Ahora bien, ¿cuán pequeña? El criterio de este valor se llama alfa. Su
valor es arbitrario, pero en psicología y en ciencias sociales suele usarse
un valor de 5% (0,05) o 1% (0,01).
Veamos un ejemplo:
Pickle Rick, ¿puede adivinar lo que estás pensando?
• Hipótesis: H0: π ≤ 0,5; H1: π > 0,5
• Estadístico: Cantidad de aciertos o proporción.
• Valor estadístico: 32 aciertos (o proporción: 0,64).
• Distribución muestral: Binomial (50 ensayos; 0,5 probabilidad de
acierto).
• P valor: 0,003
• Alfa: 0,05
45