Está en la página 1de 5

Estadística Básica para Economía y

Materia
Administración

Docente Gabriela Nelba Guerrero

Medidas de tendencia central, de posición y de dispersión

Las medidas estadísticas se utilizan como resúmenes o como indicadores que


permiten caracterizar un grupo de datos.

1. Medidas de tendencia central

Son medidas que buscan caracterizar la zona donde se encuentra el centro de los
datos.

Moda: Es el valor de la variable que corresponde a la máxima frecuencia absoluta.


Ejemplo: si se consideran los datos de la Tabla 1 de la clase “Presentación de datos”,
la moda de la variable “cantidad de materias aprobadas” es 3. Se simboliza 𝑀𝑜 = 3.
La variable “Carrera que está estudiando actualmente” es bimodal porque hay dos
modas: “Recursos Humanos” (frecuencia absoluta=7) y “Comercio Internacional”
(también tiene una frecuencia absoluta de 7).

Mediana: Es el valor de la variable que supera y es superado por igual cantidad de


datos. Para calcular la mediana puede resultar útil ubicar los datos en forma
ordenada, de menor a mayor y dividirlos en dos mitades. Por ejemplo, con los datos
de la Tabla 1 de la clase “Presentación de datos”, se buscará la mediana de la variable
“cantidad de cuatrimestres cursados en la UNQ”:

1 1 1 2 2 2 2 3 3 3 3 3 4 4 4 4 5 5 7

El valor 3 que aparece redondeado ocupa la posición central. Ése es el valor de la


mediana. Se simboliza 𝑀𝑒 = 3.
En este ejemplo, como hay cantidad impar de datos, la mediana es un valor. Cuando
se dispone de cantidad par de datos, la mediana es la semi-suma de los dos valores
centrales.
La mediana también se puede calcular en el caso de variables categóricas ordenables.
Media aritmética o promedio: Es el cociente entre la suma de todos los datos
y la cantidad de datos.
Si la media corresponde a los datos de una población, se la simboliza con la letra
griega µ. Si son datos de una muestra, se simboliza 𝑋̅:

∑𝑁
𝑖=1 𝑥𝑖
𝜇= (𝑑𝑜𝑛𝑑𝑒 𝑁 𝑠𝑖𝑚𝑏𝑜𝑙𝑖𝑧𝑎 𝑙𝑎 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛)
𝑁

∑𝑛𝑖=1 𝑥𝑖
𝑋̅ = (𝑑𝑜𝑛𝑑𝑒 𝑛 𝑠𝑖𝑚𝑏𝑜𝑙𝑖𝑧𝑎 𝑙𝑎 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎)
𝑛

Como la Tabla 1 de la clase “Presentación de datos” corresponde a una parte del


curso, para calcular el promedio de las variables numéricas que allí aparecen, se
utilizará la segunda fórmula. Por ejemplo para variable “cantidad de materias
aprobadas” es:
4 + 5 + 10 + 3 + 7 + 3 + 4 + 3 + 3 + 3 + 3 + 14 + 4 + 4 + 11 + 5 + 4 + 6 + 8 104
𝑋̅ = = = 5,47
19 19

Las calculadoras científicas pueden calcular promedios. En


https://www.youtube.com/watch?v=qguhqq0xvM0 se muestra cómo hacer.

En https://www.youtube.com/watch?v=OHkcBcbKfuY se explican estos temas


mediante ejemplos.

2. Medidas de posición

Así denominan algunos/as autores/as a los cuartiles, a los centiles y a los fractiles en
general. En este curso utilizaremos cuartiles.

Cuartiles: son los valores que dividen a la lista ordenada de datos en cuatro partes.
Se simbolizan 𝑄1 ; 𝑄2 = 𝑀𝑒 𝑦 𝑄3
Por ejemplo, con los datos de la Tabla 1 de la clase “Presentación de datos”, se
buscarán los cuartiles de la variable “cantidad de cuatrimestres cursados en la UNQ”:

1 1 1 2 2 2 2 3 3 3 3 3 4 4 4 4 5 5 7

Estadística Básica Profesora Gabriela Nelba Guerrero


-2-
Las marcas dividen a la distribución en cuatro partes iguales. De este modo, se tiene
que el primer cuartil, 𝑄1 = 2 y que el tercer cuartil, 𝑄3 = 4. El segundo cuartil, es decir
la mediana, es 3.

Aclaración: El programa Excel también calcula estas medidas, pero utiliza fórmulas
diferentes a las que se utilizan en este curso. Se recomienda efectuar los cálculos
según la explicación precedente.

3. Medidas de dispersión

Rango: El rango de una colección de datos numéricos es la distancia entre el dato


mayor y el dato menor. Continuando con el ejemplo de la Tabla 1 de la clase
“Presentación de datos”, el rango de la variable “cantidad de cuatrimestres cursados
en la UNQ” es
𝑅𝑎𝑛𝑔𝑜 = 𝑥𝑀 − 𝑥𝑚 = 7 − 1 = 6

Rango intercuartílico: se llama así a la distancia entre los cuartiles 1 y 3. En este


ejemplo, es 𝑄3 − 𝑄1 = 4 − 2 = 2

Ambas medidas dan cuenta de qué tan dispersos están los datos. Con el objetivo de
obtener una medida que muestre qué tan alejados del promedio se encuentran cada
uno de los datos que se tienen, se definen la varianza y la desviación estándar de la
siguiente manera:

Varianza: si se trata de datos de una población, se calcula:


∑𝑁
𝑖=1(𝑋𝑖 − μ)
2
𝜎2 =
𝑁
La varianza de datos de una muestra se define así:
∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2
𝑠2 =
𝑛−1
En el ejemplo de la cantidad de cuatrimestres cursados, como se trata de una
muestra, se utiliza la segunda fórmula. Utilizando el programa Excel, se obtiene que
la varianza de esa variable es 2,43.

Desviación estándar: si son datos de una población, se calcula:

∑𝑁
𝑖=1(𝑋𝑖 − μ)
2
𝜎 = √𝜎 2 = √
𝑁

Estadística Básica Profesora Gabriela Nelba Guerrero


-3-
La desviación estándar de datos de una muestra se calcula:

∑𝑛 (𝑋𝑖 − 𝑋̅)2
𝑠 = √𝑠 2 = √ 𝑖=1
𝑛−1

(En estas fórmulas, N significa el número de datos de la población y n el número de


datos de la muestra).
En el ejemplo de la cantidad de cuatrimestres cursados, como se trata de una
muestra, se utiliza la segunda fórmula. Utilizando el programa Excel, se obtiene que
la desviación estádar de esa variable es 1,56.

Estas medidas las puede calcular automáticamente el programa Excel. Y con


calculadora científica

En https://www.youtube.com/watch?v=hEsQTQKVkso hay una explicación


detallada para hacer estos cálculos con Excel.

Coeficiente de variación: se utiliza para poder comparar dos distribuciones


diferentes. Se calcula según la siguiente fórmula:
𝑠
𝐶𝑉 = ̅ ×100
𝑋

El coeficiente de variación de la cantidad de cuatrimestres cursados es:

𝑠 1,56
𝐶𝑉 = ̅ ×100 = ×100 = 50,23
𝑋 3,10

4. Gráficos de caja o box-plot

Los gráficos de caja y bigotes o box-plot se construyen ubicando una escala de referencia y, a
partir de ella, se ubican el dato menor, los cuartiles, la mediana y el dato mayor. La “caja” se
construye uniendo los cuartiles. Los “bigotes” van desde los cuartiles hacia los datos menor y
mayor.

En el siguiente gráfico, construido con Excel, se aprecia el diagrama de Caja y bigotes de la


variable “cantidad de cuatrimestres cursados”:

Estadística Básica Profesora Gabriela Nelba Guerrero


-4-
Gráfico de caja y bigotes
Variable “cantidad de cuatrimestres cursados”

Fuente: Elaboración propia con base en datos de la muestra

Ejercicio propuesto:

Calcule todas las medidas estudiadas para la variable “edad” y para la variable “estatura” de la
Tabla 1 de la Clase “Presentación de datos”. Confeccione el correspondiente diagrama de caja.

Cierre de la clase

En esta clase se profundizó el trabajo con datos numéricos, calculándose las medidas
de tendencia central, de posición y de dispersión correspondientes.

En la próxima clase, se comenzará con el cálculo de probabilidades.

Estadística Básica Profesora Gabriela Nelba Guerrero


-5-

También podría gustarte