Está en la página 1de 7

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO

FACULTAD DE ESTUDIOS SUPERIORES ACATLÁN

COORDINACIÓN DE ESTUDIOS DE POSGRADO


MAESTRÍA EN ECONOMÍA

Texto para el curso de apoyo al ingreso


(Estadística)

Dr. Víctor Manuel Ulloa Arellano


CURSO DE APOYO AL INGRESO (ESTADÍSTICA)

Medidas de tendencia central


Las medidas de tendencia central son valores que tienen propensión a acumularse en
la parte central de las observaciones muestrales organizadas en una tabla de
distribución de frecuencias. Estas medidas pueden considerarse valores de resumen
que describen en una sola cifra el comportamiento de los datos de la muestra. Entre las
más representativas se encuentran:

• La media
• La mediana
• La moda

En sus respectivas fórmulas, los datos se toman directamente de la tabla de distribución


de frecuencias.

Media para datos agrupados


La media para datos agrupados se denota con el símbolo 𝑥̅ , y se calcula con la siguiente
fórmula:
k

fx i i
x= i =1

Ecuación 4

Donde fi es la frecuencia del intervalo de clase i; xi es la marca de clase del intervalo i;


k es el número de intervalos de clase y n corresponde al número de elementos de la
muestra. Los datos para la fórmula anterior se toman directamente de la tabla de
distribución de frecuencias. Para nuestro ejemplo de la Tabla 5.

9(5.5) + 16(6.5) + 30(7.5) + 14(8.5) + 11(9.5)


𝑥̅ =
80

x = 7.53 , resultado redondeado a dos decimales. Esto significa que el valor promedio
de la muestra de 80 observaciones es de 7.53.

Víctor Manuel Ulloa Arellano Página 18 de 80


CURSO DE APOYO AL INGRESO (ESTADÍSTICA)

Características principales de la media.

• Es el estadístico o estadígrafo de mayor uso para determinar el valor que


corresponde al centro de los datos. Su objetivo es resumir en un solo número, el
valor que representa al conjunto de observaciones muestrales.
• Es sensible a la presencia de valores extremos (i.e. valores muy bajos o muy
altos) los cuales pueden ocasionar un resultado que no da una descripción real
del comportamiento general de los datos.
• El valor de la media de una muestra para datos agrupados varía en función del
número de intervalos en los que se ha agrupado la muestra.
• Una de las aplicaciones de la media, es la comparación de dos o más muestras.
Debe advertirse sin embargo, que dos muestras independientes entre sí y que
tienen la misma muestra, no necesariamente son similares, pudiendo de hecho
ser muy diferentes entre sí. Esto se debe a que a mayor heterogeneidad de los
datos, la media tienen un menor valor informativo.

Mediana para datos agrupados


La mediana, denotada por 𝑥𝑚𝑒𝑑 , es aquel valor para el cual exactamente la mitad de las
observaciones muestrales se encuentran por debajo de él y la otra mitad se encuentran
por arriba de él. Se emplea la siguiente expresión para el cálculo de la mediana:

n 
 2 − (  f )1 
xmed = L1 +  h
 f mediana 
 
Ecuación 5

Donde 𝐿1 es el límite inferior de la clase en donde se encuentra mediana (que se obtiene


dividiendo el número n de observaciones o datos de la muestra entre dos. Después, se
van sumando, comenzando desde la primera de ellas, la frecuencia de cada intervalo.
Cuando dicha suma es igual o mayor al número total de datos entre dos, se considera
que el último intervalo que integra la suma, es el que contiene a la mediana); n es el
número de elementos de la muestra; (∑ 𝑓)1 corresponde a la suma de las frecuencias
que se encuentran antes de la clase que contiene a la mediana; 𝑓𝑚𝑒𝑑𝑖𝑎𝑛𝑎 es la frecuencia
de la clase en donde se encuentra la mediana (que se halla mediante el mecanismo
explicado para determinar 𝐿1 ) y h es la amplitud de del intervalo de clase. En nuestro
ejemplo de la Tabla 5, se tiene que:

Víctor Manuel Ulloa Arellano Página 19 de 80


CURSO DE APOYO AL INGRESO (ESTADÍSTICA)

𝑛 80
= = 40, 𝐿1 = 7.0, 𝑓𝑚𝑒𝑑𝑖𝑎𝑛𝑎 = 30, (∑ 𝑓)1 = 9 + 16 = 25, ℎ = 1
2 2

Entonces

40
−25
𝑥𝑚𝑒𝑑 = 7 + ( 2 30 ) (1)

𝑥𝑚𝑒𝑑 = 7.5.

Características principales de la mediana.

• La mediana. El objetivo de este estadístico es determinar el valor que divide


exactamente a la mitad al número de observaciones muestrales.
• No es sensible a la presencia de valores extremos. La existencia de ellos no altera
el valor de la mediana.
• No se ve afectada por la heterogeneidad de los datos. Puede ser más
representativa que la media cuando la muestra tiene mucha heterogeneidad o
cuando está sesgada.
• El valor de la mediana de una muestra para datos agrupados varía en función del
número de intervalos en los que se ha agrupado la muestra.

Moda para datos agrupados


La moda para datos agrupados, denotada por 𝑥𝑚𝑜𝑑 , se obtiene mediante la siguiente
fórmula:

 1 
xmod = L1 +  h
 1 +  2 
Ecuación 6

Donde L1 es el límite inferior de la clase en donde se encuentra la moda (en la tabla de


distribución de frecuencias es la clase con mayor frecuencia); 1 es la frecuencia de la
clase modal (o sea la clase de la mayor frecuencia) menos la frecuencia de la clase
contigua anterior;  2 es la frecuencia de la clase modal (o sea la clase de la mayor
frecuencia) menos la frecuencia de la clase contigua posterior y h es la amplitud de del
intervalo de clase. En nuestro ejemplo de la Tabla 5, se tiene que:

𝐿1 = 7.0, Δ1 = 30 − 16 = 14, Δ2 = 30 − 14 = 16, ℎ = 1

Víctor Manuel Ulloa Arellano Página 20 de 80


CURSO DE APOYO AL INGRESO (ESTADÍSTICA)

Entonces

14
𝑥𝑚𝑜𝑑 = 7 + (14+16) (1)

xmod = 7.47 .

En la gráfica de una distribución de frecuencias, la moda se localiza en la cresta de la


misma. En este caso se dice que es una distribución unimodal.
Frecuencias

Intervalos de clase

Figura 5

Si la gráfica de una distribución tiene dos crestas, se dice que es bimodal. Si tiene más
de dos crestas, entonces la distribución es multimodal.

Características principales de la moda.

• Es un estadístico cuyo objetivo es determinar cuál es el valor que se presenta


con mayor frecuencia dentro de un conjunto de observaciones muestrales.
Puede darse el caso de no existir. Y si existe, puede ser única o múltiple. Se utiliza
para describir la tendencia del valor general de un conjunto de datos, junto con
la media y la mediana.
• No es sensible a la presencia de valores extremos.
• Dado que su fórmula de cálculo depende únicamente de las frecuencias, también
puede utilizarse para el estudio de variables cualitativas.

Distribuciones de frecuencias sesgadas e insesgadas

Al llevar a cabo la representación gráfica de una distribución de frecuencias, pueden


presentarse los siguientes casos:

Víctor Manuel Ulloa Arellano Página 21 de 80


CURSO DE APOYO AL INGRESO (ESTADÍSTICA)

Distribución insesgada.
También conocida como simétrica. Cuando existe una elevada simetría con respecto
de un eje vertical.

Distribución simétrica
Frecuencias

Intervalos de clase

Figura 6

Distribución con sesgo positivo.


También conocida como distribución con asimetría positiva. Cuando los valores de la
rama o cola de la derecha tienden a caer de forma notable hacia el eje horizontal. En
este caso se dice que la cola derecha es más pesada que la cola izquierda.

Distribución con sesgo positivo


Frecuencias

Intervalos de clase

Figura 7

Víctor Manuel Ulloa Arellano Página 22 de 80


CURSO DE APOYO AL INGRESO (ESTADÍSTICA)

Distribución con sesgo negativo.


También conocida como distribución con asimetría negativa. Cuando los valores de la
rama o cola de la izquierda tienden a caer de forma notable hacia el eje horizontal. En
este caso se dice que la cola izquierda es más pesada que la cola derecha.

Distribución con sesgo negativo


Frecuencias

Intervalos de clase

Figura 8

En función de la simetría o asimetría de la distribución de frecuencias, es posible


establecer una relación de orden entre las medidas de tendencia central

• En una distribución simétrica, 𝑥̅ = 𝑥𝑚𝑒𝑑 = 𝑥𝑚𝑜𝑑


• En una distribución con sesgo positivo, 𝑥𝑚𝑜𝑑 < 𝑥𝑚𝑒𝑑 < 𝑥̅
• En una distribución con sesgo negativo, 𝑥̅ < 𝑥𝑚𝑒𝑑 < 𝑥𝑚𝑜𝑑

Ilustración 7. Ejemplo de simetría y asimetría

Víctor Manuel Ulloa Arellano Página 23 de 80

También podría gustarte