Está en la página 1de 65

ESTADÍSTICA Y PROBABILIDADES

MEDIDAS DE TENDENCIA CENTRAL, ORDEN,


DISPERSIÓN Y FORMA
II 2018
3. MEDIDAS DE TENDENCIA CENTRAL

TIPOS DE DATOS SEGÚN SU PRESENTACIÓN

DATOS TABULADOS POR


DATOS NO AGRUPADOS DATOS AGRUPADOS
INTERVALOS

En todos los casos el investigador debe identificar la característica de sus datos levantados para definir el
método de cálculo a aplicar, si es poblacional o muestral.

04/09/2018 ING., JOSÉ GUZMÁN 8


3. MEDIDAS DE TENDENCIA CENTRAL

04/09/2018 ING., JOSÉ GUZMÁN 9


3. MEDIDAS DE TENDENCIA CENTRAL

04/09/2018 ING., JOSÉ GUZMÁN 10


3. MEDIDAS DE TENDENCIA CENTRAL

3.1. La Media aritmética


Es el valor resultante que se obtiene de dividir la suma de un conjunto de datos sobre el número total de
datos. Sólo es aplicable para el tratamiento de datos cuantitativos.

CARACTERÍSTICAS DATOS NO AGRUPADOS DATOS AGRUPADOS DATOS TABULADOS POR INTERVALOS

fi Fi hi Hi

PRESENTACIÓN DE
DATOS

𝑁𝑁 𝑁𝑁
MEDIA ∑𝑁𝑁
𝑖𝑖=1 𝑥𝑥𝑖𝑖 ∑𝑁𝑁
𝑖𝑖=1 𝑥𝑥𝑖𝑖 ∗ 𝑓𝑓𝑖𝑖 ∑𝑁𝑁
𝑖𝑖=1 𝑀𝑀𝑀𝑀𝑖𝑖 ∗ 𝑓𝑓𝑖𝑖
POBLACIONAL (N) 𝜇𝜇 = 𝜇𝜇 = = � 𝑥𝑥𝑖𝑖 ∗ ℎ𝑖𝑖 𝜇𝜇 = = � 𝑀𝑀𝑀𝑀𝑖𝑖 ∗ ℎ𝑖𝑖
𝑁𝑁 𝑁𝑁 𝑁𝑁
𝑖𝑖=1 𝑖𝑖=1
𝑁𝑁 𝑛𝑛
MEDIA MUESTRAL ∑𝑛𝑛𝑖𝑖=1 𝑥𝑥𝑖𝑖 ∑𝑛𝑛𝑖𝑖=1 𝑥𝑥𝑖𝑖 ∗ 𝑓𝑓𝑖𝑖 ∑𝑛𝑛𝑖𝑖=1 𝑀𝑀𝑀𝑀𝑖𝑖 ∗ 𝑓𝑓𝑖𝑖
(n) 𝑥𝑥̅ = 𝑥𝑥̅ = = � 𝑥𝑥𝑖𝑖 ∗ ℎ𝑖𝑖 𝑥𝑥̅ = = � 𝑀𝑀𝑀𝑀𝑖𝑖 ∗ ℎ𝑖𝑖
𝑛𝑛 𝑛𝑛 𝑛𝑛
𝑖𝑖=1 𝑖𝑖=1

En todos los casos el investigador debe identificar la característica de sus datos levantados para definir el
método de cálculo a aplicar, si es poblacional o muestral.
04/09/2018 ING., JOSÉ GUZMÁN 11
3. MEDIDAS DE TENDENCIA CENTRAL

3.1.2 La Media Ponderada

Consiste en asignar a cada valor 𝑥𝑥𝑖𝑖 un peso 𝑤𝑤𝑖𝑖 que depende de la importancia relativa de dicho valor, bajo algún
criterio. Su expresión responde a:

∑𝑁𝑁
𝑖𝑖=1 𝑥𝑥𝑖𝑖 ∗ 𝑤𝑤𝑖𝑖 𝑥𝑥1 ∗ 𝑤𝑤1 + 𝑥𝑥2 ∗ 𝑤𝑤2 + ⋯ + 𝑥𝑥𝑛𝑛 ∗ 𝑤𝑤𝑛𝑛
𝑥𝑥̅ = =
∑𝑁𝑁
𝑖𝑖=1 𝑤𝑤𝑖𝑖 𝑤𝑤1 + 𝑤𝑤2 + ⋯ + 𝑤𝑤𝑛𝑛
EJEMPLO

Para ganar una vacante en un proceso de selección, un aspirante debe ser evaluado en distintas pruebas:
conocimientos, habilidades en ejecución y trabajo en equipo, cada una de ellas ponderada según su importancia o
contribución en la nota final. Así, los pesos de cada apartado serán del 30, 50 y 20 por ciento, respectivamente.
Sabiendo que las notas obtenidas por un aspirante en cada prueba son 7, 3 y 5 respectivamente, ¿cuál es la nota global
en la oposición?

04/09/2018 ING., JOSÉ GUZMÁN 17


3. MEDIDAS DE TENDENCIA CENTRAL

3.1.3 La Media Cuadrática

Se define ésta como la raíz cuadrada de la media aritmética de los cuadrados de los
valores, o media cuadrática de un conjunto de números X1, X2, . . . , XN suele denotarse :

∑𝑁𝑁 2
𝑖𝑖=1 𝑥𝑥𝑖𝑖 ∑𝑛𝑛𝑖𝑖=1 𝑥𝑥𝑖𝑖2
𝜇𝜇𝜇𝜇 = 𝑥𝑥𝑄𝑄
̅ =
𝑁𝑁 𝑛𝑛

Este tipo de promedio suele usarse en aplicaciones físicas.

EJEMPLO: La raíz cuadrada media del conjunto de la población 1, 3, 4, 5, y 7 es:

04/09/2018 ING., JOSÉ GUZMÁN 19


3. MEDIDAS DE TENDENCIA CENTRAL

3.1.5 La Media Geométrica.-

Es una medida de tendencia central que puede utilizarse para mostrar los cambios porcentuales en una serie de
números positivos. Como tal, tiene una amplia aplicación en los negocios y en la economía, debido a que con
frecuencia se está interesado en establecer el cambio porcentual en las ventas en el producto interno bruto o en
cualquier serie económica. Se define como la raíz índice n del producto de n términos.

La media geométrica de n valores positivos x1, x2,..., xn es el número 𝑥𝑥̅ 𝐺𝐺 que se define como la raíz enésima del
producto de estos n valores, esto es,

𝑥𝑥̅𝐺𝐺 = 𝑛𝑛
𝑥𝑥1 ∗ 𝑥𝑥2 ∗ ⋯ ∗ 𝑥𝑥𝑛𝑛
n: cantidad total de valores observados
Xi: valores observados
𝑥𝑥̅𝐺𝐺 : media geométrica

EJEMPLO 1: la media geométrica de los valores 3, 9, 27 es igual a:

EJEMPLO 2: En los años 2015, 2016 y 2017, el precio de cierto producto de primera necesidad ha subido un 𝟏𝟏0%,
un 𝟏𝟏8% y un 𝟑𝟑0%. ¿Cuánto ha subido en promedio?

EJEMPLO 3: Si una producción ha experimentado un crecimiento del 30% del primero al segundo año y un
incremento del 35% del segundo al tercer año y un decrecimiento del 15% del tercer al cuarto año. Calcular la tasa
promedio de crecimiento de los 3 últimos años.
04/09/2018 ING., JOSÉ GUZMÁN 23
3. MEDIDAS DE TENDENCIA CENTRAL

04/09/2018 ING., JOSÉ GUZMÁN 24


3. MEDIDAS DE TENDENCIA CENTRAL

3.1.6 Mediana (Xm ; Md ; 𝑥𝑥)(DATOS


� NO TABULADOS)
La mediana es un valor que, previa ordenación, deja la mitad de las observaciones a su izquierda y la
otra mitad a su derecha. Es decir, el 50% de los datos son menores o iguales que la mediana, y el otro
50% mayores o iguales a ésta.

Para su cálculo, y suponiendo que los valores están ordenados, se procede de la siguiente manera:

 Si hay un número impar de datos, la mediana es el elemento que se encuentra en el centro, es decir

𝑥𝑥 𝑛𝑛+1
2

 Si el número de datos fuera par habría dos elementos centrales, y la mediana se obtendría como la
media de ambos, es decir:

1
𝑀𝑀𝑀𝑀 = ∗ 𝑋𝑋𝑛𝑛 + 𝑋𝑋𝑛𝑛+2
2 2 2

Hallar la mediana de los siguientes datos:

1. {3,6,8,2,1} 2. {2,1,5,4,9,8}

04/09/2018 ING., JOSÉ GUZMÁN 26


3. MEDIDAS DE TENDENCIA CENTRAL

3.1.6 Mediana (X m ; Md ; 𝑥𝑥)(DATOS TABULADOS)

Si los valores de la variable se tabulan en una distribución de frecuencias por intervalos, la mediana se
determina aproximadamente por interpolación a partir de la distribución de frecuencias acumuladas, método
ya propuesto en aplicaciones de la ojiva. Tabla # n
Ingresos # de personas # de personas
𝑛𝑛 Limite Inf - Limite Sup fi Fi
− 𝐹𝐹𝑖𝑖−1
𝑀𝑀𝑀𝑀 = 𝐿𝐿𝑖𝑖 + 2 ∗ 𝐴𝐴 2600 3400 1 1
𝑓𝑓𝑖𝑖
3400 4200 2 3
4200 5000 4 7
L¡ es el limite inferior del intervalo de la mediana. 5000 5800 10 17
5800 6600 16 33
n es el número de datos observados.
6600 7400 8 41
Fi-1 , es la frecuencia acumulada absoluta del intervalo 7400 8200 3 44
inmediatamente anterior al intervalo de la mediana. 8200 9000 1 45
f¡ es la frecuencia absoluta del intervalo de la mediana. TOTAL 45
A es la amplitud del intervalo de la mediana.

Ejemplo 1 - Los ingresos mensuales en bolivianos (variable X) de 45 personas están representados en la


tabla de esta presentación. Calcular la mediana para la muestra de los 45 ingresos quincenales tabulados.

04/09/2018 ING., JOSÉ GUZMÁN 27


3. MEDIDAS DE TENDENCIA CENTRAL

3.1.6 Mediana (X m ; Md ; 𝑥𝑥)(DATOS TABULADOS)
A es la amplitud del
intervalo de la mediana.

L¡ es el limite real Tabla # n


# de Fi-1 , es la frecuencia
Clases o Ingresos # de
inferior de la clase de la personas
intervalos Li – Ls personas fi acumulada absoluta del
Fi
mediana. intervalo inmediatamente
1 2600 3400 1 1
2 3400 4200 2 3 anterior al intervalo de la
𝑛𝑛 3 4200 5000 4 7 mediana.
− 𝐹𝐹𝑖𝑖−1
𝑀𝑀𝑀𝑀 = 𝐿𝐿𝑖𝑖 + 2 ∗ 𝐴𝐴 4 5000 5800 10 17
𝑓𝑓𝑖𝑖
5 5800 6600 16 33
f¡ es la frecuencia absoluta
𝑖𝑖 = 1, 2, … . 𝑛𝑛 6 6600 7400 8 41
del intervalo de la mediana.
7 7400 8200 3 44
8 8200 9000 1 45 n es el número de
TOTAL 45 datos observados.

Ejemplo 1 - Los ingresos mensuales en bolivianos (variable X) de 45 personas están representados en la tabla anterior.
Calcular la mediana para la muestra de los 45 ingresos quincenales tabulados.
Procedimiento:

1.- Determinar la clase de la mediana.- Es aquella clase cuya frecuencia absoluta acumulada iguala o supera por

primera vez al número obtenido del cociente entre n/2=22.5 (Para el caso i = 5)

04/09/2018 ING., JOSÉ GUZMÁN 28


3. MEDIDAS DE TENDENCIA CENTRAL

3.1.6 Mediana (X m ; Md ; 𝑥𝑥)(DATOS TABULADOS)

Calcular la mediana para la muestra

04/09/2018 ING., JOSÉ GUZMÁN 30


3. MEDIDAS DE TENDENCIA CENTRAL

3.1.6 Mediana (X m ; Md ; 𝑥𝑥)(DATOS TABULADOS)

Calcular la mediana para la muestra

Ingresos # de # de
100 hi % 100 Hi %
Limite Inf - Limite Sup personas fi personas Fi
50 60 8 8 12,31% 12,31%
60 70 10 18 15,38% 27,69%
70 80 16 34 24,62% 52,31%
80 90 14 48 21,54% 73,85%
90 100 10 58 15,38% 89,23%
100 110 5 63 7,69% 96,92%
110 120 2 65 3,08% 100,00%
TOTAL 65 100,00%

04/09/2018 ING., JOSÉ GUZMÁN 31


3. MEDIDAS DE TENDENCIA CENTRAL

3.1.7 Moda.

La moda de una serie de datos es el valor Mo, que se define como el dato que más veces se repite.

La moda no siempre existe y si existe, no siempre es única. En matemática, la moda es el valor de la


variable en el que existe un máximo absoluto (o dos o más máximos relativos iguales).

La moda es una medida promedio que se usa cuando se quiere señalar el valor más común de una
serie de datos. Por ejemplo, los comerciantes se estoquean con productos que están de moda.

La moda es el promedio menos importante debido a su ambigüedad.

EJEMPLO:

Determinar la moda mediante observación de los datos siguientes:

a) 7, 9, 7, 8, 7, 4,7 , 13, 7

b) 5, 3, 4, 5, 7, 3, 5, 6, 3

c) 31, 11, 12, 19

04/09/2018 ING., JOSÉ GUZMÁN 32


3. MEDIDAS DE TENDENCIA CENTRAL

3.1.7.2 Moda de datos agrupados.- Para calcular la moda de n datos tabulados por intervalos, primero se
determina el intervalo que contiene a la moda, esto es, el intervalo que tiene la mayor frecuencia (intervalo
modal). Luego se utiliza la fórmula: Tabla # n
Ingresos # de personas # de personas
Limite Inf - Limite Sup fi Fi

𝑑𝑑1 2600 3400 1 1


𝑀𝑀𝑜𝑜 = 𝐿𝐿𝑖𝑖 + ∗ 𝐴𝐴 3400 4200 2 3
𝑑𝑑1 + 𝑑𝑑2
4200 5000 4 7
Donde: 5000 5800 10 17
5800 6600 16 33
i contador que indica el numero de la fila del intervalo.
6600 7400 8 41
Li es el límite inferior del intervalo modal. 7400 8200 3 44
8200 9000 1 45
d1 = fi — fi-1 , esto es, d1 es igual a la frecuencia del intervalo
TOTAL 45
modal menos la frecuencia del intervalo inmediatamente anterior.
d2 = fi — fi+1, esto es, d2 es igual a la frecuencia del intervalo modal menos la frecuencia del intervalo
inmediatamente posterior.
A es la amplitud del intervalo modal.

Ejemplo 1 - Calcular la moda de la tabla de frecuencias presentada:

Procedimiento: Determinar cual es la clase modal: Es aquella clase cuya frecuencia absoluta es mayor
04/09/2018 ING., JOSÉ GUZMÁN 34
3. MEDIDAS DE TENDENCIA CENTRAL

3.1.7.2 Moda de datos agrupados.-

Ejemplo 1 - Calcular la moda de la tabla de frecuencias presentada:

Procedimiento: Determinar cual es la clase que contiene a la moda:

04/09/2018 ING., JOSÉ GUZMÁN 35


3. MEDIDAS DE TENDENCIA NO CENTRAL

3.2. Fractales:
3.2.1 Cuartiles,
3.2.2 Deciles,
3.2.1 Percentiles.

04/09/2018 ING., JOSÉ GUZMÁN 38


3. MEDIDAS DE TENDENCIA NO CENTRAL

3.2. Fractales:

También llamada Cuantilas [Cj/k] son medidas descriptivas que dividen, distribuyen o subclasifican los datos a
uno y otro lado, en porcentajes dados, una vez ordenados o clasificados.
Cuantilas de datos clasificados.:

𝒋𝒋
∗ 𝒏𝒏 − 𝑭𝑭𝒊𝒊−𝟏𝟏
𝑪𝑪 𝒋𝒋 = 𝑳𝑳𝒊𝒊 + 𝑨𝑨𝒊𝒊 𝒌𝒌 ; 𝒋𝒋 = 𝟏𝟏, 𝟐𝟐, … , 𝒌𝒌 − 𝟏𝟏
𝒌𝒌 𝒇𝒇𝒊𝒊

Donde:
𝐶𝐶 𝑗𝑗 es la cuantila j-ésima cuando el eje de las frecuencias (acumuladas) se divide en k partes iguales
𝑘𝑘

𝐼𝐼𝑖𝑖 = 𝐿𝐿𝑖𝑖 , 𝐿𝐿𝑖𝑖+1 Es la clase cuantila


𝐿𝐿𝑖𝑖 Es el límite inferior de la clase cuantila
𝐴𝐴𝑖𝑖 es el ancho de clase de la clase cuantila
𝑓𝑓𝑖𝑖 Es la frecuencia absoluta de la clase cuantila
n es el numero total de datos
𝐹𝐹𝑖𝑖−1 Es la frecuencia absoluta acumulada hasta la clase anterior a la clase cuantila (clase precuantila)
Clase cuantila: Es aquella clase cuya frecuencia absoluta acumulada iguala o supera por primera vez al
número obtenido del cociente [(j/k)*n)]

04/09/2018 ING., JOSÉ GUZMÁN 39


3. MEDIDAS DE TENDENCIA NO CENTRAL

Definición:

3.2. Cuartiles - Los cuartiles son valores que dividen una muestra de datos en cuatro partes
iguales.

El primer cuartil Q1, es el menor valor que es mayor que una cuarta parte de los datos; es
decir, aquel valor de la variable que supera 25% de las observaciones y es superado por el
75% de las observaciones.

04/09/2018 ING., JOSÉ GUZMÁN 40


3. MEDIDAS DE TENDENCIA NO CENTRAL

Definición:

DECILES

Los deciles son ciertos números que dividen la sucesión de datos ordenados en diez partes
porcentualmente iguales. Son, son también un caso particular de los percentiles. Los deciles se denotan
D1, D2,..., D9, que se leen primer decil, segundo decil, etc.

Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el aprovechamiento
académico.

Percentil - Valor del elemento que divide una serie de datos en cien grupos de igual valor o en intervalos
iguales.

Los percentiles son, tal vez, las medidas más utilizadas para propósitos de ubicación o clasificación de las
personas cuando atienden características tales como peso, estatura, etc.

Los percentiles son ciertos números que dividen la sucesión de datos ordenados en cien partes
porcentualmente iguales.. Los percentiles (P1, P2,... P99), leídos primer percentil,..., percentil 99.

04/09/2018 ING., JOSÉ GUZMÁN 41


3. MEDIDAS DE TENDENCIA NO CENTRAL

3.2. Cuartiles - Definición: Los cuartiles son valores que dividen una muestra de
datos en cuatro partes iguales.

3.2.1 Cuartiles.- Para los cuartiles, tomaremos el total de los datos divididos en 4

partes iguales. El cuartil se representa como Qk ó 𝐶𝐶 𝑗𝑗


4

𝑗𝑗
∗ 𝑛𝑛 − 𝐹𝐹𝑖𝑖−1
𝑄𝑄𝑗𝑗 = 𝐶𝐶𝑗𝑗 = 𝐿𝐿𝑖𝑖 + 𝐴𝐴𝑖𝑖 4 ; 𝑗𝑗 = 1,2,3
4 𝑓𝑓𝑖𝑖

Q1 = Valor de la variable que agrupa el 25% de los datos (j=1 y k=4).

Q2 = Valor de la variable que agrupa el 50% de los datos (j=2 y k=4).

Q3 = Valor de la variable que agrupa el 75% de los datos (j=3 y k=4).

Q4 = Valor de la variable que agrupa el 100% de los datos (j=4 y k=4).

04/09/2018 ING., JOSÉ GUZMÁN 42


3. MEDIDAS DE TENDENCIA CENTRAL

3.2. Fractales:
𝑗𝑗
∗ 𝑛𝑛 − 𝐹𝐹𝑖𝑖−1
𝐶𝐶 𝑗𝑗 = 𝐿𝐿𝑖𝑖 + 𝐴𝐴𝑖𝑖 𝑘𝑘 ; 𝑗𝑗 = 1,2, … , 𝑘𝑘 − 1
𝑘𝑘 𝑓𝑓𝑖𝑖
𝑗𝑗
∗𝑛𝑛−𝐹𝐹𝑖𝑖−1
3.2.1 Cuartiles.- 𝑄𝑄𝑗𝑗 = 𝐶𝐶 𝑗𝑗 = 𝐿𝐿𝑖𝑖 + 𝐴𝐴𝑖𝑖 4
; 𝑗𝑗 = 1,2,3
4
𝑓𝑓𝑖𝑖
𝑗𝑗
∗𝑛𝑛−𝐹𝐹𝑖𝑖−1
3.2.2 Deciles, 𝐷𝐷𝑗𝑗 = 𝐶𝐶 𝑗𝑗 = 𝐿𝐿𝑖𝑖 + 𝐴𝐴𝑖𝑖 10
; 𝑗𝑗 = 1,2, … , 9
10
𝑓𝑓𝑖𝑖
𝑗𝑗
∗𝑛𝑛−𝐹𝐹𝑖𝑖−1
3.2.1 Percentiles.𝑃𝑃𝑗𝑗 = 𝐶𝐶 𝑗𝑗 = 𝐿𝐿𝑖𝑖 + 𝐴𝐴𝑖𝑖 100
; 𝑗𝑗 = 1,2,3,….,99
100
𝑓𝑓𝑖𝑖

04/09/2018 ING., JOSÉ GUZMÁN 43


3. MEDIDAS DE TENDENCIA NO CENTRAL

3.2. Fractales - Ejemplo: En la siguiente tabla se muestra la distribución de costos por hora de
65 empleados que realizan actividades de alta gerencia en una Industria Multinacional:

Donde:
𝐶𝐶 𝑗𝑗 es la cuantila j-ésima cuando el eje de las
𝑘𝑘
frecuencias (acumuladas) se divide en k partes
iguales
𝐼𝐼𝑖𝑖 = 𝐿𝐿𝑖𝑖 , 𝐿𝐿𝑖𝑖+1 Es la clase cuantila 𝑗𝑗
∗ 𝑛𝑛 − 𝐹𝐹𝑖𝑖−1
𝐶𝐶 𝑗𝑗 = 𝐿𝐿𝑖𝑖 + 𝐴𝐴𝑖𝑖 𝑘𝑘
𝐿𝐿𝑖𝑖 Es el límite inferior de la clase cuantila 𝑓𝑓𝑖𝑖
𝑘𝑘
𝑊𝑊𝑖𝑖 es el ancho de clase de la clase cuantila
𝑓𝑓𝑖𝑖 Es la frecuencia absoluta de la clase cuantila
n es el numero total de datos
𝐹𝐹𝑖𝑖−1 Es la frecuencia absoluta acumulada hasta la
clase anterior a la clase cuantila (clase precuantila)
Clase cuantila: Es aquella clase cuya frecuencia absoluta acumulada iguala o supera por primera vez al número
obtenido del cociente [( j/k)*n]

𝑄𝑄𝐽𝐽 ; 𝐷𝐷𝐽𝐽 ; 𝑃𝑃𝐽𝐽


04/09/2018 ING., JOSÉ GUZMÁN 44
3. MEDIDAS DE TENDENCIA NO CENTRAL

3.2. Fractales - Ejemplo:


Calcular: 𝑄𝑄1 ; 𝑄𝑄2 ; 𝑄𝑄3 ; 𝐷𝐷1; 𝐷𝐷9 ; 𝑃𝑃60 ; 𝑃𝑃99
Ingresos # de # de
100 hi % 100 Hi %
Limite Inf - Limite Sup personas fi personas Fi
50 60 8 8 12,31% 12,31%
Clase cuantila: Es aquella clase cuya frecuencia
60 70 10 18 15,38% 27,69%
absoluta acumulada iguala o supera por primera
vez al número obtenido del cociente [( j/k)*n] 70 80 16 34 24,62% 52,31%
80 90 14 48 21,54% 73,85%
90 100 10 58 15,38% 89,23%
100 110 5 63 7,69% 96,92%
110 120 2 65 3,08% 100,00%
TOTAL 65 100,00%

𝑗𝑗 𝑗𝑗
𝑘𝑘
∗ 𝑛𝑛 − 𝐹𝐹𝑖𝑖−1
𝐷𝐷𝑗𝑗 = 𝐶𝐶 𝑗𝑗 = 𝐿𝐿𝑖𝑖 + 𝐴𝐴𝑖𝑖 10 ∗ 𝑛𝑛 − 𝐹𝐹𝑖𝑖−1
𝐶𝐶 𝑗𝑗 = 𝐿𝐿𝑖𝑖 + 𝐴𝐴𝑖𝑖
𝑘𝑘 𝑓𝑓𝑖𝑖 10 𝑓𝑓𝑖𝑖
𝑗𝑗 𝑗𝑗
4 ∗ 𝑛𝑛 − 𝐹𝐹𝑖𝑖−1 𝑃𝑃𝑗𝑗 = 𝐶𝐶 = 𝐿𝐿𝑖𝑖 + 𝐴𝐴𝑖𝑖 100 ∗ 𝑛𝑛 − 𝐹𝐹𝑖𝑖−1
𝑄𝑄𝑗𝑗 = 𝐶𝐶𝑗𝑗 = 𝐿𝐿𝑖𝑖 + 𝐴𝐴𝑖𝑖 𝑗𝑗
4 𝑓𝑓𝑖𝑖 100 𝑓𝑓𝑖𝑖

04/09/2018 ING., JOSÉ GUZMÁN 45


3. MEDIDAS DE TENDENCIA CENTRAL

3.1.7.2 Moda de datos agrupados.

Calcular: 𝑄𝑄1 ; 𝑄𝑄2 ; 𝑄𝑄3 ; 𝐷𝐷1 ; 𝐷𝐷3 ; 𝐷𝐷7 ; 𝐷𝐷9 ; 𝑃𝑃5 ; 𝑃𝑃40 ; 𝑃𝑃70 ; 𝑃𝑃99

Tabla # n
Ingresos
# de personas fi # de personas Fi
Limite Inf - Limite Sup

2600 3400 1 1
3400 4200 2 3
4200 5000 4 7
5000 5800 10 17
5800 6600 16 33
6600 7400 8 41
7400 8200 3 44
8200 9000 1 45
TOTAL 45

04/09/2018 ING., JOSÉ GUZMÁN 46


3. MEDIDAS DE DISPERCIÓN O VARIABILIDAD

3.3.1. Desviación media


3.3.2. Varianza,
3.3.3. Desviación Típica o Estándar,
3.3.4. Coeficiente de variación

04/09/2018 ING., JOSÉ GUZMÁN 47


3. MEDIDAS DE DISPERCIÓN O VARIABILIDAD

Las medidas de dispersión o variabilidad son números que miden el grado de separación de los datos
con respecto a un valor central, que generalmente es la media aritmética. En el estudio de las medidas de
dispersión daremos un vistazo a cuatro indicadores básicos:

1. Desviación media
El cálculo de cada uno de ellos se toma basado en la
2. Varianza
media aritmética, indicador que muestra que tan
3. Desviación estándar disperso se encuentran un conjunto de datos a un
4. Coeficiente de variación punto de concentración.

Por ejemplo:

4 5 3
5 3 2
2 2 2
3 5 1
4 1 4
04/09/2018 ING., JOSÉ GUZMÁN 48
3. MEDIDAS DE DISPERCIÓN O VARIABILIDAD

3.3.1. Desviación Media.- Indicador que muestra que tan disperso se encuentran un conjunto de datos a un
punto de concentración. Por ejemplo:

4 5 3
5 3 2
2 2 2
3 5 1
4 1 4

Desviación media (Dm): Equivale a la


división de la sumatoria del valor absoluto
de las distancias existentes entre cada dato
y su media aritmética y el número total de
datos.

∑𝑁𝑁
𝑖𝑖=1 𝑥𝑥𝑖𝑖 − 𝑥𝑥̅
𝐷𝐷𝐷𝐷 =
𝑛𝑛

04/09/2018 ING., JOSÉ GUZMÁN 49


3. MEDIDAS DE DISPERCIÓN O VARIABILIDAD

3.3.1 Desviación Media

DATOS NO DATOS TABULADOS POR


ECUACIONES DATOS AGRUPADOS
AGRUPADOS INTERVALO
DESVIACIÓN
MEDIA ∑𝑁𝑁
𝑖𝑖=1 𝑥𝑥𝑖𝑖 − 𝜇𝜇 ∑𝑁𝑁
𝑖𝑖=1 𝑥𝑥𝑖𝑖 − 𝜇𝜇 ∗ 𝑓𝑓𝑖𝑖 ∑𝑁𝑁
𝑖𝑖=1 𝑀𝑀𝑀𝑀𝑖𝑖 − 𝜇𝜇 ∗ 𝑓𝑓𝑖𝑖
𝐷𝐷𝐷𝐷 = 𝐷𝐷𝐷𝐷 = 𝐷𝐷𝐷𝐷 =
POBLACIONAL 𝑁𝑁 𝑁𝑁 𝑁𝑁

DESVIACIÓN
∑𝑛𝑛𝑖𝑖=1 𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ ∑𝑛𝑛𝑖𝑖=1 𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ ∗ 𝑓𝑓𝑖𝑖 ∑𝑛𝑛𝑖𝑖=1 𝑀𝑀𝑀𝑀𝑖𝑖 − 𝑥𝑥̅ ∗ 𝑓𝑓𝑖𝑖
MEDIA 𝐷𝐷𝐷𝐷 = 𝐷𝐷𝐷𝐷 = 𝐷𝐷𝐷𝐷 =
MUESTRAL 𝑛𝑛 𝑛𝑛 𝑛𝑛

04/09/2018 ING., JOSÉ GUZMÁN 50


3. MEDIDAS DE DISPERCIÓN O VARIABILIDAD

3.3.1 Desviación Media


Ejemplo 1: Desviación media para datos no Ejemplo 2: Desviación media para datos agrupados
agrupados Una maquina dispensadora de gaseosas esta
Tres alumnos son sometidos a una competencia para programada para llenar un envase con 350 c.c. de un
probar sus conocimientos en 10 materias diferentes, refresco popular. A partir de una muestra de prueba
cada una sustentada con 10 preguntas. La idea del realizada sobre 30 envases se realizó la siguiente tabla
concurso es encontrar al alumno más idóneo para
de frecuencia:
representar al colegio en un torneo a nivel nacional.
El número de preguntas buenas por materia se
muestra a continuación:
f

04/09/2018 ING., JOSÉ GUZMÁN 51


3. MEDIDAS DE DISPERCIÓN O VARIABILIDAD

3.3.2. Varianza.- La varianza, es una medida que cuantifíca el grado de dispersión o de variación de los
valores de una variable cuantitativa con respecto a su media aritmética. Si los valores tienden a concentrarse
alrededor de su media, la varianza será pequeña. Si los valores tienden a distribuirse lejos de la media, la
varianza será grande.

La varianza calculada a partir de una muestra será denotada por S2 y referida a una población se denotará
por 𝝈𝝈𝟐𝟐 .

Definición. La varianza se define como la media aritmética de los cuadrados de las diferencias de los
datos con respecto a su media aritmética.

La varianza es una medida de dispersión con unidades de medición al cuadrado, por ejemplo, $2, Km2, etc.

DATOS TABULADOS POR


ECUACIONES DATOS NO AGRUPADOS DATOS AGRUPADOS
INTERVALO

VARIANZA ∑𝑁𝑁
𝑖𝑖=1 𝑥𝑥𝑖𝑖 − 𝜇𝜇
2 ∑𝑁𝑁
𝑖𝑖=1 𝑥𝑥𝑖𝑖 − 𝜇𝜇
2 ∗ 𝑓𝑓𝑖𝑖 ∑𝑁𝑁
𝑖𝑖=1 𝑀𝑀𝑀𝑀𝑖𝑖 − 𝜇𝜇
2
∗ 𝑓𝑓𝑖𝑖
POBLACIONAL 𝜎𝜎 2 = 𝜎𝜎 2 = 𝜎𝜎 2 =
𝑁𝑁 𝑁𝑁 𝑁𝑁

𝑛𝑛
VARIANZA
2
∑ 𝑖𝑖=1 𝑥𝑥𝑖𝑖 − 𝑥𝑥̅
2 ∑𝑛𝑛𝑖𝑖=1 𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ 2
∗ 𝑓𝑓𝑖𝑖 ∑𝑛𝑛𝑖𝑖=1 𝑀𝑀𝑀𝑀𝑖𝑖 − 𝑥𝑥̅ 2 ∗ 𝑓𝑓𝑖𝑖
MUESTRAL 𝑆𝑆 = 𝑆𝑆 2 = 𝑆𝑆 2 =
𝑛𝑛 − 1 𝑛𝑛 − 1 𝑛𝑛 − 1
04/09/2018 ING., JOSÉ GUZMÁN 52
3. MEDIDAS DE DISPERCIÓN O VARIABILIDAD

3.3.3. Desviación Típica o Estándar.- La desviación estándar es la raíz cuadrada positiva de la varianza La
desviación estándar calculada a partir de una muestra se denotará por, s y referida a la población por 𝝈𝝈.
Esto es,
𝜎𝜎 = 𝜎𝜎 2 ; 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃 𝑙𝑙𝑙𝑙 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 ; 𝑠𝑠 = 𝑠𝑠 2 ; 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃 𝑙𝑙𝑙𝑙 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚
Ejemplo: Determinar la varianza y la desviación estándar de:

Varianza para datos no Varianza para datos Varianza para datos


agrupados agrupados agrupados
La siguiente muestra representa Calcular la varianza y la Calcular la varianza a partir de la
las edades de 25 personan desviación estándar del número siguiente tabla de frecuencia
sometidas a un análisis de de hijos de la muestra de 20 (suponga que los datos son
preferencias para un estudio de familias poblacionales).
mercado.

25 19 21 35 44 Xi fi
0 1
20 27 32 38 33 1 4
18 30 19 29 33 2 7
3 6
26 24 28 39 31 4 2
31 18 17 30 27 TOTAL 20
04/09/2018 ING., JOSÉ GUZMÁN 53
3. MEDIDAS DE DISPERCIÓN O VARIABILIDAD

Comparación de Desviaciones Estándar


Misma media pero diferentes
desviaciones estándar:
Datos A
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 3.338

Datos B
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 0.9258
Datos C
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 4.57
04/09/2018 ING., JOSÉ GUZMÁN 54
3. MEDIDAS DE DISPERCIÓN O VARIABILIDAD

¿Qué datos tienen mayor variabilidad?

Datos A: SA = 100

Datos B: SB = 1

04/09/2018 ING., JOSÉ GUZMÁN 55


3. MEDIDAS DE DISPERCIÓN O VARIABILIDAD

¿Qué datos tienen mayor variabilidad?

Datos A: SA = 100 MediaA = 1,000

Datos B: SB = 1 MediaB = 0.01

04/09/2018 ING., JOSÉ GUZMÁN 56


3. MEDIDAS DE DISPERCIÓN O VARIABILIDAD

3.3.4. Coeficiente de variación.- Llamado en ocasiones, coeficiente de variación de Pearson, por el matemático inglés
Karl Pearson (1857 – 1936).

El coeficiente de variación compara la dispersión entre dos poblaciones distintas e incluso, la variación producto de
dos variables diferentes (que pueden provenir de una misma población).

Es una medida adimensional (no tiene unidades), y compara la dispersión de varias distribuciones, y se expresa en (%).

𝜎𝜎 𝑆𝑆
𝐶𝐶𝐶𝐶 = ; Ó: 𝐶𝐶𝐶𝐶 = ; 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑑𝑑𝑑𝑑 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑦𝑦 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚
𝜇𝜇 𝑥𝑥̅

𝜎𝜎 𝑆𝑆
𝐶𝐶𝐶𝐶 = ; Ó: 𝐶𝐶𝐶𝐶 = ; 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑑𝑑𝑑𝑑 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚
𝑀𝑀𝑀𝑀 𝑥𝑥�

A mayor valor de CV, menor representatividad de 𝑥𝑥 ̅, y viceversa. En general, se suele convenir en que valores de:

 CV menores a 10% indican una alta concentración,

 CV entre 10% y 30% una concentración media,

 y valores de CV superiores a 30% (o 1 según algunos autores) una alta dispersión y una media poco o nada
representativa.

Nota: si la media aritmética es cero, obviamente el coeficiente no puede calcularse.


04/09/2018 ING., JOSÉ GUZMÁN 57
3. MEDIDAS DE DISPERCIÓN O VARIABILIDAD

3.3.4. Coeficiente de variación.-


Ejemplo: Desviación estándar para datos no PASO 1: Calcular las medias aritméticas:
agrupados.- En un juego de tiro al blanco con
PASO 2: Calcular las varianzas
escopeta de perdigones por dos participantes a
un tablero, obtienen el siguiente registro después PASO 3: Calcular la desviación estándar a partir de la

de 15 disparos cada uno. Determinar el raíz cuadrada de la

coeficiente de variación muestral para ambos varianza.

casos.
PASO 4: Calcular el coeficiente de variación.

El menor coeficiente de variación indica que el


jugador 2 presento una dispersión menor de sus
puntuaciones respecto a la media, caso contrario al
jugador 1 donde la dispersión fue mayor.

04/09/2018 ING., JOSÉ GUZMÁN 58


3. MEDIDAS DE DISPERCIÓN O VARIABILIDAD

¿Qué datos tienen mayor variabilidad?

Datos A: SA = 100

Datos B: SB = 1

04/09/2018 ING., JOSÉ GUZMÁN 59


3. MEDIDAS DE DISPERCIÓN O VARIABILIDAD

¿Qué datos tienen mayor variabilidad?

Datos A: SA = 100 MediaA = 1,000

Datos B: SB = 1 MediaB = 0,01

04/09/2018 ING., JOSÉ GUZMÁN 60


3. MEDIDAS DE TENDENCIA CENTRAL

3.4.1. Momentos con respecto al Origen y


3.4.2. momentos con respecto a la media

04/09/2018 ING., JOSÉ GUZMÁN 61


3. MEDIDAS DE TENDENCIA CENTRAL

3.4.1. Momentos

Son los promedios de las distintas potencias de las desviaciones de los datos con respecto a algún valor A.

Cuando A=0, desviación es el mismo valor de la observación, entonces se tienen los momentos respecto al

origen (o alrededor del origen)

� se tienen los momentos con respecto a la Media (o alrededor de la Media) o momentos


Cuando A=𝑋𝑋,

centrales.

3.4.1. Momentos con respecto al Origen (𝑚𝑚𝑟𝑟′ ) 3.4.2. Momentos con respecto a la media o momentos

centrales(𝑚𝑚𝑟𝑟 )

El r-ésimo momento (muestral) con respecto al origen o


El r-ésimo momento (muestral) con respecto al origen o
momento con respecto al origen de orden r, se define:
momento con respecto al origen de orden r, se define: 𝑛𝑛
𝑛𝑛 1 𝑟𝑟
1 � 𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ ; 𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷 𝑛𝑛𝑛𝑛 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐
� 𝑥𝑥𝑖𝑖𝑟𝑟 ; 𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷 𝑛𝑛𝑛𝑛 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑛𝑛
𝑛𝑛 𝑚𝑚𝑟𝑟 = 𝑀𝑀 𝑋𝑋 − 𝑥𝑥)̅ 𝑟𝑟 =
𝑖𝑖=1
𝑖𝑖=1 𝑘𝑘
𝑚𝑚𝑟𝑟′ = 𝑀𝑀 𝑋𝑋 𝑟𝑟 = 𝑘𝑘 1
1 � 𝑀𝑀𝑀𝑀𝑖𝑖 − 𝑥𝑥̅ 𝑟𝑟 ∗ 𝑓𝑓𝑖𝑖 ; 𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐
� 𝑀𝑀𝑀𝑀𝑖𝑖𝑟𝑟 ∗ 𝑓𝑓𝑖𝑖 ; 𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑛𝑛
𝑛𝑛 𝑖𝑖=1
𝑖𝑖=1
r = 0,1,2,3,4,….
r = 0,1,2,3,4,….
04/09/2018 ING., JOSÉ GUZMÁN 62
3. MEDIDAS DE TENDENCIA CENTRAL
3.4.1. Momentos – ecuaciones para datos agrupados en tablas de frecuencias y de

frecuencias por intervalos.


MOMENTOS CON RESPECTO AL ORIGEN MOMENTOS CON RESPECTO A LA MEDIA O MOMENTOS
Momentos cero CENTRALES
Momentos cero central
𝑘𝑘
1
𝑚𝑚0′ = 𝑀𝑀 𝑋𝑋 0 = � 𝑥𝑥𝑖𝑖0 ∗ 𝑓𝑓𝑖𝑖 = 1; 𝑠𝑠𝑠𝑠 𝑥𝑥𝑖𝑖 ≠ 0, ∀𝑖𝑖 𝑘𝑘
𝑛𝑛 1
𝑖𝑖=1
𝑚𝑚0 = 𝑀𝑀(𝑋𝑋 − 𝑥𝑥)̅ 0 = � 𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ 0 ∗ 𝑓𝑓𝑖𝑖 = 1; 𝑠𝑠𝑠𝑠 𝑥𝑥𝑖𝑖 ≠ 𝑥𝑥,̅ ∀𝑖𝑖
Primer momento con respecto al origen 𝑛𝑛
𝑖𝑖=1
1 Primer momento central
𝑚𝑚1′ = 𝑀𝑀 𝑋𝑋1 = ∑𝑘𝑘𝑖𝑖=1 𝑥𝑥𝑖𝑖1 ∗ 𝑓𝑓𝑖𝑖 = 𝑥𝑥̅ ; Es la media aritmética
𝑛𝑛

Segundo momento con respecto al origen 𝑘𝑘


1
𝑚𝑚1 = 𝑀𝑀(𝑋𝑋 − 𝑥𝑥)̅ 1 = � 𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ 1
∗ 𝑓𝑓𝑖𝑖 = 0
𝑛𝑛
𝑘𝑘 𝑖𝑖=1
1
𝑚𝑚2′ = � 𝑥𝑥𝑖𝑖2 ∗ 𝑓𝑓𝑖𝑖 = 𝑀𝑀 𝑋𝑋 2 Segundo momento central
𝑛𝑛
𝑖𝑖=1
1
La media cuadrática es la raíz cuadrada positivas del segundo 𝑚𝑚2 = 𝑀𝑀(𝑋𝑋 − 𝑥𝑥)̅ 2 = ∑𝑘𝑘𝑖𝑖=1 𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ 2
∗ 𝑓𝑓𝑖𝑖 ; Es la varianza
𝑛𝑛

momento con respecto al origen Tercer momento central

𝑘𝑘
Tercer momento con respecto al origen 1
𝑚𝑚3 = 𝑀𝑀(𝑋𝑋 − 𝑥𝑥)̅ 3 = � 𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ 3 ∗ 𝑓𝑓𝑖𝑖
𝑛𝑛
𝑖𝑖=1
𝑘𝑘
1 Cuarto momentos entrar
𝑚𝑚3′ = � 𝑥𝑥𝑖𝑖3 ∗ 𝑓𝑓𝑖𝑖 = 𝑀𝑀 𝑋𝑋 3
𝑛𝑛
𝑖𝑖=1
𝑘𝑘
1
4 4
𝑚𝑚4 = 𝑀𝑀(𝑋𝑋 − 𝑥𝑥)̅ = � 𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ ∗ 𝑓𝑓𝑖𝑖
𝑛𝑛
𝑖𝑖=1
04/09/2018 ING., JOSÉ GUZMÁN 63
3. MEDIDAS DE TENDENCIA CENTRAL

3.4.1. Calcular los Momentos hasta el cuarto orden respecto al origen y la media.

Xi fi
0 1
1 4
2 7
3 6
4 2
TOTAL 20

04/09/2018 ING., JOSÉ GUZMÁN 64


3. MEDIDAS DE TENDENCIA CENTRAL

3.4.1. Momentos – ecuaciones para datos agrupados en tablas de frecuencias por intervalos.
MOMENTOS CON RESPECTO AL ORIGEN MOMENTOS CON RESPECTO A LA MEDIA O MOMENTOS
Momentos cero CENTRALES
Momentos cero central
𝑘𝑘
1
𝑚𝑚0′ = 𝑀𝑀 𝑋𝑋 0 = � 𝑀𝑀𝑀𝑀𝑖𝑖0 ∗ 𝑓𝑓𝑖𝑖 = 1; 𝑠𝑠𝑠𝑠 𝑥𝑥𝑖𝑖 ≠ 0, ∀𝑖𝑖 𝑘𝑘
𝑛𝑛 1
𝑖𝑖=1
𝑚𝑚0 = 𝑀𝑀(𝑋𝑋 − 𝑥𝑥)̅ 0 = � 𝑀𝑀𝑀𝑀𝑖𝑖 − 𝑥𝑥̅ 0 ∗ 𝑓𝑓𝑖𝑖 = 1; 𝑠𝑠𝑠𝑠 𝑥𝑥𝑖𝑖 ≠ 𝑥𝑥,̅ ∀𝑖𝑖
Primer momento con respecto al origen 𝑛𝑛
𝑖𝑖=1
1 Primer momento central
𝑚𝑚1′ = 𝑀𝑀 𝑋𝑋1 = ∑𝑘𝑘𝑖𝑖=1 𝑀𝑀𝑀𝑀𝑖𝑖1 ∗ 𝑓𝑓𝑖𝑖 = 𝑥𝑥̅ ; Es la media aritmética
𝑛𝑛

Segundo momento con respecto al origen 𝑘𝑘


1
𝑚𝑚1 = 𝑀𝑀(𝑋𝑋 − 𝑥𝑥)̅ 1 = � 𝑀𝑀𝑀𝑀𝑖𝑖 − 𝑥𝑥̅ 1
∗ 𝑓𝑓𝑖𝑖 = 0
𝑛𝑛
𝑘𝑘 𝑖𝑖=1
1
𝑚𝑚2′ = � 𝑀𝑀𝑀𝑀𝑖𝑖2 ∗ 𝑓𝑓𝑖𝑖 = 𝑀𝑀 𝑋𝑋 2 Segundo momento central
𝑛𝑛
𝑖𝑖=1
1
La media cuadrática es la raíz cuadrada positivas del segundo 𝑚𝑚2 = 𝑀𝑀(𝑋𝑋 − 𝑥𝑥)̅ 2 = ∑𝑘𝑘𝑖𝑖=1 𝑀𝑀𝑀𝑀𝑖𝑖 − 𝑥𝑥̅ 2
∗ 𝑓𝑓𝑖𝑖 ; Es la varianza
𝑛𝑛

momento con respecto al origen Tercer momento central

𝑘𝑘
Tercer momento con respecto al origen 1
𝑚𝑚3 = 𝑀𝑀(𝑋𝑋 − 𝑥𝑥)̅ 3 = � 𝑀𝑀𝑀𝑀𝑖𝑖 − 𝑥𝑥̅ 3 ∗ 𝑓𝑓𝑖𝑖
𝑛𝑛
𝑖𝑖=1
𝑘𝑘
1 Cuarto momentos entrar
𝑚𝑚3′ = � 𝑀𝑀𝑀𝑀𝑖𝑖3 ∗ 𝑓𝑓𝑖𝑖 = 𝑀𝑀 𝑋𝑋 3
𝑛𝑛
𝑖𝑖=1
𝑘𝑘
1
4 4
𝑚𝑚4 = 𝑀𝑀(𝑋𝑋 − 𝑥𝑥)̅ = � 𝑀𝑀𝑀𝑀𝑖𝑖 − 𝑥𝑥̅ ∗ 𝑓𝑓𝑖𝑖
𝑛𝑛
𝑖𝑖=1
04/09/2018 ING., JOSÉ GUZMÁN 65
3. MEDIDAS DE TENDENCIA CENTRAL

3.4.1. Momentos.- Determinar los momentos con respecto al origen y a la media, hasta el
cuarto orden, de la distribución de frecuencias dadas en la tabla.

k Ii fi
1 0 2 2
2 2 4 4
3 4 6 6
4 6 8 4
5 8 10 2

𝑛𝑛
1
� 𝑥𝑥𝑖𝑖𝑟𝑟 ; 𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷 𝑛𝑛𝑛𝑛 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐
𝑛𝑛
𝑖𝑖=1
𝑚𝑚𝑟𝑟′ = 𝑀𝑀 𝑋𝑋 𝑟𝑟 = 𝑘𝑘
1
� 𝑀𝑀𝑀𝑀 𝑟𝑟 ∗ 𝑓𝑓𝑖𝑖 ; 𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐
𝑛𝑛
𝑖𝑖=1

r = 0,1,2,3,4,…..

04/09/2018 ING., JOSÉ GUZMÁN 66


3. MEDIDAS DE TENDENCIA CENTRAL

Ejercicio:
3.4.1. Momentos.- Determinar los momentos con respecto al origen y
a la media, hasta el cuarto orden, de la distribución de frecuencias
dadas en la tabla.

04/09/2018 ING., JOSÉ GUZMÁN 68


3. MEDIDAS DE TENDENCIA CENTRAL

3.5.1. Asimetría y deformación,


3.5.2. Curtosis,
3.5.3. Rango intercuartílico;
3.5.4. Coeficiente de asimetría.

04/09/2018 ING., JOSÉ GUZMÁN 69


3. MEDIDAS DE TENDENCIA CENTRAL

3.5.1. Asimetría y deformación,


• Describe cómo están distribuidos los datos Simétrica o asimétrica
• Evalúa el grado de distorsión o inclinación que adopta la distribución de los
datos respecto a su valor promedio tomado como centro de gravedad.
• A mayor diferencia entre la media y la mediana, mayor es la asimetría de la
distribución
Asimétrica a Simétrica Asimétrica a
la Izquierda la Derecha

Media < Mediana Media = Mediana Mediana < Media


(Cola larga hacia la izquierda) (Cola larga hacia la derecha)

04/09/2018 ING., JOSÉ GUZMÁN 70


3. MEDIDAS DE TENDENCIA CENTRAL

3.5.1. Asimetría y deformación,

04/09/2018 ING., JOSÉ GUZMÁN 71


3. MEDIDAS DE TENDENCIA CENTRAL

3.5.1. Asimetría y deformación,


Mide el grado de deformación horizontal de la distribución de frecuencias y se define como:

El coeficiente de asimetría de Pearson es:

3 ∗ (𝑥𝑥̅ − 𝑀𝑀𝑀𝑀) 𝑥𝑥̅ − 𝑀𝑀𝑀𝑀


𝑆𝑆𝑘𝑘 = 𝑆𝑆𝑘𝑘 =
𝑆𝑆 𝑆𝑆
El coeficiente de Pearson es
Es el coeficiente de Pearson
utilizado cuándo la distribución es
más usual
unimodal .
MEDIA ASIMÉTRICA

𝑄𝑄3 − 2 ∗ 𝑀𝑀𝑀𝑀 + 𝑄𝑄1 𝑃𝑃90 − 2 ∗ 𝑃𝑃50 + 𝑃𝑃10


𝑆𝑆𝑘𝑘 = 𝑆𝑆𝑘𝑘 =
𝑄𝑄3 − 𝑄𝑄1 𝑃𝑃90 − 𝑃𝑃10

Son llamados también media asimétrica, se usan cuando existen intervalos con
extremos abiertos ilimitados y no es posible calcular la media y consecuentemente
la varianza

04/09/2018 ING., JOSÉ GUZMÁN 72


3. MEDIDAS DE TENDENCIA CENTRAL

3.5.2. Curtosis,

04/09/2018 ING., JOSÉ GUZMÁN 73


3. MEDIDAS DE TENDENCIA CENTRAL

3.5.2. Kurtosis,
Mide el grado de deformación vertical de la distribución de frecuencias y se define:

𝑄𝑄3 − 𝑄𝑄1
𝐾𝐾 =
2 ∗ (𝑃𝑃90 − 𝑃𝑃10 )

De acuerdo a la magnitud de k las distribuciones pueden ser:


1. Leptokurticas (picuda o puntiaguda) 0,375 < 𝐾𝐾 ≤ 0,5
2. Mesokurticas (moderada o normal) 0,125 ≤ 𝐾𝐾 ≤ 0,375
3. Platikurticas (achatada o plana) 0 ≤ 𝐾𝐾 < 0,125

04/09/2018 ING., JOSÉ GUZMÁN 74


3. MEDIDAS DE TENDENCIA CENTRAL

3.5.3. Rango intercuartílico 15 0


55 0
65 0
10 5
12 10
10 10
10 10
50 10
15 10
5 12
16 15
150,5 15
20 16
10 20
0 20
65 38
10 45,5
45,5 50
20 55
0 65
38 65
74 74
309 150,5
0 309
La media es 41,875

04/09/2018 ING., JOSÉ GUZMÁN 75


3. MEDIDAS DE TENDENCIA CENTRAL

Calcular los coeficientes de asimetría y kurtosis de la distribución de frecuencias dadas en


la tabla:

Ii fi
20 30 2
30 40 10
40 55 8
55 65 6
65 85 2

04/09/2018 ING., JOSÉ GUZMÁN 76


3. MEDIDAS DE TENDENCIA CENTRAL

3.5.3. Rango intercuartílico


Son medidas de variabilidad obtenidas excluyéndome una porción especificada de valores a cada extremo y
considerando solamente la dispersión de los valores restantes; entre las más usuales que están los rangos
intercuartílico son los rangos en interpercentílicos.

• Usando el rango intercuartílico se puede eliminar algunos problemas de valores atípicos

• No cambiará incluso si los valores más pequeños y más grandes tomasen valores más extremos

• Rango intercuartílico =Q3 – Q1

Ineficiencia
de la media

04/09/2018 ING., JOSÉ GUZMÁN 77


3. MEDIDAS DE TENDENCIA CENTRAL

 Ejemplo: Encontrar el primer cuartil

Datos muestrales en un arreglo ordenado: 11 12 13 16 16 17 18 21 22


(n = 9)

Redondear a 3
25
Q1 = 25to percentil. Encontrar i : i = 100 (9) = 2.25 dado que no es
un entero

Entonces redondear hacia arriba y usar el valor en la 3ra ubicación:


Q1 = 13

Interpretación: El 25% de los datos es menor que 13

04/09/2018 ING., JOSÉ GUZMÁN 78


3. MEDIDAS DE TENDENCIA CENTRAL

3.5.3. Rango intercuartílico

Gráfico de Caja y Bigote

Herramienta gráfica de descripción de datos cuantitativos,


muestra:
• La mediana y los cuartiles
• Valores atípicos

Valores atípicos valores inusualmente bajos o altos en relación


al resto de valores de la data.

04/09/2018 ING., JOSÉ GUZMÁN 79


3. MEDIDAS DE TENDENCIA CENTRAL

3.5.3. Rango intercuartílico


• Rango intercuartílico =Q3 – Q1

Ejemplo: Dado los valores 12, 45, 30, 70, 57, el diagrama
de caja o bigotes

Mediana X
X Q1 Q3 máximo
mínimo (Q2)
25% 25% 25% 25%

12 30 45 57 70

Rango intercuartílico:
57 – 30 = 27
04/09/2018 ING., JOSÉ GUZMÁN 80
3. MEDIDAS DE TENDENCIA CENTRAL

3.5.3. Rango intercuartílico


• Es una presentación gráfica de los datos usando una “caja” central y “bigotes” extendidos

Ejemplo:
25% 25% 25% 25%

* *
Valores “Valor más pequeño” 1er Mediana 3er “Valor más grande”
Atípicos (Límite Inferior) Cuartil Cuartil (Límite Superior)

El límite inferior es Q1 – 1.5 (Q3 – Q1) El límite superior es Q3 + 1.5 (Q3 – Q1)

 Dibujar una caja desde Q1 a Q3


 Trazar una línea vertical en la mediana
 Trazar líneas (bigotes) hacia el valor más pequeño y más grande (dentro de los límites calculados)
 Identificar los valores atípicos fuera de los límites calculados

04/09/2018 ING., JOSÉ GUZMÁN 81


3. MEDIDAS DE TENDENCIA CENTRAL

3.5.3. Rango intercuartílico

De los siguientes datos, elaborar su gráfico de caja y bigote:

5 6 27 11 2 4 3 0 2 3 2

04/09/2018 ING., JOSÉ GUZMÁN 82


3. MEDIDAS DE TENDENCIA CENTRAL

15 0
55 0
65 0
10 5
12 10
10 10 min 0
10 10 max 309
50 10 Q1 10
15 10 Q2 15,5
5 12 Q3 51,25
16 15 RI 41,25
150,5 15 Li -51,875
20 16 Ls 113,125
10 20
0 20
65 38
10 45,5
45,5 50
20 55
0 65
38 65
74 74
309 150,5
0 309
La media es 41,875
04/09/2018 ING., JOSÉ GUZMÁN 86
3. MEDIDAS DE TENDENCIA CENTRAL

Ejemplo - En la siguiente tabla se han recogido las edades que tenían los actores y actrices que ganaron el
Oscar a la mejor interpretación, en todos los años de existencia de dichos premios (1929-2013). En la tabla
aparece, por orden cronológico, la edad que tenía la actriz (actor) que ganó el Oscar en la primera celebración
de los premios, y sucesivamente hasta la actualidad.

Actrices:

22 37 28 63 32 26 31 27 27 28 30 26 29 24 38 25 29 41 30 35 35 33 29 38 54 24 25 46 41 28 40 39 29 27 31 38
29 25 35 60 43 35 34 34 27 37 42 41 36 32 41 33 31 74 33 50 38 61 21 41 26 80 42 29 33 35 45 49 39 34 26 25
33 35 35 28 30 29 61 32 33 45 28 62 22

Actores:

44 41 62 52 41 34 34 52 41 37 38 34 32 40 43 56 41 39 49 57 41 38 42 52 51 35 30 39 41 44 49 35 47 31 47 37
57 42 45 42 44 62 43 42 48 49 56 38 60 30 40 42 36 76 39 53 45 36 62 43 51 32 42 54 52 37 38 32 45 60 46 40
36 47 29 43 37 38 45 50 48 60 50 39 55

04/09/2018 ING., JOSÉ GUZMÁN 87


3. MEDIDAS DE TENDENCIA CENTRAL

Comprobamos que el box‐plot es un instrumento gráfico muy


efectivo para comparar dos variables. La mediana de edad (la
barra dentro de las cajas) es más alta para los actores que
para las actrices. Este hecho seguramente está amparado por
la queja mayoritaria entre las actrices de Hollywood, que
señalan que escasean los buenos papeles para actrices
mayores de 40. En el gráfico vemos que los valores de edad
altos son atípicos para la variable de las actrices, mientras que
sólo hay un dato atípico en el caso de los hombres. En el
box‐plot se visualiza también con gran claridad la simetría o
asimetría de una distribución, pues vemos que ambas son más
largas hacia la derecha que hacia la izquierda. En
contrapartida, la mayor agrupación de datos se da a la
izquierda (la mayoría de los Oscar se consiguen a edades no
demasiado altas). El análisis puede complementarse por medio
del histograma de ambas variables, donde señalamos la media
y la mediana que, como apreciamos, son muy similares.

04/09/2018 ING., JOSÉ GUZMÁN 88


3. MEDIDAS DE TENDENCIA CENTRAL

¡SIGA ADELANTE!

04/09/2018 ING., JOSÉ GUZMÁN 89

También podría gustarte