Sesion 3 y 4

Redefinamos los
buenos
negocios
centrum.pucp.edu.pe
ESTADISTICA
Sesiones 3 -4
1
Resumen numérico
de los datos
22
Objetivos
● Reconozcamos las medidas de Tendencia Central
● Definamos e interpretemos las Medidas de dispersión
32
Medidas de
Tendencia Central
42
Características de los Datos
Tendencia Central
(Posición)
Dispersión
(Variación
)
Sesgo
52
Tendencia
Central
Media Media Media Mediana Moda

Aritmética Ponderada Geométrica
62
Media de la Población
Para datos no agrupados, la media aritmética de la

población es la suma de todos los valores en ella
dividida entre el total de valores en la
población:
  x /
donde µ representaN
la media de la población.
N es el número total de elementos en la población.
x representa cualquier valor en particular. Σ
indica la operación de sumar.
72
Media de una Muestra
Para datos no agrupados, la media de una muestra es la suma de todos los

valores divididos entre el número total de los mismos:
x  x /
donde
n
n es el número total de valores en la muestra.
denota la media muestral
82
Propiedades de la Media Aritmética
Todo conjunto de datos tiene un valor medio.
Al evaluar la media se incluyen todos los valores.
Un conjunto de valores sólo tiene una media.

x  x /
n
Desventaja
Es afectada por los valores extremos.
92
Media Aritmética
Es la medida más común de tendencia central.
Es afectada por valores extremos.
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
Media = 5 Media = 6
10
2
Media Ponderada
La media ponderada de un conjunto de números x1, x2, ..., xn, con las
ponderaciones correspondientes w1, w2, ...,wn, se calcula con la
fórmula:
xw  (w1 x1  w2 x 2  ...  wn x n ) /(w1  w2
 ...wn )
xw  (w * x) / w
11
2
Media Geométrica
La media geométrica (MG) de un conjunto de n números

positivos se define como la raíz n-ésima del producto de los n
valores. Su fórmula es:
MG  n (x1)(x2)(x3)...(xn)
La media geométrica se usa para encontrar el promedio de
porcentajes, razones, índices o tasas de crecimiento.
12
2
Mediana
Mediana: es el punto medio de los valores después de

ordenarlos de menor a mayor, o de mayor a menor. La
misma cantidad de valores se encuentra por arriba de la
mediana que por debajo de ella.
Nota: para un conjunto con un número par de números, la

mediana será el promedio aritmético de los dos números
medios.
13
2
Mediana
No es afectada por los valores extremos.
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
Mediana = 5 Mediana = 5
n  1
Mediana  2
14
2
Propiedades de la mediana
La mediana es única para cada conjunto de datos.
No se ve afectada por valores muy grandes o muy pequeños.
15
2
Moda
Valor que ocurre más a menudo.
No es afectada por valores extremos.
Puede no existir una moda.

Pueden haber varias modas.
0 1 2 3 4 5 6
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Sin Moda
16 Moda = 9
Datos NO Agrupados
Registro cantidad de artículos vendidos
durante 22 días
Día Artículos Día Artículos
1 10 12 10
2 14 13 14
3 9 14 6
4 12 15 13
5 8 16 8
6 15 17 12
7 12 18 7
8 3 19 16
9 11 20 9
10 17 21 11
11 5 22 6
17
Datos Agrupados
Distribución de Frecuencias de artículos vendidos
durante 22 días
CLASE FRECUENCIA
1-3 1
4-6 3
7-9 5
10 - 12 7
13 - 15 4
16 - 18 2
22
18
17
Media de Datos Agrupados
La media de una muestra de datos agrupados se puede

“estimar” con la formula:
x 
 ( f * x ) 
 ( f * x )
f n
f = frecuencia de cada clase
x = punto medio o marca de la clase n
= número de observaciones
19
17
Ejemplo
Media de Datos Agrupados
CLASE MARCA FRECUENCIA M X FREC.
1-3 2 1 2
4-6 5 3 15
7-9 8 5 40
10 - 12 11 7 77
13 - 15 14 4 56
16 - 18 17 2 34
22 224
224
Media  22  10.18
20
17
Mediana de datos agrupados
La mediana de una muestra de datos agrupados se calcula mediante la siguiente
fórmula:
m   ( n  1 ) / 2  ( F  1 )  * w  L m
 fm 
n= número de elementos de la distribución
F= suma de todas las frecuencias de clase hasta pero sin incluir la clase mediana. fm=
Frecuencia de la clase mediana

W = ancho del intervalo de clase
Lm= Límite inferior del intervalo de clase mediano

21
17
Ejemplo
Mediana de Datos Agrupados
CLASE FRECUENCIA FR. ACUM.
1-3 1 1
4-6 3 4
7-9 5 9
10 - 12 7 16
13 - 15 4 20
16 - 18 2 22
22
Ubicación de la mediana  222 1 

11.5
 ( 2 2  1 ) / 2  ( 9  1 ) 
m  
 7  * 3  1 0 
22
1 0 .6 4
Moda de datos agrupados
La moda de los datos agrupados se encuentra de la clase que contiene la

frecuencia de clase mayor.
d 1
M o  L M o 
   * w
 d 1  d 2 
LMo= Límite inferior de la clase modal
d1= Frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente
por debajo de ella (en valor).
d2= Frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente
por encima de ella (en valor).
w= Ancho del intervalo de la clase modal.
23
22
Ejemplo
Moda de Datos Agrupados
CLASE FRECUENCIA
1-3 1
4-6
7-9
10 - 12
13 - 1
16

M o  1 0    *( 37  15 1) . 2 (7  5)  (7
  4) 
24
22
Medidas de Medidas
de dispersión
25
22
Dispersión
Varianza Desviación Estándar Coeficiente de

Variación
Alcance Varianza de Desviación
la Población Estándar de
la Población
Varianza de
la Muestra Desviación
Estándar
Alcance Intercuartil de la
Muestra
26
22
Alcance o
Rango
27
22
Alcance
Diferencia entre la mayor y la menor de las observaciones

Alcance = xmayor – xmenor
No toma en cuenta la forma en que están distribuidos los datos.
Alcance: 12 - 7 = 5 Alcance: 12 - 7 = 5
7 8 9 10 11 12 7 8 9 10 11 12
28
22
Cuartiles
Los datos se ordenan de menor a mayor.

25% 25% 25% 25%
Q 
1 Q 
2 Q
3

Observación Observación
Menor Mayor
El alcance intercuartil es la distancia entre el tercer cuartil

Q3 y el primer cuartil Q1.
29
22
Desviación de la Media
30
22
Promedio de desviación de cada dato
-2
1
-1
0 1 5
2 3 4
( x  )  0
31
22
x1 xn
X
x2
Podríamos sumar las diferencias entre cada valor x y la media de los valores
x . Sin embargo, esto siempre daría cero. Por lo tanto,
elevamos al cuadrado la diferencia entre cada x y x, para eliminar las
negativas y resaltar los puntos singulares y después tomar las medias de los
resultados. Se define esto como la varianza
32
22
Varianza de la Población
Desviación cuadrática promedio con relación a la media de la
Población
2 
 ( x   ) 2
 N
2 x2   2
  N
33
22
Desviación Estándar de la Población
Raíz Cuadrada de la Varianza de la Población
(x  ) 2
   2 
N
x2
   2    2
N
34
22
Varianza de la Muestra
Desviación cuadrática promedio (n-1) con relación a la

media de la Muestra
2 (x  x)2
s 
n 1
x 2
nx 2
s 2 

n 1 n 1
35
22
Desviación cuadrática promedio (n-1) con relación a la
media de la Muestra
2 (x  x)2
s 
n 1
x 2
nx 2
s 2 

n 1 n 1
36
22
Desviación Estándar de la Muestra
Raíz Cuadrada de la Varianza de la Muestra
2 (x  x) 2
s  s 
n 1
x 2
nx 2
s  s 2 

37
22
n 1 n 1
Varianza de la Población
Datos Agrupados
f (x  )2
 2 
N
2  f x 2
  2
  N
x  marca de
clase
38
22
Desviación Estándar de la Población
Datos Agrupados
f (x  ) 2
   2 
N
fx2
   2    2
N
x  marca de
clase
39
22
Datos agrupados
2 f (x  x)2
s 
n 1
fx 2
nx 2
s 2 

n 1 n 1
x  marca de
clase
40
22
Desviación Estándar de la Muestra
Datos Agrupados
2 f (x  x)2
s  s 
n 1
fx 2
nx 2
s  s 2 

n 1 n 1
x  marca de
41
22 clase
Ejemplo Desviación Estándar
de Datos Agrupados
CLASE MARCA FRECUENCIA M X FREC. (Marca - Media)2 x Frecuencia
1-3 2 1 2 66.94 66.94
4-6 5 3 15 26.85 80.55
7-9 8 5 40 4.76 23.80
10 - 12 11 7 77 0.67 4.69
13 - 15 14 4 56 14.58 58.31
16 - 18 17 2 34 46.49 92.98
22 224 327.27
MEDIA 10.18 VARIANZA 15.584
DESV. ESTAND. 3.948
42
22
Comparación de Desviaciones Estándar
Datos A
Media = 15.5
s = 3.338
11 12 13 14 15 16 17 18 19 20
21
Datos B
Media = 15.5
11 12 13 14 15 16 17 18 19 20 s = .9258
21
Datos C
Media = 15.5
11 12 13 14 15 16 17 18 19 20 s = 4.57
21
43
22
Interpretación y usos de la Desviación Estándar
Teorema de Chebyshev: para cualquier conjunto de observaciones,

la proporción mínima de valores que está dentro de k desviaciones
estándar desde la media es al menos 1 - 1/k2 , donde k es una
constante mayor que 1.
44
22
Interpretación y usos de la Desviación Estándar
Regla empírica: para una distribución de frecuencias simétrica de

campana:
Cerca de 68% de las observaciones estará dentro de ±1σ de la media (μ); Cerca de
95% de las observaciones estará dentro de ±2σ de la media (μ);
Casi todas (alrededor de 99.7%) las observaciones estarán dentro de ±3σ de la media
(μ).
45
22
Curva de Distribución Normal
-3σ -2σ -1σ μ +1σ +2σ +3σ

46
22
34.13% 34.13%
13.60%
13.60%
2.135% 2.135%
0.135% 0.135%
-3σ -2 σ -1σ +1σ +2σ +3σ

μ
68.26%
95.46%
99.73%
47
22
Resultado Estándar
-3σ -2σ -1σ

μ +1σ +2σ +3σ
Re 
x  
48 
 
100 100
  20   20
x  80 x  160
¿ Re? ¿ Re?
-3σ -2σ -1σ

μ +1σ +2σ +3σ
80 100 160
80 100 160 100

Re   Re  20 
2
49 0 3
1
Dispersión Relativa
El coeficiente de variación es la razón de la desviación estándar a la

media aritmética, expresada como porcentaje:
s
CV  x (100%)
50
49
Ejemplo de Dispersión Relativa
Distribuci ón Distribuci ón
A x  10 B x  100
s2 s5
¿Cuál de las dos tiene menor dispersión?
51
49
Ejemplo de Dispersión Relativa
Distribución A Distribución B
5
2
CV  10 100  20% CV  100 100 
5%
La distribución B tiene menor dispersión
52
49
Coeficiente de Variación
NOTA: Las tablas que se presentan son
algunas propuestas que ayudan a la
interpretación del Coeficiente de Variación,
sin embargo es importante resaltar que esta
información es solo referencial, y la
interpretación en cada caso debe ser hecha
por el analista de la información, teniendo en
cuenta el proceso que se esta analizando.
53
49
Sesgo de una distribución
Positivament
Negativamente Simétrica e Sesgada
Sesgada
Media < Mediana < Moda Media = Mediana = Moda Moda < Mediana < Media
54
49
Coeficiente de asimetría
El coeficiente de asimetría de una distribución se define como:
Si | Sk |≥ 1 La distribución es altamente asimétrica
Si 0.5 < |Sk |< 1 La distribución es moderadamente asimétrica La

Si 0 < |Sk | 0.5 distribución es casi simétrica
Si Sk = 0 La distribución es simétrica
55
49
Summary Report for
Supp1 Anderson-Darling Normality Test
A-Squared 0.84
P-Value 0.029
Mean
599.55
StDev
0.62
Variance
0.38
Skewness -
0.082566
Kurtosis 0.7451
02
N 1
00
597.75 598.50 599.25 600.00 600.75 Minimum
597.80
1 st Quartile
599.20
Median
599.60
3rd Quartile
600.00
95% Confidence Intervals Maximum
601 .20
Mean 95% Confidence Interval for Mean
599.43 599.67
Median 95% Confidence Interval for Median
599.40 599.60
599.40 599.45 599.50 599.55 599.60 599.65 599.70
95% Confidence Interval for StDev
56
49 0.54 0.72

Sesion 3 y 4

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Sesion 3 y 4

Cargado por

Copyright:

Formatos disponibles

Redefinamos los

● Definamos e interpretemos las Medidas de dispersión

Media Media Media Mediana Moda

Para datos no agrupados, la media aritmética de la

N es el número total de elementos en la población.

x representa cualquier valor en particular. Σ

indica la operación de sumar.

Para datos no agrupados, la media de una muestra es la suma de todos los

Todo conjunto de datos tiene un valor medio.

Al evaluar la media se incluyen todos los valores.

Un conjunto de valores sólo tiene una media.

Es afectada por los valores extremos.

Es la medida más común de tendencia central.

Es afectada por valores extremos.

La media geométrica (MG) de un conjunto de n números

Mediana: es el punto medio de los valores después de

Nota: para un conjunto con un número par de números, la

No es afectada por los valores extremos.

La mediana es única para cada conjunto de datos.

No se ve afectada por valores muy grandes o muy pequeños.

Valor que ocurre más a menudo.

No es afectada por valores extremos.

Puede no existir una moda.

La media de una muestra de datos agrupados se puede

n= número de elementos de la distribución

Frecuencia de la clase mediana

Lm= Límite inferior del intervalo de clase mediano

Ubicación de la mediana  222 1 

La moda de los datos agrupados se encuentra de la clase que contiene la

Varianza Desviación Estándar Coeficiente de

Diferencia entre la mayor y la menor de las observaciones

No toma en cuenta la forma en que están distribuidos los datos.

Los datos se ordenan de menor a mayor.

El alcance intercuartil es la distancia entre el tercer cuartil

Desviación cuadrática promedio (n-1) con relación a la

Raíz Cuadrada de la Varianza de la Muestra

MEDIA 10.18 VARIANZA 15.584

DESV. ESTAND. 3.948

Teorema de Chebyshev: para cualquier conjunto de observaciones,

Regla empírica: para una distribución de frecuencias simétrica de

95% de las observaciones estará dentro de ±2σ de la media (μ);

-3σ -2σ -1σ μ +1σ +2σ +3σ

-3σ -2 σ -1σ +1σ +2σ +3σ

-3σ -2σ -1σ

-3σ -2σ -1σ

80 100 160 100

El coeficiente de variación es la razón de la desviación estándar a la

¿Cuál de las dos tiene menor dispersión?

La distribución B tiene menor dispersión

Si | Sk |≥ 1 La distribución es altamente asimétrica

Si 0.5 < |Sk |< 1 La distribución es moderadamente asimétrica La

También podría gustarte