Está en la página 1de 56

Redefinamos los

buenos
negocios
centrum.pucp.edu.pe
ESTADISTICA
Sesiones 3 -4

1
Resumen numérico
de los datos

22
Objetivos
● Reconozcamos las medidas de Tendencia Central

● Definamos e interpretemos las Medidas de dispersión

32
Medidas de
Tendencia Central

42
Características de los Datos

Tendencia Central
(Posición)

Dispersión

(Variación
)

Sesgo

52
Tendencia
Central

Media Media Media Mediana Moda


Aritmética Ponderada Geométrica

62
Media de la Población

Para datos no agrupados, la media aritmética de la


población es la suma de todos los valores en ella
dividida entre el total de valores en la
población:
  x /
donde µ representaN
la media de la población.

N es el número total de elementos en la población.

x representa cualquier valor en particular. Σ

indica la operación de sumar.

72
Media de una Muestra

Para datos no agrupados, la media de una muestra es la suma de todos los


valores divididos entre el número total de los mismos:

x  x /
donde
n
n es el número total de valores en la muestra.
denota la media muestral

82
Propiedades de la Media Aritmética

Todo conjunto de datos tiene un valor medio.

Al evaluar la media se incluyen todos los valores.

Un conjunto de valores sólo tiene una media.


x  x /
n
Desventaja

Es afectada por los valores extremos.

92
Media Aritmética

Es la medida más común de tendencia central.

Es afectada por valores extremos.

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14

Media = 5 Media = 6

10
2
Media Ponderada

La media ponderada de un conjunto de números x1, x2, ..., xn, con las
ponderaciones correspondientes w1, w2, ...,wn, se calcula con la
fórmula:
xw  (w1 x1  w2 x 2  ...  wn x n ) /(w1  w2
 ...wn )

xw  (w * x) / w

11
2
Media Geométrica

La media geométrica (MG) de un conjunto de n números


positivos se define como la raíz n-ésima del producto de los n
valores. Su fórmula es:

MG  n (x1)(x2)(x3)...(xn)
La media geométrica se usa para encontrar el promedio de
porcentajes, razones, índices o tasas de crecimiento.

12
2
Mediana

Mediana: es el punto medio de los valores después de


ordenarlos de menor a mayor, o de mayor a menor. La
misma cantidad de valores se encuentra por arriba de la
mediana que por debajo de ella.

Nota: para un conjunto con un número par de números, la


mediana será el promedio aritmético de los dos números
medios.

13
2
Mediana

No es afectada por los valores extremos.

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14

Mediana = 5 Mediana = 5

n  1
Mediana  2

14
2
Propiedades de la mediana

La mediana es única para cada conjunto de datos.

No se ve afectada por valores muy grandes o muy pequeños.

15
2
Moda

Valor que ocurre más a menudo.

No es afectada por valores extremos.

Puede no existir una moda.


Pueden haber varias modas.

0 1 2 3 4 5 6
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Sin Moda
16 Moda = 9
Datos NO Agrupados
Registro cantidad de artículos vendidos
durante 22 días
Día Artículos Día Artículos
1 10 12 10
2 14 13 14
3 9 14 6
4 12 15 13
5 8 16 8
6 15 17 12
7 12 18 7
8 3 19 16
9 11 20 9
10 17 21 11
11 5 22 6
17
Datos Agrupados
Distribución de Frecuencias de artículos vendidos
durante 22 días

CLASE FRECUENCIA
1-3 1
4-6 3
7-9 5
10 - 12 7
13 - 15 4
16 - 18 2
22
18
17
Media de Datos Agrupados

La media de una muestra de datos agrupados se puede


“estimar” con la formula:

x 
 ( f * x ) 
 ( f * x )
f n
f = frecuencia de cada clase
x = punto medio o marca de la clase n
= número de observaciones

19
17
Ejemplo
Media de Datos Agrupados
CLASE MARCA FRECUENCIA M X FREC.
1-3 2 1 2
4-6 5 3 15
7-9 8 5 40
10 - 12 11 7 77
13 - 15 14 4 56
16 - 18 17 2 34
22 224

224
Media  22  10.18
20
17
Mediana de datos agrupados
La mediana de una muestra de datos agrupados se calcula mediante la siguiente
fórmula:

m   ( n  1 ) / 2  ( F  1 )  * w  L m
 fm 

n= número de elementos de la distribución

F= suma de todas las frecuencias de clase hasta pero sin incluir la clase mediana. fm=

Frecuencia de la clase mediana


W = ancho del intervalo de clase

Lm= Límite inferior del intervalo de clase mediano


21
17
Ejemplo
Mediana de Datos Agrupados
CLASE FRECUENCIA FR. ACUM.
1-3 1 1
4-6 3 4
7-9 5 9
10 - 12 7 16
13 - 15 4 20
16 - 18 2 22
22

Ubicación de la mediana  222 1 


11.5
 ( 2 2  1 ) / 2  ( 9  1 ) 
m  
 7  * 3  1 0 
22
1 0 .6 4
Moda de datos agrupados

La moda de los datos agrupados se encuentra de la clase que contiene la


frecuencia de clase mayor.
d 1
M o  L M o 
   * w
 d 1  d 2 
LMo= Límite inferior de la clase modal
d1= Frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente
por debajo de ella (en valor).
d2= Frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente
por encima de ella (en valor).
w= Ancho del intervalo de la clase modal.

23
22
Ejemplo
Moda de Datos Agrupados
CLASE FRECUENCIA
1-3 1
4-6
7-9
10 - 12
13 - 1
16


M o  1 0    *( 37  15 1) . 2 (7  5)  (7
  4) 

24
22
Medidas de Medidas
de dispersión

25
22
Dispersión

Varianza Desviación Estándar Coeficiente de


Variación
Alcance Varianza de Desviación
la Población Estándar de
la Población
Varianza de
la Muestra Desviación
Estándar
Alcance Intercuartil de la
Muestra

26
22
Alcance o
Rango

27
22
Alcance

Diferencia entre la mayor y la menor de las observaciones


Alcance = xmayor – xmenor

No toma en cuenta la forma en que están distribuidos los datos.

Alcance: 12 - 7 = 5 Alcance: 12 - 7 = 5

7 8 9 10 11 12 7 8 9 10 11 12

28
22
Cuartiles

Los datos se ordenan de menor a mayor.


25% 25% 25% 25%

Q 
1 Q 
2 Q
3


Observación Observación
Menor Mayor

El alcance intercuartil es la distancia entre el tercer cuartil


Q3 y el primer cuartil Q1.

29
22
Desviación de la Media

30
22
Promedio de desviación de cada dato

-2
1
-1

0 1 5
2 3 4

( x  )  0
31
22
x1 xn
X
x2

Podríamos sumar las diferencias entre cada valor x y la media de los valores
x . Sin embargo, esto siempre daría cero. Por lo tanto,
elevamos al cuadrado la diferencia entre cada x y x, para eliminar las
negativas y resaltar los puntos singulares y después tomar las medias de los
resultados. Se define esto como la varianza

32
22
Varianza de la Población
Desviación cuadrática promedio con relación a la media de la
Población

2 
 ( x   ) 2

 N

2 x2   2
  N

33
22
Desviación Estándar de la Población
Raíz Cuadrada de la Varianza de la Población

(x  ) 2
   2 
N
x2
   2    2

N
34
22
Varianza de la Muestra

Desviación cuadrática promedio (n-1) con relación a la


media de la Muestra

2 (x  x)2
s 
n 1
x 2
nx 2

s 2 

n 1 n 1
35
22
Varianza de la Muestra
Desviación cuadrática promedio (n-1) con relación a la
media de la Muestra

2 (x  x)2
s 
n 1
x 2
nx 2

s 2 

n 1 n 1
36
22
Desviación Estándar de la Muestra

Raíz Cuadrada de la Varianza de la Muestra

2 (x  x) 2
s  s 
n 1

x 2
nx 2

s  s 2 

37
22
n 1 n 1
Varianza de la Población
Datos Agrupados

f (x  )2
 2 
N

2  f x 2
  2
  N
x  marca de
clase
38
22
Desviación Estándar de la Población
Datos Agrupados

f (x  ) 2
   2 
N
fx2
   2    2

N
x  marca de
clase
39
22
Varianza de la Muestra
Datos agrupados

2 f (x  x)2
s 
n 1
fx 2
nx 2

s 2 

n 1 n 1
x  marca de
clase
40
22
Desviación Estándar de la Muestra
Datos Agrupados

2 f (x  x)2
s  s 
n 1

fx 2
nx 2

s  s 2 

n 1 n 1
x  marca de
41
22 clase
Ejemplo Desviación Estándar
de Datos Agrupados
CLASE MARCA FRECUENCIA M X FREC. (Marca - Media)2 x Frecuencia
1-3 2 1 2 66.94 66.94
4-6 5 3 15 26.85 80.55
7-9 8 5 40 4.76 23.80
10 - 12 11 7 77 0.67 4.69
13 - 15 14 4 56 14.58 58.31
16 - 18 17 2 34 46.49 92.98
22 224 327.27

MEDIA 10.18 VARIANZA 15.584

DESV. ESTAND. 3.948

42
22
Comparación de Desviaciones Estándar

Datos A
Media = 15.5
s = 3.338
11 12 13 14 15 16 17 18 19 20
21
Datos B
Media = 15.5
11 12 13 14 15 16 17 18 19 20 s = .9258
21
Datos C
Media = 15.5

11 12 13 14 15 16 17 18 19 20 s = 4.57
21
43
22
Interpretación y usos de la Desviación Estándar

Teorema de Chebyshev: para cualquier conjunto de observaciones,


la proporción mínima de valores que está dentro de k desviaciones
estándar desde la media es al menos 1 - 1/k2 , donde k es una
constante mayor que 1.

44
22
Interpretación y usos de la Desviación Estándar

Regla empírica: para una distribución de frecuencias simétrica de


campana:
Cerca de 68% de las observaciones estará dentro de ±1σ de la media (μ); Cerca de

95% de las observaciones estará dentro de ±2σ de la media (μ);

Casi todas (alrededor de 99.7%) las observaciones estarán dentro de ±3σ de la media
(μ).

45
22
Curva de Distribución Normal

-3σ -2σ -1σ μ +1σ +2σ +3σ


46
22
34.13% 34.13%

13.60%
13.60%

2.135% 2.135%

0.135% 0.135%

-3σ -2 σ -1σ +1σ +2σ +3σ


μ

68.26%

95.46%

99.73%
47
22
Resultado Estándar

-3σ -2σ -1σ


μ +1σ +2σ +3σ

Re 
x  
48 
 
100 100
  20   20
x  80 x  160
¿ Re? ¿ Re?

-3σ -2σ -1σ


μ +1σ +2σ +3σ

80 100 160

80 100 160 100


Re   Re  20 
2
49 0 3
1
Dispersión Relativa

El coeficiente de variación es la razón de la desviación estándar a la


media aritmética, expresada como porcentaje:

s
CV  x (100%)

50
49
Ejemplo de Dispersión Relativa

Distribuci ón Distribuci ón
A x  10 B x  100
s2 s5

¿Cuál de las dos tiene menor dispersión?

51
49
Ejemplo de Dispersión Relativa

Distribución A Distribución B
5
2
CV  10 100  20% CV  100 100 
5%

La distribución B tiene menor dispersión

52
49
Coeficiente de Variación
NOTA: Las tablas que se presentan son
algunas propuestas que ayudan a la
interpretación del Coeficiente de Variación,
sin embargo es importante resaltar que esta
información es solo referencial, y la
interpretación en cada caso debe ser hecha
por el analista de la información, teniendo en
cuenta el proceso que se esta analizando.

53
49
Sesgo de una distribución

Positivament
Negativamente Simétrica e Sesgada
Sesgada

Media < Mediana < Moda Media = Mediana = Moda Moda < Mediana < Media

54
49
Coeficiente de asimetría
El coeficiente de asimetría de una distribución se define como:

Si | Sk |≥ 1 La distribución es altamente asimétrica

Si 0.5 < |Sk |< 1 La distribución es moderadamente asimétrica La


Si 0 < |Sk | 0.5 distribución es casi simétrica
Si Sk = 0 La distribución es simétrica

55
49
Summary Report for
Supp1 Anderson-Darling Normality Test
A-Squared 0.84
P-Value 0.029
Mean
599.55
StDev
0.62
Variance
0.38
Skewness -
0.082566
Kurtosis 0.7451
02
N 1
00
597.75 598.50 599.25 600.00 600.75 Minimum
597.80
1 st Quartile
599.20
Median
599.60
3rd Quartile
600.00
95% Confidence Intervals Maximum
601 .20
Mean 95% Confidence Interval for Mean
599.43 599.67
Median 95% Confidence Interval for Median
599.40 599.60
599.40 599.45 599.50 599.55 599.60 599.65 599.70
95% Confidence Interval for StDev
56
49 0.54 0.72

También podría gustarte