1

UCV/FACES/EAC
Estadísticas I
Medidas de Dispersión y Variabilidad
Prof. Leonardo Simmons
Prof. Leonardo Simmons Estadísticas I -05
2
PENSAMIENTO ESTADISTICO Y VARIABILIDAD
Según vimos anteriormente el pensamiento estadístico es la filosofía de
aprender y emprender acciones basada en los siguientes principios:
 Todo ocurre en un sistema de procesos interconectados
 La variación existe en todos los procesos
 Entender y reducir la variabilidad es la clave del éxito

Conclusión:
Estudiar, medir, entender y reducir la variabilidad de los procesos de negocio
de las empresas es vital para la salud éstas y por lo tanto se constituye en la
razón de ser de todo aquel que este a cargo de tales procesos.

Prof. Leonardo Simmons Estadísticas I -05
3
MEDIDAS DE VARIABILIDAD
Una medida de tendencia central (media, mediana, modo) representa a la
correspondiente distribución de datos de una variable y nos informa acerca
de la tendencia de la misma, sin embargo, estas medidas no nos informan
nada respecto a la variabilidad o dispersión existente entre los distintos
valores de la variable y la medida de tendencia.
Por ejemplo, las siguientes series de salarios en Bs. tiene igual media
aritmética:
Serie A: 2500, 2800, 3000, 3300, 3500 – Media = Bs. 3020
Serie B: 1000, 1500, 1600,4000, 7000 – Media = Bs. 3020
Sin embargo son bien distintas.

¿Cuan representativa es una media de tendencia central?
¿Cuál de dos o mas distribuciones de datos de una misma variable es mas o
menos dispersa respecto a una medida de tendencia central?
Prof. Leonardo Simmons Estadísticas I -05
4
MEDIDAS DE VARIABILIDAD
Las medidas de variabilidad tienen por objeto medir la magnitud de los
desvíos de los valores de la variable con respecto al valor central de la
distribución, o sea, las medidas de variabilidad definen cuan semejante o
cuan distinto son cada uno de los valores, de la variable con respecto al valor
central.
Las medidas de variabilidad son también medidas del grado de
representatividad de las medidas de tendencia central.
La variabilidad es la característica mas importante de la distribución, ya que
se constituye en un eficaz test de validación referido al nivel de significación
de las medidas de centralización
Las distintas medidas de variabilidad que estudiaremos serán:

• Rango Intercuartilico (Q)
• Coeficiente de Variación (CV)

• Rango o Recorrido (R)
• Desviación Media (D)
• Desviación Típica o Estándar (S , o)
• Varianza (S
2
, o
2
)

Prof. Leonardo Simmons Estadísticas I -05
5
MEDIDAS DE VARIABILIDAD – RANGO O RECORRIDO
Definición:
El recorrido o Rango de una variable es la diferencia entre sus valores
extremos:


Características del rango o recorrido:
• Solo suministra información de los extremos de la variable
• Informa sobre la distancia entre el mínimo y el máximo valor observado
• Se limita su uso a una información inicial


min max
X X R
x
÷ =
X
min
X
ma
x
R
x
Prof. Leonardo Simmons Estadísticas I -05
6
MEDIDAS DE VARIABILIDAD – DESVIACION MEDIA
Definición:
Es la media aritmética de los valores absolutos de las desviaciones entre los
valores de la variable y una medida de tendencia central. Entonces,
identificamos tres (3) posibles desviaciones medias:
• Desviación Media respecto a la Media:


• Desviación Media respecto a la Mediana:


• Desviación Media respecto al Modo:
n
f x x
D
k
i
i i
x
¿
=
÷
=
1
n
f M x
D
k
i
i e i
M
e
¿
=
÷
=
1
n
f M x
D
k
i
i o i
M
o
¿
=
÷
=
1
Prof. Leonardo Simmons Estadísticas I -05
7
x
1
x x ÷
1
x
k
x x
k
÷
x
MEDIDAS DE VARIABILIDAD – DESVIACION MEDIA
La Desviación Media da cuenta de la distancia promedio que existe entre los
valores de la variable (x
1
, x
2
, …..x
k
) y la medida de tendencia central, por
ejemplo la media aritmética
x
Prof. Leonardo Simmons Estadísticas I -05
8
Por ejemplo: Dada la siguiente distribución de frecuencia del precio de un
producto de consumo masivo (no regulado).
Bs Me Bs x 00 , 6 y 93 , 5 = =
MEDIDAS DE VARIABILIDAD – DESVIACION MEDIA
Precio (Bs) No.Ofertas
2 4 15,72 16,00
4 6 11,58 12,00
6 10 0,70 0,00
8 7 14,49 14,00
10 3 12,21 12,00
30 54,70 54,00
i i
f X x ÷
i e i
f M x ÷
Bs
n
f x x
D
k
i
i i
x
82 , 1
30
70 , 54
1
= =
÷
=
¿
=
Bs
n
f M x
D
k
i
i e i
M
e
80 , 1
30
00 , 54
1
= =
÷
=
¿
=
En promedio los precios distan en 1,82 Bs del precio promedio
Prof. Leonardo Simmons Estadísticas I -05
9
Otro ejemplo: Tres alumnos son sometidos a una competencia para probar sus conocimientos en 10
materias diferentes, cada una sustentada con 10 preguntas. La idea del concurso es encontrar al
alumno más idóneo para representar al colegio en un torneo a nivel nacional.
El número de preguntas buenas por materia se muestra a continuación:
MEDIDAS DE VARIABILIDAD – DESVIACION MEDIA
Materia Carlos Pedro Juan
1 2 7 5
2 9 2 6
3 10 2 5
4 2 6 5
5 3 6 5
6 1 3 5
7 9 6 4
8 9 7 5
9 1 6 6
10 4 5 4
SOLUCIÓN
Lo primero que analizaremos es la media de los puntajes para cada uno de los
alumnos, con el fin de determinar el alumno con mayor promedio de preguntas
buenas.

Las medias para los resultados de los alumnos coinciden: los tres alumnos tienen
responden en promedio 5 preguntas correctas por prueba. ¿Cuál sería entonces
el indicador diferenciador entre los alumnos?.

Complementemos el análisis anterior calculando la desviación media:

Carlos muestra una desviación media de 3,9 indicando que los datos se alejan en
promedio de la media en 3,9 preguntas buenas. Pedro disminuye su variación
(2,9), siendo Juan el que menos variación presenta con 0,9 preguntas tanto por
arriba como por debajo de la media aritmética. Se recomienda al colegio elegir
como ganador en este caso a Juan, presenta resultados más constantes que los
otros dos alumnos, Juan en promedio acierta 5 preguntas buenas con una
variación muy baja (rondando entre 4 y 6).
Prof. Leonardo Simmons Estadísticas I -05
10
MEDIDAS DE VARIABILIDAD – DESVIACION TIPICA
Definición:
La desviación típica o desviación estándar mide la dispersión de los
valores de una variable respecto a su media aritmética y se basa en la
propiedad de ésta que dice que:
- La suma de los cuadrados de los desvíos respecto de la media aritmética es
un mínimo, es decir:


Tomando esta propiedad en consideración calcularemos la desviación típica
o estándar de la población de una variable, a la cual denotaremos con la
letra o (sigma), con la siguiente expresión:




x C f C x f x x
k
i
i i
k
i
i i
= ¬ ÷ < ÷
¿ ¿
= =
) ( ) (
1
2
1
2
l poblaciona típica desviación
) (
1
2
N
f x
k
i
i x i
x
¿
=
÷
=
µ
o
Prof. Leonardo Simmons Estadísticas I -05
11
MEDIDAS DE VARIABILIDAD – DESVIACION TIPICA
Cuando estamos analizando una muestra a la desviación típica o estándar la
denotamos con la letra S y se determina con la siguiente expresión:



La desviación estándar es una medida del grado de dispersión de los datos
respecto al promedio. Dicho de otra manera, la desviación estándar es
simplemente el "promedio" o variación esperada con respecto de la media
aritmética.
Si S
x
 0 indica que los valores están cerca de la media (poca dispersión)
Si S
x
 +∞ indica que los valores están lejos de la media (mucha dispersión)
La desviación típica, al igual que la media y la varianza, es un índice muy
sensible a los valores extremos.
Nota: El término desviación estándar fue incorporado a la estadística por Karl Pearson en 1894.

muestral típica desviación
1
) (
1
2
÷
÷
=
¿
=
n
f x x
S
k
i
i i
x
Prof. Leonardo Simmons Estadísticas I -05
12
MEDIDAS DE VARIABILIDAD – DESVIACION TIPICA
Se demuestra que:
para la población



Y para la muestra:




2
1
2
x
k
i
i i
x
N
f x
µ o ÷ =
¿
=
1 ) 1 (
2
1
2
÷
÷
÷
=
¿
=
n
x
n n
f x
S
k
i
i i
x
Prof. Leonardo Simmons Estadísticas I -05
13
MEDIDAS DE VARIABILIDAD – DESVIACION TIPICA
Ejemplo: La siguiente tabla corresponde a la distribución de frecuencias de
una muestra de los espesores en pulgadas, de recipientes de acero
producidos por cierto proceso:
pulg 005 , 0
49
96 , 15
1 50
) 319 , 0 (
1
) (
1
2
1
2
= =
÷
÷
=
÷
÷
=
¿ ¿
= =
k
i
i i
k
i
i i
x
f x
n
f x x
S
Espesores en pulg No.Piezas x xf (x-Media)
2
f
0.306 - 0.310 3 0,308 0,924 0,0004
0.310 - 0.314 5 0,312 1,560 0,0003
0.314 - 0.318 5 0,316 1,580 0,0001
0.318 - 0.322 22 0,320 7,040 0,0000
0.322 - 0.326 14 0,324 4,536 0,0003
0.326 - 0.330 1 0,328 0,328 0,0001
50 15,968 0,0011
El proceso produce una pieza de espesor promedio 0,319 pulgadas con una
variación de 0,005 pulgadas
Prof. Leonardo Simmons Estadísticas I -05
14
MEDIDAS DE VARIABILIDAD – VARIANZA
Definición:
Definimos varianza a la media de los cuadrados de las desviaciones respecto
a la media, es decir, la varianza es el cuadrado de la desviación típica, por lo
tanto:






En el ejemplo anterior:
S
2
x
= (0,005 pulg)
2
= 0,000025 pulg
2

Muestral) (Varianza
1
) (
) (
l) Poblaciona (Varianza
) (
) (
1
2
2
1
2
2
÷
÷
= =
÷
= =
¿
¿
=
=
n
f x x
S x Var
N
f x
x Var
k
i
i i
x
k
i
i x i
x
µ
o
Prof. Leonardo Simmons Estadísticas I -05
15
PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA
1. La desviación típica y la varianza de una variable son estadísticos
positivos, es decir, S
x
> 0 y Var(x) = S
2
x
> 0
2. la varianza de una constante por una variable es igual al cuadrado de la
constante por la varianza de la variable, es decir:
Var(cX) = c
2
Var(X) = c
2
S
2
x
En consecuencia la desviación típica de una constante por una variable
será:
S
cx
= \c\S
x
3. La varianza de la suma de una variable más una constante es igual a la
varianza de la variable, es decir:
Var(X + c) = Var(X) = S
2
x

En consecuencia: S
x+c
= S
x
Nota: La varianza de una constante es igual a cero; Var(C) = 0
Prof. Leonardo Simmons Estadísticas I -05
16
PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA
4. Si x ʌ y son variables estadísticamente independientes entonces:
4. Var (x ± y) = Var (x) + Var (y) = S
2
x
+ S
2
y
, por lo tanto
5.


6. Var (ax + by+ c) = a
2
Var(x)+b
2
Var(y)= a
2
S
2
x
+ b
2
S
2
y
, por lo tanto:



5. Si x ʌ y son variables que no son estadísticamente independientes
entonces:
Var(x±y) = Var(x) + Var(y) ± 2Cov(x,y), donde Cov(x,y) es la Covarianza
(*) entre x ʌ y mide la magnitud de la asociación entre las dos variables y
se determina por:
y x
y x
S S S
2 2
+ =
±
y x
c by ax
S b S a S
2 2 2 2
+ =
+ +
Prof. Leonardo Simmons Estadísticas I -05
17
PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA
muestral) a (Covarianz
1
) )( (
) , (
l) Poblaciona a (Covarianz
) )( (
) , (
1
1
÷
÷ ÷
= =
÷ ÷
= =
¿
¿
=
=
n
y y x x
S y x Cov
N
y x
y x Cov
k
i
xy
k
i
y x
xy
µ µ
o
Nota (*): El concepto de covarianza se ampliará cuando abordemos el tema de las medidas de
asociación entre dos variables
5. Si y S
1
2
, S
2
2
,…S
r
2
representan las medias aritméticas y las
varianzas de r muestras de tamaño n
1
, n
2
, …n
r
de la misma variable
entonces la varianza de la unión de las r-muestras será la media de las
varianzas más la varianza de las medias, es decir:
r
X X X ,.... ,
2 1
¿
¿ ¿
=
= =
=
÷
+ =
r
i
i
r
i
i i
r
i
i
n n
n
X X n
n
S n
S
i
1
1
2
1
2
2
donde
) (
Prof. Leonardo Simmons Estadísticas I -05
18
PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA
Si las r-muestras fuesen del mismo tamaño entonces:

) (
1
2
1
2
2
r
X X
r
S
S
r
i
i
r
i
i
¿ ¿
= =
÷
+ =
Si las r-muestras fuesen del mismo tamaño y tuviesen la misma media entonces:

r
S
S
r
i
i
¿
=
=
1
2
2
Prof. Leonardo Simmons Estadísticas I -05
19
PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA
Ejemplo (1): Hallar la media del número de establecimientos hoteleros que
hay en las distintas Comunidades Autónomas de España. Después, con ayuda
de la desviación típica, comenta si esta media es representativa de todas las
comunidades autónomas.

CC.AA. Nº establecimientos
hoteleros
Andalucía 2.266
Aragón 712
Asturas (Principado de) 620
Baleares (Islas) 1.483
Canarias 532
Cantabria 496
Castilla y León 1.452
Castilla-La Mancha 842
Cataluña 2.713
Comunidad Valenciana 1.019
Extremadura 418
Galicia 1.526
Madrid (Comunidad de) 1.242
Murcia (Región de) 209
Navarra (C. Foral de) 150
País Vasco 396
Rioja (La) 117
Ceuta y Melilla 36
ientos Establecim 14 , 731
N
) x - (x
ientos Establecim 902
18
1 i
2
i
x
18
1
= =
= =
¿
¿
=
=
o
µ
N
x
i
i
x
Se trata de la población de establecimientos en España
distribuido en las 18 Comunidades Autónomas de ese país,
luego:

Como la desviación típica es muy alta, esto me indica que los
datos reales se diferencian mucho de la media, luego el dato de
la media no es representativo.
Prof. Leonardo Simmons Estadísticas I -05
20
TEOREMA DE CHEBYSHEV
Teorema de Chebyshev (Desigualdad de Chebyshev):
Para cualquier distribución estadística de datos de una variable (muestra o
población), la proporción (µ) mínima de los valores que se encuentran dentro
de k desviaciones estándares desde la media es al menos 1 – 1/k
2
, donde k
es una constante mayor que 1.
X
o µ k
x
÷ o µ k
x
+
x
µ
µ ≤ 1-1/k
2
K>1
P.ej: La distribución de contribuciones al SSO tiene media Bs. 51.54 y desviación
estándar Bs. 7.51; ¿Qué porcentaje de contribuyentes como mínimo aportan entre la
media más o menos 3.5 veces la desviación:
1-1/k
2
= 1 – 1/(3.5)
2
=0.92 o sea 92%
Prof. Leonardo Simmons Estadísticas I -05
21
REGLA EMPIRICA
Regla Empírica o Regla Normal:
Para distribuciones simétricas o en forma de “campana” (Normales), se
cumple que:
X
o µ ÷
x
o µ +
x
x
µ
68% de los datos
X
o µ 2 ÷
x
o µ 2 +
x
x
µ
95% de los datos
X
o µ 3 ÷
x
o µ 3 +
x
x
µ
99,7% de los datos
Prof. Leonardo Simmons Estadísticas I -05
22
MEDIDAS DE VARIABILIDAD – RANGO INTERCUARTIL
Definición:
El rango intercuartil es una medida de variabilidad adecuada cuando la
medida de posición central empleada ha sido la mediana y él se define como
la diferencia entre el Tercer Cuartil (Q
3
) y el Primer Cuartil (Q
1
), es
decir: R
Q
= Q
3
- Q
1





A la mitad del rango intercuartil se le conoce como Desviación Cuartil
(D
Q
):
D
Q
= R
Q
/2= (Q
3
- Q
1
)/2


Q
1
25% 25%
Q
2
Q
3
50%
Prof. Leonardo Simmons Estadísticas I -05
23
DIAGRAMA DE CAJA
El Rango Intercuartil se usa para construir los Diagramas de Caja que
sirven para visualizar la variabilidad de una variable y comparar distribuciones
de la misma variable; además de ubicar valores extremos:
X
max
X
min
Q
3
Q
1
Q
2
Q
3
+1.5 R
Q
Q
1
-1.5 R
Q
x
Dist. A Dist. B Dist. C
Prof. Leonardo Simmons Estadísticas I -05
24
DIAGRAMA DE CAJA
Distribución simétrica o en forma de “campana”
(Normal), se cumple que:
|X
min
-Q
1
| =|X
max
-Q
3
|
|Q
2
-Q
1
| =|Q
2
-Q
3
|
Q
2
= X
Distribución asimétrica negativa se cumple que:
X < Q
2
=M
e
< M
o
Distribución asimétrica positiva se cumple que:
X > Q
2
=M
e
> M
o
Prof. Leonardo Simmons Estadísticas I -05
25
COEFICIENTE DE DE VARIACION
Definición:

El coeficiente de variación permite comparar la dispersión entre dos
poblaciones distintas e incluso, comparar la variación producto de dos
variables diferentes (que pueden provenir de una misma población).

Estas variables podrían tener unidades diferentes, por ejemplo, podremos
determinar si los datos tomados al medir el volumen de llenado de un envase
de cierto líquido varían más que los datos tomados al medir la temperatura
de el liquido contenido en el envase al salir al consumidor. El volumen los
mediremos en centímetros cúbicos y la temperatura en grados centígrados.

El coeficiente de variación elimina la dimensionalidad de las variables y tiene
en cuenta la proporción existente entre una medida de tendencia y la
desviación típica o estándar.
Prof. Leonardo Simmons Estadísticas I -05
26
COEFICIENTE DE VARIACION
Coeficiente de variación (Cv): Equivale a la razón entre la media aritmética y
la desviación típica o estándar.



Si envés de la media aritmética se emplea la mediana, obtendremos el
coeficiente de variación mediana:



P.ej: se han tomado los pesos y las estaturas de los alumnos de una sección
hallándose que:
X = 68 Kg , S
x
= 8 Kg; y = 1,70 mts, S
y
= 0,61 mts
¿en cuál de los dos aspectos los estudiantes son más homogéneos?

CVx = 8/68*100=11,7% mientras que CVy = 0,61/1,70*100 = 39,5%
Hay mayor homogeneidad (menor variación) en los pesos
100 × =
X
S
CV
x
x
100 × =
e
x
x
M
S
CV
e M
Prof. Leonardo Simmons Estadísticas I -05
27
TIPIFICACION DE VARIABLES
Sea X la variable que toma los valores X
1
, X
2
, …..X
k
, de media X y desviación
estándar S
x
entonces si tomamos cualquier valor de X, digamos X
i
, la
diferencia de dicho valor con la media (X
i
- X ) mide la distancia entre estos
dos valores y si dividimos tal diferencia entre la desviación típica,
obtendremos las cantidad de desviación típicas que dista X
i
de la media. Si
definimos la variable Z como:




Se demuestra que Z = 0 y S
z
= 1 independientemente de los estadísticos de
la variable X.
A la variable Z la llámanos variable estandarizada o tipificada y se cumple que
Z no tiene unidades y siempre Z = 0 y S
z
= 1 y Z pertenece a (- ·, +· )

....k i
S
X X
Z
x
i
1 ; =
÷
=
Z= (X-X)/S
x X, X, S
x

Z, Z=0, S
z
=1
Tipificación
Prof. Leonardo Simmons Estadísticas I -05
TIPIFICACION DE VARIABLES
X
1
X
2
X
k
X
Z
1
=(X
1
-X)/S
x
Z
2
=(X
2
-X)/S
x
Z
1
Z
2
Z=0

Z=(X

- X)/S
x
=0

÷ · +·
Z
k
=(X
k
-X)/S
x
X

z

Prof. Leonardo Simmons Estadísticas I -05
29
TIPIFICACION DE VARIABLES
La interpretación de Z es como sigue:
• Si Z
1
= 1,2 indicaría que X
1
es 1,2 desviaciones típicas mayor que la media de
X; es decir si X
i
> X entonces Z
i
> 0
• Si Z
1
= -0.5 indicaría que X
1
esta a 0,5 o ½ desviaciones típicas a la izquierda
de la media de X; es decir si X
i
< X entonces Z
i
< 0
• El valor tipificado o estandarizado de la media de la variable siempre será o
cero:

0 =
÷
=
x
x
S
X X
Z
Prof. Leonardo Simmons Estadísticas I -05
30
TIPIFICACION DE VARIABLES
Uso de la Tipificación o Estandarización:
P.ej.: Dos estudiantes uno de Contaduría (A) y el otro de Administración (B) obtienen
las siguientes notas:
A: 12 ptos en Auditoria
B: 14 Ptos en Investigación de Operaciones
Los estadísticos para las clases respectivas fueron:
Clase de A: Nota promedio de Auditoría X
A
= 13 ptos con S
A
= 6 ptos
Clase de B: Nota promedio de IO X
B
= 15 ptos con S
B
= 5 ptos

Evidentemente no se pueden comparar directamente las notas de los dos estudiantes
porque el rendimiento de sus respectivas clases es diferente. La comparación habrá de
hacerse a través de la variable tipificada:
Para A: ZA = (12 - 13)/6 = 1/6
Para B: ZB = (14 – 15)/5 = -1/5




Se aprecia que la calificación del alumno A es mejor en relación a su clase, que la del
alumno B en relación a la suya
0 -1 -2 -3 3 2 1
Z
A
=1/5
Z
B
=-1/6
z
Prof. Leonardo Simmons Estadísticas I -05
31
TIPIFICACION DE VARIABLES

P.ej.: Una empresa que posee una fabrica en el país A y otra en B ha realizado una
encuesta relativa al porcentaje que de su sueldo gastan sus empleados por concepto
de alimentación, obteniéndose los siguientes datos:






El porcentaje reportado por los gerentes de producción de ambos países fueron:
Gte. Producción A: 32%
Gte. Producción B: 42%

Respecto a la realidad económica de cada país, cual de ellos se podría decir que gasta
menos en alimentación?

Tratándose de realidades distintas, la comparación habrá de hacerse a través de la
variable tipificada:
Para país A: Z = (42 - 30)/12 = 1
Para país B: Z = (32 – 20)/6 = 2
País Media Desv. Típica
A 20% 6%
B 30% 12%
Prof. Leonardo Simmons Estadísticas I -05
32
TIPIFICACION DE VARIABLES

Se aprecia que el gerente del país A, no obstante las apariencias numéricas, en
proporción gasta menos en alimentación respecto a la realidad económica de su país
que lo que gasta el gerente del país B respecto a la suya
0 -1 -2 -3 3 2 1
GTE. País A
Z=2
GTE. País B
Z=1
Realidad
Económica
Media
z
Prof. Leonardo Simmons Estadísticas I -05
33
DETECCION DE VALORES ATIPICOS CON Z

SI UNA DISTRIBUCIÓN ES APROXIMADAMENTE “Normal” entonces según la
regla empírica aproximadamente el 99.7% de los datos están comprendidos
en el intervalo µ
x
±3o
x
por lo tanto en la escala estandarizada (Z) ese
intervalo se convierte en [-3, 3]. Luego todo valor de X cuyo valor
estandarizado este fuera del anterior intervalo se puede considerar atipico.

0 -1 -2 -3 3 2 1
z
Atípicos
Atípicos
Prof. Leonardo Simmons Estadísticas I -05
34
MEDIDAS DE ASIMETRIA
Definición:

Además de la posición (tendencia) y la dispersión de un conjunto de datos, es
común usar medidas de forma en la descripción. Una de estas medidas es
una estadística que busca expresar la simetría ( o falta de ella ) que
manifiestan los datos, denominada coeficiente de asimetría.

Para saber si una distribución de frecuencias es simétrica, hay que precisar
con respecto a qué. Un buen candidato es la mediana ya que divide a la
distribución de frecuencias en dos partes de igual área (50-50). Podemos
basarnos en ella para, de forma natural, decir que una distribución de
frecuencias es simétrica si el lado derecho de la gráfica (histograma o
polígono de frecuencias (a partir de la mediana) es la imagen por un espejo
del lado izquierdo
Prof. Leonardo Simmons Estadísticas I -05
35
MEDIDAS DE ASIMETRIA
Coeficiente de Asimetría basado en los tres cuartiles (Yule-Bowley) :
Si una distribución es simétrica, es claro que deben haber tantas
observaciones entre la que deja por debajo de sí las tres cuartas partes de la
distribución y la mediana, como entre la mediana y la que deja por debajo de
sí un quarto de todas las observaciones. De forma abreviada esto es,
Q
3
– Q
2
= Q
2
– Q
1
Una pista para saber si una distribución de frecuencias es asimétrica positiva
es cuando:
Q
3
– Q
2
> Q
2
– Q
1

Prof. Leonardo Simmons Estadísticas I -05
36
MEDIDAS DE ASIMETRIA
Por analogía, si es asimétrica negativa, se tendrá:

Q
3
– Q
2
< Q
2
– Q
1


Para quitar dimensionalidad al problema, utilizamos como índice de asimetría
la cantidad:





Coeficiente de Asimetría basado en el momento central de tercer
orden:
Si la distribución fuese asimétrica positiva, las cantidades , con p
impar positivas estarían muy aumentadas al elevarse a p. Esta propiedad nos
indica que un índice de asimetría posible consiste en tomar p=3 y definir:

1 1
2 2
1 2 3
1 3
1 2 3
+ s s ÷
+ ÷
=
÷
+ ÷
=
Q
Q
Q
A
R
Q Q Q
Q Q
Q Q Q
A
) (
p
i
X X ÷
Prof. Leonardo Simmons Estadísticas I -05
37
MEDIDAS DE ASIMETRIA






Apoyándonos en este índice, diremos que hay asimetría positiva si A
3
>0, y
que la asimetría es negativa si A
3
<0.

Otros Coeficientes de Asimetría:
Basándonos en que si una distribución de frecuencias es simétrica y
unimodal, entonces la media, la mediana y la moda coinciden, podemos
definir otras medidas de asimetría, como:

ó

Diremos que hay asimetría positiva si A>0 y negativa si A<0

1 1 ,
) (
3
3
1
3
3
+ s s ÷
÷
=
¿
=
A
S
n
X X
A
x
k
i
i


x
o
S
M X
A
÷
=


) ( 3
x
e
S
M X
A
÷
=
Prof. Leonardo Simmons Estadísticas I -05
38
MEDIDAS DE ASIMETRIA
P.ej: Los días-calle de la población de cuentas x cobrar de una firma se
distribuyen de la siguiente forma:







Días No.Cuentas x F
7 -- 9 4 8 4
9 -- 11 18 10 22
11 -- 12 14 11,5 36
12 -- 13 27 12,5 63
13 -- 14 42 13,5 105
14 -- 15 31 14,5 136
15 -- 17 20 16 156
17 -- 19 1 18 157
157
µ
x
= 13,15 días
o
x
= 1,94 días
M
e
= Q
2
=13,4 días
Q
1
= 12,1 días
Q
3
=14,4 días

Lo que nos dice que aproximadamente en un rango
de (Q
3
-Q1) = 14,4-12,1 = 2,3 días se encuentra el
50% central del total de observaciones. Además:
A
Q
= -0,09
Este resultado nos indica que existe una ligera
asimetría a la izquierda (negativa). Un resultado
similar se obtiene si observamos que la distribución
de frecuencias es unimodal, siendo M
o
= 13,6 días y


0,21 ÷ =
÷
=
x
o x
M
A
o
µ
Prof. Leonardo Simmons Estadísticas I -05
39
MEDIDAS DE FORMA – KURTOSIS (CURTOSIS)
Definición:

En estadística, la Kurtosis (Curtosis) es una medida de lo
"picudo"(concentrada en torno a la media) de la distribución de frecuencia de
una variable cuantitativa. Una mayor curtosis implica que la mayor parte de la
varianza (variación) es debida a desviaciones infrecuentes en los extremos,
que se oponen a desviaciones comunes de medidas menos pronunciadas.

La curtosis se determinará a partir del momento central de cuarto orden, esto
es :



Se cumple que:
Si K < 0, la distribución es menos apuntada de lo “normal” –Platicúrtica
Si K = 0, la distribución tiene un apuntamiento “normal” – Mesocúrtica
Si k > 0, la distribución es más apuntada de lo “normal” - Leptocúrtica
4
) ( X X
i
÷
3
) (
4
1
4
÷
÷
=
¿
=
x
k
i
i i
nS
f X X
k
Prof. Leonardo Simmons Estadísticas I -05
40
MEDIDAS DE FORMA – KURTOSIS (CURTOSIS)
Curtosis Negativa Curtosis nula Curtosis Positiva
Platicúrtica


Mesocúrtica


Leptocúrtica


En el ejemplo de los días-calle de la población de cuentas x cobrar de una
firma, el calculo de la curtosis resulta igual a:

K = +0,094 lo que implica que dicha distribución tiene un apuntamiento casi
normal.
Prof. Leonardo Simmons Estadísticas I -05
41
TAREA No.5
1. Tómese unos minutos de su tiempo y lea detenidamente el siguiente
articulo: VARIACIÓN, GERENCIA, Y EL DR. W. EDWARDS DEMING
Por: Brian L. Joiner y Marie A. Gaudard.
JOINER ASSOCIATES INC.
Quality Progress, Diciembre de 1990.
Compilación, desarrollo y traducción libre: por Rogelio Carrillo Penso
http://sev.cuao.edu.co/mipymes/Documentos/Calidad/VariacionGerenciayDeming.pdf

2. Ingrese a la página de la Fundación Polar y lea los fascículos 20 y 21 de
la serie El Mundo de Las Matemáticas, que trata de la variabilidad
estadística:
http://www.fundacionempresaspolar.org/matematica2/index.html

3. Resolver del libro Estadística para Administración y Economía – Anderson
– 8va. Edición , capitulo 3, los ejercicios del 15 al 26 (pag. 88 al 89); 31
al 37 (pag. 94 al 95); 42 al 46 (pag.98 al 99)

PENSAMIENTO ESTADISTICO Y VARIABILIDAD
Según vimos anteriormente el pensamiento estadístico es la filosofía de aprender y emprender acciones basada en los siguientes principios:

 Todo ocurre en un sistema de procesos interconectados
 La variación existe en todos los procesos  Entender y reducir la variabilidad es la clave del éxito Conclusión: Estudiar, medir, entender y reducir la variabilidad de los procesos de negocio de las empresas es vital para la salud éstas y por lo tanto se constituye en la razón de ser de todo aquel que este a cargo de tales procesos.

2
Prof. Leonardo Simmons Estadísticas I -05

MEDIDAS DE VARIABILIDAD
Una medida de tendencia central (media, mediana, modo) representa a la correspondiente distribución de datos de una variable y nos informa acerca de la tendencia de la misma, sin embargo, estas medidas no nos informan nada respecto a la variabilidad o dispersión existente entre los distintos valores de la variable y la medida de tendencia. Por ejemplo, las siguientes series de salarios en Bs. tiene igual media aritmética:

Serie A: 2500, 2800, 3000, 3300, 3500 – Media = Bs. 3020
Serie B: 1000, 1500, 1600,4000, 7000 – Media = Bs. 3020 Sin embargo son bien distintas.

¿Cuan representativa es una media de tendencia central? ¿Cuál de dos o mas distribuciones de datos de una misma variable es mas o menos dispersa respecto a una medida de tendencia central?
3
Prof. Leonardo Simmons Estadísticas I -05

MEDIDAS DE VARIABILIDAD
Las medidas de variabilidad tienen por objeto medir la magnitud de los desvíos de los valores de la variable con respecto al valor central de la distribución, o sea, las medidas de variabilidad definen cuan semejante o cuan distinto son cada uno de los valores, de la variable con respecto al valor central. Las medidas de variabilidad son también medidas representatividad de las medidas de tendencia central. del grado de

La variabilidad es la característica mas importante de la distribución, ya que se constituye en un eficaz test de validación referido al nivel de significación de las medidas de centralización
Las distintas medidas de variabilidad que estudiaremos serán: • • • • Rango o Recorrido (R) Desviación Media (D) Desviación Típica o Estándar (S , s) Varianza (S2 , s2) • Rango Intercuartilico (Q) • Coeficiente de Variación (CV)

4
Prof. Leonardo Simmons Estadísticas I -05

Leonardo Simmons Estadísticas I -05 .MEDIDAS DE VARIABILIDAD – RANGO O RECORRIDO Definición: El recorrido o Rango de una variable es la diferencia entre sus valores extremos: Rx  X m ax  X m in Características del rango o recorrido: • Solo suministra información de los extremos de la variable • Informa sobre la distancia entre el mínimo y el máximo valor observado • Se limita su uso a una información inicial Rx Xmin Xma x 5 Prof.

Entonces. Leonardo Simmons .MEDIDAS DE VARIABILIDAD – DESVIACION MEDIA Definición: Es la media aritmética de los valores absolutos de las desviaciones entre los valores de la variable y una medida de tendencia central. identificamos tres (3) posibles desviaciones medias: • Desviación Media respecto a la Media: Dx  • Desviación Media respecto a la Mediana:  x x f i 1 i k i n DM e  • Desviación Media respecto al Modo:  x M i 1 i k e fi n DM o   x M i 1 i k o fi n 6 Estadísticas I -05 Prof.

MEDIDAS DE VARIABILIDAD – DESVIACION MEDIA x1 x x1  x xk  x xk La Desviación Media da cuenta de la distancia promedio que existe entre los valores de la variable (x1. ….xk) y la medida de tendencia central. por ejemplo la media aritmética x 7 Estadísticas I -05 Prof.. x2. Leonardo Simmons .

49 12.58 0.Ofertas 4 6 10 7 3 30 xi  X fi xi  M e f i 16.70 54. Leonardo Simmons Estadísticas I -05 .00 Bs Dx  54.00 12.00 12.93 Bs y Me  6.82 Bs del precio promedio i 1  x x f i k i   x M i k e fi 8 Prof.21 54.00 54.72 11.00  1.82 Bs DM e  i 1   1.70 14.00 14.80 Bs n 30 n 30 En promedio los precios distan en 1. Precio (Bs) 2 4 6 8 10 No.00 15.MEDIDAS DE VARIABILIDAD – DESVIACION MEDIA Por ejemplo: Dada la siguiente distribución de frecuencia del precio de un producto de consumo masivo (no regulado).00 0.70 x  5.

cada una sustentada con 10 preguntas. Pedro disminuye su variación (2.9 preguntas tanto por arriba como por debajo de la media aritmética.MEDIDAS DE VARIABILIDAD – DESVIACION MEDIA Otro ejemplo: Tres alumnos son sometidos a una competencia para probar sus conocimientos en 10 materias diferentes.9 indicando que los datos se alejan en promedio de la media en 3. Juan en promedio acierta 5 preguntas buenas con una variación muy baja (rondando entre 4 y 6). El número de preguntas buenas por materia se muestra a continuación: SOLUCIÓN Lo primero que analizaremos es la media de los puntajes para cada uno de los alumnos. La idea del concurso es encontrar al alumno más idóneo para representar al colegio en un torneo a nivel nacional. Complementemos el análisis anterior calculando la desviación media: Carlos muestra una desviación media de 3.9). 9 Prof. Se recomienda al colegio elegir como ganador en este caso a Juan.9 preguntas buenas. ¿Cuál sería entonces el indicador diferenciador entre los alumnos?. con el fin de determinar el alumno con mayor promedio de preguntas buenas. presenta resultados más constantes que los otros dos alumnos. siendo Juan el que menos variación presenta con 0. Leonardo Simmons Estadísticas I -05 Materia Carlos Pedro Juan 1 2 7 5 2 9 2 6 3 10 2 5 4 2 6 5 5 3 6 5 6 1 3 5 7 9 6 4 8 9 7 5 9 1 6 6 10 4 5 4 . Las medias para los resultados de los alumnos coinciden: los tres alumnos tienen responden en promedio 5 preguntas correctas por prueba.

MEDIDAS DE VARIABILIDAD – DESVIACION TIPICA Definición: La desviación típica o desviación estándar mide la dispersión de los valores de una variable respecto a su media aritmética y se basa en la propiedad de ésta que dice que: .La suma de los cuadrados de los desvíos respecto de la media aritmética es un mínimo. con la siguiente expresión: sx  Prof. a la cual denotaremos con la letra s (sigma). Leonardo Simmons  (x   ) i 1 i x k 2 fi desviación típica poblacional 10 Estadísticas I -05 N . es decir: ( xi  x ) 2 f i   ( xi  C ) 2 f i  C  x  i 1 i 1 k k Tomando esta propiedad en consideración calcularemos la desviación típica o estándar de la población de una variable.

es un índice muy sensible a los valores extremos. Si Sx  0 indica que los valores están cerca de la media (poca dispersión) Si Sx  +∞ indica que los valores están lejos de la media (mucha dispersión) La desviación típica.MEDIDAS DE VARIABILIDAD – DESVIACION TIPICA Cuando estamos analizando una muestra a la desviación típica o estándar la denotamos con la letra S y se determina con la siguiente expresión: Sx   (x  x) i 1 i k 2 fi desviación típica muestral n 1 La desviación estándar es una medida del grado de dispersión de los datos respecto al promedio. Leonardo Simmons Estadísticas I -05 . la desviación estándar es simplemente el "promedio" o variación esperada con respecto de la media aritmética. Nota: El término desviación estándar fue incorporado a la estadística por Karl Pearson en 1894. Dicho de otra manera. 11 Prof. al igual que la media y la varianza.

Leonardo Simmons Estadísticas I -05 .MEDIDAS DE VARIABILIDAD – DESVIACION TIPICA Se demuestra que: para la población sx  Y para la muestra:  xi fi 2 i 1 k N  x 2 Sx   xi fi 2 k x2 i 1  n(n  1) n  1 12 Prof.

306 .319 pulgadas con una variación de 0.0001 0.318 .005 pulg 49 El proceso produce una pieza de espesor promedio 0. de recipientes de acero producidos por cierto proceso: Espesores en pulg No.322 .308 0.316 0.326 .310 0.328 xf 0.312 0.MEDIDAS DE VARIABILIDAD – DESVIACION TIPICA Ejemplo: La siguiente tabla corresponde a la distribución de frecuencias de una muestra de los espesores en pulgadas.005 pulgadas 13 Prof.96  0.0001 0.0003 0.0011 2 Sx   (x  x) i 1 i k 2 fi n 1   ( x  0.0004 0.330 3 5 5 22 14 1 50 k x 0.320 0.040 4.0.324 0.Piezas 0.0003 0.326 0.328 15.0000 0. Leonardo Simmons Estadísticas I -05 .0.319) i 1 i 2 fi 50  1  15.0.0.924 1.318 0.580 7.310 .0.314 .0.560 1.968 (x-Media) f 0.322 0.314 0.536 0.

MEDIDAS DE VARIABILIDAD – VARIANZA Definición: Definimos varianza a la media de los cuadrados de las desviaciones respecto a la media. por lo tanto: Var( x)  s 2 x   (x   ) i 1 i x k 2 fi (Varianza Poblacional) N ( xi  x ) 2 f i  i 1 k Var( x)  S 2 x  En el ejemplo anterior: n 1 (Varianza Muestral) S2x = (0. la varianza es el cuadrado de la desviación típica.005 pulg)2 = 0. Leonardo Simmons Estadísticas I -05 .000025 pulg2 14 Prof. es decir.

La varianza de la suma de una variable más una constante es igual a la varianza de la variable. es decir. la varianza de una constante por una variable es igual al cuadrado de la constante por la varianza de la variable. La desviación típica y la varianza de una variable son estadísticos positivos. Leonardo Simmons Estadísticas I -05 . Sx > 0 y Var(x) = S2x > 0 2.PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA 1. es decir: Var(X + c) = Var(X) = S2x En consecuencia: Sx+c= Sx Nota: La varianza de una constante es igual a cero. es decir: Var(cX) = c2Var(X) = c2S2x En consecuencia la desviación típica de una constante por una variable será: Scx = \c\Sx 3. Var(C) = 0 15 Prof.

S x y  S 2 x  S 2 y 6. Var (ax + by+ c) = a2Var(x)+b2Var(y)= a2S2x + b2S2y . Si x ʌ y son variables estadísticamente independientes entonces: 4.y).y) es la Covarianza (*) entre x ʌ y mide la magnitud de la asociación entre las dos variables y se determina por: Prof. por lo tanto 5. Var (x ± y) = Var (x) + Var (y) = S2x + S2y . por lo tanto: Saxby c  a 2 S 2 x  b 2 S 2 y 5.PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA 4. donde Cov(x. Si x ʌ y son variables que no son estadísticamente independientes entonces: Var(x±y) = Var(x) + Var(y) ± 2Cov(x. Leonardo Simmons 16 Estadísticas I -05 .

. X 2 .. …nr de la misma variable entonces la varianza de la unión de las r-muestras será la media de las varianzas más la varianza de las medias.. y )  S xy  5. X r y S12.PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA Cov( x.…Sr2 representan las medias aritméticas y las varianzas de r muestras de tamaño n1. es decir: S2   ni S i i 1 r 2 n  ni ( X i  X ) 2  i 1 r n donde n   ni i 1 r 17 Prof.. n2. S22. Si  ( x  x )( y  y ) i 1 k Nota (*): El concepto de covarianza se ampliará cuando abordemos el tema de las medidas de asociación entre dos variables n 1 (Covarianza muestral) X 1 . y )  s xy   ( x   )( y   i 1 x k y ) (Covarianza Poblacional) N Cov( x. Leonardo Simmons Estadísticas I -05 .

Leonardo Simmons Estadísticas I -05 .PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA Si las r-muestras fuesen del mismo tamaño entonces: S2  S i 1 r 2 i r  (X i 1 r i  X )2 r Si las r-muestras fuesen del mismo tamaño y tuviesen la misma media entonces: S2  S i 1 r 2 i r 18 Prof.

x) i N  731.713 Comunidad Valenciana 1. comenta si esta media es representativa de todas las comunidades autónomas. Nº establecimientos hoteleros Andalucía 2.PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA Ejemplo (1): Hallar la media del número de establecimientos hoteleros que hay en las distintas Comunidades Autónomas de España. Después.483 Canarias 532 Cantabria 496 Castilla y León 1. 19 Prof.242 Murcia (Región de) 209 Navarra (C. luego: x  x i 1 18 i N 18 i 1  902 Establecimientos 2 sx   (x . CC. con ayuda de la desviación típica. Leonardo Simmons Estadísticas I -05 . Foral de) 150 País Vasco 396 Rioja (La) 117 Ceuta y Melilla 36 Se trata de la población de establecimientos en España distribuido en las 18 Comunidades Autónomas de ese país. luego el dato de la media no es representativo.526 Madrid (Comunidad de) 1.019 Extremadura 418 Galicia 1.14 Establecimientos Como la desviación típica es muy alta. esto me indica que los datos reales se diferencian mucho de la media.AA.452 Castilla-La Mancha 842 Cataluña 2.266 Aragón 712 Asturas (Principado de) 620 Baleares (Islas) 1.

5)2=0. Leonardo Simmons Estadísticas I -05 .5 veces la desviación: 1-1/k2 = 1 – 1/(3. donde k es una constante mayor que 1. la proporción (r) mínima de los valores que se encuentran dentro de k desviaciones estándares desde la media es al menos 1 – 1/k2. ¿Qué porcentaje de contribuyentes como mínimo aportan entre la media más o menos 3. 51.54 y desviación estándar Bs. 7.51.TEOREMA DE CHEBYSHEV Teorema de Chebyshev (Desigualdad de Chebyshev): Para cualquier distribución estadística de datos de una variable (muestra o población). r ≤ 1-1/k2 K>1  x  ks x  x  ks X P.92 o sea 92% 20 Prof.ej: La distribución de contribuciones al SSO tiene media Bs.

se cumple que: 68% de los datos 99.7% de los datos x  s x x  s X  x  3s x  x  3s X 95% de los datos  x  2s x  x  2s X 21 Prof. Leonardo Simmons Estadísticas I -05 .REGLA EMPIRICA Regla Empírica o Regla Normal: Para distribuciones simétricas o en forma de “campana” (Normales).

MEDIDAS DE VARIABILIDAD – RANGO INTERCUARTIL Definición: El rango intercuartil es una medida de variabilidad adecuada cuando la medida de posición central empleada ha sido la mediana y él se define como la diferencia entre el Tercer Cuartil (Q3) y el Primer Cuartil (Q1).Q1)/2 22 Prof.Q1 25% Q1 50% Q2 Q3 25% A la mitad del rango intercuartil se le conoce como Desviación Cuartil (DQ): DQ = RQ /2= (Q3 . Leonardo Simmons Estadísticas I -05 . es decir: RQ = Q3 .

5 RQ Dist.5 RQ Xmax Q3 Q2 Q1 Xmin Q1 -1. además de ubicar valores extremos: x Q3+1.DIAGRAMA DE CAJA El Rango Intercuartil se usa para construir los Diagramas de Caja que sirven para visualizar la variabilidad de una variable y comparar distribuciones de la misma variable. C 23 Prof. Leonardo Simmons Estadísticas I -05 . B Dist. A Dist.

Leonardo Simmons Estadísticas I -05 . se cumple que: |Xmin-Q1| =|Xmax-Q3| |Q2-Q1| =|Q2-Q3| Q2 = X Distribución asimétrica negativa se cumple que: X < Q2=Me< Mo Distribución asimétrica positiva se cumple que: X > Q2=Me> Mo 24 Prof.DIAGRAMA DE CAJA Distribución simétrica o en forma de “campana” (Normal).

25 Prof. Estas variables podrían tener unidades diferentes. Leonardo Simmons Estadísticas I -05 . El coeficiente de variación elimina la dimensionalidad de las variables y tiene en cuenta la proporción existente entre una medida de tendencia y la desviación típica o estándar. podremos determinar si los datos tomados al medir el volumen de llenado de un envase de cierto líquido varían más que los datos tomados al medir la temperatura de el liquido contenido en el envase al salir al consumidor. El volumen los mediremos en centímetros cúbicos y la temperatura en grados centígrados. comparar la variación producto de dos variables diferentes (que pueden provenir de una misma población). por ejemplo.COEFICIENTE DE DE VARIACION Definición: El coeficiente de variación permite comparar la dispersión entre dos poblaciones distintas e incluso.

61/1.70 mts.61 mts ¿en cuál de los dos aspectos los estudiantes son más homogéneos? CVx = 8/68*100=11. Sy = 0. Leonardo Simmons Estadísticas I -05 .5% Hay mayor homogeneidad (menor variación) en los pesos 26 Prof.7% mientras que CVy = 0. Sx = 8 Kg.70*100 = 39. Sx CVx  100 X Si envés de la media aritmética se emplea la mediana.COEFICIENTE DE VARIACION Coeficiente de variación (Cv): Equivale a la razón entre la media aritmética y la desviación típica o estándar.ej: se han tomado los pesos y las estaturas de los alumnos de una sección hallándose que: X = 68 Kg . y = 1. obtendremos el coeficiente de variación mediana: CVxM e  Sx 100 Me P.

…. Leonardo Simmons Estadísticas I -05 . digamos Xi. + ) Tipificación Z= (X-X)/Sx X. i  1.. Z=0.. la diferencia de dicho valor con la media (Xi . X. obtendremos las cantidad de desviación típicas que dista Xi de la media. Si definimos la variable Z como: Z Xi  X .X ) mide la distancia entre estos dos valores y si dividimos tal diferencia entre la desviación típica.k Sx Se demuestra que Z = 0 y Sz = 1 independientemente de los estadísticos de la variable X... de media X y desviación estándar Sx entonces si tomamos cualquier valor de X.. Sx Z.Xk. Sz=1 27 Prof. X2. A la variable Z la llámanos variable estandarizada o tipificada y se cumple que Z no tiene unidades y siempre Z = 0 y Sz = 1 y Z pertenece a (.TIPIFICACION DE VARIABLES Sea X la variable que toma los valores X1.

Leonardo Simmons Estadísticas I -05 .X)/Sx=0 Prof.TIPIFICACION DE VARIABLES X1 X2 X Xk X  Z1=(X1-X)/Sx Z2=(X2-X)/Sx Z1 Z2 Z=0 z  Zk=(Xk-X)/Sx Z=(X .

5 indicaría que X1 esta a 0. Leonardo Simmons Estadísticas I -05 .TIPIFICACION DE VARIABLES La interpretación de Z es como sigue: • Si Z1= 1.5 o ½ desviaciones típicas a la izquierda de la media de X. es decir si Xi > X entonces Zi > 0 • Si Z1= -0.2 desviaciones típicas mayor que la media de X. es decir si Xi < X entonces Zi < 0 • El valor tipificado o estandarizado de la media de la variable siempre será o cero: Zx  X X 0 Sx 29 Prof.2 indicaría que X1 es 1.

ej.TIPIFICACION DE VARIABLES Uso de la Tipificación o Estandarización: P. Leonardo Simmons Estadísticas I -05 . La comparación habrá de hacerse a través de la variable tipificada: Para A: ZA = (12 .13)/6 = 1/6 ZA=1/5 Para B: ZB = (14 – 15)/5 = -1/5 ZB=-1/6 -3 -2 -1 0 1 2 3 z Se aprecia que la calificación del alumno A es mejor en relación a su clase.: Dos estudiantes uno de Contaduría (A) y el otro de Administración (B) obtienen las siguientes notas: A: 12 ptos en Auditoria B: 14 Ptos en Investigación de Operaciones Los estadísticos para las clases respectivas fueron: Clase de A: Nota promedio de Auditoría XA = 13 ptos con SA = 6 ptos Clase de B: Nota promedio de IO XB = 15 ptos con SB = 5 ptos Evidentemente no se pueden comparar directamente las notas de los dos estudiantes porque el rendimiento de sus respectivas clases es diferente. que la del alumno B en relación a la suya 30 Prof.

Leonardo Simmons Estadísticas I -05 .TIPIFICACION DE VARIABLES P. Producción A: 32% Gte. Producción B: 42% Respecto a la realidad económica de cada país. la comparación habrá de hacerse a través de la variable tipificada: Para país A: Z = (42 . obteniéndose los siguientes datos: País Media Desv.: Una empresa que posee una fabrica en el país A y otra en B ha realizado una encuesta relativa al porcentaje que de su sueldo gastan sus empleados por concepto de alimentación. cual de ellos se podría decir que gasta menos en alimentación? Tratándose de realidades distintas.ej. Típica A B 20% 30% 6% 12% El porcentaje reportado por los gerentes de producción de ambos países fueron: Gte.30)/12 = 1 Para país B: Z = (32 – 20)/6 = 2 31 Prof.

País A GTE. Leonardo Simmons Estadísticas I -05 . en proporción gasta menos en alimentación respecto a la realidad económica de su país que lo que gasta el gerente del país B respecto a la suya 32 Prof. País B Z=1 -3 -2 Realidad Económica Media -1 0 1 2 3 Z=2 z Se aprecia que el gerente del país A. no obstante las apariencias numéricas.TIPIFICACION DE VARIABLES GTE.

7% de los datos están comprendidos en el intervalo x±3sx por lo tanto en la escala estandarizada (Z) ese intervalo se convierte en [-3.DETECCION DE VALORES ATIPICOS CON Z SI UNA DISTRIBUCIÓN ES APROXIMADAMENTE “Normal” entonces según la regla empírica aproximadamente el 99. Leonardo Simmons Estadísticas I -05 . Luego todo valor de X cuyo valor estandarizado este fuera del anterior intervalo se puede considerar atipico. 3]. Atípicos Atípicos -3 -2 -1 0 1 2 3 z 33 Prof.

es común usar medidas de forma en la descripción. decir que una distribución de frecuencias es simétrica si el lado derecho de la gráfica (histograma o polígono de frecuencias (a partir de la mediana) es la imagen por un espejo del lado izquierdo 34 Prof. Una de estas medidas es una estadística que busca expresar la simetría ( o falta de ella ) que manifiestan los datos. denominada coeficiente de asimetría. hay que precisar con respecto a qué. Podemos basarnos en ella para. Para saber si una distribución de frecuencias es simétrica.MEDIDAS DE ASIMETRIA Definición: Además de la posición (tendencia) y la dispersión de un conjunto de datos. de forma natural. Leonardo Simmons Estadísticas I -05 . Un buen candidato es la mediana ya que divide a la distribución de frecuencias en dos partes de igual área (50-50).

Q3 – Q2 = Q2 – Q1 Una pista para saber si una distribución de frecuencias es asimétrica positiva es cuando: Q3 – Q2 > Q2 – Q1 35 Prof. Leonardo Simmons Estadísticas I -05 . como entre la mediana y la que deja por debajo de sí un quarto de todas las observaciones. es claro que deben haber tantas observaciones entre la que deja por debajo de sí las tres cuartas partes de la distribución y la mediana.MEDIDAS DE ASIMETRIA Coeficiente de Asimetría basado en los tres cuartiles (Yule-Bowley) : Si una distribución es simétrica. De forma abreviada esto es.

utilizamos como índice de asimetría la cantidad: Q3  2Q2  Q1 Q3  2Q2  Q1 AQ   Q3  Q1 RQ  1  AQ  1 Coeficiente de Asimetría basado en el momento central de tercer orden: p Si la distribución fuese asimétrica positiva. con p impar positivas estarían muy aumentadas al elevarse a p. se tendrá: Q3 – Q2 < Q2 – Q1 Para quitar dimensionalidad al problema. si es asimétrica negativa. Esta propiedad nos indica que un índice de asimetría posible consiste en tomar p=3 y definir: 36 Prof. las cantidades ( X i  X ) .MEDIDAS DE ASIMETRIA Por analogía. Leonardo Simmons Estadísticas I -05 .

 1  A3  1 Otros Coeficientes de Asimetría: Basándonos en que si una distribución de frecuencias es simétrica y unimodal. entonces la media. diremos que hay asimetría positiva si A3>0. y que la asimetría es negativa si A3<0. n S x3 .MEDIDAS DE ASIMETRIA ( X i  X )3  i 1 k A3  Apoyándonos en este índice. la mediana y la moda coinciden. como: X  Mo A  Sx ó 3( X  M e ) A  Sx Diremos que hay asimetría positiva si A>0 y negativa si A<0 37 Prof. podemos definir otras medidas de asimetría. Leonardo Simmons Estadísticas I -05 .

4 días Q1= 12.3 días se encuentra el 50% central del total de observaciones.14 42 14 -.9 4 9 -.1 días Q3 =14.5 12.5 14.09 Este resultado nos indica que existe una ligera asimetría a la izquierda (negativa).17 20 17 -.21 sx 38 Prof.19 1 157 x 8 10 11.94 días Me = Q2=13.11 18 11 -.6 días y A  x  M o   0.5 13.Cuentas 7 -. Además: AQ = -0.MEDIDAS DE ASIMETRIA P.4-12.13 27 13 -. Leonardo Simmons Estadísticas I -05 .15 días sx= 1.4 días Lo que nos dice que aproximadamente en un rango de (Q3-Q1) = 14. Un resultado similar se obtiene si observamos que la distribución de frecuencias es unimodal.ej: Los días-calle de la población de cuentas x cobrar de una firma se distribuyen de la siguiente forma: Días No. siendo Mo = 13.15 31 15 -.1 = 2.5 16 18 F 4 22 36 63 105 136 156 157 x = 13.12 14 12 -.

Leptocúrtica 39 Prof. la distribución es menos apuntada de lo “normal” –Platicúrtica Si K = 0. Una mayor curtosis implica que la mayor parte de la varianza (variación) es debida a desviaciones infrecuentes en los extremos. que se oponen a desviaciones comunes de medidas menos pronunciadas. la Kurtosis (Curtosis) es una medida de lo "picudo"(concentrada en torno a la media) de la distribución de frecuencia de una variable cuantitativa. La curtosis se determinará a partir del momento central de cuarto orden. esto 4 es ( X i  X ) : k k ( X i  X )4 fi  i 1 Se cumple que: Si K < 0.MEDIDAS DE FORMA – KURTOSIS (CURTOSIS) Definición: En estadística. la distribución tiene un apuntamiento “normal” – Mesocúrtica Si k > 0. la distribución es más apuntada de lo “normal” . Leonardo Simmons Estadísticas I -05 nS 4 x 3 .

094 lo que implica que dicha distribución tiene un apuntamiento casi normal.MEDIDAS DE FORMA – KURTOSIS (CURTOSIS) Curtosis Negativa Platicúrtica Curtosis nula Mesocúrtica Curtosis Positiva Leptocúrtica En el ejemplo de los días-calle de la población de cuentas x cobrar de una firma. 40 Prof. Leonardo Simmons Estadísticas I -05 . el calculo de la curtosis resulta igual a: K = +0.

co/mipymes/Documentos/Calidad/VariacionGerenciayDeming. desarrollo y traducción libre: por Rogelio Carrillo Penso http://sev.cuao.TAREA No. Tómese unos minutos de su tiempo y lea detenidamente el siguiente articulo: VARIACIÓN. Quality Progress. Compilación. Diciembre de 1990. Edición . Y EL DR.edu.html 3. Resolver del libro Estadística para Administración y Economía – Anderson – 8va. Joiner y Marie A.pdf 2. EDWARDS DEMING Por: Brian L.org/matematica2/index. Leonardo Simmons Estadísticas I -05 .98 al 99) 41 Prof. los ejercicios del 15 al 26 (pag. 42 al 46 (pag. 88 al 89). 31 al 37 (pag.fundacionempresaspolar. GERENCIA. W.5 1. Ingrese a la página de la Fundación Polar y lea los fascículos 20 y 21 de la serie El Mundo de Las Matemáticas. Gaudard. JOINER ASSOCIATES INC. 94 al 95). que trata de la variabilidad estadística: http://www. capitulo 3.

Sign up to vote on this title
UsefulNot useful