P. 1
estadistica-i05-1225047469153058-9

estadistica-i05-1225047469153058-9

|Views: 1.338|Likes:
Publicado porrjga2006

More info:

Published by: rjga2006 on Apr 15, 2012
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PPT, PDF, TXT or read online from Scribd
See more
See less

04/21/2013

pdf

text

original

Sections

  • PENSAMIENTO ESTADISTICO Y VARIABILIDAD
  • MEDIDAS DE VARIABILIDAD – RANGO O RECORRIDO
  • MEDIDAS DE VARIABILIDAD – DESVIACION MEDIA
  • MEDIDAS DE VARIABILIDAD – VARIANZA
  • TEOREMA DE CHEBYSHEV
  • REGLA EMPIRICA
  • MEDIDAS DE VARIABILIDAD – RANGO INTERCUARTIL
  • COEFICIENTE DE DE VARIACION
  • COEFICIENTE DE VARIACION
  • DETECCION DE VALORES ATIPICOS CON Z
  • TAREA No.5

1

UCV/FACES/EAC
Estadísticas I
Medidas de Dispersión y Variabilidad
Prof. Leonardo Simmons
Prof. Leonardo Simmons Estadísticas I -05
2
PENSAMIENTO ESTADISTICO Y VARIABILIDAD
Según vimos anteriormente el pensamiento estadístico es la filosofía de
aprender y emprender acciones basada en los siguientes principios:
 Todo ocurre en un sistema de procesos interconectados
 La variación existe en todos los procesos
 Entender y reducir la variabilidad es la clave del éxito

Conclusión:
Estudiar, medir, entender y reducir la variabilidad de los procesos de negocio
de las empresas es vital para la salud éstas y por lo tanto se constituye en la
razón de ser de todo aquel que este a cargo de tales procesos.

Prof. Leonardo Simmons Estadísticas I -05
3
MEDIDAS DE VARIABILIDAD
Una medida de tendencia central (media, mediana, modo) representa a la
correspondiente distribución de datos de una variable y nos informa acerca
de la tendencia de la misma, sin embargo, estas medidas no nos informan
nada respecto a la variabilidad o dispersión existente entre los distintos
valores de la variable y la medida de tendencia.
Por ejemplo, las siguientes series de salarios en Bs. tiene igual media
aritmética:
Serie A: 2500, 2800, 3000, 3300, 3500 – Media = Bs. 3020
Serie B: 1000, 1500, 1600,4000, 7000 – Media = Bs. 3020
Sin embargo son bien distintas.

¿Cuan representativa es una media de tendencia central?
¿Cuál de dos o mas distribuciones de datos de una misma variable es mas o
menos dispersa respecto a una medida de tendencia central?
Prof. Leonardo Simmons Estadísticas I -05
4
MEDIDAS DE VARIABILIDAD
Las medidas de variabilidad tienen por objeto medir la magnitud de los
desvíos de los valores de la variable con respecto al valor central de la
distribución, o sea, las medidas de variabilidad definen cuan semejante o
cuan distinto son cada uno de los valores, de la variable con respecto al valor
central.
Las medidas de variabilidad son también medidas del grado de
representatividad de las medidas de tendencia central.
La variabilidad es la característica mas importante de la distribución, ya que
se constituye en un eficaz test de validación referido al nivel de significación
de las medidas de centralización
Las distintas medidas de variabilidad que estudiaremos serán:

• Rango Intercuartilico (Q)
• Coeficiente de Variación (CV)

• Rango o Recorrido (R)
• Desviación Media (D)
• Desviación Típica o Estándar (S , o)
• Varianza (S
2
, o
2
)

Prof. Leonardo Simmons Estadísticas I -05
5
MEDIDAS DE VARIABILIDAD – RANGO O RECORRIDO
Definición:
El recorrido o Rango de una variable es la diferencia entre sus valores
extremos:


Características del rango o recorrido:
• Solo suministra información de los extremos de la variable
• Informa sobre la distancia entre el mínimo y el máximo valor observado
• Se limita su uso a una información inicial


min max
X X R
x
÷ =
X
min
X
ma
x
R
x
Prof. Leonardo Simmons Estadísticas I -05
6
MEDIDAS DE VARIABILIDAD – DESVIACION MEDIA
Definición:
Es la media aritmética de los valores absolutos de las desviaciones entre los
valores de la variable y una medida de tendencia central. Entonces,
identificamos tres (3) posibles desviaciones medias:
• Desviación Media respecto a la Media:


• Desviación Media respecto a la Mediana:


• Desviación Media respecto al Modo:
n
f x x
D
k
i
i i
x
¿
=
÷
=
1
n
f M x
D
k
i
i e i
M
e
¿
=
÷
=
1
n
f M x
D
k
i
i o i
M
o
¿
=
÷
=
1
Prof. Leonardo Simmons Estadísticas I -05
7
x
1
x x ÷
1
x
k
x x
k
÷
x
MEDIDAS DE VARIABILIDAD – DESVIACION MEDIA
La Desviación Media da cuenta de la distancia promedio que existe entre los
valores de la variable (x
1
, x
2
, …..x
k
) y la medida de tendencia central, por
ejemplo la media aritmética
x
Prof. Leonardo Simmons Estadísticas I -05
8
Por ejemplo: Dada la siguiente distribución de frecuencia del precio de un
producto de consumo masivo (no regulado).
Bs Me Bs x 00 , 6 y 93 , 5 = =
MEDIDAS DE VARIABILIDAD – DESVIACION MEDIA
Precio (Bs) No.Ofertas
2 4 15,72 16,00
4 6 11,58 12,00
6 10 0,70 0,00
8 7 14,49 14,00
10 3 12,21 12,00
30 54,70 54,00
i i
f X x ÷
i e i
f M x ÷
Bs
n
f x x
D
k
i
i i
x
82 , 1
30
70 , 54
1
= =
÷
=
¿
=
Bs
n
f M x
D
k
i
i e i
M
e
80 , 1
30
00 , 54
1
= =
÷
=
¿
=
En promedio los precios distan en 1,82 Bs del precio promedio
Prof. Leonardo Simmons Estadísticas I -05
9
Otro ejemplo: Tres alumnos son sometidos a una competencia para probar sus conocimientos en 10
materias diferentes, cada una sustentada con 10 preguntas. La idea del concurso es encontrar al
alumno más idóneo para representar al colegio en un torneo a nivel nacional.
El número de preguntas buenas por materia se muestra a continuación:
MEDIDAS DE VARIABILIDAD – DESVIACION MEDIA
Materia Carlos Pedro Juan
1 2 7 5
2 9 2 6
3 10 2 5
4 2 6 5
5 3 6 5
6 1 3 5
7 9 6 4
8 9 7 5
9 1 6 6
10 4 5 4
SOLUCIÓN
Lo primero que analizaremos es la media de los puntajes para cada uno de los
alumnos, con el fin de determinar el alumno con mayor promedio de preguntas
buenas.

Las medias para los resultados de los alumnos coinciden: los tres alumnos tienen
responden en promedio 5 preguntas correctas por prueba. ¿Cuál sería entonces
el indicador diferenciador entre los alumnos?.

Complementemos el análisis anterior calculando la desviación media:

Carlos muestra una desviación media de 3,9 indicando que los datos se alejan en
promedio de la media en 3,9 preguntas buenas. Pedro disminuye su variación
(2,9), siendo Juan el que menos variación presenta con 0,9 preguntas tanto por
arriba como por debajo de la media aritmética. Se recomienda al colegio elegir
como ganador en este caso a Juan, presenta resultados más constantes que los
otros dos alumnos, Juan en promedio acierta 5 preguntas buenas con una
variación muy baja (rondando entre 4 y 6).
Prof. Leonardo Simmons Estadísticas I -05
10
MEDIDAS DE VARIABILIDAD – DESVIACION TIPICA
Definición:
La desviación típica o desviación estándar mide la dispersión de los
valores de una variable respecto a su media aritmética y se basa en la
propiedad de ésta que dice que:
- La suma de los cuadrados de los desvíos respecto de la media aritmética es
un mínimo, es decir:


Tomando esta propiedad en consideración calcularemos la desviación típica
o estándar de la población de una variable, a la cual denotaremos con la
letra o (sigma), con la siguiente expresión:




x C f C x f x x
k
i
i i
k
i
i i
= ¬ ÷ < ÷
¿ ¿
= =
) ( ) (
1
2
1
2
l poblaciona típica desviación
) (
1
2
N
f x
k
i
i x i
x
¿
=
÷
=
µ
o
Prof. Leonardo Simmons Estadísticas I -05
11
MEDIDAS DE VARIABILIDAD – DESVIACION TIPICA
Cuando estamos analizando una muestra a la desviación típica o estándar la
denotamos con la letra S y se determina con la siguiente expresión:



La desviación estándar es una medida del grado de dispersión de los datos
respecto al promedio. Dicho de otra manera, la desviación estándar es
simplemente el "promedio" o variación esperada con respecto de la media
aritmética.
Si S
x
 0 indica que los valores están cerca de la media (poca dispersión)
Si S
x
 +∞ indica que los valores están lejos de la media (mucha dispersión)
La desviación típica, al igual que la media y la varianza, es un índice muy
sensible a los valores extremos.
Nota: El término desviación estándar fue incorporado a la estadística por Karl Pearson en 1894.

muestral típica desviación
1
) (
1
2
÷
÷
=
¿
=
n
f x x
S
k
i
i i
x
Prof. Leonardo Simmons Estadísticas I -05
12
MEDIDAS DE VARIABILIDAD – DESVIACION TIPICA
Se demuestra que:
para la población



Y para la muestra:




2
1
2
x
k
i
i i
x
N
f x
µ o ÷ =
¿
=
1 ) 1 (
2
1
2
÷
÷
÷
=
¿
=
n
x
n n
f x
S
k
i
i i
x
Prof. Leonardo Simmons Estadísticas I -05
13
MEDIDAS DE VARIABILIDAD – DESVIACION TIPICA
Ejemplo: La siguiente tabla corresponde a la distribución de frecuencias de
una muestra de los espesores en pulgadas, de recipientes de acero
producidos por cierto proceso:
pulg 005 , 0
49
96 , 15
1 50
) 319 , 0 (
1
) (
1
2
1
2
= =
÷
÷
=
÷
÷
=
¿ ¿
= =
k
i
i i
k
i
i i
x
f x
n
f x x
S
Espesores en pulg No.Piezas x xf (x-Media)
2
f
0.306 - 0.310 3 0,308 0,924 0,0004
0.310 - 0.314 5 0,312 1,560 0,0003
0.314 - 0.318 5 0,316 1,580 0,0001
0.318 - 0.322 22 0,320 7,040 0,0000
0.322 - 0.326 14 0,324 4,536 0,0003
0.326 - 0.330 1 0,328 0,328 0,0001
50 15,968 0,0011
El proceso produce una pieza de espesor promedio 0,319 pulgadas con una
variación de 0,005 pulgadas
Prof. Leonardo Simmons Estadísticas I -05
14
MEDIDAS DE VARIABILIDAD – VARIANZA
Definición:
Definimos varianza a la media de los cuadrados de las desviaciones respecto
a la media, es decir, la varianza es el cuadrado de la desviación típica, por lo
tanto:






En el ejemplo anterior:
S
2
x
= (0,005 pulg)
2
= 0,000025 pulg
2

Muestral) (Varianza
1
) (
) (
l) Poblaciona (Varianza
) (
) (
1
2
2
1
2
2
÷
÷
= =
÷
= =
¿
¿
=
=
n
f x x
S x Var
N
f x
x Var
k
i
i i
x
k
i
i x i
x
µ
o
Prof. Leonardo Simmons Estadísticas I -05
15
PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA
1. La desviación típica y la varianza de una variable son estadísticos
positivos, es decir, S
x
> 0 y Var(x) = S
2
x
> 0
2. la varianza de una constante por una variable es igual al cuadrado de la
constante por la varianza de la variable, es decir:
Var(cX) = c
2
Var(X) = c
2
S
2
x
En consecuencia la desviación típica de una constante por una variable
será:
S
cx
= \c\S
x
3. La varianza de la suma de una variable más una constante es igual a la
varianza de la variable, es decir:
Var(X + c) = Var(X) = S
2
x

En consecuencia: S
x+c
= S
x
Nota: La varianza de una constante es igual a cero; Var(C) = 0
Prof. Leonardo Simmons Estadísticas I -05
16
PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA
4. Si x ʌ y son variables estadísticamente independientes entonces:
4. Var (x ± y) = Var (x) + Var (y) = S
2
x
+ S
2
y
, por lo tanto
5.


6. Var (ax + by+ c) = a
2
Var(x)+b
2
Var(y)= a
2
S
2
x
+ b
2
S
2
y
, por lo tanto:



5. Si x ʌ y son variables que no son estadísticamente independientes
entonces:
Var(x±y) = Var(x) + Var(y) ± 2Cov(x,y), donde Cov(x,y) es la Covarianza
(*) entre x ʌ y mide la magnitud de la asociación entre las dos variables y
se determina por:
y x
y x
S S S
2 2
+ =
±
y x
c by ax
S b S a S
2 2 2 2
+ =
+ +
Prof. Leonardo Simmons Estadísticas I -05
17
PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA
muestral) a (Covarianz
1
) )( (
) , (
l) Poblaciona a (Covarianz
) )( (
) , (
1
1
÷
÷ ÷
= =
÷ ÷
= =
¿
¿
=
=
n
y y x x
S y x Cov
N
y x
y x Cov
k
i
xy
k
i
y x
xy
µ µ
o
Nota (*): El concepto de covarianza se ampliará cuando abordemos el tema de las medidas de
asociación entre dos variables
5. Si y S
1
2
, S
2
2
,…S
r
2
representan las medias aritméticas y las
varianzas de r muestras de tamaño n
1
, n
2
, …n
r
de la misma variable
entonces la varianza de la unión de las r-muestras será la media de las
varianzas más la varianza de las medias, es decir:
r
X X X ,.... ,
2 1
¿
¿ ¿
=
= =
=
÷
+ =
r
i
i
r
i
i i
r
i
i
n n
n
X X n
n
S n
S
i
1
1
2
1
2
2
donde
) (
Prof. Leonardo Simmons Estadísticas I -05
18
PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA
Si las r-muestras fuesen del mismo tamaño entonces:

) (
1
2
1
2
2
r
X X
r
S
S
r
i
i
r
i
i
¿ ¿
= =
÷
+ =
Si las r-muestras fuesen del mismo tamaño y tuviesen la misma media entonces:

r
S
S
r
i
i
¿
=
=
1
2
2
Prof. Leonardo Simmons Estadísticas I -05
19
PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA
Ejemplo (1): Hallar la media del número de establecimientos hoteleros que
hay en las distintas Comunidades Autónomas de España. Después, con ayuda
de la desviación típica, comenta si esta media es representativa de todas las
comunidades autónomas.

CC.AA. Nº establecimientos
hoteleros
Andalucía 2.266
Aragón 712
Asturas (Principado de) 620
Baleares (Islas) 1.483
Canarias 532
Cantabria 496
Castilla y León 1.452
Castilla-La Mancha 842
Cataluña 2.713
Comunidad Valenciana 1.019
Extremadura 418
Galicia 1.526
Madrid (Comunidad de) 1.242
Murcia (Región de) 209
Navarra (C. Foral de) 150
País Vasco 396
Rioja (La) 117
Ceuta y Melilla 36
ientos Establecim 14 , 731
N
) x - (x
ientos Establecim 902
18
1 i
2
i
x
18
1
= =
= =
¿
¿
=
=
o
µ
N
x
i
i
x
Se trata de la población de establecimientos en España
distribuido en las 18 Comunidades Autónomas de ese país,
luego:

Como la desviación típica es muy alta, esto me indica que los
datos reales se diferencian mucho de la media, luego el dato de
la media no es representativo.
Prof. Leonardo Simmons Estadísticas I -05
20
TEOREMA DE CHEBYSHEV
Teorema de Chebyshev (Desigualdad de Chebyshev):
Para cualquier distribución estadística de datos de una variable (muestra o
población), la proporción (µ) mínima de los valores que se encuentran dentro
de k desviaciones estándares desde la media es al menos 1 – 1/k
2
, donde k
es una constante mayor que 1.
X
o µ k
x
÷ o µ k
x
+
x
µ
µ ≤ 1-1/k
2
K>1
P.ej: La distribución de contribuciones al SSO tiene media Bs. 51.54 y desviación
estándar Bs. 7.51; ¿Qué porcentaje de contribuyentes como mínimo aportan entre la
media más o menos 3.5 veces la desviación:
1-1/k
2
= 1 – 1/(3.5)
2
=0.92 o sea 92%
Prof. Leonardo Simmons Estadísticas I -05
21
REGLA EMPIRICA
Regla Empírica o Regla Normal:
Para distribuciones simétricas o en forma de “campana” (Normales), se
cumple que:
X
o µ ÷
x
o µ +
x
x
µ
68% de los datos
X
o µ 2 ÷
x
o µ 2 +
x
x
µ
95% de los datos
X
o µ 3 ÷
x
o µ 3 +
x
x
µ
99,7% de los datos
Prof. Leonardo Simmons Estadísticas I -05
22
MEDIDAS DE VARIABILIDAD – RANGO INTERCUARTIL
Definición:
El rango intercuartil es una medida de variabilidad adecuada cuando la
medida de posición central empleada ha sido la mediana y él se define como
la diferencia entre el Tercer Cuartil (Q
3
) y el Primer Cuartil (Q
1
), es
decir: R
Q
= Q
3
- Q
1





A la mitad del rango intercuartil se le conoce como Desviación Cuartil
(D
Q
):
D
Q
= R
Q
/2= (Q
3
- Q
1
)/2


Q
1
25% 25%
Q
2
Q
3
50%
Prof. Leonardo Simmons Estadísticas I -05
23
DIAGRAMA DE CAJA
El Rango Intercuartil se usa para construir los Diagramas de Caja que
sirven para visualizar la variabilidad de una variable y comparar distribuciones
de la misma variable; además de ubicar valores extremos:
X
max
X
min
Q
3
Q
1
Q
2
Q
3
+1.5 R
Q
Q
1
-1.5 R
Q
x
Dist. A Dist. B Dist. C
Prof. Leonardo Simmons Estadísticas I -05
24
DIAGRAMA DE CAJA
Distribución simétrica o en forma de “campana”
(Normal), se cumple que:
|X
min
-Q
1
| =|X
max
-Q
3
|
|Q
2
-Q
1
| =|Q
2
-Q
3
|
Q
2
= X
Distribución asimétrica negativa se cumple que:
X < Q
2
=M
e
< M
o
Distribución asimétrica positiva se cumple que:
X > Q
2
=M
e
> M
o
Prof. Leonardo Simmons Estadísticas I -05
25
COEFICIENTE DE DE VARIACION
Definición:

El coeficiente de variación permite comparar la dispersión entre dos
poblaciones distintas e incluso, comparar la variación producto de dos
variables diferentes (que pueden provenir de una misma población).

Estas variables podrían tener unidades diferentes, por ejemplo, podremos
determinar si los datos tomados al medir el volumen de llenado de un envase
de cierto líquido varían más que los datos tomados al medir la temperatura
de el liquido contenido en el envase al salir al consumidor. El volumen los
mediremos en centímetros cúbicos y la temperatura en grados centígrados.

El coeficiente de variación elimina la dimensionalidad de las variables y tiene
en cuenta la proporción existente entre una medida de tendencia y la
desviación típica o estándar.
Prof. Leonardo Simmons Estadísticas I -05
26
COEFICIENTE DE VARIACION
Coeficiente de variación (Cv): Equivale a la razón entre la media aritmética y
la desviación típica o estándar.



Si envés de la media aritmética se emplea la mediana, obtendremos el
coeficiente de variación mediana:



P.ej: se han tomado los pesos y las estaturas de los alumnos de una sección
hallándose que:
X = 68 Kg , S
x
= 8 Kg; y = 1,70 mts, S
y
= 0,61 mts
¿en cuál de los dos aspectos los estudiantes son más homogéneos?

CVx = 8/68*100=11,7% mientras que CVy = 0,61/1,70*100 = 39,5%
Hay mayor homogeneidad (menor variación) en los pesos
100 × =
X
S
CV
x
x
100 × =
e
x
x
M
S
CV
e M
Prof. Leonardo Simmons Estadísticas I -05
27
TIPIFICACION DE VARIABLES
Sea X la variable que toma los valores X
1
, X
2
, …..X
k
, de media X y desviación
estándar S
x
entonces si tomamos cualquier valor de X, digamos X
i
, la
diferencia de dicho valor con la media (X
i
- X ) mide la distancia entre estos
dos valores y si dividimos tal diferencia entre la desviación típica,
obtendremos las cantidad de desviación típicas que dista X
i
de la media. Si
definimos la variable Z como:




Se demuestra que Z = 0 y S
z
= 1 independientemente de los estadísticos de
la variable X.
A la variable Z la llámanos variable estandarizada o tipificada y se cumple que
Z no tiene unidades y siempre Z = 0 y S
z
= 1 y Z pertenece a (- ·, +· )

....k i
S
X X
Z
x
i
1 ; =
÷
=
Z= (X-X)/S
x X, X, S
x

Z, Z=0, S
z
=1
Tipificación
Prof. Leonardo Simmons Estadísticas I -05
TIPIFICACION DE VARIABLES
X
1
X
2
X
k
X
Z
1
=(X
1
-X)/S
x
Z
2
=(X
2
-X)/S
x
Z
1
Z
2
Z=0

Z=(X

- X)/S
x
=0

÷ · +·
Z
k
=(X
k
-X)/S
x
X

z

Prof. Leonardo Simmons Estadísticas I -05
29
TIPIFICACION DE VARIABLES
La interpretación de Z es como sigue:
• Si Z
1
= 1,2 indicaría que X
1
es 1,2 desviaciones típicas mayor que la media de
X; es decir si X
i
> X entonces Z
i
> 0
• Si Z
1
= -0.5 indicaría que X
1
esta a 0,5 o ½ desviaciones típicas a la izquierda
de la media de X; es decir si X
i
< X entonces Z
i
< 0
• El valor tipificado o estandarizado de la media de la variable siempre será o
cero:

0 =
÷
=
x
x
S
X X
Z
Prof. Leonardo Simmons Estadísticas I -05
30
TIPIFICACION DE VARIABLES
Uso de la Tipificación o Estandarización:
P.ej.: Dos estudiantes uno de Contaduría (A) y el otro de Administración (B) obtienen
las siguientes notas:
A: 12 ptos en Auditoria
B: 14 Ptos en Investigación de Operaciones
Los estadísticos para las clases respectivas fueron:
Clase de A: Nota promedio de Auditoría X
A
= 13 ptos con S
A
= 6 ptos
Clase de B: Nota promedio de IO X
B
= 15 ptos con S
B
= 5 ptos

Evidentemente no se pueden comparar directamente las notas de los dos estudiantes
porque el rendimiento de sus respectivas clases es diferente. La comparación habrá de
hacerse a través de la variable tipificada:
Para A: ZA = (12 - 13)/6 = 1/6
Para B: ZB = (14 – 15)/5 = -1/5




Se aprecia que la calificación del alumno A es mejor en relación a su clase, que la del
alumno B en relación a la suya
0 -1 -2 -3 3 2 1
Z
A
=1/5
Z
B
=-1/6
z
Prof. Leonardo Simmons Estadísticas I -05
31
TIPIFICACION DE VARIABLES

P.ej.: Una empresa que posee una fabrica en el país A y otra en B ha realizado una
encuesta relativa al porcentaje que de su sueldo gastan sus empleados por concepto
de alimentación, obteniéndose los siguientes datos:






El porcentaje reportado por los gerentes de producción de ambos países fueron:
Gte. Producción A: 32%
Gte. Producción B: 42%

Respecto a la realidad económica de cada país, cual de ellos se podría decir que gasta
menos en alimentación?

Tratándose de realidades distintas, la comparación habrá de hacerse a través de la
variable tipificada:
Para país A: Z = (42 - 30)/12 = 1
Para país B: Z = (32 – 20)/6 = 2
País Media Desv. Típica
A 20% 6%
B 30% 12%
Prof. Leonardo Simmons Estadísticas I -05
32
TIPIFICACION DE VARIABLES

Se aprecia que el gerente del país A, no obstante las apariencias numéricas, en
proporción gasta menos en alimentación respecto a la realidad económica de su país
que lo que gasta el gerente del país B respecto a la suya
0 -1 -2 -3 3 2 1
GTE. País A
Z=2
GTE. País B
Z=1
Realidad
Económica
Media
z
Prof. Leonardo Simmons Estadísticas I -05
33
DETECCION DE VALORES ATIPICOS CON Z

SI UNA DISTRIBUCIÓN ES APROXIMADAMENTE “Normal” entonces según la
regla empírica aproximadamente el 99.7% de los datos están comprendidos
en el intervalo µ
x
±3o
x
por lo tanto en la escala estandarizada (Z) ese
intervalo se convierte en [-3, 3]. Luego todo valor de X cuyo valor
estandarizado este fuera del anterior intervalo se puede considerar atipico.

0 -1 -2 -3 3 2 1
z
Atípicos
Atípicos
Prof. Leonardo Simmons Estadísticas I -05
34
MEDIDAS DE ASIMETRIA
Definición:

Además de la posición (tendencia) y la dispersión de un conjunto de datos, es
común usar medidas de forma en la descripción. Una de estas medidas es
una estadística que busca expresar la simetría ( o falta de ella ) que
manifiestan los datos, denominada coeficiente de asimetría.

Para saber si una distribución de frecuencias es simétrica, hay que precisar
con respecto a qué. Un buen candidato es la mediana ya que divide a la
distribución de frecuencias en dos partes de igual área (50-50). Podemos
basarnos en ella para, de forma natural, decir que una distribución de
frecuencias es simétrica si el lado derecho de la gráfica (histograma o
polígono de frecuencias (a partir de la mediana) es la imagen por un espejo
del lado izquierdo
Prof. Leonardo Simmons Estadísticas I -05
35
MEDIDAS DE ASIMETRIA
Coeficiente de Asimetría basado en los tres cuartiles (Yule-Bowley) :
Si una distribución es simétrica, es claro que deben haber tantas
observaciones entre la que deja por debajo de sí las tres cuartas partes de la
distribución y la mediana, como entre la mediana y la que deja por debajo de
sí un quarto de todas las observaciones. De forma abreviada esto es,
Q
3
– Q
2
= Q
2
– Q
1
Una pista para saber si una distribución de frecuencias es asimétrica positiva
es cuando:
Q
3
– Q
2
> Q
2
– Q
1

Prof. Leonardo Simmons Estadísticas I -05
36
MEDIDAS DE ASIMETRIA
Por analogía, si es asimétrica negativa, se tendrá:

Q
3
– Q
2
< Q
2
– Q
1


Para quitar dimensionalidad al problema, utilizamos como índice de asimetría
la cantidad:





Coeficiente de Asimetría basado en el momento central de tercer
orden:
Si la distribución fuese asimétrica positiva, las cantidades , con p
impar positivas estarían muy aumentadas al elevarse a p. Esta propiedad nos
indica que un índice de asimetría posible consiste en tomar p=3 y definir:

1 1
2 2
1 2 3
1 3
1 2 3
+ s s ÷
+ ÷
=
÷
+ ÷
=
Q
Q
Q
A
R
Q Q Q
Q Q
Q Q Q
A
) (
p
i
X X ÷
Prof. Leonardo Simmons Estadísticas I -05
37
MEDIDAS DE ASIMETRIA






Apoyándonos en este índice, diremos que hay asimetría positiva si A
3
>0, y
que la asimetría es negativa si A
3
<0.

Otros Coeficientes de Asimetría:
Basándonos en que si una distribución de frecuencias es simétrica y
unimodal, entonces la media, la mediana y la moda coinciden, podemos
definir otras medidas de asimetría, como:

ó

Diremos que hay asimetría positiva si A>0 y negativa si A<0

1 1 ,
) (
3
3
1
3
3
+ s s ÷
÷
=
¿
=
A
S
n
X X
A
x
k
i
i


x
o
S
M X
A
÷
=


) ( 3
x
e
S
M X
A
÷
=
Prof. Leonardo Simmons Estadísticas I -05
38
MEDIDAS DE ASIMETRIA
P.ej: Los días-calle de la población de cuentas x cobrar de una firma se
distribuyen de la siguiente forma:







Días No.Cuentas x F
7 -- 9 4 8 4
9 -- 11 18 10 22
11 -- 12 14 11,5 36
12 -- 13 27 12,5 63
13 -- 14 42 13,5 105
14 -- 15 31 14,5 136
15 -- 17 20 16 156
17 -- 19 1 18 157
157
µ
x
= 13,15 días
o
x
= 1,94 días
M
e
= Q
2
=13,4 días
Q
1
= 12,1 días
Q
3
=14,4 días

Lo que nos dice que aproximadamente en un rango
de (Q
3
-Q1) = 14,4-12,1 = 2,3 días se encuentra el
50% central del total de observaciones. Además:
A
Q
= -0,09
Este resultado nos indica que existe una ligera
asimetría a la izquierda (negativa). Un resultado
similar se obtiene si observamos que la distribución
de frecuencias es unimodal, siendo M
o
= 13,6 días y


0,21 ÷ =
÷
=
x
o x
M
A
o
µ
Prof. Leonardo Simmons Estadísticas I -05
39
MEDIDAS DE FORMA – KURTOSIS (CURTOSIS)
Definición:

En estadística, la Kurtosis (Curtosis) es una medida de lo
"picudo"(concentrada en torno a la media) de la distribución de frecuencia de
una variable cuantitativa. Una mayor curtosis implica que la mayor parte de la
varianza (variación) es debida a desviaciones infrecuentes en los extremos,
que se oponen a desviaciones comunes de medidas menos pronunciadas.

La curtosis se determinará a partir del momento central de cuarto orden, esto
es :



Se cumple que:
Si K < 0, la distribución es menos apuntada de lo “normal” –Platicúrtica
Si K = 0, la distribución tiene un apuntamiento “normal” – Mesocúrtica
Si k > 0, la distribución es más apuntada de lo “normal” - Leptocúrtica
4
) ( X X
i
÷
3
) (
4
1
4
÷
÷
=
¿
=
x
k
i
i i
nS
f X X
k
Prof. Leonardo Simmons Estadísticas I -05
40
MEDIDAS DE FORMA – KURTOSIS (CURTOSIS)
Curtosis Negativa Curtosis nula Curtosis Positiva
Platicúrtica


Mesocúrtica


Leptocúrtica


En el ejemplo de los días-calle de la población de cuentas x cobrar de una
firma, el calculo de la curtosis resulta igual a:

K = +0,094 lo que implica que dicha distribución tiene un apuntamiento casi
normal.
Prof. Leonardo Simmons Estadísticas I -05
41
TAREA No.5
1. Tómese unos minutos de su tiempo y lea detenidamente el siguiente
articulo: VARIACIÓN, GERENCIA, Y EL DR. W. EDWARDS DEMING
Por: Brian L. Joiner y Marie A. Gaudard.
JOINER ASSOCIATES INC.
Quality Progress, Diciembre de 1990.
Compilación, desarrollo y traducción libre: por Rogelio Carrillo Penso
http://sev.cuao.edu.co/mipymes/Documentos/Calidad/VariacionGerenciayDeming.pdf

2. Ingrese a la página de la Fundación Polar y lea los fascículos 20 y 21 de
la serie El Mundo de Las Matemáticas, que trata de la variabilidad
estadística:
http://www.fundacionempresaspolar.org/matematica2/index.html

3. Resolver del libro Estadística para Administración y Economía – Anderson
– 8va. Edición , capitulo 3, los ejercicios del 15 al 26 (pag. 88 al 89); 31
al 37 (pag. 94 al 95); 42 al 46 (pag.98 al 99)

PENSAMIENTO ESTADISTICO Y VARIABILIDAD
Según vimos anteriormente el pensamiento estadístico es la filosofía de aprender y emprender acciones basada en los siguientes principios:

 Todo ocurre en un sistema de procesos interconectados
 La variación existe en todos los procesos  Entender y reducir la variabilidad es la clave del éxito Conclusión: Estudiar, medir, entender y reducir la variabilidad de los procesos de negocio de las empresas es vital para la salud éstas y por lo tanto se constituye en la razón de ser de todo aquel que este a cargo de tales procesos.

2
Prof. Leonardo Simmons Estadísticas I -05

MEDIDAS DE VARIABILIDAD
Una medida de tendencia central (media, mediana, modo) representa a la correspondiente distribución de datos de una variable y nos informa acerca de la tendencia de la misma, sin embargo, estas medidas no nos informan nada respecto a la variabilidad o dispersión existente entre los distintos valores de la variable y la medida de tendencia. Por ejemplo, las siguientes series de salarios en Bs. tiene igual media aritmética:

Serie A: 2500, 2800, 3000, 3300, 3500 – Media = Bs. 3020
Serie B: 1000, 1500, 1600,4000, 7000 – Media = Bs. 3020 Sin embargo son bien distintas.

¿Cuan representativa es una media de tendencia central? ¿Cuál de dos o mas distribuciones de datos de una misma variable es mas o menos dispersa respecto a una medida de tendencia central?
3
Prof. Leonardo Simmons Estadísticas I -05

MEDIDAS DE VARIABILIDAD
Las medidas de variabilidad tienen por objeto medir la magnitud de los desvíos de los valores de la variable con respecto al valor central de la distribución, o sea, las medidas de variabilidad definen cuan semejante o cuan distinto son cada uno de los valores, de la variable con respecto al valor central. Las medidas de variabilidad son también medidas representatividad de las medidas de tendencia central. del grado de

La variabilidad es la característica mas importante de la distribución, ya que se constituye en un eficaz test de validación referido al nivel de significación de las medidas de centralización
Las distintas medidas de variabilidad que estudiaremos serán: • • • • Rango o Recorrido (R) Desviación Media (D) Desviación Típica o Estándar (S , s) Varianza (S2 , s2) • Rango Intercuartilico (Q) • Coeficiente de Variación (CV)

4
Prof. Leonardo Simmons Estadísticas I -05

Leonardo Simmons Estadísticas I -05 .MEDIDAS DE VARIABILIDAD – RANGO O RECORRIDO Definición: El recorrido o Rango de una variable es la diferencia entre sus valores extremos: Rx  X m ax  X m in Características del rango o recorrido: • Solo suministra información de los extremos de la variable • Informa sobre la distancia entre el mínimo y el máximo valor observado • Se limita su uso a una información inicial Rx Xmin Xma x 5 Prof.

MEDIDAS DE VARIABILIDAD – DESVIACION MEDIA Definición: Es la media aritmética de los valores absolutos de las desviaciones entre los valores de la variable y una medida de tendencia central. Leonardo Simmons . identificamos tres (3) posibles desviaciones medias: • Desviación Media respecto a la Media: Dx  • Desviación Media respecto a la Mediana:  x x f i 1 i k i n DM e  • Desviación Media respecto al Modo:  x M i 1 i k e fi n DM o   x M i 1 i k o fi n 6 Estadísticas I -05 Prof. Entonces.

Leonardo Simmons .xk) y la medida de tendencia central. por ejemplo la media aritmética x 7 Estadísticas I -05 Prof..MEDIDAS DE VARIABILIDAD – DESVIACION MEDIA x1 x x1  x xk  x xk La Desviación Media da cuenta de la distancia promedio que existe entre los valores de la variable (x1. x2. ….

70 14.00  1.80 Bs n 30 n 30 En promedio los precios distan en 1. Leonardo Simmons Estadísticas I -05 .00 12.70 54.49 12.58 0.00 54.MEDIDAS DE VARIABILIDAD – DESVIACION MEDIA Por ejemplo: Dada la siguiente distribución de frecuencia del precio de un producto de consumo masivo (no regulado).82 Bs del precio promedio i 1  x x f i k i   x M i k e fi 8 Prof.00 Bs Dx  54.70 x  5.00 15.00 12.00 0. Precio (Bs) 2 4 6 8 10 No.93 Bs y Me  6.00 14.82 Bs DM e  i 1   1.Ofertas 4 6 10 7 3 30 xi  X fi xi  M e f i 16.21 54.72 11.

9 preguntas tanto por arriba como por debajo de la media aritmética. Se recomienda al colegio elegir como ganador en este caso a Juan.9 preguntas buenas. Pedro disminuye su variación (2. El número de preguntas buenas por materia se muestra a continuación: SOLUCIÓN Lo primero que analizaremos es la media de los puntajes para cada uno de los alumnos.9). con el fin de determinar el alumno con mayor promedio de preguntas buenas. La idea del concurso es encontrar al alumno más idóneo para representar al colegio en un torneo a nivel nacional.MEDIDAS DE VARIABILIDAD – DESVIACION MEDIA Otro ejemplo: Tres alumnos son sometidos a una competencia para probar sus conocimientos en 10 materias diferentes. cada una sustentada con 10 preguntas. Las medias para los resultados de los alumnos coinciden: los tres alumnos tienen responden en promedio 5 preguntas correctas por prueba. presenta resultados más constantes que los otros dos alumnos. 9 Prof.9 indicando que los datos se alejan en promedio de la media en 3. ¿Cuál sería entonces el indicador diferenciador entre los alumnos?. Leonardo Simmons Estadísticas I -05 Materia Carlos Pedro Juan 1 2 7 5 2 9 2 6 3 10 2 5 4 2 6 5 5 3 6 5 6 1 3 5 7 9 6 4 8 9 7 5 9 1 6 6 10 4 5 4 . Complementemos el análisis anterior calculando la desviación media: Carlos muestra una desviación media de 3. Juan en promedio acierta 5 preguntas buenas con una variación muy baja (rondando entre 4 y 6). siendo Juan el que menos variación presenta con 0.

MEDIDAS DE VARIABILIDAD – DESVIACION TIPICA Definición: La desviación típica o desviación estándar mide la dispersión de los valores de una variable respecto a su media aritmética y se basa en la propiedad de ésta que dice que: . Leonardo Simmons  (x   ) i 1 i x k 2 fi desviación típica poblacional 10 Estadísticas I -05 N . a la cual denotaremos con la letra s (sigma). es decir: ( xi  x ) 2 f i   ( xi  C ) 2 f i  C  x  i 1 i 1 k k Tomando esta propiedad en consideración calcularemos la desviación típica o estándar de la población de una variable. con la siguiente expresión: sx  Prof.La suma de los cuadrados de los desvíos respecto de la media aritmética es un mínimo.

al igual que la media y la varianza. Nota: El término desviación estándar fue incorporado a la estadística por Karl Pearson en 1894. Leonardo Simmons Estadísticas I -05 . Si Sx  0 indica que los valores están cerca de la media (poca dispersión) Si Sx  +∞ indica que los valores están lejos de la media (mucha dispersión) La desviación típica. la desviación estándar es simplemente el "promedio" o variación esperada con respecto de la media aritmética. 11 Prof.MEDIDAS DE VARIABILIDAD – DESVIACION TIPICA Cuando estamos analizando una muestra a la desviación típica o estándar la denotamos con la letra S y se determina con la siguiente expresión: Sx   (x  x) i 1 i k 2 fi desviación típica muestral n 1 La desviación estándar es una medida del grado de dispersión de los datos respecto al promedio. es un índice muy sensible a los valores extremos. Dicho de otra manera.

MEDIDAS DE VARIABILIDAD – DESVIACION TIPICA Se demuestra que: para la población sx  Y para la muestra:  xi fi 2 i 1 k N  x 2 Sx   xi fi 2 k x2 i 1  n(n  1) n  1 12 Prof. Leonardo Simmons Estadísticas I -05 .

040 4.316 0.0.0.328 15.0003 0.0001 0.308 0.0000 0.318 .005 pulg 49 El proceso produce una pieza de espesor promedio 0.319) i 1 i 2 fi 50  1  15.0.322 .318 0.326 0.0.924 1.0003 0.Piezas 0.MEDIDAS DE VARIABILIDAD – DESVIACION TIPICA Ejemplo: La siguiente tabla corresponde a la distribución de frecuencias de una muestra de los espesores en pulgadas.328 xf 0. de recipientes de acero producidos por cierto proceso: Espesores en pulg No.0001 0.330 3 5 5 22 14 1 50 k x 0.314 .320 0.319 pulgadas con una variación de 0.0004 0.310 0.312 0.0011 2 Sx   (x  x) i 1 i k 2 fi n 1   ( x  0.324 0.326 .0.322 0.005 pulgadas 13 Prof.96  0.0. Leonardo Simmons Estadísticas I -05 .306 .314 0.968 (x-Media) f 0.310 .536 0.580 7.560 1.

MEDIDAS DE VARIABILIDAD – VARIANZA Definición: Definimos varianza a la media de los cuadrados de las desviaciones respecto a la media. es decir. la varianza es el cuadrado de la desviación típica.000025 pulg2 14 Prof. Leonardo Simmons Estadísticas I -05 . por lo tanto: Var( x)  s 2 x   (x   ) i 1 i x k 2 fi (Varianza Poblacional) N ( xi  x ) 2 f i  i 1 k Var( x)  S 2 x  En el ejemplo anterior: n 1 (Varianza Muestral) S2x = (0.005 pulg)2 = 0.

es decir. Sx > 0 y Var(x) = S2x > 0 2. Var(C) = 0 15 Prof.PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA 1. La varianza de la suma de una variable más una constante es igual a la varianza de la variable. es decir: Var(cX) = c2Var(X) = c2S2x En consecuencia la desviación típica de una constante por una variable será: Scx = \c\Sx 3. Leonardo Simmons Estadísticas I -05 . es decir: Var(X + c) = Var(X) = S2x En consecuencia: Sx+c= Sx Nota: La varianza de una constante es igual a cero. la varianza de una constante por una variable es igual al cuadrado de la constante por la varianza de la variable. La desviación típica y la varianza de una variable son estadísticos positivos.

S x y  S 2 x  S 2 y 6. Si x ʌ y son variables estadísticamente independientes entonces: 4. Si x ʌ y son variables que no son estadísticamente independientes entonces: Var(x±y) = Var(x) + Var(y) ± 2Cov(x. por lo tanto: Saxby c  a 2 S 2 x  b 2 S 2 y 5. Var (x ± y) = Var (x) + Var (y) = S2x + S2y . Var (ax + by+ c) = a2Var(x)+b2Var(y)= a2S2x + b2S2y . por lo tanto 5.y). donde Cov(x. Leonardo Simmons 16 Estadísticas I -05 .PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA 4.y) es la Covarianza (*) entre x ʌ y mide la magnitud de la asociación entre las dos variables y se determina por: Prof.

Si  ( x  x )( y  y ) i 1 k Nota (*): El concepto de covarianza se ampliará cuando abordemos el tema de las medidas de asociación entre dos variables n 1 (Covarianza muestral) X 1 .PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA Cov( x. …nr de la misma variable entonces la varianza de la unión de las r-muestras será la media de las varianzas más la varianza de las medias. y )  s xy   ( x   )( y   i 1 x k y ) (Covarianza Poblacional) N Cov( x... S22... es decir: S2   ni S i i 1 r 2 n  ni ( X i  X ) 2  i 1 r n donde n   ni i 1 r 17 Prof. Leonardo Simmons Estadísticas I -05 . X 2 . n2.…Sr2 representan las medias aritméticas y las varianzas de r muestras de tamaño n1. X r y S12. y )  S xy  5.

PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA Si las r-muestras fuesen del mismo tamaño entonces: S2  S i 1 r 2 i r  (X i 1 r i  X )2 r Si las r-muestras fuesen del mismo tamaño y tuviesen la misma media entonces: S2  S i 1 r 2 i r 18 Prof. Leonardo Simmons Estadísticas I -05 .

PROPIEDADES DE LA DESVIACION TIPICA Y VARIANZA Ejemplo (1): Hallar la media del número de establecimientos hoteleros que hay en las distintas Comunidades Autónomas de España. Leonardo Simmons Estadísticas I -05 .019 Extremadura 418 Galicia 1. Después. CC.266 Aragón 712 Asturas (Principado de) 620 Baleares (Islas) 1. luego: x  x i 1 18 i N 18 i 1  902 Establecimientos 2 sx   (x .242 Murcia (Región de) 209 Navarra (C. comenta si esta media es representativa de todas las comunidades autónomas.713 Comunidad Valenciana 1.x) i N  731. con ayuda de la desviación típica.14 Establecimientos Como la desviación típica es muy alta. 19 Prof.483 Canarias 532 Cantabria 496 Castilla y León 1.526 Madrid (Comunidad de) 1. luego el dato de la media no es representativo. Foral de) 150 País Vasco 396 Rioja (La) 117 Ceuta y Melilla 36 Se trata de la población de establecimientos en España distribuido en las 18 Comunidades Autónomas de ese país. esto me indica que los datos reales se diferencian mucho de la media.AA. Nº establecimientos hoteleros Andalucía 2.452 Castilla-La Mancha 842 Cataluña 2.

r ≤ 1-1/k2 K>1  x  ks x  x  ks X P.5)2=0.ej: La distribución de contribuciones al SSO tiene media Bs. la proporción (r) mínima de los valores que se encuentran dentro de k desviaciones estándares desde la media es al menos 1 – 1/k2.5 veces la desviación: 1-1/k2 = 1 – 1/(3. donde k es una constante mayor que 1. 51.54 y desviación estándar Bs. Leonardo Simmons Estadísticas I -05 . 7.TEOREMA DE CHEBYSHEV Teorema de Chebyshev (Desigualdad de Chebyshev): Para cualquier distribución estadística de datos de una variable (muestra o población).92 o sea 92% 20 Prof. ¿Qué porcentaje de contribuyentes como mínimo aportan entre la media más o menos 3.51.

REGLA EMPIRICA Regla Empírica o Regla Normal: Para distribuciones simétricas o en forma de “campana” (Normales). se cumple que: 68% de los datos 99.7% de los datos x  s x x  s X  x  3s x  x  3s X 95% de los datos  x  2s x  x  2s X 21 Prof. Leonardo Simmons Estadísticas I -05 .

Q1)/2 22 Prof.MEDIDAS DE VARIABILIDAD – RANGO INTERCUARTIL Definición: El rango intercuartil es una medida de variabilidad adecuada cuando la medida de posición central empleada ha sido la mediana y él se define como la diferencia entre el Tercer Cuartil (Q3) y el Primer Cuartil (Q1). Leonardo Simmons Estadísticas I -05 .Q1 25% Q1 50% Q2 Q3 25% A la mitad del rango intercuartil se le conoce como Desviación Cuartil (DQ): DQ = RQ /2= (Q3 . es decir: RQ = Q3 .

además de ubicar valores extremos: x Q3+1. C 23 Prof.5 RQ Xmax Q3 Q2 Q1 Xmin Q1 -1.5 RQ Dist. B Dist. Leonardo Simmons Estadísticas I -05 .DIAGRAMA DE CAJA El Rango Intercuartil se usa para construir los Diagramas de Caja que sirven para visualizar la variabilidad de una variable y comparar distribuciones de la misma variable. A Dist.

se cumple que: |Xmin-Q1| =|Xmax-Q3| |Q2-Q1| =|Q2-Q3| Q2 = X Distribución asimétrica negativa se cumple que: X < Q2=Me< Mo Distribución asimétrica positiva se cumple que: X > Q2=Me> Mo 24 Prof.DIAGRAMA DE CAJA Distribución simétrica o en forma de “campana” (Normal). Leonardo Simmons Estadísticas I -05 .

por ejemplo. 25 Prof. Estas variables podrían tener unidades diferentes. podremos determinar si los datos tomados al medir el volumen de llenado de un envase de cierto líquido varían más que los datos tomados al medir la temperatura de el liquido contenido en el envase al salir al consumidor. El coeficiente de variación elimina la dimensionalidad de las variables y tiene en cuenta la proporción existente entre una medida de tendencia y la desviación típica o estándar.COEFICIENTE DE DE VARIACION Definición: El coeficiente de variación permite comparar la dispersión entre dos poblaciones distintas e incluso. Leonardo Simmons Estadísticas I -05 . El volumen los mediremos en centímetros cúbicos y la temperatura en grados centígrados. comparar la variación producto de dos variables diferentes (que pueden provenir de una misma población).

5% Hay mayor homogeneidad (menor variación) en los pesos 26 Prof. Sx = 8 Kg.COEFICIENTE DE VARIACION Coeficiente de variación (Cv): Equivale a la razón entre la media aritmética y la desviación típica o estándar.61 mts ¿en cuál de los dos aspectos los estudiantes son más homogéneos? CVx = 8/68*100=11.7% mientras que CVy = 0. obtendremos el coeficiente de variación mediana: CVxM e  Sx 100 Me P.70*100 = 39. y = 1.70 mts. Sx CVx  100 X Si envés de la media aritmética se emplea la mediana.ej: se han tomado los pesos y las estaturas de los alumnos de una sección hallándose que: X = 68 Kg . Leonardo Simmons Estadísticas I -05 .61/1. Sy = 0.

la diferencia de dicho valor con la media (Xi .. Si definimos la variable Z como: Z Xi  X . + ) Tipificación Z= (X-X)/Sx X. digamos Xi.TIPIFICACION DE VARIABLES Sea X la variable que toma los valores X1.Xk. Sz=1 27 Prof. A la variable Z la llámanos variable estandarizada o tipificada y se cumple que Z no tiene unidades y siempre Z = 0 y Sz = 1 y Z pertenece a (. de media X y desviación estándar Sx entonces si tomamos cualquier valor de X. Leonardo Simmons Estadísticas I -05 .. Z=0. i  1. …. Sx Z.X ) mide la distancia entre estos dos valores y si dividimos tal diferencia entre la desviación típica. obtendremos las cantidad de desviación típicas que dista Xi de la media.k Sx Se demuestra que Z = 0 y Sz = 1 independientemente de los estadísticos de la variable X... X. X2..

TIPIFICACION DE VARIABLES X1 X2 X Xk X  Z1=(X1-X)/Sx Z2=(X2-X)/Sx Z1 Z2 Z=0 z  Zk=(Xk-X)/Sx Z=(X . Leonardo Simmons Estadísticas I -05 .X)/Sx=0 Prof.

es decir si Xi > X entonces Zi > 0 • Si Z1= -0. es decir si Xi < X entonces Zi < 0 • El valor tipificado o estandarizado de la media de la variable siempre será o cero: Zx  X X 0 Sx 29 Prof.2 desviaciones típicas mayor que la media de X.5 indicaría que X1 esta a 0. Leonardo Simmons Estadísticas I -05 .2 indicaría que X1 es 1.TIPIFICACION DE VARIABLES La interpretación de Z es como sigue: • Si Z1= 1.5 o ½ desviaciones típicas a la izquierda de la media de X.

que la del alumno B en relación a la suya 30 Prof.ej.TIPIFICACION DE VARIABLES Uso de la Tipificación o Estandarización: P.13)/6 = 1/6 ZA=1/5 Para B: ZB = (14 – 15)/5 = -1/5 ZB=-1/6 -3 -2 -1 0 1 2 3 z Se aprecia que la calificación del alumno A es mejor en relación a su clase. Leonardo Simmons Estadísticas I -05 .: Dos estudiantes uno de Contaduría (A) y el otro de Administración (B) obtienen las siguientes notas: A: 12 ptos en Auditoria B: 14 Ptos en Investigación de Operaciones Los estadísticos para las clases respectivas fueron: Clase de A: Nota promedio de Auditoría XA = 13 ptos con SA = 6 ptos Clase de B: Nota promedio de IO XB = 15 ptos con SB = 5 ptos Evidentemente no se pueden comparar directamente las notas de los dos estudiantes porque el rendimiento de sus respectivas clases es diferente. La comparación habrá de hacerse a través de la variable tipificada: Para A: ZA = (12 .

Típica A B 20% 30% 6% 12% El porcentaje reportado por los gerentes de producción de ambos países fueron: Gte.TIPIFICACION DE VARIABLES P.: Una empresa que posee una fabrica en el país A y otra en B ha realizado una encuesta relativa al porcentaje que de su sueldo gastan sus empleados por concepto de alimentación. Producción A: 32% Gte.ej. Leonardo Simmons Estadísticas I -05 . Producción B: 42% Respecto a la realidad económica de cada país.30)/12 = 1 Para país B: Z = (32 – 20)/6 = 2 31 Prof. obteniéndose los siguientes datos: País Media Desv. cual de ellos se podría decir que gasta menos en alimentación? Tratándose de realidades distintas. la comparación habrá de hacerse a través de la variable tipificada: Para país A: Z = (42 .

País B Z=1 -3 -2 Realidad Económica Media -1 0 1 2 3 Z=2 z Se aprecia que el gerente del país A.TIPIFICACION DE VARIABLES GTE. en proporción gasta menos en alimentación respecto a la realidad económica de su país que lo que gasta el gerente del país B respecto a la suya 32 Prof. no obstante las apariencias numéricas. País A GTE. Leonardo Simmons Estadísticas I -05 .

Atípicos Atípicos -3 -2 -1 0 1 2 3 z 33 Prof. Leonardo Simmons Estadísticas I -05 .7% de los datos están comprendidos en el intervalo x±3sx por lo tanto en la escala estandarizada (Z) ese intervalo se convierte en [-3. Luego todo valor de X cuyo valor estandarizado este fuera del anterior intervalo se puede considerar atipico. 3].DETECCION DE VALORES ATIPICOS CON Z SI UNA DISTRIBUCIÓN ES APROXIMADAMENTE “Normal” entonces según la regla empírica aproximadamente el 99.

denominada coeficiente de asimetría. de forma natural. Para saber si una distribución de frecuencias es simétrica. Una de estas medidas es una estadística que busca expresar la simetría ( o falta de ella ) que manifiestan los datos. Podemos basarnos en ella para. hay que precisar con respecto a qué.MEDIDAS DE ASIMETRIA Definición: Además de la posición (tendencia) y la dispersión de un conjunto de datos. decir que una distribución de frecuencias es simétrica si el lado derecho de la gráfica (histograma o polígono de frecuencias (a partir de la mediana) es la imagen por un espejo del lado izquierdo 34 Prof. Un buen candidato es la mediana ya que divide a la distribución de frecuencias en dos partes de igual área (50-50). Leonardo Simmons Estadísticas I -05 . es común usar medidas de forma en la descripción.

MEDIDAS DE ASIMETRIA Coeficiente de Asimetría basado en los tres cuartiles (Yule-Bowley) : Si una distribución es simétrica. Leonardo Simmons Estadísticas I -05 . es claro que deben haber tantas observaciones entre la que deja por debajo de sí las tres cuartas partes de la distribución y la mediana. De forma abreviada esto es. Q3 – Q2 = Q2 – Q1 Una pista para saber si una distribución de frecuencias es asimétrica positiva es cuando: Q3 – Q2 > Q2 – Q1 35 Prof. como entre la mediana y la que deja por debajo de sí un quarto de todas las observaciones.

las cantidades ( X i  X ) .MEDIDAS DE ASIMETRIA Por analogía. con p impar positivas estarían muy aumentadas al elevarse a p. utilizamos como índice de asimetría la cantidad: Q3  2Q2  Q1 Q3  2Q2  Q1 AQ   Q3  Q1 RQ  1  AQ  1 Coeficiente de Asimetría basado en el momento central de tercer orden: p Si la distribución fuese asimétrica positiva. Esta propiedad nos indica que un índice de asimetría posible consiste en tomar p=3 y definir: 36 Prof. se tendrá: Q3 – Q2 < Q2 – Q1 Para quitar dimensionalidad al problema. Leonardo Simmons Estadísticas I -05 . si es asimétrica negativa.

podemos definir otras medidas de asimetría. Leonardo Simmons Estadísticas I -05 .  1  A3  1 Otros Coeficientes de Asimetría: Basándonos en que si una distribución de frecuencias es simétrica y unimodal.MEDIDAS DE ASIMETRIA ( X i  X )3  i 1 k A3  Apoyándonos en este índice. la mediana y la moda coinciden. n S x3 . diremos que hay asimetría positiva si A3>0. como: X  Mo A  Sx ó 3( X  M e ) A  Sx Diremos que hay asimetría positiva si A>0 y negativa si A<0 37 Prof. entonces la media. y que la asimetría es negativa si A3<0.

13 27 13 -.15 31 15 -.94 días Me = Q2=13.11 18 11 -.5 13.5 16 18 F 4 22 36 63 105 136 156 157 x = 13.5 12.4 días Q1= 12. Leonardo Simmons Estadísticas I -05 .1 = 2.4-12.9 4 9 -.12 14 12 -.MEDIDAS DE ASIMETRIA P.19 1 157 x 8 10 11.5 14.ej: Los días-calle de la población de cuentas x cobrar de una firma se distribuyen de la siguiente forma: Días No.09 Este resultado nos indica que existe una ligera asimetría a la izquierda (negativa).17 20 17 -. Además: AQ = -0.4 días Lo que nos dice que aproximadamente en un rango de (Q3-Q1) = 14. Un resultado similar se obtiene si observamos que la distribución de frecuencias es unimodal.21 sx 38 Prof.1 días Q3 =14.14 42 14 -.Cuentas 7 -.15 días sx= 1.3 días se encuentra el 50% central del total de observaciones. siendo Mo = 13.6 días y A  x  M o   0.

La curtosis se determinará a partir del momento central de cuarto orden.Leptocúrtica 39 Prof. Una mayor curtosis implica que la mayor parte de la varianza (variación) es debida a desviaciones infrecuentes en los extremos. la Kurtosis (Curtosis) es una medida de lo "picudo"(concentrada en torno a la media) de la distribución de frecuencia de una variable cuantitativa. la distribución es más apuntada de lo “normal” . la distribución tiene un apuntamiento “normal” – Mesocúrtica Si k > 0. que se oponen a desviaciones comunes de medidas menos pronunciadas. esto 4 es ( X i  X ) : k k ( X i  X )4 fi  i 1 Se cumple que: Si K < 0. la distribución es menos apuntada de lo “normal” –Platicúrtica Si K = 0. Leonardo Simmons Estadísticas I -05 nS 4 x 3 .MEDIDAS DE FORMA – KURTOSIS (CURTOSIS) Definición: En estadística.

Leonardo Simmons Estadísticas I -05 . el calculo de la curtosis resulta igual a: K = +0.MEDIDAS DE FORMA – KURTOSIS (CURTOSIS) Curtosis Negativa Platicúrtica Curtosis nula Mesocúrtica Curtosis Positiva Leptocúrtica En el ejemplo de los días-calle de la población de cuentas x cobrar de una firma.094 lo que implica que dicha distribución tiene un apuntamiento casi normal. 40 Prof.

Y EL DR. Compilación.fundacionempresaspolar. 88 al 89). Edición .org/matematica2/index.TAREA No.cuao. Gaudard. desarrollo y traducción libre: por Rogelio Carrillo Penso http://sev. EDWARDS DEMING Por: Brian L.98 al 99) 41 Prof. 42 al 46 (pag.5 1. Ingrese a la página de la Fundación Polar y lea los fascículos 20 y 21 de la serie El Mundo de Las Matemáticas. 94 al 95). los ejercicios del 15 al 26 (pag. JOINER ASSOCIATES INC. Leonardo Simmons Estadísticas I -05 . que trata de la variabilidad estadística: http://www. Resolver del libro Estadística para Administración y Economía – Anderson – 8va.pdf 2. 31 al 37 (pag. Quality Progress. Joiner y Marie A. capitulo 3. Diciembre de 1990.edu.html 3. W.co/mipymes/Documentos/Calidad/VariacionGerenciayDeming. Tómese unos minutos de su tiempo y lea detenidamente el siguiente articulo: VARIACIÓN. GERENCIA.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->