Está en la página 1de 48

UNIVERSIDAD NACIONAL SAN AGUSTIN DE

AREQUIPA
FACULTAD DE PSICOLOGA, RELACIONES INDUSTRIALES
Y CIENCIAS DE LA COMUNICACIN
DEPARTAMENTO ACADMICO DE ESTADISTICA
AREQUIPA -
2012
MEDIDAS ESTADSTICAS
s
2
m
s
N
x
M D
i

=
| |
.

2
2
2
2
) (

o =

=

N
x
N
x
i i
2
2
2
) (

o =

=

N
x
N
x
i i
n
x
x
i

=
1. Medidas de tendencia central
- Media ( aritmtica, geomtrica y armnica)
- Mediana
- Moda

2. Medidas de dispersion
- Rango
- Varianza
- Desviacin Standard

3. Asimetria y apuntamiento

Grafica tus
datos
Interpreta lo
que ves
Resmenes
Numricos?
Modelos
Matemtico
s?
Comienzas representando grficamente e
interpretando lo que t ves
Buscas patrones globales y desviaciones llamativas
de esos patrones, y buscas explicaciones en el
contexto del problema
Basado en el examen de los datos, escoges
apropiadas descripciones numricas de aspectos
especficos
Si el patrn global es suficientemente regular, buscas
a un modelo matemtico compacto para ese patrn
CUANDO T EXAMINAS UN CONJUNTO DE DATOS.
(Moore, 1999, Pg. 251).
David Moore sintetiza la esencia de lo que se quiere ensear en este
curso
MEDIA
ARITMTICA
MEDIANA
MODA
MEDIA
PONDERADA
MEDIA
GEOMTR
ICA
MEDIA
ARMNICA
FRACTILES
DESVIACIN
MEDIA
VARIANZA
DESVIACIN
ESTNDAR
ALCANCE
INTERCU
ARTIL
ALCANCE
INTERDECIL
ALCANCE
INTERPERCENTIL
RANGO o
ALCANCE
-CUARTILES
-DECILES
-PERCENTILES
MEDIDAS DE FORMA
CURTOSIS SIMETRA
HACIA QU VALOR SE
AMONTONA LA MAYORA
DE LOS DATOS?
CUN DISPERSOS
ESTN LOS DATOS?

EN CUNTO SE PARECE NUESTRA
CURVA DE FRECUENCIA A UNA
DISTRIBUCIN NORMAL?
MEDIA
ARITMTICA
MEDIANA
MODA
MEDIA
PONDERADA
MEDIA
GEOMTRICA
MEDIA
ARM
NICA
DECILES
PERCENTILES
CUARTILES
MEDIDAS DE POSICIN

MEDIA
ARITMTICA
MEDIA
PONDERADA
Para una
poblacin de N
elementos
N
x

=
n
x
x
i

=
Para una muestra
de n elementos
n
x
X
n
i
i i
=
=
1
f
La media aritmtica de los valores x
1
, x
2
, x
3
, . . . x
k
ponderada por
los pesos w
1
, w
2
, w
3
, . . . w
k
es el nmero:
Ejemplo: Si un alumno en el semestre anterior ha obtenido 11 en el
curso A de 5 crditos, 13 en el curso B de 4 crditos y 16 en el curso C
de 3 crditos. Entonces su promedio (ponderado por los crditos) es:

=
=
=
+ + + +
+ + + +
=
k
i
i
k
i
i i
k
k k
w
x w
w w w w
x w x w x w x w
X
1
1
3 2 1
3 3 2 2 1 1
...
...
Rpta: 13,06
ELEMENTO REPRESENTATIVO DE UN CONJUNTO DE
VALORES DADOS, CUYA DISTRIBUCIN ES
APROXIMADAMENTE SIMTRICA.
SIGNIFICADOS DE LA MEDIA ARITMTICA
SIRVE PARA OBTENER UNA CANTIDAD IGUAL A REPARTIR
PARA CONSEGUIR UNA DISTRIBUCIN UNIFORME.
SIRVE PARA ESTIMAR UNA CANTIDAD DESCONOCIDA EN
PRESENCIA DE ERRORES DE MEDIDA.
SIRVE PARA CONOCER EL VALOR QUE SE OBTENDR CON
MAYOR PROBABILIDAD AL TOMAR UN ELEMENTO AL AZAR,
DE UNA POBLACIN
Ventajas:
Concepto familiar para muchas personas
Es nica para cada conjunto de datos
Es posible comparar medias de diferentes
muestras
Desventajas
Se ve afectada por los datos extremos
Si la muestra es grande y los datos no
estn agrupados, su clculo es
tedioso
Si los datos estn agrupados en clases
con extremos abiertos, no es posible
calcular la media.
VENTAJAS Y DESVENTAJAS DE LA
MEDIA ARITMTICA
Ejemplo:
La siguiente tabla muestra el nmero
de reclamos y quejas presentadas por
clientes en el Servicio de
mantenimiento a lo largo de una
semana. Calcule e interprete la media.
Da/Semana Lun Mar Mier Jue Vier Sab
Reclamos/da 8 10 5 12 10 15
Ejemplo:
La distribucin de frecuencias siguiente,
representa los puntajes obtenidos en una
evaluacin del desempeo, aplicado al
personal tcnico de una empresa. El puntaje
mximo en la prueba es 50. Calcule e
interprete la media.
Desempeo Nmero de
(puntos) tcnicos
12 - 16 4
17 - 21 8
22 - 26 15
27 - 31 23
32 - 36 10
TOTAL 60
Ejemplo: Una empresa comercializadora de
Seguros Mdicos dispone de 3
representantes para la zona de Miraflores,
cada uno de los cuales cobra diferente
comisin por pliza vendida, y realiza
diferente nmero de contratos. Calcule e
interprete el valor medio de la comisin





N de polizas de Comisin
Vendedor Seguro Mdico por venta $
Pedro 30 30
Juan 25 40
Pablo 20 50
i
w i
X
Interpretacin:
Si se elige al azar un representante se espera que
cobre una comisin de $38.67 por pliza vendida.
67 . 38 $
75
2900
20 25 30
) 50 ( 20 ) 40 ( 25 ) 30 ( 30
= =
+ +
+ +
=
p
x
SOLUCIN:
MEDIANA
Una vez que se han ordenado los datos, la mitad de
ellos
(N / 2) ( n / 2 ) es menor o igual que la mediana y la
otra mitad es mayor o igual que la mediana.
MODA
Clculo de la mediana a partir de datos no
tabulados
Para hallar la mediana de un conjunto de datos,
primero hay que organizarlos en orden
descendente o ascendente.

Si el conjunto de datos contiene un nmero impar
de elementos, el dato central en el arreglo
ordenado es la mediana. Su ubicacin se
encuentra con la frmula: 2
1 +
=
n
Me
MEDIANA
Si hay un nmero par de observaciones, la
mediana es el promedio de los dos elementos
ordenados centrales. Su ubicacin se encuentra
con la frmula:
2
n
Me =
MEDIANA
k
k
k
k
c
f
F
n
X Me
2

1
1
|
|
|
|
.
|

\
|

+ =

donde:
X
k-1
: es el lmite real inferior de la clase mediana o del
intervalo donde se ubica la Me.
n : nmero total de datos u observaciones.
F
k-1
: frecuencia absoluta acumulada inferior al
Intervalo de la Me.
f
k
: frecuencia absoluta de la clase mediana o del
Intervalo de la Me.
c
k
: amplitud o ancho del intervalo mediano
Ejemplo: La tabla siguiente muestra la experiencia laboral
(aos) del personal de seguridad que labora en una
institucin. Calcule e interprete la mediana.
Experiencia Nmero de
laboral trabajadores
(aos) de seguridad
0 - 3 4
4 - 7 12
Clase
Mediana
8 - 11 24
12 - 15 16
16 - 19 10
20 - 23 3
69
Lugar de la mediana:
4
24
) 16 (
2
1 69
5 , 7
(
(
(


+
+ = d M
4
24
16 35
5 , 7
(


+ =
Mediana = 10,5 aos
o
35
2
1 69
2
1
=
+
=
+ n
Interpretacin:

La mitad del personal de seguridad que
labora en esta institucin tienen una
experiencia laboral igual o menor a 10 aos 6
meses. La otra mitad de este personal tiene
una experiencia laboral igual o mayor a 10
aos y 6 meses.
e) Ventajas:
Los valores extremos no afectan a la mediana como
en el caso de la media aritmtica.
Es fcil de calcular, interpretar y entender.
Se puede determinar para datos cualitativos,
registrados bajo una escala ordinal.

Desventajas:
Como valor central, se debe ordenar primero la
serie de datos.
Para una serie amplia de datos no agrupados, el
proceso de ordenamiento de los datos demanda
tiempo y usualmente provoca equivocaciones.
VENTAJAS Y DESVENTAJAS DE LA MEDIANA




MODA
La moda es aquel valor que ms se repite
en el conjunto de datos. En ocasiones, el
azar hace que un solo elemento no
representativo se repita lo suficiente para
ser el valor ms frecuente del conjunto de
datos. Es por esta razn que rara vez
utilizamos la moda de un conjunto de
datos no agrupados como medida de
tendencia central.
el dato que ms se repite
o la mayor frecuencia de un
conjunto de datos
PARA DATOS
NO AGRUPADOS
PARA DATOS
AGRUPADOS
Se toma el dato que ms se repite
Si fuesen dos valores diferentes,
se habla de bimodal, de ser tres,
sera trimodal

es
Se calcula
k k
c X Mo
2 1
1
1
|
|
.
|

\
|
A + A
A
+ =

MODA
Donde:
X
k-1
: lmite real inferior de la clase modal, o sea la
de mayor frecuencia.
= diferencia entre las frecuencias de la clase
modal y la clase contigua inferior.
= diferencia entre las frecuencias de la clase
modal y la clase contigua superior.
c
k
: amplitud del intervalo modal

1
A
2
A
Las clases mediana y modal pueden coincidir pero
conceptualmente son diferentes.
Ejemplo: La tabla siguiente muestra los errores de
facturacin durante un mes, en una Empresa. Calcule e
interprete la moda.








Interpretacin: Durante un mes, el nmero ms frecuente
de errores de facturacin en esta empresa es 6.
Errores de
f acturacin Das
0 - 3 6
4 - 7 12
Clase
Modal
8 - 11 8
12 - 15 3
16 - 19 1
Total 30
Clase moda : (4 - 7)



Mo = 5,9
6
1
= A
4
2
= A
4
4 6
6
5 . 3 Mo
|
.
|

\
|
+
+ =
VENTAJAS
Se puede utilizar tanto para datos
cualitativos como cuantitativos.
No se ve afectada por los valores extremos.
Se puede calcular, a pesar de que existan
una o ms clases abiertas.
DESVENTAJAS:
No tiene un uso tan frecuente como la
media.
Muchas veces no existe moda (distribucin
amodal).
En otros casos la distribucin tiene varias
modas, lo que dificulta su interpretacin.
Ventajas y desventajas de la
moda
EJEMPLO
Para los datos de las remuneraciones (en dlares)
de 50 obreros de construccin civil, calcular,
Media aritmtica, mediana y Moda
Remuneraciones X
i
f
i

45 - 52
52 - 59
59 - 66
66 - 73
73 - 80
80 - 87
87 - 94
48,5
55,5
62,5
69,5
76,5
83,5
90,5
3
7
7
18
8
4
3
50
CUARTILES
k
k
k
k r
c
n
N
rn
X Q
4
1
1
|
|
|
|
.
|

\
|

+ =

DECILES
k
k
k
k r
c
n
N
n r
X D
10

1
1
|
|
|
|
|
.
|

\
|

+ =

MEDIDAS DE POSICIN - FRACTILES


PERCENTILES
k
k
k
k r
c
n
N
n r
X P
100

1
1
|
|
|
|
|
.
|

\
|

+ =

Ejemplo:
La tabla muestra la experiencia (en aos) de
Trabajadores de un centro minero.
Experiencia Trabajadores
(aos)
0 - 3 18
4 - 7 42
8 - 11 68
12 - 15 120
16 - 19 40
20 - 23 34
24 - 27 12
Total 334
Sobre qu edad se ubica el 25% de los
trabajadores de mayor experiencia?
Para saber en cul clase se halla este dato, se
calcul la frecuencia acumulativa.
Menor
Experiencia
Mayor
Experiencia
75 % 25 %
P
75

K = 75
) ordenados nmeros los de ( 5 , 250
100
) 334 ( 75
100
Kn
P del Lugar
o
75
= = =
Experiencia N Trabajadores Frec. Acumulada
(aos)
0 - 3 18 18
4 - 7 42 60
8 - 11 68 128
12 - 15 120 248
16 - 19 40 288
20 - 23 34 322
24 - 27 12 334
334
Interpretacin: Para que un trabajador est
comprendido dentro del 25% de mayor experiencia
laboral debe tener al menos 15 aos, 7 meses y 24
das.
( )
4
40
1 248
100
75(334)
5 . 15
75
P
(
(
(

+
+ =
aos 65 . 15
75
P =
i
F
i
f
En esta clase
se localizan del
249 - 288
F=248
SIMETRIA Y APUNTAMIENTO
Para saber si una distribucin de frecuencias es
simtrica, hay que precisar con respecto a qu.
Un buen candidato es la mediana, ya que para
variables continuas, divide al histograma de
frecuencias en dos partes de igual rea.
Podemos basarnos en ella para, de forma
natural, decir que una distribucin de frecuencias
es simtrica si el lado derecho de la grfica (a
partir de la mediana) es la imagen por un espejo
del lado izquierdo.
Cuando la variable es discreta, decimos que es
simtrica, si lo es con respecto a la media.
Las curvas que representan a un conjunto de
datos, pueden ser analizadas de acuerdo a
su:
a) Simetra o Sesgo
b) Curtosis o apuntamiento

Las curvas simtricas, tienen una forma tal
que con una lnea vertical que pase por el
punto ms alto de la curva, dividir el rea de
esta en dos partes iguales.
SIMETRIA Y APUNTAMIENTO
Mo Me X = =
DISTRIBUCIN SIMTRICA
Las curvas sesgadas son aquellas cuyos valores
estn concentrados en el extremo inferior o superior
de la escala de medicin del eje horizontal. La cola
indica el tipo de sesgo.
SIMETRIA Y APUNTAMIENTO
DISTRIBUCIN ASIMTRICA
POSITIVA NEGATIVA
> Me > Mo

X X
< Me < Mo
SIMETRIA Y APUNTAMIENTO
INDICES DE ASIMETRA.
POSITIVA
NEGATIVA
3
3
1
) (
s
n x x
g
i i

=
COEFICIENTE DE FISHER
Si g
1
> 0 distribucin
asimtrica positiva
Si g
1
< 0 distribucin
asimtrica negativa
Si g
1
= 0 distribucin
simtrica.

SIMETRA vs SESGO
COEFICIENTE DE ASIMETRA
Mide el grado de ASIMETRA de la distribucin de frecuencia,
respecto a la curva de distribucin normal que tiene
coeficiente igual a 0.
g
1
= 0 g
1
> 0 g
1
< 0
COEFICIENTE DE ASIMETRA DE PEARSON
Miden el grado de agudeza, la
mayor o menor cantidad de datos
que se agrupan en torno al valor
central. Se definen 3 tipos de
distribuciones segn su grado de
curtosis:
Leptocrtica (concentracin al centro)
Mesocrtica distribuidos simtricamente)
Platicrtica (aplanada).

El Apuntamiento o Curtosis
SIMETRIA Y APUNTAMIENTO
SIMETRIA Y APUNTAMIENTO
INDICE DE CURTOSIS
Coeficiente de FISHER
3
) (
4
4
2

=

s
n X x
g
i i
Si g
2
> 0 la distribucin ser leptocrtica o apuntada
Si g
2
= 0 la distribucin ser mesocrtica o normal
Si g
2
< 0 la distribucin ser platicrtica o menos
apuntada que lo normal

g
2
= 0
g
2
> 0
g
2
< 0
COEFICIENTE DE CURTOSIS
Mide el grado de apuntamiento o achatamiento
de la distribucin de frecuencia, respecto a la
curva de distribucin normal que tiene coeficiente
igual a 0.
Califc, Acum.(base:19) Alumnos sec 2 (35 alumnos)
Calif.Acumulado en base a 19
N


a
l
u
m
n
o
s
0 4 8 12 16 20
0
3
6
9
12
15
Calif. Acum. (base 19). 24 alumnos seccion 1
Calif. Acum en base a 19
n


d
e

a
l
u
m
n
o
s
0 3 6 9 12 15 18
0
2
4
6
8