Está en la página 1de 48

PRESENTACIONES

ESTADSTICAS
DISTRIBUCIONES
DE FRECUENCIAS.
Una distribucin de frecuencia es una
tabla en la cual se agrupan en clases
los valores posibles para una variable y
se registra el nmero de valores
observados que corresponde a cada
clase. Los datos organizados en una
distribucin de frecuencias se
denominan datos agrupados. Por el
contrario, para los datos no agrupados
se consideran todos los valores
observados de la variable.
1

EJEMPLO
La siguiente tabla muestra una
distribucin de frecuencias de
salarios.
Salario ($)
Nmero de
obreros (f)
2400-2599

2600-2799

20

2800-2999

33

3000-3199

25

3200-3399

11

3400-3599

4
Total

100

INTERVALOS DE CLASE
Por cada una de las clases de una
distribucin de frecuencias, los
lmites nominales de la clase
superior e inferior indican los valores
incluidos dentro de la clase.
Para ciertos propsitos los valores de
una clase se representan a menudo
por el punto medio de clase, que se
determina sumando la mitad del
intervalo de clase a su lmite inferior.
3

Salarios diarios de 100


empleados
Salario ($)
Nmero de
Punto medio
Lmites
obreros (f)

de clase

exactos de
clase

2400-2599

2499.5

2399.52599.5

2600-2799

20

2699.5

2599.52799.5

2800-2999

33

2899.5

2799.52999.5

3000-3199

25

3099.5

2999.53199.5

3200-3399

11

3299.5

3199.53399.5

3400-3599

3499.5

3399.53599.5

Total

100

Es deseable que todos los intervalos de clase en


una distribucin de frecuencias dada sean
iguales. Una frmula que puede usarse para
determinar el intervalo de clase aproximado es:
intervalo aproximado=(mayor valor-menor
valor)/nmero de clase que se desean.
Para los datos de los salarios, suponer que el
mayor sueldo es $3,580 y el menor es $2,420 y
se desean seis intervalos de clase.
Intervalo aproximado=(3,580-2,420)/6=$193.33
El tamao de clase conveniente ms prximo es:

$200
5

DESCRIPCIN DE DATOS DE
NEGOCIOS:
MEDIDAS DE POSICIN

MEDIDAS DE POSICIN EN
CONJUNTOS DE DATOS
Una medida de posicin es un valor
que se calcula para un grupo de
datos y que se utiliza para
describirlos de alguna manera.
Normalmente se desea que el valor
sea representativo de todos los
valores incluidos en el grupo y, por
ello se desea alguna clase de
promedio.

LA MEDIA ARITMTICA
La media aritmtica o promedio aritmtico,
se define como la divisin de la suma de
todos los valores entre el nmero de
valores.

X
X
n

Las dos frmulas son idnticas, sin embargo


en anlisis estadstico la primera se refiere a
una poblacin y la segunda a la muestra.

EJEMPLO 1
En determinado mes, 8 vendedores
de artculos electrnicos vendieron
las siguientes cantidades de equipos
o aparatos:
8,11,5,14,8,11,16,11.
Considerando a ste mes como la
poblacin
de unidades
X el promedio
84

10.5unidad
vendidas
es:

LA MEDIA PONDERADA
La media ponderada o promedio ponderado
es una media aritmtica, en la cual se
considera a cada uno de los valores de
acuerdo con su importancia en el grupo
Su expresin matemtica es:

( pX )
P oX p p
Cada uno de los valores del grupo (X) se
multiplica por el factor de ponderacin
apropiado (p) y despus se suman stos
productos y la suma se divide entre los
pesos o ponderaciones
9

Ejemplo 2.- media ponderada


En una empresa que maneja 4 productos,
los mrgenes de utilidad
correspondientes a cada uno de ellos
durante el ao fiscal anterior fueron:
producto A, 4.2%, producto B, 5.5%,
producto C, 7.4%, producto D, 10.1 %. El
margen de utilidad promedio no
ponderado es:X 27.2

6.8%

El cual es incorrecto ya que se vendieron


cantidades diferentes de los cuatro
productos
10

MEDIA PONDERADA
Product
o

Margen
de
utilidad
(X) %

Ventas (p) $

Px

4.2

30,000,000

1,260,000

5.5

20,000,000

1,100,000

7.4

5,000,000

370,000

10.1

3,000,000

303,000

SUMA p=
$58,000,000

SUMA
Px=$3,033,000

(pX )
$3,033,000
P oX p p $58,000,000 5.2%

11

LA MEDIANA
La mediana de un grupo de datos es el
valor del dato que ocupa un lugar de
cuando se les agrupa a todos en orden
ascendente o descendente. Para un
grupo con un nmero par de elementos,
se supone que la mediana se encuentra a
la mitad entre los dos valores adyacentes
del centro. Cuando el conjunto de datos
contiene un nmero grande de valores,
resulta til la siguiente frmula para
determinar la posicin de la mediana en
el conjunto ordenado:

Med X(( n / 2 ) (1 / 2 ))

12

Ejemplo 3.- Mediana

Los 8 vendedores que se describieron en el


ejemplo 1 vendieron el siguiente nmero de
aparatos en orden ascendente:
5,8,8,11,11,11,14,16. por lo tanto el valor
de la Mediana es:

Med X (( n / 2 ) (1 / 2 ))
Med X ((8 / 2 ) (1 / 2 ))
Med=4+1/2=4.5
El valor de la mediana se encuentra entre los
valores cuarto y quinto de ste conjunto
ordenado de datos, como los dos son
iguales a 11 en ste caso la mediana es 11

13

LA MODA
La moda es el valor que se presenta con
mayor frecuencia en un conjunto de datos.
Para un conjunto de datos poco numerosos en
los que no se repite ningn valor, no existe
moda. Cuando dos valores no adyacentes
tienen frecuencias mximas similares, se dice
que la distribucin es bimodal. A las
distribuciones de frecuencias que tienen
varias modas se les denomina multimodales.
Los 8 vendedores que se describieron en
el ejemplo 1 vendieron:
8,11,5,14,8,11,16 y 11. La moda para
ste grupo de valores es el de mayor
frecuencia o moda=11

14

Ejemplo Embotelladora
500540
550590
600640
650690
700740
750790
800840
850890
900940
950990

530

570,590

600,600,600,610,610,620,620,620,620,630,630

1
1
650,650,650,660,670,670,680,680,680,690
1
0
710,710,710,720,720,730,730,730,730,740,740,740
1
2
750,750,750,750,750,750,750,760,760,760,760,770,770,780,78 2
0,780,780,780,790,790,790
1
800,810,820,820,830,840
6
850,850,850,860,870,880,880,880,890

900,930,930,940

950,950,960,970

15

X 60820

760.25ml
N
80

16

MEDIANA

Med

(( n / 2 ) (1 / 2 ))

Med X ((80 / 2 ) (1 / 2 ) 40 1 / 2 40.5


Valor de posicin

17

530, 570,590,
600,600,600,610,610,620,620,620,620,630,63
0, 650,650,650,660,670,670,680,680,680,690,
710,710,710,720,720,730,730,730,730,740,74
0,

740,750,750,750,750,750,750,750,760,760,76
0,
760,770,770,780,780,780,780,780 ,
790,790,790, 800,810,820,820,830,840,
850,850,850,860,870,880,880,880,890,
900,930,930,940, 950,950,960,970

Mediana =(750+750)/2=750
18

MODA

MODA es el valor que ms se repite=750


600,600,600,610,610,620,620,620,620,630,630,
650,650,650,660,670,670,680,680,680,690,
710,710,710,720,720,730,730,730,730,740,740,
740,750,750,750,750,750,750,750,760,760,760,
760,770,770,780,780,780,780,780 ,
790,790,790, 800,810,820,820,830,840,
850,850,850,860,870,880,880,880,890,
900,930,930,940, 950,950,960,970

Moda =750

19

Media para datos agrupados


Cantida
d de
bebida
en ml

500-540
550-590
600-640
650-690
700-740
750-790
800-840
850-890
900-940

Nmer Frecuen Punto


o de
cia
medio
registr acumula de
os (f)
da
clase
(fa)
(X)

1
2
11
10
12
21

1
3
14
24
36
57

520
570
620
670
720
770

6
9
4

63
72
76

820
870
920

fX

520
1140
6820
6700
8640
1617
0
4920
7830
3680

20

Media para datos agrupados

(fX) 60300
MediaX

753.75ml
n
80

21

Mediana
n / 2 fa
Mediana Li (
)i
fc
Donde Li= lmite exacto inferior de la clase que contiene la mediana
N= nmero total de observaciones en la distribucin de frecuencia (n para muestra
fa=la frecuencia acumulada de la clase que precede a la clase que contiene la
mediana
.fc=nmero de observaciones en la clase que contiene la mediana
i=intervalo de clase
.

22

n / 2 fa
Mediana Li (
)i
fc
Por lo tanto: Li=(650+640)/2=645, n=80, fa=18, fc=10, i=50
Sustituyendo valores:
Mediana=745+((80/2)-36))/10*50=645+(40-36)/10*50=754.52
Mediana=754.52

23

Moda para datos agrupados


d1
Moda L i (
)i
d1 d 2
Donde:
Li=lmite exacto inferior de la clase modal y la
frecuencia de la clase precedente.
d1=diferencia entre la frecuencia de la clase modal y la
frecuencia de la clase precedente
d2=diferencia entre la frecuencia de la clase modal y la
frecuencia de la clase siguiente
i=tamao del intervalo de clase
.

24

Datos:
Li=(750+740/2=745
d1=9
d2 =15
i=50
Sustituyendo valores:

d1
Moda L i (
)i
d1 d 2
9
Moda 745 (
)10 763.5
9 15
25

Cuartiles, deciles y
percentiles de datos
agrupados

primer cuartil

mediana
segundo cuartil

tercer cuartil

100

26

Para datos agrupados la frmula de


la mediana se modifica de acuerdo
con el punto fraccionario de inters
Q1(primer cuartil)=Li+[(n/4)-fa)]*i

fc
D3(tercer decil)=Li+[(3n/10)-fa]*i

fc
P70 (percentil 70)=Li+[(70n/100)fa]*i

fc
27

Para los datos de la


embotelladora

Q1(primer cuartil)=Li+[(n/4)-fa)]*i
fc
Donde:
Li=(650+640)/2=645, n=80, fa=
Sustituyendo valores:
Q1=645+[(80/4)-24)]*50/21

Q1=685.48
28

Tercer decil
D3(tercer decil)=Li+[(3n/10)-fa]*i

fc
Donde Li=(650+640)/2=645
D3=645+[(3*80/10)-14)]*50/21

D3=668

29

Percentil 70
P70 (percentil 70)=Li+[(70n/100)fa]*i

fc
Donde Li=(850+840)/2=845
P70=845+[(70*80)/100)-63)]*50/21

P70=861
30

MEDIDAS DE VARIABILIDAD
Las medidas de variabilidad de
tendencia central son tiles para
identificar el valor tpico en un conjunto
de datos.
En contraste, las medidas de variabilidad
se ocupan de describir precisamente la
variabilidad entre los valores y son:
Rango, desviacin media, varianza,
desviacin estndar y coeficiente de
variacin.
31

Ejemplo
Suponer que dos mquinas empacadoras
distintas dan como resultado paquetes
con un peso promedio de 10 gramos de
caf, pero que en un caso todos los
paquetes se encuentran dentro de 0.10
gramos de ste peso, en tanto que en el
otro caso los pesos pueden variar hasta
en un gramo en cualquier direccin. Medir
la variabilidad o dispersin de las
cantidades que se empacan es tan
importante como medir el promedio.
32

EL RANGO
El rango R, es la diferencia entre los valores mayor y
menor del conjunto de datos.
R=My-Mn
Donde:
My= mayor valor del grupo
Mn=Menor valor del grupo
Ejemplo: Durante un mes determinado del verano, ocho
vendedores de aparatos electrnicos de una empresa
vendieron el siguiente nmero de
ventiladores:8,11,5,14,8,11,16,11. el rango del
nmero de unidades vendidas es:
R=My-Mn=16-5=11 unidades

33

DESVIACIN MEDIA
La desviacin media o DM se basa en la
diferencia entre el valor absoluto de
cada uno de los elementos conjuntos de
datos y la media del grupo. Despus se
calcula la media de esas desviaciones.
DM poblacional=X I
valor absoluto
N
de X-
Para los datos utilizados del ejemplo anterior
del equipo elctrico, la media aritmtica es
(8,11,5,14,8,11,16,11)/8=10.5
34

DESVIACIN MEDIA
X

X-

X-

-5.5

5.5

-2.5

2.5

-2.5

2.5

11

0.5

0.5

11

0.5

0.5

11

0.5

0.5

14

3.5

3.5

16

5.5

5.5

Total

21.0

DM= X- /N=21/8=2.625 unidades


As puede decirse que, en promedio las ventas de aparatos
elctricos por vendedor difieren en 2.6 unidades de la media
del grupo, en cualquier direccin

35

LA VARIANZA Y DESVIACIN
ESTNDAR
La varianza es
similar a la desviacin
media porque se basa en la diferencia
entre cada uno de los valores del
conjunto de datos y la media del grupo.
La diferencia consiste en que antes de
sumarlas, se eleva al cuadrado cada
una de las diferencias.
Para una poblacin se representa la
varianza mediante v(X) o, en forma ms
tpica, mediante .
( X )
La frmula es: v(X)==
N
2

36

Por lo general resulta difcil interpretar el


significado del valor de una varianza porque
las unidades en las que se expresa son
valores al cuadrado. Por sta razn se utiliza
con mayor frecuencia la raz cuadrada de la
varianza representada por y se le denomina
desviacin estndar.
2
Desviacin
estndar
poblacional
( X ) / N
Desviacin estndar muestral

37

Desviacin estndar
muestral

( X ) / n 1
2

38

Para los datos de ventas de


aparatos elctricos, la media
aritmtica es 10.5 unidades, por lo
tanto la desviacin estndar ser:
( X ) 2 / N 86 / 8 10.75 3.3

39

Hoja de trabajo para calcular la desviacin


estndar poblacional para los datos de
ventas de aparatos elctricos
X

X-

(X-)

-5.5

30.25

-2.5

6.25

-2.5

6.25

11

0.5

0.25

11

0.5

0.25

11

0.5

0.25

14

3.5

12.25

16

5.5

30.25

Total 86
40

Uso de la desviacin
estndar
La desviacin estndar es la medida de
dispersin ms importante. En anlisis
estadstico a una curva de frecuencias
simtrica y mesocrtica se le denomina
curva normal. Para una distribucin que
tiene distribucin normal, se sabe que
aproximadamente el 68% de las
mediciones se encuentran a no ms de 1
desviacin estndar y el 95% de las
mediciones a no ms de dos desviaciones
estndar.

41

COEFICIENTE DE ASIMETRA DE
PEARSON

ste coeficiente mide la desviacin


de la simetra, expresando a
diferencia entre la media y la
mediana con respecto a la desviacin
estndar del grupo de mediciones.
Las frmulas son:
Asimetra=3(-Med)/

42

Ejemplo
Para los datos de ventas de los aparatos
elctricos vistos: 5,8,8,11,11,11,14,16.
La media es =84/8=10.5
La
mediana=(n/2)+(1/2)=8/2+1/2=4.5=11
CAP=Asimetra=3(-Med)/=3(10.5-11)/3.3=0.45
As , la distribucin de las unidades vendidas
tiene una ligera asimetra negativa, es decir est
sesgada hacia la izquierda.
43

Problemas de distribucin normal de


probabilidad
Se ha ajustado el proceso de fabricacin de
un tornillo de manera que la longitud
promedio de los tornillos sea =13 cm. Por
supuesto no todos los tornillos tienen una
longitud exacta de 13 cms., debido a fuentes
aleatorias de variabilidad. La desviacin estndar
de la longitud de los tornillos es =0.1 cms., y se
sabe que la distribucin de las longitudes tiene
una forma normal. Determinar la probabilidad

de que un tornillo elegido al azar tenga una


longitud entre 13 y 13.2 cms.
44

Z=(X-)/=(13.2-13)/0.1=+2
P(13 X 13.2) P(0 Z 2.0) 0.4772
Valor obtenido de tablas

13.0

13.2

45

Para el problema mencionado de los


tornillos

Cul es la probabilidad de que la longitud del


tornillo exceda de 13.25 cms

13

13.25

Z=(X-)/=(13.25-13)/0.1=+2.5
P(X>13.25)=P(z>2.5)=0.500-0.4938=0.0062
De tablas se obtiene el valor de 0.4938

46

Cul es la probabilidad de que la


longitud del tornillo est entre
12.9 y 13.1 cms
Z1=(X1-)/ = (12.9-13)/0.1=-1.0 y de tablas se obtiene el

valor de 0.3413
Z2=(X2-)/ =(13.1-13)/0.1=+1 y de tablas se obtiene el
valor de 0.3413

P812.9 X 13.1) P(1.0 Z 1.0) 0.3413 0.3413 0.6826

12.9
X1

13.0 13.1
X2

47

Se observa que las cuentas por energa


elctrica en una determinada rea para un
mes determinado tienen una distribucin
normal. Si se determina que la media de los
consumos es $8,400 con una desviacin
estndar de $2,400, entonces puede
concluirse que el 68% de las cuentas por
consumo de energa elctrica se encuentran
a no ms de $2,400 de la media, o lo que es
lo mismo entre $6,000 y $10,800. tambin
puede concluirse que aproximadamente 95%
de las cuentas se encuentran a no ms de
$4,800 de la media o entre $3,600 y
$13,200.

48