Está en la página 1de 33

UNIDAD 1

Estadística descriptiva
MEDIDAS DE VARIABILIDAD

Objetivos específicos
Que el estudiante:
• Defina y calcule el Rango para datos
agrupados.
• Calcule e interprete la Desviación Media,
varianza y desviación típica.
DATOS AGRUPADOS
Aquellos datos que están agrupados por intervalos de clase.
1. Desviación media (DM)
 F Xm  
(población) MD 
N
 F Xm  x
(muestra) MD 
n 1
Recuerde que la media aritmética en este tipo de datos es:
 FXm
x
n
 FXm

N
2. Varianza ( )2

2
 F Xm  
Varianza  
2

Poblacional N

Varianza Muestral  F Xm  x 2

S  2

n 1
3. DESVIACION ESTANDAR ( )
2
 F Xm  
Población 
N
2

Muestra
 F Xm  x
S
n 1
1. Calcule el rango o amplitud
total (At) para las series agrupadas.
Amplitud total
At = Ls de la última clase – Li de la primera clase

At = Ls de la última clase – Li de la primera clase

At = 52 - 22
At = 30 años
2. Calcule la desviación media para
las series agrupadas.
Se usan formulas para muestra, de acuerdo al ejercicio planteado.

 f Xm  x
DM 
n 1
 fXm
x
n
2. Calcule la desviación media para
las series agrupadas.

 f Xm  x
DM 
n 1
Se usan formulas para muestra, de acuerdo al ejercicio planteado.
3. Calcule la Varianza para las series
agrupadas.
Se usan formulas para muestra, de acuerdo
al ejercicio planteado.
4. Calcule desviación estándar para las
series agrupadas.
Se usan formulas para muestra, de acuerdo
al ejercicio planteado.
Se usan formulas para muestra, de acuerdo
al ejercicio planteado.

Desviación estándar.

Resultados obtenidos
OTROS EJEMPLOS
Medidas de Variabilidad o Dispersión
Datos Agrupados

At = Ls de la última clase – Li de la primera clase

Puntaje f At = 57 - 28
o blación
P
28 – 32 10 At = 29 puntos
33 – 37 15
38 – 42 20
43 – 47 35
48 – 52 19
53 – 57 12
Medidas de Variabilidad o Dispersión
Datos Agrupados

Salario ($) f
300 – 324 5
325 – 349 18 At = Ls de la última clase – Li de la primera clase
350 – 374 28
At = 474 - 300
375 – 399 36
At = $174.00
400 – 424 22
425 – 449 15
450 - 474 4
Medidas de Variabilidad o Dispersión de Datos
Agrupados (tablas con intervalos de clase)
*Desviación Media
 f Xm  x
DM 
n 1
Millones de Número de Xm FXm  fXm
dólares Empresas (F)
x
n
0–5 12 2.5 30
5 – 10 35 7.5 262.5 4235
x
10 – 15 41 12.5 512.5 250
15 – 20 95 17.5 1662.5
20 – 25 35 22.5 787.5
x  $16.94 millones
25 – 30 17 27.5 467.5
30 – 35 10 32.5 325
35 – 40 5 37.5 187.5
n=250  = 4235
Medidas de Variabilidad o Dispersión de Datos Agrupados
*Desviación Media

x  $16.94 millones

 f Xm  x
DM 
n 1
1371.44
MD 
250  1
1371.44
MD 
249

MD  $5.51 millones
Medidas de Variabilidad o Dispersión de Datos Agrupados

Nota: Este ejercicio lo desarrollará el


Pulsaciones por minuto
(p.p.m.)
f
estudiante.
43-50 3
 f Xm  
51-58 28 Po blación MD 
59-66 131 N
67-74 283

75-82 351 2
83-90 185  F Xm  
91-98 64  2

99-106 14 N
107-114 1 2
 F Xm  

N
Medidas de Variabilidad o Dispersión de Datos Agrupados
*Varianza y Desviación Estándar

Ejemplos: Calcule la varianza y la desviación estándar


para las distribuciones anteriormente estudiadas.

1. Ganancia en millones de dólares, obtenida al finalizar el


año pasado por un grupo de empresas nacionales.

2. Número de pulsaciones por minuto de todos los estudiantes


de Bachillerato en una Escuela en Santa Tecla.
Medidas de Variabilidad o Dispersión de Datos Agrupados
*Varianza y Desviación Estándar

Millones Número
de de Xm fXm
dólares Empresas
0–5 12 2.5 30
5 – 10 35 7.5 262.5
10 – 15 41 12.5 512.5
15 – 20 95 17.5 1662.5
20 – 25 35 22.5 787.5
25 – 30 17 27.5 467.5
30 – 35 10 32.5 325

35 – 40 5 37.5 187.5
4235
Medidas de Variabilidad o Dispersión de Datos Agrupados
*Varianza y Desviación Estándar

Nota: Este ejercicio lo


Pulsaciones por minuto (p.p.m.) f desarrollará el estudiante
43-50 3
 f Xm  
51-58 28 MD 
59-66 131 N
67-74 283
2
75-82 351
 F Xm  
83-90 185
 2

91-98
99-106
64
14
N
2
107-114 1
 F Xm  

N
TEOREMA DE CHEBYSHEV
• Regla empírica: En una distribución simétrica en forma de campana
se establece lo siguiente
a) Aproximadamente el 68% de las observaciones (datos) deben
estar entre la media y mas-menos una desviación estándar,
queda representado con la siguiente expresión:

Gráficamente quedaría

μ±σ 68%
x± S 68% 68 %

Se usa cuando se conoce que la


distribución tiene forma de   
campana.
S x S
TEOREMA DE CHEBYSHEV
• Regla empírica: En una distribución simétrica en forma de campana
se establece lo siguiente

b) Aproximadamente el 95% de las observaciones (datos) deben


estar entre la media y mas-menos dos desviaciones estándar,
queda representado con la siguiente expresión:
Se usa cuando se conoce que la Gráficamente quedaría
distribución tiene forma de
campana.

μ ± 2σ 95%
95 %
x ± 2S 95%
 2  2
 2S x 2S
TEOREMA DE CHEBYSHEV
• Regla empírica: En una distribución simétrica en forma de
campana se establece lo siguiente

c) Aproximadamente el 99.7% de las observaciones (datos)


deben estar entre la media y mas-menos tres desviaciones
estándar, queda representado con la siguiente expresión:
Se usa cuando se conoce que la distribución tiene forma de campana.

μ ± 3σ 99.7% Gráficamente quedaría

x ± 3S 99.7%
El uso de esta fórmula revela el
dato mayor y el dato menor de la
distribución ya que está 99.7%
representando casi al 100% de
los datos.
 3  3
Con estos datos se puede
determinar la amplitud de la  3S x 3S
distribución (AExc) =PM - Pm
EN RESUMEN:
UTILIZARA ESTAS FORMULAS CUANDO CONOZCA LA MEDIA Y LA
DESVIACION ESTANDAR , Y LE PREGUNTEN SOBRE QUÉ INTERVALO DE
DATOS ESTA ENTRE LOS PORCENTAJES MENCIONADOS .

HAY TRES POSIBLES OPCIONES:


Se le suma y se le resta a la media la desviación
μ±σ 68% estándar y se obtiene el intervalo de datos en el
que se encuentra el 68 % de la distribución.
x± S 68%

Se le suma y se le resta a la media 2 veces la


μ ± 2σ 95% desviación estándar y se obtiene el intervalo de
datos en el que se encuentra el 95% de la
x ± 2S 95% distribución.

Se le suma y se le resta a la media 3 veces la


μ ± 3σ 99.7% desviación estándar y se obtiene el intervalo de
datos en el que se encuentra el 99.7 % de la
x ± 3S 99.7% distribución. Y como representa casi al 100 %, se
puede decir que estos datos que se encuentren
será el PM y el Pm de la distribución.
TEOREMA DE CHEBYSHEV
Ejemplo:
En una muestra de 600 personas, se miden para
estudiar la estatura, las cuáles obtuvieron una estatura
promedio de 1.69 m y una desviación estándar de 0.07
m. Con la anterior información se pregunta:

a) ¿Entre qué estaturas está aproximadamente el 68% de


las personas medidas?
b) ¿Entre qué estaturas está aproximadamente el 95% de
las personas medidas?
c) ¿Teóricamente cuál es la estatura mayor y la estatura
menor de las personas medidas?
a) ¿Entre qué estaturas está aproximadamente
el 68% de las personas medidas?
μ±σ 68% Se usa la segunda formula porque dice que es
una muestra

x± S 68% x  1.69m S  0.07 m


x  1S  1.69  (1)0.07
x  1S  1.69  (1)0.07  1.62
x  1S  1.69  (1)0.07  1.76

Conclusión: El 68% de los datos (estaturas) de la distribución se


encuentran entre 1.62 y 1.76 metros.
b) ¿Entre qué estaturas está aproximadamente el
95% de las personas medidas?

μ ± 2σ 95% Se usa la segunda formula porque dice que es


una muestra

x ± 2S 95% x  2 S  1.69  ( 2)0.07


x  2 S  1.69  ( 2)0.07  1.55
x  2 S  1.69  ( 2)0.07  1.83

Conclusión: El 95% de los datos (estaturas) de la distribución se


encuentran entre 1.55 y 1.83 metros.
c) ¿Teóricamente cuál es la estatura mayor y la
estatura menor de las personas medidas?

μ ± 3σ 99.7% Se usa la segunda formula porque dice que es


una muestra.
x ± 3S 99.7% Y como no se conoce la tabla de datos, el
puntaje mayor y el puntaje menor se determina
con la formula que casi representa al 100%.

x  3S  1.69  (3)0.07
x  3S  1.69  (3)0.07  1.48
x  3S  1.69  (3)0.07  1.80

El PM=1.80 m
Pm = 1.48 m
TEOREMA DE CHEBYSHEV
En cualquier conjunto de observaciones (muestra o
población) la proporción de los valores que queda dentro
de k desviaciones estándar de la media es por lo menos

1 – 1/k2 , donde k es una constante mayor que uno (k >1).

• La formula sombreada, representa el % de valores que se


encuentra entre k desviaciones estandar, por lo tanto el
resultado de dicha formula se multiplica por 100.
• Se usa cuando se desconoce la forma de distribución y se nos
pregunta por valores porcentuales que comprende un
intervalo de datos.

K: Es el número de desviaciones estándar respecto de la media

Si este dato no se conoce, se determina por medio de la


siguiente formula:
K = (PM-Pm)/desviación estándar
TEOREMA DE CHEBYSHEV
Ejemplo: El promedio quincenal de ahorro que tienen
los empleados de una empresa estadounidense es de
$ 51.54 y la desviación estándar se calculó que es $
7.51, ¿qué porcentaje de los ahorros está
comprendido entre mas-menos 1.5 desviaciones de la
media. (Solo necesita conocer el valor de k para usar
la formula) 0.5556 x100%  55.56 %
1 1
1 2 1
k 2.25 R/ Aproximadamente el 55.56% de
1 0.444 los ahorros de los empleados esta
1 entre la media y mas menos 1.5
1
(1.5) 2 desviaciones estándar.
0.5556
TEOREMA DE CHEBYSHEV
Un grupo de vendedoras de un centro comercial percibe un promedio de
ganancias diarias de $200 con una desviación estándar de $15.5
determine que porcentaje de las ganancias esta entre $180 y $ 235.
Se trata de una muestra porque se refiere nada mas a un grupo.

Se tiene X= 200 y S = 15.5


Preguntan un % por lo tanto debe usarse el teorema de chevishev, no
se conoce K pero se puede determinar ya que se conoce el intervalo
de datos del cual se pide el %
K = (PM- Pm)/ S = (235 – 180) /15.5 = ?
Determínelo con un decimal y encuentre el % buscado usando la
siguiente formula.

1
1 2
k

También podría gustarte