Está en la página 1de 42

ESTADÍSTICA APLICADA

INGENIERÍA CIVIL

Docente: Segundo O. Rodríguez Bellina

7° SEMANA
MUCHAS VECES DEBEMOS TOMAR
DECISIONES
https://www.google.com/search?q=medidas+de+dispersion&tbm=isch&rlz=1C1PRFI_enPE854PE
854&hl=es&ved=2ahUKEwjlv7GlyNXpAhXxsjEKHdY-
Bz4QrNwCKAB6BAgBEDM&biw=1007&bih=608#imgrc=juJassNk7zr5DM
Medidas de dispersión
Las medidas de dispersión cuantifican la variabilidad (el grado de
separación) que presenta un conjunto de datos. Ya que dos conjuntos de
datos pueden tener las mismas medidas de tendencia central pero diferir en
términos de variación. Entre las medidas de dispersión, tenemos:
- Rango.
- Varianza.
- Desviación estándar o típica.
- Coeficiente de variación.
El rango (R)
Llamado también recorrido, amplitud total o alcance.
La dispersión puede medirse en términos de la diferencia entre los dos
valores extremos del conjunto de datos. de esta forma, el rango (amplitud)
se define como la diferencia entre el máximo y el mínimo valor de la
distribución.

Obtención: Se obtiene de la diferencia entre el dato mayor y el dato


menor.

𝑹 = 𝑿𝒎á𝒙 − 𝑿𝒎í𝒏
Ejemplo:
Los siguientes datos representan el peso de 10 estudiantes de agronomía,
(en kg.). calcule e interprete el rango.
48 52 80 75 60
50 49 78 66 58

𝑹 = 𝑿𝒎á𝒙 − 𝑿𝒎í𝒏

𝑿𝒎á𝒙 = 𝟖𝟎
𝑿𝒎í𝒏 = 48

Rango = (80 - 48) Rango = 32 kg.

Interpretación
La diferencia entre el alumno de mayor peso y el alumno de menor
peso es 32 Kg.
RANGO PARA DATOS AGRUPADOS
Cálculo a partir de datos agrupados, se utiliza la siguiente fórmula:
R= (Ls - Li )
donde: Ls : limite superior de la última clase
Li : limite inferior de la primera clase
Ejemplo:
La distribución de frecuencias siguiente representa el tiempo que espera un
estudiante para ser atendido, en tesorería de UPAO. Calcule e interprete el
rango
Tiempo Nº de Alumnos Ls =32
(minutos) (por día) Li =12
12 - 16 4
16 - 20 8
20 - 24 15 Rango = (32-12)
24 - 28 23
28 - 32 10
R = 20 minutos
Total 60

Interpretación: La diferencia de tiempo entre el alumno que más espera y


el que menos espera para ser atendido es 20 minutos.
Varianza
La varianza se define como el promedio de las desviaciones (distancias)
cuadráticas de las observaciones respecto del promedio.

Cálculos a partir de datos no agrupados.


para una población
N 2
σ𝑁
 (X i −  )
2
𝑥
𝜎2 = 𝐼=1 𝑖
− 𝜇2
𝑁
 =
2 i =1

Observación:
Esta medida de dispersión tiene como inconveniente que las unidades de la
variable están al cuadrado
Ejemplo para datos no agrupados:
Tenemos la edad de todos los alumnos atendidos hoy en la Facultad de
agronomía 18 19 21 22 23. Calcular la VARIANZA
Primero calculamos la media aritmética. Sabemos:
N
σ𝑋
 (X i −  )
2
18+19+21+22+23
µ= = = 20.6
= 𝑛

2 i =1 5
N
𝟐 𝟐 𝟐 𝟐 𝟐
(𝟏𝟖 − 𝟐𝟎. 𝟔) +(𝟏𝟗 − 𝟐𝟎. 𝟔) +(𝟐𝟏 − 𝟐𝟎. 𝟔) +(𝟐𝟐 − 𝟐𝟎. 𝟔) +(𝟐𝟑 − 𝟐𝟎. 𝟔)
𝝈𝟐 =
𝟓
𝟏𝟕. 𝟐
= = 𝟑. 𝟒𝟒 𝒂ñ𝒐𝒔𝟐
𝟓
Interpretación: No tiene interpretación. Una aproximación sería: El
promedio de las desviaciones de los datos con respecto a la media elevados
al cuadrado es 3.44 𝒂ñ𝒐𝒔𝟐
Cálculos a partir de datos no agrupados
para una muestra

 (X i − x )
2

=
2 i =1
S n −1

𝑛 2
(σ𝑖=1 𝑥𝑖 ) 𝑛 2
− 𝑛𝑥ҧ 2
σ𝑖=1 𝑥𝑖
σ𝑛𝑖=1 𝑥𝑖2 − 2
2
𝑆 = 𝑛 𝑆 =
𝑛−1 𝑛−1
Ejemplo para datos no agrupados:
Tenemos una muestra de la edad de los alumnos atendidos en Abril en la
de agronomía: 18 19 21 22 23. Calcular la VARIANZA
Primero calculamos la media aritmética. Sabemos:
σ 𝑋 18 + 19 + 21 + 22 + 23
σ𝑛𝑖=1(𝑥𝑖 ത
− 𝑋) 2 𝑋ത = 𝑛 = 5
= 20.6
𝑆2 =
𝑛−1
𝟐 𝟐 𝟐 𝟐 𝟐
(𝟏𝟖 − 𝟐𝟎. 𝟔) +(𝟏𝟗 − 𝟐𝟎. 𝟔) +(𝟐𝟏 − 𝟐𝟎. 𝟔) +(𝟐𝟐 − 𝟐𝟎. 𝟔) +(𝟐𝟑 − 𝟐𝟎. 𝟔)
𝑺𝟐 =
𝟓−𝟏
𝟏𝟕. 𝟐
= = 𝟒. 𝟑 𝒂ñ𝒐𝒔𝟐
𝟒
Interpretación: No tiene interpretación. Una aproximación sería: El
promedio de las desviaciones de los datos con respecto a la media elevados
al cuadrado es 4.3 𝒂ñ𝒐𝒔𝟐
La desviación estándar
Llamada también desviación típica representa la variabilidad (o
desviaciones) promedio de los datos con respecto a la media aritmética. es
la raíz cuadrada de la varianza, sea poblacional o muestral.
Cálculos a partir de datos no agrupados

N
 (Xi −  )
2

Para la población  = 2 = i =1
N

 (Xi − x )
2

S= =
2 i =1

para la muestra s n −1
Ejemplo para datos no agrupados(Población):
Tenemos la edad de todos los alumnos atendidos hoy en la Facultad de
agronomía 18 19 21 22 23. Calcular la DESVIACIÓN ESTÁNDAR
Primero calculamos la media aritmética. Sabemos:
N
 (Xi −  )
2 σ𝑋 18+19+21+22+23
 = 2 = i =1
µ= = = 20.6
N 𝑛 5

(𝟏𝟖 − 𝟐𝟎. 𝟔)𝟐 +(𝟏𝟗 − 𝟐𝟎. 𝟔)𝟐 +(𝟐𝟏 − 𝟐𝟎. 𝟔)𝟐 +(𝟐𝟐 − 𝟐𝟎. 𝟔)𝟐 +(𝟐𝟑 − 𝟐𝟎. 𝟔)𝟐
𝝈=
𝟓

𝟏𝟕. 𝟐
= = 𝟑. 𝟒𝟒 𝒂ñ𝒐𝒔𝟐 = 𝟏. 𝟖𝟓 𝒂ñ𝒐𝒔.
𝟓
Interpretación: La desviación de las edades de los alumnos atendidos hoy
en la Facultad de agronomía con respecto a su promedio es de 1.85 años
en promedio.
Ejemplo para datos no agrupados(Muestra):

La siguiente información se refiere al número de frutos que tiene las plantas


de manzana de dos años. Calcule la desviación estándar.
8, 10, 5, 12, 10, 15
Ya sabemos por el ejemplo anterior que S2 = 11,6 Entonces

𝐒= 𝟏𝟏, 𝟔
S=
2
s
𝐒 = 3,4 manzanas

Interpretación: La desviación de los frutos de manzana con respecto a su


promedio es de 3.4 manzanas en promedio.
𝑛𝑖 = 𝑓𝑖 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑋𝑖 = 𝑌𝑖 𝑀𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
Ejemplo para datos agrupados (Población):
Sobre los ingresos semanales presentado anteriormente considerando 191
datos.
2 σ 𝑌𝑖 𝑛𝑖 41909.5 𝜇 = ෍ 𝑌𝑖 ℎ𝑖 = 219.42
( 𝑌𝑖 ) 𝑛𝑖 = 𝑓𝑖 (𝑌𝑖 − 𝜇) 𝑌𝑖 − 𝜇) 𝑌𝑖 − 𝜇) 2 𝑓𝑖
𝜇= = = 219.42
147.5 4 -71.92 5172.486 20689.9456 𝑛 191
166.5 10 -52.92 2800.526 28005.264
185.5 30 -33.92 1150.566 34516.992
204.5 38 -14.92 222.6064 8459.0432 𝑘 2𝑓
223.5 47 4.08 16.6464 782.3808 2
σ 𝑖=1 (𝑌𝑖 − 𝜇) 𝑖 184181.822
242.5 30 23.08 532.6864 15980.592
𝜎 = = = 964.3027
𝑁 191
261.5 25 42.08 1770.726 44268.16
280.5 5 61.08 3730.766 18653.832
299.5 2 80.08 6412.806 12825.6128
191 184181.822 𝜎 = 964.3027 = 31.053 soles
ética=

Interpretación: La desviación de los ingresos semanales de los


trabajadores con respecto a su media es de 31.053 soles en promedio.
El coeficiente de variación (CV)
El coeficiente de variación, también denominado coeficiente de variación de
Spearman, nos informa acerca de la dispersión relativa de un conjunto de
datos.

𝜎
para la POBLACIÓN: 𝐶𝑉 = ∗ 100
𝜇 El coeficiente de variación toma
valores entre 0 ≤ CV ≤ 1
𝑆
para la MUESTRA : 𝐶𝑉 = ∗ 100
𝑥ҧ
Si el CV ≤ 33% el conjunto de datos tiene un comportamiento
homogéneo.
el conjunto de datos tiene un comportamiento
Si el CV > 33% heterogéneo.
Ejemplo para datos no agrupados(Población):
Tenemos la edad de todos los alumnos atendidos hoy en la Facultad de
agronomía 18 19 21 22 23. Calcular el COEFICIENTE DE VARIACIÓN.
Primero calculamos la media aritmética. Sabemos:
σ𝑋 N
 (Xi −  )
2

µ= = 20.6  = 2 = i =1
𝝈=
𝟏𝟕. 𝟐
= 𝟏. 𝟖𝟓 .
𝑛 N 𝟓

1.85
𝐶𝑉 = ∗ 100 = 0.0898 ∗ 100 = 8.98%
20.6

Interpretación: Las edades de los alumnos atendidos en la


Facultad de agronomía que conforman la población presentan una
baja variabilidad. Es decir es una población homogénea.
Ejemplo para datos no agrupados(Muestra):
La siguiente información se refiere al número de frutos que tiene plantas de
manzana de dos años.. Calcule el Coeficiente de Variación.
8, 10, 5, 12, 10, 15 Sabemos que 𝑿
ഥ = 𝟏𝟎 S=3.4 Entonces

𝑺 𝟑. 𝟒
𝑪𝑽 = ∗ 𝟏𝟎𝟎 = ∗ 𝟏𝟎𝟎 = 𝟑𝟒%

𝒙 𝟏𝟎

Interpretación: Las manzanas que producen las plantas que conforman la


muestra presentan una alta variabilidad. Es decir es una muestra
heterogénea.
Ejemplo:
A continuación se presentan las tarifas de dos laboratorios de análisis de
suelos. El laboratorio I tiene sus tarifas en soles y el laboratorio II en dólares
¿Cuál de ellos tiene un plan tarifario más homogéneo o estable?.

Laboratorio I (soles) Laboratorio II (dólares)


40,70,60,48,52,65,58 70,35,150,140,82,110,140,120

Calculamos la media y desviación estándar para cada uno de los


laboratorios
S
Laboratorio I CV =  100
x
x Xi − x (Xi − x ) 2
n
 Xi 393
40 -16.14 260.50
x = i =1
= = 56.14
70 13.86 192.10 n 7
60 3.86 14.90 n
 (Xi − x )
2
48 -8.14 66.26
632.86
52 -4.14 17.14 S= i =1
= = 10.27
n −1 7 −1
65 8.86 78.50
1.86 3.46 10.27
58
CV = 100 = 18.29
 X = 393  (Xi − x ) = 0  (Xi − x )
2
= 632,86 56.14

Interpretación:
Laboratorio II S
CV =  100
x
x Xi − x (Xi − x ) 2
n

70 -35.87 1286.6569  Xi 847


= i =1 = = 105.87
35 -70.87 5022.5569 x n 8
150 44.13 1947.4569
140 34.13 1164.8569 n
−x)
2
82 -23.87 569.7769  (X i 11372,88
S= i =1
= = 40.30
110 4.13 17.0569
n −1 8 −1
140 34.13 1164.8569
120 14.13 199.6569

 X = 847  (Xi − x ) = 0,04  (Xi − x )


2
= 11372,88 CV =
40,30
100 = 30 ,06
105,87
Interpretación:

El Laboratorio II presenta una mayor variabilidad en el plan tarifario.


Ejemplo: TIRO AL BLANCO
En un juego de tiro al blanco con escopeta de perdigones por dos participantes
a un tablero, obtienen el siguiente registro después de 15 disparos cada uno.
Determinar el coeficiente de variación para ambos casos, interpretar.
MEDIDAS DE FORMA: ASIMETRÍA Y CURTÓSIS
Asimetría

10/15/2022
Miden la deformación horizontal. Miden la simetría de la distribución. Si
representamos gráficamente una distribución de frecuencias: tracemos una
perpendicular al eje de las x por x . Asimetría se refiere a si la curva que forman los
valores de la serie presenta la misma forma a izquierda y derecha de un valor central
(media aritmética).

26
La fórmula para la asimetría de los datos de
muestra es:

10/15/2022
COEFICIENTE DE ASIMETRÍA DE PEARSON

X −MO 3( X − M e)
AS 1 = S AS 2
=
S

EN LA PRÁCTICA SE DEBE DECIDIR POR UNA SOLA FÓRMULA


27
Asimetría
Los resultados pueden ser los siguientes:

10/15/2022
AS = 0 (distribución simétrica; existe la misma concentración
de valores a la derecha y a la izquierda de la media)

28
Asimetría
Los resultados pueden ser los siguientes:
AS > 0 (distribución asimétrica positiva; existe mayor

10/15/2022
concentración de valores a la derecha de la media que a
su izquierda)

29
Asimetría
Los resultados pueden ser los siguientes:
AS < 0 (distribución asimétrica negativa; existe mayor

10/15/2022
concentración de valores a la izquierda de la media que a
su derecha)

30
Asimetría
Ejemplo: Vamos a calcular el Coeficiente de Asimetría
de PEARSON de la serie de datos referidos al peso de

10/15/2022
los estudiantes del curso de Bioestadística.

31
Forma de distribución: Sesgo

Simétrico (no sesgado)


• La asimetría es cero.
• La media y la mediana son iguales.
.35
Asimetría = 0

Frecuencia Relativa
.30
.25
.20
.15
.10
.05
0

10/15/2022 32
Forma de distribución: Sesgo
• Moderadamente sesgado a la izquierda
• La asimetría es negativa.

10/15/2022
• La media será generalmente menor que la mediana.
Asimetría = − .31
.35

Frecuencia relativa
.30
.25
.20
.15
.10
.05
0
33
Forma de distribución: Sesgo
• Derecho moderadamente sesgado
• La asimetría es positiva.

10/15/2022
• La media generalmente será más que la mediana.
.35
Asimetría = .31

Frecuencia relativa
.30
.25
.20
.15
.10
.05
0
34
Forma de distribución: Sesgo

Muy sesgado a la derecha


• La asimetría es positiva (a menudo por encima de 1.0).
• La media generalmente será más que la mediana.
Frecuencia Relativa
.35
Asimetría = 1.25
.30
.25
.20
.15
.10
.05
0

10/15/2022 35
Forma de distribución: Sesgo
Ejemplo: alquileres de apartamentos
Setenta apartamentos de becarios fueron al azar
muestreado en una ciudad universitaria. Los precios de
alquiler mensuales para los apartamentos se enumeran a
continuación en orden ascendente.
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615

10/15/2022 36
Forma de distribución: Sesgo

Ejemplo: alquileres de apartamentos

.35 Asimetría = .92

Frecuencia relativa
.30

.25

.20
.15

.10
.05
0

10/15/2022 37
Curtosis
El Coeficiente de Curtosis analiza el grado de concentración
que presentan los valores alrededor de la zona central de la

10/15/2022
distribución.

 Se definen 3 tipos de distribuciones según su grado de curtosis:

38
Distribución mesocúrtica: presenta Distribución leptocúrtica: presenta un
un grado de concentración medio elevado grado de concentración
alrededor de los valores centrales de alrededor de los valores centrales de
la variable (el mismo que presenta la variable.
una distribución normal).

10/15/2022 39
Distribución platicúrtica: presenta un reducido grado de concentración
alrededor de los valores centrales de la variable.

10/15/2022
K=0.263 PARA LA CURVA NORMAL DE PROBABILIDADES
SI K 0.5 LA CURVA ES LEPTOCÚRTICA.
SI K 0.25 LA CURVA ES MESOCÚRTICA.
SI K 0 LA CURVA ES PLATICÚRTICA

El Coeficiente de Curtosis viene definido por la siguiente fórmula:

Q −Q
K= 3 1 0 0.125 0.25 0.375 0.5

2 (P − P 90 10
)
PLATICÚRTICA. MESOCÚRTICA LEPTOCÚRTICA

40

COEFICIENTE DE CURTOSIS PERCENTILICO


KURTOSIS

10/15/2022
K=0.263 PARA LA CURVA NORMAL DE PROBABILIDADES
SI K 0.5 LA CURVA ES LEPTOCÚRTICA.
SI K 0.25 LA CURVA ES MESOCÚRTICA.
SI K 0 LA CURVA ES PLATICÚRTICA

El Coeficiente de Curtosis viene definido por la siguiente fórmula:

Q −Q
K= 3 1 0 0.125 0.25 0.375 0.5

2 (P − P 90 10
)
PLATICÚRTICA. MESOCÚRTICA LEPTOCÚRTICA

41

COEFICIENTE DE CURTOSIS PERCENTILICO


Creo que todo es posible si tienes la mentalidad, la voluntad y el
deseo de hacerlo y pones el tiempo en ello. Roger Clemens

https://www.google.com/search?q=sartimbamba&rlz=1C1PRFI_enPE854PE854&oq=sartimba&aqs=chrome.1.69
i57j0l3j46j0l3.8008j0j8&sourceid=chrome&ie=UTF-8

También podría gustarte