Está en la página 1de 33

PROB Y

ESTADISTICA I
TEMA # 5

MEDIDAS DE
DISPERCIÓN
Prof. Franz R. Arce Velasco

TARIJA - BOLIVIA
Agenda Clase

MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN


"La estadística es el único tribunal de apelación para juzgar el
nuevo conocimiento."

1 2 3 4

Desciación Aplicación
Rango Varianza y
Efecto del Covid
media desviación Problación
estandar Tarijeña
Divisiones
de la
Estadística
DATOS Y VARIABLES
CONCEPTO DE
MEDIDAS
MEDIDAS DE DISPERSION

• Indican cuan dispersos o concentrados


están los datos
• Las mas usadas son las que indican la
concentración de los valores del
conjunto de datos alrededor del valor
medio
• Las mas importantes son: la desviación
media, la varianza la desviación
estándar, el coeficiente de variación y el
recuento estándar.
2. CONCEPTO DE
MEDIDAS
MEDIDAS DE FORMA
• Indica la forma de la curva de
frecuencia, o curva suavizada.
Con respecto a la curva normal,
se distinguen entre medidas de
sesgo y de curtosis.
• Las medidas de sesgo miden la
simetría de la curva.
• Las medidas de curtosis miden el
perfil de la curva

6
3. PARAMETROS Y
ESTADIGRAFOS
• Cuando se mide las características de
un conjunto de datos se debe distinguir
si se tratan de datos que representan a
una población o una muestra.
• Parámetro se llama a la medida usada
para describir las características de una
población.
• Para calcular un parámetro se emplean
los datos se emplea información de
toda la población. Ejm. Media
poblacional, varianza poblacional, etc.
3. PARAMETROS Y
ESTADIGRAFOS
• Se llama Estadígrafo o
estadístico a la medida usada
para describir las características
de una muestra.
• Para calcular un Estadígrafo o
estadístico se emplea
información de una muestra o
parte de una población. Ejm.
Media muestra, varianza
muestra, etc.
1. MEDIDAS DE DISPERSION

9
1. MEDIDAS DE DISPERSION

10
2. CONCEPTO DE MEDIDAS DE
DISPERSION
• Para medir cuan separados o concentrados están
entre si los datos , se usan las medidas de dispersión,
que indican cuan diferentes entre si son los datos que
se analizan.
MEDIDAS DE DISPERSION
• Rango
• Desviación media; desviación mediana
• Varianza de Población y de muestra
• Desviación estándar o típica de población y
muestra.
• Coeficiente de variación, recuento estándar
2. CONCEPTO DE MEDIDAS DE
DISPERSION

12
3. RANGO

• Se llama rango de un conjunto de datos a la


diferencia entre el valor máximo y el mínimo.
• Al rango también se lo llama recorrido
• En una ordenación de datos el rango se calcula
Rango=Xmax – Xmin
• En una tabulación discreta se calcula como rango =
Xmax – xmin donde Xmax y Xmin son los valores
mas altos y mas bajo respectivamente.
• En una clasificación de datos Rango=Xmax – Xmin ,
Xmax es la frontera del limite superior de la clase
mas alta y Xmin es la fontera o limite inferior de la
clase mas baja.

13
3. RANGO : EJEMPLOS

• Ejm. Calcular el rango

76 82 64 85 86 78 63 75 72 61 67 79 69
61 63 64 67 69 72 75 76 78 79 82 85 86 ordenado
X1 X2 X3 ………………………………X13

N = 13
Rango Xmax – Xmin = 86 – 61 = 25
3. RANGO : TABULACION DISCRETA
EJEMPLOS

b) x datos f frecuencia
5 11
6 13
7 16
8 10
50

• Para el caso de una tabulación discreta


• Rango = Xmax – Xmin = 8 – 5 = 3
• Para el rango no interesa la reiteración de un
dato
3. RANGO : TABULACION DISCRETA
EJEMPLOS
c) clases marca de clases f frecuencia de clases
148, 156 151 2
156,162 159 5
162,168 165 6
168,174 171 9
174,180 177 6
28

• Para el caso de una clasificación de datos


• El rango es la diferencia entre el limite superior de la ultima clase y el limite inferior de la primera
clase . 16

• Rango = Xmax – Xmin = 180 – 148 = 32


• NOTA: Como se aprecia el rango es fácil de calcular sin embargo su calidad de información, es baja
de modo que para análisis mas completos es preferible el uso de otras medidas de dispersión.
3. RANGO

17
4. DESVIACION MEDIA
• La desviación media absoluta llamada también desviación promedio o
desviación media es un conjunto de datos que se designa por DM.
• Para una ordenación de n datos X1,X2,X3….Xn se calcula como:

• Donde Xm es la media aritmética del conjunto de datos |X - Xm| es el


valor absoluto de la desviación de un valor Xj respecto a su media Xm .
• Para datos agrupados ya sea como tabulación o clasificación:

18

• En una tabulación los fj son las frecuencias. En una clasificación los fj son
las frecuencias de clase. Las Xj son las marcas de clase.
4. DESVIACION MEDIA

• Ejm. Calcular la desviación media de los números


12,14,17,18,19.
• Calculando la media aritmética del conjunto de datos, n=5 . El
valor absoluto de un positivo o negativo es positivo.

19
4. DESVIACION MEDIA

• a) calcular la desviación media de los datos agrupados.


x datos f frecuencia
2 10
3 16
4 13
5 11
50

20
4. DESVIACION MEDIA

• b) a) calcular la desviación media de la siguiente clasificación de


datos:
clases marca de clases f frecuencia de clases
55,59 57 3
59,63 61 7
63,67 65 8
67,71 69 5
71,75 73 1
24

21
4. DESVIACION MEDIA:
VENTAJAS Y DESVENTAJAS
• La desviación media es una medida de
dispersión rápida, fácil de calcular y mas
precisa que el rango, considera a todos los
valores y es poco sensible a los valores
extremos.

• La desviación media no es muy operable


teóricamente, no permite una manipulación
algebraica sencilla, quedando en desventaja
frente a otras medidas.
5. LA VARIANZA

• La varianza es la principal medida de dispersión, es la mas precisa y de mayor


uso, sobre todo en estadística inferencial.
• La varianza de una población se designa por σ2 (sigma cuadrado). La varianza
de una muestra o varianza muestral se designa por s2.
• Para una ordenación de datos X1,X2,X3…,Xn, la varianza se calcula como:

23

• Donde la media aritmética de una población es μ y de una muestra Xm, su


modo de cálculo es la misma. Se debe tomar en cuenta que el total de
datos se representa por N,n para una población o muestra
respectivamente.
5. LA VARIANZA

• Para datos agrupados ya sea como tabulación discreta o


clasificación de datos, la varianza se calcula por:

24

• Donde los fj son las frecuencias. Para una tabulación discreta


los Xj son los datos diferentes entre si. Para una clasificación
los Xj son las marcas de clase.
5. LA VARIANZA

• Calcule la varianza poblacional y muestral de los siguientes


conjuntos de datos 12,14,17,18,19.

POBLACION

25
5. LA VARIANZA

• MUESTRAL

26
5. LA VARIANZA
• Calcule la varianza poblacional para los siguientes datos
agrupados como tabulación discreta.

f
x datos frecuencia
2 10
3 16
4 13
5 11 27

50
5. LA VARIANZA
• Calcule la muestral para los siguientes datos agrupados como
tabulación discreta.

x datos f frecuencia
2 10
3 16
4 13
5 11
50
28
5. LA VARIANZA
• Calcule la varianza poblacional para los siguientes datos agrupados como
tabulación discreta.
• Clasificación en 5 clases k=5, indica la marca y frecuencia de clases,
frecuencia total es N=24
clases marca de clases f frecuencia de clases
55,59 57 3
59,63 61 7
63,67 65 8
67,71 69 5
71,75 73 1
24

29
5. LA VARIANZA

• Calcule la varianza muestral para los siguientes datos agrupados como


tabulación discreta.
• Clasificación en 5 clases k=5, indica la marca y frecuencia de clases,
frecuencia total es n=24. μ=Xm
marca de f frecuencia
clases clases de clases
55,59 57 3
59,63 61 7
63,67 65 8
67,71 69 5
30
71,75 73 1
24
6. LA DESVIACION ESTANDAR
• Con base a la varianza, otra medida de dispersión es la desviación estándar.
• Según se trabaje con una población o con una muestra se obtendrá la desviación estándar poblacional y
la desviación estándar muestral.
• La desviación estándar de una población se designa por σ y para una muestra s.

31

DATOS
AGRUPADOS
6. LA DESVIACION
ESTANDAR • DEFINICION
VARIANZA (VA) = σ2
σ = √VA
7. COEFICIENTE DE VARIACION
• El coeficiente de variación se llama
también coeficiente d dispersión.
• Es una medida de dispersión relativa
• Permite realizar comparaciones entre
diversos grupos de datos, que no
necesariamente poseen la misma
frecuencia total.
• Para un conjunto de datos , se llama
coeficiente de variación al cociente de
desviación estándar maestral entre su
media aritmética.

• Se considera un coeficiente menos a 50% como baja dispersión donde la


media aritmética es una buena representante de los datos, si es mayor
significa alta dispersión

También podría gustarte