2da Clase Estadistica Descriptiva

SEMANA 2
ESTADISTICA DESCRIPTIVA
Docente:
Mercedes Aida Osorio Maza
mosorio@uni.edu.pe
2018-II
TEORIA
TEMAS A DESARROLLAR
 Fabulación y codificación de los datos

continuos.
 Estadígrafos de posición media; mediana.
 Estadígrafos de Dispersión: varianza,
Desviación Standard, Coeficiente de
Variabilidad.
MEDIDAS ESTADÍSTICAS
En numerosas ocasiones, en
vez de trabajar con todos
los datos, es preferible
disponer de una o más
medidas descriptivas que
resumen los datos de forma
cuantitativa.
Las medidas descriptivas
son valores numéricos
calculados a partir de la
muestra y que nos resumen
la información contenida en
ella
CLASIFICACIÓN
MEDIDAS ESTADÍSTICAS
Medidas de Posición Medidas de Dispersión Medidas de Forma
Medidas de Centralización
 Media  Varianza  Coeficientes de

 Mediana Asimetría
 Moda  Desviación Típica
 Coeficiente de
 Coeficiente de Concentración
Variabilidad (Índice de Gini)
Otras Medidas de Posición
 Apuntamiento o
 Cuantiles Curtosis
 Porcentiles
 Cuartiles
 Deciles
MEDIDAS DE POSICIÓN
A continuación
estudiaremos diferentes
parámetros estadísticos
que nos permitirán
conocer la tendencia
posicional de los datos.
Veremos en primer lugar
medidas de tendencia
central y posteriormente
otras medidas alusivas
igualmente a la posición.
MEDIDAS DE CENTRALIZACIÓN
Llamadas así porque tratan de localizar el centro

de la distribución de los datos.
Las principales medidas de centralización son:
a) Media Aritmética
b) Mediana.
c) Moda
a) MEDIA ARITMÉTICA( y )
Es el promedio del conjunto de datos, hay tres formas de

hallarlo.
I.- Datos No Agrupados:
y   i , n  Tamaño de la muestra
y
n
Ejemplo:
13  14  .....24
13, 14, 17, 21, 24,  y 
5
II.- Datos Agrupados en Tablas de Frecuencias:
y  ny i i
n
Donde: n i  Frecuencia absoluta
y i  Marca de clase
n  Tamaño de muestra
Ejemplo:
 n i yi 
Estimación de la y para datos agrupados  y   
 n 
Limites yi ni
[ 15.2 – 115.5 > 15.35 2

[ 15.5 – 15.8 > 15.65 5
[ 15.8 – 16.1 > 15.95 11
[ 16.1 – 16.4 > 16.25 6
[ 16.4 – 16.7 > 16.55 3
[ 16.7 – 17.0 ] 16.85 3
k
n i yi
y
i 1 n
6
n i yi 2(15.35)  5(15.65)  ......3(16.85)
y 
i 1 n 30
III.- Método Codificado:

c
y  Ot   ni Z i
n
Donde:
n  Frecuencia absoluta
c  Amplitud
O t  Origen de trabajo, es una marca de clase que presenta mayor frecu e ncia
Zi  C odificació n
Reglas para elegir Ot (origen de trabajo)
 Tomamos Ot a una de las marcas de clase yi.
 Si el numero de intervalos es impar Ot es la marca de clase del intervalo
central.
 Si el número de intervalos es par, Ot es la marca de uno de los 2
intervalos centrales, prefiriendo el intervalo al cual le corresponde mayor
frecuencia.
Ejemplo:
Hallar la media aritmética por el método codificado y  ny i i
n
Estaturas yi - O t
yi ni Zi  , nizi
(Limites) c
[ 1.50 – 1.55 > 1.525 2 -2 -4
[ 1.55 – 1.60 > 1.575 12 -1 -12
[ 1.60 – 1.65 > 1.625 Ot 42 0 0
[ 1.65 – 1.70 > 1.675 36 1 36
[ 1.70 – 1.75 > 1.725 25 2 50
[ 1.75 – 1.80] 1.775 3 3 9
Total n=120 79
c  1.55 - 1.50  0
1.525  1.625  0.10
z1    2
0.05 0.05
1.575  1.625  0.05
z2    1
0.05 0.05
z3  0
1.675  1.625 0.05
z4   1
0.05 0.05
z5 2
z6  3
Método Codificado:
k
c
y  ot 
n
n
i 1
i zi
0.05
y  1.625  (79)
120
 y  1.6579mts
Propiedades de la Media Aritmética
 Si se tiene 2 o más sub poblaciones de tamaño n1 y n2,

entonces la media total se calcula:
n1y1  n 2 y 2  ............nk y k
y
n1  n 2  ........nk
 Para K = cte.
- Si yi  x i  k  y  xk
- Si yi  kx i  y  kx
x x
- Si yi  i y
k k
 La suma de las desviaciones respecto al promedio es cero
n
 y
i 1
i  y  0 desviación : yi  y 
b) MEDIANA
Es aquel valor que divide en 2 partes iguales al conjunto de

datos, se halla de tres formas:
Se ordena ya sea en forma creciente y/o decreciente.
yn  y n
1
Si n  par  Me  2 2
n  Tamaño de la muestra
2
Si n  impar  Me  y n 1
2
Ejemplo:
 Si “n” es par sean los #: 10, 1, 2, 7, 6, 3, 4, 5,
Ordenando: 1, 2, 3, 4, 5, 6, 7, 10
y n/2  y n/2 1
Me 
2
y 4  y5 45
Me    4.5
2 2
 Si “n” es impar ; (n = 7) Impar.

Datos: 1, 2, 3, 4, 5, 6, 7.
Me  y n 1  y 4  4
2
II.- Datos Agrupados:
Tabla de frecuencias con variable cuantitativa discreta
n
Si N J 1   Me  y J
2
n y J-1  y J
Si N J-1   Me 
2 2
Ejemplo:
Si yi ni Ni
n 60
  30
0 3 3 2 2
1 5 8 Como
2 10 18
3 18 36 n
4 14 50
N j-1   Me  y j
2
5 7 57
6 3 60 1 8  3 0  Me  3
Si yi ni Ni n 50
  25
2 2
0 5 5
n
1 12 17 Como N j-1  25 
2 8 25 2
3 15 40
y j1  y j 2  3
4 5 45  Me    2.5
5 5 50 2 2
III.- Tabla de Frecuencias con Variable Cuantitativa Continua
 n/2  N J 1 
Me  LJ  CJ  
 n J 
Donde:
Lj = Limite inferior de la clase mediana.

n = Numero total de observaciones.
Cj = Amplitud del intervalo de la clase mediana.
Nj-1 = Frecuencia absoluta acumulada hasta la clase
inmediata anterior a la clase mediana.
nj = Frecuencia absoluta de la clase mediana.
Propiedades de la Mediana
 La mediana no esta afectada por los términos extremos.
 Si k = Constante
yi  x i  k  Me y  Me x  k
y i  kx i  Me y  kMe x
xi Me x
yi   Me y 
k k
c) MODA
Es aquel valor que se presenta c/mayor frecuencia, se halla

de dos formas:
Se escoge aquel valor que se repita más.
Ejemplo:
 4, 7, 8, 9, 9, 3, 6.  Mo = 9 (Unimodal)
 3, 3, 4, 5, 6, 7, 8, 8.  Mo1 = 3, Mo2 = 8 (Bimodal)
 d1 
Mo  Lo  Co  
 d1  d 2 
Lo = Limite inferior
Co = Amplitud de la clase modal.
d1 = Diferencia de la frecuencia absoluta
modal menos la anterior.
d2 = Diferencia de la frecuencia absoluta
modal menos la siguiente.
Ejemplo:
Limites ni Ni
[ 60 – 63 > 5 5
[ 63 – 66 > 18 23
[ 66 – 69 > 42 65
[ 69 – 72 > 27 92
[ 72 – 75 ] 8 100
 d1 
Mo  Lo  Co  
 d1  d 2 
 24   24 
Mo  66  3   66  3 
 24  15   29 
Mo  67.84
d1  42  18
d 2  42  27
Propiedades de la Moda
 Si k = Constante
1. y i  x i  k  Mo y  Mo x  k
2. yi  kx i  Mo y  kMo x
xi Mo x
3. y i   Mo y 
k k
OTRAS MEDIDAS DE POSICIÓN
Análogamente a la mediana, que divide los datos en dos

partes iguales, se definen otras medidas que dividirán los
datos en cuatro, diez o cien partes.
Los cuantiles son valores de la distribución que la dividen en
partes iguales, es decir, en intervalos, que comprenden el
mismo número de valores. Los más usados son los cuartiles,
los deciles y los percentiles.
 PERCENTILES: Son 99 valores que dividen en cien partes
iguales el conjunto de datos ordenados.
 CUARTILES: Son los tres valores que dividen al conjunto

de datos ordenados en cuatro partes iguales.
 DECILES: son los nueve valores que dividen al conjunto

de datos ordenados en diez partes iguales, son también un
caso particular de los percentiles.
Se definen genéricamente como cuantiles a los cuartiles,

deciles, percentiles,.....Los cuantiles de denominan también
parámetros de estructuras y son muy utilizados en las
CC.Sociales.
MEDIDAS DE DISPERSIÓN
Las medidas de posición central no
proporcionan, en general, suficiente
información para una adecuada
descripción de los datos, porque no
toman en cuanta la dispersión o
concentración de los mismos, por
lo tanto es claro que se requieren
otras medidas que indiquen el
grado de variabilidad de los datos.
Estas medidas son necesarias para efectuar comparaciones significativas

entre grupos de observaciones. Cuando se mide la dispersión de los valores
de una variable respecto de unas de sus medidas de posición, se está
midiendo el grado de representatividad que dicha medida de posición tiene
en el conjunto de los datos a los cuales pretende resumir.
Entre las medidas de dispersión mas conocidas son:
a) Varianza(S2)
b) Desviación estándar o típica(S).
c) Coeficiente de variabilidad(Cv)
d) Rango
a) Varianza ( S2 )
Mide la variabilidad absoluta de los datos yi, respecto a la

media
La varianza es una cantidad no negativa(S2 > 0 )

Si

 iy  y 2
n  30  S2n -1  Varianza Insesgada

n 1
 
S2n   i

2
y y
n  30  Varianza Sesgada
n
n  60  S2n -1  y/o S2n son iguales
La varianza se halla de tres formas:

 y  y
2
S 2
y  i
n
Donde:
y i  Obsevacion es
y  Promedio o media
n  Tamaño de muestra
Desarrollando:
2
  y i
 y2 (n  30)
S y
n
k
n i (yi - y) 2
Sy  
2
i 1 n
Donde:
yi  marca de clase
n i  frecuencia absoluta
Desarrollando:
n i yi2
Sy   n  y (n  30)
2 2
III.- Método Codificado:
Se sabe por el método codificado que:
yi  O t
Zi 
C
Donde:
yi = Marca de clase
Ot = origen de trabajo
C = amplitud de intervalo de clase Ls – LI
Luego expresando como método codificado será:
c 
2
V(v)   n i z i 
2  n i zi  
2

n  n 

Propiedades de la Varianza
 La desviación de la constante es cero V(c) = 0
 La variancia de una variable mas una constante es igual a la

variancia de la variable.
V(x  c)  V(x)
 La variancia de una variable multiplicada por una constante es:
V(cx)  c 2 V(x) c  cte.

V(ax  b)  a 2 V(x) a y b  ctes.
b) Desviación estándar o típica(S)
Mide el grado de uniformidad con respecto a la media.
S  Alto grado de variabilidad
S  Alto grado de uniformidad
Es útil para juzgar la representatividad del promedio

aritmético.
Ejemplo:
Sea xi = Variables de ingresos mensuales.
S2= 61.53
S = S 2 =7.84
Esto significa que los ingresos mensuales presentan una

dispersión respecto a su media de 7.84 soles
c) Coeficiente de variabilidad(Cv)
S
Cv  .100
y
 Es útil para comparar la uniformidad de 2 o poblaciones.

 Se expresa en %
 No presenta unidades.
MEDIDAS DE FORMA
En otras ocasiones podemos estar interesados

sobre cuestiones de forma como la simetría de los
datos o “su aplastamiento”. La mayoría de las
medidas de forma serán invariantes por cambio de
localización y de escala.
Coeficientes de Asimetría
Diremos que una distribución es simétrica cuando

su mediana, su moda y su media aritmética
coinciden.
Diremos que una distribución es asimétrica a la
derecha si las frecuencias (absolutas o relativas)
descienden más lentamente por la derecha que por
la izquierda.
Si las frecuencias descienden más lentamente por
la izquierda que por la derecha diremos que la
distribución es asimétrica a la izquierda.
Si la distribución de frecuencias es unimodal y tiene forma
de campana, se definen los coeficientes de asimetría :
3(x  Me )
CA2 
x
x  Mo
CA1 
x
Su valor es cero cuando la distribución es simétrica, positivo
cuando existe asimetría a la derecha y negativo cuando
existe asimetría a la izquierda.
Coeficiente de Concentración (Índice de Gini)
El Coeficiente de Gini es una medida de la desigualdad

ideada por el estadístico italiano Corrado Gini.
Normalmente se utiliza para medir la desigualdad en los
ingresos, pero puede utilizarse para medir cualquier
forma de distribución desigual. El coeficiente de Gini es
un número entre 0 y 1, en donde 0 se corresponde con la
perfecta igualdad (todos tienen los mismos ingresos) y 1
se corresponde con la perfecta desigualdad (una persona
tiene todos los ingresos y los demás ninguno). El índice
de Gini es el coeficiente de Gini expresado en
porcentaje, y es igual al coeficiente de Gini multiplicado
por 100.
El coeficiente de Gini se puede calcular mediante la
siguiente fórmula:
n 1
 p  q  i i
CG  i 1
n 1
p
i 1
i
Donde:
Apuntamiento o Curtosis
Miden la mayor o menor cantidad de datos que se
agrupan en torno a la moda. Se definen 3 tipos de
distribuciones según su grado de curtosis:
Distribución Mesocúrtica: presenta un grado de

concentración medio alrededor de los valores centrales
de la variable (el mismo que presenta una distribución
normal).
Distribución Leptocúrtica: presenta un elevado grado
de concentración alrededor de los valores centrales de la
variable.
Distribución Platicúrtica: presenta un reducido grado

de concentración alrededor de los valores centrales de la
variable.
VIDEO DE MEDIDAS DE
POSICIÓN

2da Clase Estadistica Descriptiva

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

2da Clase Estadistica Descriptiva

Cargado por

Copyright:

Formatos disponibles

SEMANA 2

 Fabulación y codificación de los datos

Medidas de Posición Medidas de Dispersión Medidas de Forma

 Media  Varianza  Coeficientes de

Llamadas así porque tratan de localizar el centro

Es el promedio del conjunto de datos, hay tres formas de

I.- Datos No Agrupados:

[ 15.2 – 115.5 > 15.35 2

III.- Método Codificado:

 Si se tiene 2 o más sub poblaciones de tamaño n1 y n2,

Es aquel valor que divide en 2 partes iguales al conjunto de

I.- Datos No Agrupados:

Se ordena ya sea en forma creciente y/o decreciente.

 Si “n” es impar ; (n = 7) Impar.

Tabla de frecuencias con variable cuantitativa discreta

Lj = Limite inferior de la clase mediana.

 La mediana no esta afectada por los términos extremos.

Es aquel valor que se presenta c/mayor frecuencia, se halla

I.- Datos No Agrupados:

Se escoge aquel valor que se repita más.

Análogamente a la mediana, que divide los datos en dos

 CUARTILES: Son los tres valores que dividen al conjunto

 DECILES: son los nueve valores que dividen al conjunto

Se definen genéricamente como cuantiles a los cuartiles,

Estas medidas son necesarias para efectuar comparaciones significativas

Mide la variabilidad absoluta de los datos yi, respecto a la

La varianza es una cantidad no negativa(S2 > 0 )

n  30  S2n -1  Varianza Insesgada

La varianza se halla de tres formas:

Luego expresando como método codificado será:

 La desviación de la constante es cero V(c) = 0

 La variancia de una variable mas una constante es igual a la

 La variancia de una variable multiplicada por una constante es:

V(cx)  c 2 V(x) c  cte.

Mide el grado de uniformidad con respecto a la media.

S  Alto grado de variabilidad

S  Alto grado de uniformidad

Es útil para juzgar la representatividad del promedio

Sea xi = Variables de ingresos mensuales.

Esto significa que los ingresos mensuales presentan una

 Es útil para comparar la uniformidad de 2 o poblaciones.

En otras ocasiones podemos estar interesados

Diremos que una distribución es simétrica cuando

El Coeficiente de Gini es una medida de la desigualdad

Distribución Mesocúrtica: presenta un grado de

Distribución Platicúrtica: presenta un reducido grado

También podría gustarte