Está en la página 1de 44

SEMANA 2

ESTADISTICA DESCRIPTIVA
Docente:
Mercedes Aida Osorio Maza
mosorio@uni.edu.pe

2018-II
TEORIA
TEMAS A DESARROLLAR

 Fabulación y codificación de los datos


continuos.
 Estadígrafos de posición media; mediana.
 Estadígrafos de Dispersión: varianza,
Desviación Standard, Coeficiente de
Variabilidad.
MEDIDAS ESTADÍSTICAS
En numerosas ocasiones, en
vez de trabajar con todos
los datos, es preferible
disponer de una o más
medidas descriptivas que
resumen los datos de forma
cuantitativa.
Las medidas descriptivas
son valores numéricos
calculados a partir de la
muestra y que nos resumen
la información contenida en
ella
CLASIFICACIÓN
MEDIDAS ESTADÍSTICAS

Medidas de Posición Medidas de Dispersión Medidas de Forma

Medidas de Centralización

 Media  Varianza  Coeficientes de


 Mediana Asimetría
 Moda  Desviación Típica
 Coeficiente de
 Coeficiente de Concentración
Variabilidad (Índice de Gini)
Otras Medidas de Posición
 Apuntamiento o
 Cuantiles Curtosis
 Porcentiles
 Cuartiles
 Deciles
MEDIDAS DE POSICIÓN
A continuación
estudiaremos diferentes
parámetros estadísticos
que nos permitirán
conocer la tendencia
posicional de los datos.
Veremos en primer lugar
medidas de tendencia
central y posteriormente
otras medidas alusivas
igualmente a la posición.
MEDIDAS DE CENTRALIZACIÓN

Llamadas así porque tratan de localizar el centro


de la distribución de los datos.
Las principales medidas de centralización son:

a) Media Aritmética
b) Mediana.
c) Moda
a) MEDIA ARITMÉTICA( y )

Es el promedio del conjunto de datos, hay tres formas de


hallarlo.

I.- Datos No Agrupados:

y   i , n  Tamaño de la muestra
y
n

Ejemplo:

13  14  .....24
13, 14, 17, 21, 24,  y 
5
II.- Datos Agrupados en Tablas de Frecuencias:

y  ny i i

n
Donde: n i  Frecuencia absoluta
y i  Marca de clase
n  Tamaño de muestra
Ejemplo:
 n i yi 
Estimación de la y para datos agrupados  y   
 n 
Limites yi ni

[ 15.2 – 115.5 > 15.35 2


[ 15.5 – 15.8 > 15.65 5
[ 15.8 – 16.1 > 15.95 11
[ 16.1 – 16.4 > 16.25 6
[ 16.4 – 16.7 > 16.55 3
[ 16.7 – 17.0 ] 16.85 3
k
n i yi
y
i 1 n
6
n i yi 2(15.35)  5(15.65)  ......3(16.85)
y 
i 1 n 30

III.- Método Codificado:


c
y  Ot   ni Z i
n

Donde:

n  Frecuencia absoluta
c  Amplitud
O t  Origen de trabajo, es una marca de clase que presenta mayor frecu e ncia
Zi  C odificació n
Reglas para elegir Ot (origen de trabajo)
 Tomamos Ot a una de las marcas de clase yi.
 Si el numero de intervalos es impar Ot es la marca de clase del intervalo
central.
 Si el número de intervalos es par, Ot es la marca de uno de los 2
intervalos centrales, prefiriendo el intervalo al cual le corresponde mayor
frecuencia.
Ejemplo:
Hallar la media aritmética por el método codificado y  ny i i

n
Estaturas yi - O t
yi ni Zi  , nizi
(Limites) c
[ 1.50 – 1.55 > 1.525 2 -2 -4
[ 1.55 – 1.60 > 1.575 12 -1 -12
[ 1.60 – 1.65 > 1.625 Ot 42 0 0
[ 1.65 – 1.70 > 1.675 36 1 36
[ 1.70 – 1.75 > 1.725 25 2 50
[ 1.75 – 1.80] 1.775 3 3 9
Total n=120 79
c  1.55 - 1.50  0
1.525  1.625  0.10
z1    2
0.05 0.05
1.575  1.625  0.05
z2    1
0.05 0.05
z3  0
1.675  1.625 0.05
z4   1
0.05 0.05
z5 2
z6  3

Método Codificado:
k
c
y  ot 
n
n
i 1
i zi

0.05
y  1.625  (79)
120
 y  1.6579mts
Propiedades de la Media Aritmética

 Si se tiene 2 o más sub poblaciones de tamaño n1 y n2,


entonces la media total se calcula:

n1y1  n 2 y 2  ............nk y k
y
n1  n 2  ........nk

 Para K = cte.
- Si yi  x i  k  y  xk
- Si yi  kx i  y  kx
x x
- Si yi  i y
k k
 La suma de las desviaciones respecto al promedio es cero
n

 y
i 1
i  y  0 desviación : yi  y 
b) MEDIANA

Es aquel valor que divide en 2 partes iguales al conjunto de


datos, se halla de tres formas:

I.- Datos No Agrupados:

Se ordena ya sea en forma creciente y/o decreciente.

yn  y n
1
Si n  par  Me  2 2
n  Tamaño de la muestra
2
Si n  impar  Me  y n 1
2
Ejemplo:
 Si “n” es par sean los #: 10, 1, 2, 7, 6, 3, 4, 5,
Ordenando: 1, 2, 3, 4, 5, 6, 7, 10

y n/2  y n/2 1
Me 
2
y 4  y5 45
Me    4.5
2 2

 Si “n” es impar ; (n = 7) Impar.


Datos: 1, 2, 3, 4, 5, 6, 7.

Me  y n 1  y 4  4
2
II.- Datos Agrupados:

Tabla de frecuencias con variable cuantitativa discreta

n
Si N J 1   Me  y J
2
n y J-1  y J
Si N J-1   Me 
2 2
Ejemplo:
Si yi ni Ni
n 60
  30
0 3 3 2 2
1 5 8 Como
2 10 18
3 18 36 n
4 14 50
N j-1   Me  y j
2
5 7 57
6 3 60 1 8  3 0  Me  3

Si yi ni Ni n 50
  25
2 2
0 5 5
n
1 12 17 Como N j-1  25 
2 8 25 2
3 15 40
y j1  y j 2  3
4 5 45  Me    2.5
5 5 50 2 2
III.- Tabla de Frecuencias con Variable Cuantitativa Continua

 n/2  N J 1 
Me  LJ  CJ  
 n J 
Donde:

Lj = Limite inferior de la clase mediana.


n = Numero total de observaciones.
Cj = Amplitud del intervalo de la clase mediana.
Nj-1 = Frecuencia absoluta acumulada hasta la clase
inmediata anterior a la clase mediana.
nj = Frecuencia absoluta de la clase mediana.
Propiedades de la Mediana

 La mediana no esta afectada por los términos extremos.

 Si k = Constante

yi  x i  k  Me y  Me x  k
y i  kx i  Me y  kMe x
xi Me x
yi   Me y 
k k
c) MODA

Es aquel valor que se presenta c/mayor frecuencia, se halla


de dos formas:

I.- Datos No Agrupados:

Se escoge aquel valor que se repita más.

Ejemplo:

 4, 7, 8, 9, 9, 3, 6.  Mo = 9 (Unimodal)
 3, 3, 4, 5, 6, 7, 8, 8.  Mo1 = 3, Mo2 = 8 (Bimodal)
II.- Datos Agrupados:

 d1 
Mo  Lo  Co  
 d1  d 2 

Lo = Limite inferior
Co = Amplitud de la clase modal.
d1 = Diferencia de la frecuencia absoluta
modal menos la anterior.
d2 = Diferencia de la frecuencia absoluta
modal menos la siguiente.
Ejemplo:
Limites ni Ni

[ 60 – 63 > 5 5
[ 63 – 66 > 18 23
[ 66 – 69 > 42 65
[ 69 – 72 > 27 92
[ 72 – 75 ] 8 100

 d1 
Mo  Lo  Co  
 d1  d 2 
 24   24 
Mo  66  3   66  3 
 24  15   29 
Mo  67.84
d1  42  18
d 2  42  27
Propiedades de la Moda

 Si k = Constante

1. y i  x i  k  Mo y  Mo x  k
2. yi  kx i  Mo y  kMo x
xi Mo x
3. y i   Mo y 
k k
OTRAS MEDIDAS DE POSICIÓN

Análogamente a la mediana, que divide los datos en dos


partes iguales, se definen otras medidas que dividirán los
datos en cuatro, diez o cien partes.
Los cuantiles son valores de la distribución que la dividen en
partes iguales, es decir, en intervalos, que comprenden el
mismo número de valores. Los más usados son los cuartiles,
los deciles y los percentiles.
 PERCENTILES: Son 99 valores que dividen en cien partes
iguales el conjunto de datos ordenados.

 CUARTILES: Son los tres valores que dividen al conjunto


de datos ordenados en cuatro partes iguales.

 DECILES: son los nueve valores que dividen al conjunto


de datos ordenados en diez partes iguales, son también un
caso particular de los percentiles.

Se definen genéricamente como cuantiles a los cuartiles,


deciles, percentiles,.....Los cuantiles de denominan también
parámetros de estructuras y son muy utilizados en las
CC.Sociales.
MEDIDAS DE DISPERSIÓN
Las medidas de posición central no
proporcionan, en general, suficiente
información para una adecuada
descripción de los datos, porque no
toman en cuanta la dispersión o
concentración de los mismos, por
lo tanto es claro que se requieren
otras medidas que indiquen el
grado de variabilidad de los datos.

Estas medidas son necesarias para efectuar comparaciones significativas


entre grupos de observaciones. Cuando se mide la dispersión de los valores
de una variable respecto de unas de sus medidas de posición, se está
midiendo el grado de representatividad que dicha medida de posición tiene
en el conjunto de los datos a los cuales pretende resumir.
Entre las medidas de dispersión mas conocidas son:

a) Varianza(S2)
b) Desviación estándar o típica(S).
c) Coeficiente de variabilidad(Cv)
d) Rango
a) Varianza ( S2 )

Mide la variabilidad absoluta de los datos yi, respecto a la


media

La varianza es una cantidad no negativa(S2 > 0 )


Si


 iy  y 2

n  30  S2n -1  Varianza Insesgada


n 1
 
S2n   i

2
y y
n  30  Varianza Sesgada
n
n  60  S2n -1  y/o S2n son iguales

La varianza se halla de tres formas:


I.- Datos No Agrupados:

 y  y
2

S 2
y  i

n
Donde:
y i  Obsevacion es
y  Promedio o media
n  Tamaño de muestra
Desarrollando:

2
  y i
 y2 (n  30)
S y
n
II.- Datos Agrupados:

k
n i (yi - y) 2
Sy  
2

i 1 n

Donde:
yi  marca de clase
n i  frecuencia absoluta

Desarrollando:

n i yi2
Sy   n  y (n  30)
2 2
III.- Método Codificado:
Se sabe por el método codificado que:
yi  O t
Zi 
C
Donde:
yi = Marca de clase
Ot = origen de trabajo
C = amplitud de intervalo de clase Ls – LI

Luego expresando como método codificado será:

c 
2
V(v)   n i z i 
2  n i zi  
2


n  n 

Propiedades de la Varianza

 La desviación de la constante es cero V(c) = 0

 La variancia de una variable mas una constante es igual a la


variancia de la variable.

V(x  c)  V(x)

 La variancia de una variable multiplicada por una constante es:

V(cx)  c 2 V(x) c  cte.


V(ax  b)  a 2 V(x) a y b  ctes.
b) Desviación estándar o típica(S)

Mide el grado de uniformidad con respecto a la media.

S  Alto grado de variabilidad

S  Alto grado de uniformidad

Es útil para juzgar la representatividad del promedio


aritmético.
Ejemplo:

Sea xi = Variables de ingresos mensuales.

S2= 61.53

S = S 2 =7.84

Esto significa que los ingresos mensuales presentan una


dispersión respecto a su media de 7.84 soles
c) Coeficiente de variabilidad(Cv)

S
Cv  .100
y

 Es útil para comparar la uniformidad de 2 o poblaciones.


 Se expresa en %
 No presenta unidades.
MEDIDAS DE FORMA

En otras ocasiones podemos estar interesados


sobre cuestiones de forma como la simetría de los
datos o “su aplastamiento”. La mayoría de las
medidas de forma serán invariantes por cambio de
localización y de escala.
Coeficientes de Asimetría

Diremos que una distribución es simétrica cuando


su mediana, su moda y su media aritmética
coinciden.
Diremos que una distribución es asimétrica a la
derecha si las frecuencias (absolutas o relativas)
descienden más lentamente por la derecha que por
la izquierda.
Si las frecuencias descienden más lentamente por
la izquierda que por la derecha diremos que la
distribución es asimétrica a la izquierda.
Si la distribución de frecuencias es unimodal y tiene forma
de campana, se definen los coeficientes de asimetría :

3(x  Me )
CA2 
x

x  Mo
CA1 
x
Su valor es cero cuando la distribución es simétrica, positivo
cuando existe asimetría a la derecha y negativo cuando
existe asimetría a la izquierda.
Coeficiente de Concentración (Índice de Gini)

El Coeficiente de Gini es una medida de la desigualdad


ideada por el estadístico italiano Corrado Gini.
Normalmente se utiliza para medir la desigualdad en los
ingresos, pero puede utilizarse para medir cualquier
forma de distribución desigual. El coeficiente de Gini es
un número entre 0 y 1, en donde 0 se corresponde con la
perfecta igualdad (todos tienen los mismos ingresos) y 1
se corresponde con la perfecta desigualdad (una persona
tiene todos los ingresos y los demás ninguno). El índice
de Gini es el coeficiente de Gini expresado en
porcentaje, y es igual al coeficiente de Gini multiplicado
por 100.
El coeficiente de Gini se puede calcular mediante la
siguiente fórmula:

n 1

 p  q  i i
CG  i 1
n 1

p
i 1
i

Donde:
Apuntamiento o Curtosis
Miden la mayor o menor cantidad de datos que se
agrupan en torno a la moda. Se definen 3 tipos de
distribuciones según su grado de curtosis:

Distribución Mesocúrtica: presenta un grado de


concentración medio alrededor de los valores centrales
de la variable (el mismo que presenta una distribución
normal).
Distribución Leptocúrtica: presenta un elevado grado
de concentración alrededor de los valores centrales de la
variable.

Distribución Platicúrtica: presenta un reducido grado


de concentración alrededor de los valores centrales de la
variable.
VIDEO DE MEDIDAS DE
POSICIÓN

También podría gustarte