Está en la página 1de 11

CAPITULO I

ESTADISTICA DESCRIPTIVA : FORMULARIO

• Algunas definiciones

Letras griegas utilizadas en notación estadística

Nombre Min May.


alfa
beta
2
ji cuadrada
delta
mu
nu
pi Π
rho
sigma Σ
tau
theta

• Sumatoria de una serie de términos:

∑x i = x1+ + x 2 + x3 + ......... + x n
i =1
MEDIDAS DE TENDENCIA CENTRAL

Las medidas de tendencia central se utilizan para representar a través de un solo


valor a una serie de datos agrupados o no agrupados y son valores alrededor de los
cuáles tienden a agruparse las observaciones.

Media aritmética

Es el promedio de los valores de las observaciones.

Datos no agrupados Datos agrupados


N N

∑x i ∑ fx i i

Población = i =1
= i =1
N N
n n

∑x i ∑ fx i i

Muestra x= i =1
x= i =1
n n

Media ponderada

Cuando se desea otorgar pesos diferentes a una serie de datos de acuerdo a su


importancia desigual, la media se obtiene sumando los productos de los valores
observados y sus pesos respectivos, dividida entre la suma de éstos últimos.

∑ (wx ) i i

x= i =1
n

∑w i
i =1
Mediana

Es el valor que divide en dos partes iguales un arreglo ordenado. Si el número de


valores es impar, la mediana es el valor medio del arreglo, si el número de valores es
par, la mediana será el promedio de los dos valores centrales. En el caso de datos
agrupados, se ubica el intervalo en el que está la mediana y su valor se obtiene a
través de interpolación.

n
Mediana = L1 + 2
(∑ f ) c
fmed
L1 = límite inferior de clase .
n = número total de observaciones

∑ f = suma de frecuencias de las clases inferiores a la de la mediana.


fmed = frecuencia de clase de la mediana.
c = tamaño del intervalo de clase de la mediana

Moda

Es el valor que ocurre con mayor frecuencia en una serie de datos, puede no existir y
tampoco ser único. Una distribución con una sola moda se conoce como unimodal. En el
caso de datos agrupados la moda se calcula por interpolación, después de ubicar la clase
modal:

 ∆1 
Mo = L 1 +  
 ∆1 + ∆ 2 
L 1 = límite inferior de la clase modal
∆ 1 = diferencia entre la frecuencia de la clase
modal y la frecuencia de la clase anterior.
∆ 2 = diferencia entre la frecuencia de la clase
modal y la frecuencia de la clase posterior.
Rango Medio

Es el valor promedio de las medidas mayor y menor de un conjunto de datos

Li + Ls
Rango =
2
Li = límite inferior de los datos
Ls = límite superior de losdatos

Media Geométrica

Es la raíz n-ésima del producto de n valores.

Datos no agrupados Datos agrupados


G = x 1 x 2 x 3...... xn
n
G = n x1f 1 x 2f 2 x 3f 3 ...xnfn

MEDIDAS DE DISPERSION

En el análisis estadístico es importante conocer la variabilidad de las observaciones


alrededor de su valor central. La variabilidad se mide de dos maneras: como
distancia entre observaciones seleccionadas o bien como desviaciones promedio de
las observaciones individuales respecto a un valor central.
De los primeros valores mencionados, los más usuales son el rango y el rango
interfractil.

Rango

Es la diferencia entre las medidas mayor y menor de un conjunto de datos. Para datos
agrupados y no agrupados se calcula:

R = Ls − Li
Ls = límite superior de clase
Li = límite inferior de clase

Fractiles y percentiles

Cualquier valor de un conjunto de datos bajo el cuál se encuentra una proporción


específica de ellos.

Cuando esa proporción representa un porcentaje de datos, entonces se denomina


percentil y dentro de éstos los más conocidos son, los cuartiles y deciles.

• Cuartiles: dividen los datos observados en cuatro porciones, en cada una de ellas
se ubica el 25% de los datos.

• Deciles: dividen los datos observados en diez porciones, en cada una de ellas se
ubica el 10% de los datos.

La mediana es el segundo cuartil y el quinto decil.

Rango interfractil
Es la diferencia entre dos fractiles.
Desviación media

Es la media aritmética de todas las diferencias absolutas entre cada observación


individual y la media aritmética del conjunto de datos.

Datos no agrupados Datos agrupados


N N

∑ | xi − | ∑f i | xi − |
Dm = i =1
Dm = i =1
N
Población N
f i = frecuencia de la clase i
= media de la población
xi = punto medio de la clase
N = total de observaciones = media poblacional
N = total de observaciones

n n

∑| x − x | i ∑f i | xi − x |
Muestra Dm = i =1
Dm = i =1

n n
= media de lasobservaciones f i = frecuencia de la clase i
n = total de observaciones xi = punto medio de la clase i
x = media muestral
n = total de observaciones
Varianza

Es la media aritmética del cuadrado de las desviaciones de cada uno de los valores
respecto a la media.

Datos no agrupados Datos agrupados


N 2 N 2

∑(x − ) i ∑ f (x − )
i i

Población
2
= i=1 2
= i=1
N N

n 2 n 2

∑ ( xi − x ) ∑ fi ( xi − x )
Muestra s2 = i =1
s2 = i =1
n −1 n −1

Desviación estándar.
Es la raíz cuadrada positiva de la varianza

Población = 2

Muestra s = s2
Distribución normal

Describe un tipo de población cuya distribución de frecuencias se caracteriza por:

• La media = mediana = moda


• Es simétrica alrededor de este valor central
• Sus extremos se extienden en forma indefinida en ambas direcciones y se
aproximan pero nunca tocan al eje horizontal.

En una distribución normal de frecuencias, puede estimarse el porcentaje de los


valores que están a ±1, ±2 y ± 3 desviaciones estándard desde la media:

Intervalo % de datos en el intervalo


[ − , + ] 68.3%
[ −2 , +2 ] 95.4%
[ −3 , +3 ] 99.7%

Teorema de Chevyshev

Para cualquier población con una distribución, podemos esperar que sus datos se
dispersen alrededor de la media en al menos:

1
1− dónde k ≥ 1
k2

Estas predicciones son más conservadoras, aplicando este teorema, se espera que la
dispersión de los datos con relación a la media en términos de desviaciones estándard
es el siguiente:

Intervalo % de datos en el intervalo


[ − , + ] 0%
[ −2 , +2 ] 75%
[ −3 , +3 ] 89%
[ −4 , +4 ] 94%
Coeficiente de variación

Es la razón entre la desviación estándard y la media y nos indica el porcentaje de


datos que están ubicados alrededor de la media a una distancia de una desviación
estándard.

Población CV =

Muestra s
CV =
x

MEDIDAS DE FORMA

La forma de una distribución de frecuencias se puede describir por su simetría o falta


de ella (asimetría) y por su agudeza (curtosis).

Asimetría

Grado de asimetría, es el grado de distorsión de una distribución de frecuencias


desde la simetría horizontal, cuando se tiene una distribución unimodal, se pueden
presentar tres casos:

Asimetría cero media = mediana = moda


Asimetría positiva media > mediana > moda
Asimetría negativa moda > mediana >media
Coeficiente de Pearson

Es la medida de asimetría más conocida, es la razón de la diferencia de la media y la


moda entre la desviación estándard.

− mo
Sk =

Población = media de la población


mo = mod a de la población
= desviación estándard de la población
x − mo
Sk =

Muestra x = media d e l amuestra


mo = mod a de lamuestra
= desviación estándard de la muestra

De acuerdo al valor del coeficiente, tenemos que:

Sk = 0 simetría
Sk < 0 sezgo negativo
Sk > 0 sezgo positivo
Curtosis

Es el grado de agudeza de una curva de distribución de frecuencias y su cálculo es:

Datos no agrupados Datos agrupados


N

∑(x − )
4
i
N

∑ f (x )
i =1
i −
k= N i

Población 4 k= i =1
fi
= media
= media
xi = valores observados
xi = punto medio de la clase i
N = total de observaciones
fi = frecuencia de la clase i
4
= cuadrado de la var ianza
n

∑ (x − x )
4
i
n

∑ f (x − x)
i =1
i
Muestra k= n i

s4 k= i =1
fi
x = media
x = media
xi = valores observados
xi = punto medio de la clase i
n = total de observaciones
fi = frecuencia de la clase i
s 4 = cuadrado d e l avar ianza

De acuerdo al valor del coeficiente, las curvas tienen diferentes denominaciones:

k=3 mesocúrticas
k>3 leptocúrticas son más agudas
k<3 platocúrticas son más planas

También podría gustarte