Formulario PDF

CAPITULO I
ESTADISTICA DESCRIPTIVA : FORMULARIO
• Algunas definiciones
Letras griegas utilizadas en notación estadística
Nombre Min May.

alfa
beta
2
ji cuadrada
delta
mu
nu
pi Π
rho
sigma Σ
tau
theta
• Sumatoria de una serie de términos:
∑x i = x1+ + x 2 + x3 + ......... + x n
i =1
MEDIDAS DE TENDENCIA CENTRAL
Las medidas de tendencia central se utilizan para representar a través de un solo

valor a una serie de datos agrupados o no agrupados y son valores alrededor de los
cuáles tienden a agruparse las observaciones.
Media aritmética
Es el promedio de los valores de las observaciones.
Datos no agrupados Datos agrupados

N N
∑x i ∑ fx i i
Población = i =1
= i =1
N N
n n
∑x i ∑ fx i i
Muestra x= i =1
x= i =1
n n
Media ponderada
Cuando se desea otorgar pesos diferentes a una serie de datos de acuerdo a su

importancia desigual, la media se obtiene sumando los productos de los valores
observados y sus pesos respectivos, dividida entre la suma de éstos últimos.
∑ (wx ) i i
x= i =1
n
∑w i
i =1
Mediana
Es el valor que divide en dos partes iguales un arreglo ordenado. Si el número de

valores es impar, la mediana es el valor medio del arreglo, si el número de valores es
par, la mediana será el promedio de los dos valores centrales. En el caso de datos
agrupados, se ubica el intervalo en el que está la mediana y su valor se obtiene a
través de interpolación.
n
Mediana = L1 + 2
(∑ f ) c
fmed
L1 = límite inferior de clase .
n = número total de observaciones
∑ f = suma de frecuencias de las clases inferiores a la de la mediana.

fmed = frecuencia de clase de la mediana.
c = tamaño del intervalo de clase de la mediana
Moda
Es el valor que ocurre con mayor frecuencia en una serie de datos, puede no existir y
tampoco ser único. Una distribución con una sola moda se conoce como unimodal. En el
caso de datos agrupados la moda se calcula por interpolación, después de ubicar la clase
modal:
 ∆1 
Mo = L 1 +  
 ∆1 + ∆ 2 
L 1 = límite inferior de la clase modal
∆ 1 = diferencia entre la frecuencia de la clase
modal y la frecuencia de la clase anterior.
∆ 2 = diferencia entre la frecuencia de la clase
modal y la frecuencia de la clase posterior.
Rango Medio
Es el valor promedio de las medidas mayor y menor de un conjunto de datos
Li + Ls
Rango =
2
Li = límite inferior de los datos
Ls = límite superior de losdatos
Media Geométrica
Es la raíz n-ésima del producto de n valores.

G = x 1 x 2 x 3...... xn
n
G = n x1f 1 x 2f 2 x 3f 3 ...xnfn
MEDIDAS DE DISPERSION
En el análisis estadístico es importante conocer la variabilidad de las observaciones

alrededor de su valor central. La variabilidad se mide de dos maneras: como
distancia entre observaciones seleccionadas o bien como desviaciones promedio de
las observaciones individuales respecto a un valor central.
De los primeros valores mencionados, los más usuales son el rango y el rango
interfractil.
Rango
Es la diferencia entre las medidas mayor y menor de un conjunto de datos. Para datos
agrupados y no agrupados se calcula:
R = Ls − Li
Ls = límite superior de clase
Li = límite inferior de clase
Fractiles y percentiles
Cualquier valor de un conjunto de datos bajo el cuál se encuentra una proporción

específica de ellos.
Cuando esa proporción representa un porcentaje de datos, entonces se denomina

percentil y dentro de éstos los más conocidos son, los cuartiles y deciles.
• Cuartiles: dividen los datos observados en cuatro porciones, en cada una de ellas
se ubica el 25% de los datos.
• Deciles: dividen los datos observados en diez porciones, en cada una de ellas se
ubica el 10% de los datos.
La mediana es el segundo cuartil y el quinto decil.
Rango interfractil
Es la diferencia entre dos fractiles.
Desviación media
Es la media aritmética de todas las diferencias absolutas entre cada observación

individual y la media aritmética del conjunto de datos.

N N
∑ | xi − | ∑f i | xi − |
Dm = i =1
Dm = i =1
N
Población N
f i = frecuencia de la clase i
= media de la población
xi = punto medio de la clase
N = total de observaciones = media poblacional
N = total de observaciones
n n
∑| x − x | i ∑f i | xi − x |
Muestra Dm = i =1
Dm = i =1
n n
= media de lasobservaciones f i = frecuencia de la clase i
n = total de observaciones xi = punto medio de la clase i
x = media muestral
n = total de observaciones
Varianza
Es la media aritmética del cuadrado de las desviaciones de cada uno de los valores
respecto a la media.

N 2 N 2
∑(x − ) i ∑ f (x − )
i i
Población
2
= i=1 2
= i=1
N N
n 2 n 2
∑ ( xi − x ) ∑ fi ( xi − x )
Muestra s2 = i =1
s2 = i =1
n −1 n −1
Desviación estándar.
Es la raíz cuadrada positiva de la varianza
Población = 2
Muestra s = s2
Distribución normal
Describe un tipo de población cuya distribución de frecuencias se caracteriza por:
• La media = mediana = moda

• Es simétrica alrededor de este valor central
• Sus extremos se extienden en forma indefinida en ambas direcciones y se
aproximan pero nunca tocan al eje horizontal.
En una distribución normal de frecuencias, puede estimarse el porcentaje de los

valores que están a ±1, ±2 y ± 3 desviaciones estándard desde la media:
Intervalo % de datos en el intervalo

[ − , + ] 68.3%
[ −2 , +2 ] 95.4%
[ −3 , +3 ] 99.7%
Teorema de Chevyshev
Para cualquier población con una distribución, podemos esperar que sus datos se
dispersen alrededor de la media en al menos:
1
1− dónde k ≥ 1
k2
Estas predicciones son más conservadoras, aplicando este teorema, se espera que la
dispersión de los datos con relación a la media en términos de desviaciones estándard
es el siguiente:
Intervalo % de datos en el intervalo

[ − , + ] 0%
[ −2 , +2 ] 75%
[ −3 , +3 ] 89%
[ −4 , +4 ] 94%
Coeficiente de variación
Es la razón entre la desviación estándard y la media y nos indica el porcentaje de

datos que están ubicados alrededor de la media a una distancia de una desviación
estándard.
Población CV =
Muestra s
CV =
x
MEDIDAS DE FORMA
La forma de una distribución de frecuencias se puede describir por su simetría o falta

de ella (asimetría) y por su agudeza (curtosis).
Asimetría
Grado de asimetría, es el grado de distorsión de una distribución de frecuencias

desde la simetría horizontal, cuando se tiene una distribución unimodal, se pueden
presentar tres casos:
Asimetría cero media = mediana = moda

Asimetría positiva media > mediana > moda
Asimetría negativa moda > mediana >media
Coeficiente de Pearson
Es la medida de asimetría más conocida, es la razón de la diferencia de la media y la

moda entre la desviación estándard.
− mo
Sk =
Población = media de la población

mo = mod a de la población
= desviación estándard de la población
x − mo
Sk =
Muestra x = media d e l amuestra

mo = mod a de lamuestra
= desviación estándard de la muestra
De acuerdo al valor del coeficiente, tenemos que:
Sk = 0 simetría
Sk < 0 sezgo negativo
Sk > 0 sezgo positivo
Curtosis
Es el grado de agudeza de una curva de distribución de frecuencias y su cálculo es:

N
∑(x − )
4
i
N
∑ f (x )
i =1
i −
k= N i
Población 4 k= i =1
fi
= media
= media
xi = valores observados
xi = punto medio de la clase i
N = total de observaciones
fi = frecuencia de la clase i
4
= cuadrado de la var ianza
n
∑ (x − x )
4
i
n
∑ f (x − x)
i =1
i
Muestra k= n i
s4 k= i =1
fi
x = media
x = media
xi = valores observados
xi = punto medio de la clase i
n = total de observaciones
fi = frecuencia de la clase i
s 4 = cuadrado d e l avar ianza
De acuerdo al valor del coeficiente, las curvas tienen diferentes denominaciones:
k=3 mesocúrticas
k>3 leptocúrticas son más agudas
k<3 platocúrticas son más planas

Formulario PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Formulario PDF

Cargado por

Copyright:

Formatos disponibles

CAPITULO I

ESTADISTICA DESCRIPTIVA : FORMULARIO

Letras griegas utilizadas en notación estadística

Nombre Min May.

• Sumatoria de una serie de términos:

Las medidas de tendencia central se utilizan para representar a través de un solo

Es el promedio de los valores de las observaciones.

Datos no agrupados Datos agrupados

Cuando se desea otorgar pesos diferentes a una serie de datos de acuerdo a su

Es el valor que divide en dos partes iguales un arreglo ordenado. Si el número de

∑ f = suma de frecuencias de las clases inferiores a la de la mediana.

Es el valor promedio de las medidas mayor y menor de un conjunto de datos

Es la raíz n-ésima del producto de n valores.

Datos no agrupados Datos agrupados

En el análisis estadístico es importante conocer la variabilidad de las observaciones

Cualquier valor de un conjunto de datos bajo el cuál se encuentra una proporción

Cuando esa proporción representa un porcentaje de datos, entonces se denomina

La mediana es el segundo cuartil y el quinto decil.

Es la media aritmética de todas las diferencias absolutas entre cada observación

Datos no agrupados Datos agrupados

Datos no agrupados Datos agrupados

Describe un tipo de población cuya distribución de frecuencias se caracteriza por:

• La media = mediana = moda

En una distribución normal de frecuencias, puede estimarse el porcentaje de los

Intervalo % de datos en el intervalo

Intervalo % de datos en el intervalo

Es la razón entre la desviación estándard y la media y nos indica el porcentaje de

La forma de una distribución de frecuencias se puede describir por su simetría o falta

Grado de asimetría, es el grado de distorsión de una distribución de frecuencias

Asimetría cero media = mediana = moda

Es la medida de asimetría más conocida, es la razón de la diferencia de la media y la

Población = media de la población

Muestra x = media d e l amuestra

De acuerdo al valor del coeficiente, tenemos que:

Es el grado de agudeza de una curva de distribución de frecuencias y su cálculo es:

Datos no agrupados Datos agrupados

De acuerdo al valor del coeficiente, las curvas tienen diferentes denominaciones:

También podría gustarte