Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadstica Repaso
Profesor: Carlos Gonzlez Lavado
Universidad de Aconcagua
www.isuac.com
www.cgonzalez.cl
Estadstica Descriptiva
La estadstica descriptiva es una ciencia
que analiza series de datos (por ejemplo,
edad de una poblacin, altura de los
estudiantes de una escuela, temperatura
en los meses de verano, etc) y trata de
extraer conclusiones sobre el
comportamiento de estas variables.
Estadstica Descriptiva
Las variables pueden ser de dos tipos:
Ejemplo Distribucion.xlsx
Estadstica Descriptiva
La distribucin de frecuencia
agrupada.
Supongamos que medimos la estatura de
los operarios de una empresa y obtenemos
los siguientes resultados (m):
Estadstica Descriptiva
La distribucin de frecuencia
agrupada.
Si presentramos esta informacin en una
tabla de frecuencia obtendramos una tabla
de 30 lneas (una para cada valor), cada
uno de ellos con una frecuencia absoluta
de 1 y con una frecuencia relativa del 3,3%.
Esta tabla nos aportara escasa
informacin.
Estadstica Descriptiva
La distribucin de frecuencia
agrupada.
En lugar de ello, preferimos agrupar los
datos por intervalos, con lo que la
informacin queda ms resumida (se
pierde, por tanto, algo de informacin),
pero es ms manejable e informativa:
Ejemplo cuartiles
Estadstica Descriptiva
Medidas de dispersicin
1.Concentracin
2.Asimetra
3.Curtosis
Estadstica Descriptiva
a) Concentracin: mide si los valores de la
variable estn ms o menos uniformemente
repartidos a lo largo de la muestra.
b) Asimetra: mide si la curva tiene una forma
simtrica, es decir, si respecto al centro de la
misma (centro de simetra) los segmentos de
curva que quedan a derecha e izquierda son
similares.
c) Curtosis: mide si los valores de la
distribucin estn ms o menos concentrados
alrededor de los valores medios de la muestra.
Estadstica Descriptiva
a) Concentracin
Para medir el nivel de concentracin de una
distribucin de frecuencia se pueden
utilizar distintos indicadores, entre ellos el
ndice de Gini.
Este ndice se calcula aplicando la siguiente
frmula:
Estadstica Descriptiva
a) Concentracin
En donde pi mide el porcentaje de
individuos de la muestra que presentan un
valor igual o inferior al de xi.
Estadstica Descriptiva
a) Concentracin
Mientras que qi se calcula aplicando la
siguiente frmula:
Estadstica Descriptiva
a) Concentracin
El Indice Gini (IG) puede tomar valores
entre 0 y 1:
IG = 0 : concentracin mnima. La muestra
est unifomemente repartida a lo largo de
todo su rango.
IG = 1 : concentracin mxima. Un slo
valor de la muestra acumula el 100% de los
resultados.
Estadstica Descriptiva
a) Concentracin
Ejemplo: vamos a calcular el Indice Gini de
una serie de datos con los sueldos de los
empleados de una empresa (millones
pesos).
asimetria.xlsx
Estadstica Descriptiva
c) Curtosis
g2 = 0 (distribucin mesocrtica).
g2 = 0 (distribucin mesocrtica).
g2 > 0 (distribucin leptocrtica).
g2 < 0 (distribucin platicrtica).
Ejemplo:
Estadstica Descriptiva
Las distribuciones bidimensionales son
aquellas en las que se estudian al mismo
tiempo dos variables de cada elemento de
la poblacin: por ejemplo: peso y altura de
un grupo de estudiantes; superficie y precio
de las viviendas de una ciudad; potencia y
velocidad de una gama de coches
deportivos.
Estadstica Descriptiva
Para representar los datos obtenidos se utiliza una
tabla de correlacin:
Ejemplo:
Estadstica Descriptiva
Distribuciones Marginales
Al analizar una distribucin bidimensional,
uno puede centrar su estudio en el
comportamiento de una de las variables,
con independencia de como se comporta la
otra. Estaramos as en el anlisis de una
distribucin marginal.
Estadstica Descriptiva
Distribuciones Marginales
De cada distribucin bidimensional se
pueden deducir dos distribuciones
marginales: una correspondiente a la
variable x, y otra correspondiente a la
variable y.
Estadstica Descriptiva
Distribuciones Marginales
Ejemplo: a partir del ejemplo que vimos en
la leccin anterior (serie con los pesos y
medidas de los alumnos de una clase)
vamos a estudiar sus distribuciones
marginales.
Ejemplo:
Estadstica Descriptiva
Coeficiente de Correlacin
En una distribucin bidimensional puede
ocurrir que las dos variables guarden algn
tipo de relacin entre si.
Por ejemplo, si se analiza la estatura y el
peso de los alumnos de una clase es muy
posible que exista relacin entre ambas
variables: mientras ms alto sea el alumno,
mayor ser su peso.
Estadstica Descriptiva
Coeficiente de Correlacin
El coeficiente de correlacin lineal
mide el grado de intensidad de esta posible
relacin entre las variables. Este
coeficiente se aplica cuando la relacin que
puede existir entre las variables es lineal
(es decir, si representramos en un grfico
los pares de valores de las dos variables la
nube de puntos se aproximara a una
recta).
Estadstica Descriptiva
Coeficiente de Correlacin
y = a + bx
Estadstica Descriptiva
Regresin Lineal
La regresin lineal nos permite calcular el
valor de estos dos parmetros, definiendo
la recta que mejor se ajusta a esta nube de
puntos.
El parmetro "b" viene determinado por
la siguiente frmula:
Estadstica Descriptiva
Regresin Lineal
Es la covarianza de las dos variables,
dividida por la varianza de la variable "x".
El parmetro "a" viene determinado por:
a = ym - (b * xm)