Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística Descriptiva
1. Introducción:
1. Conceptos de: Población, muestra, subpoblación.
2. Variables estadísticas, clasificación.
2. Tablas Estadísticas: Tipos
3. Técnicas de recuento.
4. Distintos tipos de frecuencia.
5. Medidas estadísticas:
1. Centralización: Moda, Mediana y Media.
2. Dispersión: Desviación, desviación media, desviación típica, varianza.
3. Localización: Cuartiles, deciles, percentiles.
4. Simetría.
5. Curtosis.
Introducción:
Luego por tanto de cada elemento de la población podremos estudiar uno o más
aspectos cualidades o caracteres.
Variables y atributos.
Como hemos visto, los caracteres de un elemento pueden ser de muy diversos tipos,
por lo que los podemos clasificar en: dos grandes clases:
Variables Cuantitativas.
Las variables cuantitativas son las que se describen por medio de números, como por
ejemplo el peso, Altura, Edad, Número de Suspensos…
Los atributos son aquellos caracteres que para su definición precisan de palabras, es
decir, no le podemos asignar un número. Por ejemplo Sexo Profesión, Estado Civil,
etc.
Tablas Estadísticas:
A partir de este momento nos vamos a ocupar de las estadísticas de una sola
variable, "Estadísticas Unidimensionales".
Tablas tipo I:
5, 8, 16, 38, 45
2 1 2 2 1 2 4 2 1 1
2 3 2 1 1 1 3 4 2 2
2 2 1 2 1 1 1 3 2 2
3 2 3 1 2 4 2 1 4 1
1 3 4 3 2 2 2 1 3 3
Podemos observar que la variable toma valores comprendidos entre 1 y 4, por lo que
precisaremos una tabla en la que resumamos estos datos quedando la siguiente
tabla:
Personas Número de
Activas Familias
1 16
2 20
3 9
4 5
Total 50
450 1152 250 300 175 80 25 2680 605 785 1595 2300 5000 1200 100
5 180 200 675 500 375 1500 205 985 185 125 315 425 560 110
0
[ Li-1 , Li ) Frecuenci
a
[ 0,500) 16
[ 500, 1000) 6
[ 1000,1500 3
)
[ 1500, 2
2000)
[ 2000, 1
2500)
[ 2500, 1
3000)
[ 3000, 0
3500)
[ 3500, 0
4000)
[ 4000, 0
4500)
[ 4500, 0
5000)
[ 5000,5500 1
)
Aunque hoy en día, si se realiza un estudio estadístico importante esta tarea la realiza
el ordenador, ya sea por medio de programas de estadística específicos BMDP, SPSS,
o bien utilizando herramientas informáticas de propósito general como Bases de
Datos u Hojas de Cálculo
A lo largo del curso, veremos como mediante hojas de cálculo o bases de datos
podemos realizar este recuento.
Aunque el método más utilizado o conocido sea el primero, quizás el más cómodo de
utilizar es el 2º en la mayoría de los casos.
1. Frecuencia absoluta
2. Frecuencia relativa
3. Porcentaje
4. Frecuencia absoluta acumulada
5. Frecuencia relativa acumulada
6. Porcentaje acumulado
7. Ejemplo
Frecuencia absoluta:
Frecuencia relativa:
fa(xi)
fr (xi) =
n
Porcentaje:
La frecuencia relativa es un tanto por uno, sin embargo, hoy día es bastante
frecuente hablar siempre en términos de tantos por ciento o porcentajes, por lo que
esta medida resulta de multiplicar la frecuencia relativa por 100. La denotaremos por
p i.
Para poder calcular este tipo de frecuencias hay que tener en cuenta que la variable
estadística ha de ser cuantitativa o cualitativa ordenable. En otro caso no tiene
mucho sentido el cálculo de esta frecuencia. La frecuencia absoluta acumulada de un
valor de la variable, es el número de veces que ha aparecido en la muestra un valor
menor o igual que el de la variable y lo representaremos por Fa(xi)
Fa(xi)
Fr =
n
Porcentaje Acumulado:
Veamos esto con un ejemplo: Tomamos para ello los datos relativos a las personas
activas.
Medidas Estadísticas:
1. Introducción.
2. Tipos de Medida
3. Algunas consideraciones
INTRODUCCIÓN:
En las variables cuantitativas continuas, dado que la tabulación de los datos se hace
mediante intervalos, necesitaremos tomar un valor del intervalo para poder operar.
Este valor se denomina marca de clase y es el 53-1-u-punto medio del intervalo.
TIPOS DE MEDIDA:
1. Medidas de Centralización:
o Que sirven para determinar los valores centrales o medios de la
dsitribución
2. Medidas de Dispersión:
o Nos van a dar una idea sobre la representatividad de las medidas
centrales, a mayor dispersión menor representatividad.
3. Medidas de Localización:
o Útiles para encontrar determinados valores importantes, para una
"clasificación" de los elementos de la muestra o población.
4. Medidas de la Simetría:
o Sirven para ver si la distribución tiene el mismo comportamiento por
encima y por debajo de los valores centrales.
5. Ejemplo del cálculo de los coeficientes de simetría y Curtósis
ALGUNAS CONSIDERACIONES:
Medidas de Centralización:
1. Media
1. Media aritmética
2. Media geomética
3. Media armónica
2. Mediana
1. Variable discreta.
2. Variable contínua.
3. Moda
1. Variable discreta.
2. Variable contínua.
MEDIA:
Vamos a estudiar en este apartado los distintos tipos de media que hemos detallado
en el apartado anterior
Media aritmética:
La media aritmética de una variable se define como la suma ponderada de los valores
de la variable por sus frecuencias relativas y lo denotaremos por y se calcula
mediante la expresión:
MEDIA:
Vamos a estudiar en este apartado los distintos tipos de media que hemos detallado
en el apartado anterior
Media aritmética:
La media aritmética de una variable se define como la suma ponderada de los valores
de la variable por sus frecuencias relativas y lo denotaremos por y se calcula
mediante la expresión:
Propiedades:
Media geométrica:
Media armónica:
Mediana:
Veamos un ejemplo.
N parN Impar
Me=12
Me=
65 75 19 35
75 85 11 46
85 95 4 50
este caso es el 3º y aplicamos la fórmula anterior. Luego la
Mediana será
MODA:
Me=
La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que más
se repite, es la única medida de centralización que tiene sentido estudiar en una
variable cualitativa, pues no precisa la realización de ningún cálculo.
Por su propia definición, la moda no es única, pues puede haber dos o más valores de
la variable que tengan la misma frecuencia siendo esta máxima. En cuyo caso
tendremos una distribución bimodal o polimodal según el caso.
Otros autores dan una expresión aproximada para la moda que viene dada por la
siguiente expresión:
Veamos su cálculo mediante un ejemplo, para ello usaremos los datos del apartado
anterior
Li-1 Li ni Ni
45 55 6 6
55 65 10 16
Utilizando la fórmula aproximada
65 75 19 35
75 85 11 46
85 95 4 50
MEDIDAS DE DISPERSIÓN:
1. Breve Introducción
2. Rango
3. Concepto de desviación
4. Desviación Media
5. Varianza
6. Desviación Típica
7. Cuasivarianza
8. Cuasi Desviación típica
9. Coeficiente de Variación
10. Ejemplo
Breve Introducción
Rango:
No es una medida, son muchas medidas, pues cada valor de la variable lleva asociada
su correspondiente desviación, por lo que precisaremos una medida que resuma
dicha información.
La primera solución puede ser calcular la media de todas las desviaciones, es decir, si
consideramos como muestra la de todas las desviaciones y calculamos su media.
Pero esta solución es mala pues como veremos siempre va a ser 0.
Luego por lo tanto esta primera idea no es valida, pues las desviaciones positivas se
contrarrestan con las negativas.
Desviación media:
Varianza:
por .
Desviación típica:
Este estadístico se mide en la misma unidad que la variable por lo que se puede
interpretar mejor.
Cuasivarianza:
Es una medida de dispersión, cuya única diferencia con la varianza es que dividimos
Cuasidesviación típica:
Todas estas medidas de dispersión vienen influidas por la unidad en la que se mide la
variable, esto implica que si cambiamos de unidad de medida, los valores de estos
estadísticos se vean a su vez modificados. Además, no permite comparar por
ejemplo, en un grupo de alumnos si los pesos o las alturas presentan mas dispersión.
Pues no es posible comparar unidades de distinto tipo.
Precisamos por lo tanto, una medida "escalar", es decir, que no lleve asociado
ninguna unidad de medida.
Coeficiente de Variación:
Ejemplo
Dm=
C.V.=
1. Cuartiles.
2. Deciles.
3. Percentiles.
4. Ejemplos de cálculo.
5. Algunas medidas de dispersión asociadas
Cuartiles
Deciles
No tiene mucho sentido calcularlas para variables cualitativas discretas. Por lo que lo
vamos a ver sólo para las variables continuas.
k = 1 .. 9
Percentiles:
No tiene mucho sentido calcularlas para variables cualitativas discretas. Por lo que lo
vamos a ver sólo para las variables continuas.
k=1 .. 99
EJEMPLO:
Como se puede observar la forma de calcular estas medidas es muy similar a la del
cálculo de la mediana.
Li-1 Li ni Ni
45 55 6 6
55 65 10 16
65 75 19 35
75 85 11 46
85 95 4 50
Una vez estudiadas las medidas de localización surgen dos nuevas medidas de
dispersión, que son:
• Recorrido intercuartílico:
• Semirecorrido intercuartílico:
• Recorrido interdecílico:
• Recorrido intercentilico:
Medidas de Simetría:
Las medidas de la asimetría, al igual que la curtosis, van a ser medidas de la forma de
la distribución, es frecuente que los valores de una distribución tiendan a ser
similares a ambos lados de las medidas de centralización. La simetría es importante
para saber si los valores de la variable se concentran en una determinada zona del
recorrido de la variable.
Esta medida es muy fácil de calcular, pero menos precisa que el coeficiente de
asimetría de Pearson.
Para evitar el problema de la unidad, y hacer que sea una medida escalar y por lo
tanto relativa, dividimos por el cubo de su desviación típica. Con lo que resulta la
siguiente expresión:
Veamos por último el cálculo de estos dos últimos coeficientes en el ejemplo que
estamos estudiando.
Mo= 70.24
As=
Coeficiente de Asimetría
de Pearson As=
K=