Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2. Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas: Medidas de posición y de tendencia
central
Bibliografía:
Lind, Marchal, Wathen, 2012, Estadística aplicada a los negocios y la economía, McGraw Hill.
Webster, Allen, 2001, Estadística aplicada a los negocios y la economía.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
Ladatos
estadística es una de las herramientas más ampliamente utilizadas; su aplicación en instituciones gubernamentales y
educativas, en los negocios, en la industria, en la banca y en otros quehaceres diarios hacen de la estadística una
herramienta indispensable.
Como área de estudio, la Estadística proporciona los métodos que ayudan a resolver los problemas correspondientes, para
ello es necesario conocer los conceptos básicos que conforman los contenidos de esta materia tales como:
a) Población.
b) Muestra.
c) Variable.
d) Datos u observaciones.
e) Parámetros.
f) Estadígrafos o Estadísticos.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
Población: es un conjunto de personas, entidades u objetos del cual se quiere saber algo que nos interesa para tomar una
determinación acertada.
Muestra: es un subconjunto de la población que se estudia para determinar el parámetro que describe la característica
deseada de la misma.
Muestra aleatoria es aquella que se obtiene de tal manera que cada posible observación disponible en la población, tiene
la misma probabilidad de ser seleccionada
Para poder obtener estas muestras es necesario que no intervenga la preferencia del investigador por algún elemento de
la población; es decir, cada elemento de la población deberá tener igual oportunidad de ser seleccionado
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
Variable aleatoria: es una función que asocia un numero a cada resultado del espacio muestral.
Datos u observaciones: Es el elemento primario de la información, los datos reunidos pueden cobrar significación. Solo o
aislado el dato no posee relevancia, pero utilizado en las premisas de un razonamiento puede llevarnos a una conclusión.
Surgen de la observación o la experiencia.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
Parámetros: Es una cantidad numérica calculada sobre una población y resume los valores que esta toma en algún
atributo.
Intenta resumir toda la información que hay en la población en unos pocos números.
Estadígrafos o Estadísticos: Es la cantidad numérica calculada sobre una muestra que resume su información en algún
aspecto.
Los promedios y proporciones muestrales son características medibles de las muestras respectivas.
Los indicadores que permiten hallar un valor numérico, el mismo que representa a toda la población o muestra en estudio
se les denomina estadígrafos.
Si un estadístico se usa para aproximar un parámetro suele llamarse estimador.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
“La Estadística Descriptiva es el estudio que incluye la obtención, organización, presentación y descripción de
información numérica”.
“La inferencia estadística es una técnica mediante la cual se obtienen generalizaciones o se toman decisiones en base a
una información obtenida mediante técnicas descriptivas”.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
Una vez que se han obtenido los datos y que se ha hecho el estudio de los valores que pueden tomar las variables, la
primera tarea de la Estadística es la de ordenar y presentar los datos en tablas que permitan ver la tendencia de los
mismos. Ordenados los datos se facilita su representación en diagramas y gráficas de diferentes tipos.
Existen diferentes formas de describir, presentar, ordenar, resumir la información en tablas y su presentación en
diferentes tipos de gráficas.
Escalas de Medición.
La clasificación de las variables depende del nivel de medición de la característica deseada.
El nivel de medición también denominado escalas de medición, se lo puede clasificar en:
1. Nominal: es la que se usa para asignarle una etiqueta a las categorías que se construyen de la variable con el único fin
de distinguir unas de otras.
2. Ordinal: es la que permite ordenar o jerarquizar las categorías que se construyen de la variable que se evalúa.
3. Por intervalo: es la que permite clasificar, ordenar y cuantificar las categorías que se establecen de la variable.
En la carrera de caballos que se realizó el jueves 03 de diciembre corrieron 10 caballos, los cuales se numeraron de la
siguiente forma:
10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20
Al finalizar la carrera, el primer lugar lo obtuvo el caballo 13, el segundo lugar el 19, y el tercer lugar el 16. El primer lugar
hizo un tiempo de 15.3 minutos, el segundo lugar 15.5 y el tercer lugar 15.8 minutos.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
En la carrera de caballos que se realizó el jueves 03 de diciembre corrieron 10 caballos, los cuales se numeraron de la
siguiente forma:
10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20
Al finalizar la carrera, el primer lugar lo obtuvo el caballo 13, el segundo lugar el 19, y el tercer lugar el 16. El primer lugar
hizo un tiempo de 15.3 minutos, el segundo lugar 15.5 y el tercer lugar 15.8 minutos.
Definición de variable:
Número de caballo
Lugar que ocupó
Tiempo que hizo
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
En la carrera de caballos que se realizó el jueves 03 de diciembre corrieron 10 caballos, los cuales se numeraron de la
siguiente forma:
10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20
Al finalizar la carrera, el primer lugar lo obtuvo el caballo 13, el segundo lugar el 19, y el tercer lugar el 16. El primer lugar
hizo un tiempo de 15.3 minutos, el segundo lugar 15.5 y el tercer lugar 15.8 minutos.
Al finalizar la carrera, el primer lugar lo obtuvo el caballo 13, el segundo lugar el 19, y el tercer lugar el 16. El primer lugar
hizo un tiempo de 15.3 minutos, el segundo lugar 15.5 y el tercer lugar 15.8 minutos.
La escala de medición por intervalos es la de mayor nivel de medición e incluye las dos anteriores; para poder usarse
con la precisión deseada es necesario fijar un patrón de medida que cuantifique a la variable con la misma exactitud,
cuantas veces sea medida.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
Distribución de Frecuencias
Los datos agrupados en tablas, nos permiten ver con facilidad el número de observaciones iguales o comprendidos en un
intervalo, a este número de repeticiones iguales de la variable se llama frecuencia y se denota por fi. Otros valores
relacionados con la frecuencia son:
La frecuencia relativa que se denota por fr.
La frecuencia acumulada que se denota por Fi.
La frecuencia relativa acumulada que se denota Fr.
I, A, M, Q, Q, M, A, I, M, Q, A, Q, I, Q, M,
Q, M, M, A, Q, I, Q, M, I, I, Q, M, M, A, I,
M, A, A, Q, I, M, Q, Q, A, M, A, Q, M, A, Q
I, A, M, Q, Q, M, A, I, M, Q, A, Q, I, Q, M,
Q, M, M, A, Q, I, Q, M, I, I, Q, M, M, A, I,
M, A, A, Q, I, M, Q, Q, A, M, A, Q, M, A, Q
NÚMERO DE
CATEGORÍAS ALUMNOS ( f )
I 8
Q 14
M 13
A 10
Total 45
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
a) ¿Cuál categoría es la de mayor frecuencia? Química
b) ¿Qué información podemos determinar con la categoría de mayor frecuencia? La carrera de Química es la mas
solicitada
c) ¿Qué carrera es la menos solicitada? Ingeniería
NÚMERO DE
CATEGORÍAS ALUMNOS ( f )
I 8
Q 14
M 13
A 10
Total 45
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
El gerente de una Empresa, Kimberly preocupado por el pago de energía consumida solicito al jefe de planta, un estudio
del consumo diario durante el mes de agosto. Los resultados obtenidos. KW/hr (kilowatts por hora) son los siguientes:
Consumo
(KW/hr) (f)
5 2
6 3
7 4
8 5
9 6
10 5
11 3
12 2
Total 30
Investigación elaborada por el jefe de planta, datos tomados del consumo diario del mes de agosto de 2015
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
a) Define la variable del problema
b) ¿Qué tipo de variable es?
c) ¿Qué valores toma la variable?
d) ¿Qué tipo de escala define la variable?
e) ¿Cuál es la mayor frecuencia de la variable?
f) ¿Qué frecuencia tiene la variable cuya categoría es 10?
Consumo
(KW/hr) (f)
5 2
6 3
7 4
8 5
9 6
10 5
11 3
12 2
Total 30
Investigación elaborada por el jefe de planta, datos tomados del consumo diario del mes de agosto de 2015
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
a) Define la variable del problema: Consumo en KW/hr
b) ¿Qué tipo de variable es? Cuantitativa contínua
c) ¿Qué valores toma la variable? Los valores de la variable se encuentran en un rango de 5 a 12 KW/hr
d) ¿Qué tipo de escala define la variable? Por intervalos
e) ¿Cuál es la mayor frecuencia de la variable? La mayor frecuencia es 6 y significa en 6 días del mes se tiene consumo
de 9 KW/hr.
f) ¿Qué frecuencia tiene la variable cuya categoría es 10? La frecuencia de la categoría 10 es 5 lo cual significa que en 5
días del mes hubo un consumo de 10 KW/hr.
Consumo
(KW/hr) (f)
5 2
6 3
7 4
8 5
9 6
10 5
11 3
12 2
Total 30
Investigación elaborada por el jefe de planta, datos tomados del consumo diario del mes de agosto de 2015
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
Otro parámetro importante es la frecuencia relativa que simbolizaremos con “fr”, ésta se obtiene dividiendo la
frecuencia absoluta (fi) entre el número de elementos de la muestra que simbolizaremos con (n).
La frecuencia relativa se puede expresar como una razón, como una proporción o como un porcentaje.
( fr )
Consumo
(KW/hr) (f) Razón Proporción Porcentaje
5 2 2/5 0,07 7% Frecuencia relativa (fr) es la proporción de
6 3 3/30 0,10 10% elementos que pertenecen a una categoría y
7 4 4/30 0,13 13% ésta se obtiene dividiendo su frecuencia
8 5 5/30 0,17 17% absoluta entre el número total de elementos
9 6 6/30 0,20 20% de la muestra.
10 5 5/30 0,17 17%
11 3 3/30 0,10 10%
12 2 2/30 0,07 7%
Total 30 30/30 1,00 100%
Investigación elaborada por el jefe de planta, datos tomados del consumo diario del mes de agosto de 2015
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
Gráficas
Al representar en una gráfica la información concentrada en la tabla de frecuencias, ésta es un recurso visual que nos
permite tener una idea clara, precisa, global y rápida acerca de las observaciones de una muestra o población.
Existen muchos tipos de gráficas en las que se pueden representar la frecuencia absoluta (fi), relativa (fr) y acumulada
(Fi) y con ellas podemos estimar algunos valores con la simple observación.
Los diferentes tipos de gráfica que podemos usar para representar las observaciones de un determinado problema y la
selección de este tipo, dependen de la variable en estudio.
Si la variable en estudio es de tipo cuantitativo, los gráficos que podemos usar para su representación gráfica son:
a) Histogramas
b) Polígonos de frecuencias
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
Histograma es la representación gráfica en el plano coordenado de las características concentradas en la tabla de
frecuencias de una variable continua.
Al gerente general de la empresa “Conductores Monterrey” le interesa conocer la antigüedad de sus trabajadores, por lo
que le indica al gerente de personal que realice un análisis del problema.
El gerente de personal recabó de los expedientes la siguiente información sobre los años de antigüedad:
Al gerente general de la empresa “Conductores Monterrey” le interesa conocer la antigüedad de sus trabajadores, por lo
que le indica al gerente de personal que realice un análisis del problema.
El gerente de personal recabó de los expedientes la siguiente información sobre los años de antigüedad:
Años de servicio
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
Polígono de Frecuencia
El polígono de frecuencia se construye a partir de los datos de la tabla de frecuencias.
Sobre el eje horizontal se levanta por el punto medio segmentos verticales punteados que terminan a la altura de su
frecuencia de clase, se unen los puntos superiores con un segmento de recta que empieza medio punto antes del límite
superior de la última clase.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
Polígono de Frecuencia acumulada relativa
Si en la escala vertical en lugar de representar las frecuencias absolutas, se representa la frecuencia relativa, se obtiene
un polígono de frecuencia acumulada
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
Polígono de Frecuencia acumulada (Ojiva)
La gráfica de la frecuencia acumulada es muy útil porque en ella podemos determinar cuántas observaciones hay por
arriba o por debajo de algún valor que nos interese.
La gráfica que se obtiene de la frecuencia acumulada también se conoce con el nombre de ojiva.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
Gráficas Circulares, Diagramas de Barras, Pictogramas y Gráficas de Líneas
Gráficas Circulares.
Una forma de representar datos u observaciones de una variable cualitativa es mediante un diagrama circular. es un
recurso estadístico que se utiliza para representar porcentajes y proporciones. Consisten en subgrupos que son
combinados para formar una unidad entera.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
Gráficas Circulares, Diagramas de Barras, Pictogramas y Gráficas de Líneas
Diagrama de barras.
Los gráficos de barras, que también llamados gráficos de columnas, muestran observaciones hechas a lo largo del
tiempo. Son principalmente utilizados para mostrar el cambio de una variable en el tiempo.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
Gráficas Circulares, Diagramas de Barras, Pictogramas y Gráficas de Líneas
Pictograma
Es otra forma de representación gráfica de la información de un determinado problema.
En este tipo de gráfica se usa la imagen de la variable, por ejemplo:
a) Árboles: si la variable representa árboles.
b) Libros: si la variable representa libros.
c) Casas: si la variable representa casas.
d) Figuras de personas: si la variable son personas, etcétera.
1.- Qué es estadística: Conceptos y fundamentos básicos; recolección y presentación de
datos
En Estadística Descriptiva el material de trabajo lo constituyen los datos, que son los resultados de las observaciones.
Una vez obtenidos los datos hay que ordenarlos y clasificarlos mediante algún criterio racional de modo que sea posible
una visión crítica de los mismos.
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
Medidas de tendencia central: se refieren a los valores de la variable que suelen estar en el centro de la distribución.
Análisis estadísticos sencillos que se usan para describir características, o elementos típicos, de la información que se
recoge con el fin de resumir los datos e indicar similitudes o diferencias entre ellos que permita comparar dos grupos de
datos.
Moda:
La moda de una muestra x1, x 2,…xn es aquel valor de la variable que se presenta con mayor frecuencia; es decir es el
valor que más se repite, y se denota por Mo.
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
EJEMPLO: Edad de jubilados encuestados
Mo = Moda
LMo = Límite inferior de la clase modal
d1 = frecuencia de la clase modal menos la frecuencia de la clase anterior a ella (d1 = fi – fi-1 )
d2 = frecuencia de la clase modal menos la frecuencia de la clase posterior a ella (d2 = fi – fi+1 )
h = amplitud del intervalo de clase
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
EJEMPLO: Edad de jubilados encuestados
EDAD mi fi fri fri% Fi Fri Fri%
50-60 55 10 0,2 20% 10 0,2 20%
60-70 65 18 0,36 36% 28 0,56 56%
70-80 75 14 0,28 28% 42 0,84 84%
80-90 85 6 0,12 12% 48 0,96 96%
90-100 95 2 0,04 4% 50 1 100%
La clase modal es 60-70 , ya que es la que presenta la mayor frecuencia
LMo = 60
fi = 18
fi-1= 10
fi+1 = 14
d1 = 18 – 10 =8
d2 = 18-14 = 4
h = 10
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
Mediana: Dado un conjunto de n observaciones x1, x 2,…., xn, de la variable x, se define la mediana de este conjunto de
valores, como aquel valor que no es superado ni supera a más de la mitad de las n observaciones, arregladas en orden
de magnitud creciente o decreciente.
Cálculo de la Mediana: Ordenar los datos en orden de magnitud creciente, X(1) X(2) X(n) entonces la mediana esta
definida mediante la siguiente fórmula:
Nota: En general, la mediana no se ve afectada por valores muy grandes o por valores muy pequeños en los datos en
comparación a la media. Por ejemplo, si x 3= 40, la media es 1/3(1+2+40)=14.33, sin embargo la mediana es Me=2.
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
x1 2
x2 3
x3 5
x4 6
x5 8
La mitad de las observaciones son menores o iguales que 5 y la otra mitad son mayores o iguales que 5.
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
x1 2
x2 3
x3 5
x4 6
x5 8
x6 9
La mitad de las observaciones son menores o iguales que 5,5 y la otra mitad son mayores o iguales que 5,5.
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
Cálculo de la mediana para datos agrupados
Si los datos están agrupados en una distribución de frecuencias, se selecciona el intervalo de clase que contiene a la
mediana llamado clase mediana. Para ello, debemos determinar la frecuencia acumulada absoluta que contenga al
elemento número
Me = Mediana
Lm = Límite inferior de la clase mediana
n = cantidad de datos
Fi-1 = frecuencia acumulada absoluta de la clase anterior al intervalo mediana
fi = frecuencia absoluta de la clase mediana
h = amplitud del intervalo de clase
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
La clase mediana es la que contenga el elemento en la posición (50+1)/2 =25,5 es el intervalo 60-70
Buscamos en la frecuencia acumulada Fi y vemos que se halla en el intervalo [60, 70)
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
Media:
La media (o promedio) de una muestra x1, x 2,…xn de tamaño n de una variable x, se define como la suma de todos los
valores observados en la muestra, dividida por el número total de observaciones n, es decir:
Por ejemplo si los datos son x1 = 1, x 2 =2, x3=3, entonces la media es 1/3(1+2+3)=2.
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
El Departamento de Acción Social ofrece un estímulo especial a aquellas agrupaciones en las que la edad promedio de
los niños que asisten está por debajo de 9 años. Si los siguientes datos corresponden a las edades de los niños que
acuden de manera regular al Centro ¿calificará éste para el estímulo?
8
5
9
10
9
12
7
12
13
7
8
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
Entre las medidas de tendencia central, la media requiere variables cuantitativas (de intervalo, aunque también suele
calcularse con datos ordinales).
La mediana es un estadístico típicamente ordinal (requiere valores ordinales al menos). Al contrario de lo que ocurre con
la media, la mediana es insensible a la presencia de valores extremos, por lo tanto es preferible a la media cuando la
distribución es asimétrica.
La moda sirve para todo tipo de variables, pero es mas apropiada para caracterizar datos categóricos porque es un
estadístico que aprovecha información nominal.
Las distribuciones simétricas tienen el mismo valor para la media, la mediana y la moda.
2.- Estadística clásica para variables discretas y continuas, sin agrupar y agrupadas:
Medidas de posición y de tendencia central
En una distribución con sesgo positivo, la moda se halla en el punto más alto de la distribución, la mediana está hacia la
derecha de la moda y la media más a la derecha. Es decir Mo < Me < x
En una distribución con sesgo negativo, la moda es el punto más alto, la mediana está a la izquierda de la moda y la
media está a la izquierda de la mediana. Es decir, x < Me < Mo
Cuando la población tiene una distribución sesgada, con frecuencia la mediana resulta ser la mejor medida de posición,
debido a que está siempre entre la media y la moda.
La mediana no se ve altamente influida por la frecuencia de aparición de un solo valor como es el caso de la moda, ni se
distorsiona con la presencia de valores extremos como la media.
Cuartiles: divide la población en 4 partes iguales, calcula los percentiles 25, 50 y 75, es decir los valores por debajo de los
cuales se encuentra el 25%, el 50% y el 75% de los casos.
Percentiles: divide la población en 100 partes iguales, se usa también como genérico para dividir en valores concretos
(valores que acumulan un determinado porcentaje de casos)
Promedio de Número de Frecuencia Si el primer cuartil es 15,75 y representa 25,34 días ¿qué
Intervalos días pacientes acumulada
significa esto?
1 día a 9 días 5 5 5
El 25% de los pacientes fueron mandados a valoración en
10 día a 19 días 14.5 6 11
25,34 días y el 75% de los pacientes lo hicieron después
20 día a 29 días 24.5 8 19
de 25,34 días
30 día a 39 días 34.5 8 27
40 día a 49 días 44.5 4 31 Si el segundo cuartil es 31,5 y representa 50,9 días ¿a
50 día a 59 días 54.5 5 36 que conclusiones se puede llegar?
60 día a 69 días 64.5 7 43 Que en 50,9 días se habían atendido al 50 % de los
70 día a 79 días 74.5 8 51 pacientes a ser valorados de los niveles de glucosa
80 día a 89 días 84.5 4 55
90día a 100 días 94.5 8 63 Si el tercer cuartil es 47,25 y representa 74,78 días ¿Qué
puede concluir?
El 75% de pacientes que envió la clínica a realizarse
estudios de glucosa lo realizo en 74,78días y el resto en
los otros días restantes
3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
Las medidas de dispersión estudian la distribución de los valores de la serie, analizando si estos se encuentran más o
menos concentrados, o más o menos dispersos.
Existen diversas medidas de dispersión, entre las más utilizadas podemos destacar las siguientes:
1.- Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor más elevado y el valor
más bajo.
4.- Coeficiente de variación de Pearson: Se calcula como cociente entre la desviación típica y la media.
El interés del coeficiente de variación es que al ser un porcentaje permite comparar el nivel de dispersión de dos
muestras. Esto no ocurre con la desviación típica, ya que viene expresada en las mismas unidas que los datos de la serie.
Por ejemplo, para comparar el nivel de dispersión de una serie de datos de la altura de los alumnos de una clase y otra
serie con el peso de dichos alumnos, no se puede utilizar las desviaciones típicas (una viene vienes expresada en cm y la
otra en kg). En cambio, sus coeficientes de variación son ambos porcentajes, por lo que sí se pueden comparar.
3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
Las medidas de forma permiten conocer que forma tiene la curva que representa la serie de datos de la muestra. En
concreto, podemos estudiar las siguientes características de la curva:
a) Concentración: mide si los valores de la variable están más o menos uniformemente repartidos a lo largo de la
muestra. Para medir el nivel de concentración de una distribución de frecuencia se pueden utilizar distintos indicadores,
entre ellos el Indice de Gini.
El Indice Gini (IG) puede tomar valores entre 0 y 1
IG = 0 : concentración mínima. La muestra está uniformemente repartida a lo largo de todo su rango.
IG = 1 : concentración máxima. Un sólo valor de la muestra acumula el 100% de los resultados.
b) Asimetría: mide si la curva tiene una forma simétrica, es decir, si respecto al centro de la misma (centro de simetría)
los segmentos de curva que quedan a derecha e izquierda son similares.
c) Curtosis: mide si los valores de la distribución están más o menos concentrados alrededor de los valores medios de la
muestra.
3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
0 corresponde a la perfecta igualdad (todos tienen los mismos ingresos).
1 corresponde a la perfecta desigualdad (una persona tiene todos los ingresos y todos los demás ninguno).
Ejemplo 1: vamos a calcular el índice de Gini de una serie de datos con los sueldos de los empleados de una
empresa. Datos: Calculamos los valores que necesitamos para aplicar la fórmula:
Sueldos Xi ni Σ ni pi Xi · ni ΣXi · ni qi pi - qi
Empleados
(miles de €)
20 10 10 25,0 200 200 13,8 11,2
20 10
27 12 22 55,0 324 524 36,3 18,7
27 12
36 8 30 75,0 288 812 56,3 18,7
36 8
48 5 35 87,5 240 1052 73,0 14,5
48 5
60 3 38 95,0 180 1232 85,4 9,6
60 3
90 1 39 97,5 90 1322 91,7 5,8
90 1
120 1 40 100,0 120 1442 100,0 0
120 1
X x x x x x x x
Σpi (entre 1 y n-1) = 435,0 Σ(pi - qi) (entre 1 y n-1 )= 78,5
Por lo tanto:
G=78,5/435,0=0,18 (18%)
Un coeficiente de Gini de 0,18 indica que la muestra está bastante uniformemente repartida, es decir, su nivel de
concentración no es excesivamente alto.
3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
0 corresponde a la perfecta igualdad (todos tienen los mismos ingresos).
1 corresponde a la perfecta desigualdad (una persona tiene todos los ingresos y todos los demás ninguno).
Ejemplo 2: el mismo ejemplo pero considerando que hay más personal de la empresa que cobra el sueldo máximo, lo que conlleva mayor
concentración de renta en unas pocas personas.
Sueldos Xi ni Σ ni pi Xi · ni ΣXi · ni qi pi - qi
Empleados
(miles de €)
20 10 10 25,0 200 200 10,9 14,1
20 10
27 10 20 50,0 270 470 25,6 24,4
27 10
36 8 28 70,0 288 758 41,2 28,8
36 8
48 5 33 82,5 240 998 54,3 28,2
48 5
60 0 33 82,5 0 998 54,3 28,2
60 3
90 0 33 82,5 0 998 54,3 28,2
90 0
120 7 40 100,0 840 1838 100,0 0,00
120 4
x x x x x x x x
Por tanto: Σpi (entre 1 y n-1) = 392,5 Σ(pi - qi) (entre 1 y n-1 ) = 151,9
G=151,9/392,5=0,39 (39%)
CONCLUSIÓN: se puede observar que Portugal, España y Grecia son los países con mayores desigualdades.
3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
Asimetría o sesgo
Es un estadístico que describe la simetría de la distribución alrededor de la media.
Si el sesgo es igual a cero, la distribución es simétrica (normal), ambas colas será iguales.
Si no existe una cola o sesgo, la asimetría tendrá un valor de cero.
3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
Curtosis, es un estadístico que describe el grado de “punta” o “achatamiento” de la distribución de una variable con
relación a la distribución normal.
El uso del coeficiente de la Curtosis es muy importante para establecer el grado en el que la distribución de los valores se
acerca o aleja de la curva normal.
3.- Estadígrafos de variabilidad, dispersión y de forma aplicados eficientemente a variables
de la realidad: Medidas de dispersión, concentración, asimetría y curtosis.
Si el coeficiente es positivo, quiere decir que
La curtosis positiva indica una distribución hay una mayor concentración de los datos en
que perfila un gráfico “más en punta”, tal torno a la media. (Leptocurtica)
como vemos en la curva del centro, con Si el coeficiente es negativo, la distribución se
relación a la normal; será Leptocúrtica. llama Platicúrtica y muestra que hay una menor
concentración de datos en torno a la media;
sería más achatada.
El Rango es 770.5