Está en la página 1de 24

DOCUMENTO RESUMEN ESTADISTICA

DESCRIPTIVA

GENERALIDADES.

La estadística es una ciencia formal parte de las matemáticas que se encarga de estudiar y analizar variables resultantes
de un problema específico, a partir de recolectar, procesar y analizar datos, que permitan presentar la información en
forma lógica, que permita la toma de decisiones a fin de encontrar la mejor solución al problema objeto de estudio.

1. Tipos de estadística

La estadística se puede clasificar en diferentes tipos de acuerdo al análisis y la certidumbre que se tiene de los
resultados obtenidos. Típicamente la estadística la podemos clasificar así:

1.1 Estadística descriptiva

La estadística descriptiva se encarga de analizar una población o un hecho en forma


completa, y a partir del cálculo de unos parámetros (variables estadísticas) de los
datos recolectados de las características objeto de la investigación, nos permita
describir la población y/o hecho que nos den una información global. Como por
ejemplo, si se quisiera establecer el nivel de cumplimiento de los despachos de los
pedidos a los clientes en una compañía, el nivel de servicio ofrecido a un cliente, la
duración de los tiempos de entrega de un pedido, la duración de un inventario, el
análisis de la demanda, entre otros, podemos utilizar la estadística descriptiva, a partir del análisis de datos históricos
sobre los tiempos de entrega de los pedidos.

1.2 Estadística inferencial

En algunos momentos requerimos de hacer una análisis que implican tomar


demasiados datos de una población a fin de poder describir cual es el comportamiento
de las variables objetos de análisis, que nos permitan a través de su interpretación
poder encontrar una solución al problema objeto de estudio, como por ejemplo cuando
en campañas electorales para presidente o para alcalde se desea establecer quién
será el candidato ganador, para conocer quien ganaría tendríamos que consultar a
toda la población en relación a cuál sería su intención de voto, lo cual resultaría
demasiado costo. Es por eso que para poder establecer quien podrí ser el ganador y esto tuviera un costo razonable se
efectúa la selección de una muestra y a esta se le aplica el instrumento de recolección de la información, de forma que a
partir del procesamiento y análisis de la información se pueda establecer cuál es la intención de voto de la población a
partir de lo información resultante de la encuesta realizada a la muestra.

1.3 Estadística matemática o probabilística

En los anteriores tipos de estadística podemos ver que estas se encargan de estudiar
hechos en los cuales tenemos certeza que las variables observadas van a suceder o que
ya sucedieron, es decir que nos encontramos en el campo de la certeza, pero hay
momentos en los cual esta certeza no la tenemos, como por ejemplo cuando lanzamos un
dado no podemos conocer en qué número caerá o cuando hablamos de la demanda de un
producto, también nos es difícil establecer en que cantidad será comprada por el cliente.
Cuando estamos en estos casos de incertidumbre para poder establecer cuál será el posible resultado, recurrimos a la
estadística matemática o probabilística.

2. El método estadístico

Como se menciona anteriormente la estadística se encarga de tomar datos de una variable derivada de un problema que
necesitamos resolver, mediante la aplicación de una metodologías que nos permita tomar las decisiones más acertadas
a fin de solucionar el problema.

Por Msc. Francisco Villalba Cruz


DOCUMENTO RESUMEN ESTADISTICA
DESCRIPTIVA

Pero ahora bien, que es un problema? Un problema será una situación que requiere de una solución, a partir de
modificar una situación existente, de que se desea explicar un hecho o de que se desea describir algo.

En el desarrollo de un proceso estadístico, el primer paso es poder identificar el problema y/o hecho que será objeto de
estudio, ya que a partir de esto podemos determinar las variables a analizar y los instrumentos que se deben diseñar
para la recolección de la información.

Para efectuar un adecuado método de análisis es conveniente seguir los siguientes pasos:

Situación a Hecho a Elemento a


Modificar Explicar Describir

Problema

Identificar
Variables

Determinar Fuentes Diseñar instrumentos


Definir de información de recolección
Definir Recolectar
parámetros
Variables información
a evaluar
Validar Fuentes de Validar instrumentos
información de recolección

Clasificar
información

Analizar
información

Explicar comportamiento
de las variables

Presentar
informe

Donde a partir de la definición del problema, se identifican y se definen las variables que permitan, a partir de su análisis,
encontrar las posibles soluciones al problema, luego se definen los principales parámetros de evaluación de cada una de
las variables que permitan explicar su comportamiento, una vez identificados los parámetro de avaluación, se realiza una
exploración de las posibles fuentes de información de los datos necesarios para analizar la variable, posteriormente se
realiza una validación de la fuente de información que permita definir el grado de confianza que se obtendrá de los
resultados obtenidos. Validada la fuente se procede a diseñar los instrumentos de recolección de la información, los
cuales deben ser validados antes de realizar la recolección de la información. Una vez recolectados los datos se procede
a la clasificación de los datos, al análisis de los datos, a la explicación del comportamiento de los datos y a la
presentación del informe con las conclusiones a los hallazgos encontrados.

2.2 Definición de variables

Por Msc. Francisco Villalba Cruz


DOCUMENTO RESUMEN ESTADISTICA
DESCRIPTIVA
Una variable se puede definir como una característica que al ser medida en diferentes objetos o puede tomar diferentes
valores.

Estas a su vez se pueden clasificar de acuerdo a los siguientes criterios:

2.2.1 De acuerdo a su forma de medición

a. Variables cualitativas

Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se
denomina atributo o categoría y la medición consiste en una clasificación de dichos atributos

b. Variables cualitativas ordinales

La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el
intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado, grave.

c. Variables cualitativas nominales

En esta variable los valores no pueden ser sometidos a un criterio de orden como por ejemplo los colores o el lugar de
residencia

d. Variables cuantitativas

Son las variables que se expresan mediante cantidades numéricas. Las variables cuantitativas además pueden ser

e. Variables discretas

Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones
o interrupciones indican la ausencia de valores entre los distintos valores específicos que la variable pueda asumir.
Ejemplo: El número de hijos (1, 2, 3, 4, 5).

f. Variables continuas

Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo la masa (2,3
kg, 2,4 kg, 2,5 kg, ...), que solamente está limitado por la precisión del aparato medidor, en teoría permiten que siempre
exista un valor entre dos variables

2.2.2 De acuerdo a su influencia

a. Variables independientes

Es aquella característica o propiedad que se supone ser la causa del fenómeno estudiado. En investigación experimental
se llama así a la variable que el investigador manipula

b. Variable dependiente

Son las variables de respuesta que se observan en el estudio y que podrían estar influenciadas por los valores de las
variables independientes

Por Msc. Francisco Villalba Cruz


DOCUMENTO RESUMEN ESTADISTICA
DESCRIPTIVA
1. Medidas de tendencia central

En estadística una medida de tendencia central nos permite determinar un valor numérico hacia el cual datos tiende a
agruparse, se usan para describir y sintetizar mediante un número único, la posición de un valor en la variable, de forma
que este represente al conjunto de valores observados.

Para su cálculo debemos primero realizar un análisis de los datos individuales, a fin de poder determinar que tan bien
describe la tendencia del comportamiento los valores de la modo, la media y la mediana. Estas variables se pueden
considerar cuando la moda es igual a la mediana y esta a su vez es igual a la media. De no cumplirse con este requisito,
se hace entonces necesario, calcular estos mismos valores con daros agrupados, para poder realizar un mejor análisis
de la información.

Las principales medidas de tendencia central son:

• Media aritmética
• Mediana
• Moda
• Cuartiles deciles y percentiles
• Centro o rango de recorrido

1.1 Media aritmética

Esta es una de las medidas más utilizadas, ya que esta nos muestra el valor promedio de los datos, pero de igual forma
es uno de los datos más peligrosos de trabajar ya que en mucha ocasiones no nos muestra el comportamiento real de
los datos, debido a que es un valor muy sensible a las variaciones y de acuerdo a los valores extremos puede darnos
información no cierta. Por ejemplo: en un promedio podemos tener valores de

7 + 5 = 12 11 + 1 = 12
Promedio = 12/2 Promedio = 12/2
Promedio = 6 Promedio = 6
A pesar de que las diferencias de los valores extremos es mucho más alta para los valores 11 y uno, el valor promedio
es el mismo que si tuviéramos valor de 5 y 7, que no tienen una diferencia significativa entre sus valores extremos.

Para si calculo utilizamos la siguiente formula:

∑&%'( 𝑋%
𝑋" =
𝑛

Ejemplo:

Supongamos que se reunió la siguiente información, que representa las cantidades de mercancía entregada por una
empresa a sus clientes.

Por Msc. Francisco Villalba Cruz


DOCUMENTO RESUMEN ESTADISTICA
DESCRIPTIVA
Xi VALOR Xi VALOR Xi VALOR Sumatoria = 2.037
1 48 11 74 21 82
2 56 12 67 22 55 Total datos = 30 datos
3 60 13 92 23 65
4 67 14 70 24 88 2.037
5 47 15 69 25 52
𝑋" =
30
6 70 16 61 26 58
7 70 17 71 27 76 𝑋" = 68 𝑈𝑛𝑖𝑑𝑎𝑑𝑒𝑠
8 63 18 79 28 57
9 72 19 85 29 72
10 76 20 68 30 67

Esto quiere decir que las unidades promedio despachadas por esta empresa es de 68 unidades por pedido.

1.2 Mediana (Md)

La mediana se establece como el valor que se ubica en el centro de los datos de la muestra, cuando estos se ordenan
de mayor a menor.

Para calcular la ubicación del valor medio (VMd), utilizamos la siguiente ecuación:

𝑛+1
𝑉,- =
2
Ejemplo:

Para los datos que venimos analizando, en relación a las unidades despachadas por pedido, tendremos

Xi VALOR Xi VALOR Xi VALOR


1 48 11 74 21 82
2 56 12 67 22 55
3 60 13 92 23 65
4 67 14 70 24 88
5 47 15 69 25 52
6 70 16 61 26 58
7 70 17 71 27 76
8 63 18 79 28 57
9 72 19 85 29 72
10 76 20 68 30 67

1.3 Moda

Se define como el valor que más se repite en los datos analizados, se usa preferentemente en distribuciones que
presentan una amplitud constante y una frecuencia demasiado grande. Una serie puede ser unimodal, bimodal o
multimodal.

Ejemplo:

Para los datos que venimos analizando, en relación a las unidades despachadas por pedido, tendremos

Por Msc. Francisco Villalba Cruz


DOCUMENTO RESUMEN ESTADISTICA
DESCRIPTIVA
Xi VALOR Xi VALOR Xi VALOR
PERIODO VALOR PERIODO VALOR PERIODO VALOR
1 48 11 74 21 82 5 47 23 65 9 72
2 56 12 67 22 55 1 48 4 67 29 72
3 60 13 92 23 65 25 52 12 67 11 74
4 67 14 70 24 88 22 55 30 67 10 76
5 47 15 69 25 52 2 56 20 68 27 76
6 70 16 61 26 58 28 57 15 69 18 79
7 70 17 71 27 76 26 58 6 70 21 82
8 63 18 79 28 57 3 60 7 70 19 85
9 72 19 85 29 72 16 61 14 70 24 88
10 76 20 68 30 67 8 63 17 71 13 92

Analicemos los resultados obtenidos del ejemplo anterior, la media fue de 68 unidades, la mediana de 68.5 unidades y la
moda de 67 unidades, como estos valores son diferentes, se hace necesario recalcular estos valores tomando los datos
en forma agrupada.

1.4 Agrupación de datos

Para esto se desarrolla el siguiente procedimiento:

• Calcular el tamaño del intervalo de agrupación (TI), este se calcula de acuerdo a la siguiente ecuación

𝐷@A − 𝐷@&
𝑇𝐼 =
𝐾
Donde K es una constante que se calcula con la siguiente ecuación:

𝐾 = 1 + 3,322 ∗ log (𝑛)


Siendo n el número de datos analizados
• Calcular los intervalos de agrupación de acuerdo a lo establecido en el tamaño del intervalo
• Calcular la frecuencia de cada intervalo, para lo cual contamos los datos que se encuentran en cada uno de los
intervalos definidos
• Calculamos el porcentaje de participación de la frecuencia con relación al total de datos

𝑓%
%𝐹𝑟𝑒𝑐 = ∗ 100
∑&%'( 𝑓%

• Calculamos la frecuencia acumulada

𝐹𝑟𝑒𝑐 𝐴𝑐𝑢𝑚 = 𝑓% + 𝑓%S(

• Calculamos el porcentaje de participación de la frecuencia acumulada con relación al total de datos

𝑓𝑎𝑐𝑢𝑚%
%𝐹𝑟𝑒𝑐 𝐴𝑐𝑢𝑚 = ∗ 100
∑&%'( 𝑓𝑎𝑐𝑢𝑚%

• Por ultimo calculamos la marca de cada clase MCS

𝑅𝑎𝑛𝑔𝑜 𝑖𝑛𝑖𝑐𝑖𝑎𝑙 + 𝑅𝑎𝑛𝑔𝑜 𝑓𝑖𝑛𝑎𝑙


𝑀𝐶𝑆 =
2

Ejemplo:

Por Msc. Francisco Villalba Cruz


DOCUMENTO RESUMEN ESTADISTICA
DESCRIPTIVA
Tomemos los datos de los ejemplos anteriores para agruparlos

Xi VALOR Xi VALOR Xi VALOR


1 48 11 74 21 82
2 56 12 67 22 55
3 60 13 92 23 65
4 67 14 70 24 88
5 47 15 69 25 52
6 70 16 61 26 58
7 70 17 71 27 76
8 63 18 79 28 57
9 72 19 85 29 72
10 76 20 68 30 67

Si ordenamos los datos para facilitar el conteo de la frecuencia, la tabla de datos quedaría:

PERIODO VALOR PERIODO VALOR PERIODO VALOR


5 47 23 65 9 72
1 48 4 67 29 72
25 52 12 67 11 74
22 55 30 67 10 76
2 56 20 68 27 76
28 57 15 69 18 79
26 58 6 70 21 82
3 60 7 70 19 85
16 61 14 70 24 88
8 63 17 71 13 92

• Calculo del tamaño del intervalo (TI)

Calculamos el valor de K

𝐾 = 1 + 3,322 ∗ log (𝑛)

𝐾 = 1 + 3,322 ∗ log (30) Calculamos el log de 30, por que los datos analizados son 30

𝐾 = 5,9

Calculamos el TI
]^_ S]^`
𝑇𝐼 = a
De acuerdo a la tabla de datos ordenada el dato mayor es 92 y el dato menor 47

Por Msc. Francisco Villalba Cruz


DOCUMENTO RESUMEN ESTADISTICA
DESCRIPTIVA
92 − 47
𝑇𝐼 =
5.9

𝑇𝐼 = 7,6 ≅ 8

• Calculo del tamaño del intervalo

Para el primer intervalo iniciamos con el dato menor (47) y a este valor le sumamos el tamaño del intervalo (8) para
calcular el rango final

𝑅𝑎𝑛𝑔𝑜 𝑖𝑛𝑖𝑐𝑖𝑎𝑙 = 𝐷@& 𝑅𝑎𝑛𝑔𝑜 𝐼𝑛𝑖𝑐𝑖𝑎𝑙 = 47

𝑅𝑎𝑛𝑔𝑜 𝐹𝑖𝑛𝑎𝑙 = 𝑅𝑎𝑛𝑔𝑜 𝐼𝑛𝑖𝑐𝑖𝑎𝑙 + 𝑇𝐼 𝑅𝑎𝑛𝑔𝑜 𝑓𝑖𝑛𝑎𝑙 = 47 + 8 𝑅𝑎𝑛𝑔𝑜 𝑓𝑖𝑛𝑎𝑙 = 55

Para el siguiente intervalo, el rango inicial será el rango final anterior más uno (1), esto lo hacemos para evitar que exista
una duplicidad en la ubicación de los datos en los intervalos.

𝑅𝑎𝑛𝑔𝑜 𝑖𝑛𝑖𝑐𝑖𝑎𝑙 = 𝑅𝑎𝑛𝑔𝑜 𝑓𝑖𝑛𝑎𝑙 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 + 1 𝑅𝑎𝑛𝑔𝑜 𝐼𝑛𝑖𝑐𝑖𝑎𝑙 = 55 + 1 𝑅𝑎𝑛𝑔𝑜 𝐼𝑛𝑖𝑐𝑖𝑎𝑙 = 56

𝑅𝑎𝑛𝑔𝑜 𝐹𝑖𝑛𝑎𝑙 = 𝑅𝑎𝑛𝑔𝑜 𝐼𝑛𝑖𝑐𝑖𝑎𝑙 + 𝑇𝐼 𝑅𝑎𝑛𝑔𝑜 𝑓𝑖𝑛𝑎𝑙 = 56 + 8 𝑅𝑎𝑛𝑔𝑜 𝑓𝑖𝑛𝑎𝑙 = 64

Continuamos este cálculo hasta garantizar que el dato mayor quede incluido en el análisis. En consecuencia para el
ejemplo la taba de rangos quedara de la siguiente manera:

Rango Inicial Rango Final


47 55
56 64
65 73
74 82
83 91
92 100

Una vez determinados los intervalos, procedemos a contar los valores de la tabla de datos correspondientes a cada
intervalo, por ejemplo para el primer intervalo la cantidad de datos que están contenidos entre 47 y 55 son 4 datos, entre
56 y 64 hay contenidos 6. Efectuando este conteo establecemos la frecuencia para cada intervalo, y nos quedaría una
tabla de la siguiente manera:

Rango Inicial Rango Final Frecuencia


47 55 4
56 64 6
65 73 12
74 82 5
83 91 2
92 100 1
Total de datos 30
• Calculo del porcentaje de participación de la frecuencia con relación al total

Para el primer intervalo tendremos:

Por Msc. Francisco Villalba Cruz


DOCUMENTO RESUMEN ESTADISTICA
DESCRIPTIVA

ef i
%𝐹𝑟𝑒𝑐 = ∑` ∗ 100 % 𝐹𝑟𝑒𝑐 = jk ∗ 100 %𝐹𝑟𝑒𝑐 = 13,3%
fgh ef

Calculando los demás valores, la tabla quedaría

Rango Inicial Rango Final Frecuencia % Frecuencia


47 55 4 13,3%
56 64 6 20,0%
65 73 12 40,0%
74 82 5 16,7%
83 91 2 6,7%
92 100 1 3,3%
Total de datos 30 100,0%

• Calculo de la frecuencia acumulada

Para este cálculo iniciamos con la frecuencia del primer intervalo (4), para el segundo intervalo la frecuencia acumulada
sería, el valor de la frecuencia acumulada anterior, para este caso 4 y le sumamos la frecuencia relativa del segundo
intervalo (6), lo que nos da que la frecuencia acumulada del segundo intervalo será 4+6, 10 unidades.

Repitiendo este cálculo para las siguientes frecuencias acumuladas la taba quedaría

Rango Inicial Rango Final Frecuencia % Frecuencia Frecuencia


47 55 4 13,3% 4
56 64 6 20,0% 10
65 73 12 40,0% 22
74 82 5 16,7% 27
83 91 2 6,7% 29
92 100 1 3,3% 30
Total de datos 30 100,0%

• Calculo porcentaje de participación de la frecuencia acumulada en relación al total de datos

Para el primer intervalo tendremos:

elmn@f i
%𝐹𝑟𝑒𝑐 𝐴𝑐𝑢𝑚 = ∑` ∗ 100 % 𝐹𝑟𝑒𝑐 𝐴𝑐𝑢𝑚 = ∗ 100 %𝐹𝑟𝑒𝑐 𝐴𝑐𝑢𝑚 = 13,3%
fgh elmn@f jk

Calculando los demás valores, la tabla quedaría

Por Msc. Francisco Villalba Cruz


DOCUMENTO RESUMEN ESTADISTICA
DESCRIPTIVA
Rango Inicial Rango Final Frecuencia % Frecuencia Frecuencia % Frecuencia
47 55 4 13,3% 4 13,3%
56 64 6 20,0% 10 33,3%
65 73 12 40,0% 22 73,3%
74 82 5 16,7% 27 90,0%
83 91 2 6,7% 29 96,7%
92 100 1 3,3% 30 100,0%
Total de datos 30 100,0%

Calculo de la marca de clase para cada intervalo

Para el primer intervalo tomamos el rengo inicial 47 unidades y el rango final 55 unidades
ol&pq %&%m%lrsol&pq e%&lr iusvv
𝑀𝐶𝑆 = t
𝑀𝑆𝐶 = t
𝑀𝑆𝐶 = 51

Efectuando los cálculos para los demás intervalos, la tabla final de agrupación de datos quedaría:

Rango Inicial Rango Final Frecuencia % Frecuencia Frecuencia % Frecuencia MSC


47 55 4 13,3% 4 13,3% 51
56 64 6 20,0% 10 33,3% 60
65 73 12 40,0% 22 73,3% 69
74 82 5 16,7% 27 90,0% 78
83 91 2 6,7% 29 96,7% 87
92 100 1 3,3% 30 100,0% 96
Total de datos 30 100,0%

A partir de esta agrupación podemos calcular las medidas de moda, mediana y media para datos agrupados.

1.5 Calculo de la media con datos agrupados

Para calcular la media por datos agrupados, procedemos primero que todo a agrupar los datos de acuerdo al
procedimiento anterior. Una vez agrupados calculamos la media aritmética por medio de la siguiente
ecuación:

𝑀𝐶𝑆% ∗ 𝑓%
𝑋" =
𝑛
Para el ejemplo que venimos trabajando

Por Msc. Francisco Villalba Cruz


DOCUMENTO RESUMEN ESTADISTICA
DESCRIPTIVA
Rango Inicial Rango Final Frecuencia % Frecuencia Frecuencia % Frecuencia MSC Xi*fi
47 55 4 13,3% 4 13,3% 51 204
56 64 6 20,0% 10 33,3% 60 360
65 73 12 40,0% 22 73,3% 69 828
74 82 5 16,7% 27 90,0% 78 390
83 91 2 6,7% 29 96,7% 87 174
92 100 1 3,3% 30 100,0% 96 96
T otal de datos 30 100,0% Sumatoria 2052
Por lo tanto aplicando la formula, tendremos:

,wx ∗e tkvt
𝑋" = &f f 𝑋" = jk 𝑋" = 68,4 ≅ 68 𝑈𝑛𝑖𝑑𝑎𝑑𝑒𝑠

1.6 Cálculo de la mediana para datos agrupados

Una vez agrupados los datos de acuerdo a lo visto anteriormente se procede de la siguiente manera:

• Se calcula el intervalo en el cual debe estar ubicado el valor de la mediana mediante la ecuación
&
𝑀- = t
Donde n es el número de datos analizados

• Se localiza el valor resultante de la anterior formula en la columna de la frecuencia acumulada, si el valor no se


encuentra, se debe tomar el valor inmediatamente superior.
• Aplicar la siguiente fórmula para calcular el valor de la mediana

Para el ejemplo que venimos trabajando:

El intervalo en el que se encuentra la mediana será:

& jk
𝑀- = t
𝑀- = t
𝑀- = 15

Ubicamos este valor en tabla de agrupación en la columna de frecuencia acumulada, pero como este valor no
se encuentra, tomamos el inmediatamente superior, es decir en esta caso 22.

Rango Rango Frecuencia % Frecuencia %


Inicial Final Relativa Frecuencia Acumulada Frecuencia
47 55 4 13,3% 4 13,3%
56 64 6 20,0% 10 33,3%
65 73 12 40,0% 22 73,3%
74 82 5 16,7% 27 90,0%
83 91 2 6,7% 29 96,7%
92 100 1 3,3% 30 100,0%
Total de datos 30 100,0%

Por Msc. Francisco Villalba Cruz


DOCUMENTO RESUMEN ESTADISTICA
DESCRIPTIVA
Los otros valores de la ecuación serán:

Límite inferior del intervalo 𝑙% = 65


Frecuencia acumulada anterior 𝐹l = 10
Frecuencia absoluta del intervalo 𝑓@y- = 12
Amplitud de la clase 𝑎 = 𝑅𝑎𝑛𝑔𝑜 𝑓𝑖𝑛𝑎𝑙 − 𝑅𝑎𝑛𝑔𝑜 𝑖𝑛𝑖𝑐𝑖𝑎𝑙 𝑎 = 55 − 47 = 8
` ~•
Se{ S(k
𝑀y = 𝑙% + ez ∗𝑎 𝑀y = 65 + z
(t
∗8 𝑀y = 68,3 ≅ 68 𝑈𝑛𝑖𝑑𝑎𝑑𝑒𝑠
^|}

1.7 Cálculo de la moda para datos agrupados

Una vez agrupados los datos de acuerdo a lo visto anteriormente se procede de la siguiente manera:

• Establecer el intervalo modal, ubicar el valor de mayor frecuencia relativa en la tabla de agrupación de datos.
• Establecer el límite inferior del intervalo modal
• Calcular el incremento modal inferior ∆% como la diferencia que existe entre la frecuencia modal y la frecuencia
anterior.
• Calcular el incremento modal superior ∆• como la diferencia que existe entre la frecuencia modal y la
frecuencia siguiente.
• Determinar la amplitud de la clase a
• Aplicar la fórmula para calcular la moda para datos agrupados.

∆%
𝑀q = 𝑙% + ∗𝑎
∆% + ∆•

Para el ejemplo que venimos trabajando tenemos:

Ubicamos el intervalo modal, como aquel que tiene una mayor frecuencia relativa, para el ejemplo la frecuencia relativa
es 12, que corresponde al intervalo (65-73), y su límite inferior será 73.

% %
Rango Rango Frecuencia Frecuencia
Frecuencia Frecuencia
Inicial Final Relativa Acumulada
Relativa Acumulada
47 55 4 13,3% 4 13,3%
56 64 6 20,0% 10 33,3%
65 73 12 40,0% 22 73,3%
74 82 5 16,7% 27 90,0%
83 91 2 6,7% 29 96,7%
92 100 1 3,3% 30 100,0%
Total de datos 30 100,0%

El incremento modal inferior ∆% :

Frecuencia modal = 12
Frecuencia modal anterior = 6 ∆% = 12 − 6 = 6

El incremento modal superior ƥ :

Frecuencia modal = 12

Por Msc. Francisco Villalba Cruz


DOCUMENTO RESUMEN ESTADISTICA
DESCRIPTIVA
Frecuencia modal anterior = 5 ∆• = 12 − 5 = 7

Amplitud de la clase 𝑎 = 𝑅𝑎𝑛𝑔𝑜 𝑓𝑖𝑛𝑎𝑙 − 𝑅𝑎𝑛𝑔𝑜 𝑖𝑛𝑖𝑐𝑖𝑎𝑙 𝑎 = 55 − 47 = 8

f∆ ƒ
𝑀q = 𝑙% + ∆ s∆ ∗𝑎 𝑀q = 65 + ƒsu ∗ 8 𝑀q = 68,69 ≅ 68 𝑈𝑛𝑖𝑑𝑎𝑑𝑒𝑠
f ‚

Como podemos observar un análisis de los datos agrupados nos permite, en este caso, garantizar que los valores de la
media, la mediana y la moda sean iguales, y estos se ubican en el tercer intervalo (65-73), con lo cual podemos concluir
que el nivel de unidades despachadas por pedido esta entre 65 y 73 con una probabilidad del 73,3%

1.8 Cuartiles, deciles y percentiles


Estas medidas también son conocidas como medidas de posición, y se utilizan en aquellas poblaciones que poseen
alguna característica que permita su agrupación, como por ejemplo el número de personas de una ciudad, las cuales
pueden ser clasificadas por edades, estaturas, etc.

Par la agrupación lo primero es determinar cuál será el criterio para agrupar, es decir se se quieren cuartiles, deciles o
percentiles.

• Cuartiles:

Agrupar bajo esta característica implica dividir los datos en cuatro partes iguales, por lo tanto se obtienen un total de
cuatro grupos C1 que deja por detrás de él 25% de los datos, C2 que divide la población en dos partes iguales 50% y
C3 que deja el 75% de los datos detrás de él.

• Deciles

Los deciles dividen los datos analizados en 10 partes iguales, por lo tanto los deciles son 9, el D1 deja al 10% de los
datos antes, el D2 deja el 20% de las datos antes, el D3 deja el 30% de los datos antes y así sucesivamente hasta el D9
que deja el 90% de los datos antes.

Percentiles

Los percentiles dividen los datos en 100 partes iguales, eso quiere decir que existen 99 percentiles, el primero deja al 1%
de los datos detrás de él, el percentil 2 deja el 2% de los datos detrás de él, y así sucesivamente hasta el percentil 99,
que deja el 99% de los datos detrás de él.

2. MEDIDAS DE DISPERSION

Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de
dispersión nos dicen hasta qué punto estas medidas de tendencia central son representativas como síntesis de la
información. Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la
distribución respecto al valor central. Distinguimos entre medidas de dispersión absolutas, que no son comparables entre
diferentes muestras y las relativas que nos permitirán comparar varias muestras.

Las principales medidas de dispersión son:

• Oscilación
• Varianza
• Desviación típica
• Coeficiente de variación
• Coeficiente de desviación
• Puntaje
• Asimetría

Por Msc. Francisco Villalba Cruz


DOCUMENTO RESUMEN ESTADISTICA
DESCRIPTIVA
• Apuntamiento

Veamos el detalle de cada una de ellas:

1.1 Oscilación

El valor de la oscilación es conocido también con el nombre de rango, y consiste en la diferencia numérica que existe
entre el mayor de los valores y el menor de los valores de los datos analizados.

𝑅𝑎𝑛𝑔𝑜 = 𝐷𝑎𝑡𝑜@lAq„ − 𝐷𝑎𝑡𝑜@y&q„

En el ejemplo que hemos venido analizando en relación a la cantidad de unidades despachadas por pedido de una
empresa
PERIODO VALOR PERIODO VALOR PERIODO VALOR
1 48 11 74 21 82
2 56 12 67 22 55
3 60 13 92 23 65
4 67 14 70 24 88
5 47 15 69 25 52
6 70 16 61 26 58
7 70 17 71 27 76
8 63 18 79 28 57
9 72 19 85 29 72
10 76 20 68 30 67
El dato mayor de estos datos es 92 y el dato menor es 47, en consecuencia el valor del rango será:

𝑅𝑎𝑛𝑔𝑜 = 𝐷𝑎𝑡𝑜@lAq„ − 𝐷𝑎𝑡𝑜@y&q„ 𝑅𝑎𝑛𝑔𝑜 = 92 − 47 𝑅𝑎𝑛𝑔𝑜 = 45 𝑈𝑛𝑖𝑑𝑎𝑑𝑒𝑠

Lo cual quiere decir que el valor promedio de las unidades despachadas presenta variaciones de más menos 45
unidades.

1.2 Varianza

La varianza se define como el promedio al cuadrado de las variaciones de cada uno de los datos con respecto al valor
promedio de los datos. La varianza para datos no agrupados se calcula a partir de la siguiente formula:

∑(𝑋% − 𝑋")t
𝜎t =
𝑛
En el ejemplo que hemos venido analizando en relación a la cantidad de unidades despachadas por pedido de una
empresa

PERIODO VALOR PERIODO VALOR PERIODO VALOR


1 48 11 74 21 82
2 56 12 67 22 55
3 60 13 92 23 65
4 67 14 70 24 88
5 47 15 69 25 52
6 70 16 61 26 58
7 70 17 71 27 76
8 63 18 79 28 57
9 72 19 85 29 72
10 76 20 68 30 67

Por Msc. Francisco Villalba Cruz


DOCUMENTO RESUMEN ESTADISTICA
DESCRIPTIVA

Para el cálculo de la varianza primero calculamos el promedio de acuerdo a lo anteriormente visto.

∑† tkju
𝑋" = & f 𝑋" = jk = 67,9 ≅ 70

Para el cálculo de la varianza debemos calcular el cuadrado de la diferencia de cada valor con respecto al
promedio, para este caso para el periodo 1, tendremos:

(𝑋( − 𝑋") = 48 − 70 = −22

Elevando este valor al cuadrado, tendremos:

(𝑋( − 𝑋")t = (−22)t = 484

Para el periodo 2, tendremos:

(𝑋( − 𝑋") = 56 − 70 = −14

Elevando este valor al cuadrado, tendremos:

(𝑋( − 𝑋")t = (−14)t = 196


Calculando los valores para el resto de periodos, la tabla nos quedaría

PERIODO VALOR PERIODO VALOR PERIODO VALOR


1 48 -22 484 11 74 4 16 21 82 12 144
2 56 -14 196 12 67 -3 9 22 55 -15 225
3 60 -10 100 13 92 22 484 23 65 -5 25
4 67 -3 9 14 70 0 0 24 88 18 324
5 47 -23 529 15 69 -1 1 25 52 -18 324
6 70 0 0 16 61 -9 81 26 58 -12 144
7 70 0 0 17 71 1 1 27 76 6 36
8 63 -7 49 18 79 9 81 28 57 -13 169
9 72 2 4 19 85 15 225 29 72 2 4
10 76 6 36 20 68 -2 4 30 67 -3 9

En consecuencia el valor de la varianza será:

∑(†fS†" )z ju(j
𝜎t = &
𝜎t = jk
𝜎 t = 123,7 𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠

1.2.1 Varianza para datos agrupados

Para calcular la varianza para los datos agrupados, utilizamos la siguiente formula

∑(𝑌% − 𝑌")t ∗ 𝑛%
𝜎t =
𝑛

Donde

Por Msc. Francisco Villalba Cruz


DOCUMENTO RESUMEN ESTADISTICA
DESCRIPTIVA
∑&%'( 𝑀𝐶𝑆% ∗ 𝑓%
𝑌" =
𝑛

En consecuencia para el ejemplo que estamos analizando, la agrupación de los datos sería

Rango Inicial Rango Final Frecuencia % Frecuencia Frecuencia % Frecuencia MSC


47 55 4 13,3% 4 13,3% 51
56 64 6 20,0% 10 33,3% 60
65 73 12 40,0% 22 73,3% 69
74 82 5 16,7% 27 90,0% 78
83 91 2 6,7% 29 96,7% 87
92 100 1 3,3% 30 100,0% 96
Total de datos 30 100,0%

Calculando el valor de 𝑌", la tabla quedaría

Rango Inicial Rango Final Frecuencia % Frecuencia Frecuencia % Frecuencia MSC Yi*fi
47 55 4 13,3% 4 13,3% 51 204
56 64 6 20,0% 10 33,3% 60 360
65 73 12 40,0% 22 73,3% 69 828
74 82 5 16,7% 27 90,0% 78 390
83 91 2 6,7% 29 96,7% 87 174
92 100 1 3,3% 30 100,0% 96 96
Total de datos 30 100,0% Sumatoria 2052

En consecuencia:

∑ `
,wxf ∗ef tkvt
𝑌" = fgh 𝑌" = = 68,4
& jk

Con este valor calculamos el valor de la varianza, quedando la tabla así:

Rango Inicial Rango Final Frecuencia % Frecuencia Frecuencia % Frecuencia MSC Yi*fi
47 55 4 13,3% 4 13,3% 51 204 -17,4 1211,04
56 64 6 20,0% 10 33,3% 60 360 -8,4 423,36
65 73 12 40,0% 22 73,3% 69 828 0,6 4,32
74 82 5 16,7% 27 90,0% 78 390 9,6 460,8
83 91 2 6,7% 29 96,7% 87 174 18,6 691,92
92 100 1 3,3% 30 100,0% 96 96 27,6 761,76
Total de datos 30 100,0% Sumatoria 2052 Sumatoria 3553,2

Por Msc. Francisco Villalba Cruz


DOCUMENTO RESUMEN ESTADISTICA
DESCRIPTIVA
Por lo tanto

∑(‰fS‰" )z∗&f j.vvj,t


𝛿t = 𝛿t = 𝛿 t = 118,4 𝑈𝑛𝑖𝑑𝑎𝑑𝑒𝑠
& jk

1.3 Desviación estándar

La desviación estándar se define como el promedio de las variaciones de cada uno de los valores analizados
con relación al promedio de los datos, y se define como la raíz cuadrada de la varianza, o a través de la
siguiente formula

∑& (𝑋% − 𝑋")


𝛿 = Š %'(
𝑛−1

En consecuencia este valor me permite establecer cuál es el grado de dispersión de los datos con relación al
promedio, encontrando que los datos tienden a agruparse a una (68,3%), dos (95,5%) o tres (99,7%)
desviaciones estándar, como se muestra en la siguiente figura

-3S -2S -S +S +2S +3S

68.3%

95.5%
99.7%

En la práctica, no es frecuente encontrar distribuciones absolutamente simétricas, pero al estudiar el


comportamiento de una población a través de una muestra, la suponemos muy similar.

Ejemplo.

Calculemos la desviación estándar para los datos que venimos trabajando

PERIODO VALOR PERIODO VALOR PERIODO VALOR


1 48 11 74 21 82
2 56 12 67 22 55
3 60 13 92 23 65
4 67 14 70 24 88
5 47 15 69 25 52
6 70 16 61 26 58
7 70 17 71 27 76
8 63 18 79 28 57
9 72 19 85 29 72
10 76 20 68 30 67

Por Msc. Francisco Villalba Cruz


DOCUMENTO RESUMEN ESTADISTICA
DESCRIPTIVA

De acuerdo a la formula debemos calcular el valor de la desviación de cada uno de los puntos con relación al
promedio (𝑋%S"""
𝑋).

Nuevamente Calculando el valor de (𝑋%S """


𝑋)

PERIODO VALOR PERIODO VALOR PERIODO VALOR


1 48 -22 484 11 74 4 16 21 82 12 144
2 56 -14 196 12 67 -3 9 22 55 -15 225
3 60 -10 100 13 92 22 484 23 65 -5 25
4 67 -3 9 14 70 0 0 24 88 18 324
5 47 -23 529 15 69 -1 1 25 52 -18 324
6 70 0 0 16 61 -9 81 26 58 -12 144
7 70 0 0 17 71 1 1 27 76 6 36
8 63 -7 49 18 79 9 81 28 57 -13 169
9 72 2 4 19 85 15 225 29 72 2 4
10 76 6 36 20 68 -2 4 30 67 -3 9
Por lo tanto el valor de la desviación estándar será

∑& (𝑋% − 𝑋")t 3713


𝛿 = Š %'( 𝛿 = Š 𝛿 = 11,3 𝑈𝑛𝑖𝑑𝑎𝑑𝑒𝑠
𝑛−1 29

1.4 Coeficiente de estabilidad (CE)

El coeficiente de estabilidad nos permite establecer cuál es la consistencia de los datos analizados, y si estos
nos muestran una realidad que nos da una confiabilidad en los resultados obtenidos. Para so calculo
utilizamos la siguiente formula.

𝛿
𝐶𝐸 = 1 − Œ " •
𝑋

En el caso que venimos analizando el coeficiente de estabilidad será:

𝛿 11,3
𝐶𝐸 = 1 − Œ • 𝐶𝐸 = 1 − Œ • 𝐶𝐸 = 83,9%
"
𝑋 70

Este valor nos muestra que los datos analizados son confiables ya que su comportamiento tiene una
constancia del 83,9%

1.5 Puntaje típico o estandarizado (Z)

Se emplea para medir la desviación de una observación con respecto a la media aritmética, en unidades de
desviación típica, calculando así a la posición relativa de una observación dentro del conjunto, permitiendo así
calcular cual es el nivel de confianza de los datos analizados. Para el cálculo del puntaje utilizamos la
siguiente ecuación.

Por Msc. Francisco Villalba Cruz


DOCUMENTO RESUMEN ESTADISTICA
DESCRIPTIVA
𝑋% − 𝑋"
𝑍=
𝛿

Calculemos el puntaje para los datos que venimos trabajando

PERIODO VALOR PERIODO VALOR PERIODO VALOR


1 48 11 74 21 82
2 56 12 67 22 55
3 60 13 92 23 65
4 67 14 70 24 88
5 47 15 69 25 52
6 70 16 61 26 58
7 70 17 71 27 76
8 63 18 79 28 57
9 72 19 85 29 72
10 76 20 68 30 67

El valor del promedio y de la desviación estándar calculados anteriormente, con:

𝑋" = 70 𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠 𝛿 = 11,3 𝑈𝑛𝑖𝑑𝑎𝑑𝑒𝑠

Por lo tanto si calculamos el valor de Z para cada uno de los valores que venimos trabajando en el ejemplo,
tendríamos la siguiente tabla:

PERIODO VALOR PERIODO VALOR PERIODO VALOR


1 48 -1,98 11 74 0,36 21 82 1,08
2 56 -1,26 12 67 -0,27 22 55 -1,35
3 60 -0,90 13 92 1,98 23 65 -0,45
4 67 -0,27 14 70 0,00 24 88 1,62
5 47 -2,07 15 69 -0,09 25 52 -1,62
6 70 0,00 16 61 -0,81 26 58 -1,08
7 70 0,00 17 71 0,09 27 76 0,54
8 63 -0,63 18 79 0,81 28 57 -1,17
9 72 0,18 19 85 1,35 29 72 0,18
10 76 0,54 20 68 -0,18 30 67 -0,27

Para el periodo 1, el valor de Z se calcula:

†f S†" i•Suk
𝑍= = ► 𝑍 = −1,98
• ((,j

Por Msc. Francisco Villalba Cruz


DOCUMENTO RESUMEN ESTADISTICA
DESCRIPTIVA
Para calcular el valor de Z promedio de los datos requerimos calcular el valor absoluto de cada Z puntal, con
lo cual la tabla nos quedaría:

PERIODO VALOR PERIODO VALOR PERIODO VALOR


1 48 -1,98 1,98 11 74 0,36 0,36 21 82 1,08 1,08
2 56 -1,26 1,26 12 67 -0,27 0,27 22 55 -1,35 1,35
3 60 -0,90 0,90 13 92 1,98 1,98 23 65 -0,45 0,45
4 67 -0,27 0,27 14 70 0,00 0,00 24 88 1,62 1,62
5 47 -2,07 2,07 15 69 -0,09 0,09 25 52 -1,62 1,62
6 70 0,00 0,00 16 61 -0,81 0,81 26 58 -1,08 1,08
7 70 0,00 0,00 17 71 0,09 0,09 27 76 0,54 0,54
8 63 -0,63 0,63 18 79 0,81 0,81 28 57 -1,17 1,17
9 72 0,18 0,18 19 85 1,35 1,35 29 72 0,18 0,18
10 76 0,54 0,54 20 68 -0,18 0,18 30 67 -0,27 0,27

Por lo cual el valor del puntaje promedio 𝑍̅ sería:

∑&%'( 𝑍% 23,09
𝑍̅ = 𝑍 = 𝑍 = 0,76
𝑛 30

Esto quiere decir que los datos analizados se encuentra separados del promedio 0,76 unidades de dispersión.

Con este valor podemos realizar dos operaciones:

• La primera es poder efectuar un ajuste al promedio aritmético de los datos, a fin de poder reducir la
variabilidad de los datos, ya que como comentamos anteriormente, el promedio aritmético es una
medida que nos esconde las variaciones de los datos, y este es posible utilizarlo si y solo si la moda,
la mediana y el promedio son iguales.

En el ejemplo que venimos analizando, ya habíamos calculado los valores de la moda, la mediana y
el promedio, los cuales son 67, 68,5 y 67,9 respectivamente. Por lo cual, al ser diferentes estos
valores, es necesario ajustar el promedio con el valor del puntaje y la desviación estándar.

𝑍 = 0,76
𝛿 = 11,3
𝑋" = 67,9

El promedio corregido se calcula utilizando la siguiente ecuación:

"""
𝑋 ’ = 𝑋" + 𝑍𝛿 𝑋
"""’ = 67,9 + (0,76 ∗ 11,3) 𝑋
"""’ = 76,4 ≅ 76 𝑈𝑛𝑖𝑑𝑎𝑑𝑒𝑠

• La segunda es calcular el nivel de confianza de los datos, para lo cual nos valemos del cálculo de la
distribución normal inversa del valor de Z.

Para esto utilizamos la fórmula de Excel DISTR.NORM.ESTAND(Z). Aplicando la formula al ejercicio


anterior, el nivel de confianza será 77,93%.

1.6 Coeficiente de asimetría

Por Msc. Francisco Villalba Cruz


DOCUMENTO RESUMEN ESTADISTICA
DESCRIPTIVA

Las medidas de asimetría son indicadores que permiten establecer el grado de simetría (o asimetría) que
presenta una distribución de probabilidad de una variable aleatoria sin tener que hacer su representación
gráfica.

Como eje de simetría consideramos una recta paralela al eje de ordenadas que pasa por la media de la
distribución. Si una distribución es simétrica, existe el mismo número de valores a la derecha que a la
izquierda de la media, por tanto, el mismo número de desviaciones con signo positivo que con signo negativo.

Decimos que hay asimetría positiva (o a la derecha) si la "cola" a la derecha de la media es más larga que la
de la izquierda, es decir, si hay valores más separados de la media a la derecha. Diremos que hay asimetría
negativa (o a la izquierda) si la "cola" a la izquierda de la media es más larga que la de la derecha, es decir, si
hay valores más separados de la media a la izquierda.

El valor del coeficiente de asimetría debe ser un valor que oscile entre -1 y 1, es decir que -1 > CA <1, siendo
lo ideal que este valor esté más cerca de cero, lo cual muestra que los datos son mucho más simétricos.

Cuando el valor tiende a ser menor que -1, decimos que la curva es simétrica a la izquierda, y esto se
interpreta diciendo que los datos que se encuentran por debajo del promedio tienen un mayor peso en el
comportamiento de los datos.

Mientras que si este valor tiende a ser mayor que 1, decimos que la curva es simétrica a la derecha, y esto se
interpreta diciendo que los datos que se encuentran por encima del promedio tienen un mayor peso en el
comportamiento de los datos.

Me Md Mo Mo< Me Md<
Me
Mo = Me = Md Mo
Md

Mo > Me =>Md Mo Md Me

El coeficiente de asimetría se calcula por medio de la siguiente ecuación

∑&%'((𝑋% − 𝑋")j
𝐶𝐴 =
𝑛𝛿 j
Ejemplo:

Para la tabla que venimos trabajando

Por Msc. Francisco Villalba Cruz


DOCUMENTO RESUMEN ESTADISTICA
DESCRIPTIVA
PERIODO VALOR PERIODO VALOR PERIODO VALOR
1 48 11 74 21 82
2 56 12 67 22 55
3 60 13 92 23 65
4 67 14 70 24 88
5 47 15 69 25 52
6 70 16 61 26 58
7 70 17 71 27 76
8 63 18 79 28 57
9 72 19 85 29 72
10 76 20 68 30 67

Los valores del promedio 𝑋" = 70 y de la desviación estándar 𝛿 = 11,3 ya se habían calculado
anteriormente. Aplicando la fórmula de coeficiente de asimetría, tendremos:

PERIODO VALOR PERIODO VALOR PERIODO VALOR


1 48 -22 -10648 11 74 4 64 21 82 12 1728
2 56 -14 -2744 12 67 -3 -27 22 55 -15 -3375
3 60 -10 -1000 13 92 22 10648 23 65 -5 -125
4 67 -3 -27 14 70 0 0 24 88 18 5832
5 47 -23 -12167 15 69 -1 -1 25 52 -18 -5832
6 70 0 0 16 61 -9 -729 26 58 -12 -1728
7 70 0 0 17 71 1 1 27 76 6 216
8 63 -7 -343 18 79 9 729 28 57 -13 -2197
9 72 2 8 19 85 15 3375 29 72 2 8
10 76 6 216 20 68 -2 -8 30 67 -3 -27
Sumatoria -18153

Para el periodo 1 tendremos

𝑋% − 𝑋" = 48 − 70 = −22 (𝑋% − 𝑋")j = (−22)j = −10.648

Efectuando la sumatoria de todos los (𝑋% − 𝑋")j nos da -18.153

Calculando 𝑛 ∗ 𝛿 j = 30 ∗ (11,3)j = 43.462,19

El valor del coeficiente de asimetría CA será:

∑&%'((𝑋% − 𝑋")j −18.153


𝐶𝐴 = j
= ► 𝐶𝐴 = −0,41
𝑛𝛿 43.462,19

Por lo cual podemos concluir que estos datos son bastante simétricos, ya que el CA está muy cercano a cero,
pero los datos por debajo del promedio tienen un mayor peso en el comportamiento de los datos.

1.7 Coeficiente de curtosis (CC)

En estadística, la curtosis es una medida de la forma. Así, las medidas de curtosis tratan de estudiar la
proporción de la desviación estándar que se explica por la combinación de datos extremos respecto al
promedio en contraposición con datos poco alejados del mismo. Una mayor curtosis implica una mayor

Por Msc. Francisco Villalba Cruz


DOCUMENTO RESUMEN ESTADISTICA
DESCRIPTIVA
concentración de datos muy cerca del promedio de la distribución coexistiendo al mismo tiempo con una
relativamente elevada frecuencia de datos muy alejados de la misma. Esto explica una forma de la
distribución de frecuencias con colas muy elevadas y un con un centro muy apuntado.

El coeficiente de curtosis (CC) se calcula de acuerdo a la siguiente ecuación


i
𝑛(𝑛 + 1) 𝑋% − 𝑋" 3(𝑛 − 1)t
𝐶𝐶 = “ ”• – —−˜ ™
(𝑛 − 1)(𝑛 − 2)(𝑛 − 3) 𝛿 (𝑛 − 2)(𝑛 − 3)

Para la interpretación de este valor debemos tener en cuenta:

• Si CC=3, la distribución es normal y se denomina MESOCURTICA


• Si CC<3, la distribución es achatada y se denomina PLATICURTICA
• Si CC>3, la distribución es apuntada y se denomina LEPTOCURTICA

CAP = 3; Distribución normal


MESOCURTICA

CAP>3; Distribución apuntada


LEPTOCURTICA
CAP < 3; Distribución achatada
PLATICURTICA

Ejemplo

Para los datos que venimos analizando, el valor del coeficiente de curtosis será:

PERIODO VALOR PERIODO VALOR PERIODO VALOR


1 48 11 74 21 82
2 56 12 67 22 55
3 60 13 92 23 65
4 67 14 70 24 88
5 47 15 69 25 52
6 70 16 61 26 58
7 70 17 71 27 76
8 63 18 79 28 57
9 72 19 85 29 72
10 76 20 68 30 67

†fS†" i
Para el cálculo de la curtosis, hallamos el valor de la ∑ š •

Por Msc. Francisco Villalba Cruz


DOCUMENTO RESUMEN ESTADISTICA
DESCRIPTIVA

PERIODO VALOR PERIODO VALOR PERIODO VALOR

1 48 -1,8 10,287 11 74 0,5 0,091 21 82 1,3 2,593


2 56 -1,1 1,315 12 67 -0,1 0,000 22 55 -1,2 1,816
3 60 -0,7 0,255 13 92 2,2 22,127 23 65 -0,3 0,005
4 67 -0,1 0,000 14 70 0,2 0,001 24 88 1,8 10,706
5 47 -1,9 12,515 15 69 0,1 0,000 25 52 -1,4 4,192
6 70 0,2 0,001 16 61 -0,6 0,149 26 58 -0,9 0,630
7 70 0,2 0,001 17 71 0,3 0,006 27 76 0,7 0,282
8 63 -0,4 0,038 18 79 1,0 0,996 28 57 -1,0 0,926
9 72 0,4 0,019 19 85 1,5 5,608 29 72 0,4 0,019
10 76 0,7 0,282 20 68 0,0 0,000 30 67 -0,1 0,000
Sumatoria 74,9

Para el periodo 1 tendremos:

𝛿 = 11,1
𝑋" = 67,9
i
𝑋% − 𝑋" 48 − 67,9 i
• – = Œ • = 10,287
𝛿 11,1

†fS†" i
Calculando los demás la ∑ š •
› nos da 74,9

Remplazando los valores en la formula

i
𝑛(𝑛 + 1) 𝑋% − 𝑋" 3(𝑛 − 1)t
𝐶𝐶 = “ ”• – —−˜ ™
(𝑛 − 1)(𝑛 − 2)(𝑛 − 3) 𝛿 (𝑛 − 2)(𝑛 − 3)

30(30 + 1) 3(30 − 1)t


𝐶𝐶 = œ ∗ (74,9)• − ˜ ™
(30 − 1)(30 − 2)(30 − 3) (30 − 2)(30 − 3)

𝐶𝐶 = −0,16

Lo cual quiere decir que estos datos tienen una distribución platicurtica ya que CC<3, lo cual implica que
encontramos valores extremos alejados del promedio, lo cual hace que la curva de distribución de achate.

Por Msc. Francisco Villalba Cruz

También podría gustarte