Está en la página 1de 15

UNIVERSIDAD NACIONAL EXPERIMENTAL DEL TÁCHIRA

VICE-RECTORADO ACADÉMICO
DECANATO DE DOCENCIA
DEPARTAMENTO DE MATEMÁTICA Y FÍSICA
UNIDAD CURRICULAR ESTADÍSTICA

MEDIDAS ESTADÍSTICAS:
DISTRIBUCIÓN DE FORMA

Prof. José Alexy Moros Briceño


Índice
Medidas de distribución...…….................................................................................3

Coeficiente de sesgo o simetría …..........................................................................4

Coeficiente de curtosis……......................................................................................9

Autoevaluación........................................................................................................13

Referencias .............................................................................................................23
Medidas de distribución de forma
Las medidas de forma permiten comprobar si una distribución de frecuencia
tiene características especiales como simetría, asimetría, nivel de
concentración de datos y nivel de apuntamiento que la clasifiquen en un tipo
particular de distribución. Por lo tanto:
- Son indicadores estadísticos que permiten identificar si una distribución
de frecuencia presenta uniformidad.
- Permiten identificar la forma en que se separan o aglomeran los valores de
acuerdo a su representación gráfica.
- Describen la manera como los datos tienden a reunirse de acuerdo con la
frecuencia con que se hallen dentro de la información.
- Son necesarias para determinar el comportamiento de los datos y así,
poder adaptar herramientas para el análisis probabilístico
- Su utilidad radica en la posibilidad de identificar las características de la
distribución sin necesidad de generar el gráfico.
Sus principales medidas son:
- Coeficiente de asimetría
- Coeficiente de curtosis
Coeficiente de sesgo o asimetría
El coeficiente de sesgo (C.S.) es un número que mediante su signo determina si
los datos (la curva) tienen distribución simétrica o sesgada. Corresponde al
momento 3.
Para el calculo de los cuartiles recurrimos a la siguientes fórmulas:
Datos no agrupados Datos agrupados
ഥ )𝟑
σ𝒌𝒊=𝟏(𝒙𝒊 − 𝑿 ഥ )𝟑
σ𝒌𝒊=𝟏 𝒇𝒊 (𝑿𝒊 − 𝑿
𝑪. 𝑺. = 𝑪. 𝑺. =
𝒏𝑺𝟑 𝒏𝑺𝟑
El C.S. se interpreta del siguiente modo:
1. Si C.S. < 0, los datos son sesgado a la izquierda.
2. Si C.S. = 0, los datos se distribuyen de manera simétrica (insesgado).
3. Si C.S. > 0, los datos son sesgado a la derecha.
En la siguiente figura se representa gráficamente lo antes mencionado.

Puede observarse en estas


gráficas como es la relación de las
medidas de tendencia central.
Coeficiente de sesgo o asimetría
Otra forma de determinar el C.S. es mediante el coeficiente de asimetría, a través
de la diferencia de la media y la mediana en relación con la desviación estándar, tal
como se muestra en las siguientes expresiones
Asimetría de la población Asimetría de la muestra
𝟑(𝝁 − 𝑴𝒅) ഥ − 𝑴𝒅)
𝟑(𝑿
𝑪. 𝑺. = 𝑪. 𝑺. =
𝝈 𝑺
Si C.S. = 0, es porque la media es igual a la mediana.
Si C.S. > 0, es porque la media es mayor a la mediana.
Si C.S. < 0, es porque la media es menos a la mediana.
Coeficiente de sesgo o asimetría
Datos no agrupados
Ejemplo. Suponga que un ingeniero químico se interesa en probar el sesgo en
un medidor de pH. Se reúnen datos de una sustancia neutra (pH = 7.0). Se
toma una muestra de las mediciones y los datos son los siguientes: 7.07, 7.00,
7.10, 6.97, 7.00, 7.03, 7.01, 7.01, 6.98, 7.08.
Solución. Construimos una tabla de frecuencia para un mejor procesamiento
de los datos. 𝒙 ഥ )𝟑
(𝒙 − 𝑿
𝒊 𝒊
7,07 9,1125E-05
7,00 -1,5625E-05
ഥ )𝟑
σ𝒌𝒊=𝟏(𝒙𝒊 − 𝑿 𝟎, 𝟎𝟎𝟎𝟑𝟖𝟒 7,10 0,00042187
𝑪. 𝑺. = = = 𝟎, 𝟒𝟓
𝒏𝑺𝟑 𝟏𝟎 ∗ 𝟖, 𝟓𝟑𝟕𝟒𝟕𝒙𝟏𝟎−𝟓 6,97 -0,00016638
7,00 -1,5625E-05
7,03 1,25E-07
7,01 -3,375E-06
7,01 -3,375E-06
𝑋ത 7,03
6,98 -9,1125E-05
𝑆3 8,53747E-05
7,08 0,00016637
Σ =0,000384

Como C.S. > 0 se concluye que los datos del pH tienen una distribución
sesgada a la derecha.
Coeficiente de sesgo o asimetría
Datos agrupados
En una compañía área se sabe que, por término medio, el 655 de los vuelos
tienen retraso. La distribución de los vuelos retrasado es la siguiente:
Duración de retraso (centésimas Número de vuelos
de hora)
0 – 10 2.000
10 – 20 3.000
20 – 30 2.500
30 – 40 2.000
40 – 50 500

Determine su coeficiente de asimetría. ഥ )𝟑


σ𝒌𝒊=𝟏 𝒇𝒊 (𝑿𝒊 − 𝑿
𝑪. 𝑺. =
𝒏𝑺𝟑
Coeficiente de sesgo o asimetría
Datos agrupados
Solución. Hallamos el punto medio, la media aritmética y la desviación estándar
Duración de retraso 𝑿𝒊 Número de vuelos 𝑿𝒊. 𝒇𝒊 ഥ
𝒇𝒊 𝑿𝒊 − 𝑿 𝟐 ഥ
𝒇𝒊 𝑿𝒊 − 𝑿 𝟑

(centésimas de hora) (𝒇𝒊)


0 – 10 5 2.000 10.000 512000 -8192000
10 – 20 15 3.000 45.000 108000 -648000
20 – 30 25 2.500 62.500 40000 160000
30 – 40 35 2.000 70.000 392000 5488000
40 – 50 45 500 22.500 288000 6912000
𝜮 10.000 210.000 1.340.000 3.720.000
𝒏
ഥ = σ𝒊=𝟏 𝑿𝒊 𝒇𝒊 = 𝟐𝟏𝟎.𝟎𝟎𝟎 = 𝟐𝟏 𝒄𝒆𝒏𝒕é𝒔𝒊𝒎𝒂𝒔 𝒅𝒆 𝒉𝒐𝒓𝒂
𝑿
𝒏 𝟏𝟎.𝟎𝟎𝟎

ഥ )𝟐
σ𝒏𝒊=𝟏 𝒇𝒊 (𝑿𝒊 − 𝑿 𝟏. 𝟑𝟒𝟎. 𝟎𝟎𝟎
𝑺= = = 𝟏𝟏, 𝟓𝟕𝟔 𝒄𝒆𝒏𝒕é𝒔𝒊𝒎𝒂𝒔 𝒅𝒆 𝒉𝒐𝒓𝒂
𝒏−𝟏 𝟏𝟎. 𝟎𝟎𝟎 − 𝟏

ഥ )𝟑
σ𝒌𝒊=𝟏 𝒇𝒊 (𝑿𝒊 − 𝑿 𝟑. 𝟕𝟐𝟎. 𝟎𝟎𝟎
𝑪. 𝑺. = = = 𝟎, 𝟐𝟒
𝒏𝑺𝟑 𝟏𝟎. 𝟎𝟎𝟎 ∗ (𝟏𝟏, 𝟓𝟕𝟔)𝟑
Se concluye que los datos tienen una distribución sesgada a la derecha.
Coeficiente de curtosis
El coeficiente de curtosis (K) es un número cuya magnitud nos indica si los datos
se distribuyen simétricamente de forma normal (curva mesocúrtica), más
empinada que la curva normal (curva leptocúrtica) o más aplanado de la curva
normal (curva platicúrtica). Corresponde al momento 4.
Para el calculo del coeficiente de curtosis recurrimos a la siguientes fórmulas:
Datos no agrupados Datos agrupados
ഥ )𝟒
σ𝒌𝒊=𝟏(𝒙𝒊 − 𝑿 ഥ )𝟒
σ𝒌𝒊=𝟏 𝒇𝒊 (𝑿𝒊 − 𝑿
𝑲= 𝑲=
𝒏𝑺𝟒 𝒏𝑺𝟒

Otra forma de calcular el coeficiente de cutosis es a través de una fórmula en


función de los cuantiles 𝑸𝟏, 𝑸𝟐 , 𝑷𝟏𝟎 𝒚 𝑷𝟗𝟎 , la cual se ilustra a continuación:
𝑸𝟑 − 𝑸𝟏
𝑲=
Coeficiente de curtosis
Datos no agrupados
Ejemplo. Suponga que un ingeniero químico se interesa en probar el sesgo en
un medidor de pH. Se reúnen datos de una sustancia neutra (pH = 7.0). Se
toma una muestra de las mediciones y los datos son los siguientes: 7.07, 7.00,
7.10, 6.97, 7.00, 7.03, 7.01, 7.01, 6.98, 7.08.
Solución. Construimos una tabla de frecuencia para un mejor procesamiento
de los datos. 𝒙𝒊 ഥ )𝟒
(𝒙𝒊 − 𝑿
7,07 4,10062E-06
7,00 3,90625E-07
ഥ )𝟒
σ𝒌𝒊=𝟏(𝒙𝒊 − 𝑿 𝟓, 𝟗𝟎𝟐𝟔𝟐𝒙𝟏𝟎−𝟓 7,10 3,16406E-05
𝑲= = = 𝟏, 𝟓𝟕
𝒏𝑺𝟒 𝟏𝟎 ∗ 𝟑, 𝟕𝟓𝟗𝟐𝟗𝒙𝟏𝟎−𝟔 6,97
7,00
9,15063E-06
3,90625E-07
7,03 6,25E-10
7,01 5,0625E-08
7,01 5,0625E-08
𝑋ത 7,03
6,98 4,10062E-06
𝑆4 3,75929E-06
7,08 9,15062E-06
Σ = 𝟓, 𝟗𝟎𝟐𝟔𝟐𝒙𝟏𝟎−𝟓

Como K > 0 se concluye que los datos del pH tienen una distribución
empinada o leptocúrtica.
Coeficiente de sesgo o asimetría
Datos agrupados
En una compañía área se sabe que, por término medio, el 655 de los vuelos
tienen retraso. La distribución de los vuelos retrasado es la siguiente:
Duración de retraso (centésimas Número de vuelos
de hora)
0 – 10 2.000
10 – 20 3.000
20 – 30 2.500
30 – 40 2.000
40 – 50 500

Determine su coeficiente de asimetría. ഥ )𝟑


σ𝒌𝒊=𝟏 𝒇𝒊 (𝑿𝒊 − 𝑿
𝑪. 𝑺. =
𝒏𝑺𝟑
Coeficiente de curtosis
Datos agrupados
Solución. Hallamos el punto medio, la media aritmética y la desviación estándar
Duración de retraso 𝑿𝒊 Número de vuelos 𝑿𝒊. 𝒇𝒊 ഥ
𝒇𝒊 𝑿𝒊 − 𝑿 𝟐 ഥ
𝒇𝒊 𝑿𝒊 − 𝑿 𝟒

(centésimas de hora) (𝒇𝒊)


0 – 10 5 2.000 10.000 512000 131072000
10 – 20 15 3.000 45.000 108000 3888000
20 – 30 25 2.500 62.500 40000 640000
30 – 40 35 2.000 70.000 392000 76832000
40 – 50 45 500 22.500 288000 165888000
𝜮 10.000 210.000 1.340.000 378.320.000
𝒏
ഥ = σ𝒊=𝟏 𝑿𝒊 𝒇𝒊 = 𝟐𝟏𝟎.𝟎𝟎𝟎 = 𝟐𝟏 𝒄𝒆𝒏𝒕é𝒔𝒊𝒎𝒂𝒔 𝒅𝒆 𝒉𝒐𝒓𝒂
𝑿
𝒏 𝟏𝟎.𝟎𝟎𝟎

ഥ )𝟐
σ𝒏𝒊=𝟏 𝒇𝒊 (𝑿𝒊 − 𝑿 𝟏. 𝟑𝟒𝟎. 𝟎𝟎𝟎
𝑺= = = 𝟏𝟏, 𝟓𝟕𝟔 𝒄𝒆𝒏𝒕é𝒔𝒊𝒎𝒂𝒔 𝒅𝒆 𝒉𝒐𝒓𝒂
𝒏−𝟏 𝟏𝟎. 𝟎𝟎𝟎 − 𝟏

ഥ )𝟒
σ𝒌𝒊=𝟏 𝒇𝒊 (𝑿𝒊 − 𝑿 378.320.000
𝑲= = = 𝟐. 𝟏𝟎
𝒏𝑺𝟒 𝟏𝟎. 𝟎𝟎𝟎 ∗ (𝟏𝟏, 𝟓𝟕𝟔)𝟒
Como K> 0, se concluye que los datos tienen una distribución leptocúrtica.
Autoevaluación
Ejercicios para resolver:
1. Se ha pasado un test de 80 preguntas a 600 personas. El número de
respuestas correctas se refleja en la siguiente tabla:

¿Cómo es la distribución de estos datos?


2. Se ha medido dieciséis veces la longitud en metros que separa dos puntos,
Los resultados obtenidos se muestran a continuación: 13,404 - 13,443 -
13,445 - 13,447 - 13,449 - 13,450 - 13,453 - 13,455 - 13,457 - 13,460 - 13,460 -
13,465 - 13,455 - 13,453 - 13,445 - 13,455. Determine el coeficiente de sesgo
y el coeficiente de curtosis.
Autoevaluación
3. Supóngase que el rango intercuartílico de un conjunto de datos es 3,2 cm y el
rango percentil es 10 cm. Además, se sabe que la media aritmética es 1,2 cm
donde el 50% de los datos no es mayor de 2,0 cm. ¿Cómo es la distribución de
los datos?.
4. Complete lo siguiente:
Un C.S positivo nos indica: ____________________________
Un K negativo nos indica: _____________________________
Un K = 0 y C.S. = 0 nos indica: __________________________
Un K > 0 y C.S. < 0 nos indica: __________________________
REFERENCIAS

• Contreras, Francisco. (2007). Estadística descriptiva y análisis


descriptivo con SPSS. San Cristóbal, Venezuela: FEUNET.
• Franco Valencia, Gerardo Alberto. (2004). Estadística descriptiva.
Universidad de Cartagena, Colombia.
• Batanero, Carmen y Godino, Juan. (2001). Análisis de datos y su
didáctica. Departamento de Didáctica de la Matemática
Universidad de Granada.
• Levine, David, Krehbiel, Timothy y Berenson, Mark. (2012)
Estadística descriptiva. México: Pearson Educación.
• Martínez, Ciro. (2012). Estadística y muestreo. Bogotá: Ecoe
Ediciones.
• Walpole, Ronald E., Myers, Raymond H. y Radford, L. Myers (2012).
Probabilidad y estadística para ingeniería y ciencias. (9ª . Ed.).
México: Pearson Educación.

También podría gustarte