Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PE Módulo IV
PE Módulo IV
ESTADÍSTICA
FACULTAD DE INGENIERÍA MECÁNICA
LICENCIATURA EN INGENIERÍA DE ENERGÍA Y AMBIENTE
GRUPO: 1EM121
𝑥1 + 𝑥2 + 𝑋3 + ⋯ + 𝑥𝑛 σ𝑛𝑖=1 𝑥𝑖
𝑥 = =
𝑛 𝑛
La mediana
■ Algunas veces llamada media posicional, porque se ubica exactamente en la mitad del
conjunto de datos después de que las observaciones se han colocado en serie ordena.
■ La mitad de las observaciones estará por encima de la mediana, la otra mitad por
debajo de ella.
■ Si el conjunto de datos tiene un número impar de observaciones, la mediana es:
𝑛+1
2
■ Con un conjunto de datos que contiene un número par de observaciones es necesario
promediar los dos valores medios.
– Ejemplo: 35, 45, 52, 56, 67, 67
– Posición de la mediana = (6+1)/2=3.5; Es decir (52+56)/2= 54
Medidas de tendencia central
La moda La media ponderada
■ Es la observación que ocurre con ■ 𝑥ҧ𝑤 =La media asume que cada
mayor frecuencia observación es de igual importancia
■ Sin embargo en ciertos casos se
quiere dar mayor peso a algunas de
las observaciones, esto es lo que
hace la media ponderada.
𝛴×𝑤
■ 𝑥ҧ𝑤 = σ𝑤
, donde
■ 𝑥ҧ𝑤 = media ponderada
■ W= peso o ponderación asignada a
cada observación
■ X= es la observación individual
La media geométrica
■ La media geométrica puede utilizarse para mostrar los cambios porcentruales en
una serie de números positivos. Por este motivo, tiene mucho uso en los negocios y
en la economía, ya que con frecuencia se está interesado en establecer el cambio
porcentual en las ventas, producto nacional bruto o en cualquier serie económica.
■ La media geométrica proporciona una medida precisa de un cambio porcentual
promedio en usa serie de números.
𝑛
𝑀𝐺 = 𝑥1 𝑥2 𝑥3 … 𝑥 𝑛
P25: A= 12 x 25 /100 = 3
• A resulta un entero, por tanto el
P25 corresponde al promedio de
las observaciones en las posiciones Ejemplo
3º y 4º, es decir, P25= (5+8)/2 =
6.5
Note que debido a que se está trabajando con una población, la media es y no 𝑋,
ത como para una muestra, y el
número de observaciones es N y no n, como para una muestra
Varianza y desviación estándar para
una muestra
■ La varianza y la desviación estándar para una muestra representan medidas de
dispersión alrededor de la media.
■ Se calculan de manera parecida a aquellas para una población. La varianza de la
muestra s2 es
𝑋𝑖 − 𝑋ത 2
■ Varianza de la muestra 𝑠2 =
𝑛−1
𝛴𝑓𝑀2 − 𝑛𝜒 2
𝑠2 =
𝑛−1
■ En ambos casos, la moda es por definición la observación que ocurre con mayor
frecuencia. Por tanto, está en el pico de la distribución.
■ Sin embargo, por su sola naturaleza, la media se ve más afectada por las
observaciones extremas. Por lo tanto, es halada en la dirección del sesgo, más de lo
que está la mediana, la cual está en algún sitio entre la media y la moda.
Asimetría o Sesgo
La asimetría presenta las siguientes formas:
■ Asimetría Negativa o a la Izquierda.
– Se da cuando en una distribución la minoría de los datos está en la parte izquierda de la media. Este
tipo de distribución presenta un alargamiento o sesgo hacia la izquierda, es decir, la distribución de
los datos tiene a la izquierda una cola más larga que a la derecha. También se dice que una
distribución es simétrica a la izquierda o tiene sesgo negativo cuando el valor de la media aritmética
es menor que la mediana y éste valor de la mediana a su vez es menor que la moda, en símbolos
x < Md < Mo
■ Simétrica.
Se da cuando en una distribución se distribuyen aproximadamente la misma cantidad de los datos a
ambos lados de la media aritmética. No tiene alargamiento o sesgo. Se representa por una curva normal
en forma de campana llamada campana de Gauss (matemático Alemán 1777-1855) También se dice que
una distribución es simétrica cuando su media aritmética, su mediana y su moda son iguales, en
símbolos x = Md = Mo
■ Asimetría Positiva o a la Derecha.
– Se da cuando en una distribución la minoría de los datos está en la parte derecha de la media
aritmética. Este tipo de distribución presenta un alargamiento o sesgo hacia la derecha, es decir, la
distribución de los datos tiene a la derecha una cola más larga que a la izquierda.
– También se dice que una distribución es simétrica a la derecha o tiene sesgo positivo cuando el valor
de la media aritmética es mayor que la mediana y éste a valor de la mediana a su vez es mayor que
la moda, en símbolos
x > Md > Mo
Coeficiente de Karl Pearson
■ Coeficiente de sesgo
3 𝑋ത − mediana
As =
𝑠
■ Donde:
■ 𝑋ത = media aritmética.
■ Md = Mediana.
■ s = desviación típica o estándar.
■ Nota:
■ El Coeficiente de Pearson varía entre -3 y 3
■ Si As < 0 la distribución será asimétrica negativa.
■ Si As = 0 la distribución será simétrica.
■ Si As > 0 la distribución será asimétrica positiva.
Medida de Yule Bowley o Medida
Cuartílica
■ Donde:
■ Q1= Cuartil uno; Q2= Cuartil dos = Mediana; Q3= Cuartil tres.
■ Nota:
■ La Medida de Bowley varía entre -1 y 1
■ Si As < 0 la distribución será asimétrica negativa.
■ Si As = 0 la distribución será simétrica.
■ Si As > 0 la distribución será asimétrica positiva.
Medida de Fisher
■ Para datos sin agrupar se emplea la siguiente fórmula:
■ Donde:
xi= cada uno de los valores; n = número de datos; x = media aritmética; f = frecuencia absoluta
3= cubo de la desviación estándar poblacional; xm = marca de clase
■ Nota:
■ Si As < 0 Indica que existe presencia de la minoría de datos en la parte izquierda de la media, aunque
en algunos casos no necesariamente indicará que la distribución sea asimétrica negativa
■ Si As = 0 la distribución será simétrica
■ Si As > 0 Indica que existe presencia de la minoría de datos en la parte derecha de la media, aunque
en algunos casos no necesariamente indicará que la distribución sea asimétrica positiva
CURTOSIS O APUNTAMIENTO
■ La curtosis mide el grado de agudeza o achatamiento de una distribución con
relación a la distribución normal, es decir, mide cuán puntiaguda es una
distribución.
■ TIPOS DE CURTOSIS
■ La curtosis determina el grado de concentración que presentan los valores en la
región central de la distribución. Así puede ser:
– Leptocúrtica.- Existe una gran concentración.
– Mesocúrtica.- Existe una concentración normal.
– Platicúrtica.- Existe una baja concentración.
Medida de Fisher
■ Para datos sin agrupar se emplea la siguiente fórmula:
■ Donde: xi = cada uno de los valores; n = número de datos; x = media aritmética; 4=
Cuádruplo de la desviación estándar poblacional; f = frecuencia absoluta; xm = marca
de clase
■ Si a < 3 la distribución es platicúrtica
■ Si a = 3 la distribución es normal o mesocúrtica
■ Si a > 3 la distribución es leptocúrtica
ADICIONAL
Más conocimiento
Diagrama de tallo /
hoja (steam & leaf)
■ El diagrama "tallo y hojas" (Stem-and-Leaf
Diagram) permite obtener simultáneamente una
distribución de frecuencias de la variable y su
representación gráfica. Para construirlo basta This Photo by Unknown Author is licensed under CC BY-SA
■ Reordenando queda:
Valores extremos o anómalos (outliers): son observaciones que
se alejan del conjunto der datos.
¿Qué son los Una regla para determinar si un dato es outliers es: