Documentos de Académico
Documentos de Profesional
Documentos de Cultura
NORMAL
Ing. Roberto Guzmán Ortiz
1
La desviación estándar puede utilizarse para
sacar ciertas conclusiones si el conjunto de datos
en análisis está distribuido normalmente.
Una distribución normal es una distribución de
datos continuos que produce una curva simétrica
en forma de campana.
2
Suponga que se tiene un número grande de
observaciones para el tiempo, en minutos, que
le toma a los esquiadores descender por una
pendiente inclinada de una montaña de Vail.
Si los datos están distribuidos normalmente,
una gráfica de la frecuencia con la cual
ocurren cada observación toma la forma de la
figura.
3
Las observaciones en cada extremo ocurrirán en forma
poco frecuente, pero las observaciones que están más
cerca de la mitad ocurrirán con una frecuencia alta; lo
que produce la curva simétrica en forma de campana.
La observación modal, 10 en este caso, es la que ocurre
con la mayor frecuencia y por tanto está en el pico de
la distribución.
En la distribución normal, la media, la mediana y la moda
son todas iguales.
4
Observe que la mitad de las observaciones está
por encima de la media y la otra mitad está
por debajo de la media; esto significa:
La mitad del área que está bajo la curva está
a la derecha de la media y la otra mitad del
área que está bajo la curva está a la izquierda
de la media.
5
Para explicar como se aplica la desviación estándar
en la distribución normal, asumir que 1,000
esquiadores desciende por la montaña en una
pendiente empinada.
Los tiempos para todos los esquiadores parecen
distribuidos normalmente, con una media de
μ = 10 minutos y desviación estándar de σ = 2
minutos.
La regla empírica establece que si se incluyen todas
las observaciones que están a una desviación
estándar de la media (una desviación estándar por
encima de la media y una desviación estándar por
debajo de la media) estas serán 68.3% de todas
las observaciones. 6
Es decir, no importa cual es la media ni cual es la
desviación estándar, se puede estar seguro que el
68.3% de las observaciones quedan a una
desviación estándar de la media si las
observaciones están distribuidas normalmente.
Como el promedio de los esquiadores se toma 10 min
para completar el trayecto, mover una desviación
estándar (es decir 2 min) por encima y por debajo
de la media de 10 min produce un rango de 8 a 12
min.
7
De acuerdo con la regla empírica, 683 (68.3% de 1,000)
esquiadores se toman entre 8 y 12 minutos para bajar la
montaña.
9
Suponiendo que un segundo grupo de esquiadores
también hizo un promedio de 10 minutos, pero
tuvo una desviación estándar de 4 minutos,
¿qué pasa con los datos y con la campana?
10
Aquí observamos:
Para el 2do grupo los tiempos más rápidos en esquí
estaban por debajo de 10, y los más lentos estaban
muy por encima de 10, comparados con los del 1er
11
grupo.
SESGO
Algunas distribuciones normales están sesgadas a la
izquierda o a la derecha.
La figura muestra la distribución para el peso de las
personas.
En ambos casos:
La moda es la observación que ocurre con mayor
frecuencia, por lo que está en el pico de la distribución.
La media es la más afectada por las observaciones
extremas, siendo halada a la dirección del sesgo, más de lo
que está la mediana.
La mediana está en algún lugar entre la moda y la media.
13
El sesgo puede medirse mediante el Coeficiente
de Pearson,
Coeficiente de sesgo:
P= 3(X — mediana)
s
Si P < 0, los datos están sesgados a la izquierda,
si P > 0, entonces los datos están segados a la
derecha.
Si P = 0 están distribuidos normalmente.
14
COEFICIENTE DE VARIACIÓN
Un uso importante de la desviación estándar es
servir como medida de dispersión, sin embargo, se
aplican ciertas limitaciones.
Cuando se consideran dos o más distribuciones que
tienen medias significativamente diferentes, o
que están medidas en unidades distintas, es
peligros sacar conclusiones respecto a la
dispersión solo basados en la desviación estándar.
Coeficiente de variación:
CV = (s/X)*100
16
Considere el caso donde Alta Costura, un gran
fabricante de ropa, desea estudia la
distribución en la estatura de las personas.
Alta Costura reconoce que el público estaba en
constante cambio en su tamaño físico y en sus
proporciones. Para producir la ropa con mejor
ajuste, la gerencia decide realizar un estudio
completo de las tendencias actuales en los
tamaños de moda.
Al realizar el estudio, medir la estatura de sus
clientes potenciales encuentra que las
estaturas están distribuidas normalmente
alrededor de una media de 67 pulgadas y una
desviación estándar de 2 pulgadas.
17
La figura muestra la gráfica de las estaturas, en la que en
el eje horizontal se colocan las observaciones individuales,
y la frecuencia con la cual cada una de estas
observaciones ocurrieron en el eje vertical.
19
20
La figura I tiene una μ = 67 y σ = 2; con la mitad de las
observaciones por encima de 67 y la otra mitad por
debajo de la media. La σ = 2 indica el grado de dispersión
en el cual las observaciones están dispersas por encima y
por debajo de 67.
La figura II tiene una media más alta, μ = 79, pero la
misma desviación estándar de σ = 2. Está centrada más
a la derecha, directamente sobre 79, pero como tiene el
mismo grado de dispersión (σ = 2) toma la mismo forma
que la primera distribución.
La distribución III tiene la misma media que la I, μ = 67,
por lo que está centrada en el mismo sitio. Pero como su
medida de dispersión es más grande, σ = 4. Las
observaciones varían por encima y por debajo de dicha
media de 67 hasta un grado mayor que las observaciones
de la primera distribución. Por lo tanto la distribución
III es más plana y más dispersa por encima y por debajo 21
de la media de 67.
Como conjunto de datos normalmente distribuidos, la regla
empírica especifica que, sin considerar el valor de la media
y de la desviación de estándar,
El 68.3% de todas las observaciones está a una
desviación estándar de la media.
El 95.5 % de todas las observaciones está a dos
desviaciones estándar de la media.
El 99.7% de todas las observaciones está a tres
desviaciones estándar de la media.
22
LA DESVIACIÓN NORMAL
Puede existir un número infinito de distribuciones normales
posibles, cada una con su propia media y su desviación
estándar; como no se puede analizar un número tan grande de
posibilidades, es necesario convertir todas estas
distribuciones normales a una forma estándar o tipificada.
La conversión a la distribución normal estándar o tipificada
se efectúa con la formula:
Z = X — μ ; donde
σ
Z es la desviación normal,
X es algún valor específico de la variable aleatoria
μ es la media
σ es la desviación estándar
Después de este proceso la μ = 0 y la σ = 1
23
La figura ilustra el uso de los datos de Alta Costura.
El eje superior mide las observaciones de estatura
X en pulgadas, la μ = 67 pulgadas y la σ = 2
pulgadas.
El eje inferior refleja estas estaturas en términos
de Z.
24
Valor de Z. Es el número de desviaciones estándar a las que
una observación está por encima o por debajo de la media.
25