Está en la página 1de 25

DISTRIBUCIÓN

NORMAL
Ing. Roberto Guzmán Ortiz

1
 La desviación estándar puede utilizarse para
sacar ciertas conclusiones si el conjunto de datos
en análisis está distribuido normalmente.
 Una distribución normal es una distribución de
datos continuos que produce una curva simétrica
en forma de campana.

2
Suponga que se tiene un número grande de
observaciones para el tiempo, en minutos, que
le toma a los esquiadores descender por una
pendiente inclinada de una montaña de Vail.
Si los datos están distribuidos normalmente,
una gráfica de la frecuencia con la cual
ocurren cada observación toma la forma de la
figura.

3
Las observaciones en cada extremo ocurrirán en forma
poco frecuente, pero las observaciones que están más
cerca de la mitad ocurrirán con una frecuencia alta; lo
que produce la curva simétrica en forma de campana.
La observación modal, 10 en este caso, es la que ocurre
con la mayor frecuencia y por tanto está en el pico de
la distribución.
En la distribución normal, la media, la mediana y la moda
son todas iguales.

4
Observe que la mitad de las observaciones está
por encima de la media y la otra mitad está
por debajo de la media; esto significa:
 La mitad del área que está bajo la curva está
a la derecha de la media y la otra mitad del
área que está bajo la curva está a la izquierda
de la media.

5
Para explicar como se aplica la desviación estándar
en la distribución normal, asumir que 1,000
esquiadores desciende por la montaña en una
pendiente empinada.
Los tiempos para todos los esquiadores parecen
distribuidos normalmente, con una media de
μ = 10 minutos y desviación estándar de σ = 2
minutos.
La regla empírica establece que si se incluyen todas
las observaciones que están a una desviación
estándar de la media (una desviación estándar por
encima de la media y una desviación estándar por
debajo de la media) estas serán 68.3% de todas
las observaciones. 6
Es decir, no importa cual es la media ni cual es la
desviación estándar, se puede estar seguro que el
68.3% de las observaciones quedan a una
desviación estándar de la media si las
observaciones están distribuidas normalmente.
Como el promedio de los esquiadores se toma 10 min
para completar el trayecto, mover una desviación
estándar (es decir 2 min) por encima y por debajo
de la media de 10 min produce un rango de 8 a 12
min.

7
De acuerdo con la regla empírica, 683 (68.3% de 1,000)
esquiadores se toman entre 8 y 12 minutos para bajar la
montaña.

Ahora si se mueve más de una observación estándar por


encima y por debajo de la media, se obtendrá un
porcentaje más grande de observaciones.

La regla empírica especifica que:


 68.3% de las observaciones están dentro de más o
menos una desviación estándar de la media.
 95.5% de las observaciones están dentro de más o
menos dos desviaciones estándar de la media.
 99.7% de las observaciones están dentro de más o
menos tres desviaciones estándar de la media.
8
 Para una desviación estándar (2 min) por encima y por
debajo de la media da un rango de 8 a 12 min.
 Dos desviaciones estándar (4 min) por encima y por
debajo de la media da un rango de 6 a 14 min.
 Tres desviaciones estándar (6 min) por encima y por
debajo de la media da un rango de 4 a 16 min.

La figura siguiente muestra los intervalos de tiempo para


una, dos y tres desviaciones estándar por encima y por
debajo de la media.

9
Suponiendo que un segundo grupo de esquiadores
también hizo un promedio de 10 minutos, pero
tuvo una desviación estándar de 4 minutos,
¿qué pasa con los datos y con la campana?

Las observaciones se dispersan, o sea que los


tiempos de este grupo están más dispersos que
los del primer grupo.
La campana se aplanará y se esparcirá.

10
Aquí observamos:
 Para el 2do grupo los tiempos más rápidos en esquí
estaban por debajo de 10, y los más lentos estaban
muy por encima de 10, comparados con los del 1er
11
grupo.
SESGO
Algunas distribuciones normales están sesgadas a la
izquierda o a la derecha.
La figura muestra la distribución para el peso de las
personas.

La figura (a) indica que la distribución está sesgada a la


derecha. Parece que las pocas personas más pesadas que
están en el extremo superior en la escala de peso (quizá
algunos hombres más grandes) halan la cola de la
distribución hacia la derecha.
12
En la distribución de pesos de la figura (b) unas cuantas
mujeres pequeñitas halan la distribución hacia el extremo
inferior, que hace que se desvíe hacia la izquierda.

En ambos casos:
 La moda es la observación que ocurre con mayor
frecuencia, por lo que está en el pico de la distribución.
 La media es la más afectada por las observaciones
extremas, siendo halada a la dirección del sesgo, más de lo
que está la mediana.
 La mediana está en algún lugar entre la moda y la media.
13
El sesgo puede medirse mediante el Coeficiente
de Pearson,
Coeficiente de sesgo:
P= 3(X — mediana)
s
Si P < 0, los datos están sesgados a la izquierda,
si P > 0, entonces los datos están segados a la
derecha.
Si P = 0 están distribuidos normalmente.

14
COEFICIENTE DE VARIACIÓN
Un uso importante de la desviación estándar es
servir como medida de dispersión, sin embargo, se
aplican ciertas limitaciones.
Cuando se consideran dos o más distribuciones que
tienen medias significativamente diferentes, o
que están medidas en unidades distintas, es
peligros sacar conclusiones respecto a la
dispersión solo basados en la desviación estándar.

Con frecuencia se debe considerar el Coeficiente


de Variación, (CV), que sirve como medida
relativa de dispersión
15
El Coeficiente de variación determina el grado de
dispersión de un conjunto de datos relativo a su
medida.

Se calcula dividiendo la desviación estándar de una


distribución por su media y multiplicando por 100.

Coeficiente de variación:
CV = (s/X)*100

16
Considere el caso donde Alta Costura, un gran
fabricante de ropa, desea estudia la
distribución en la estatura de las personas.
Alta Costura reconoce que el público estaba en
constante cambio en su tamaño físico y en sus
proporciones. Para producir la ropa con mejor
ajuste, la gerencia decide realizar un estudio
completo de las tendencias actuales en los
tamaños de moda.
Al realizar el estudio, medir la estatura de sus
clientes potenciales encuentra que las
estaturas están distribuidas normalmente
alrededor de una media de 67 pulgadas y una
desviación estándar de 2 pulgadas.
17
La figura muestra la gráfica de las estaturas, en la que en
el eje horizontal se colocan las observaciones individuales,
y la frecuencia con la cual cada una de estas
observaciones ocurrieron en el eje vertical.

Se observa que el 50% de las observaciones, estaturas,


esta por encima de la media y el 50% de estas está debajo
de la media; similarmente el 50% de toda el área bajo la
curva normal está a la derecha de la media y el 50% de
esta área esta a la izquierda de la media 18
Comparación entre distribuciones normales.
La forma y posición de una distribución normal están
determinadas por dos parámetros: su media y su
desviación estándar.
La figura muestra tres distribuciones normales
diferentes de las tallas que Alta Costura encontró en su
estudio sobre las tendencias de la moda.

19
20
 La figura I tiene una μ = 67 y σ = 2; con la mitad de las
observaciones por encima de 67 y la otra mitad por
debajo de la media. La σ = 2 indica el grado de dispersión
en el cual las observaciones están dispersas por encima y
por debajo de 67.
 La figura II tiene una media más alta, μ = 79, pero la
misma desviación estándar de σ = 2. Está centrada más
a la derecha, directamente sobre 79, pero como tiene el
mismo grado de dispersión (σ = 2) toma la mismo forma
que la primera distribución.
 La distribución III tiene la misma media que la I, μ = 67,
por lo que está centrada en el mismo sitio. Pero como su
medida de dispersión es más grande, σ = 4. Las
observaciones varían por encima y por debajo de dicha
media de 67 hasta un grado mayor que las observaciones
de la primera distribución. Por lo tanto la distribución
III es más plana y más dispersa por encima y por debajo 21
de la media de 67.
Como conjunto de datos normalmente distribuidos, la regla
empírica especifica que, sin considerar el valor de la media
y de la desviación de estándar,
 El 68.3% de todas las observaciones está a una
desviación estándar de la media.
 El 95.5 % de todas las observaciones está a dos
desviaciones estándar de la media.
 El 99.7% de todas las observaciones está a tres
desviaciones estándar de la media.

22
LA DESVIACIÓN NORMAL
Puede existir un número infinito de distribuciones normales
posibles, cada una con su propia media y su desviación
estándar; como no se puede analizar un número tan grande de
posibilidades, es necesario convertir todas estas
distribuciones normales a una forma estándar o tipificada.
La conversión a la distribución normal estándar o tipificada
se efectúa con la formula:
Z = X — μ ; donde
σ
Z es la desviación normal,
X es algún valor específico de la variable aleatoria
μ es la media
σ es la desviación estándar
Después de este proceso la μ = 0 y la σ = 1
23
La figura ilustra el uso de los datos de Alta Costura.
El eje superior mide las observaciones de estatura
X en pulgadas, la μ = 67 pulgadas y la σ = 2
pulgadas.
El eje inferior refleja estas estaturas en términos
de Z.

24
Valor de Z. Es el número de desviaciones estándar a las que
una observación está por encima o por debajo de la media.

Si Paula Pérez mide 63 pulgadas, su valor Z es:


Z = 63 — 67 = — 2
2
Como se observa en la figura 63 pulgadas está a 4 pulgadas
de la media o a 2 desviaciones estándar por debajo de la
media.

25

También podría gustarte