Está en la página 1de 17

DISTRIBUCIN NORMAL /PRUEBA NORMALIDAD/ TRANSF. DATOS P. Reyes / Sept.

2007

DISTRIBUCIN NORMAL, PRUEBA DE


NORMALIDAD Y TRANSFORMACIN DE
DATOS

DR. PRIMITIVO REYES AGUILAR


Septiembre 2007
Mail. Primitivo_reyes@yahoo.com /
Cel. 044 55 52 17 49 12

Pgina 1 de 17

DISTRIBUCIN NORMAL /PRUEBA NORMALIDAD/ TRANSF. DATOS P. Reyes / Sept. 2007

CONTENIDO
1. Distribucin normal

2. Estandarizacin de valores

3. Prueba de normalidad

4. Transformacin de datos

5. Ajuste de datos con otras distribuciones de probabilidad

Pgina 2 de 17

DISTRIBUCIN NORMAL /PRUEBA NORMALIDAD/ TRANSF. DATOS P. Reyes / Sept. 2007

LA DISTRIBUCIN NORMAL, PRUEBA DE


NORMALIDAD, TRANSFORMACIN Y AJUSTE DE DATOS
1. DISTRIBUCIN NORMAL
Un proceso opera en condiciones normales, si tiene los materiales dentro de de
especificaciones y del mismo lote, un mtodo consistente, un medio ambiente
adecuado, el operador capacitado, y el equipo ajustado correctamente, si se
toman mediciones en alguna caracterstica del producto, mostrar el siguiente
comportamiento:

Fig. 1 Construccin de la distribucin normal


La distribucin normal es una de las distribuciones ms usadas e importantes.
Se ha desenvuelto como una herramienta indispensable en cualquier rama de
la ciencia, la industria y el comercio.
Muchos eventos reales y naturales tienen una distribucin de frecuencias cuya
forma es muy parecida a la distribucin normal. La distribucin normal es
llamada tambin campana de Gauss por su forma acampanada.

Pgina 3 de 17

DISTRIBUCIN NORMAL /PRUEBA NORMALIDAD/ TRANSF. DATOS P. Reyes / Sept. 2007

Cuando se incluyen todos los datos de un proceso o poblacin, sus parmetros


se indican con letras griegas, tales como: promedio o media = (mu), y
desviacin estndar (indicador de la dispersin de los datos) = (sigma).
Para el caso de estadsticos de una muestra se tiene media = X y desv. est.= s.

Propiedades de la distribucin normal estndar

La distribucin normal estndar tiene media = 0 y desviacin estndar


=1. La media, Mediana y Moda coinciden, son iguales y se localizan en el
pico.

Fig. 2 Propiedades de la distribucin normal

El rea bajo la curva o probabilidad de menos infinito a ms infinito vale 1.

La distribucin normal es simtrica, la mitad de curva tiene un rea de 0.5.

La escala horizontal de la curva se mide en desviaciones estndar.

La forma y la posicin de una distribucin normal dependen de los


parmetros , , por lo que hay un nmero infinito de distribuciones
normales.

Pgina 4 de 17

DISTRIBUCIN NORMAL /PRUEBA NORMALIDAD/ TRANSF. DATOS P. Reyes / Sept. 2007

Lmite inferior de especs.

Lmite superior de especificaciones

Fig. 3 Distribuciones normales con varias desv. estndar

LIE
Fig. 4 Distribuciones
desviaciones estndar

LSE
normales

Pgina 5 de 17

con

varias

medias

DISTRIBUCIN NORMAL /PRUEBA NORMALIDAD/ TRANSF. DATOS P. Reyes / Sept. 2007

Existe una relacin del porcentaje de probabilidad o rea bajo la curva normal
a la desviacin estndar. En la figura observamos por ejemplo que el rea bajo
la curva para 1

tiene un porcentaje de 68.26%, 2

= 95.46% y

3 99.73% .

-3s -2s -1s

+1s +2s +3s


68.26%
95.46%

99.73%
Fig. 5 rea bajo la curva de Distribucin normal
Lo anterior se puede calcular con la Tabla de distribucin normal o con Excel
(Fx =distr.norm.estand(Z) proporciona el rea desde menos infinito hasta Z).
En la tabla normal, se busca el valor de Z y se encuentra el rea bajo la curva.
La primera tabla sirve para determinar el rea o probabilidad que se encuentra
fuera de los lmites de especificaciones. La segunda tabla proporciona valores
de rea bajo la curva para Zs mayores a cero. En cada una se muestran
ejemplos de su uso.

Pgina 6 de 17

DISTRIBUCIN NORMAL /PRUEBA NORMALIDAD/ TRANSF. DATOS P. Reyes / Sept. 2007

Pgina 7 de 17

DISTRIBUCIN NORMAL /PRUEBA NORMALIDAD/ TRANSF. DATOS P. Reyes / Sept. 2007

Ejemplo 1
a) Determinar el rea bajo la curva de menos infinito a Z = - 1.
P(Z<= -1) = 0.1587
b) Determinar el rea bajo la curva de menos infinito a Z = - 2.
P(Z<= - 2) = 0.0228
c) Determinar el rea bajo la curva entre Z >= -2. hasta Z <= -1
P(- 2 <= Z<= -1) = 0.1259

Pgina 8 de 17

DISTRIBUCIN NORMAL /PRUEBA NORMALIDAD/ TRANSF. DATOS P. Reyes / Sept. 2007

Pgina 9 de 17

DISTRIBUCIN NORMAL /PRUEBA NORMALIDAD/ TRANSF. DATOS P. Reyes / Sept. 2007

Ejemplo 2
a) Determinar el rea bajo la curva de menos infinito a Z = 1.
P(Z <= 1) = 0.8413
b) Determinar el rea bajo la curva de menos infinito a Z = 2.
P(Z <= 2) = 0.9772 8
c) Determinar el rea bajo la curva de menos Z = 1 a Z = 2
P(1 <= Z <= 2) = 0.9772 0.8413 = 0.1369

Pgina 10 de 17

DISTRIBUCIN NORMAL /PRUEBA NORMALIDAD/ TRANSF. DATOS P. Reyes / Sept. 2007

EJERCICIO 1:
Qu porcentaje del rea bajo la curva normal estndar o probabilidad est
incluido dentro de los siguientes rangos?
a) P(1.2 <= Z <= 2.2) = P(Z <= 2.2) P(Z <= 1.2) =
b) P(-2.1 <= Z <= -0.4) = P(Z <= - 0.4) P(Z <= -2.1) =
c) P( -1.3 <= Z <= 2.7) = P(Z <= 2.7) P(Z <= -1.3) =
d) P( Z >= 2.4) = P(Z <= -2.4) =
e) P( Z<=-2.9) + P(Z>= 3.1) = P(Z <= -2.9) + P(Z <= -3.1) =
f) P(Z>= 1.9) = P(Z <= -1.9) =

2. Estandarizacin de valores reales


En la prctica, se tienen valores reales de promedio diferentes de cero y con
desviacin estndar diferentes de uno, para determinar la probabilidad o rea
bajo la curva, se determina el nmero de desviaciones estndar Z entre algn
valor X y la media de la poblacin o de la muestra X como sigue:

s se consideran los datos completos del proceso.

X X
s

s se consideran slo los datos de una muestra.

Ejemplo 3 El departamento de personal de una empresa requiere que los


solicitantes a un puesto en cierta prueba alcancen una calificacin de 500. Si
las calificaciones de la prueba se distribuyen normalmente con media 485
y desviacin estndar

30 Qu porcentaje de los solicitantes pasar la

prueba?
Calculando el valor de Z obtenemos:
Z

X
500 485
0.5
=
30

Buscamos el valor correspondiente

Z en las tablas de distribucin normal

estndar o por medio de Excel =distr.norm.estand(0.5). Z0.5 = 0.69146 =

Pgina 11 de 17

DISTRIBUCIN NORMAL /PRUEBA NORMALIDAD/ TRANSF. DATOS P. Reyes / Sept. 2007

69.146%. donde la probabilidad de que la calificacin sea menor a 500 es P (X


<= 500). Dado que el porcentaje pedido es P ( X 500) la solucin es 10.69146 =0.3085, por tanto slo 30.85% de los participantes pasarn la prueba.
Otra forma es tomando la Z como negativa con P(Z <= -0.5) = 0.3085.
485

3 0 .8 5 %

Z.0 5

Fig. 6 rea bajo la curva de Distribucin normal

Ejemplo 1.4 Suponga que un proceso tiene una distribucin normal dada tiene
una media de 20 y una desviacin estndar de 4. Calcule la probabilidad
P (X >=24) = 1 P(X <= 24) =
En la barra de herramientas seleccione el icono de funciones
fx>Estadsticas>Distr.Norm.Estand. OK. El sistema muestra la siguiente
ventana, en la cual llenamos los siguientes datos:

Fig. 7 Clculo del rea bajo la curva normal sin requerir Z


El resultado de la frmula = 0.8413. , dado que esta es la probabilidad P(X
24), la probabilidad buscada es: P(X > 24) = 1 - 0.8413= 0.1587

Pgina 12 de 17

DISTRIBUCIN NORMAL /PRUEBA NORMALIDAD/ TRANSF. DATOS P. Reyes / Sept. 2007

EJERCICIO 2:
Un producto tiene un peso promedio de 75 Kgs. con una desviacin estndar
de 10Kgs.
a) Cul es la probabilidad de que un producto pese ms de 85Kgs.?
b) Cul es la probabilidad de que un producto pese menos de 55Kgs.?
c) Cul es la probabilidad de que el producto pese entre 60 y 80 Kgs.?.
d) Cul es la probabilidad de que el producto pese entre 55 y 70 Kgs.?
e) Cul es la probabilidad de que el producto pese entre 85 y 100Kgs.?

3. PRUEBA DE NORMALIDAD
Para probar normalidad de datos, se pueden utilizar los mtodos de Anderson
Darling o Ryan, y la grfica de probabilidad normal.
a) En el mtodo de Anderson Darling o Ryan Joiner, si el valor de probabilidad
P de la prueba es mayor a 0.05, se considera que los datos son normales.
Seguir los siguientes pasos:
Generar 100 datos aleatorios en Minitab con Media = 264.6 y Desviacin
estndar S = 32.02 con:
1. Calc > Random data > Normal
2. Generate 100 Store in columns C1 Mean 264.06 Estandar deviation 32.02
OK
Nos aseguramos que los datos se distribuyan normalmente con la prueba de
Anderson Darling o Ryanjoiner como sigue:
1. Stat > Basic statistics > Normality Test
2. Variable C1

Seleccionar Ryan Joiner test OK

El P value debe ser mayor a 0.05 para que los datos se distribuyan
normalmente

Pgina 13 de 17

DISTRIBUCIN NORMAL /PRUEBA NORMALIDAD/ TRANSF. DATOS P. Reyes / Sept. 2007

Fig. 8 Grfica de probabilidad de un proceso normal


b) Otra opcin por medio de una grfica de probabilidad normal, se tiene:
3. Graph > Probability plot > Normal
4. Graph Variable C1
5. Distribution Normal OK
Los puntos deben quedar dentro del intervalo de confianza para indicar que es
normal la distribucin.

Fig. 9 Grfica de probabilidad normal con Int.de confianza

Pgina 14 de 17

DISTRIBUCIN NORMAL /PRUEBA NORMALIDAD/ TRANSF. DATOS P. Reyes / Sept. 2007

4. TRANSFORMACIN DE DATOS
Si los datos no son normales, se pueden tratar de transformar con alguna
funcin para normalizarlos utilizando el Mtodo de Box Cox, que encuentra un
exponente lamda al que se deben elevar los datos:

Por ejemplo los datos del archivo Tiles.Mtw de Minitab:


Probability Plot of Torcedura
Normal
99.9

Mean
StDev
N
AD
P-Value

99

Percent

95
90

2.923
1.786
100
1.028
0.010

80
70
60
50
40
30
20
10
5
1
0.1

-4

-2

2
4
Torcedura

10

Fig. 10 Grfica de probabilidad de un proceso no normal

Para tratar de normalizarlos con el Mtodo de Box Cox se tiene:


1. File > Open worksheet Tiles.mtw
2. Stat > Control Charts > Box Cox transformation
3. All observations in a column Torcedura (Warpness) Subgroup size 1
4. Options: Store transformed data in: TorceduraTransf
5. OK

Si no se encuentra un intervalo de confianza (rayas rojas), indica que los datos


no son transformables por este mtodo.

Pgina 15 de 17

DISTRIBUCIN NORMAL /PRUEBA NORMALIDAD/ TRANSF. DATOS P. Reyes / Sept. 2007

Box-Cox Plot of Torcedura


LowerCL

UpperCL
Lambda

20

(using 95.0% confidence)

StDev

15

Estimate

0.345504

LowerCL
UpperCL

0.052120
0.642093

Best Value

0.500000

10

5
Limit
0
-2

-1

1
2
Lambda

Fig. 11 Determinacin del exponente Lambda de Box Cox


Aqu indica que para normalizar los datos, se deben elevar a la 0.5 (raz
cuadrada), al probar la normalidad de los datos transformados se tiene:
Probability Plot of TorceduraTransf
Normal
99.9

Mean
StDev
N
AD
P-Value

99

Percent

95
90

1.624
0.5380
100
0.301
0.574

80
70
60
50
40
30
20
10
5
1
0.1

0.0

0.5

1.0

1.5
2.0
TorceduraTransf

2.5

3.0

3.5

Fig. 12 Grfica de probabilidad del proceso normalizado

5. AJUSTE DE DATOS CON OTRAS DISTRIBUCIONES DE


PROB.
Si los datos no son transformables, se puede identificar una funcin a la que se
ajusten los datos, para que con esta se determine la capacidad del proceso:
1. File > Open worksheet Tiles.mtw
Pgina 16 de 17

DISTRIBUCIN NORMAL /PRUEBA NORMALIDAD/ TRANSF. DATOS P. Reyes / Sept. 2007

2. Stat > Reliability / Survival > Distribution Analysis (right sensoring) >
Distribution ID Plot
3. Variables Torcedura
4. Seleccionar Use all distributions
5. OK
Los resultados se muestran a continuacin, se indica el valor del coeficiente de
correlacin, se puede seleccionar la distribucin que tenga el mayor, o el
menor valor de Anderson Darling:
Goodness-of-Fit
Distribution
Weibull
Lognormal
Exponential
Loglogistic
3-Parameter Weibull
3-Parameter Lognormal
2-Parameter Exponential
3-Parameter Loglogistic
Smallest Extreme Value
Normal
Logistic

Anderson-Darling
(adj)
0.379
1.566
11.735
1.852
0.400
0.515
7.325
0.944
7.609
1.170
1.330

Correlation
Coefficient
0.994
0.978
*
0.974
0.997
0.994
*
0.985
0.909
0.978
0.973

Las grficas resultantes son:


Probability Plot for Torcedura
LSXY Estimates-Complete Data
Correlation Coefficient
Weibull
0.994
Lognormal
0.978
Exponential
*
Loglogistic
0.974

Lognormal

99.9

99.9

90

99

50

90

Percent

Percent

Weibull

10
1

50
10
1

0.1

0.1

1.0
Torcedura

0.1
0.1

10.0

Exponential
99.9

90

99
Percent

50
Percent

10.0

Loglogistic

99.9

10
1
0.1
0.001

1.0
Torcedura

90
50
10
1

0.010

0.100
1.000
Torcedura

10.000

0.1
0.1

1.0
10.0
Torcedura

100.0

Fig. 13 Grficas de varias distribuciones de probabilidad

Pgina 17 de 17

También podría gustarte