Está en la página 1de 10

Actividad 2: La distribucin Normal

ACTIVIDAD 2: La distribucin Normal


CASO 2-1: CLASE DE BIOLOGA______________________________________
El Dr. Saig es profesor de Biologa en una prestigiosa universidad. Est preparando una
clase en la que pretende mostrar con ejemplos el hecho de que la distribucin normal es
muy til a la hora de describir el comportamiento de muchas variables fisiolgicas de los
seres vivos. As, p.e., se sospecha que la longitud de una determinada planta sigue un
comportamiento aproximadamente normal con media = 64 cm y desviacin estndar =
3,1 cm.
El Dr. Saig pretende comparar los resultados obtenidos en una prctica de campo, en la que
sus alumnos midieron 60 plantas de la especie anterior, con una simulacin por ordenador
realizada a partir de una normal.
1.

Simular con Minitab la medicin de 60 plantas de la especie anterior. A fin de que todos
obtengamos los mismos datos, usar como base para la generacin de datos aleatorios
provenientes de una normal el nmero 333.
Seleccionamos Calc > Set Base :

Ahora usamos la opcin Calc > Random Data > Normal :

A2 - 1

Estadstica Aplicada con Minitab


Habremos generado 60 valores aleatorios procedentes de una distribucin normal con los parmetros
indicados.

2.

Mostrar un resumen descriptivo y grfico (histograma + grfico de normalidad) de los


datos obtenidos en el apartado anterior mediante simulacin.
Seleccionar Stat > Basic Statistics > Display Descriptive Statistics
> Graphs :

El programa nos dar el siguiente output:

Descriptive Statistics
Variable
SIMULADO

N
60

Mean
64,584

Median
64,523

TrMean
64,635

Variable
SIMULADO

Minimum
58,051

Maximum
70,316

Q1
62,734

Q3
66,640

StDev
2,931

SE Mean
0,378

Histogram of SIMULADOS, with Normal Curve

Frequency

10

0
60

65

70

SIMULADOS

A2 - 2

Actividad 2: La distribucin Normal

Ahora queremos un grfico de normalidad:


Normality Test:

Stat

>

Basic

Statistics

>

Normal Probability Plot

,999
,99

Probability

,95
,80
,50
,20
,05
,01
,001
60

65

70

SIMULADOS
Av erage: 64,5844
StDev : 2,93060
N: 60

Anderson-Darling Normality Test


A-Squared: 0,236
P-Value: 0,780

Observar que los puntos se aproximan bastante a la lnea roja, lo cual era de esperar puesto que esto
ocurrir siempre que los datos sean aproximables por una distribucin normal (y de hecho estos datos
provienen de una normal).

A2 - 3

Estadstica Aplicada con Minitab


3.

Hacer lo mismo que en el apartado 2 pero ahora con los datos obtenidos en el campo,
los cuales se encuentran en el archivo campo.mtw . Qu podran concluir los alumnos
del Dr. Saig?.
Repitiendo los pasos anteriores con estos nuevos datos, obtendremos los siguientes resultados:

Descriptive Statistics
Variable
Longitud

N
60

Mean
65,357

Median
66,000

TrMean
65,402

Variable
Longitud

Minimum
57,200

Maximum
71,300

Q1
62,425

Q3
68,225

StDev
3,472

SE Mean
0,448

Histogram of Longitud, with Normal Curve


8
7

Frequency

6
5
4
3
2
1
0
60

65

70

Longitud

Normal Probability Plot

,999
,99

Probability

,95
,80
,50
,20
,05
,01
,001
60

65

70

Longitud
Av erage: 65,3567
StDev : 3,47155
N: 60

W-test f or Normality
R:
0,9853
P-Value (approx): > 0,1000

Si bien ahora los puntos se alejan ms que antes de la lnea roja, siguen estando lo suficientemente
prximos a la misma como para que consideremos que se distribuyen de forma aproximadamente
normal. Parece pues que los dos conjuntos de datos son bastante similares.
A2 - 4

Actividad 2: La distribucin Normal

CASO 2-2: SALARIOS MEDIOS_______________________________________


Segn viene publicado en una prestigiosa revista de economa, el salario semanal medio de
los profesores universitarios europeos es de 406,15 . Se estima adems que la desviacin
estndar de dichos salarios es de 55,50 . Supongamos ahora que pretendemos tomar una
muestra aleatoria de 100 profesores para estudiar sus salarios. Calcular las siguientes
probabilidades referentes a la media de dicha muestra:
1.

La probabilidad de que la media de la muestra sea menor de 400 .


En primer lugar, observar lo siguiente: como n = 100 >> 30, por el Teorema Central del Lmite
tendremos que la distribucin de las medias muestrales X se podr aproximar por una normal con
media 406,15 y desviacin estndar 5,50.
Hemos de hallar P ( X < 400) :

Seleccionamos: Calc > Probability Distributions > Normal :

Cumulative Distribution Function


Normal with mean = 406,150 and standard deviation = 5,55000
x
400,0000

P( X <= x)
0,1339

A2 - 5

Estadstica Aplicada con Minitab

2.

La probabilidad de que la media de la muestra est entre 400 y 410 .


Sabemos que P (400 < X < 410) = P ( X < 410) P ( X < 400)
probabilidades ya la hemos calculado en el apartado anterior.

. La segunda de stas

Para calcular la primera se razona anlogamente, obteniendo que:

Cumulative Distribution Function


Normal with mean = 406,150 and standard deviation = 5,55000
x
410,0000

P( X <= x)
0,7561

Por tanto, tendremos: P (400 < X < 410) = P ( X < 410) P ( X < 400) = 0,6222

3. La probabilidad de que la media de la muestra sea mayor de 415 .


En este caso, P ( X > 415) = 1 P ( X < 415) . Hemos de calcular pues esta ltima probabilidad, lo
cual haremos de forma anloga a los apartados anteriores.
Obtendremos lo siguiente:

Cumulative Distribution Function


Normal with mean = 406,150 and standard deviation = 5,55000
x
415,0000

P( X <= x)
0,9446

Por consiguiente, P ( X > 415) = 1 P ( X < 415) = 0,0554

4. Hallar el valor del salario medio c tal que P ( X < c ) = 0,95 .

Seleccionamos nuevamente: Calc > Probability Distributions > Normal , pero


ahora elegiremos la opcin Inverse Cumulative Probability , con lo que
obtendremos :

Inverse Cumulative Distribution Function


Normal with mean = 406,150 and standard deviation = 5,55000
P( X <= x)
0,9500

x
415,2789

A2 - 6

Actividad 2: La distribucin Normal

CASO 2-3: APROXIMACIN NORMAL A UNA BINOMIAL__________________


Para muchas combinaciones de n y p es posible aproximar bastante bien una distribucin
binomial B(n,p) mediante una distribucin normal de media = np y varianza 2 = np(1-p).
Generalmente, esta aproximacin tiende a ser tanto mejor cuanto mayor es el nmero de
pruebas n.
1.

Introducir en la columna C1 de una hoja de trabajo los nmeros 0, 1, 2, ..., 16. En la


columna C2 calcular P(X = 0), P(X = 1), ..., P(X = 16), siendo X una binomial de
parmetros n = 16 y p = 0,5.
Seleccionamos: Calc > Make Patterned Data > Simple Set of Numbers :

Ahora hacemos: Calc > Probability Distributions > Binomial :

A2 - 7

Estadstica Aplicada con Minitab


El resultado ser el siguiente:

Data Display

2.

Row

C1

C2

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

0,000015
0,000244
0,001831
0,008545
0,027771
0,066650
0,122192
0,174561
0,196381
0,174561
0,122192
0,066650
0,027771
0,008545
0,001831
0,000244
0,000015

Introducir en la columna C3 el valor de la funcin de densidad de probabilidad (f.d.p.)


asociada a los valores de la C1 para una distribucin normal que aproxime a la binomial
anterior.
Observar que: = n*p = 8 y 2 = n*p*(1-p) = 4
Hacemos: Calc > Probability Distributions > Normal :

A2 - 8

Actividad 2: La distribucin Normal


3.

Dibujar un diagrama de barras con los datos de las columnas C1 (en eje x) y C2 (en eje
y). Superpuesto a l, dibujad la funcin de densidad que se obtiene a partir de las
columnas C1 (en eje x) y C3 (en eje y). Qu observas?.
A fin de superponer ambos grficos, elegimos la opcin: Graph > Layout :

Seleccionamos: Graph > Chart :

Finalmente hacemos: Graph > Plot :

A2 - 9

Estadstica Aplicada con Minitab

Para representar los grficos superpuestos basta con hacer: Graph > End Layout :

Aproximacin normal a una binomial


0,2

C2 y C3

binomial

fdp normal
0,1

0,0
0 1 2

3 4 5 6

7 8 9 10 11 12 13 14 15 16

C1

A partir del grfico anterior se comprende mejor el hecho de que podemos aproximar la probabilidad de
que una variable binomial tome un determinado valor mediante la f.d.p. de una distribucin normal.
As, p.e., podemos estimar P(X = 7) (rea en azul) por P(6,5 < X < 7,5) (rea comprendida entre
la curva roja y ambos puntos). En el primer caso estamos considerando que la variable X es binomial,
mientras que en el segundo consideramos que es normal (y por tanto hacemos uso de la aproximacin
por continuidad, puesto que para cualquier variable continua la probabilidad puntual es cero).

A2 - 10

También podría gustarte