Está en la página 1de 12

DISTRIBUCIONES DE PROBABILIDAD

I. DISTRIBUCION NORMAL O Z
La distribucin normal, tambin llamada distribucin de Gauss o distribucin gaussiana,
es la distribucin de probabilidad que con ms frecuencia aparece en estadstica y teora de
probabilidades. Esto se debe a dos razones fundamentalmente:
Su funcin de densidad es simtrica y con forma de campana, lo que favorece su
aplicacin como modelo a gran nmero de variables estadsticas.
Es, adems, lmite de otras distribuciones y aparece relacionada con multitud de
resultados ligados a la teora de las probabilidades gracias a sus propiedades
matemticas.
La importancia de la distribucin normal se debe principalmente a que hay muchas variables
asociadas a fenmenos naturales que siguen el modelo de la normal
La distribucin normal posee ciertas propiedades importantes que conviene destacar:
i.
Tiene una nica moda, que coincide con su media y su mediana.
ii.
La curva terica de una distribucin normal va desde
y
es tericamente
posible. El rea total bajo la curva es, por tanto, igual a 1.
iii.
Es simtrica con respecto a su media
. Segn esto, para este tipo de variables
existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50%
de observar un dato menor.
iv.
La distancia entre la lnea trazada en la media y el punto de inflexin de la curva es
igual a una desviacin tpica ( ). Cuanto mayor sea
, ms aplanada ser la curva
de la densidad.
v.
El rea bajo la curva comprendido entre los valores situados aproximadamente a dos
desviaciones estndar de la media es igual a 0.95. En concreto, existe un 95% de
posibilidades
de
observar
un
valor
comprendido
en
el
intervalo
.
La forma de la campana de Gauss depende de los parmetros
y
. La media
indica la posicin de la campana, de modo que para diferentes valores de
la grfica
es desplazada a lo largo del eje horizontal. Por otra parte, la desviacin estndar
determina el grado de apuntamiento de la curva.

vi.

Mediante esta se puede obtener una estimacin puntual o de un intervalo de un parmetro


de la poblacin.
Una estimacin puntual es insesgada si el valor esperado es igual al parmetro de la
poblacin.
As el promedio
(muestra) es una estimacin puntual insesgada de
(poblacin)
Una estimacin o intervalo se refiere a la amplitud de valores junto con la probabilidad a
nivel de confianza, de que el intervalo incluya el parmetro de la poblacin desconocida.
Dada la desviacin estandar de la poblacin o su estimacin y dado que la poblacin es
normal o que una muestra aleatoria es igual o mayor a 30, podemos encontrar que el
intervalo de confianza al 95% para la media de la poblacin desconocida es:
P(

1.96
=

<

<

+ 1.96

/ n

Donde:
P= probabilidad

=media

= error estandar

=media poblacional

Los intervalos de confianza mas usados son:

95%
P(

1.96

<

<

+ 1.96

90%
P(

1.96

<

<

+ 1.96

1.96

<

<

+ 1.96

99%
P(

Estimacin de la media de una poblacin normalmente


distribuida.
Ejercicio 1: Si tomamos una muestra aleatoria de 20 hongos descomponedores de madera
cuya media de colonizacin es de 9 dias y una desviacin estndar de 7.2, la poblacin
hallada en el bosque es de 350 hongos. Calcular el intervalo de confianza al 95% para la
media de la poblacin desconocida. E interprete.

Ejercicio 2: Empleando los datos del ejercicio 1 determine que sucede al incrementar la
desviacin estndar.

Ejercicio 3: Estimar los intervalos para alturas de rboles en la siguiente muestra al azar.
22, 25, 13, 12, 33, 15, 17, 32, 18, 23, 25, 18, 29, 15, 21, 18, 33, 35, 26, 28, 15, 17, 19, 28,
33, 15, 17, 32, 18, 15, 21, 18, 33, 35. (mts)

Ejercicio 4: Estimar los intervalos de la media poblacional para una muestra tomada al azar
para la variable nmero de nematodos por cm 2. 18, 7, 9, 29, 32, 23, 13, 15, 18, 18, 22, 15,
11, 5, 23, 18, 7, 9, 29, 32, 23, 13, 23, 13, 15, 18, 18, 22, 15, 11.

Estimacin de reas de una poblacin normalmente


distribuida.
Donde Z=(X

)/S

Ejercicio 1: Con los datos del ejercicio 1 del anterior tema determine la probabilidad de que un
hongo colonice en 6 das, en 12 das y en 15 das. Si se sabe que la S= 5. Graficar

Ejercicio 2: Con los datos del ejercicio 3 del anterior tema. Que probabilidad hay de que un
rbol mida menos o igual a 20 mts. Graficar

Ejercicio 3: Que probabilidad existe de que se halle 12 nematodos en una muestra de suelo de
1 cm2 tomada al a azar. Graficar.

Ejercicio 4: Obtenga las probabilidades, dados los siguientes valores de z


P [Z 1.28]
P [0.81 Z 1.64]
P [Z -2.17]
P [-0.46 Z 2.21]
P [Z -0.68]
P [Z > 2.05]
P [-2.04 Z 2.04]

II.

DISTRIBUCION T STUDENT

En probabilidad y estadstica, la distribucin-t o distribucin t de Student es una


distribucin de probabilidad que surge del problema de estimar la media de una
poblacin normalmente distribuida cuando el tamao de la muestra es pequeo. sta es
la base del popular test de la t de Student para la determinacin de las diferencias entre
dos medias mustrales y para la construccin del intervalo de confianza para la
diferencia entre las medias de dos poblaciones.
La distribucin t surge, en la mayora de los estudios estadsticos prcticos, cuando la
desviacin tpica de una poblacin se desconoce y debe ser estimada a partir de los
datos de una muestra.
Nivel de Probabilidad:
95%
= 1 0.95
= 0.05 nivel de significancia
= 0.05 / 2 = 0.025
= 1 0.025
= 0.975
Por lo tanto al 95% =
P(
99%

t 0.975

- t 0.975 (n-1) S

<

<

+ t 0.975 (n-1) S

<

+ t 0.995 (n-1) S

= 1 0.99
= 0.01 nivel de significancia
= 0.01 / 2 = 0.005
= 1 0.005
= 0.995
Por lo tanto al 99% =
P(

t 0.995

- t 0.995 (n-1) S

<

Donde:

t 0.995 (n-1)
(n-1)

=valor crtico de T student


=grados de libertad

=error estandar
=promedio de la poblacin

Ejercicio 1: Si tomamos 10 ramas terminales de sauco y evaluamos cuantas yemas tienen en


formacin obtenemos los siguientes datos: 3, 5, 2, 8, 6, 5, 9, 4, 7, 8. Calcular los lmites de
confianza para la media poblacional de este experimento al 99% y 95%.

Ejercicio 2: Si tenemos la evaluacin de el tamao en cm de las ganodermas encontradas en


los eucaliptos del Fundo El Porvenir se tienen: 15, 13, 9, 5, 12, 10, 15, 7, 6, 12 (cm).Calcular los
limites de confianza para la media poblacional de este al 95%.

Determinacin de reas con T student


Para determinar reas se detalla el procedimiento a continuacin.
o
o
o
o

Determinar los grados de libertad para el rea sombreada


Determinar el rea no sombreada
Determinar el grado de significancia
Ubicar el valor critico de T en la tabla

Ejercicio 1: Determinar el valor crtico de T y el rea de la izquierda; para 9 gl y el rea


sombreada a la derecha es igual a 0.025

Ejercicio 2: Determinar el rea sin sombrear y el valor crtico de T, si el rea de la izquierda es


de 0.05 y n=8.

Ejercicio 3: Si X tiene distribucin t con 18 grados de libertad halle el valor c tal que:

P [X 2.101] =

P [X - 2.878] =

P [X > 1.734] =

P [-1.330 X 2.552] =

P [X 2] =

III.
DISTRIBUCION CHI CUADRADO
La prueba de ji-cuadrado es considerada como una prueba no paramtrica que mide la
discrepancia entre una distribucin observada y otra terica (bondad de ajuste), indicando en
qu medida las diferencias existentes entre ambas, de haberlas, se deben al azar en el
contraste de hiptesis. Tambin se utiliza para probar la independencia de dos variables entre
s, mediante la presentacin de los datos en tablas de contingencia.
La frmula que da el estadstico es la siguiente:

X2 = (O E )2 / E
Donde:
X2= Chi cuadrado
O= Frecuencia observada
E= Frecuencia esperada
Ejercicio 1: Se ha estudiado la reaccin de las platas de pinus producidas en contenedores, con
distintos sustratos, con el fin de obtener el mayor desarrollo, de tal estudio se esperaba la
siguiente proporcin siendo esta 5:3:1.El nmero de plantas con alturas y dimetros ptimos
fueron:
o Arena, musgo, tierra negra
2175
o Arena, cascarilla de arroz, musgo
1231
o Arena, musgo, tierra agrcola
420
Calcular los lmites de confianza de este experimento al 99% y 95% limites de confianza.
Clase

Observados

Esperados

Desviacin

Arena, musgo, tierra negra


Arena, cascarilla de arroz, musgo
Arena, musgo, tierra agrcola
Total

Determinacin de reas: (Tabla)


Ejercicio 1: Hallar el valor crtico de X 2 para los que el rea en la cola derecha de la distribucin
X2 sea 0.025 si el nmero de gl es igual a 6, 5, 8, 3.

Limites de confianza: =Sn/x0.975

<

<

Sn/x0.025

Ejercicio: La desviacin tpica de 40 rboles elegidos al azar es de 8 m3. La poblacin es de


1000 rboles. Hallar los lmites de confianza al 95% y 99% de la desviacin tpica para todos
los volmenes de madera de la poblacin.

IV.
ANALISIS DE VARIANZA ANOVA
En estadstica, anlisis de varianza (ANOVA, segn terminologa inglesa) es una coleccin de
modelos estadsticos y sus procedimientos asociados. El anlisis de varianza sirve para
comparar si los valores de un conjunto de datos numricos son significativamente distintos a
los valores de otro o ms conjuntos de datos. El procedimiento para comparar estos valores
est basado en la varianza global observada en los grupos de datos numricos a comparar.
Tpicamente, el anlisis de varianza se utiliza para asociar una probabilidad a la conclusin de
que la media de un grupo de puntuaciones es distinta de la media de otro grupo de
puntuaciones.
El ANOVA parte de algunos supuestos que han de cumplirse:
La variable dependiente debe medirse al menos a nivel de intervalo.
Independencia de las observaciones.
La distribucin de los residuales debe ser normal.
Homocedasticidad: homogeneidad de las varianzas.
Procedimiento para determinar ANOVA
o Se plantea una hiptesis
Se evala el desarrollo de plntulas en 4 tipos de sustratos A, B, C, D.
o Planteamiento de la hiptesis
Ho: A = B = C = D
Ha: A B C D
o Toma de datos
Variable: altura de plntulas en diferentes sustratos (cm)
Repeticin
1
2
3
4
5
6
7
8
9
10
TOTAL
PROMEDIO

A
13
15
20
15
18
13
12
15
16
14

o Desarrollo de formulas:
1.- Factor de correccin:

Fc =

(xi)2
txr

B
18
17
20
22
19
16
17
18
15
14

C
23
19
18
23
22
20
24
17
15
17

D
16
15
18
19
15
14
20
18
17
15

2.- Suma de Cuadrado total:

Sctot = x2i Fc

3.- Suma de cuadrado de tratamientos

Sctrat = (xi)2 - Fc
r

4.- Suma de cuadrado de error

Sce= Sctot - Sctrat

5.- Cuadrado medio de tratamientos

Cmtrat =

Sctrat
gltrat

6.- Cuadrado medio de error

Cmerror=

Scerror
glerror

7.- F calculado

FC

Fuente de variacin
Tratamiento
Error
Total

Cmtrat
Cmerror

Sc

Gl
t-1
t(r-1)

Cm

FC

0.05

ANOVA para diferentes tamaos de muestra


Variable: Germinacin con 4 tratamientos pre germinativos en Albizzia lophanta
Repeticin
1
2
3
4
5
6
7
8
9
10
TOTAL
PROMEDIO

A
13
15
20
15
18

B
18
17
20
22
19
16
17
18

23
19
18
23
22
20
24
17
15
17

16
15
18
19
15
14
20

Hipotesis
Ho: A = B = C = D
Ha: A B C D
1.- Factor de correccin:

Fc =

(xi)2
n1+n2 + n3 + n4

2.- Suma de Cuadrado total:

Sctot = x2i Fc

3.- Suma de cuadrado entre tratamientos

Scentre trat = ( e1)2 + ( e1)2 + ( e1)2 + ( e1)2


n1
n2
n3
n4

4.- Suma de cuadrado dentro de tratamientos

Scdentro trat = Sctot - Scentre trat

5.- Cuadrado medio de tratamientos

Cmentre trat =

Scentre trat
Glentre trat

Fc

6.- Cuadrado medio de error

Cmdentro trat=

Scdentro trat
gldentro trat

7.- F calculado entre tratamientos

FC

Cmentre trat
Cmdentro trat

Fuente de variacin
Entre tratamiento
Dentro de tratamientos
Total

Sc

Gl
t-1

Cm

FC

r - 1

REGRESION Y CORRELACION LINEAL

0.05

En los trabajos de investigacin con frecuencia se analizan dos o mas variables


relacionadas entre si, para determinar la relacin funcional existente entre las variables en
estudio.
Para este tipo de anlisis se necesita :
Diagrama de dispersin de puntos: Nos permite dar una idea sobre la relacin
existente entre las variables o caractersticas estudiadas
Curva lineal o no lineal: La que mas se acomode a los datos.
a) REGRESIN LINEAL:
y = a + bx
donde:
y = estimado de la variable dependiente
a = constante
b = pendiente
x = variable independiente
Ejercicio 1: Se tiene un estudio de la relacin entre las edades y alturas de Eucalyptus
globulus en el Valle del Mantaro. De manera que a los 2, 7, 15, 18, 20 aos presenta
una altura de 3, 9, 11, 17, 19 metros; respectivamente. Qu altura tendr un rbol de
25 aos?
Variable
1
2
3
4
5
Total
b=

xy x y
n
x2 (x)2
n

a = y b x
n

y = a + bx

Graficar:

b) CORRELACIN:
R=
xy x y

XY

Y2

X2

n
( x2 (x)2 ) ( y2 (y)2
n
n
R = Es el % de datos que se explican o ajustan al modelo empleado
R=+
R= R= 0
CORRELACION, VALOR O RANGO
1) Perfecta

R=1

2) Excelente

R = 0.9 < = R < 1

3) Buena

R = 0.8 < = R < 0.9

4) Regular

R = 0.5 < = R < 0.8

5) Mala

R < 0.5

c) REGRESION LOGARITMICA:
y = a + b Ln x
Variable
1
2
3
4
5
Total

b = n (Ln XY) (Ln X) Y


n Ln X2 ( Ln X) 2
a = Y b LnX
n

Ln X

Ln XY

Ln X2

También podría gustarte