Está en la página 1de 17

ESCUELA POLITCNICA NACIONAL

FACULTAD DE INGENIERA CIVIL Y AMBIENTAL

MAESTRA DISEO HIDRULICO

Nombre: Luis Jurado A.

Curso: Propedutico

Materia: Probabilidad y Estadstica

Taller 10. Distribuciones de probabilidades: normal, binomial, chi-cuadrado, distribucin t y


distribucin F (continuacin)

1. Calcule las siguientes probabilidades: a) dada una variable z con distribucin normal
estndar, cual es la probabilidad de que z sea mayor a 0.1, 1 y 2.5 b) Cul es la
probabilidad que una variable tenga un valor mayor a 42 si su media es 35 y la
desviacin estndar es 6?

Probabilidad de que z > 0.1

0.4602 = 46.02%

Probabilidad de que z > 1

0.1587 = 15.87%

Probabilidad de que z > 2.5

0.0062 = 0.62%

Probabilidad que una variable tenga un valor mayor a 42 si su media es 35 y la desviacin


estndar es 6

0.1217 = 12.17%

2. El 5% de los varones de una distribucin normal se encuentran aproximadamente


fuera de dos desviaciones estndares de la media. Pruebe que eso es verdad. Cules
son los lmites que corresponden al 1%, 0.5% y 0.1%?

0-2.5% valores < -1.96


97.5 100% valores > 1.96

Se comprueba que el 5% de valores se encuentran aproximadamente fuera de dos desviaciones


estndar.

0-0.5% valores < -2.58

99.5 100% valores > 2.58

0-0.25% valores < -2.81

99.75 100% valores > 2.81

0-0.05% valores < -3.29

99.95 100% valores > 3.29

3. Encuentre un valor positivo de z de modo que el rea bajo la curva normal estndar
entre -z y z sea igual a 0.95

R= Para que el rea bajo la curva sea igual a 0.95 se necesita un rango de z de -1.96 a 1.96 por
lo que el valor positivo de z era 1.96.

4. Los resultados de los exmenes de ingreso a la universidad tienen un valor medio de


1000 y una desviacin estndar de 100. Cul debera ser tu nota para que solamente
el 10% de los estudiantes tenga una nota mayor a la tuya?

Se necesita obtener una nota del 90% para cumplir que solo el 10% de los estudiantes tenga una
nota mayor.

La nota que se debe obtener es de 1128.155


5. Cules son los valores de . , . , .

0.025 = 1.96
0.01 = 2.33
0.005 = 2.58
6. Un estudio reciente muestra que el 44.7% de los estudiantes usan Wikipedia como al
menos una de su fuente de informacin para elaboracin de tareas. Si se toma una
muestra de estudiantes n=31, demuestre la distribucin x de estudiantes en un
grfico. Cul es la probabilidad de que x es igual a 17? Cul es la probabilidad de que
x tenga un valor menor a 13? Cul es la probabilidad de que el nmero de estudiantes
sea entre 16 y 19?

Probabilidad de que x = 17

R= 0.0753 = 7.53%

Probabilidad de que x < 13

R= 0.4514 = 45.14%
Probabilidad de que 16 < x < 19

R=0.1489 = 14.89%

7. Haga un grfico de una distribucin normal standard con 1000 nmeros aleatorios.

8. Haga un grfico de una distribucin chi-cuadrado con 3 grados de libertad. Es decir,


calcule una variable que siga una distribucin chi-cuadrado con 3 grados de libertad
9. Divida la variable chi.sq.e para los grados de libertad (3) de manera que cambiamos la
escala de los valores iniciales de la variable

Generamos otra variable normal y dividimos para la raz cuadrada de scaled.chi.q.3

Genere un grfico de la variable t.3 usando el comando hist(). La variable t.3 sigue una
distribucin t con 3 grados de libertad.
10. Obtenga una variable que sigue una distribucin F por medio de encontrar la relacin
(divisin) entre dos variables que tengan una distribucin t. Una variable con 3 grados
de libertad, es la variable calculada anteriormente scaled.chi.sq.3. La otra variable
debe tener 20 grados de libertad. Calcule la relacin entre las dos variables y obtendr
una variable que sigue una distribucin F

11. El programa CHISQUARE produce un nmero ilimitado de distribuciones chi-cuadrado,


una por cada grado de libertad. Para valores pequeos del grado de libertad, la
distribucin chi cuadrada es sesgada a la derecha. A medida que los grados de libertad
incrementan (el tamao de la muestra incrementa), el valor modal de la distribucin
chi-cuadrado se desplaza a la derecha. Los valores de la distribucin chi-cuadrado
deben ser positivos y varan continuamente entre cero y un valor positivo infinito. El
programa toma muestras de una distribucin normal. Inicialmente el programa toma
250 muestras. Cada vez el valor de la estadstica chi-cuadrado es calculada. Los 250
valores de chi-cuadrado se grafican y el programa calcula el grupo modal y el rango de
los valores chi-cuadrado. Corra el programa CHISQUARE para cada tamao de muestra
y grados de libertad indicados abajo. Use una media de poblacin= 0 y desviacin
estndar=1.0 y 250 rplicas del experimento. Haga una captura de pantalla de la forma
de la distribucin y liste el grupo modal (el grupo con la frecuencia relativa mayor)
Grupo
N Grfico de la distribucin
modal

2 1
3 1

4 3

5 3

6 3
7 5

Comente: Qu sucede con la forma de la distribucin chi-cuadrado a medida que el tamao de


la muestra incrementa?

Como se puede observar, cuando la muestra es pequea, la distribucin es totalmente sesgada


a la derecha, mientras el tamao de la muestra incrementa, la variacin modal se desplaza hacia
la derecha, aproximndose cada vez ms a una distribucin chi-cuadrado.

La moda terica de la distribucin chi-cuadrado es (df-2) cuando df>2. Calcule la moda terica
de la distribucin chi-cuadrado para cada tamao de muestra.

Grupo Moda
N df Error
modal terica
2 1 1 No aplicable No aplicable
3 2 1 No aplicable No aplicable
4 3 3 1 2
5 4 3 2 1
6 5 3 3 0
7 6 5 4 1

12. El script t-test crea una distribucin de scores z y t. El programa requiere que se ingrese
la media de la poblacin, la desviacin estndar, tamao de muestra y nmero de
rplicas del experimento (muestras a ser tomadas). El script selecciona una muestra
aleatoria del tamao determinado, calcula el valor medio y la desviacin estndar de
la muestra y luego la estadstica z y t. Este proceso se repite 250 veces. Los 250 scores
z y t son tabulados en una tabla de frecuencias. Al comparar la tabla de frecuencias
usted podr observar la variabilidad en las frecuencias en los valores extremos (cola)
de la distribucin.

Corra el script para una media de la poblacin= 0 y desviacin estndar= 1. Use un tamao de
muestra de 5 y corra el experimento 1000 veces. Registe las siguientes observaciones
Intervalo FREQt FREQz
-4.0, -3.5 0,007 0,001
-3,5, -3.0 0,006 0,000
-3.0, -2.5 0,014 0,003
-2,5, -2.0 0,025 0,019
-2.0, -1.5 0,041 0,043
-1,5, -1.0 0,086 0,101
-1.0, -0.5 0,131 0,144
-0.5, 0.0 0,180 0,184
0.0, 0.5 0,179 0,200
0.5, 1.0 0,123 0,127
1.0, 1.5 0,084 0,100
1.5, 2.0 0,056 0,051
2.0, 2.5 0,027 0,018
2.5, 3.0 0,016 0,007
3.0, 3.5 0,008 0,001
3.5, 4.0 0,005 0,000

Qu puede comentar sobra las frecuencias de la distribucin en los extremos de la distribucin?

Como se puede observar, las frecuencias en los extremos tienden a ser menores que en los
valores centrales. Esto demuestra que es una distribucin normal.

Grafique las frecuencias Z (lnea slida) y t(lnea puenteada). Cul es la diferencia ms notoria
entre ambos grficos? Explique
La diferencia ms notoria se encuentra en la frecuencia relativa, ya que los valores de z
presentan un valor un poco mayor a los valores de t, pero ambas grficas tienen la misma
distribucin.

Repita este proceso para un tamao de muestra de 100. Conserve los valores de la media= 0 y
std= 1.0. Replique el experimento 1000 veces. Explique la diferencia de los datos entre los
tamaos de muestras.
Intervalo FREQt FREQz
-4.0, -3.5 0,001 0,001
-3,5, -3.0 0,002 0,002
-3.0, -2.5 0,005 0,004
-2,5, -2.0 0,015 0,012
-2.0, -1.5 0,036 0,036
-1,5, -1.0 0,095 0,094
-1.0, -0.5 0,154 0,155
-0.5, 0.0 0,178 0,182
0.0, 0.5 0,204 0,208
0.5, 1.0 0,168 0,168
1.0, 1.5 0,087 0,086
1.5, 2.0 0,039 0,033
2.0, 2.5 0,012 0,014
2.5, 3.0 0,003 0,005
3.0, 3.5 0,001 0,000
3.5, 4.0 0,000 0,000

La diferencia principal entre los tamaos de muestras es la frecuencia relativa de t y z. Se puede


concluir con los datos obtenidos que mientras mayor es el tamao de la muestra, los valores de
frecuencias relativas de t y z se aproximan ms entre s.
13. El script F-Curve simula una distribucin F para valores diferentes de grados de
libertad. El grado df1 se refiere a la variable del numerador y el df2 a los grados de
libertad de la variable del denominador df2. Luego el script calcula las distribuciones
de la relacin F. Ejecute el programa para los grados de libertad indicados abajo con
100 rplicas del experimento.
SCRIPT

# Taller 10
# Luis Jurado

#1 Probabilidades
#a probabilidad de que x> 0.1, 1, 2.5
1-pnorm(0.1)
1-pnorm(1)
1-pnorm(2.5)

#b
1-pnorm(42,mean=35,sd=6)
x=c(10:60)
Fx=pnorm(x,mean=35,sd=6)
fx=dnorm(x,mean=35,sd=6)
plot(x,fx,"l")

#2
qnorm(0.025)
qnorm(0.975)

qnorm(0.005)
qnorm(0.995)

qnorm(0.0025)
qnorm(0.9975)

qnorm(0.0005)
qnorm(0.9995)

#3
qnorm(0.975)
qnorm(0.025)

#4
qnorm(0.9,mean=1000,sd=100)

#5
qnorm(0.025)
qnorm(0.01)
qnorm(0.005)

#6 n=31, p=0.447
x=c(1:31)
y=dbinom(x,size=31,prob=0.447)
plot(x,y,type="h",main="Distribucin x de estudiantes",xlab="x",ylab="f(x)")
#prob x=17
dbinom(17,size=31,prob=0.447)

#prob x<13
pbinom(13,size=31,prob=0.447)

#prob 16<x<19
x1=pbinom(16,size=31,prob=0.447)
x2=pbinom(19,size=31,prob=0.447)
x2-x1

#7
x=rnorm(1000)
y=dnorm(x)
plot(x,y,main="Funcin de distribucin normal standard",xlab="x",ylab="f(x)")
hist(x)

#8
a=rnorm(1000)
b=rnorm(1000)
c=rnorm(1000)
chi.sq.3=a^2 + b^2 + c^2
hist(chi.sq.3)

#9
scaled.chi.sq.3=(chi.sq.3)/3

normal.d=rnorm(n=1000)
t.3=normal.d/sqrt(scaled.chi.sq.3)

hist(t.3)

#10
chi.sq.20=rchisq(1000,20)
scaled.chi.sq.20=chi.sq.20/20
F.3.20=scaled.chi.sq.3/scaled.chi.sq.20
hist(F.3.20)

#12
x=c(-4,-3.5,-3,-2.5,-2,-1.5,-1,-0.5,0,0.5,1,1.5,2,2.5,3,3.5)
freq.t=c(0.007,0.006,0.014,0.025,0.041,0.086,0.131,0.180,0.179,0.123,0.084,
0.056,0.027,0.016,0.008,0.005)
freq.z=c(0.001,0.000,0.003,0.019,0.043,0.101,0.144,0.184,0.2,0.127,0.1,0.051,
0.018,0.007,0.001,0.000)
plot(x,freq.t,type="l")
plot(x,freq.z,type="p")