Documentos de Académico
Documentos de Profesional
Documentos de Cultura
10 * 55 #directorio de trabajo
5-1 getwd()
x <- 25 setwd("C:\\Users\\USUARIO\\Documents\\bioestadistic
a UN 2022")
print(x)
a. Calcule la suma entre los números 123 y 567, y
y <- 10
guarde el resultado en un objeto con nombre
print(y) “hola”.
b. Se sabe que una aeronave pequeña puede
w <- x*y
cargar como máximo un total de 1500 Kg. A
w/5 continuación, se muestra una lista con los pesos
# operaciones con objetos de tipo vector (Kg) de las personas que pretenden viajar juntas
en dicha aeronave:
a<-c(1,3,5,6,7) 23, 41, 65, 76, 89, 36, 44, 78, 56, 89, 25, 64, 69,
b<-10:14 76, 82, 34, 67, 90, 82, 71, 45, 91, 56, 67, 78, 60,
52.
# ¿cuántos elementos tiene un objeto de tipo vector?
¿Es viable que puedan hacerlo?. Conteste la
length(a) pregunta utilizando una función de R.
length(b)
c. Escriba la instrucción que utilizó para cambiar el
directorio de trabajo a una carpeta de su
a+b computador.
a*b d. Defina el vector x<-10:15, en el objeto “y”
guarde el resultado de multiplicar por 2 cada
# instalación de paquetes
una de las entradas de x.
library() e. Utilice la ayuda de R para describir qué hace la
función “table”.
install.packages("descr")
#ejercicios introducción a R, semana 2
library(descr)
#ejercicio a
#funciones
"hola"<- 123+567
x <- c(20, 21, 23, 19, 18)
#ejercicio b
mean(x)
p<- 1500
v<-c(23, 41, 65, 76, 89, 36, 44, 78, 56, 89, 25, 64, 69, 76, Clase F. Absoluta F. Relativa F.Abs.Acumulada F. Rel.
82, 34, 67, 90, 82, 71, 45, 91, 56, 67, 78, 60, 52) Acumulada
5 8 21−22 21.5 83
Total 200
22−23 22.5 37
# número de hermanos
y <- c(0, 1, 2, 3, 4, 5) 23−24 23.5 4
# frecuencia absoluta
nj <- c(38, 67, 44, 32, 11, 8) # limite inferior de los intervalos
# tamaño de la muestra li <- 15:23
sum(nj) # limite superior de los intervalos
## [1] 200 ls <- 16:24
# marca de clase
# frecuencia relativa yj <- (li+ls)/2
hj <- nj/sum(nj) print(yj)
print(hj)
## [1] 15.5 16.5 17.5 18.5 19.5 20.5 21.5
## [1] 0.190 0.335 0.220 0.160 0.055 0.040 22.5 23.5
# promedio # numero de intervalos
sum(nj*y)/sum(nj) length(yj)
## [1] 1.675 ## [1] 9
# otra manera # frecuencia absoluta
sum(hj*y) nj <- c(2, 5, 29, 76, 118, 96, 83, 37, 4)
# tamaño de la muestra
## [1] 1.675 sum(nj)
## [1] 450
# frecuencia relativa
hj <- nj/sum(nj)
print(hj)
## [1] 0.004444444 0.011111111 0.064444444
0.168888889 0.262222222 0.213333333
## [7] 0.184444444 0.082222222 0.008888889 ## [1] 21.15
# media # otra manera
sum(nj*yj)/sum(nj) quantile(x, probs = 0.5)
## [1] 20.01556 ## 50%
# otra manera ## 21.15
sum(hj*yj)
## [1] 20.01556 el 50% de los IMCs son menores (mayores) o iguales
que 7.7.
Las calificaciones de un estudiante están conformadas Los datos de la siguiente tabla corresponden al
de acuerdo con la información que se presenta en la número de hijos de una muestra de empleados de una
siguiente tabla. Calcular la calificación promedio del empresa. Calcular e interpretar la mediana.
estudiante.
## [1] 19.95763
# en este caso no se debe utilizar las fun
ciones median y quantile dado que los
# datos estan agrupados en una tabla
eniendo en cuenta los datos del Ejemplo 1, calcular e ## [1] 50
interpretar el rango intercuartílico para cada hospital. mean(x_2)
## 1.7
Teniendo en cuenta los datos del Ejemplo 1,
diff(quantile(x = x_2, probs = c(0.25, 0.7 estandarizar las observaciones de cada hospital.
5)))
Comentar los resultados obtenidos.
## 75%
## 3.35 # datos empresa 1
x_1 <- c(34.5, 30.7, 32.9, 36.0, 34.1, 34.
0, 32.3)
Se tienen los siguientes conjuntos de datos: # datos empresa 2
x_2 <- c(34.0, 27.5, 31.6, 39.7, 35.3, 34.
Conjunto de datos I: 50, 50, 50, 50 , 50 7, 31.7)
# promedio y desviacion estandar empresa 1
Conjunto de datos II: 45, 50, 55, 47 , 53 m_1 <- mean(x_1)
s_1 <- sd(x_1)
Conjunto de datos III: 3, 97, 10, 105, 35 print(m_1)
#Desviación estándar
sdt<-sqrt(var(c_aerobica$peso))
sdt
#Coeficiente de variación
cvt<-sqrt(var(c_aerobica$peso))/mean(c_aer
obica$peso)*100
cvt
#Rango intercuartílico
ri<-quantile(c_aerobica$peso,0.75)-quantil
e(c_aerobica$peso,0.25)
names(ri)<-"RIC"
ri
Medidas descriptivas para dos variables Total 34.8% 34.8% 30.4% 100.0%
Hombre 4 9 12 25
Mujer 12 7 2 21
Total 16 16 14 46
# datos
tabla <- rbind(c(4, 9, 12), c(12, 7, 2))
rownames(tabla) <- c("Hombre","Mujer")
colnames(tabla) <- c("Bachillerato","Pregr
ado","Posgrado")
print(tabla)
Elaborar los perfiles fila y los perfiles columna de la ## Hombre 25 56.25 85.71429
muestra para la tabla bidimensional del ejemplo ## Mujer 75 43.75 14.28571
anterior.
## Sum 100 100.00 100.00000
Los perfiles fila y los perfiles columna de la muestra
se las siguientes tablas. Las frecuencias relativas de # perfiles fila
pf <- 100*prop.table(x = tabla, margin = 1
estas tablas se calcularon con las fórmulas
)
hij|i∙=nijni∙yhij|∙j=nijn∙jhij|i∙=nijni∙yhij|∙j=nijn∙j # perfiles columna
pc <-100*prop.table(x = tabla, margin = 2)
para i=1,2i=1,2 y j=1,2,3j=1,2,3. # diagrama de barras perfiles fila
barplot(height = t(pf), ylim = c(0,120), l
Por ejemplo, se observa que de los hombres, tiene
egend.text = TRUE,
posgrado el 48.0%, mientras que de los individuos args.legend = list(x = "top", bty
con posgrado, es hombre el 85.7%. Al interpretar las = "n", ncol = 3),
frecuencias relativas de los perfiles es indispensable main = "Perfil fila", xlab = "Sexo
fijarse cuál es el grupo de individuos de referencia. ", ylab = "Porcentaje (%)")
# diagrama de barras perfiles columna
Perfiles fila: barplot(height = pc, beside = FALSE, las =
1, ylim = c(0, 120),
X/Y Bachillerato Pregrado Posgrado legend.text = TRUE, args.legend =
Total list(x = "top", bty = "n", ncol = 2),
main = "Perfil columna", xlab = "N
Hombre 16.0% 36.0% 48.0% 100.0% ivel educativo", ylab = "Porcentaje (%)")
Hombre 25.0% 56.3% 85.7% 54.3% Edad: 12.3, 13.2, 12.5, 13.1, 12.9, 13.1, 12.4, 12.9, 13.2,
12.3, 12.4, 13.0, 12.5, 12.6, 12.8, 12.9, 12.5, 13.1, 13.0,
Mujer 75.0% 43.8% 14.3% 45.7% 12.7, 12.2, 13.3, 12.4, 12.3, 12.6
Total 100.0% 100.0% 100.0% 100.0% Peso: 39.5, 41.0, 39.7, 40.8, 40.7, 41.3, 39.2, 40.4, 41.2,
38.8, 39.4, 40.2, 39.7, 39.8, 40.0, 40.3, 39.6, 41.1, 41.3,
# datos 40.3, 39.4, 41.1, 39.9, 39.6, 40.2
tabla <- rbind(c(4, 9, 12), c(12, 7, 2))
rownames(tabla) <- c("Hombre","Mujer") En la siguiente figura se muestra el diagrama de
colnames(tabla) <- c("Bachillerato","Pregr
ado","Posgrado") dispersión del peso frente a la temperatura de los
# perfiles fila materiales. Se observa que la relación entre las
addmargins(A = 100*prop.table(x = tabla, m variables es directa y aparentemente fuerte.
argin = 1), margin = 2)
## Bachillerato Pregrado Posgrado S # datos
um edad <- c(12.3, 13.2, 12.5, 13.1, 12.9, 13
.1, 12.4, 12.9, 13.2, 12.3, 12.4, 13.0, 12
## Hombre 16.00000 36.00000 48.00000 1 .5,
00 12.6, 12.8, 12.9, 12.5, 13.1, 13
## Mujer 57.14286 33.33333 9.52381 1 .0, 12.7, 12.2, 13.3, 12.4, 12.3, 12.6)
00 peso <- c(39.5, 41.0, 39.7, 40.8, 40.7, 41
.3, 39.2, 40.4, 41.2, 38.8, 39.4, 40.2, 39
# perfiles columna .7,
addmargins(A = 100*prop.table(x = tabla, m 39.8, 40.0, 40.3, 39.6, 41.1, 41
argin = 2), margin = 1) .3, 40.3, 39.4, 41.1, 39.9, 39.6, 40.2)
# dispersograma
## Bachillerato Pregrado Posgrado plot(x = edad, y = peso)
Calcular e interpretar la covarianza entre el peso y la 12.6, 12.8, 12.9, 12.5, 13.1, 13
.0, 12.7, 12.2, 13.3, 12.4, 12.3, 12.6)
edad con el conjunto de datos bivariado del ejemplo
peso <- c(39.5, 41.0, 39.7, 40.8, 40.7, 41
anterior. .3, 39.2, 40.4, 41.2, 38.8, 39.4, 40.2, 39
.7,
Para obtener la covarianza entre la edad y el peso, 39.8, 40.0, 40.3, 39.6, 41.1, 41
primero se deben calcular los promedios de estas .3, 40.3, 39.4, 41.1, 39.9, 39.6, 40.2)
variables. En este caso se tiene # desviaciones estandar
sd(edad)
que x¯=12.728x¯=12.728 y y¯=40.180y¯=40.180. Luego
de calcular los respectivos promedios, se procede a ## [1] 0.3397548
calcular las diferencias y los productos, de tal forma sd(peso)
que la covarianza entre la temperatura y el peso es
## [1] 0.7239936
Dado que la covarianza entre la edad y el peso es # coeficiente de correlacion
positiva, entonces la relación entre las dos variables cor(edad, peso)
es directa, como se aprecia en la Figura. Las unidades
de la covarianza son unidades mixtas que en este ## [1] 0.9204667
caso corresponden a años ×× kilogramo. # otra forma
cov(edad, peso)/(sd(edad)*sd(peso))
# datos
edad <- c(12.3, 13.2, 12.5, 13.1, 12.9, 13 ## [1] 0.9204667
.1, 12.4, 12.9, 13.2, 12.3, 12.4, 13.0, 12
.5,
12.6, 12.8, 12.9, 12.5, 13.1, 13
.0, 12.7, 12.2, 13.3, 12.4, 12.3, 12.6)
peso <- c(39.5, 41.0, 39.7, 40.8, 40.7, 41
.3, 39.2, 40.4, 41.2, 38.8, 39.4, 40.2, 39
.7,
39.8, 40.0, 40.3, 39.6, 41.1, 41
.3, 40.3, 39.4, 41.1, 39.9, 39.6, 40.2)
# promedios
mean(edad)
## [1] 12.728
mean(peso)
## [1] 40.18
# covarianza
cov(edad, peso)
## [1] 0.2264167
# otra manera
n <- length(edad)
sum((edad - mean(edad))*(peso-mean(peso)))
/(n-1)
## [1] 0.2264167
# datos
edad <- c(12.3, 13.2, 12.5, 13.1, 12.9, 13
.1, 12.4, 12.9, 13.2, 12.3, 12.4, 13.0, 12
.5,
## [4,] 1 1 4
Guía Parcial numero 2
## [5,] 1 1 5
Probabilidad ## [6,] 1 2 1
dim(lista)
conteo
## [1] 125 3
1. ¿De cuantás maneras se puede ordenar la
secuencia ATGC? 3. ¿De cuántas formas se pueden seleccionar 3
personas en un grupo de 20?
P44=4!0!=24P44=4!0!=24
(203)=20!3!17!=1140(203)=20!3!17!=114
# permutacion 0
factorial(4)/factorial(0)
## [1] 24 # combinación
choose(n = 20, k = 3)
# lista de posibilidades
library(gtools) ## [1] 1140
lista <- permutations(n = 4, r = 4, v = c(
# otra manera
"A", "T", "G", "C"))
factorial(20)/(factorial(3)*factorial(17))
head(lista)
## [1] 1140
## [,1] [,2] [,3] [,4]
# lista de posibilidades
## [1,] "A" "C" "G" "T"
lista <- combinations(n = 20, r = 3, v = 1
## [2,] "A" "C" "T" "G" :20)
head(lista)
## [3,] "A" "G" "C" "T"
## [,1] [,2] [,3]
## [4,] "A" "G" "T" "C"
## [1,] 1 2 3
## [5,] "A" "T" "C" "G"
## [2,] 1 2 4
## [6,] "A" "T" "G" "C"
## [3,] 1 2 5
dim(lista )
## [4,] 1 2 6
## [1] 24 4
## [5,] 1 2 7
## [6,] 1 2 8
2. ¿Cuántas posibles claves de 3 dígitos se
pueden obtener con los números de 1 a 5? dim(lista)
## [1] 1140 3
53=12553=125
# valores de la variable ## x fx
x <- 0:3 ## [1,] 2 0.02777778
# f.m.p.
fx <- c(1, 3, 3, 1)/8 ## [2,] 3 0.05555556
# gráfico
plot(x = x, y = fx, xlab = "x", ylab = "f( ## [3,] 4 0.08333333
x)", pch = 15, col = "blue") ## [4,] 5 0.11111111
segments(x0 = x, y0 = 0, x1 = x, y1 = fx,
lwd = 2, col = "blue") ## [5,] 6 0.13888889
## [6,] 7 0.16666667
Dada XX: suma del lanzamiento de dos dados. Se
## [7,] 8 0.13888889
sabe que su f.m.p está dada por:
fX(x)=6−|7−x|36, x=2,3,...,12fX(x)=6−|7−x|36, x=2,3, ## [8,] 9 0.11111111
...,12
## [9,] 10 0.08333333
Calcular: ## [10,] 11 0.05555556
1. P(X=3)=6−|7−3|36=236P(X=3)=6−|7−3|36=236
## [11,] 12 0.02777778
f<-function(x) (6-abs(7-x))/36
f(3) #Función de probabilidad
plot(x = x, y = fx, xlab = "x", ylab = "f(
## [1] 0.05555556 x)", pch = 15, col = "blue")
segments(x0 = x, y0 = 0, x1 = x, y1 = fx,
lwd = 2, col = "blue")
2. P(X≤4.5)=P(X≤4)=P(X=2 o X=3 o X=4)=f
X(2)+fX(3)+fX(4)=136+236+336=16P(X≤4.5) Función de distribución
=P(X≤4)=P(X=2 o X=3 o X=4)=fX(2)+fX(3)+
fX(4)=136+236+336=16
El gráfico de FX está dado por:
f(2)+f(3)+f(4) # valores de la variable
## [1] 0.1666667 x <- 0:3
# f.m.p.
fx <- c(1, 3, 3, 1)/8
# f.d.a.
3. P(3≤X≤6)=fX(3)+fX(4)+fX(5)+fX(6)P(3≤X
Fx <- cumsum(fx)
≤6)=fX(3)+fX(4)+fX(5)+fX(6) plot(x = c(0, x), y = c(0, Fx), type = "s"
, xlab = "x", ylab = "F(x)", col = "blue",
lwd = 2)
f(3)+f(4)+f(5)+f(6)
points(x, Fx, col = "blue", pch = 15)
## [1] 0.3888889
3. P(3≤X<6)=fX(3)+fX(4)+fX(5)P(3≤X<6)=fX(
3)+fX(4)+fX(5)
f(3)+f(4)+f(5)
## [1] 0.25
Además, se pide calcular la probabilidad de que por lo Un equipo de trabajo establecido por el Ministerio de
menos nueve de las 10 personas que toman el Medio Ambiente, programó visitas a dos fábricas para
medicamento se recuperen, esto investigar posibles violaciones a los reglamentos para
es, Pr(X≥9)Pr(X≥9). Así, el control de contaminación ambiental. Sin embargo,
Pr(X≥9)=Pr(X=9;X=10)=Pr(X=9)+Pr(X=10)=(1 los recortes presupuestales han reducido
drásticamente el tamaño del equipo de trabajo por lo
09)(0.3)9(0.7)10−9+(1010)(0.3)10(0.7)10−10=0.0 que solamente se podrán investigar cinco de las 25
00144.Pr(X≥9)=Pr(X=9;X=10)=Pr(X=9)+Pr(X=10)=(10 fábricas. Si se sabe que 10 de las fábricas están
9)(0.3)9(0.7)10−9+(1010)(0.3)10(0.7)10−10=0.000144. operando sin cumplir los reglamentos, calcular la
De otra parte, se observa que: probabilidad de que al menos una de las fábricas
muestreadas esté operando en contra del reglamento.
• E[X]=10(0.3)=3E[X]=10(0.3)=3. Este valor Se define la v.a. XX como el “número de fábricas en
indica que se espera la recuperación de 3 la muestra seleccionada que operan sin cumplir los
enfermos de una muestra aleatoria de 10 reglamentos”; de acuerdo con las características del
pacientes. problema se supone que el muestreo se hace sin
• V[X]=10(0.3)(0.7)=2.1V[X]=10(0.3)(0.7)= reemplazo y por lo tanto se sigue
2.1. que X∼H(5,10,25)X∼H(5,10,25). Así, la
probabilidad pedida es
En la siguiente figura se presenta el gráfico de la Pr(X≥1)=∑i=15Pr(X=i)=1−Pr(X=0)=1−(100)(155)
f.m.p. y de la f.d.a. de una variable con distribución (255)=0.9434.Pr(X≥1)=∑i=15Pr(X=i)=1−Pr(X=0)=1−(1
binomial con parámetros n=10n=10 y π=0.3π=0.3. 00)(155)(255)=0.9434.
# parametros
En consecuencia, la probabilidad de que al menos
p <- 0.3
n <- 10 una de las fábricas muestreadas esté operando en
x <- 0:n contra al reglamento es 0.9434.
# P(X >= 9)
# parametros
sum(dbinom(x = c(9, 10), size = n, prob =
n <- 5
p))
M <- 10
## [1] 0.0001436859 N <- 25
# P(X >= 1)
# valor esperado # la parametrizacion de esta rutina es dif
n*p erente a la presentada en la formula
sum(dhyper(x = 1:5, m = M, n = N-M, k = n) que X∼Pois(5)X∼Pois(5), por lo que la f.m.p
)
de XX es
## [1] 0.9434783 fX(x;5)={e−55xx!,0,si x=0,1,2,…;en otro
# otra manera caso.fX(x;5)={e−55xx!,si x=0,1,2,…;0,en otro caso.
1 - dhyper(x = 0, m = M, n = N-M, k = n)
Se pide calcular
## [1] 0.9434783
Pr(X≤3)=Pr(X=0;X=1;X=2;X=3)=Pr(X=0)+Pr(X
La siguiente figura presenta el gráfico de la f.m.p. y =1)+Pr(X=2)+Pr(X=3)=e−5500!+e−5511!+e−5522
de la f.d.a. de una variable con distribución !+e−5533!=0.2650.Pr(X≤3)=Pr(X=0;X=1;X=2;X=3)=Pr
hipergeométrica con (X=0)+Pr(X=1)+Pr(X=2)+Pr(X=3)=e−5500!+e−5511!+e−
parámetros n=5n=5, M=10M=10 y N=25N=25. 5522!+e−5533!=0.2650.
1. Se dice que una persona está controlada si su 4. Grafique las funciones de densidad y de
niveles están por debajo de 100 mg/100 ml. distribución
¿Cuál es la probabilidad de que un paciente
diabético se encuentre controlado?
# parámetros
mu <- 106
En primer lugar, la v.a.c X:“nivel de glucosa en sangre sigma <- 8
en ayunas (mg/100 ml)”, tiene par(mfrow=c(1,2))
distribución N(100,64)N(100,64), adicionalmente, curve(expr = dnorm(x,mean=mu,sd=sigma), fr
nos preguntan: om = 76, to = 136, xlab = "x", ylab = "f(x
)", col = "blue", lwd = 2)
P(X<100)=FX(100)=0.2266P(X<100)=FX(100)=0. curve(expr = pnorm(x,mean=mu,sd=sigma), fr
2266 om = 76, to = 136, xlab = "x", ylab = "f(x
# parámetros )", col = "blue", lwd = 2)
mu <- 106
sigma <- 8 Distribución normal estándar
#P(X<100)
pnorm(q=100,mean=mu,sd=sigma) Estandarización
## [1] 0.2266274
Conteste las preguntas del ejemplo anterior, haciendo
uso de la estandarización.
2. ¿Qué porcentaje de diabéticos tienen niveles
de glucosa comprendidos entre 95 mg/100 1. Se dice que una persona está controlada si su
mly 125 mg/100 ml? niveles están por debajo de 100 mg/100 ml.
¿Cuál es la probabilidad de que un paciente
P(95<X<125)=FX(125)−FX(95)=0.9067P(95<X< diabético se encuentre controlado?
125)=FX(125)−FX(95)=0.9067 Es decir que
el 90.67%90.67% de los pacientes tienen un nivel Sabemos que N(106,64)N(106,64), por lo
de glucosa en ayunas entre 95 mg/100 mly 125 tanto Z=X−1068∼N(0,1)Z=X−1068∼N(0,1), nos
mg/100 ml. preguntan:
# parámetros
P(X<100)=P(Z<100−1068)=Φ(−0.75)=0.2266P(X
mu <- 106 <100)=P(Z<100−1068)=Φ(−0.75)=0.2266
sigma <- 8 # parámetros
#P(95<X<125) mu <- 106
pnorm(q=125,mean=mu,sd=sigma)-pnorm(q=95,m sigma <- 8
ean=mu,sd=sigma) #P(X<450)
## [1] 0.9066598 pnorm(q=(100-mu)/sigma)
## [1] 0.2266274
Así, π0.75=z0.75∗8+106=111.3959π0.75=z0.75∗8+
106=111.3959
Es decir que el 75% de los pacientes tienen niveles de
glucosa en ayunas de 111.3959 mg/100 ml o menos.
# parámetros
mu <- 106
sigma <- 8
#percentil 75 de la normal estándar
z75<-qnorm(p=0.75)
#percentil 75 del volumen de llenado
x75<-z75*sigma+mu
print(x75)
## [1] 111.3959
1. Sea Ω={0,1,2,3,4,5,6,7,8,9}Ω={0,1,2,3, una permutación sin repetición, y por lo tanto
4,5,6,7,8,9} el espacio muestral la cantidad pedida es:
correspondiente a un experimento
aleatorio dado y 6∗P66=6∗6!(6−6)!=4320.6∗P66=6∗6!(6−6)
!=4320.
A={0,1,2,3},B={4,5,6,7},C={2,4,6},D={
1,8,9}.A={0,1,2,3},B={4,5,6,7},C={2,4, 6*factorial(6)
6},D={1,8,9}.
## [1] 4320
eventos incluidos en ΩΩ. Listar los elementos de
los conjuntos que corresponden a los 4. Una caja contiene siete fichas rojas, seis
siguientes eventos: blancas y cuatro azules. ¿Cuántas selecciones
de tres fichas se pueden formar si:
a. (AC∪D)C={1,4,5,6,7,8,9}C={0,2,3}(AC∪D)C
={1,4,5,6,7,8,9}C={0,2,3}. a. las tres deben ser rojas? El número total de
b. B∩CC={4,5,6,7}∩{0,1,3,5,7,8,9}={5,7}B∩C fichas es 7+6+4=177+6+4=17. Aplicando el
C={4,5,6,7}∩{0,1,3,5,7,8,9}={5,7} . principio fundamental del conteo junto con
c. (DC∩A)C∪C=D∪AC∪C={1,8,9}∪{4,5,6,7,8, combinaciones, se tiene que la cantidad
9}∪{2,4,6}={1,2,4,5,6,7,8,9}(DC∩A)C∪C=D pedida es:
∪AC∪C={1,8,9}∪{4,5,6,7,8,9}∪{2,4,6}={1,2,
4,5,6,7,8,9}. (73)∗(60)∗(40)=35(73)∗(60)∗(40)=35
d. (ΩC∩B)C=Ω∪BC=Ω={0,1,2,3,4,5,6,7,8,9}(
ΩC∩B)C=Ω∪BC=Ω={0,1,2,3,4,5,6,7,8,9}.
choose(7,3)
e. B∩C∩DC={4,5,6,7}∩{2,4,6}∩{0,2,3,4,5,6,
7}={4,6}B∩C∩DC={4,5,6,7}∩{2,4,6}∩{0,2,3 ## [1] 35
,4,5,6,7}={4,6}.
Observe que (60)=(40)=1(60)=(40)=1.
2. Los estudiantes de un curso de estadística se
clasifican como estudiantes de administración, b. ninguna puede ser blanca? Usando la misma
economía o ingeniería; como repitente o no metodología, se tiene que la cantidad pedida
repitente y también como hombre o mujer. es:
Encuentre el número total de clasificaciones
posibles para los estudiantes de este curso. (73)∗(60)∗(40)+(72)∗(60)∗(41)+(71)∗(
60)∗(42)+(70)∗(60)∗(43)=165(73)∗(60)∗
Aplicando directamente el principio fundamental del
(40)+(72)∗(60)∗(41)+(71)∗(60)∗(42)+(70)∗(6
conteo, el número total de clasificaciones es:
0)∗(43)=165
3∗2∗2=12.3∗2∗2=12.
3. Siete personas se quieren organizar en una fila. a. choose(7,3) + choose(7,2)*choose(4,1) + ch
oose(7,1)*choose(4,2) + choose(4,3)
¿De cuántas maneras diferentes pueden hacerlo?
Este es un caso de una permutación sin repetición, y ## [1] 165
por lo tanto la cantidad pedida es:
P77=7!(7−7)!=5040.P77=7!(7−7)!=5040. c. las tres deben ser del mismo color? Usando la
misma metodología, se tiene que la cantidad
factorial(7) pedida es:
## [1] 5040
(73)∗(60)∗(40)+(70)∗(63)∗(40)+(70)∗(
60)∗(43)=59.(73)∗(60)∗(40)+(70)∗(63)∗(40
b. ¿De cuántas maneras diferentes pueden )+(70)∗(60)∗(43)=59.
hacerlo si una de ellas no debe estar al
comienzo de la fila? En este caso se aplica el
principio fundamental del conteo junto con choose(7,3) + choose(6,3) + choose(4,3)
## [1] 59 b. Graficar fX(x)fX(x) y FX(x)FX(x).
d. las tres son de colores diferentes? Usando la A continuación se presentan los gráficos
misma metodología, se tiene que la cantidad correspondientes:
pedida es:
# recorrido de X
x <- 0:6
(71)∗(61)∗(41)=168.(71)∗(61)∗(41)=168. # f.m.p.
fx <- c(0.06,0.13,0.20,0.28,0.25,0.05,0.03
1. choose(7,1)*choose(6,1)*choose(4,1) )
Un investigador evalúa habitualmente el # f.d.a.
proceso reproductivo de una especie Fx <- cumsum(fx)
# gráficos
canina determinada. Sea XX el número par(mfrow = c(1,2))
de crías con sobrepeso en un grupo de # f.m.p
animales seleccionado al azar. Se sabe plot(x = x, y = fx, xlab = "x", ylab = "f(
que la función de distribución x)", pch = 16, col = "blue", main="Función
acumulada de XX es: de masa")
segments(x0 = x, y0 = 0, x1 = x, y1 = fx,
lwd = 2, col = "blue")
FX(x)=⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪ # f.d.a.
⎪⎪⎪⎪0.00,x<0;0.06,0≤x<1;0.19,1≤x<2;0 plot(x = c(0, x), y = c(0, Fx), type = "s"
.39,2≤x<3;0.67,3≤x<4;0.92,4≤x<5;0.97,5 , xlab = "x", ylab = "F(x)", col = "blue",
lwd = 2, main="Función de Distribución")
≤x<6;1.00,6≤x;FX(x)={0.00,x<0;0.06,0≤x< points(x, Fx, col = "blue", pch = 16)
1;0.19,1≤x<2;0.39,2≤x<3;0.67,3≤x<4;0.92,
4≤x<5;0.97,5≤x<6;1.00,6≤x;
El recorrido de XX es {0,1,2,3,4,5,6}{0,1,2,3,4,5,6}.
Además, teniendo en cuenta
que fX(x)=FX(x)−FX(x−)fX(x)=FX(x)−FX(x−),
donde x−x− es el valor de la variable inmediatamente
anterior a xx, se tiene que
fX(0)fX(1)fX(2)fX(3)fX(4)fX(5)fX(6)=FX(0)=0.06=
FX(1)−FX(0)=0.19−0.06=0.13=FX(2)−FX(1)=0.3
9−0.19=0.20=FX(3)−FX(2)=0.67−0.39=0.28=FX(
4)−FX(3)=0.92−0.67=0.25=FX(5)−FX(4)=0.97−0
.92=0.05=FX(6)−FX(5)=1.00−0.97=0.03fX(0)=FX
(0)=0.06fX(1)=FX(1)−FX(0)=0.19−0.06=0.13fX(2)=FX(2)
−FX(1)=0.39−0.19=0.20fX(3)=FX(3)−FX(2)=0.67−0.39=0
.28fX(4)=FX(4)−FX(3)=0.92−0.67=0.25fX(5)=FX(5)−FX(
4)=0.97−0.92=0.05fX(6)=FX(6)−FX(5)=1.00−0.97=0.03
Observe que,
∑kfX(xk)=fX(0)+fX(1)+…+fX(6)=0.06+0.13+…+0.
03=1∑kfX(xk)=fX(0)+fX(1)+…+fX(6)=0.06+0.13+…+0.
03=1
# f.m.p
fx <- c(0.06,0.13,0.20,0.28,0.25,0.05,0.03
)
sum(fx)
## [1] 1
c. Calcular e xk2fX(xk)=02∗fX(0)+12∗fX(1)+…+62∗fX(6)=02∗0.06+12
interpretar P(X=2)P(X=2), P(X>3)P(X>3), P ∗0.13+…+62∗0.03=9.78
(2≤X≤5)P(2≤X≤5). Por lo tanto, la varianza de XX es
σ2X=E(X2)−(E(X))2=9.78−2.82=1.94.σX2=E(X2)−(
P(X=2)=fX(2)=FX(2)−FX(1)=0.39−0.19=0.20P(X E(X))2=9.78−2.82=1.94.
=2)=fX(2)=FX(2)−FX(1)=0.39−0.19=0.20
Así, el coeficiente de variación de XX está dado por
- Luego, la probabilidad de que el número de crías
CV(X)=100∗σ2X−−−√μX=49.74%CV(X)=100∗σX2μ
con sobrepeso en un grupo de animales X=49.74%
seleccionado al azar sea igual a 2 crías es de 0.20.
P(X>3)=1−Pr(X≤3)=1−FX(3)=1−0.67=0.33P(X> Como el coeficiente de variación de XX es 49.74%,
3)=1−Pr(X≤3)=1−FX(3)=1−0.67=0.33 entonces la variabilidad del número de defectos
importantes es alta respecto al valor esperado.
- Así, la probabilidad de que el número de crías con
sobrepeso en un grupo de animales seleccionado al # recorrido de X
azar sea mayor que 3 crías es de 0.33. x <- 0:6
# f.m.p.
P(2≤X≤5)=FX(5)−FX(1)=0.97−0.19=0.78P(2≤X≤5 fx <- c(0.06,0.13,0.20,0.28,0.25,0.05,0.03
)=FX(5)−FX(1)=0.97−0.19=0.78 )
# valor esperado
- Por lo tanto, la probabilidad de que el número de EX <- sum(x*fx)
crías con sobrepeso en un grupo de animales EX
seleccionado al azar sea mayor o igual que 2 crías, y
## [1] 2.8
menor o igual que 5 crías es de 0.78.
# valor esperado de X^2
EX2 <- sum(x^2*fx)
d. Calcular e interpretar el valor esperado de XX.
EX2
# recorrido de X
# f.m.p. 6*7^2
f <- function(x) x^2*(3/8)*(7-x)^2
integrate(f, lower = 5, upper = 7) ## [1] 294
## [1] 168
(54)∗(30)(84)=7.14%.(54)∗(30)(84)=7.14%.
choose(5,4)/choose(8,4)
por lo tanto, la tasa esperada de accidentes
es λ=−ln(0.0821)=2.499817λ=−ln(0.0821)=2.499
817 por semana.
Así, la probabilidad de que, en una semana
1. Si los niños y las niñas tienen la misma seleccionada al azar, se presenten por lo menos dos
probabilidad de nacer, ¿a qué es igual la accidentes de trabajo es:
probabilidad de que en una familia con
tres hijos, exactamente uno sea niña? P(X≥2)=1−P(X≤1)=1−FX(1)=0.712665.P(X≥2)=1
¿Cuál es el número esperado de niñas −P(X≤1)=1−FX(1)=0.712665.
que tendría una familia con tres hijos?
# lambda
Sea XX la v.a. que representa el número de niñas en lambda <- -log(0.0821)
una familia con tres hijos. Dadas las condiciones de la lambda
variable, se tiene que X∼Bin(n,π)X∼Bin(n,π), ## [1] 2.499817
donde n=3n=3 y π=0.5π=0.5; la probabilidad de # Pr(X >= 2)
éxito es 0.5 dado que los niños y las niñas tienen la 1 - ppois(q = 1, lambda = lambda)
misma probabilidad de nacer.
## [1] 0.712665
a. ¿A qué es igual la probabilidad de que en una
familia con tres hijos, exactamente uno sea 3. Se estima que el porcentaje de adultos entre
niña? 40 y 50 años que tienen hipertensión es del
26%. Si se selecciona una muestra aleatoria
P(X=1)=fX(1)=(31)(0.5)1(0.5)2=0.375P(X de 15 personas con edades entre 40 y 50
=1)=fX(1)=(31)(0.5)1(0.5)2=0.375 años, calcule la probabilidad de que:
dbinom(x = 1, size = 3, prob = 0.5) Sea XX la v.a. que representa el número de personas
de una muestra aleatoria de 15 personas con edades
## [1] 0.375 entre 40 y 50 años que tienen hipertensión. Dado que
la probabilidad de éxito (tener hipertensión) se
mantiene constante (esto puede suceder cuando la
b. ¿Cuál es el número esperado de niñas que
muestra se toma con reemplazo o cuando se toma sin
tendría una familia con tres hijos?
reemplazo cuando n<<Nn<<N, donde NN es el
tamaño de la población), se tiene
E(X)=3∗0.5=1.5E(X)=3∗0.5=1.5
que X∼Bin(n,π)X∼Bin(n,π),
con n=15n=15 y π=0.26π=0.26.
2. Sea XX la variable aleatoria que representa el
número de accidentes de trabajo en una
semana en una fábrica. Si para ella se sabe a. Exactamente 3 tengan hipertensión.
que P(X=0)=0.0821P(X=0)=0.0821, calcule
la probabilidad de que, en una semana P(X=3)=fX(3)=(153)(0.26)3(0.74)12=0.2
seleccionada al azar, se presenten por lo 156314P(X=3)=fX(3)=(153)(0.26)3(0.74)12
menos dos accidentes de trabajo. =0.2156314
En este caso la v.a. XX se puede modelar mediante la b. Tres o más tengan hipertensión.
distribución Poisson con parámetro λλ, dado
que XX da cuenta del número de éxitos (accidentes P(X≥3)=1−P(X≤2)=1−FX(2)=0.789861P(
de trabajos) en una unidad de tiempo bien definida, X≥3)=1−P(X≤2)=1−FX(2)=0.789861
en este caso, por semana. Dado
que P(X=0)=0.0821P(X=0)=0.0821, se tiene que c. Entre 4 y 7, inclusive, tengan hipertensión.
P(X=0)=e−λλ00!=e−λ=0.0821P(X=0)=e−λλ00!=e−λ=
0.0821 P(4≤X≤7)=P(X=4)+…+Pr(X=7)=FX(7)−FX
(3)=0.5523283P(4≤X≤7)=P(X=4)+…+Pr(X
=7)=FX(7)−FX(3)=0.5523283
# a. Pr(X = 3) P(X=4)=fX(4)=(104)(0.305)4(0.695)6=0.
dbinom(x = 3, size = 15, prob = 0.26) 2047988P(X=4)=fX(4)=(104)(0.305)4(0.695
)6=0.2047988
## [1] 0.2156314
# b. Pr(X >= 3) b. Si en la muestra hay cuatro personas a las
1 - pbinom(q = 2, size = 15, prob = 0.26) que el test le da positivo, ¿cuál es la
## [1] 0.789861 probabilidad de que, entre estas, exactamente
dos estén sanas?
# c. Pr(4 <= X <= 7)
pbinom(q = 7, size = 15, prob = 0.26) - pb Sea YY la v.a. que representa el número de
inom(q = 3, size = 15, prob = 0.26) estudiantes de los 4 para los que la prueba da
## [1] 0.5523283
positiva.
Así, Y∼Bin(4,π)Y∼Bin(4,π) donde n=4n=4 y
π=P(EC∣P)=P(EC∩P)P(P)=P(P∣EC)P(EC)P(P)=(0.
4. Un médico aplica un test a 10 alumnos de un 25)(0.9)0.305=0.7377049π=P(EC∣P)=P(EC∩P)P(P)
colegio para detectar una enfermedad cuya =P(P∣EC)P(EC)P(P)=(0.25)(0.9)0.305=0.7377049
incidencia sobre una población de niños es del
10%. La sensibilidad del test es del 80% y la y por lo tanto la probabilidad pedida es
especificidad del 75%. P(Y=2)=(42)(0.7377049)2(0.2622951)2=0.224
6451P(Y=2)=(42)(0.7377049)2(0.2622951)2=0.2246451
Sea EE el evento dado por “el alumno tiene la
enfermedad”; se sabe que la incidencia 5. En una cierta población se ha observado un
correspondiente es 10% y por lo número medio anual de muertes por cáncer
tanto P(E)=0.1P(E)=0.1. De otra parte, sea PP el de pulmón de 12.
evento dado por “la prueba es positiva para la
enfermedad de interés”; dado que la sensibilidad de Sea XX la v.a. que representa el número anual de
la prueba de calidad es del 80% y la especificidad del muertes por cáncer de pulmón. Así, XX se puede
75%, se tiene modelar mediante la distribución Poisson con
que P(P∣E)=0.8P(P∣E)=0.8 (sensibilidad) parámetro λλ, dado que XX da cuenta del número de
y P(PC∣EC)=0.75P(PC∣EC)=0.75 (especificidad). Así, éxitos (muertes) en una unidad de tiempo bien
aplicando el teorema de la probabilidad total, se definida, en este caso, por año. Se tiene
deduce que la probabilidad de dar positivo para la que λ=12λ=12.
prueba es
a. ¿Cuál es la probabilidad de que durante el año
en curso: Haya exactamente 10 muertes por
P(P)=P(P∣E)P(E)+P(P∣EC)P(EC)=(0.8)(0.1)+(0.2 cáncer de pulmón?
5)(0.9)=0.305P(P)=P(P∣E)P(E)+P(P∣EC)P(EC)=(0.8)(0.
1)+(0.25)(0.9)=0.305 P(X=10)=fX(10)=e−12121010!=0.104837
Ahora, sea XX la v.a. que representa el número de 3P(X=10)=fX(10)=e−12121010!=0.1048373
estudiantes de los 10 seleccionados para detectar la
enfermedad. Dado que la probabilidad de éxito (la b. ¿Cuál es la probabilidad de que durante el año
prueba da positiva para la enfermedad) se mantiene en curso: 15 o más personas mueran a causa
de la enfermedad?
constante (esto puede suceder cuando la muestra se
toma con reemplazo o cuando se toma sin
reemplazo cuando n<<Nn<<N, donde NN es el P(X≥15)=1−P(X≤14)=1−FX(14)=0.2279
tamaño del lote), se tiene 755P(X≥15)=1−P(X≤14)=1−FX(14)=0.2279
755
que X∼Bin(n,π)X∼Bin(n,π),
con n=10n=10 y π=0.305π=0.305.
c. ¿Cuál es la probabilidad de que durante el año
a. ¿Cuál es la probabilidad de que exactamente a
en curso: 10 o menos personas mueran a
cuatro estudiantes les dé un resultado
causa de la enfermedad?
positivo?
P(X≤10)=FX(10)=0.3472294P(X≤10)=FX(
10)=0.3472294
# a. P(X = 10) P(7000<X<9000)=FX(9000)−FX(7000)=
dpois(x = 10, lambda = 12) 0.2300692P(7000<X<9000)=FX(9000)−FX(
7000)=0.2300692
## [1] 0.1048373
# b. P(X >= 15) c. Calcular la probabilidad de que, en un día
1- ppois(q = 14, lambda = 12) determinado, una familia: Gaste menos de
## [1] 0.2279755 $5,000 en alimentación.
E(X)=10∗815=5.333333E(X)=10∗815=5.3
33333
# a P(X = 6)
dhyper(x = 6, m = 8, n = 7, k = 10)
## [1] 0.3263403
# b. E(X)
10*8/15
## [1] 5.333333