Está en la página 1de 3

Probabilidad y estadística: PEC2

UOC

NOMBRE:
Indique claramente el nombre y apellidos en la primera página del informe. Resuelva los
ejercicios usando R siempre que sea necesario, es importante mostrar cada uno de los pasos
realizados para llegar al resultado final. Indique en cada caso qué instrucciones de R ha usado
y las salidas que se obtienen.
El informe final se entregará a través del moodle en un archivo con formato “pdf”
o “html”.

Problema 1
(4 puntos) Los datos del archive LasVegas.csv, obtenidas del repositorio UCI (https://archive-
beta.ics.uci.edu/ml/datasets) contienen información sobre las reseñas redactadas en
TripAdvisor por clientes de 21 hoteles de Las Vegas. Importe los datos al programa R y
observe los nombres de las variables.
data_p2<-read.table("LasVegas.csv", header = TRUE, sep = ";")
names(data_p2)

## [1] "User.country" "Nr..reviews" "Nr..hotel.reviews"


## [4] "Helpful.votes" "Score" "Period.of.stay"
## [7] "Traveler.type" "Pool" "Gym"
## [10] "Tennis.court" "Spa" "Casino"
## [13] "Free.internet" "Hotel.name" "Hotel.stars"
## [16] "Nr..rooms" "User.continent" "Member.years"
## [19] "Review.month" "Review.weekday"
a) La variable Traveler.type indica el tipo de viajero clasificado en Business, Couples,
Families, Friends, Solo (según si se han hospedado en el hotel por negocios, en pareja,
en familia, con amigos o solos). La variable Hotel.stars indica el número de estrellas
del hotel que pueden ser 3, 3.5, 4, 4.5 o 5. Elabore una tabla de contingencia entre las
variables Traveler.type y Hotel.stars:
t_c<-with(data_p2,addmargins(table(Traveler.type,Hotel.stars)))
t_c

1
## Hotel.stars
## Traveler.type 3 3,5 4 4,5 5 Sum
## Business 15 11 14 4 30 74
## Couples 36 25 58 10 85 214
## Families 22 25 17 4 42 110
## Friends 19 9 21 5 28 82
## Solo 4 2 10 1 7 24
## Sum 96 72 120 24 192 504
b) Si escogemos un individuo de la base de datos al azar ¿cuál es la probabilidad que
corresponda a un cliente que se ha hospedado con amigos y en un hotel de 5 estrellas?

28
P (F riends ∩ 5estrellas) = = 0.0555556.
504
c) ¿Cuál es la probabilidad que un cliente que viaja por negocios se haya hospedado en un
hotel de 3 estrellas?

15
P (3estrellas|Business) = = 0.2027027.
74
d) ¿Cuál es la probabilidad que un cliente que se ha hospedado en un hotel de 4 estrellas
viaje en pareja?

58
P (Couples|4estrellas) = = 0.4833333.
120

Problema 2
(3 puntos) Continuamos con los datos del problema anterior.
a) Si escogemos un cliente de la base de datos al azar. ¿Cuál es la probabilidad que se
hospede en un hotel de 5 estrellas?

192
P (5estrellas) = = 0.3809524.
504
b) Escogemos al azar 10 clientes de la base de datos, con reposición. Consideramos la
variable que nos indica el número de clientes, entre los 10, que se hospedan en un hotel
de 5 estrellas.
i.) ¿Qué distribución sigue esta variable? ¿De qué parámetros? Si llamamos X a esta
variable, X sigue una distribución binomial de parámetros n = 10 y p = 0.3809524.
ii.) ¿Cuál es la probabilidad que exactamente 3 de los 10 se hospeden en un hotel de 5
estrellas?
!
10
P (X = 3) = · 0.38095243 · (1 − 0.3809524)7 = 0.2311329.
3

2
O directamente con R
dbinom(3, size=10, prob=p)

## [1] 0.2311329
c) Supongamos ahora que sabemos que entre los que se hospedan en un hotel de 5 estrellas
el 25% usa el pàrquing del hotel. Sabemos también que un 30% de los clientes de la
base de datos que han usado el pàrquing de su hotel se han hospedado en un hotel de 5
estrellas. ¿Cuál es la probabilidad que un cliente use el pàrquing del hotel? Tenemos
que P (P arquing|5estrellas) = 0.25 y que P (5estrellas|P arquing) = 0.3. Observamos
que
P (P arquing ∩ 5estrellas) = P (P arquing|5estrellas) · P (5estrellas)
y también

P (P arquing ∩ 5estrellas) = P (5estrellas|P arquing) · P (P arquing).

Igualando estas dos igualdades y despejando tenemos que

P (P arquing|5estrellas) · P (5estrellas) 0.25 × p


P (P arquing) = = = 0.3174603.
P (5estrellas|P arquing) 0.30

Problema 3
(3 puntos) Supongamos ahora que sabemos que la edad de los clientes de uno de estos hoteles
se distribuye siguiendo una distribución normal de media 52 y desviación típica 11. Escogemos
un cliente al azar:
a) ¿Cuál es la probabilidad que tenga más de 60 años?
1-pnorm(60, mean = 52, sd = 11)

## [1] 0.2335295
b) ¿Cuál es la probabilidad que tenga menos de 40 años?
pnorm(40, mean = 52, sd = 11)

## [1] 0.1376564
c) Encuentre una edad de forma que el 75% de los clientes de este hotel sean menores que
ese valor y el 25% de los clientes sean mayores.
qnorm(0.75, mean = 52, sd = 11)

## [1] 59.41939

También podría gustarte