Documentos de Académico
Documentos de Profesional
Documentos de Cultura
UOC
#Cargar datos
data<-read.table("LasVegas.csv", header=TRUE, sep=";", dec=",")
1
Problema 1
(4 puntos) Los datos del archive LasVegas.csv, obtenidas del repositorio UCI (https://
archive-beta.ics.uci.edu/ml/datasets) contienen información sobre las reseñas redactadas en
TripAdvisor por clientes de 21 hoteles de Las Vegas. Importe los datos al programa R y
observe los nombres de las variables.
##
## 3 3.5 4 4.5 5 Sum
## Business 15 11 14 4 30 74
## Couples 36 25 58 10 85 214
## Families 22 25 17 4 42 110
## Friends 19 9 21 5 28 82
## Solo 4 2 10 1 7 24
## Sum 96 72 120 24 192 504
Tabla 1. Tabla de contingencia que relaciona el tipo de viajero (solitario, pareja, familia. . . )
y el número de estrellas del hotel donde se quedó (3,3.5,4,4.5 o 5). Los tipos de viajeros
están separados por filas y las estrellas de los hoteles están separadas por columnas. Se
puede observar que hay un total de 504 viajeros, de los cuales la mayoría eran parejas (204),
y la mayoría se quedaron en hoteles de 5 estrellas (192). Por otro lado, muy pocos viajeros
fueron solos (24) y los hoteles con 4.5 estrellas fueron los menos escogidos (24).
2
## [1] 5.555556
Respuesta: La probabilidad de que el individuo al azar sea un viajero con amigos y se haya
quedado en un hotel de 5 estrellas es del 5.56%.
c) ¿Cuál es la probabilidad que un cliente que viaja por negocios se haya hospedado en
un hotel de 3 estrellas?
## [1] 20.27027
#Otra manera mucho más "directa" sería utilizar la Regla de Laplace sabiendo que
#como hablamos de viajeros de negocios, los casos totales serán 74, y, que tengan
#3 estrellas son 15, por lo que:
#P(3estrellas|negocios)=(15/74)*100=20.27%
p_3estrellas_se_negocios<-tabla_cont_mod["Business", "3"]/tabla_cont_mod["Business", "Su
p_3estrellas_se_negocios*100
## [1] 20.27027
Respuesta: La probabilidad de que el cliente que viaja por negocios se haya hospedado en
un hotel de 3 estrellas es del 20.27%.
Línea de código del bloque anterior que se corta en el PDF:
p_3estrellas_SE_negocios<-(tabla_cont_mod[“Business”, “3”]/tabla_cont_mod[“Sum”,
“Sum”])/ (tabla_cont_mod[“Business”,“Sum”]/tabla_cont_mod[“Sum”, “Sum”])
## [1] 48.33333
3
Problema 2
(3 puntos) Continuamos con los datos del problema anterior.
## [1] 38.09524
4
## [1] 23.18856
c) Supongamos ahora que sabemos que entre los que se hospedan en un hotel de 5 estrellas
el 25% usa el pàrquing del hotel. Sabemos también que un 30% de los clientes de la
base de datos que han usado el pàrquing de su hotel se han hospedado en un hotel de
5 estrellas. ¿Cuál es la probabilidad que un cliente use el pàrquing del hotel?
#P(parquing|5estrellas)=0.25 (ec.1)
#P(5estrellas|parquing)=0.3 (ec.2)
#P(parquing)?
#De la ec.1:
#(P(parquing Y 5estrellas))/(P(5estrellas))=0.25 (ec.3)
#P(5estrellas)=192/504
## [1] 31.74603
Respuesta: La probabilidad de que un cliente use el párquing del hotel es del 31.75%
5
Problema 3
(3 puntos) Supongamos ahora que sabemos que la edad de los clientes de uno de estos
hoteles se distribuye siguiendo una distribución normal de media 52 y desviación típica 11.
Escogemos un cliente al azar:
#N~(52,11)
#P(X>60)=1-P(X<60)
#Utilizando la función pnorm(q, mean, sd, lower.tail=TRUE, log.p=FALSE) obtendremos
#la función de distribución
resultado<-1-pnorm(60,52,11, lower.tail=TRUE, log.p=FALSE)
resultado*100
## [1] 23.35295
resultado<-pnorm(40,52,11,lower.tail=TRUE, log.p=FALSE)
resultado*100
## [1] 13.76564
c) Encuentre una edad de forma que el 75% de los clientes de este hotel sean menores que
ese valor y el 25% de los clientes sean mayores.
#Para calcular esta edad utilizaremos la función qnorm(p, mean, sd, lower.tail=FALSE, l
resultado1<-qnorm(0.25,52,11,lower.tail=FALSE, log.p=FALSE)
resultado1
## [1] 59.41939
## [1] 59.41939
6
#P(X>59.41939)=0.25
#P(X<59.41939)=0.75
Respuesta: El 25% de los clientes serán mayores de 59 años, y el 75% de los clientes menores.