Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Hipotesis
Hipotesis
CREATE TABLE
`proyecto4-356320.1000thon.hipotesis1` AS
SELECT
*,
CASE
WHEN lead_time BETWEEN 0 and 15 THEN "Muy Corto"
WHEN lead_time BETWEEN 15 and 30 THEN "Corto"
WHEN lead_time BETWEEN 30 and 60 THEN "Casi Regular"
WHEN lead_time BETWEEN 60 and 90 THEN "Regular"
WHEN lead_time BETWEEN 90 and 180 THEN "Casi Largo"
WHEN lead_time BETWEEN 180 and 360 THEN "Largo"
WHEN lead_time >360 THEN "Muy Largo"
Else NULL
END AS tiempo_entre_reserva_y_llegada
FROM
`proyecto4-356320.1000thon.hotel`
CARGANDO A POWER BI
SELECT
AVG(is_canceled) as tasa_de_cancelacion,
tiempo_entre_reserva_y_llegada
FROM
`proyecto4-356320.1000thon.hipotesis1`
GROUP BY
tiempo_entre_reserva_y_llegada
OBTENEMOS:
GROUP BY categoria_hijos
GROUP BY hotel,categoria_hijos
OBTENEMOS:
Conclusión: Tenemos como respuesta que en City Hotel que cuando no tienen hijos es mas
probable que cancelen la reserva sin embargo en Resort Hotel cuando tienen hijos es mas
probable que cancelen su reserva. Esto puede ser por algún tipo de comodidad o plan que
pueda brindar Resort Hotel cuando tienen niños
HIPOTESIS 3
Crear una nueva tabla con una segmentación según la cantidad de cambios. Puedes hacer tres
categorías: 'Sin Cambios', 'Entre 1 y 10 cambios' y '10 cambios o más'.
CREATE TABLE
`proyecto4-356320.1000thon.hipotesis3` AS
SELECT
*,
CASE
WHEN booking_changes =0 THEN "Sin cambios"
WHEN booking_changes BETWEEN 1 and 10 THEN "Cambios casuales"
WHEN booking_changes > 10 THEN "Muchos cambios"
Else NULL
END AS cambios_de_reserva
FROM
`proyecto4-356320.1000thon.hipotesis2`
Generar una consulta que agrupe la nueva segmentación y calcule la tasa de cancelación para
cada caso
SELECT
AVG(is_canceled) as prom_cancela_por_cambios, cambios_de_reserva
FROM
`proyecto4-356320.1000thon.hipotesis3`
GROUP BY cambios_de_reserva
Agregar algunas otras dimensiones que enriquezcan tu análisis (por ejemplo, la variable hotel)
SELECT
hotel,AVG(is_canceled) as prom_cancela_por_cambios, cambios_de_reserva
FROM
`proyecto4-356320.1000thon.hipotesis3`
GROUP BY hotel,cambios_de_reserva
No olvides visualizar estos datos en PowerBI y extraer conclusiones
Conclusiones:
Vemos que cuando no realizan cambios en ambos hoteles la probabilidad que cancelen es muy
alta.
En City hotel cuando son cambios casuales se reduce la probabilidad porque muestran mas
interés en la reserva y cuando realizan muchos cambios reduce aun más la probabilidad, esto
podría ser porque en City hotel traten de brindar un mejor servicio en cuanto a cambios.
Mientras que en Resort Hotel cuando realizan cambios casuales reduce mucho la probabilidad
de cancelación, pero con muchos cambios vemos que se reduce la probabilidad, pero no tanto
como en cambios casuales, esto podría ser porque la gente no está conforme con el servicio
tras ya realizar bastantes cambios.
HIPOTESIS 4
SELECT
hotel,AVG(is_canceled) as prom_cancela_por_cambios,
CASE
WHEN total_of_special_requests = 0 THEN "Sin cambio especial"
WHEN total_of_special_requests >0 THEN "Con cambnio especial"
ELSE NULL
END as cambios_especiales
FROM
`proyecto4-356320.1000thon.hipotesis3`
GROUP BY hotel,cambios_especiales
CARGANDO A POWER BI
Conclusión: vemos que en ambos hoteles cuando realizan un cambio especial la probabilidad
de cancelación de reserva se reduce, esto se debe a que los cambios especiales son mas
especificos y logran satisfacer lo que el usuario desea, pero en City hotel vemos que ofrece un
buen servicio de cambios especiales porque logra reducir a mas del 50% la probabilidad de
cancelación, mientras que en Resort Hotel no hay tanta diferencia
HIPOTESIS 5
0 al 100
SELECT
hotel,AVG(is_canceled) as prom_cancela_por_Adr,
CASE
WHEN adr BETWEEN 0 and 35 THEN "adr_bajo_cat1"
WHEN adr BETWEEN 35 and 70 THEN "adr_medio_cat1"
WHEN adr BETWEEN 70 and 100 THEN "adr_alto_cat1"
END as cat1_adr
FROM
`proyecto4-356320.1000thon.hipotesis3`
WHERE adr BETWEEN 0 and 100
GROUP BY hotel,cat1_adr
CARGANDO EN POWER BI
Conclusiones: Vemos que en City Hotel cuando el adr es medio la probabilidad de cancelación
es muy alta, esto puede ser porque el adr en City hotel cuando esta en una etapa media no
tiene muchos paquetes de descuentos, sin embargo, en el adr alto la probabilidad se reduce
porque puede tener promociones o paquetes especiales, y en adr bajo porque deben ser
fechas clave al ser pocos días y el gasto está estimado.
Sin embargo, en Resort Hotel vemos que en adr alto hay mayor probabilidad de cancelación de
reserva luego se reduce en adr medio y se reduce aun mas en adr bajo, debe ser porque los
usuarios derre encuentran un mejor precio en otros lugares mientras planeen quedarse más
días
100 a 200
SELECT
hotel,AVG(is_canceled) as prom_cancela_por_Adr,
CASE
WHEN adr BETWEEN 100 and 135 THEN "adr_bajo_cat1"
WHEN adr BETWEEN 135 and 170 THEN "adr_medio_cat1"
WHEN adr BETWEEN 170 and 200 THEN "adr_alto_cat1"
END as cat1_adr
FROM
`proyecto4-356320.1000thon.hipotesis3`
WHERE adr BETWEEN 100 and 200
GROUP BY hotel,cat1_adr
CARGANDO EN POWER BI
Conclusiones, en adr de 100 a 200 vemos el mismo comportamiento en Resort porque su
probabilidad va de manera ascendente de adr bajo a adr alto. Sin embago en City hotel vemos
que en adr bajo la probabilidad de cancelación es muy alta, pero en adr alta se reduce, y esto
podría ser porque mientras mas adr alto tenga mayor descuento se le puedan realizar a los
usuarios
200 a 300
SELECT
hotel,AVG(is_canceled) as prom_cancela_por_Adr,
CASE
WHEN adr BETWEEN 200 and 235 THEN "adr_bajo_cat1"
WHEN adr BETWEEN 235 and 270 THEN "adr_medio_cat1"
WHEN adr BETWEEN 270 and 300 THEN "adr_alto_cat1"
END as cat1_adr
FROM
`proyecto4-356320.1000thon.hipotesis3`
WHERE adr BETWEEN 200 and 300
GROUP BY hotel,cat1_adr
CARGANDO EN POWER BI
Conclusiones de 200 a 300
Vemos que en ambos hoteles se van nivelando la probabilidad de cancelación ya que el adr
está en valores altos
300 a 400
SELECT
hotel,AVG(is_canceled) as prom_cancela_por_Adr,
CASE
WHEN adr BETWEEN 300 and 335 THEN "adr_bajo_cat1"
WHEN adr BETWEEN 335 and 370 THEN "adr_medio_cat1"
WHEN adr BETWEEN 370 and 400 THEN "adr_alto_cat1"
END as cat1_adr
FROM
`proyecto4-356320.1000thon.hipotesis3`
WHERE adr BETWEEN 300 and 400
GROUP BY hotel,cat1_adr
CARGANDO EN POWER BI
Conclusiones, vemos que en valores muy altos en City hotel la probabilidad que cancelen la
reserva es nula, esto debe ser porque no hay clientes que lleguen a un adr tan alto o porque
los clientes esten satisfechos con el adr en esa cantidad. Por otro lado, en Resort Hotel sigue
de manera ascendente la probabilidad de que se cancele, esto puede ser porque los precios a
medida que incrementan la gente se van desanimando y las probabilidades de que cancelen
aumentan