Está en la página 1de 10

HIPOTESIS 1

CREATE TABLE
  `proyecto4-356320.1000thon.hipotesis1` AS
SELECT
  *,
  CASE
    WHEN lead_time BETWEEN 0 and 15 THEN "Muy Corto"
    WHEN lead_time BETWEEN 15 and 30 THEN "Corto"
    WHEN lead_time BETWEEN 30 and 60 THEN "Casi Regular"
    WHEN lead_time BETWEEN 60 and 90 THEN "Regular"
    WHEN lead_time BETWEEN 90 and 180 THEN "Casi Largo"
    WHEN lead_time BETWEEN 180 and 360 THEN "Largo"
    WHEN lead_time >360 THEN "Muy Largo"
    Else NULL
    END AS tiempo_entre_reserva_y_llegada
FROM
  `proyecto4-356320.1000thon.hotel`

CARGANDO A POWER BI
SELECT
  AVG(is_canceled) as tasa_de_cancelacion,
  tiempo_entre_reserva_y_llegada
FROM
  `proyecto4-356320.1000thon.hipotesis1`
GROUP BY
  tiempo_entre_reserva_y_llegada
  

OBTENEMOS:

Conclusión: la hipótesis es verdad, ya que los resultados lo verifican ya que mientras el


periodo de reserva sea mas largo hay mas resultados de que se cancela la reserva
HIPOTESIS 2
CREATE TABLE
  `proyecto4-356320.1000thon.hipotesis2` AS
SELECT
  *,
  CASE
    WHEN children > 0 or babies > 0 THEN "Tienen hijos" 
    WHEN children = 0 and babies = 0 THEN "No tienen hijos"
    Else NULL
    END AS categoria_hijos
FROM
  `proyecto4-356320.1000thon.hipotesis1`
CORRIENDO UNA CONSULTA SIMILAR A LA HIPOTESIS 1
SELECT
  AVG(is_canceled) as prom_cancela_porhijos, categoria_hijos 
  
FROM
  `proyecto4-356320.1000thon.hipotesis2`

GROUP BY categoria_hijos

MODIFICAMOS PARA QUE CONSIDERE LA COLUMNA HOTEL Y CARGAMOS A POWER BI


SELECT
  hotel,AVG(is_canceled) as prom_cancela_porhijos, categoria_hijos 
  
FROM
  `proyecto4-356320.1000thon.hipotesis2`

GROUP BY hotel,categoria_hijos

  OBTENEMOS:

Conclusión: Tenemos como respuesta que en City Hotel que cuando no tienen hijos es mas
probable que cancelen la reserva sin embargo en Resort Hotel cuando tienen hijos es mas
probable que cancelen su reserva. Esto puede ser por algún tipo de comodidad o plan que
pueda brindar Resort Hotel cuando tienen niños
HIPOTESIS 3

Crear una nueva tabla con una segmentación según la cantidad de cambios. Puedes hacer tres
categorías: 'Sin Cambios', 'Entre 1 y 10 cambios' y '10 cambios o más'.
CREATE TABLE
  `proyecto4-356320.1000thon.hipotesis3` AS
SELECT
  *,
  CASE
    WHEN booking_changes =0 THEN "Sin cambios"
    WHEN booking_changes BETWEEN 1 and 10 THEN "Cambios casuales" 
    WHEN booking_changes > 10 THEN "Muchos cambios"
    Else NULL
    END AS cambios_de_reserva
FROM
  `proyecto4-356320.1000thon.hipotesis2`

Generar una consulta que agrupe la nueva segmentación y calcule la tasa de cancelación para
cada caso
SELECT
  AVG(is_canceled) as prom_cancela_por_cambios, cambios_de_reserva
  
FROM
  `proyecto4-356320.1000thon.hipotesis3`

GROUP BY cambios_de_reserva

Agregar algunas otras dimensiones que enriquezcan tu análisis (por ejemplo, la variable hotel)
SELECT
  hotel,AVG(is_canceled) as prom_cancela_por_cambios, cambios_de_reserva
  
FROM
  `proyecto4-356320.1000thon.hipotesis3`

GROUP BY hotel,cambios_de_reserva
No olvides visualizar estos datos en PowerBI y extraer conclusiones

Conclusiones:

Vemos que cuando no realizan cambios en ambos hoteles la probabilidad que cancelen es muy
alta.

En City hotel cuando son cambios casuales se reduce la probabilidad porque muestran mas
interés en la reserva y cuando realizan muchos cambios reduce aun más la probabilidad, esto
podría ser porque en City hotel traten de brindar un mejor servicio en cuanto a cambios.

Mientras que en Resort Hotel cuando realizan cambios casuales reduce mucho la probabilidad
de cancelación, pero con muchos cambios vemos que se reduce la probabilidad, pero no tanto
como en cambios casuales, esto podría ser porque la gente no está conforme con el servicio
tras ya realizar bastantes cambios.

HIPOTESIS 4
SELECT
  hotel,AVG(is_canceled) as prom_cancela_por_cambios,
  CASE
  WHEN total_of_special_requests = 0 THEN "Sin cambio especial"
  WHEN total_of_special_requests >0 THEN "Con cambnio especial"
  ELSE NULL
  END as cambios_especiales
  
FROM
  `proyecto4-356320.1000thon.hipotesis3`

GROUP BY hotel,cambios_especiales

CARGANDO A POWER BI

Conclusión: vemos que en ambos hoteles cuando realizan un cambio especial la probabilidad
de cancelación de reserva se reduce, esto se debe a que los cambios especiales son mas
especificos y logran satisfacer lo que el usuario desea, pero en City hotel vemos que ofrece un
buen servicio de cambios especiales porque logra reducir a mas del 50% la probabilidad de
cancelación, mientras que en Resort Hotel no hay tanta diferencia
HIPOTESIS 5

0 al 100
SELECT
  hotel,AVG(is_canceled) as prom_cancela_por_Adr, 
  CASE
  WHEN adr BETWEEN 0 and 35 THEN "adr_bajo_cat1"
  WHEN adr BETWEEN 35 and 70 THEN "adr_medio_cat1"
  WHEN adr BETWEEN 70 and 100 THEN "adr_alto_cat1"  
  END as cat1_adr
FROM
  `proyecto4-356320.1000thon.hipotesis3`
WHERE adr BETWEEN 0 and 100
GROUP BY hotel,cat1_adr

CARGANDO EN POWER BI

Conclusiones: Vemos que en City Hotel cuando el adr es medio la probabilidad de cancelación
es muy alta, esto puede ser porque el adr en City hotel cuando esta en una etapa media no
tiene muchos paquetes de descuentos, sin embargo, en el adr alto la probabilidad se reduce
porque puede tener promociones o paquetes especiales, y en adr bajo porque deben ser
fechas clave al ser pocos días y el gasto está estimado.

Sin embargo, en Resort Hotel vemos que en adr alto hay mayor probabilidad de cancelación de
reserva luego se reduce en adr medio y se reduce aun mas en adr bajo, debe ser porque los
usuarios derre encuentran un mejor precio en otros lugares mientras planeen quedarse más
días

100 a 200
SELECT
  hotel,AVG(is_canceled) as prom_cancela_por_Adr, 
  CASE
  WHEN adr BETWEEN 100 and 135 THEN "adr_bajo_cat1"
  WHEN adr BETWEEN 135 and 170 THEN "adr_medio_cat1"
  WHEN adr BETWEEN 170 and 200 THEN "adr_alto_cat1"  
  END as cat1_adr
FROM
  `proyecto4-356320.1000thon.hipotesis3`
WHERE adr BETWEEN 100 and 200
GROUP BY hotel,cat1_adr

CARGANDO EN POWER BI
Conclusiones, en adr de 100 a 200 vemos el mismo comportamiento en Resort porque su
probabilidad va de manera ascendente de adr bajo a adr alto. Sin embago en City hotel vemos
que en adr bajo la probabilidad de cancelación es muy alta, pero en adr alta se reduce, y esto
podría ser porque mientras mas adr alto tenga mayor descuento se le puedan realizar a los
usuarios

200 a 300
SELECT
  hotel,AVG(is_canceled) as prom_cancela_por_Adr, 
  CASE
  WHEN adr BETWEEN 200 and 235 THEN "adr_bajo_cat1"
  WHEN adr BETWEEN 235 and 270 THEN "adr_medio_cat1"
  WHEN adr BETWEEN 270 and 300 THEN "adr_alto_cat1"  
  END as cat1_adr
FROM
  `proyecto4-356320.1000thon.hipotesis3`
WHERE adr BETWEEN 200 and 300
GROUP BY hotel,cat1_adr

CARGANDO EN POWER BI
Conclusiones de 200 a 300

Vemos que en ambos hoteles se van nivelando la probabilidad de cancelación ya que el adr
está en valores altos

300 a 400
SELECT
  hotel,AVG(is_canceled) as prom_cancela_por_Adr, 
  CASE
  WHEN adr BETWEEN 300 and 335 THEN "adr_bajo_cat1"
  WHEN adr BETWEEN 335 and 370 THEN "adr_medio_cat1"
  WHEN adr BETWEEN 370 and 400 THEN "adr_alto_cat1"  
  END as cat1_adr
FROM
  `proyecto4-356320.1000thon.hipotesis3`
WHERE adr BETWEEN 300 and 400
GROUP BY hotel,cat1_adr

CARGANDO EN POWER BI
Conclusiones, vemos que en valores muy altos en City hotel la probabilidad que cancelen la
reserva es nula, esto debe ser porque no hay clientes que lleguen a un adr tan alto o porque
los clientes esten satisfechos con el adr en esa cantidad. Por otro lado, en Resort Hotel sigue
de manera ascendente la probabilidad de que se cancele, esto puede ser porque los precios a
medida que incrementan la gente se van desanimando y las probabilidades de que cancelen
aumentan

También podría gustarte