Está en la página 1de 5

1

Análisis Estadístico de los Usuarios de la


Plataforma Airbnb.
C. A. Azanza, estudiante, Universidad Católica de Cuenca, y M.C. Salamea, estudiante, Universidad
Católica de Cuenca

|
Resumen— En el siguiente trabajo de investigación se realizó II. DATOS Y MÉTODOS
un análisis estadístico de los usuarios de la plataforma Airbnb, en
los últimos cinco años turistas y trabajadores han optado por el A. Materiales y Datos:
uso de este sistema de alojamiento debido al bajo costo que Para la realización de esta investigación se utilizó el software
representa, permitiendo ahorrar a los usuarios gran cantidad de gratuito RStudio, que utiliza códigos de programación para el
dinero. En este artículo anualizaremos la variable de precio que es análisis de datos estadísticos, como también de gráficas y
la razón por la cual los usuarios deciden usar este servicio. estadígrafos.
Analizaremos los costos mínimos y más altos de los alojamientos y
También se usaron dos bases de datos diferentes, la primera
se realizara un análisis comparativo con servicios de alojamiento
tradicionales para poder determinar cuánto se puede ahorrar base de datos se descargó de la página oficial de Airbnb, que
usando esta plataforma, para poder realizar el análisis se procedió corresponde a todos los alojamientos disponibles que existen
al uso de software gratuito R para la obtención de estadígrafos y en la ciudad de Madrid España en el año 2017.
gráficas.
TABLA I
Índice de términos— Airbnb, alojamiento, análisis, MUESTRA DE DATOS ALOJAMIENTOS EN LA CIUDAD DE MADRID DE AIRBNB.
comparativo, estadístico, estadígrafos, graficas, hoteles, Madrid,
resultados.

I. INTRODUCCIÓN

E STE trabajo de investigación analiza el uso de la plataforma


virtual Airbnb.
Viajar ya sea por placer o por trabajo se ha convertido en una
acción rutinaria y necesaria en la sociedad actual, pero los La segunda base de datos fue de creación propia para el
costos de realizar cualquier tipo de viaje pueden alcanzar estudio de este caso, corresponde a 100 hoteles diferentes de la
niveles a los que un usuario promedio no se encuentra en la ciudad de Madrid, buscando los 100 más utilizados la base de
capacidad de costear. La plataforma Airbnb desde hace cinco datos consta del nombre del hotel como de su precio por
años ha colaborado con viajeros a reducir drásticamente el noche.
TABLA II
presupuesto necesario para poder realizar un viaje. En el MUESTRA DE DATOS HOTELES EN LA CIUDAD DE MADRID.
siguiente trabajo de investigación se analizará los costos que se
pueden ahorrar al usar este tipo de servicio. Se realizará un
análisis comparativo entre el uso de este servicio y los servicios
de alojamiento tradicionales, además se realizará un análisis
estadístico completo de la variable precio de Airbnb,
planteando como objetivo el incentivar a los consumidores
ahorrar costos con este tipo de alojamiento que favorece dos
partes, al inquilino como al anfitrión. Se analizará estadígrafos
de tendencia central, posición y dispersión, así como también
las diferentes graficas de la variable a analizar.
2

B. Metodología
Para el análisis del caso se utilizó el Programa RStudio que  Luego calculamos el coeficiente de asimetría
utiliza un código de programación propio para poder obtener para determinar la forma en la que se
resultados de una manera rápida y eficaz al poder trabajar con encuentran distribuidos nuestros datos:
gran cantidad de datos.
En la base de datos de Airbnb existe 14 variables diferentes Σ(Xi−X)3
𝐴𝑠 = (5)
para trabajar en este caso se procedió a utilizar la variable 𝑛∗𝑠 3

“Price” que determina el precio de cada alojamiento


 Por ultimo analizamos la kurtosis de nuestros
Para el trabajo se realizó los siguientes pasos: datos y determinamos si existe agrupamiento
1. Inserción de datos en el programa mediante la en nuestros datos o se encuentran dispersos.
herramienta Import Dataset.
Σ(Xi−X)4
2. Luego se procedió a calcular los estadígrafos de 𝛼= (6)
𝑛∗𝑠 4
tendencia central, posición, kurtosis y simetría.
Para ello se usaron los comandos “summary” y El comando “summary” nos ayuda a determinar los
“describe” valores de lo cuartiles. El programa RStudio no utiliza
El comando “describe” calcula los siguientes valores datos agrupados por lo que no se utiliza la fórmula
que han sido estudiados con anterioridad y para los tradicional para el cálculo de cuartiles.
cuales anotaremos su fórmula de cálculo a mano: 3. Se analizó si existen valores extremos apartados, para
lo cual en el programa se realizó los siguientes
 La media que es la medida de tendencia cálculos.
central más usada ya que es el promedio su
fórmula es la siguiente:  Cálculo de la dispersión entre cuartiles:
ΣXi
𝑋= (1) 𝑓𝑠 = 𝑄3 − 𝑄1 (7)
𝑛

Xi en este caso el precio de cada alojamiento  Cálculo de valores extremos:


de la base de datos,
n el número de alojamientos totales. 𝑉. 𝑒𝑥𝑡𝑟𝑒𝑚𝑜 = 𝑓𝑠 ∗ 3 (8)
 También se calculó la media recortada
quitando valores extremos para que de darse  Cálculo de Limites:
valores atípicos extremos esta pueda ser
tomada como una medida de tendencia central 𝐿. 𝑖𝑛𝑓𝑒𝑟𝑖𝑟𝑜𝑟 = 𝑄1 − 𝑉. 𝑒𝑥𝑡𝑟𝑒𝑚𝑜 (9)
más precisa.
𝐿. 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 𝑄3 + 𝑉. 𝑒𝑥𝑡𝑟𝑒𝑚𝑜 (10)
 La mediana es el valor de la medida central
del total de datos. 4. En el programa se procedió a obtener cada uno de los
diferentes gráficos:
 Se pudo obtener el valor mínimo y máximo de  Histograma se procedió a realizar un
todos los 12605 diferentes alojamientos, así histograma con el comando “hist”.
como el rango que es:  Gráfico de Barras con el comando “barplot”.
 Gráfico de puntos con el comando “plot”
 Gráfico de Caja y Bigote con el comando
𝑅𝑎𝑛𝑔𝑜 = 𝑉. 𝑚𝑎𝑥𝑖𝑚𝑜 − 𝑉. 𝑚𝑖𝑛𝑖𝑚𝑜 (2) “boxplot”.

 La varianza, que nos indica que tan dispersos Además, se realizó un análisis comparativo de precios
están nuestros datos con respecto a la media: entre los hoteles y los alojamientos de Airbnb con un
diagrama de caja y bigote entre las dos bases de datos.
Σ(Xi−X)2
𝑠2 = (3)
𝑛 III. RESULTADOS Y DISCUSIÓN DE RESULTADOS
Después de realizar todos los procesos abordados en la
 La desviación estándar que es la raíz cuadra de Metodología se presenta a continuación los siguientes
la varianza. resultados, organizados en la misma forma en la que fue
presentada la metodología para mantener un orden apropiado
y que pueda ser comprensible hacia el lector.
𝑠 = √𝑠 2 (4)
Cabe destacar para la comprensión de este artículo, que a
pesar de que la ciudad en estudio es Madrid, el análisis de
3

precios se encuentra en dólares americanos ya que la empresa Con la Kurtosis podemos observar que obtiene un
Airbnb es norteamericana. valor de 23.93.
Podemos determinar entonces que α > 3, por lo que
1. Al insertar los datos se determinó que en la base de afirmamos entonces que nuestros datos se encuentran
datos de Airbnb existen 12605 observaciones de en una curva leptocúrtica, eso quiere decir que la
diferentes alojamientos. mayor cantidad de alojamientos se encuentran muy
Con el comando “describe” se pudo conocer que el agrupados.
valor mínimo de un alojamiento por noche es de En la tercera parte de este estudio de estadígrafos
$10.0 mientras que el valor máximo es de $934. analizaremos la posición y el valor de los cuartiles,
Dando, así como resultado un rango de $924(2) para lo cual se usó el comando “summary”.

Fig. 4 Estadígrafos de posición.


Fig. 1 Valor mínimo, máximo y rango.
En la Fig. 4 podemos observar el valor de los 3
cuartiles principales de nuestra base de datos.
2. Se calculó todos los estadígrafos arrojando los Según estos resultados podemos concluir que el 25%
siguientes resultados. de los alojamientos se encuentran en valores iguales
o menores a 38$, esto nos determina el primer cuartil.
El segundo cuartil o la mediana nos dice que el 50%
de los datos se encuentra en valores iguales o
menores a 60$.
Fig. 2 Estadígrafos de tendencia central y dispersión. El tercer cuartil nos indica que el 75% de nuestros
datos se encuentra en valores iguales o menores a
En la Fig.2 se puede observar los siguientes 93$.
resultados la media obtiene un valor de 74.98, la Por ultimo podemos determinar que el 25 % de los
media recortada 64,81, la mediana es 60, la varianza datos restantes son superiores a los 93$, por lo que de
1 y la desviación estándar es igual a 61.82. 12605 alojamientos totales en la ciudad de Madrid
Al observar estos datos podemos determinar que la solo 3016 superan los 93$. Considerando que la
mediana y la media recortada obtienen valores muy media de un hotel promedio en Madrid es de 186$ en
similares, esto se debe a los valores extremos que el 75% de los alojamientos de Airbnb existe hasta un
hacen que la media aritmética y la mediana tengan un 100% de ahorro que en un hotel tradicional de
valor un poco más alejado. Madrid.
Se recomienda usar igualmente la media como 3. Al hacer el análisis de los valores extremos se
medida de tendencia central más probable ya que obtuvieron los siguientes resultados:
existe solamente una diferencia de 14.98$ con la
mediana, considerando el valor máximo 934$, el
valor de la media es aceptable para ser tomada como
referencia.
Al analizar la varianza podemos determinar que la
mayoría de los datos se encuentras cercanos a la
media aritmética.
En la siguiente parte se analizó la asimetría y la
kurtosis de nuestra base de datos y nos dio los
siguientes resultados:
Fig. 5 Resultados Análisis de Valores Extremos.

Fig. 3 Estadígrafos de forma. Pudimos determinar que la dispersión entre cuartiles


es de 55 (7), y el Valor extremo es de 165 (8).
Se puede observar en la Fig.3 que la asimetría tiene Con eso obtuvimos los limites el límite inferior
un valor de 0.55. obtuvo un valor de -127 (9), mientras que el límite
Al obtener este resultado podemos determinar que superior un valor de 258 (10).
As > 0, por lo que podemos deducir que al ser mayor Podemos analizar estos valores entonces en el lado
a cero encontramos una asimetría positiva, quiere izquierdo de nuestros alojamientos miramos que el
decir que la mayoría de los alojamientos se valor mínimo es de 10$ y el límite inferior es de -127
encuentran en la parte izquierda del total de datos. por lo que podemos concluir que de ese lado no
existen valores extremos.
4

Por el lado derecho es diferente determinamos En la gráfica de barras se puede observar los 12605
entonces que el límite superior es 258 y el valor diferentes alojamientos de la ciudad de Madrid.
máximo es de $934, así que existe gran cantidad de Se puede observar que los alquileres más costosos
valores extremos después de los 258$. Siendo así superan los 900$, como se observó en el histograma
hasta el Valor máximo uno de los Valores extremos. se observa que la mayor cantidad de alojamientos se
Haciendo un análisis podemos decir entonces que encuentran en un rango de 0 a 100$.
existen alojamientos bastante costosos superiores a
los 260$ pero en la base de datos se puede observar La Grafica de Puntos nos muestra los siguientes
que estos alojamientos corresponden a casas o resultados:
departamentos que pueden ser utilizados por 2 o más
personas.

4. En el punto 4 en la metodología se propuso el análisis


de Graficas de la base de datos de alojamientos de
Airbnb.
Primero analizaremos el histograma que obtuvimos
en nuestros datos:

Fig. 8 Grafico de Puntos Precio por Noche en Alojamiento en


Madrid.

En la gráfica se puede observar el número de


observaciones que repite un precio en los 12605
alojamientos, se puede observar que existen solo 4
alojamientos que superan los 750$.
Fig. 6 Histograma Precio por Noche en Alojamiento en Madrid. Y al igual que en otras graficas se puede observar
como la mayoría de datos se encuentran en un rango
Se puede observar como primer punto que en la de 0 a 200$.
gráfica tenemos una asimetría positiva, según
podemos observar casi el 90% de los datos se Ahora se analizará el diagrama de caja y bigote:
encuentra en un rango de 0 a 200$.
También determinamos que la gráfica es unimodal
por lo que se puede ver casi el 70% de los datos se
encuentran en un rango de 0 a 100 hasta. Según la
moda que se observa entre ese 70% podemos ver que
existen hasta aproximadamente 5000 alojamientos
entre 0 y 50$ y un poco más de 5000 alojamientos
entre 50$ y 100$.
Ahora se analizará la Gráfica de Barras:

Fig. 9 Boxplot Precio por Noche en Alojamiento en Madrid.

Determinamos entonces que el 50% de los datos se


encuentran muy agrupados, cerca de la mediana y
que se pueden encontrar entre un rango de 38$ a 93$.
Los bigotes de nuestra caja en el lado inferior llegan
a un valor cercano a 0 como sabemos que el valor
mínimo es de 10$, y por el lado superior llega hasta
Fig. 7 Grafico de Barras Precio por Noche en Alojamiento en antes de los 200$.
Madrid.
5

Después de esto podemos observar los valores


atípicos y valores extremos del total de nuestros
datos.
Como se observó en la gráfica de puntos se puede
observar que hay solo 3 valores que superan los IV. CONCLUSIONES
800$.
Dado los resultados de los objetivos planteados podemos
Para terminar con los resultados se realizará un análisis concluir que al usar la plataforma Airbnb como medio de
comparativo entre los alojamientos de Airbnb y los hoteles alojamiento podemos ahorrar gran cantidad de dinero.
tradicionales. Ya que este artículo se plantea únicamente al aspecto
económico no se analizó los aspectos de inconformidad o
incomodidad que pueda generar usar este tipo de servicio.
Al observar los datos nos damos cuenta que en Airbnb muchos
de los alojamientos no superan los 100$ lo que a la hora de
viajar equivale a un gran ahorro en el presupuesto de un viaje
Fig. 10 Estadígrafos de los Hoteles tradicionales de Madrid. ya sea a turistas o empresas que requieran un viaje de trabajo.
Como conclusión de los últimos resultados acerca del análisis
comparativo de los dos servicios, podemos observar cómo
puede constituirse ese ahorro si observamos que, dado el
tamaño de las dos bases de datos, en Hoteles siendo solo los
100 más visitados y en Airbnb el total de alojamientos del año
Fig. 11 Valores Mínimo y Máximo de los Hoteles tradicionales de
Madrid.
2017, que a pesar de los tamaños, el 50% de los datos de
Airbnb se encuentra mucho más agrupado que el de los
hoteles, esto quiere decir que el ahorro planteado por Airbnb
es exponencial además se observa en la Fig.12 como en el
cuartil 1 de los hoteles es superior al cuartil 3 de Airbnb.
Todos estos resultados nos muestran en un aspecto económico
porque es recomendable usar este servicio para personas que
no se encuentren en la capacidad de pagar un viaje.

V. REFERENCIAS

Libros:
[1] J. Devore, Probabilidad y Estadística para Ingeniería y Ciencias, 6ta Ed.
México: International Thomson, 2005, p. 81.

Fig. 12 Boxplot Comparativo entre los hoteles de Madrid y los


alojamientos de Airbnb.

Como se puede observar en la Fig. 10 la media de los hoteles


tradicionales es de 186$, mientras que en Airbnb la media es
de 74.82$ existiendo una diferencia de 111.18$. Como se
puede ver en Airbnb puede existir hasta un ahorro de más del
100% en el alquiler de un alojamiento promedio.
En la Fig. 11 se observa como el valor mínimo de un hotel es
de 35$ mientras que en Airbnb el valor mínimo es de $10 por
un cuarto. Además, observamos que el valor máximo de los
hoteles es de 555$, mientras que en Airbnb es de 934$, pero
cabe recalcar que en un hotel el valor máximo es para una sola
persona, en cambio en Airbnb el valor máximo corresponde a
el de una casa o departamento en donde se podrían alojar hasta
15 personas.
En la Fig.12 tenemos un Diagrama de caja y bigote
comparativo entre los dos tipos de alojamiento. Podemos
observar como en los hoteles tradicionales el 50% de los datos
se encuentran más dispersos que los de los alojamientos de
Airbnb, además este 50% de datos se encuentran en un rango
de 150$ a 300$, mientras que en Airbnb el 50% de datos esta
entre 38$ a 93$.

También podría gustarte