Está en la página 1de 32

UNIVERSIDAD PERUANA DE CIENCIAS APLICADAS

ENTREGA DE SERVICIO DE TI EN UNA SOLUCIN DE BIG DATA PARA ANALIZAR Y PREDECIR EL COMPORTAMIENTO DEL TRFICO EN LA CIUDAD DE LIMA

Monografa que como parte del curso de Seminario de investigacin para Ingeniera Presentan los alumnos

Omar Bugosen Abi-Gosen Christian Tejada Ruiz

Noviembre 2013

A Dios.

RESUMEN

El tema de esta monografa trata sobre la entrega de servicio de TI en una solucin de Big Data para analizar y predecir el comportamiento del trfico en la ciudad de Lima. Con ello en mente, la hiptesis plantea que la implementacin de la gestin de servicio para Big Data permite el anlisis y prediccin del comportamiento del trfico mediante la excelencia en la entrega de servicio para "Big Data", el tratamiento de la informacin con herramientas de inteligencia de negocios y mediante el uso de informacin desde diferentes dispositivos. En el primer captulo se explican los conceptos de Big Data y de entrega de servicio de TI, as como los de componentes lgicos y fsicos involucrados con la entrega de servicio de TI para Big Data. En el segundo captulo abordamos el tema del anlisis del tratamiento de informacin de Big Data mediante el uso de herramientas de inteligencia de negocios y se explica el uso del servicio de Big Data desde diversos dispositivos para analizar y predecir el comportamiento del trfico. As, se concluye que el tratamiento de informacin con una solucin de Big Data provee un servicio para el anlisis y prediccin del trfico de la ciudad de Lima, para poder aliviar dicho inconveniente en la capital del Per.

NDICE

Introduccin Captulo 1. Entrega de servicio TI para una solucin Big Data 1.1 Concepto de Solucin de Big Data 1.1.1 Definicin y ventajas de Big Data 1.1.2 Consideraciones en el uso de Big Data 1.2 Componentes fsicos y lgicos de Big Data 1.2.1 El componente fsico o infraestructura de una solucin Big Data

VII 8 8 9 9 10 10

1.2.2 El aspecto lgico de una solucin Big Data: las fuentes y el tratamiento de datos 10 1.3 Concepto de entrega de servicio de TI 1.3.1 Definicin y tipos de servicio de TI 1.3.2 Organizacin dentro de la entrega de servicio de TI 1.4 Modelo de negocio de entrega de servicio de TI para Big Data 1.4.1 Determinacin del costeo segn el modelo de negocio 1.4.2 Valor econmico en el anlisis de tendencias 1.5 Fundamentos de una solucin de Big Data 1.5.1 Los 7 pasos necesarios para explotar el potencial de una solucin de Big Data 1.5.2 Inteligencia en un entorno Big Data Captulo 2. Tratamiento de informacin y uso de servicio Big Data 12 12 13 13 14 14 15

15 16 18

2.1 Anlisis de informacin de las herramientas de inteligencia de negocios 2.1.1 Servicio de entrega de informacin de Big Data 2.1.2 Soluciones de Inteligencia de Negocios para trfico y accidentes 2.2 Uso del servicio de Big Data mediante dispositivos mviles y computadoras 2.2.1 Caractersticas de Big Data en mviles 2.2.2 Informacin y equipos inteligentes 2.2.3 Pago mediante telfonos mviles Conclusiones Bibliografa

18 19 21 22 22 24 25 27 31

INTRODUCCIN

El panorama que observamos en el mundo est plagado de fenmenos nuevos y, de hecho, otros no tan nuevos. Es de importancia mencionar que la sociedad contempornea se encuentra inmersa en una diversidad de medios de comunicacin que, sin duda alguna, facilitan la vida a las personas. El funcionamiento de nuestra sociedad est estrechamente relacionado con el uso de tecnologas, las que naturalmente van evolucionando con el transcurrir del tiempo. Las diversas tecnologas que existen se vuelven mucho ms atractivas cuando, valga la pltora de palabras, tienen aplicaciones interesantes en la vida cotidiana de las personas. Uno de los tantos problemas que atraviesa nuestra sociedad limea, el trfico, urge de soluciones efectivas. Una manera de evitar el excesivo trfico vehicular es mediante el anlisis de este, ya sea para la eleccin de alguna va alterna o para la determinacin de las causas del congestionamiento que se observa da a da. La propuesta de anlisis se basa en la entrega de servicio de TI para una solucin de Big Data para analizar y predecir el comportamiento del trfico en nuestra ciudad: Lima. Quin no ha llegado tarde al trabajo por culpa del trfico? De quin es el agrado estar tanto tiempo en un aburridsimo embotellamiento? Es muy probable que los lectores sufran una catarsis con el simple hecho de imaginarse esas situaciones y, adems, es ms probable an que urjan de soluciones innovadoras y efectivas en costo y tiempo.

VI

VII

CAPTULO 1

ENTREGA DE SERVICIO DE TI PARA UNA SOLUCIN BIG DATA

La solucin de Big Data propone el adecuado tratamiento de grandes cantidades de informacin mediante herramientas de tecnologa para el anlisis y prediccin del trnsito vehicular. Ya sea mediante el uso de recursos de software o tangibles, la propuesta se enfoca en utilizar los recursos de la mejor manera para generar informacin de inters para cualquier agente interesado en el proyecto. Mitigar el trfico no es tarea sencilla y, para ello, se requiere el uso de tecnologas adecuadas. El presente captulo tiene como objetivo definir y explicar el concepto y las ventajas de una solucin Big Data para aportar soluciones de inters para el trfico, el cual ms bien se parece cada vez ms a un mal que se propaga por toda la ciudad. 1.1 Concepto de Solucin de Big Data El trmino Big Data est referido a sistemas que manipulan grandes cantidades de informacin. En ese sentido, conjuntos grandes de datos (como lo son los factores que influyen en la generacin del trfico) requieren ser procesados de manera adecuada, con tecnologas y tcnicas pertinentes y, claro est, en un tiempo oportuno. 1.1.1 Definicin y ventajas de Big Data
8

Big Data es considerado como un conjunto grande de datos caracterizados por su gran volumen y variedad, que son generados con rapidez y con un nivel de certeza relativo. De manera ms formal, se define formalmente a nuestro concepto de inters: Big Data [son las] tcnicas de anlisis para procesar grandes cantidades de informacin relativamente extensas (de terabytes hasta exabytes 1) y complejas () y que requieren del soporte de almacenamiento avanzado y especializado, as como de tecnologas de gestin, anlisis y visualizacin. (Ping Fung 2013)

Con lo mencionado por el autor, se considera que esta abundante cantidad de informacin requiere de equipos tecnolgicos especializados para poder ser analizados. Los datos sern extrados de formas particulares que sern luego explicadas, as como sern almacenados y tratados con herramientas relacionadas entre s. 1.1.2 Consideraciones en el uso de Big Data Es claro que a mayores volmenes de datos, las necesidades de tratamiento de estos van a ser especiales. Big Data representa la cambiante necesidad de procesar muchos datos con soluciones tecnolgicas innovadoras.2 As, se redondea la idea al considerar a Big Data como un conjunto de tecnologas y prcticas emergentes destinadas a coleccionar, procesar, descubrir y almacenar grandes volmenes de data de manera rpida y con eficiencia en temas de costos. La compatibilidad entre las herramientas a utilizar es importante, ya que en las fases de recoleccin, procesamiento y anlisis ser vital que las aplicaciones trabajen de manera conjunta para lograr resultados coherentes.

1 2

Un terabyte equivale a 1012 bytes y un exabyte equivale a 1018 bytes. Referencia Cfr. Dyche 2012

Con el concepto definido, resultar ms sencillo entender en subcaptulos posteriores los componentes lgicos y fsicos, adems de las aplicaciones de esta tecnologa para fines de nuestro inters. 1.2 Componentes fsicos y lgicos de Big Data Como es natural en cualquier solucin tecnolgica de cierta complejidad, Big Data se integra tanto por componentes lgicos como fsicos. Los componentes lgicos son aquellos en los que se basa Big Data para el tratamiento y anlisis de la informacin, como herramientas de software y sistemas operativos. Por su parte, los componentes fsicos son constituidos por equipos y recursos tangibles para el tratamiento y anlisis de la informacin, ya sean servidores, discos duros, equipos de cmputo, etc. 1.2.1 El componente fsico o infraestructura de una solucin Big Data Como se expuso lneas arriba, una solucin Big Data consta de componentes lgicos y fsicos que, si bien han sido definidos por separado, se complementan entre s y trabajan en conjunto. En este sentido, se sugiere tener la solucin de Big Data sobre clsteres de computadoras; es decir, sobre conjuntos de computadoras relacionadas entre s que funcionan como si fueran una sola.3 La idea de utilizar clsteres funciona bien, ya que as se provee una infraestructura dinmica y flexible frente a los cambios que pudiesen surgir en el tiempo. As, esto ser de utilidad para separar las aplicaciones de base de datos, sistemas de archivos, herramientas de anlisis de datos, etc. Estas aplicaciones constituyen el aspecto lgico de la solucin Big Data, a detallar a continuacin. 1.2.2 El aspecto lgico de una solucin Big Data: las fuentes y el tratamiento de datos

Cfr. Cisco 2013

10

Los datos que pueden alimentar a una solucin Big Data y, por ende, funcionar como materia prima para su tratamiento, se encuentran en todos lados. En un documento de investigacin de Big Data para entornos empresariales, se enumera algunos ejemplos: el constante monitoreo de la salud de los pacientes para tratar enfermedades crnicas, la permanente evaluacin de datos provenientes de sensores instalados en automviles para detectar patrones de uso y evitar accidentes, la deteccin de potenciales clientes que puedan ser identificados por el uso de dispositivos mviles y que estn cerca de una tienda, etc. 4 Es razonable concluir que los datos de velocidades promedio de los autos en una va dada, de la fecha y hora del da y hasta del clima son vlidos para su tratamiento y anlisis si lo que se desea es estudiar el comportamiento del trfico. Para fines prcticos sobre el tratamiento de una gran cantidad de datos, se propone dividir el tratamiento de estos en la recoleccin, organizacin y anlisis de la data.5 Para ello, en el componente lgico, se formula el uso de su sistema de base de datos NoSQL para la fase de recoleccin y almacenamiento de grandes cantidades de informacin. Con dicha aplicacin, se asegura que los datos se almacenarn en una estructura simple y dinmica que permitir flexibilizar el tratamiento de la informacin para evitar incurrir en costosos cambios de ser necesaria alguna modificacin6. Para la organizacin, se sugiere la tecnologa Hadoop, sistema de archivos que permite una carga rpida de datos en la base de datos. Para el anlisis, se sugieren soluciones gratuitas que permitan el anlisis estadstico de datos y la minera de datos.7 Esta distribucin de aplicaciones y componentes es adecuada para el proyecto, ya que las computadoras podrn tomar decisiones sobre cmo acomodar los
4 5

Cfr. Oracle 2012: 4 Cfr. Oracle 2012: 5 6 Cfr. Oracle 2012: 5 7 La minera de datos se refiere al proceso de detectar patrones en grandes volmenes de datos.

11

distintos elementos relacionados a los datos tomados del trfico y, de esa manera, arrojar resultados en tiempos adecuados en comparacin si no se usase la tecnologa para descentralizar la carga de trabajo sobre los grandes volmenes de datos a tratar. El diagrama de despliegue de la solucin tanto lgica como fsica se muestra en la Figura 1. Figura 1: Solucin de Big Data Oracle integrada

Fuente: Oracle 2013 As, y como cierre a la explicacin de los componentes lgico y fsico, podremos ahora definir el concepto de entrega de servicio de TI. 1.3 Concepto de entrega de servicio de TI 1.3.1 Definicin y tipos de servicio de TI

12

Definimos a la entrega de servicio de TI como un conjunto de principios, estndares, polticas y procesos que se usan para disear, desplegar y operar tecnologas por parte de un proveedor con experiencia en el contexto de negocio de TI. La entrega de servicio de TI en una organizacin puede consistir en proveer diversos servicios como servicios de servidores, almacenamiento, networking8, seguridad, recuperacin de desastres, control de activos, gestin de servicios y aplicaciones de TI.9 1.3.2 Organizacin dentro de la entrega de servicio de TI Es de importancia decidir cmo es que se van a formar los grupos de trabajo. La entrega de servicio de TI puede ser realizada de varias formas, como se menciona a continuacin: La entrega de servicio de TI es realizada por equipos de trabajo, que bien pueden ser trabajadores contratados, contratistas, proveedores en los que se terceriza el trabajo, o una mezcla de los mencionados. (Ping Fung 2013: 2)

Con conceptos claros sobre la entrega de servicio de TI y de una solucin Big Data, podemos presentar y explicar ya un bosquejo de modelo de negocio que relacione la entrega de servicio con la solucin tecnolgica para grandes bases de datos. 1.4 Modelo de negocio de entrega de servicio de TI para Big Data A partir de la automatizacin de la recoleccin, organizacin y anlisis de datos, se pueden idear interesantes modelos de negocio para ser ofrecidos al cliente. Como ejemplo, podemos recolectar fotos de las placas de autos que circulen por una avenida determinada a una hora dada, para descubrir informacin que est detrs de la placa del auto capturado.

8 9

El trmino networking se refiere a la integracin de dos o ms redes de computadoras. Cfr. Ping Fung 2013: 2

13

As, podremos obtener la marca y modelo del auto, as como identificar a su propietario. Con esta informacin, se podra indagar en bases de datos relacionadas para determinar el nivel socioeconmico de la persona y, as, determinar (luego de detectar patrones en la avenida tratada) la publicidad a colocar en la ruta, por ejemplo. Sin embargo, nuestra materia de estudio no es el anlisis del poder adquisitivo de los conductores, sino el trfico que se genera en dicha avenida en circunstancias especiales. De esta forma, el negocio toma un giro algo distinto: se registrar el nmero de autos que circulan por una va dada, en una fecha y hora especfica. Con esta informacin, adems del clima y de otros factores como la proporcin de transporte pblico, se podrn tratar los datos recolectados para generar estadsticos e incluso predecir cmo sern las condiciones del trfico en el futuro. 1.4.1 Determinacin del costeo segn el modelo de negocio La entrega de servicio de TI para Big Data puede ser til para muchas personas (en el caso del trfico, por ejemplo, para la Municipalidad de Lima) y, adems, ser preciso vender dicho servicio como corresponda. Para calcular los costos, se sugiere diferentes modelos de negocio, como la distribucin prorrateada de costos, fijacin de precios a mano alzada, precios escalera, precios por unidad multiplicada por cantidad, etc.10 Como ejemplo, podra cobrarse ms al cliente mientras el anlisis sea ms preciso; por ejemplo, cuando una mayor cantidad de datos haya sido analizada y procesada de manera adecuada con herramientas de Inteligencia de Negocios, a detallar en el prximo subcaptulo. 1.4.2 Valor econmico en el anlisis de tendencias Como se mencion lneas arriba, es propicio considerar muchos datos que pudiesen en el trfico vehicular de Lima (y, de hecho, lo hacen). As, se indica que factores como el clima,
10

Cfr. Ping Fung 2013: 8

14

las noticias y otros aspectos coyunturales (como partidos de ftbol) que afecten el trfico podrn y sern recogidos de diversas fuentes digitales de data y as nos proveern de anlisis ms precisos que redunden en nuevas fuentes de valor econmico para el modelo de negocio.11 Asimismo, y como corolario del prrafo anterior, la recoleccin, organizacin y anlisis de la data mencionada permitir tomar decisiones mejor informadas. Ahora bien, conocemos el mecanismo del modelo de negocio y su interaccin con la solucin de Big Data, pero ahora profundizaremos en el anlisis de dicha interaccin entre la data y su tratamiento con herramientas de inteligencia de negocios. 1.5 Fundamentos de una solucin de Big Data En esta seccin se explicarn los fundamentos de una solucin de Big Data mediante la Inteligencia de Negocios (BI, Business Intelligence, por sus siglas en ingls). 1.5.1 Los 7 pasos necesarios para explotar el potencial de una solucin de Big Data Para explotar el potencial de una solucin de Big Data, los pasos necesarios son: 1) recolectar, 2) procesar, 3) gestionar, 4) medir, 5) consumir, 6) almacenar y 7) gobernar.12 Ahora detallaremos cada paso a continuacin: Recolectar

La data se recolecta desde distintas fuentes, como fue explicado anteriormente. Luego, se distribuye en otros nodos (como se explic en la solucin basada en clsteres), donde a su vez un subconjunto de la data es procesada para descentralizar la carga de trabajo. Procesar

11 12

Cfr. Oracle 2013: 15 Cfr. Dyche 2012

15

La data se procesa y depura para ser ms fcil de entender para los analistas. Luego, ser utilizada para ser analizada por otras herramientas, como por ejemplo de Inteligencia de Negocios. Gestionar

Toda la data que fue obtenida de diversas fuentes se limpia y homogeniza bajo estndares de seguridad pertinentes. Medir

Se deber medir que porcentaje de la data es til para ser utilizada de manera concomitante con otros datos para su anlisis e interpretacin. Consumir

Los requerimientos de consumo de data debern estar supeditados a los resultados que se hayan obtenido de manera histrica; es decir, si una fuente arroj data de valor en el pasado, entonces ser adecuado volver a utilizar dicha fuente. Almacenar

Se deber contar con soluciones de almacenamiento para corto y largo plazo. Gobernar

El gobierno de data est referido a las polticas que manejan todos los 6 pasos anteriores aqu descritos. 1.5.2 Inteligencia en un entorno Big Data Segn Sokol y Ames, doctores que colaboraron en una investigacin realizada por IBM: La inteligencia de negocios se asegura con la extraccin de caractersticas, contextualizacin y conocimiento de la situacin, modelado predictivo y anlisis de los datos (IBM Redbooks 2013)

16

La extraccin de caractersticas se refiere a la extraccin de informacin de forma estructurada de una fuente. En lo que a contextualizacin y conocimiento de la situacin refiere, no siempre ms datos significan mayor inteligencia; los datos deben estar en un contexto dado y deberemos saber de qu tratan y qu podemos obtener de ellos. El modelado predictivo tiene que ver con la prediccin de eventos basada en data histrica relacionada. Finalmente, el anlisis de los datos tiene que ver con analizar cada dato que se extraiga, buscar su relacin con los dems y acomodarlo para que pueda proveer informacin. En resumen, las nuevas tecnologas de BI permitirn analizar grandes y variados volmenes de datos con costos razonables. Esto es de especial inters para el proyecto, pues el parque automotor se hace cada vez ms grande, y conviene ser cautos con la data a tratar para arrojar resultados coherentes y en tiempos adecuados.

17

CAPTULO 2

TRATAMIENTO DE INFORMACIN Y USO DE SERVICIO BIG DATA

2.1 Anlisis de informacin de las herramientas de inteligencia de negocios Los datos obtenidos y procesados con el servicio Big Data, de la manera que se expuso en el captulo anterior, nos sirvi como referencia para entender la importancia que tienen los datos en una aplicacin prctica dada, como es el caso del trnsito vehicular. Ahora bien, en tiempos de innovacin, se propone la creacin y uso de una plataforma integrada de inteligencia de negocios y de Big Data13. La razn de esto tiene que ver con que la integracin entre ambas tecnologas nos va a asegurar una fuente de datos confiables, lo que a su vez redundar en sistemas con las mismas caractersticas. Para la integracin de datos estructurados y no estructurados se deben combinar soluciones de tecnologa que permitan el depsito de ambos tipos de datos; en ese sentido, IBM refiere: En la capa de almacenamiento de depsito de datos, Netezza es una gran opcin para su sistema de base de datos de MPP. Este sistema est equipado para los datos estructurados, pero cuando usa Hadoop o Cassandra para datos sin estructura o semiestructurados es posible crear una plataforma integrada de BI y analtica de big data (IBM Developer Works 2013) De esta manera, se asegura que la solucin Big Data cuente con datos estructurados y datos que no lo son, como objetos sin estructura uniforme, ya sea texto, audio, video, datos de

13

Cfr. IBM Developer Works 2013

18

sensores, fotopapeletas14, informacin sobre el clima, placas de los autos, publicaciones en redes sociales, seales de GPS de telfonos mviles, etc. El anlisis de toda la informacin relativa a los puntos mencionados lneas arriba nos ayudar a indagar sobre problemas del trfico e incluso se podran mitigar riesgos, pues se cuenta con diversas fuentes de informacin relevante en comparacin a las bases de datos tpicas o relacionales que slo contemplan datos estructurados, como texto o cadenas de caracteres que no ayudan mucho. Esto significa que, claramente, nos encontramos al frente de una oportunidad para realizar anlisis de mayor complejidad, ya que contamos con ms fuentes de informacin de calidad que, al interpretarlas de manera inteligente, podremos sacarles provecho. 2.1.1 Servicio de entrega de informacin de Big Data Un servicio de entrega de informacin Big Data especializado provee informacin de trfico, data histrica sobre rutas determinadas, mapas con el volumen de trfico en un momento dado, velocidades de los autos, condiciones de la carretera y otros tipos de informacin sobre el trfico que se haya registrado antes o incluso que se est registrando en el presente.15 La figura 2 nos muestra un despliegue asociado a una solucin Big Data, donde se puede apreciar la manera en la que se obtienen los datos desde diversas fuentes, tales como dispositivos mviles de conductores o peatones, informacin de servicios telemticos que registren el nmero de autos que circulan por un lugar en una hora dada y a una velocidad determinada o incluso de otras fuentes como lo son redes sociales.
14 15

Las fotopapeletas son multas aplicadas a los vehculos por transitar a velocidades no permitidas. Cfr. Green Car Congress 2013

19

Figura 2: Diagrama de una solucin Big Data

Fuente: Green Car Congress 2013 Los vehculos que cuenten con equipos de telemtica; es decir, que enven mensajes con informacin sobre el vehculo (marca, modelo, velocidad, equipamiento) constituyen informacin valiosa en la medida que, adems de aplacar el trfico, puede reflejar el nivel socioeconmico de la persona que lo conduce. Una gran cantidad de vehculos que fluyan por una avenida dada y que tengan caractersticas de pertenecer a gente de clase media, podrn alimentar la idea de colocar publicidad relacionada a su estilo de vida en lugares aledaos. Otra forma de usar la informacin de marca y modelo es, si por ejemplo, se identifican muchos camiones grandes que circulan por una ruta determinada. Esto propiciar tomar medidas en cuanto a desvos, planes de reordenamiento del trnsito o incluso podra hacer pensar al gobierno en la construccin de nuevas carreteras. Datos del tipo estructurado como marca, modelo, velocidad son tan tiles como los datos no estructurados, y no deber subestimarse la capacidad de aporte de cada uno de estos.
20

2.1.2 Soluciones de Inteligencia de Negocios para trfico y accidentes La informacin obtenida por los medios ya descritos es de suma utilidad para gobiernos y empresas que, al contar con dicha informacin, podran ayudar a aliviar el trfico e incluso conocer la ubicacin de lugares seguros o de asistencia mdica en caso de desastres naturales. Todos los datos obtenidos deben ser aprovechados al mximo; por ejemplo, conocer qu porcentaje de autos que cuente con sistema de ABS16 permite manejar ese dato para luego establecer una relacin entre dicha mtrica medida en una ruta y compararla con la tasa de accidentes en ese mismo camino; por otro lado, se puede conocer si los conductores de vehculos que transiten por un lugar en el que haya ocurrido un siniestro cuentan con un Smartphone, lo que ayudara a indicarles por medio de una aplicacin los lugares de evacuacin ms cercanos, as como equipos de rescate que pudiesen estar disponibles. Otro dato de inters (del tipo no estructurado) para aliviar el trfico seran las imgenes de los lugares con ms trfico que sean compartidas por conductores que cuenten con un Smartphone o Tablet, de manera que los potenciales interesados (la municipalidad, por ejemplo) puedan enviar refuerzos como policas de trnsito para aliviar la carga vehicular. Es claro que el procesamiento de los datos antes de ser utilizados es de suma importancia. Por ese motivo, los datos se cargan en una solucin de inteligencia de negocios, de manera que se filtren para que sean utilizados nicamente los datos que sern luego informacin con integridad, oportunidad y disponibilidad pertinentes.

16

Sistema Antibloqueo de Frenos (o ABS por sus siglas en ingls), que sirve para impedir el bloqueo de las llantas en una frenada fuerte, lo que podra causar accidentes al perderse estabilidad. Referencia

21

En conclusin a este punto, la informacin debidamente recogida por una solucin de Big Data y tratada con herramientas de inteligencia de negocios mejora la calidad de vida de las personas y alivia accidentes por los motivos ya expuestos. 2.2 Uso del servicio de Big Data mediante dispositivos mviles y computadoras 2.2.1 Caractersticas de Big Data en mviles El servicio de entrega que se detall da cuenta de la forma en la que por medio de informacin recibida en grandes cantidades y por distintos usuarios, se logra alimentar el servicio de informacin Big Data con el propsito de aliviar el trfico o de asistir zonas en las que haya ocurrido algn tipo de siniestro. En la figura 3 se muestra la aplicacin mvil de Twitter, en la que se aprecia cmo los usuarios colaboran informando sobre las zonas de mayor trfico. En este caso, los tweets17constituyen un dato del tipo no estructurado y son relativamente nuevos para ser tratados en una base de datos con una solucin de inteligencia de negocios. Este tipo de informacin resulta til pues es obtenido en tiempo real y se puede procesar para tomar acciones de inmediato, como aliviar el trnsito; o bien a mediano o largo plazo, para proponer soluciones, arreglar las pistas, colocar semforos donde sea propicio o tomar otras medidas como las que se propusieron en el punto previo.

Figura 3: Aplicacin mvil que informa sobre el estado del trfico

17

Un tweet es un mensaje corto y de cualquier tipo que se publica en la red social Twitter. Referencia

22

Fuente: Twitter 2013 Es bastante comn que la gente opine sobre temas sociales y polticos; entonces, por qu no aprovechar lo que la gente opine sobre el trfico vehicular? Los tweets en mencin logran funcionar como una encuesta que se realiza de manera permanente con la finalidad de conocer los sitios con mayor congestin de vehculos en la ciudad. Estos mensajes de corta extensin tambin informan sobre accidentes vehiculares, temblores, sugerencias de atajos y otros consejos que pueden ser de gran ayuda a los ansiosos conductores de la ciudad. Adems de ser consumida esta informacin por otros conductores, tambin forman parte de un gran conjunto de datos no estructurados que podrn ser tratados por el servicio de informacin de Big Data para procesarse con herramientas de inteligencia de negocios.
23

2.2.2 Informacin y equipos inteligentes Un tipo de informacin que muchas veces la gente ignora est relacionada con las obras en las autopistas o eventos como conciertos o ferias que se van a llevar a cabo.18 Circunstancias eventuales como esta generan mucho trfico por la gran afluencia que dichos eventos suelen tener. Un servicio de informacin que se alimente de fuentes que indiquen la mayor cantidad de causas que provoquen congestin vehicular es preciso para el diagnstico y alivio de esta. Otros datos del tipo no estructurado tambin son de gran utilidad cuando son captados por el servicio de informacin de Big Data. Hay ciertos tipos de data que pueden o no ser obtenidos por colaboracin de los usuarios: el volumen del trfico puede ser captado por cmaras de seguridad; sin embargo, algunos detalles o datos son mejor interpretados cuando una persona describe algn fenmeno en especial que pudiese estar ocurriendo y generando trfico. Sea cual fuere el motivo del trfico, la idea de la inteligencia de negocios radica en utilizar tcnicas y herramientas de minera de datos para detectar patrones que permitan explicar y hasta predecir el comportamiento del trfico, ya sea para evaluar cuando habr mayor o menor congestin, o para obtener informacin nueva e interesante para los clientes de la solucin. El gobierno funciona como cliente en la medida que consumira informacin obtenida por medios innovadores y con un tratamiento inteligente de la data recolectada. Por otro lado, diversas empresas que anuncien en la va pblica tambin funcionaran como clientes, siempre y cuando se logre brindar una informacin objetiva y suficiente sobre las caractersticas de conductores que circulen por una va determinada de la ciudad: sucede
18

Cfr. Siemens AG 2013: 6

24

que todos los conductores son potenciales clientes de algn bien o servicio que se ofrezca en carteles, y con mayor razn si es que el producto en promocin coincide con sus preferencias. 2.2.3 Pago mediante telfonos mviles La tendencia en cobro de tarifas de peaje est orientada al uso de tarjetas recargables o incluso de los telfonos mviles, con lo que se agilizara el proceso de pagar el peaje y se evitaran costos derivados de la recaudacin de dicho gravamen.19 Lo mismo ocurre con los estacionamientos: un sistema de cobro automtico evitara colas a la entrada y salida de locales de aparcamiento de autos. Lo importante en la posibilidad de la proliferacin de estas tecnologas es que se tiende a reducir tiempos de espera y costos de recursos humanos, a la vez que se realizan esfuerzos constantes para llevar a cabo una reingeniera de todos los procesos de una empresa a fin de hacer al negocio ms eficiente y cmodo para los usuarios. Podrn considerarse adems otras formas de cobrar de manera ms rpida el peaje o los estacionamientos. Dado que el uso de dispositivos mviles con acceso a datos es cada vez ms difundido, se podra tomar el nmero de telfono como otra entrada en la tabla de la base de datos asociada a un automvil o conductor, para as relacionar el pago de servicios con una persona. Adicionalmente, podr estudiarse cul fue el estacionamiento ms usado, por cunto tiempo, cuntas veces se paga el peaje por semana, etc. Otra forma de realizar la cobranza podra ser con la utilizacin de sistemas de reconocimiento de placas; las que, obviamente, estarn almacenadas en una base de datos para poder corroborar si es que estn o no afiliadas a los servicios de pago adelantado de peajes o estacionamientos.
19

Cfr. Siemens AG 2013: 6

25

En conclusin, los dispositivos mviles brindan la posibilidad de enviar informacin al servicio de Big Data y, por otro lado, permiten tambin el acceso a la informacin con mayor rapidez. Finalmente, observamos que el uso de estas tecnologas mejoran los procesos cotidianos que generan trfico, como lo es el pago del peaje.

26

CONCLUSIONES

Grandes cantidades de informacin requieren ser tratadas de manera especial con herramientas de tecnologa apropiadas, como lo es Big Data.

En la implementacin de una solucin Big Data, es preciso escoger adecuadamente los recursos lgicos y fsicos que sern utilizados. En el aspecto fsico, es recomendable utilizar clsteres de computadoras (o conjunto integrado de equipos de cmputo) de manera que la carga de trabajo sea distribuida y se pueda procesar la informacin en tiempos adecuados. En el aspecto lgico, se recomienda el uso de la base de datos de Oracle NoSQL, en la medida que esta ofrece estructuras simples y dinmicas que son flexibles frente a cambios. Otras tecnologas sugeridas son Hadoop, eficiente gestor de sistemas de archivos y otras soluciones que permiten el anlisis estadstico de datos y la minera de estos (o el descubrimiento de patrones en conjuntos de datos).

La entrega de servicio de Big Data es de utilidad para muchos agentes interesados, de manera que el proyecto puede funcionar como idea de negocio para clientes como municipalidades o empresas privadas interesadas en el anlisis del trfico vehicular y factores relacionados a este.
27

Una solucin de Big Data se vale de siete pasos fundamentales en el tratamiento de la informacin, que son: recolectar, procesar, gestionar, medir, consumir, almacenar y gobernar.

En soluciones de Big Data, es propicio contextualizar los datos a tratar, as como tener conocimiento de los mismos, ya que de esa manera se podrn tomar decisiones mejor informadas sobre la informacin que se quiere obtener de los datos recolectados.

Un servicio de entrega de informacin de Big Data logra captar informacin de diversas fuentes para almacenarlas y tratarlas segn sea conveniente. Todas las fuentes deben ser consideradas como importantes, y toda informacin del pasado y del presente se podr utilizar para analizar el trfico y predecirlo en un futuro.

La informacin obtenida en el servicio de Big Data sirve para analizar el equipamiento de seguridad de automviles y relacionarlo con las tasas de accidentes, tambin para obtener la ubicacin de accidentes y enviar ayuda, as como los usuarios podrn enviar tweets o imgenes de las zonas con trfico para aliviarlo de inmediato, proponer soluciones a mediano o largo plazo (en forma de propuestas del gobierno) e incluso para estudiar las causas de la congestin vehicular.

28

La informacin obtenida por cada usuario por el servicio Big Data para ser procesada y utilizada funciona como una encuesta, ya que cada vehculo representa una incidencia sobre los lugares con ms trfico.

La informacin obtenida por el servicio Big Data deber ser oportunamente procesada por herramientas de inteligencia de negocios, con la finalidad de detectar patrones en el comportamiento del trfico y poder proponer soluciones. Causas como obras en las vas y la realizacin de eventos de gran escala pueden generar congestin vehicular.

El cobro tradicional de peajes y otros procesos cotidianos a estudiar son causantes de trfico vehicular, por lo que es recomendable utilizar tecnologas como el cobro automtico de las tarifas por medio de equipos relacionados con telfonos inteligentes o tarjetas recargables.

En conclusin, diversas fuentes colaboran con la obtencin de informacin para la identificacin de las causas del trfico; las que podrn ser tratadas por el gobierno si as se decide. Dicha informacin estar compuesta por datos tanto estructurados como no estructurados, pudiendo componerse por tweets, imgenes, monitoreo del trfico o videos. Cada reporte independiente de los conductores ser analizado con herramientas adecuadas de inteligencia de negocios, de manera que se puedan detectar patrones para la posterior propuesta de soluciones. En conclusin, diversos fenmenos o eventualidades pueden ser las causas de la congestin vehicular que se

29

observa a diario, por lo que ser propicio atender cada incidencia con la importancia que se merece para poder proponer soluciones basadas en tecnologa como el uso de servicios telemticos o una comunicacin que facilite la identificacin de las causas, a fin de evitarlas o mitigar el efecto de las mismas.

30

BIBLIOGRAFA

CISCO (2013) Cisco UCS with StackIQ Solution: Deliver Big Infrastructure for Big Data (consulta: 25 de setiembre) (http://www.cisco.com/en/US/solutions/collateral/ns340/ns517/ns224/ns944/whitep aper_c07-727919.html) DYCHE, Jill (2012) The seven steps of big data delivery (consulta: 25 de setiembre de 2013) (http://www.sas.com/news/sascom/big-data-delivery.html) GREEN CAR CONGRESS (2013) Toyota to launch new Big Data Traffic Information Service in Japan (consulta: 25 de setiembre) (http://www.greencarcongress.com/2013/05/tmc-201230529.html) IBM Developer Works (2013) Analtica de inteligencia de negocios de Big Data (consulta: 30 de octubre) (http://www.ibm.com/developerworks/ssa/library/ba-bigdata-bi/) IBM Redbooks (2013) Analytics in a Big Data Environment (consulta: 25 de setiembre) (http://www.redbooks.ibm.com/redpapers/pdfs/redp4877.pdf) IBM The Big Data Hub (2013) Sitio web oficial de IBM, contiene informacin sobre Big Data y enlaces de inters (consulta: 25 de setiembre) (http://www.ibmbigdatahub.com/whitepapers) LARSON, Eric (2013) 5 Big Data Projects That Could impact Your Life (consulta: 25 de setiembre) (http://mashable.com/2013/07/17/big-data-projects/) ORACLE (2013) Oracle: Big data for the Enterprise (consulta: 25 de setiembre) (http://www.oracle.com/us/products/database/big-data-for-enterprise-519135.pdf) PING FUNG, Han (2013) Using Big Data Analytics in Information Tchnology (IT) Service Delivery (consulta: 25 de setiembre)
31

(http://www.academia.edu/3567945/Using_Big_Data_Analytics_in_Information_T echnology_IT_Service_Delivery) SIEMENS AG (2013) Soluciones inteligentes para el trfico de hoy y del maana (consulta: 25 de setiembre) (https://www.swe.siemens.com/spain/web/es/industry/mobility/Documents/traffic.p df) TWITTER (2013) Trfico (https://twitter.com/traficorpp) RPP (consulta: 31 de octubre)

32

También podría gustarte