Está en la página 1de 7

Nº DE IDENTIFICACIÓN EXPEDIENTE CEN-20091026 | ACRÓNIMO DEL PROYECTO BUSCAMEDIA

BUSCAMEDIA
HACIA UNA ADAPTACIÓN SEMÁNTICA DE MEDIOS DIGITALES
MULTIRRED- MULTITERMINAL
PROYECTO CENIT-E

Cloud computing
Ana Juan Ferrer, Jose Miguel Garrido
Atos Origin

INFORMACIÓN DEL ARTÍCULO RESUMEN

Publicado el 3 de mayo del 2010


Cloud Computing es una de las tendencias que han emergido con más
fuerza en los últimos años. En este documento se definen algunos
conceptos comúnmente empleados en Cloud Computing y se
Palabras clave: cloud computing,
buscamedia, eucalyptus, amazon,
relacionan con las necesidades de Buscamedia. Se presentan
EC2, S2, almacenamiento, P2P brevemente algunas alternativas que pueden ser útiles para el
despliegue de Buscamedia y se dan unas recomendaciones para la
implementación.

AVISO LEGAL

El trabajo asociado a este documento se ha llevado a cabo de acuerdo con las mayores garantías de calidad técnica y los socios de
BUSCAMEDIA se han comprometido a alcanzar este nivel de rigor con el trabajo en cuestión. No obstante los socios de BUSCAMEDIA
no tienen control sobre quién recibe la información de este documento, por lo que no se hacen responsables del uso que se pueda hacer
de dicha información.

© Reservados todos los derechos.

Se permite su copia y distribución por cualquier medio siempre que se mantenga el reconocimiento de sus autores, no se haga uso
comercial de las obras y no se realice ninguna modificación de las mismas

¿Qué es Cloud Computing? Cloud computing es una forma de


estandarización de los entornos de TI basada
En líneas generales, el paradigma del Cloud
en la capacidad - de los servicios basados en
Computing se basa en cambiar la ubicación de
Internet, software, o infraestructuras de TI - de
la infraestructura a la red basado en modelos
ser ofrecidos por un proveedor de servicios
de pago por uso que permiten reducir lo
que es accesible a través de los protocolos de
costes asociados a la gestión de recursos
Internet, desde cualquier ordenador, siempre
hardware y software.
disponible y escalable automáticamente para
Una de las primeras dificultades al hablar de adaptarse a la demanda, ya sea a mediante el
Cloud Computing es lograr establecer un pago por uso o subscripción a estos servicios.
vocabulario común. A nivel académico y Dispone de una Web o interface de control
empresarial, se han postulado varias programática permitiendo al cliente pleno
definiciones de Cloud Computing y sus control de auto-servicio.
funcionalidades:
El prestigioso analista Gartner define el Cloud
Forrester ofrece esta visión: como:

1
Cloud computing es un estilo de computación cuál sea la ubicación de su infraestructura. En
escalable donde las capacidades de entornos un sistema Cloud, normalmente se da a los
de TI son entregadas como un servicio a usuarios la posibilidad de abastecerse
clientes externos utilizando las tecnologías de únicamente de los recursos estrictamente
Internet. necesarios. En principio, de cara a los
Telefónica I+D y SAP lo definen como: usuarios, el sistema tiene unos recursos
infinitos, que puede solicitar según su
Los Clouds en definitiva son un gran número necesidad sin preocuparse de problemas de
de recursos generalmente virtuales fácilmente asignación de recursos.
utilizables y accesibles tales como hardware,
plataformas de desarrollo y/o servicios. Estos Normalmente, el usuario puede beneficiarse de
recursos pueden ser reconfigurados un modelo de pago por uso de estos servicios
dinámicamente para adaptarse a una carga mediante un acuerdo general de servicio (SLA)
variable (escalable) así como permitir una y conociendo a priori el coste que supondrá su
óptima utilización de los recursos. Este utilización durante un cierto periodo de tiempo.
conjunto de recursos puede ser explotado por Esta es la perspectiva que verán las personas
el proveedor de la infraestructura a través de que usen Buscamedia. Buscamedia será una
un modelo de pago por uso por medio de aplicación “desde la nube”, la mayor parte de
SLAs personalizados. la funcionalidad estará accesible por medio de
La definición NIST (National Institute of Internet y el usuario no tendrá necesidad de
Standards) de Cloud Computing es: preocuparse por la asignación de recursos.

Cloud computing es un modelo para permitir Perspectiva del proveedor


un acceso a un conjunto de recursos Las infraestructuras Cloud, son diseñadas con
computacionales compartidos (por ejemplo, el objetivo de ser escaladas añadiendo nuevos
redes, servidores, almacenamiento, recursos computacionales en caso de un pico
aplicaciones y servicios), de forma conveniente en la demanda o simplemente utilizando los
y a petición. Los recursos pueden ser recursos de un proveedor externo. Se
rápidamente provisionados y liberados con pretende que se trate de infraestructuras
mínimo esfuerzo de gestión o interacción con flexibles, proporcionando una completa
el proveedor del servicio. adaptación de sus recursos computacionales,
Cualquiera de las definiciones anteriores como memoria, capacidad de procesamiento
puede ser adecuada para el caso de o almacenamiento.
Buscamedia. No obstante quizá la visión de Permite desacoplar los recursos, favoreciendo
nuestro proyecto sea más coherente con la el multipropósito de la infraestructura pudiendo
definición de Gartner, que en cualquier caso es compartir varios cometidos sin necesidad de
la más general. preocuparse de cómo otros recursos han sido
Otra forma de definir el Cloud Computing es diseñados y sin comprometer su seguridad y
definiendo las características deseables que privacidad. Las aplicaciones pueden ser
deben cumplir este tipo de infraestructuras, compuestas utilizando y reutilizando servicios
considerándolo tanto desde el punto de vista débilmente acoplados e independientes entre
de los usuarios de estos recursos como desde sí, ofreciendo sus funcionalidades como un
la perspectiva del proveedor de la servicio para el usuario final, en ocasiones
infraestructura. disponible bajo demanda.
Perspectiva de usuario Ayudándose de una estricta monitorización
tanto del comportamiento de la infraestructura
Los recursos son presentados a los usuarios
como de sus recursos físicos, se pretende
de forma transparente con independencia de

 
Nº DE IDENTIFICACIÓN EXPEDIENTE CEN-20091026 | ACRÓNIMO DEL PROYECTO BUSCAMEDIA

conseguir eficiencia y predictibilidad con el aplicación SaaS, sobre todo en los aspectos
objetivo de crear una infraestructura auto- como buscador.
reparable en caso de fallo.
PLATAFORMA COMO SERVICIO (PaaS):
En el caso de Buscamedia, usando una
En este nivel se encuentran los proveedores
arquitectura Cloud en vez de una tradicional
de entornos Cloud que suministran a los
para el Centro de Proceso de Datos, se
desarrolladores una interface programática
pretende aprovechar las ventajas de
con un conjunto de APIs y entornos de
escalabilidad. No se pretende que el CPD sea
ejecución bien definidos para facilitar la
compartido con otras aplicaciones, pero sí que
interacción y creación de los diferentes
tenga la flexibilidad para responder a las
entornos y aplicaciones en el Cloud.
necesidades computacionales.
Se distinguen dos tipos de plataformas: las
Cloud stack
que permiten la personalización de los
Se suele dividir el modelo Cloud en capas o servicios de un proveedor de SaaS y las que
niveles, cada uno de ellos proporciona un nivel permiten la interacción con los diferentes
mayor de abstracción en el servicio y puede servicios de infraestructura de un proveedor
estar compuesto utilizando el nivel inferior. (IaaS).
Existen otras clasificaciones que distinguen
En esta categoría se incluyen plataformas
mas niveles pero la clasificación en 3 niveles
como Google App Engine, Microsoft Azure o
es con mucho la más extendida.
Sales de Salesforce.com.
SOFTWARE COMO SERVICIO (SaaS): Buscamedia no va a ofrecer servicios PaaS a
En la parte más alta, encontramos la capa de usuarios finales. En este momento no es
aplicaciones provistas en el Cloud. Es la previsible el uso de un modelo PaaS dentro
primera que aparece incluso antes que el de la arquitectura de Buscamedia.
concepto Cloud Computing, siendo el más INFRAESTRUCTURA COMO SERVICIO (IaaS):
extendido en la actualidad. Es un modelo de
En ocasiones también llamado “Hardware
provisión de software donde las aplicaciones
como Servicio”, plantea la posibilidad de
están alojadas en infraestructuras externas a la
aprovisionar parte de una infraestructura como
del consumidor, son accesibles a los usuarios
un servicio. Generalmente estas
a través de Internet, disponibles bajo demanda
infraestructuras se presentan como un entorno
y generalmente con un modelo de pago por
virtualizado.
uso o gratuito.
Está enfocado a evitar la infra-utilización de las
Los ejemplos de software como servicio son
infraestructuras, dando la posibilidad de
numerosos, siendo uno de los más conocidos
reaprovechar los servidores, el espacio en los
Google Docs, pero en general cualquier
centros de datos y los equipamientos de red.
servicio “desde la nube” para usuarios finales
se puede considerar SaaS, incluyendo IaaS esta ejemplificado como mayor
buscadores multimedia como Youtube. Se exponente por Amazon Web Services o Elastic
espera que gran parte de las aplicaciones Compute Cloud (EC2), de los que hablaremos
tradicionales migren a un modelo SaaS en el más adelante.
futuro.
Se pretende que Buscamedia emplee
Buscamedia desde el punto de los clientes herramientas de IaaS para crear la
finales se puede considerar en general una infraestructura escalable del Centro de
Proceso de Datos, aunque no ofrezca

3
servicios de IaaS a clientes finales. Además, Se puede ver al Cloud privado como la
Buscamedia pretende hacer uso de las evolución del uso de la virtualización en el
tecnologías de IaaS en conjunción con Centro de Proceso de Datos de una
herramientas de análisis distribuido de datos organización.
tipo Hadoop para el proceso distribuido y
CLOUD HÍBRIDOS:
paralelo de grandes volúmenes de datos
requeridos por Buscamedia para la indexación Se llama Cloud hibrido a unir un Cloud privado
de contenidos. con un Cloud público y usar una combinación
de ambos según las necesidades provocadas
Modelo de negocio
por la demanda.
Las clasificaciones anteriores son adecuadas
La posibilidad inmediata para Buscamedia es
desde el punto de vista técnico, pero en la
el despliegue en un Cloud privado, organizar el
práctica, una forma muy conveniente y muy
Centro de Proceso de Datos utilizando
utilizada para clasificar las distintas tipologías
herramientas Cloud.
de Cloud Computing es basándose en su
modelo de negocio o de quien es la propiedad No obstante, mediante el uso de tecnologías
de los recursos computacionales. adecuadas, es posible hacer una transición
sencilla a un Cloud público comúnmente
CLOUD PÚBLICO
utilizado. De este modo, se asegura que
Son análogos a las compañías suministradoras Buscamedia puede disponer de unos recursos
de “utilities” o “commodities” como agua o potencialmente ilimitados para responder a
electricidad. cualquier demanda.
Ejemplos clave incluyen Amazon Web Services Cloud públicos: Amazon Web Services
(como EC2 para computo y S3 para
La tienda online Amazon es actualmente el
almacenamiento), y Cloud Files y Cloud
líder en servicios de Cloud Computing gracias
Servers de Rackspace.
entre otras cosas a que fue uno de los
Incluyen un método de facturación muy primeros jugadores en el mercado. Luego ha
granular (llegando a cobrar por hora o sabido abrir nuevos nichos y mantener con
kilobyte), contando el servidor o el volumen de precio y calidad su ventaja inicial, hasta
almacenamiento como la unidad básica de convertirse en un estándar de facto. En la
gestión, y por supuesto, ofrecen la habilidad actualidad Amazon tiene en torno a 20
de obtener un gran número de servidores o servicios, los más conocidos e importantes
almacenamiento solo unos minutos después para Buscamedia son EC2 y S3
del pago sin necesidad de firmar un contrato.
Amazon EC2 (Elastic Computiong Cloud) es el
CLOUD PRIVADO CERRADO caso que ejemplifica mejor lo que se pretende
de un Cloud computing. Es un servicio web
Se trata de un Cloud usado exclusivamente
ofrecido remotamente que proporciona
por una única organización y no incorporado a
capacidad de cómputo en la nube,
ninguna clase de Cloud público. ¿Cuándo
redimensionable bajo demanda. EC2 ofrece un
debe una organización crear su propio Cloud
servicio de alquiler de maquinas virtuales
privado? ¿Qué tipo de organizaciones deben
donde desplegar las aplicaciones.
hacerlo? La respuesta es que un Cloud
privado es óptimo para organizaciones con Es el principal caso de éxito en las
datos altamente sensibles, regulados por ley, o infraestructuras como servicio (IaaS),
que tienen requerimientos extremadamente proporcionando tanto a particulares como
altos de prestaciones y almacenamiento. organizaciones capacidad de cómputo y

 
Nº DE IDENTIFICACIÓN EXPEDIENTE CEN-20091026 | ACRÓNIMO DEL PROYECTO BUSCAMEDIA

almacenamiento, así como un sistema de Una de sus ventajas es que ofrece un interfaz
pago por uso de los recursos. compatible con EC2 y S3 de Amazon. De este
modo, una aplicación diseñada para funcionar
Amazon S3 (Simple Storage Service) es el
en un Cloud privado con Eucalyptus puede
servicio de almacenamiento de Amazon. Hay
migrar fácilmente a un cloud publico de
que tener en cuenta que las máquinas virtuales
Amazon, lo cual es muy interesante para
de EC2 son volátiles, pueden crearse en
Buscamedia.
cualquier momento pero como contrapartida
cuando son borradas su estado se pierde por HADOOP
completo.
Hadoop es un framework java que permite
S3 puede usarse para almacenar contenidos construir programas distribuidos usando el
multimedia. Pueden además ser accedidos no paradigma map-reduce. Hadoop se suele
solo mediante un protocolo HTTP, sino utilizar en el contexto de Cloud computing y es
también mediante P2P, pudiéndose integrar incluso ofrecido por Amazon dentro de su
por tanto en el esquema de distribución de oferta de servicios Cloud.
Buscamedia.
Aplicaciones eficientes en Cloud
Herramientas de Cloud
No todas las aplicaciones pueden funcionar en
Como se ha comentado, el proyecto un entorno Cloud sin modificaciones. Para
Buscamedia no se limita a poder usar un funcionar bien en un entorno Cloud, la
Cloud externo, sino que pretende implementar aplicación debe reunir unas características
su propia infraestructura de Cloud. mínimas:
Afortunadamente hay en el mercado un amplio
 Funcionar en una plataforma difundida,
abanico de herramientas tanto comerciales
un estándar industrial como Windows
como de software libre que permiten crear un
o una distribución popular de Linux, o
Cloud privado sin necesidad de comenzar
preferentemente, ambos sistemas.
desde cero.
 No requerir una versión concreta del
De la amplia oferta, por razones de espacio se
sistema operativo, sino que debe
comentan aquí solo las más intereasantes a
funcionar con la mayor posible
priori para Buscamedia.
independencia del nivel de
EUCALYPTUS actualización del sistema, versión del
kernel o service patch instalados.
El objetivo de este proyecto open source es
promover la investigación y desarrollo de las  Poder funcionar en un entorno
tecnologías que ofrecen “servicios elásticos, virtualizado, y si es posible, tomar la
útiles y en la nube”, así como el estudio de las forma de imagen de disco duro virtual,
estrategias de asignación de recursos, que es muy fácil de enviar y distribuir y
acuerdos a nivel de servicio (SLA), políticas y se puede arrancar y parar a voluntad.
modelos de uso. Ha sido desarrollado en el
 La aplicación no debe quedar
laboratorio MAYHEM por el Departamento de
vinculada después de la instalación a
Ciencia y Computación de la Universidad
un servidor específico, por ejemplo,
californiana de Santa Bárbara. Su objetivo
obligada a responder a un nombre de
inicial era servir como una herramienta para la
servidor concreto.
investigación del Cloud Computing, pero se ha
convertido en una solución de enorme interés
también en entornos de producción.

5
 Ser capaz de llevar los datos consigo, conveniente es desplegar Buscamedia en un
pero no depender de que residan en Cloud privado usando una herramienta como
un lugar concreto inmutable. Eucalyptus, para luego si es necesario
desplegar la aplicación en un Cloud público si
 En el mismo sentido, debe ser capaz
la demanda lo requiere.
de usar almacenamiento externo, pero
de forma configurable. Buscamedia puede usar Cloud computing
para lograr un mejor servicio en tres aspectos
 Debe poder cambiar de nombre DNS,
críticos:
IP o dirección MAC sin problemas.
 Para lograr un tiempo de respuesta
 En general, debe ser una aplicación
más rápido, utilizando la computación
“bien educada” que no interfiera con
distribuida para realizar las búsquedas.
otras aplicaciones en la misma
Esto se lograría usando Hadoop sobre
máquina.
un cluster de maquinas virtuales
En general estas recomendaciones nacen del usando un Cloud similar a EC2.
carácter volátil de las maquinas virtuales que
 Como repositorio de los contenidos,
se usan en Cloud computing, frente al carácter
empleando algo similar a S3 para la
permanente de las maquinas virtuales en
gestión del almacenamiento.
Centros de Proceso de Datos virtualizados, o
de las maquinas físicas en los CPD  Se puede aprovechar la infraestructura
tradicionales. de un Cloud público para proporcionar
el ancho de banda para la distribución,
Todas estas consideraciones han de tenerse
teniendo en cuenta que el
en cuenta a la hora de desarrollar y desplegar
almacenamiento puede ser compatible
Buscamedia.
con P2P.
Conclusiones
En este documento se ha definido que es el
Cloud Computing y se ha visto como se puede
situar el proyecto Buscamedia dentro de los
distintos puntos de vista y clasificaciones del
mundo Cloud. Se ha visto que lo más

 
Nº DE IDENTIFICACIÓN EXPEDIENTE CEN-20091026 | ACRÓNIMO DEL PROYECTO BUSCAMEDIA

Referencias
[1]. “Utility computer, reality and beyond”, Springer 2009 (http://www.springerlink.com/content/m6947454583l173x)
[2]. “A Break in the Clouds: Towards a Cloud Definition”, (http://ccr.sigcomm.org/online/files/p50-v39n1l-vaqueroA.pdf)
[3]. Peter Mell and Tim Grance , “The NIST Definition of Cloud Computing”, Version 15, 10-7-09
(http://csrc.nist.gov/groups/SNS/cloud-computing/cloud-def-v15.doc)
[4]. Forrester, “Future View: The New Tech Ecosystems Of Cloud, Cloud Services, And Cloud Computing”, 2008,
(http://www.rpath.com/corp/images/stories/white_papers/rPath_WP_forresterfutureview.pdf)
[5]. Lamia Youseff , “Toward a Unified Ontology of Cloud Computing”,. University of California,
(http://www.cs.ucsb.edu/~lyouseff/CCOntology/CloudOntology.pdf)
[6]. “The Cloud Spectrum” (http://www.gridipedia.eu/cloud-spectrum.html)
[7]. Arma Partners, ’Software as a Service: Ride it while it’s hot! Whitepaper‘, 2007,
(http://www.armapartners.com/files/admin/uploads/W17_F_1873_34979.pdf)
[8]. Burton Group, ’SaaS Implementation Survey: Where, When, and How to use SaaS’, 2008, (
http://www.burtongroup.com/Guest/Ccs/SaasSurvey.aspx )
[9]. Forrester, “Cloud Computing for the Enterprise” Webminar, 2009,
(http://www.forrester.com/imagesV2/uplmisc/CloudComputingWebinarSlideDeck.pdf)
[10]. Information Week , ’Special Report: SaaS Red Light, Green Light‘,
(http://www.informationweek.com/news/software/hosted/showArticle.jhtml?articleID=207400212)
[11]. Agenda Estrategica de INES, GT “Infrastructuras Orientadas a Servicios”, (http://www.ines.org.es/docs/INES_AEI_v2_0.pdf)
[12]. Amazon EC2 (http://aws.amazon.com/ec2/)
[13]. Amazon S3 (http://aws.amazon.com/s3/)
[14]. Eucalyptus (http://open.eucalyptus.com/)

Currículum vitae de los autores


Ana Juan Ferrer ha cursado Ingeniería en Informática por la Universitat Autònoma de Barcelona (1998). Trabaja en Atos Origin, dentro de
Atos Research & Innovation desde 2006. Primero como responsable técnica de sistemas multi-agentes en el entorno del proyecto
CROSSWORK. Desde septiembre de 2007, trabaja en el proyecto BEinGRID donde investiga temas de servicios web, tecnologías Grid y
SLAs. Actualmente, también involucrada en el proyecto NEXOF-RA cómo responsable de la definición de la NEXOF Roadmap. Su carrera
está enfocada en las tecnologías de Arquitecturas de Servicios, Grid, Cloud Computing y Green IT. Tiene amplia experiencia como
consultora y arquitecta de software en el contexto de Internet y el e-business. Anteriormente, se ocupó de proyectos de banca electrónica
(La Caixa, Banc Sabadell) y energía (Gas Natural).

Jose Miguel Garrido es Ingeniero Industrial esp. Automática por la Universidad de Valladolid. En la actualidad trabaja en la unidad de
Media dentro de Atos Research and Innovation. Tiene experiencia en los sectores de telecomunicaciones, deportivos, defensa y
administraciones públicas. Ha colaborado en proyectos europeos como POLYMNIA, MIDAS, GAMA, ALIS o PuppyIR en el campo de las
telecomunicaciones y las tecnologías multimedia.

Proyecto cofinanciado por el Centro para el Desarrollo Tecnológico Industrial (CDTI)