Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Dialnet ServidorProxyCache 4869011 PDF
Dialnet ServidorProxyCache 4869011 PDF
149-162
Artículo de Investigación - Fecha de recepción: 1 de agosto de 2012 - Fecha de aceptación: 6 de septiembre de 2012
Carlos E. Gómez
Magíster en Ingeniería en Sistemas y Computación, Licenciado en Matemáticas y Computación, Universidad del Quindío. Armenia,
Colombia, carloseg@grid.edu.co
Luis E. Sepúlveda
Ingeniero de Sistemas y Computación, Magíster en Software Libre, Universidad del Quindío. Armenia, Colombia,
lesepulveda@grid.edu.co
Christian A. Candela
Ingeniero de Sistemas y Computación, Magíster en Comercio Electrónico, Universidad del Quindío. Armenia, Colombia,
christiancandela@grid.edu.co
Resumen
Los proveedores de acceso a Internet usualmente incluyen el concepto de aceleradores de
Internet para reducir el tiempo promedio que tarda un navegador en obtener los archivos
solicitados. Para los administradores del sistema es difícil elegir la configuración del servidor
proxy caché, ya que es necesario decidir los valores que se deben usar en diferentes variables.
En este artículo se presenta la forma como se abordó el proceso de comprensión y asimilación
tecnológica del servicio de proxy caché, un servicio de alto impacto organizacional. Además,
este artículo es producto del proyecto de investigación “Análisis de configuraciones de ser-
vidores proxy caché”, en el cual se estudiaron aspectos relevantes del rendimiento de Squid
como servidor proxy caché.
Palabras clave
Proxy server, proxy caché server, proxy caché, caché web, Squid.
1. Artículo derivado del proyecto de investigación: Análisis de configuraciones de servidores proxy caché, del Grupo de
Investigación en Redes, Información y Distribución - GRID, Universidad del Quindío, 2011.
149
Servidor Proxy Caché: Comprensión y asimilación tecnológica
Keywords
Proxy server, proxy cache server, proxy caching, web caching, Squid.
150
Revista INGE CUC,Volumen 8, Número 1, Octubre de 2012, pp. 149-162
151
Servidor Proxy Caché: Comprensión y asimilación tecnológica
interna para hacerlas compatibles con una lución software implementada en la capa
red externa. Típicamente, el servicio NAT de aplicación la cual intercepta los mensa-
es prestado por un router o un host confi- jes de solicitud HTTP (y otros protocolos),
gurado con más de una tarjeta de red y se para hacer la solicitud en representación de
utiliza generalmente para pasar de una red los usuarios de la red corporativa. Gene-
interna, en la cual los hosts tienen configu- ralmente un servidor proxy se ubica en la
radas direcciones IP privadas, para permitir frontera entre la red corporativa y la red del
el acceso a Internet. En este proceso, el dis- proveedor de acceso a Internet [8].
positivo intermedio modifica tanto la direc-
En las dos soluciones mencionadas, todas
ción IP origen (la dirección local), como el
las solicitudes pasan a través de un disposi-
número de puerto origen y esta información
tivo intermedio, lo que ocasiona un cuello
es registrada en una tabla. Cuando llegan
de botella y en consecuencia se hace más
los mensajes de respuesta desde el exterior,
lento el servicio de acceso a Internet a los
los mensajes también son interceptados, y
usuarios. Sin embargo, es posible aprove-
se modifican nuevamente la dirección IP
char la ubicación de un servidor proxy para
y el número de puerto destino, de acuer-
guardar allí copias de archivos que hayan
do con la información registrada. De este
sido descargados por algún navegador de
modo es posible entregar correctamente
la red corporativa, los cuales probablemen-
cada datagrama IP recibido. Esta solución
te sean solicitados en el futuro por algún
es realizada en la capa de red, aunque de al-
usuario de la red. Las copias de los obje-
guna manera utiliza información de la capa
tos estarán más cerca de los usuarios, por lo
de transporte según el modelo de referencia
tanto, serán entregadas mucho más rápido,
TCP/IP [12].
mejorando significativamente el rendimien-
Por su parte, un servidor proxy es una so- to de todo el sistema. Esta técnica es am-
152
Revista INGE CUC,Volumen 8, Número 1, Octubre de 2012, pp. 149-162
153
Servidor Proxy Caché: Comprensión y asimilación tecnológica
154
Revista INGE CUC,Volumen 8, Número 1, Octubre de 2012, pp. 149-162
Simulación de redes con datos artificiales que puede ser atribuido al uso y administra-
ción del caché [16].
La simulación es un mecanismo de evalua-
ción que no obliga implementaciones com- Las dos métricas de desempeño más acepta-
pletas aunque requieren el conocimiento das para evaluar el desempeño de un caché
detallado del sistema que se desea evaluar. son el hit rate y el byte hit rate [6]. Sin em-
bargo, la reutilización de objetos que estén
Sistemas reales en redes aisladas almacenados en el caché depende en gran
Esta técnica consiste en crear escenarios medida de las preferencias de los usuarios.
controlados en los cuales se eliminan varia- Además, alcanzar un nivel mayor en el hit
bles que a pesar de ser reales pueden distor- rate o en el byte hit rate, no necesariamente
sionar los resultados obtenidos. conduce a mejorar significativamente el de-
sempeño del caché [16].
Análisis de archivos log reales
Es una práctica usada con frecuencia debi-
do a que los datos son obtenidos a partir del Desempeño de Squid con respecto
comportamiento real de los usuarios. al sistema de archivos y al esquema
de almacenamiento
Squid ofrece una variedad de opciones en
Métricas de desempeño el proceso de instalación y configuración,
especialmente relacionadas con el alma-
En estudios acerca del desempeño de los
cenamiento de los archivos en disco. Los
servidores proxy caché [16] señala que hay
sistemas de archivos son característicos de
trabajos orientados a mejorar las métricas
un sistema operativo particular. Casi todas
como el hit rate y el byte hit rate; otros
las versiones de Unix tienen una implemen-
trabajos pretenden disminuir la latencia
tación del UFS (Unix File System), el cual
experimentada por el usuario; y algunos
también es conocido como el FFS (Berkeley
más intentan disminuir el tráfico hacia el
Fast File System). El sistema de archivos
exterior de la red. Sin embargo, hay algu-
por defecto de GNU/Linux es ext2fs, aun-
nas métricas no tradicionales que pueden
que recientemente nuevos sistemas de ar-
tener incidencia en el desempeño del servi-
chivos han sido desarrollados como ext3fs
dor proxy caché como la cancelación de la
y ext4fs. Muchos sistemas operativos tam-
conexión entre el cliente y el servidor, y la
bién soportan tecnologías de sistemas de
influencia que tiene el uso de cookies [4]; la
archivos más nuevas. Estas incluyen nom-
proporción de reducción de costo [2]; las ta-
bres y acrónimos como advfs, xfs y reiserfs.
sas máxima y promedio de ancho de banda
Squid puede funcionar con cinco esquemas
consumido, el porcentaje de tráfico de red
de almacenamiento: ufs, aufs, diskd, coss y
ahorrado debido al uso local de recursos al-
null. Estos esquemas tienen diferentes pro-
macenados en caché y la cantidad de tráfico
piedades y técnicas para organizar y acce-
155
Servidor Proxy Caché: Comprensión y asimilación tecnológica
der a los datos almacenados en el caché me- tema. Esta etapa finalizó con la formulación
diante llamadas a operaciones del sistema del proyecto.
de archivos [15].
El análisis del problema consiste en enten-
En [15] se publicaron los resultados de unas der la situación objeto de estudio. Se inició
pruebas de desempeño de Squid en las cua- con la identificación de los servicios funda-
les se hicieron análisis sobre sistemas de mentales que ofrece Squid como servidor
archivos y esquemas de almacenamiento en proxy caché. Luego, se examinó el formato
sistemas operativos distintos. Las pruebas del archivo de configuración de Squid para
realizadas al utilizar el sistema operativo reconocer y analizar los parámetros relacio-
GNU/Linux se relacionan mejor con el pro- nados con su desempeño.
yecto de investigación.
El diseño de la solución se refiere a la bús-
queda de ideas y al planteamiento de alter-
METODOLOGÍA nativas que conduzcan a resolver el proble-
ma objeto de estudio. El diseño inició con
El proyecto de investigación se enmarcó la adaptación de un modelo abstracto por
dentro de la investigación tecnológica en capas con un enfoque descendente, defi-
ciencias de la ingeniería. La metodología nido en [11]. Este modelo es un referente
empleada correspondió a una adaptación de abstracto del cual se pueden derivar diseños
la metodología propuesta por [14] para su con especificaciones particulares, como las
aplicación en proyectos de infraestructura de este proyecto, ya que permite indepen-
de tecnología informática. Producto de la dizar funciones o responsabilidades y ocul-
adaptación de esta metodología, se identifi- tar detalles internos de las distintas capas.
caron cinco etapas: Estudios previos, Aná- Para este caso se diseñó un ambiente virtual
lisis del problema, Diseño de la solución, controlado sobre el cual se puso en funcio-
Implementación y Pruebas. namiento Squid en diferentes topologías de
Los estudios previos corresponden a la pri- red, las cuales fueron de gran utilidad en la
mera etapa del proyecto. En esta etapa se realización del estudio. Posteriormente, se
identificó el problema objeto de estudio a diseñaron escenarios de prueba con diferen-
partir de la oportunidad que representa para tes configuraciones del servidor Squid, y se
el Grupo GRID impactar positivamente crearon archivos para ser almacenados en
el desarrollo de sus actividades misiona- un servidor web (Apache Web Server). Para
les como son la investigación, la docencia finalizar esta etapa se diseñó un sistema au-
y la proyección social. Posteriormente, se tomatizado de pruebas a partir de sincroni-
realizó la búsqueda y organización de la zación de archivos.
información, continuando con la revisión La implementación corresponde a la etapa
bibliográfica y el análisis de trabajos rela- en la que se materializa el diseño realizado.
cionados, obteniendo el estado general del Se utilizaron los recursos físicos disponi-
156
Revista INGE CUC,Volumen 8, Número 1, Octubre de 2012, pp. 149-162
157
Servidor Proxy Caché: Comprensión y asimilación tecnológica
158
Revista INGE CUC,Volumen 8, Número 1, Octubre de 2012, pp. 149-162
159
Servidor Proxy Caché: Comprensión y asimilación tecnológica
160
Revista INGE CUC,Volumen 8, Número 1, Octubre de 2012, pp. 149-162
tir de los cuales se definieron: los archivos conveniente en un escenario puede ser in-
disponibles para descargar, la cantidad de conveniente en otro. Determinar los valores
veces que debía ser descargado un archivo de los parámetros de configuración adecua-
y los archivos de configuración del servidor dos para un ambiente específico es una ta-
Squid que serían cargados para la ejecución rea no trivial; por lo tanto, las pruebas reali-
de cada prueba. Por otra parte, el registro de zadas en el proyecto de investigación sirven
actividades en bitácoras (archivos log) per- de referencia para que los administradores
mitía obtener la información necesaria para de servidores Squid realicen ajustes a sus
calcular los tiempos promedio necesarios archivos de configuración.
para los análisis de cada archivo de configu-
El ambiente automatizado desarrollado
ración. El ambiente automatizado de prue-
dentro de este proyecto es un valor agrega-
bas se desarrolló a partir de la combinación
do para los administradores de infraestruc-
de herramientas disponibles en el sistema
tura de redes, ya que puede ser aplicado a
operativo, shell scripts y aplicaciones soft-
servicios similares en múltiples platafor-
ware construidas a la medida en lenguaje C.
mas, siempre y cuando su comportamiento
esté basado en parámetros especificados en
CONCLUSIONES, APORTE un archivo de configuración.
Y TRABAJO FUTURO La infraestructura para virtualización em-
La configuración por defecto de Squid no es presarial fue probada y funciona eficiente-
apropiada para todos los ambientes de pro- mente, lo que permite aprovechar este re-
ducción. Es necesario estudiar las necesida- curso en futuros proyectos de investigación.
des de la organización y, con base en ellas,
Como trabajo futuro, quedan muchas ideas
realizar los ajustes respectivos, los cuales
para profundizar, entre las que se destacan
pueden ser tan sencillos como modificar
la automatización de la asignación de los
un parámetro de configuración, o tan com-
valores de los parámetros de configuración
plejos como recompilar el software y/o el
mediante la aplicación de inteligencia arti-
kernel del sistema operativo (si éste lo per-
ficial; el uso de cachés cooperativos (distri-
mite); utilizar varias estructuras de archivos
buidos y jerárquicos); el uso de servidores
para alojar los cachés y tal vez ajustar una
proxy caché sobre plataformas de red basa-
variedad de parámetros en el archivo de
das en IPv6; implementar un robot multi-
configuración, sin dejar de lado la adecuada
hilo que simule ambientes con acceso con-
selección del hardware para la instalación
currente al servidor proxy caché; y realizar
del servicio.
estudios acerca de configuraciones propias
El comportamiento de una configuración del sistema operativo y de hardware que
es altamente dependiente de los ambientes afecten el rendimiento del servidor proxy
de ejecución particulares y lo que puede ser caché.
161
Servidor Proxy Caché: Comprensión y asimilación tecnológica
162