Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Cluster School
Cluster School
2003
Linux Clusters
Gilberto Diaz gilberto@ula.ve Centro de Clculo Cientfico Universidad de Los Andes Mrida - Venezuela
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
Eterna necesidad
Desde la invencin de las computadoras el hombre constantemente ha mantenido una demanda por mayor porder de cmputo
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
Motivacin
Necesidades actuales de clculos intensivos: Prediccin del tiempo Diseo de productos avanzados Almacenamiento masivo de datos Procesamiento de imgenes Requieren de recursos de gran capacidad para resolver los problemas ms rpido
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
Cmo ir ms rpido?
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
Cluster: a number of similar individuals that occur together. En el ambiente de computacin, es una agrupacin de mquinas interconectadas que colaboran en una tarea.
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
Cluster Beowulf
No es un paquete de software especial, ni una nueva topologa de red, ni un nuevo ncleo modificado de algn S.O. Es una tecnologa para agrupar computadores basados en el sistema operativo Linux para formar un supercomputador virtual paralelo, a partir de hardware comn, sistema operativo Linux y software abierto (open source).
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
Cluster Beowulf Caractersticas: Bajo costo inicial Fcil de mantener Tecnologa familiar Escalable Software gratis
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
Origenes Surgimiento de plataformas de bajo costo - Comunicacin - Procesamiento - Almacenamiento Esto ha permitido el desarrollo de herramientas computacionales del dominio pblico, que han extendido la experiencia en el campo de la computacin paralela a estas nuevas plataformas.
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
Origenes El primer cluster Beowulf fue construido con 16 procesadores DX4 y una red ethernet de 10Mbits para atender las necesidades asociadas con la gran cantidad de datos que manejaban las aplicaciones en el proyecto ESS (Earth and Space Sciences) llevado a cabo en Center of Excellence in Space Data and Information Sciences (CESDIS) Por Donald Becker y Thomas Sterling
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
Origenes
En 1997 el cluster de 140 nodos de la Universidad de Caltech ejecut un problema (N-Body) a una tasa de 10GFlops/sec. Un cluster no es un supercomputador pero si es necesario obtener un rendimiento parecido, estos satisfacen todos los requerimientos
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
Caractersticas
- Flexibilidad Hardware comn: red, procesador, etc Software de dominio pblico Linux, MPI, PVM, etc.
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
Caractersticas - Escalabilidad Los cluster permiten agregar nuevos componentes para aumentar el nivel de prestaciones sin necesidad de eliminar los elementos ya existentes.
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
Caractersticas - Disponibilidad Existe edundancia natural, cada nodo posee sus propios componentes: bus, memoria, procesador. Se puede implementar polticas para el reemplazo rpido en caso de falla del servidor maestro.
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
Caractersticas - Rendimiento: En principio las aplicaciones paralelas son ms rpidas. Factores influyentes: - Comportamiento del programa - Carga de la red.
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
Ejemplos Cluster de 1000 nodos utilizado para la investigacin de algoritmos genticos www.genetic-programing.com
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
Ejemplos
PIRUN = Piles of Inexpensive and Redundant Universal Nodes 72 nodos PIII 500 MHz, 128 MB Provee clculo intensivo en general y funciona como superservidor de internet
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
Ejemplos
Chama = Cluster Hecho A MAno 28 nodos: PIII dual, 2TB de disco, 20GB RAM Clculo paralelo, Qumica, Fsica, etc.
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
Arquitectura (hardware)
Internet
Nodo Maestro Archivo
Asfdjlsfsdfkjsdfjsdhners Werweiujoifdsfshgvbcvs Sdfsjdfasdfjdhegbdbbcv Sdfsdjflkjsdfskdjf asdfkj sdfkjasdfijwerlkjsdfasdfj
Nodo adm
Red Interna
Nodos clientes
Channel Bonding
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
Arquitectura (software)
Linux
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
Clasificacin
Dentro de la taxonomia de computadores paralelos Beowulf esta en algn lugar entre - Procesadores masivamente paralelos CM 5, Cray T3D, etc. - Red de estaciones de trabajo.
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
Clasificacin Existen diferencias sutiles entre un cluster Beowulf y una red de estaciones de trabajo, pero son muy significativas en relacin al rendimiento. - Red interna aislada. La carga de la red slo depende de las aplicaciones. - Nodos dedicados al cluster Fcil manejo del balanceo de carga de los procesadores.
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
Clasificacin
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
Diseo
Es necesario tomar en cuenta diversos factores para el diseo de un cluster Beowulf que contribuyan a un mejor desempeo: - Disco - Memoria - Motherboard - Procesador - Multiprocesadores simtricos - Red
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
Diseo
Internet
Nodo Maestro Red Interna
Hacer que el cluster se comporte como una sola mquina - Los usuarios deben ser conocidos en todos los nodos - Las aplicaciones deben estar presentes en todos los nodos - Un sistema de archivos comn
Nodos clientes
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
Diseo Hacer que el cluster se comporte como una sola mquina - Los usuarios deben ser conocidos en todos los nodos (NIS) u otro mecanismo para mantener consistentes los /etc/passwd - Las aplicaciones deben estar presentes en todos los nodos: compartir el /usr/local - Un sistema de archivos comn: /home, /tmpdata
New User on Rocks Mail List I managed to install Rocks with five nodes. The nodes have
a small HD 2.5 GB each, the cluster is in my home on a private network behind a Linux box "firewall". And it looks like everything is working fine. I can see all the nodes and the front-end in the ganglia web interface. I built it so I can learn more about clusters. And to tell the truth I have no idea on what to do with it, I mean where to start, how to use it, what to use it for. NPACI ROCKS Presentation
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
Conclusiones - La escalabilidad en un punto significativo - Los cluster Linux constituyen una plataforma adecuada para muchas aplicaciones - Alta disponibilidad - Limitaciones redes con alto nivel de latencia
-
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
Conclusiones
PC
Workstation
Mini Computer
Vector Supercomputer
Mainframe
http://www.dgs.monash.edu.au/~rajkumar
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
Conclusiones
http://www.dgs.monash.edu.au/~rajkumar
High Performance Computing on Linux Cluster Gilberto Diaz (CeCalCULA) Mrida Oct-Nov
2003
Documentacin
Manual de instalacin
http://www.cecalc.ula.ve/documentacion/tutoriales/beowulf http://www.cecalc.ula.ve/documentacion/tutoriales/beowulf.pdf
Pgina recomendada
http://www.beowulf.org