Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Version 0.1
Tabla de Contenido
Introduccin a un cluster de alto rendimiento............................................................................................4 Elementos de un cluster.........................................................................................................................4 Procesadores....................................................................................................................................4 Comunicaciones...............................................................................................................................5 Sistemas O erati!os.........................................................................................................................5 So"t#are...........................................................................................................................................5 $ecursos %umanos..........................................................................................................................5 Instalacin de $oc&s..................................................................................................................................6 $e'uerimientos ( Prerre'uisitos...........................................................................................................6 Instalacin ( con"i)uracin del *ront End............................................................................................+ Con"i)uracin del *ront End..........................................................................................................10 Instalacin ( con"i)uracin de los nodos ...........................................................................................11 Con"i)uracin "inal de los nodos....................................................................................................11 Administracin ,-sica..............................................................................................................................12 Acceso al *ront.End ( a los nodos del cluster....................................................................................12 Sistemas de arc/i!os en el cluster.......................................................................................................10 1onitoreo ,-sico de los recursos del cluster.......................................................................................14 Or)ani2acin del sistema O erati!o....................................................................................................1+ Sistemas de arc/i!os or red..........................................................................................................13 El ser!icio 411 Secure In"ormation S(stem........................................................................................19 Administracin de 4suarios................................................................................................................20 S5ntesis de comandos...........................................................................................................................21 6 icos Es eciales de Administracin.....................................................................................................22 Instalacin de 7ue!o So"t#are............................................................................................................22 1onitoreo de recursos or la #e,.......................................................................................................24 S5ntesis de comandos...........................................................................................................................25 Errores encontrados al instalar el cluster en la 4ni!ersidad de Guadala8ara...........................................26 Instalacin de los nodos......................................................................................................................26 $einiciar un ser!icio con errores.........................................................................................................26 *lu8os ara re!isin de errores ( c/ec&list ara la administracin..........................................................2+ A)re)ar usuario...................................................................................................................................2+ Eliminar un 4suario............................................................................................................................23 9etalles del cluster instalado en la 4ni!ersidad de Guadala8ara.............................................................29
ndice de figuras
:Por'ue un cluster;....................................................................................................................................4 Es'uema General de con"i)uracin de un cluster......................................................................................+ Pantalla de Inicio de $oc&s........................................................................................................................3 Es'uema de articionamiento de $ocs&....................................................................................................9 Pantalla del insert.e/ters..........................................................................................................................11 Putt(.........................................................................................................................................................12 Acti!acin de <11 "or#ardin).................................................................................................................10 S5ntesis de comandos =Administracin >-sico?.......................................................................................21 Gan)lia monitorin)..................................................................................................................................24
S5ntesis de comandos Administracin a!an2ada......................................................................................25 *lu8o ara a)re)ar un usuario al cluster...................................................................................................2+ *lu8o ara eliminar un usuario.................................................................................................................23 *ront.End.................................................................................................................................................29 com ute.0.0.............................................................................................................................................00 com ute.0.1.............................................................................................................................................00 com ute.0.2.............................................................................................................................................00 com ute.0.0.............................................................................................................................................00 com ute.0.4.............................................................................................................................................00 com ute.0.5.............................................................................................................................................01 com ute.0.6.............................................................................................................................................01 com ute.0.+.............................................................................................................................................01 com ute.0.3.............................................................................................................................................01
Proces adores
Clus ters
Es calabilidad
Recurs os !umanos
!erramientas "plicaciones
Figura 1: Porque un cluster? Bas caracteristicas m-s so,resalientes en la utili2acin de un cluster ara el com uto de alto rendmiento tiene las si)uientesC
Comunicaciones
EEisten soluciones 'ue necesitan ocos recursos economicos ara interconectar los e'ui os 'ue "ormaran arte del cluster. Se uede utili2ar cual'uier ti o de tecnolo)5a ara la interconeEin entre los e'ui os (a sea la utli2acin de redes Et/ernetD 1(rinetD Gi)a,it. Con el 'ue se o,tiene un )ran anc/o de ,anda dis oni,le ara la comunicacin con ,a8as latencias.
Sistemas Operativos
Se uede utili2ar cual'uier sistema o erati!o ara la creacin de un cluster sin em,arlo se recomienda el uso de linuE (a 'ue este osee una )ran esta,ilidad aFnado a un ,uen rendmiento en cuanto a mane8o de memor5aD as5 como de IGO e"icienteD asi como la osi,ilidad de /acer un a8uste mu( re"inado a los arametros de los dis ositi!os ara un me8or rendimiento.
Software
EEiste una )ran cantidad de so"t#are 'ue (a esta listo ara "uncionar en un clusterD desde la a aricin de los rocesadores con %i er6/readin) =%6?D la ro)ramacin ( la roli"eracin de so"t#are se /a desarrollado eE onencialmenteD con lo 'ue se tiene una ma(or cantidad de osi,ilidades ara las di"erentes disci linas cienti"icas.
Recursos Humanos
El elemento m-s im ortante ara el "uncionamiento de cual'uier sistema es el elemento /umano 'ue ca acitado en la administracin ( mane8o necesario de recursos ro!eA de un am,iente m-s ami)a,le ara a'uellos usuarios 'ue retendan utili2ar el cluster. El cluster es "acilmente escala,le a com aracin de las su ercom utadoras en donde la escala,ilidad de ende de una )ran cantidad de recursos economicos. Con la "acilidad de eEtender el cluster con e'ui o de ,a8o costo la escala,ilidad no re resenta una )ran limitante en el momento de a)re)ar recursos necesarios ara incrementar el oder de com uto. EEisten adem-s muc/as /erramientas en la actualidad ara la administracin ( mane8o del clusterD tanto en /erramientas de monitoreoD as5 como de /erramientas ara la administracin de tra,8os ( recursos. El so orte en li,rerias ara o)ramacin en aralelo estan altamente desarrolladasD lo cual ermite 'ue la ro)ramcin de nue!as a licaciones 'ue uedan "uncionar en multi rocesamiento sea m-s sencillo.
Instalacin de Rocks
=ori)inalmente llamado 7PACI $oc&s? es una distri,ucin de BinuE ara clusters de com utadores de alto rendimiento. *ue inciada or la 7PACI ( la S9CS in 2000D ( "ue "inanciada inicialmente en arte or una su,!encin de la 7*S =2000.200+?D ero actualmente est- "inanciada or la si)uiente su,!encin de la 7S*. $oc&s se ,as inicialmente en la distri,ucin $ed %at BinuED sin em,ar)o las !ersiones m-s modernas de $oc&s est-n ,asadas en CentOSD con un instalador anaconda modi"icadoD 'ue sim li"ica la instalacin Hen masaH en muc/as com utadoras.
Requerimientos y Prerrequisitos
Bos re'uerimientos necesarios ara instalar roc&s sonC
4n con8unto de m-'uinas de ar'uitectura similar =com ute nodes?D cada una con una inter"a2 de redD disco duro con ca acidad ara m-s de + G> ( memoria $A1 su erior a 256 1>. 4n data s#itc/ =o !arios? con un nFmero de uertos ma(or al do,le del nFmero de m-'uinas dis oni,les = ara darle escala,ilidad?. 4na m-'uina con 2 inter"aces de redD ca acidad en disco duro i)ual o su erior a 20 G>D ( memoria $A1 su erior o i)ual a 512 1> ="rontend?. Ca,les de red en nFmero ( lon)itud su"iciente. 1ue,le o $ac& con es acio a ro iado ara los c/asis de las m-'uinas ( e!entualmente ara el "rontendD con acceso a ro iado a la arte de atr-s de los e'ui os. 4na /a,itacin con !entilacin o re"ri)eracin adecuada ara los ni!eles de disi acin de calor de todos los e'ui os com,inados. 4na 4PS ara alimentar al menos una m-'uina =el "rontend or e8em lo? or m-s de 10 minutos.
Para la instalacin del sistema o erati!o se de,e dis oner de los si)uientes medios =rolls? 'ue uede ser descar)ados desde el sitio de roc&s clusters =/tt CGG###.roc&sclusters.or)G?C
Iernel $oll Core $oll OS $ollD dis& 1 OS $oll dis& 2 Cual'uier otro $oll 'ue considere necesario =CondorD >ioD Ji2D etc.?
El roceso de instalacin resulta mu( sencillo una !e2 instalados los e'ui os en el rac& ( uesto la alimientacin de oder /a( 'ue encender el e'ui o 'ue ser- el nodo maestro =*rontEnd? ( oner el disco de arran'ue =>oot? en la unidad de C9 ara comen2ar la instalacin. Al reali2ar este rocedimiento a arecer- la rimer antalla en la 'ue de,eremos ele)ir la instalacin del *rontEnd =*i)ura 0.?.
Figura 3: Pantalla de Inicio de la isntalacin de Rocks En esta antala ara oder instalar el nodo maestro de,emos de escri,ir la ala,ra K,uildL =o "rontend en !ersiones anteriores a la 5.1 de $oc&s?. Con esto comen2ar- el roceso de instalacin en la 'ue se con"i)urar- el cluster. Pantalla 1. Seleccionar los rolls 'ue se !an a instalarC Para ello /a( 'ue selecionar la o cion (a sea de instalar desde C9 o descar)ar desde un ser!idor. Para a)re)ar los roll desde un C9 solo /a( seleccionar el roll a aMadir de la antalla 'ue a arece des uede darle clic& en el ,oton K*rom media G *rom C9LD des ues de selecionar el roll ( resionar el ,oton KSu,mitL entonces re)resamos a la antalla anterior ( la unidad de C9 se eE ulsar- automaticamenteD des ues de esto /a( 'ue ir re itienedo el mismo rocedimiento ara cada roll 'ue se dis on)a. O en caso 'ue se seleccione la o cion de instalar desde un ser!idorD seleccionar la lista de rolls 'ue se desean instalar. 9es ues de esto resionar el >oton K7eEtL Pantalla 2. A arece una "ormulario en el 'ue /a( 'ue llenar la in"ormacin >-sica del cluster entre las 'ue se encuentranC 1. *ull( @uali"ied %ost 7ame =*@%7?C /a( 'ue oner el nom,re con el 'ue se conocera en la red eEterna en este caso =orion.ud).mE?
2. Cluster 7ameC 7om,re utili2ado ara identi"icar dentro de las /erramientas del cluster como )an)lia al clusterD se ueden utili2ar cual'uier ti o de com,inacin de letras ( di)itos =Orion?. 0. Or)ani2acin a la 'ue ertenece el clusterD el estado ( la ciudad =4deGD 4ni!ersidad de Guadala8araD Nalisco 1<? 4. 9ireccin de contactoC 4sar una direccin !alida ara re"erencia de correos electronicos res ecto al cluster. Pantalla 0. Con"i)uracin >-sica de la red ri!ada en nuestro caso una clase > =10.1.0.0 G 255.255.0.0? Pantalla 4. Con"i)uracin de la red eEterna. En esta antalla /a( 'ue dar los datos de la red en la 'ue se encuentr nuestro clusterD en nuestro caso 143.202.105.220 G 255.255.255.0 )# 143.202.105.254. Pantalla 5 Esta,lecimiento de la contraseMa de root 'ue ser- utili2ada ara los ro ositos de adminsitracin. Pantalla 6. Esta,lecer el uso /orario del ser!ido ( en caso de ser re'uerido un ser!idor 76P ara sincroni2aciones de tiem o. Pantalla +. Es'uema de articionado del discoD en caso de clusters dedicados se recomienda el auto articionamiento or de"ecto 'ue es el si)uienteC
en donde KaL es !alido tanto ara sda como /da. 4na !e2 seleccionado el es'uema de articionado comien2a entonces la instalacin del *rontEndD en donde se nos solicitar- ir a)re)ando los cd de los rolls seleccionados o la descar)a del ser!idor de los mismos. 4na !e2 terminada la instalacin de todos los rolls el e'ui o es reiniciado ( el ultimo cd insertado es eE ulsadoO una !e2 reiniciado el *rontEnd arranca con nuestro sistema $oc&s (a instalado.
Figura !: "omando insert#et$ers 9es ues de e8ecutar el comando anterior /a( 'ue ir encendiendo los nodos con el cd de Iernel $oll ara comen2ar a instalar. Si se desea 'ue se res ete la u,icacin "5sica de los nodos ( 'ue coincida con la secuencia de asi)ancin de nom,re /a( 'ue encender secuencialmente los nodos. Se uede ir monitoreando el a!ance de la instalacin de los nodos con el comandoC roc&s.console com ute.0.0 reem la2ando com ute.0.0 or el nom,re 'ue le asi)na insert.et/ers aun'ue este comando solo "unciona si se tiene una ser!idor <.
"dministracin b#sica
Acceso al Front-End y a los nodos del cluster
Ba utilidad del utt( es acti!ar el <11 "or#ardin) ( tener instalado en nuestro e'ui o un ser!idor < ara oder eE ortar a licaciones en "orma )r-"ica ara ello solo /a( 'ue dar clic& en la o cin de < 11 "or#ardin)
Al acti!ar el ser!idor < en nuestro e'ui o como el C()#in =###.c()#in.com?. Con esto odremos lan2ar a licaciones desde el "ronend /acia nuestro e'ui o. %a( 'ue tomar en cuenta 'ue cual'uier a licacion )r-"ica 'ue se utili2a /ara uso de los recursos del "rontend.
ste in) c u 1%2 cac/e si2e rocessor !endorRid c u "amil( model model name ste in) c u 1%2 cac/e si2e
C9 C 2+91.114 C 512 I> C1 C GenuineIntel C 15 C2 C Intel=$? <eon=61? CP4 2.30G%2 C9 C 2+91.114 C 512 I>
9e los arametros dinamicos nos interesa la car)a 'ue tiene un nodoD ara ello odemos reali2ar la consulta mediante el comando u time. cluster."or& u time X... con lo 'ue o,tenemos com ute.0.6C 13C51C55 u 6 da(sD 3C24D 0 usersD load a!era)eC 0.00D 0.03D 0.2+ com ute.0.+C 13C51C56 u 6 da(sD 3C24D 0 usersD load a!era)eC 0.02D 0.02D 0.03 com ute.0.3C 13C51C5+ u 6 da(sD 3C24D 0 usersD load a!era)eC 0.00D 0.00D 0.00 en donde se uede estar consultado la car)a romedio de cada uno de los nodos. $A1D de este recurso tam,ien nos interesan tanto los arametro dinamicos como los estaticos. 9e los estaticos odemos !er el tamaMo total de la memoria ( el tamaMo s#a . 9e los dinamicos nos interesan la memoria utili2ada ( la memoria li,re. Para consultar los arametros dinamicos odemos re!isar el arc/i!o G rocGmemin"o como si)ueC cluster."or& cat G rocGmemin"o 1em6otalC 1em*reeC 2595+33 &> 205++60 &>
Para el disco duro =%9? se ueden consultar las articiones del disco ( los untos de monta8eD as5 como los tamaMos asi)nadosD el es acio dis oni,le ( el es acio utili2adoD con el si)uiente comando se uede reali2ar esta consultaC cluster."or& d" .&/ com ute.0.+C *iles(stem Gde!Gsda1 Gde!Gsda0 tm "s Si2e 4sed A!ail 4seY 1ounted on 5.+G 2.2G 0.2G 41Y G 2+G ++1 26G 1Y GstateG artition1 10141 0 10141 0Y Gde!Gs/m
orion.localCGeE ortG/omeGadan) 4+G 21G 24G 46Y G/omeGadan) com ute.0.3C *iles(stem Gde!Gsda1 Gde!Gsda2 Gde!Gsda5 tm "s Si2e 4sed A!ail 4seY 1ounted on 16G 2.2G 10G 16Y G 0.3G 1101 0.5G 4Y G!ar 10G 1621 10G 2Y GstateG artition1 1.0G 0 1.0G 0Y Gde!Gs/m
orion.localCGeE ortG/omeGadan) 4+G 21G 24G 46Y G/omeGadan) Otra /erramienta de )ran !alor ara el monitoreo es el comando sD con el 'ue odemos /acer una consulta de los rocesos 'ue se estan e8ecutando en determinado momentoD as5 como al)unas de sus ro iedades m-s im ortantesD un e8em lo de este comando esC cluster."or& s .cauE com ute.0.+C 4SE$ root root PI9 YCP4 Y1E1 JSZ $SS 66S 1 0.0 0.0 2064 620 ; 2 0.0 0.0 0 0; S6A6 S6A$6 6I1E CO11A79 Ss Nan16 0C00 init SX Nan16 0C00 mi)rationG0
root root root root root root 4SE$ root root root root
0 0.0 0.0 4 0.0 0.0 5 0.0 0.0 6 0.0 0.0 + 0.0 0.0 3 0.0 0.0
0 0 0 0 0 0
0; 0; 0; 0; 0; 0;
S7 Nan16 0C00 &so"tir'dG0 SX Nan16 0C00 #atc/do)G0 SX Nan16 0C00 mi)rationG1 S7 Nan16 0C00 &so"tir'dG1 SX Nan16 0C00 #atc/do)G1 SX Nan16 0C00 mi)rationG2 S6A6 S6A$6 6I1E CO11A79
com ute.0.3C PI9 YCP4 Y1E1 JSZ $SS 66S 1 0.0 0.0 2064 620 ; 2 0.0 0.0 0 0.0 0.0 4 0.0 0.0 0 0 0 0; 0; 0; Ss Nan16 0C00 init SX Nan16 0C00 mi)rationG0 S7 Nan16 0C00 &so"tir'dG0 SX Nan16 0C00 #atc/do)G0
dr#Er.Er.E + root root 4096 7o! 1 14C24 install dr#E...... + "ulano "ulano 4096 7o! 3 11C04 "ulano Este directorio contiene de un lado todos los /ome director( de los usuarios. 9e otra arte se encuentra all5 tam,iAn el directorio del usuario condor donde se de ositan im ortantes arc/i!os del sistema de colas de Condor. W GeE ortG/omeGinstallC total 20 dr#Er.Er.E 0 root root 4096 7o! 1 14C24 contri, dr#Er.Er.E 4 root root 4096 7o! 1 14C2+ roc&s.dist dr#Er.Er.E 10 root root 4096 7o! 1 13C53 rolls dr#Er.Er.E 0 root root 4096 7o! 1 15C0+ s,in dr#Er.Er.E 0 root root 4096 7o! 1 19C12 site. ro"iles Este im ortante directorio contiene la totalidad de los a'uetes de instalacinD arc/i!os de con"i)uracinD ro)ramas ( scri ts es eciales 'ue usa $oc&s ara reali2ar la instalacin del sistema o erati!o en los nodos.
Administracin de &suarios
Para a)re)ar un usuario /a( 'ue reli2ar los si)uientes asosC Creacin de una cuenta de usuario 1.Creacin ,-sica de la cuentaC \useradd usuario 2.Asi)nacin correcta del /ome del usuarioC \usermod Wd G/omeGusuario usuario 0.Asi)nacin de la contraseMaC ass#d usuario 4.Con"i)uracin de auto"sC !i GetcGauto./ome a)re)ar usuario cluster.localCGeE ortG/omeGusuario 5.Sincroni2acin de los arc/i!os de usuarioC Pma&e WC G!arG411 "orce 6.$ecar)ar auto"s en el "rontend ( los nodosC \ ser!ice auto"s reload O cluster."or& auto"s reload En !ersiones m-s recientes lo anterior se uede reducir a tres asos utili2ando el comando roc&s.user. s(nc 1.Creacin de la cuenta 2.*i8acin de la contraseMa 0.E8ecucin del comandoC roc&s.user.s(nc
S'ntesis de comandos
>ditar este ultimo y agregar los paquetes necesario a la seccion main+ indicando ?2,03>41> el nombre del paquete 7sin el n'mero de la versin u otra informacin que venga con el archivo rpm9 ie. MPGG 1here may be as many pac!ages as needed here. Qust ma!e sure you only uncomment as many pac!age lines as you need. 0ny empty Mpac!age*M"pac!age* tags are going to confuse roc!s and !ill the installation procedure GG* MPGG Mpac!age*gnuplotM"pac!age* GG* MPGG Mpac!age* insert Fnd pac!age name here and uncomment the lineM"pac!age* GG* MPGG Mpac!age* insert #rd pac!age name here and uncomment the lineM"pac!age* GG* Una vez configurado se debe reconstruir la distribucin usando el comando roc!s: cd "eNport"roc!s"install roc!s create distro >s importante que una vez se reconstruye la distribucin se pruebe al menos con la reinstalacin de uno de los nodos que la distribucin funciona correctamente. Para reinstalar fcilmente un nodo del cluster se puede recurrir a mecanismos de automatizacin que vienen instalados con Ioc!s y que usan el sistema !ic!start. ,a re instalacin procede de la siguiente manera: a9 ?e elimina del nodo respectivo el archivo ".roc!sGrelease ssh cRG% rm Grf ".roc!sGrelease >sto habilita una opcin en el gestor de arranque que hace que el nodo se reinicie la prNima vez en modo de re instalacin. b9 ?e inicia el proceso de re instalacin: ssh cRG% "boot"!ic!start"clusterG!ic!start
Shutting down kernel logger: [ OK ] Shutting down system logger: [ OK ]
\ c o!ra(.0.6.tar.)2 Gs/areGa sGsrc \ cd GeE ortGa sGsrc \ tar 2E!" o!ra(.0.6.tar.)2 \ cd o!ra(.0.6.1 \ .Gcon"i)ure W re"iE]Gs/areGa s \ ma&eO ma&e install 1odi"icar GetcG ro"ile en caso de ser necesario ( recar)ar 411
\ cd GeE ortGa sGsrc \ tar 2E!" )sl.1.6.tar.)2 \ cd )sl.1.6 \ .Gcon"i)ure .. re"iE]Gs/areGa s \ ma&eO ma&e install Editar GetcGld.so.con"C \ ldcon"i)O cluster."or& ldcon"i)
Figura %: &anglia monitoring Solo /a( 'ue a,rir un na!e)ador ( a untar a la direccin IP o dns del cluster utili2ando el rotocolo /tt s ( a)re)ando al "inal la ala,ra )an)lia =/tt sCGGorion.ud).mEG)an)lia?. Con lo 'ue a arecera una antalla como la "i)ura 6.
S'ntesis de comandos
9es ues de re!isar el estatus ( !eri"icar 'ue este esta con errores /a( 'ue !eri"icar or'ue tiene el error corre)ir ( !ol!er a inicar el ser!icio con ser!ice Xser!icio[ start i.e. ser!ice d/c d start
Eliminar un &suario
Se utili2aron los si)uientes recursos de %ard#areC S#itc/C Enteras(s de 24 uertos di!idido en 0 Jlans.
Jlan I9 1 =de"ault?C 4tili2ada ara dar salida a las ma'inasD los uestos en esta !lan son del 1 al 5. Jlan I9 2 =6itan?C En esta estan todos los uertos ares 'ue es la utili2ada ara el cluster orion Jlan I9 0 =Atlante?C En esta estan todos los uertos im ares del + al 10
*rontEndC
com ute.0.1
com ute.0.2
com ute.0.0
com ute.0.4
com ute.0.5
com ute.0.6
com ute.0.+
com ute.0.3