Está en la página 1de 27

COMPUTACIÓN PARALELA

Y DISTRIBUIDA,
CLÚSTERSY REDES
INTEGRANTES:
-Castillo Garcia Jeisson
-Gallardo Cabrera Kevin
-Layza Martinez Rogger
-Montañez Julcamoro Edwin
-Montenegro Chavez William
-Zerpa Castro Patrick
PROCESAMIENTO
PARALELO
Y DISTRIBUIDO
múltiples procesadores que
Procesamiento
comparten memoria y otros Multiprocesamiento (MP)
paralelo
recursos

Sistemas MP

Los programas se
Las CPU
CPU comparten modifican -> para Las más eficaces
comparten una CPU mismo tipo y Una sola copia de
recursos de la aprovechar la son de 2 a 4
cantidad común velocidad SO en ejecución
computadora ejecución en procesadores
de memoria
múltiples CPU
Si A requiere 10 min, B 60, c 60 y D 20.
especifican
Flujo de trabajo En una
computadora 10 + 60 + 60 + 20 = 150 min
Pasos del procesamiento a llevar a cabo
En dos 10 + 60 + 20 = 90 min
computadoras
Entradas y salidas de estos

Dependencia de elementos
Se REDUCE el tiempo de “reloj de pared’’
Descrito por una grafica acíclica dirigida Si B y C se hacen 10 veces más rápidos:

B Antes 10 + 60 + 20 = 90 min
Después 10 + 6 + 20 = 36 min
A D
C Se hizo 2.5 veces mas rápido, pero su velocidad
no fue lineal, esto lo dicta la Ley de Amdahl
Indican
Flujos de tubería
dependencia
Estructura
Simultáneamente
Flujos de barrido en paralelo

Tiempo de
Flujo de trabajo
trabajo

Tiempo de reloj
de pared
Medición
Utilización de
recursos

Producción
Arquitectura de un sistema
distribuido

Memoria

Sistema con Pasan datos entre


Descripción multiprocesamiento capas o comparten
simétrico tablas pueden
beneficiarse
sustancialmente de
su ejecución en tal
arquitectura

Hay diferencias A medida que usamos las


importantes entre las Estos sistemas
características mas avanzadas
arquitecturas de in sistema debemos tener cuidado sobre comparten Aplicaciones que
distribuido y los sistemas los efectos e interacciones procesan grandes
multitarea de procesador laterales entre características cantidades de datos y
único diferentes pasan

Hay dos técnicas para


aprovechar el poder de multiprocesamiento
multihilo
un sistema SMP
Múltiples
Sistema Redes de
Los clústeres estaciones de
distribuido computo clústeres
Nodos de computadoras individuales
No comparten recursos directamente
Pueden tener procesadores únicos o
sistemas MP
No comparten registros comunes
Conectados por LAN

Gestionado por uno o un grupo de personas Configuraciones de HW y SW distintas


Sus registros de identificación son idénticos
para cada nodo Los administradores acuerdan
Sus nodos comparten recursos de compartición de trabajos
almacenamiento usando SAN y NAS
Sus nodos cabeza gestionan el trabajo Otros : P2P, COWS, sistemas de computación
voluntarios.
. Están acoplados de manera mas débil que los
clúster

Definición: .Es administrada por varias organizaciones

.Cada organización aporta un conjunto de


recursos

Grids .Cada nodo puede ser una computadora no


Ventaja: costosa, pero al combinarlos en una red puede
Computacionales ser una supercomputadora

.Los nodos no tienen interconexiones a gran


Desventaja: velocidad, de baja latencia
Computación voluntaria

Permite a los usuarios Si todas las capacidades que


Es una forma de computación
compartir sus recursos de no se utilizan se juntan
distribuida
computo ociosos formarían un superordenador
BOINC

CONDOR
Fue desarrollado por la Universidad de California de Berkeley

Fue desarrollado por la Universidad de Wisconsin


Esta integrado por un sistema servidor que envía trabajo y recibe resultados

Cuando los usuarios se registran en BOINC, pueden elegir en cuales proyectos científicos desean participar
Proporciona una estructura semejante a BOINC

Cuenta con un pretector de pantalla grafico que muestra en pantalla el trabajo realizado

Cada proyecto administra su propio proyecto único y un


conjunto de nodos privados

Es popular y de amplio uso, requiere un solo procedimiento


para su instalacion
SINCRONIZACIÓN Y COMUNICACIÓN DE PROCESOS.

A menudo los procesos En algunas arquitecturas


trabajan con otros distribuidas, estos mecanismos
procesos, esto incluye la no están disponibles, por lo cual
compartición de datos. se utilizan otros mecanismos.
Esta distribución de
datos requiere
coordinación entre los
procesos.

La sincronización de acceso
El problema que intentamos evitar lo
simultáneo a datos se efectúa por
provocan dos procesos que tratan de
medio de semáforos o mecanismos de
cambiar un solo dato al mismo tiempo,
cerradura semejantes en aquellas
esto se denomina condición de carrera.
regiones críticas donde se manipulan
los datos.
Ejemplo
Supongamos que tenemos una lista muy larga de información sobre muchas personas. Por
ejemplo, la lista puede contener números telefónicos, nombres, direcciones de correo y algún
valor como los ingresos familiares del último año. Tal vez sea necesario escribir esta lista en
orden creciente por número telefónico y calcular el ingreso medio al mismo tiempo.

Soluciones

El método evidente para resolver este problema es


Podríamos tratar de equilibrar esto dando más
partir la lista más pequeñas por separado. Si se
trabajo (más números en su lista) a los
cuenta con ocho procesadores para repartir el
procesadores más rápidos. Si un procesador es dos
trabajo entre ellos, puede hacerse que cada
veces más rápido que otros, podríamos darle el
procesador ordene y calcule la media de un octavo
doble de números para que trabaje.
de datos y luego fusionar el resultado.

Sería más eficiente si pudiéramos iniciar el procesamiento de


los resultados antes de colocarlos todos. Pero esto podría crear
una condición de carrera en la que algunos de los procesadores
empezaran a intentar fusionar los resultados antes de que
todos los procesadores hayan producido su primer resultado.
Pero es difícil
Ahora nuestro ejemplo se complicó, y antes de poder usar el resultado de un proceso
de barrido es necesario saber si ya terminó. En una computadora con CPU única esto
no es difícil. Podemos comunicarnos usando memoria compartida y la finalización de
señales al fijar banderas en los datos para indicar su finalización.

El caso SMP
¿Cómo podría hacerse lo anterior en un sistema
SMP?

Los SMP comparten la memoria entre todas las CPU, de modo que la mayor parte de las
técnicas comunes usadas para la comunicación de procesos funcionan de la misma forma que
en un sistema con procesador único.
El caso de los clústers

¿Cómo se lleva a cabo el compartir y bloquear en un clúster de computadoras?

Esta arquitectura es más difícil que con un CPU única o en un sistema SMP. Compartir la
memoria no es posible. Los mensajes deben enviarse entre los nodos de los procesadores
a través de una red de área local.

El trabajo se parte y distribuye.

Los datos deben enviarse a cada nodo del


procesador por separado.

Si los datos se originan en un archivo, puede haber intercambiado de


archivo entre los nodos, minimizando el impacto de esta distribución.
El caso de los clústers

La reescritura y la reestructuración de un flujo de trabajo para un clúster requiere más programación y diseño que
para un sistema SPM o con una CPU única ya que es común tratar de partir el procesamiento de los problemas
para un clúster, de modo que casi no hay interacción entre procesos sino hasta el final de cada uno, porque la
comunicación entre sistemas en un clúster es mucho más lenta que en un sistema SMP.

A pesar de esto no termina haciendo tanto trabajo en paralelo. Pero la compensación es que el costo del nodo por
procesamiento en un clúster es mucho menor.
EL CASO DE LOS
GIRDS
Compartir memoria no es posible entre clústeres en una red.

Los mensajes deben enviarse entre nodos a través de una red que puede estar
protegida por cortafuegos.

Los nodos pueden estar muy distantes y por lo tanto tener alta latencia, en
consecuencia, el trabajo se parte y distribuye.

Se debe enviar los datos de nodo a nodo por medio de una red ya que no se comparten en la
memoria entre procesadores, la red fundamental de este envío de datos es la internet la cual
es lenta a menudo, para un ligero mejor desempeño, la internet2.
• Se utilizan grids computacionales, ya que en lugar de solo
memoria comparten clústeres completos de
computadoras entre usuarios

• Los usuarios de redes constituyen organizaciones


virtuales, ya que en vez de estar limitado al uso de unos
cuantos nodos en un clúster local un investigador puede
ser capaz de utilizar 50 clúster de computadoras. Son muy
dinámicas, para conjuntos de datos muy grandes.
TECNICAS PARA COMPARTIR
ARCHIVOS
Los archivos contienen valores de datos crudos, parámetros, resultados
intermedios y finales e información adicional, no es inusual que sean archivos
de gran tamaño (GB´s) , los clústeres con muchos TB´s son comunes .

El compartir archivos para SMP es relativamente fácil, los procesos que


comparten archivos por supuesto necesitan coordinarse usando bloqueos o
mecanismos semejantes.

Los grids no comparten partes de archivos ni permiten bloqueos de clústeres,


permiten el copiado de archivos enteros, algunas herramientas simulan el
compartir de archivos semejantes a clústeres.
USO DE SERVICIOS REMOTOS
Los servicios fuera de un proceso son
invocados mediante RPC (llamadas a
procedimientos remotos) o RMI
(invocaciones a métodos remotos).

Los sistemas que se ejecutan en


clústeres usan un middleware que
mejora llamadas o invocaciones para que
estas sean semejantes a las mismas.

Sistemas grids presentan dificultad para


compartir especialmente datos y
seguridad. También presentan largos
retrasos de red.
MANIPULACION DE FALLAS
Mientras más
computadoras y más
software se añaden a un
¿Qué puede fallar?
sistema se incrementan las
posibilidades que algo salga
mal.

Es necesario escribir
software a fin de tomar en
cuenta las fallas; por
Podría ser falla de ejemplo, el middleware, si
hardware, fallas en la red el servicio no responde en
más probables que en los menos del límite de tiempo
nodos. Pero también el se realiza otra llamada,
software puede ocasionar quizá un servidor distinto y
fallas. si la respuesta a la solicitud
original llega después, el
resultado simplemente se
desecha.
7.6 EJEMPLOS
Computación • Muchos nuevos proyectos han tenido resultados solo en el ultimo
año por culpa del declive en los precios de las computadoras ,lo
científica en cluster cual provoca que estos sean asequibles para comunidades de
y grids investigación

• Un genoma de montaje empieza por romper una cadena de DNA


El montaje del DNA en muchas partes pequeñas las cuales luego se leen mediante
del genoma maquinas secuenciadoras
• Este método es muy popular por la disponibilidad de clusters de
humano computadora para reunir gran numero de fragmentos traslapados

El centro de • IBM a sido activa en computación paralela y distribuida , esta a


biología desarrollado clusters y aplicaciones biológicas en escala muy
grande como Blue Gene
computacional IBM • El centro de biología computacional cuenta como proyectos como :
y cluster de bioinformática, informática medica e investigación genómica
funcional
computación
Cluster de • Seti@home se dedica a la investigación de vida extraterrestre y reunió datos almacenados de
repositorios durante años , este tuvo gran éxito gracias a los participantes que contribuyeron con mas
computación de 2 millones de años de tiempo de computo agregado
• Las computadoras SETI están conectadas sobre redes caseras y líneas telefónicas compuesta por una

voluntarios mezcla de maquinas antiguas y nuevas

Un cluster de Hecho con 98 computadores con 2 procesadores


Cada nodo tiene un disco local y dos procesadores dentro dela computadora los cuales comparten 2 GB de memoria

computación Las computadoras se comunican entre si por medio de una red local conectada de un GB por segundo
EL cluster también tiene 5 nodos cabeza conectados a cortafuegos que permiten que un usuario e externo se
conecte al cluster o a varios servidores
típico

Uso de un cluster • Estos sistemas operativos no saben que forman parte de un cluster
• En lugar de modificar el SO m el trabajo de gestión del cluster se realiza mediante middlewarre , que se
ejecuta en la parte superior del SO
Globus

Portales e • Los portales son servidores de computadoras que permiten a los usuarios acceder a datos , aplicaciones
e informacion y compartir resultados
• Un portal local permite que cualquiera pueda registrarse ,ver investigaciones y compartir opiniones
interfaces en línea

También podría gustarte