Está en la página 1de 2

ASIGNATURA: COMPUTACIN PARALELA

SEMESTRE : II-2014 INF-5141 - 2141


EVALUACIN: Taller 2y3-F2 4/Nov/2014

DEPTO. DE INFORMATICA Y COMPUTACION

ASIGNATURA: COMPUTACIN PARALELA


SEMESTRE : II-2014 INF-5141 - 2141
EVALUACIN: Taller 2y3-F2 4/Nov/2014

DEPTO. DE INFORMATICA Y COMPUTACION

Problemas N1 N= Ta2F2; Problemas N4 a 6 Ta2F3

Problemas N1 N= Ta2F2; Problemas N4 a 6 Ta2F3

Relacionesobtenidasentrelostiempossecuencialesparalostrestiposdemquinasquecomponen
RIN

NOMBRES : __________________________________ R.U.T: ______________

TamaoProblema
(matriz)

PROBLEMA 1. ( xx ptos).

Filas
700
1000
1500
2000

Un conjunto de programas para evaluar el desempeo de los computadores denominado ABC contiene 85.025
operacionesenpuntoflotanteyposeelassiguientescaractersticasdeperformance:

Noincluyelasoperacionesen
puntoflotanterealizadasencada
llamadaalassiguientes
funciones
Funcin
N
de
invocaciones
(veces)
arcotangente 680
680
seno
2020
coseno
razcuadrada 990
990
exponencial
990
logaritmo
TOTAL

6.350

Descomposicindelasoperacionesbsicas
paraunaiteracin(sinincluiroperacionesen
puntoflotantepararealizarlasfunciones
anteriores).

Funcin

Suma
Resta
Multiplicacin
Divisin
Conversin
(entero a punto
flotante)
TOTAL

N de operaciones
bsicas por iteracin
(veces)

44.820

4.200

27.350

13.610

5.020

Ndeoperacionesenpuntoflotantenecesariaspara
realizarlasfuncionesarcotangente,seno,coseno,
razcuadrada,exponencialylogaritmo
Funcin

95.000

N de operaciones
bsicas
por
iteracin(veces)
Suma
86.170
Resta
8.650
76.930
Multiplicacin
22.490
Divisin
Conversin (entero a punto 6.310

flotante)
4.950
Comparacin
TOTAL
205.500

ElconjuntodeprogramasseejecutenunprocesadorXYZquecorrea2.500MHz,eincluyeuncoprocesadorde
puntoflotante(suponerqueelcoprocesadornoincluyearcotangente,seno,coseno,razcuadrada,exponencialy
logaritmocomoinstrucciones).

Elcompiladorutilizadopermitequeelpuntoflotantesecalculeconelcoprocesadoroutilizandorutinassoftware
dependiendodelosparmetrosdelcompilador.Unaiteracindelconjuntodeprogramasnecesita1.08segundos
utilizandoelcoprocesador,y13.6utilizandoelsoftware.SuponerquealmedirelCPIutilizandoelcoprocesadorse
obtuvounamedidade10,mientrasqueutilizandoelsoftwarelamedidafuede6.

a)CuleslaestimacinenMIPS(nativos)paraambasejecuciones?
b)Culeselnmerototaldeinstruccionesejecutadasenambasejecuciones?
c) En promedio, cuntas instrucciones enteras se necesitan para realizar cada operacin de punto flotante en
software?

PROBLEMA 2. ( xx ptos).

Tiempos Secuenciales (s)

L/R
4.89
5.03
4.85
3.94

I/R
1.63
3.01
2.99
3.70

L/I
3.00
3.01
1.62
1.06

Nota:Tamaosdeproblemas:lentas/rpidas(L/R),intermedias/
rpidas(I/R)ylentas/intermedias(L/I).

Sepide:
DeterminelaPotenciadecmputo(PotenciaComputacional)decadaunodelosgruposdeprocesadores.
Nota:Lapotenciacomputacionaltotaldeunsistemaheterogneo,compuestoporpprocesadores(CPt(p)),
puededefinirsecomolasumadelapotenciacomputacionaldetodoslospprocesadorespi,i:1..p,
que componen el sistema. Este parmetro refleja la cantidad de trabajo que puede realizar el
sistemaenunaunidaddetiempo,alejecutarunalgoritmoespecfico.

PROBLEMA 3. ( xx ptos).
Considerequecuentaconunaplataformacomputacionalheterogneacompuestapor8procesadoresp0...p7, dondep0
tienelamayorpotenciadecmputo,p1...p4tienenun75%delamismayp5...p7un50%delapotenciadep0:
a. Determinelapotenciadecmputorelativa(pcr)decadaunodelosprocesadores(p0ap8).
b. Determinelapotenciadecmputototal(pct).
c. Sealeculeslapotenciadecmputototalalcanzable(Sopt)delaarquitecturaparalelacompuestaporlos8
procesadores,sabiendoqueelSpeedlogradoes4,0.
d. Determinelaeficienciadelsistemaparalelo.
e. UnadelosprincipalesmotivosquedecrementanelrendimientodeunSistemaParaleloeselocioproducidoen
los procesadores. Esto ocurre principalmente cuando el trabajo a realizar no est distribuido equitativamente
(en cuanto a tiempo de ejecucin y no en cuanto a cantidad de trabajo) entre los diferentes elementos de
procesamientoqueformanlaarquitecturaparalela.Unamtricaimportanteparaanalizarelcomportamientoen
esteaspectodeunsistemaparaleloeseldesbalancedecarga(D)entrelosprocesadoresqueintervienen.Este
valorsecalculacomoladiferenciadeltiempodecmputodedicadoaresolvereseproblemaporlosdiferentes
elementosdeprocesamiento(Ti).
Considerando una distribucin homognea de trabajo a los procesadores componentes de la plataforma
computacional(seledaigualvolumendetrabajoalos8procesadores),determineelDesbalancedeCarga(D)
delaplataforma{D=((MaxTi)MinTi)/(promedioTi),dondeTcorrespondealtiempodecmputodelprocesoi.
f. Culeselniveldebalancedelsistemaparalelo?

PROBLEMA 4. ( x ptos).

Considere una plataforma heterognea (HN) compuesta por un conjunto de procesadores disponibles en un
sistema(sistemaP,conP=14)yformadoporlossiguientesgruposdemquinas(clusters):
ElprimergrupoestcompuestoporunamquinadememoriacompartidaconcuatroprocesadoresIntel
(R)XeonTMde1.40GHzcon3Gbdememoria.Losprocesadoresqueformanestamquinaseidentifican
comomquinasrpidas(R).
El segundo grupo de mquinas lo forman cuatro PCs AMD DuronTM de 800 MHz con 256 MB de
memoria.Estasmquinasseidentificanmquinasintermedias(I).
Elltimogrupo,lasmquinaslentas(L),estformadoporseisPCsAMDK6TMde501MHzcon256MB
dememoria.
Todas las mquinas de estos tres grupos trabajan con el sistema operativo Debian Linux y estn conectadas
medianteunswitchFastEtherneta100Mbit/senunesquemadebusformandolareddeinterconexinRIN.En
esta plataforma se considera la heterogeneidad debida a diferencias en las velocidades de cmputo de los
procesadoresyalasdiferenciasenlasvelocidadesdecomunicacin(asumaquelaheterogeneidaddebidaalas
diferenciasenlascapacidadesdememorianoseconsideraencuenta).
Antecedentes:

OMV

Columnas
700
1000
1500
2000

CP 2014-II, TA 2/3-F2 UTEM

ElobservatoriodelcerroLasTurquesasseconstruyhace12mesesysecaracterizaportomarunagrancantidad
deimgenesalespacioparadetectarelementosenmovimientos.
Esteseencuentraaunaalturade2.264metrosdealturaypertenecealospasesdeSurinamyEtiopa.
La estrategia de observacin consiste en captar 'tiras' del firmamento al menos tres veces con un tiempo de
retardoqueoscilaentre10y20minutosdeunatiraalasiguiente.
Las imgenes se adquieren primero sin filtro alguno y con tiempos de exposicin que van de los 0 a los 180
segundos.
Trasunaprimerafasedepreprocesodelasimgenes(queseencargadelaeliminacindemalospixeles,camposplanos
ydesviacin)elprocesorealdeanlisisdeimgenessedesarrollaparadetectarobjetosenmovimiento.
Un primer paso del anlisis de imagen es la determinacin de coordenadas y la identificacin de los objetos
observados. A continuacin se desarrolla una segunda fase, con vistas a detectar objetos en movimiento. Este
proceso es automtico pero requiere confirmacin humana, dado que la deteccin automtica, a menudo,
encuentraobjetosfalsosenmovimiento(objetosqueenrealidaddeberanserpixeles'hot',porejemplo).
Otra operacin til que se hace a veces es el 'parpadeo visual', consistente en hacer fluctuar a las imgenes
quietas como en una tira de pelcula. De esta forma, las estrellas del fondo permanecen quietas y se pueden

OMV

CP 2014-II, TA 2/3-F2 UTEM

DEPTO. DE INFORMATICA Y COMPUTACION

ASIGNATURA: COMPUTACIN PARALELA


SEMESTRE : II-2014 INF-5141 - 2141
EVALUACIN: Taller 2y3-F2 4/Nov/2014
Problemas N1 N= Ta2F2; Problemas N4 a 6 Ta2F3

visualizarotrosobjetosenmovimiento.Graciasaestaoperacinesposibleincrementarhastaun20%elnmero
deobjetosmvilesencontradosenuncampodevisin.
Actualmenteelprocesodeanlisisserealizaenformasecuencialysedemora200minutosaproximadamente.
Como el tiempo de todo el proceso es muy alto, se est evaluando cambiar los computadores por
multiprocesadoresomulticomputadoresloscualesdeberandisminuireltiempodeejecucin.
Seharecibidoofertasdecuatroalternativaspararealizarlaconexindelosprocesadores:

Alternativaspararealizarlainterconexindelosprocesadores

16procesadoresconectadosporunareddeMallaBidimensional.
15procesadoresconectadosporunaredenformaderbolBinario.
16procesadoresconectadosporunaredHipercubo.
16procesadoresconectadosporunaredShuffleExchange.

Tiempodeejecucin
(minutos)
100
110
90
130

Dado las caractersticas del trabajo que se realiza con las imgenes, con apoyo de software altamente
especializado,senecesitagranrapidezenelprocesamiento,dadoquemientrasmsavanzalatecnologa,mayor
eslafacilidaddeencontrarnuevosastrosymsancuandoestnenmovimiento.
LosdirectivosdelObservatoriodeseansaberculdelas4alternativaselegiryleencarganlatareadeasesorarlos
(Analiceelproblemaytcnicamentedeterminelaalternativamsatractiva).

PROBLEMA 5. ( xx ptos).

Considerelasiguientetabladeindicadoresdedesempeo
paracadaunodelosalgoritmo(Ai,i=1,4)
1 Qu algoritmo es mejor (A1, A2, A3 A4)?.
Fundamente.
2EselTiempodeejecucinunamtricasignificativa?.
Fundamente.
3Hayalgnalgoritmoptimoencosto?.Demuestre.

PROBLEMA 6. ( xx ptos).
Considereunalgoritmodeordenamientoqueposeeuntiempodeejecucinserialde:
Ts(n)=O(nlgn).
Siunalgoritmodeordenamientodetipoparaleloutilizan/2procesadoresyposeeuntiempode
ejecucinsobrepprocesadoresdeTp(n)=O(n).
Determinesielalgoritmoparalelodeordenamientoesmseficiente?(Fundamentesurespuesta).

OMV

CP 2014-II, TA 2/3-F2 UTEM