Está en la página 1de 59

Arquitectura de Computadores

Tema 1
Introduccin. Conceptos fundamentales
Departamento de Arquitectura de Computadores y Automtica

Unversidad Complutense de Madrid (Spain)


Jos Ignacio Hidalgo
hidalgo@dacya.ucm.es

Jos Ignacio Hidalgo. DACYA. UCM, AC, 2009


2009--2010

ndice
1.
2.
3.
4.
5.
6.
7.

Introduccin. La asignatura
Perspectiva Histrica
Rendimiento, Coste y Potencia
Ley de Moore, Tendencias
Benchmarks
Ley de Ahmdal
Consumo

1. Introduccin. La asignatura.

Aplicacin

Lenguaje de alto nivel

Ofimtica (MS-Office, Contaplus, D-Base)


Comunicaciones (Netscape, Explorer, Mail)
Di (AutoCAD,
Diseo
(A t CAD ...),
) Multimedia,
M lti di J
Juegos, etc.
t
FOR, WHILE, REPEAT, PROCEDURE, ...
PASCAL, FORTRAN, C, COBOL, BASIC, ...
MODULA C++,
MODULA,
C++ JAVA,
JAVA ...
Gestin de memoria
Gestin de procesos
Gestin de ficheros

Sistema Operativo /
Compilador
Arquitectura del repertorio
de instrucciones
Organizacin
Hardware del sistema

Registros
R0

R7

Registro Estado
Contador Programa

Compilacin
Enlazado
Ubicacin
Loop move
load
add
sub
b
beq

#$10, R0
R1(dir1), R2
R2, R0
#1
#1, R1
Loop

Circuito Digital
CPU

Mem
Mem.

Fsico
Bus
E/S

Niveles de descripcin de un computador


Dnde se estudia?
Aplicacin

Casa, auto-aprendizaje en ratos libres,


Academias de informtica/ofimtica

Lenguaje de alto nivel

Fundamentos de Programacin
Programacin, EDI

Sistema Operativo /
Compilador

Sistemas Operativos (NO compiladores)

Arquitectura del repertorio


de instrucciones

ESTRUCTURA DE COMPUTADORES,

Organizacin
Hardware del sistema

Arquitectura de Computadores

Circuito Digital

Circuitos Digitales
Digitales, Tecnologa,
Tecnologa F
F. Computadores

Fsico

Instrumentacin,
Diseo y Test de Circuitos Integrados

Arquitectura de computadores
Los atributos de un computador tal y como los ve un
programador en lenguaje ensamblador.
ensamblador
La estructura conceptual y el modelo funcional (modelo de
programacin). Amdahl, Blaaw, Brooks 1964
El concepto ha cambiado en el tiempo.
Hasta la mitad de los 80. El nfasis era el diseo de juego de
instrucciones orientado a los LAN.
Desde entonces el nfasis es el diseo de CPU, Jerarqua de memoria,
sistema de I/O. Aspectos clave coste-rendimiento-tecnologa-potencia

Tres aspectos
Arquitectura del juego de instrucciones
Organizacin
O
i i ( diferentes
dif
t organizaciones
i i
P6,
P6 N
Netbrust,
tb t AMD)
Implementacin ( PentiumIII, Celeron, Pentium4, Pentium Xeon )

Evolucin de los juegos de instrucciones


Acumulador (EDSAC 1950)
Acumulador + Registros ndices
(Manchester Mark I, IBM 700 series 1953)

Separacin del modelo de programacin


de la implementacin

O i t d a los
Orientadas
l LAN
(B5000 1963)

C
Concepto
t d
de Familia
F ili
(IBM 360 1964)

Arquitecturas con Reg de propsito general


Arquitecturas CISC
(Vax, Intel 432, x86 1977-80)

Arquitecturas Load/Store
((CDC 6600,, Cray
y 1 1963-76))

RISC
(Mips,Sparc,HP-PA,IBM RS6000, . . .1987)

Metodologa de Diseo

Complejidad de la
Implementacin

E l
Evaluar
Sistemas
Si t
existentes

Benchmarks
Tendencias
Implementar Nuevo
Sistema

Simular Nuevos
Diseos

Carga de Trabajo
7

La asignatura
Entrada/salida y almacenamiento
Discos, WORM, Cintas

DRAM- Memoria Central

Jerarqua
de Memoria

RAID
Organizacin de
memoria
Protocolos de Bus

Coherencia,
Ancho de banda,
Latencia

L2 Cache

Segmentacin y ILP

L1 Cache
VLSI
Arquitectura del Procesador

DSP

Segmentacin, Riesgos,
Superescalar, Ejecucin fuera de orden,
Prediccin Especulacin
Prediccin,
Especulacin,
8

La asignatura
Que estudia la asignatura
P M

P M

P M

P M

Red de interconexin

Switch Procesador Memoria

Multiprocesadores
Redes de Interconexin

Memoria
M
i Compartida,
C
id
Paso de Mensajes,
Paralelismo de Datos
Red
Topologa,
Routing
Routing,
Ancho de Banda,
Latencia,

ndice
1.
2.
3.
4.
5.
6.
7.

Introduccin. La asignatura
Perspectiva Histrica
Rendimiento, Coste y Potencia
Ley de Moore, Tendencias
Benchmarks
Ley de Ahmdal
Consumo

10

2. Perspectiva histrica
Generaciones de computadores
Generacin

Fechas

Caractersticas Tecnolg.
Tecnolg

Potencia de clculo

Primera

1946-1957

Vlvula de vaco

0,04 MIPS

Segunda

1958-1964

Transistores

0,2 MIPS

Tercera

1965-1971

Circuitos integrados

1 MIPS

Cuarta

1972-1988

Microprocesador

10 MIPS

Quinta

1988-

Sistema basados en micro

> 100 MIPS

1 Generacin (1946(1946-1957)

ENIAC (1946)

Primer computador
p
de propsito
p p
especial
p
Peso: 30 toneladas; Superficie: 1.400 m2; Consumo: 140 KW
Potencia clculo: 5000 sumas/seg
Difcil de programar. Mediante conmutadores y cables

Primeros computadores comerciales (Aos 50)

UNIVAC I y II (Eckert & Mauchly)


IBM Serie 700
Programacin en lenguaje mquina

11

Mquina de Pascal

12

Mquina de Leibnitz

13

Charles Babbage

14

Ramn Verea

15

Leonardo Torres Quevedo

16

Colossus
Primera computadora totalmente electrnica

17

Primeras vlvulas de vaco


IBM RAMAC

18

Perspectiva histrica
2 Generacin (1958 - 1964)

El transistor
t
i t
Inventado por los laboratorios Bell en 1947
Ms p
pequeos,
q
, baratos y menor consumo que
q las vlvulas de vaco
Computadores de menor coste y tamao, ms fiables mayores prestaciones

Principales computadores comerciales


DEC PDP
PDP-1
1
IBM Serie 7000
UNIVAC 1100

Otras innovaciones

Programacin en lenguajes de alto nivel (Fortran, Cobol, ...)


Canales de E/S
Memoria virtual
Interrupciones para la E/S

19

Transistor
IBM 7030

20

Perspectiva histrica
3 Generacin (1965 - 1971)

El circuito integrado (CI)

Principales computadores comerciales

Integracin de mltiples componentes (transistores, resistencias, condensadores, .. )


en un mismo CI de silicio
Reduce enormemente el tiempo de fabricacin, el tamao y el coste del computador
Aumenta an ms la fiabilidad y las prestaciones
DEC PDP
PDP-8
8
IBM Series 360 y 370
UNIVAC 1108
CDC series 6600, 7800 y Cyber

Otras innovaciones

Microprogramacin
Interrupciones con prioridades
Memoria cache
Controladores DMA
Nuevos lenguajes de programacin (Basic, APL, Pascal)
Si t
Sistemas
operativos
ti
robustos
b t (MVS de
d IBM,
IBM VMS de
d DEC)
21

IBM 360

22

Perspectiva histrica
4 Generacin (1972 - 1988)

El microprocesador
i
d

Aumento constante en escala de integracin (LSI, VLSI): se duplica cada ao


La escala LSI permite integrar todos los componentes de un procesador en un mismo chip

De 8 bits: intel 8008, 8080; Motorola 6502, 6800


De 16 bits (ao 78): intel 8086, 80286; Motorola 68000, 68010
De 32 bits (aos 85): intel 80386; Motorola 68020, 68030
MIPS R2000 (32 bits, ao 1986)

Supercomputadores vectoriales y paralelos

Microsoft desarrolla el primer sistema operativo para PC: MS-DOS

Surge el procesador con conjunto reducido de instrucciones (RISC)

i4004

Principales procesadores de esta generacin

Primer microprocesador: intel 4004 (procesador de 4 bits, 1971)

Aparece el computador personal (IBM/PC)

Nace el MICROPROCESADOR

Basados en tecnologa ECL


Muy caros de fabricar y mantener
Cray, NEC, Hitachi, Fujitsu

Aparecen
p
las redes de computadores
p

23

Intel 4004

Procesador
P
ocesado de 4 bits
2300 Transistores
8 micras

24

Intel 8008
Intel 8008

Procesador
P
d d
de 8 bits
bit
3500 Transistores
16 K bytes de memoria
O,5 MHz

25

4 Generacin
MITS Altair 8800

Apple II (MC6502)

26

CRAY 1

27

Perspectiva histrica
5 Generacin (1988 - ...)

Sistemas basados en microprocesador

Contina crecimiento en la escala de integracin:


Ms de 15 millones de transistores por chip
Se abaratan los precios de los microprocesadores y aumentan sus prestaciones
Aparece el procesador superescalar, capaz de lanzar varias instrucciones por ciclo de reloj
La increble relacin coste-prestaciones del microprocesador hace de ste el elemento bsico de:
Computadores personales
PC (i486,
(i486 Pentium,
P ti
Pentium
P ti
II,
II Pentium
P ti
III,
III Pentium
P ti
4,
4 Pentium
P ti
M)
Machintosh (Motorola 68030, 40, PowerPC4)
Estaciones de trabajo (Work-Stations)
Sun (SuperSparc
(SuperSparc, UltraSparc II, UltraSparc II
II, UltraSparc III)
DEC (Alpha 21064, 21164, 21264, 21364)
Silicon Graphics (MIPS R4000, R5000, R8000, R10000, R12000)
IBM (RS/6000)
Supercomputadores paralelos basados en microprocesadores
Multicomputadores de de memoria distribuida (Cray T3E, IBM SP2)
Multiprocesadores de memoria compartida (SG Origin 2000, Sun SparcServer, HP
PA8000)
28

ndice
1.
2.
3.
4.
5.
6.
7.

Introduccin. La asignatura
Perspectiva Histrica
Rendimiento, Coste y Potencia
Ley de Moore, Tendencias
Benchmarks
Ley de Ahmdal
Consumo

29

Perspectiva histrica
Evolucin del rendimiento de los computadores

Incremento del rendimiento:


X 1.54 anual

Medida de rendimiento utilizada:


nmero de veces ms rpido qu el VAX-11/780

30

Consumo de Potencia

31

ndice
1.
2.
3.
4.
5.
6.
7.

Introduccin. La asignatura
Perspectiva Histrica
Rendimiento, Coste y Potencia
Ley de Moore, Tendencias
Benchmarks
Ley de Ahmdal
Consumo

32

Ley de Moore Segn Intel

33

Predicciones
1997

1999

2001

2003

2006

2009

2012

Tamao
caracterstico
(micras)

0.25

0.18

0.15

0.13

0.1

0.07

0.05

Voltaje de
alimentacin (V)

1.8-2.5

1.5-1.8

1.2-1.5

1.2-1.5

0.9-1.2

0.6-0.9

0.5-0.6

Transistores por
chip (M)

11

21

40

76

200

520

1,400

Bits DRAM por


chip (M)

167

1,070
,

1,700
,

4,290
,

17,200
,

68,700
,

275,000
,

Tamao del dado


(mm2)

300

340

385

430

520

620

750

Dimensin
mxima del chip
(mm)

17.3

18.4

19.6

20.7

22.8

24.9

27.4

Frecuencia de
reloj local (MHz)

750

1,250

1,500

2,100

3,500

6,000

10,000

Frecuencia de
reloj global
(MHz)

750

1,200

1,400

1,600

2,000

2,500

3,000

Mxima p
pot p
por
chip (W)

70

90

110

130

160

170

175

34

Rendimiento
Evolucin del rendimiento de los computadores (cont.)

Incremento del rendimiento:


X 1.54 anual
Incremento en la frecuencia del reloj: X 1.25 anual
La diferencia entre el incremento en la frecuencia del reloj y el incremento real del
rendimiento se debe a la introduccin de mejoras en el diseo y la organizacin del
propio computador

Mejoras en el procesador
Procesadores superescalares (lanzan varias instrucciones por ciclo)
Ejecucin
Ej
i ffuera d
de orden
d y tcnicas
i
de
d ejecucin
j
i especulativa
l i (eliminan
( li i
muchas
h de
d las
l
dependencias impuestas por el programa)
Mejoras en la memoria
Uso de jerarqua de memoria (memoria cache
cache, memoria principal
principal, memoria virtual)
Mejoras en los elementos de interconexin
Uso de jerarqua de buses (buses del sistema, buses de expansin, buses externos)
Mejoras en la gestin de la entrada/salida
Acceso directo a memoria (DMA), procesadores de E/S
Mejoras en los dispositivos de entrada/salida
Dispositivos de almacenamiento de alta velocidad (discos, CD-ROM, etc.)
Redes
R d de
d alta
lt velocidad
l id d
35

PREDICCIONES DE LA SIA

36

PREDICCIONES DE LA SIA
Los estudios se basan en:
transistores (rea),
velocidad (reduciendo tiempo de respuesta a los cambios)
potencia.
potencia

Las predicciones han ayudado al diseo de nuevos chips.


Problema: limitaciones de la tecnologa actual.
actual

37

Procesadores de Propsito General


Claves en el diseo:
Rendimiento y velocidad
Speed-up
Eficiencia

Potencia y temperatura
Potencia Esttica
Hot Spots

Memoria Cache
Tamao y niveles

Nmero de threads
Nmero de Cores
Actuales < 8
Futuro 100s

38

EMBEDDED PROCESSORS Y PROCESADORES Soc


Claves en el diseo
Procesadores especializados
Dominan el mercado
Adaptacin de sistemas y aplicaciones

39

Rendimiento, rea y Potencia

40

Consideraciones sobre el rendimiento


Limitaciones al rendimiento:
Memory wall:
ms velocidad de CPU, ms fallos de cach en un determinado tiempo.
La MP no p
puede trabajar
j a tales velocidades.

Frequency wall:
el nmero de puertas lgicas en una etapa no se puede reducir ms all
de un lmite

Power wall:
ms frecuencia implica ms densidad de potencia y, por tanto, ms
calor.

41

CONSIDERACIONES SOBRE EL
COSTE ((REA))

42

DIFERENCIA ENTRE DENSIDAD Y


PRODUCTIVIDAD

g p
gap

43

FUTURAS DIRECCIONES DE LA TECNOLOGA


Objetivo:
Diseos con alto rendimiento y
Bajo consumo de potencia

Arquitecturas de alto rendimiento:


Ncleos mltiples
Ms hilos (threads) de ejecucin por ncleo
Cachs multinivel ms grandes

ELPA
Arquitecturas con consumo mnimo de potencia
Con el objetivo de mejorar la vida media de las bateras

44

ndice
1.
2.
3.
4.
5.
6.
7.

Introduccin. La asignatura
Perspectiva Histrica
Rendimiento, Coste y Potencia
Ley de Moore, Tendencias
Benchmarks
Ley de Ahmdal
Consumo

45

Rendimiento
Rendimiento del procesador
T CPU= N * CPI * t

N : N de Instrucciones
Compiladores y LM

CPI : Ciclos medios por instruccin

LM, implementacin, paralelismo


(TCPU * Clock Rate) / Numero de Instrucciones
Ciclos / Numero de Instrucciones
CPI i * F i
Fj es la frecuencia de aparicin de la instruccin J

t : ttiempo
e po de de cciclo
co
implementacin, tecnologa

Ejemplo:
ALU 1 ciclo( 50%),
50%) Load 2c(20%),
2c(20%) Store 2c(10%),
2c(10%) saltos 2c(20%)
CPI = ALU 0.5, Ld 0.4, St 0.2, salto 0.4
TOTAL CPI = 1.5

Invertir recursos donde se gasta el tiempo


46

Benchmarks

La nica forma fiable es ejecutando distintos programas reales

Programas de
de juguete:
juguete :
10~100 lneas de cdigo con resultado conocido.
Criba de Erasttenes, Puzzle, Quicksort

Programas de prueba (benchmarks) sintticos:


simulan la frecuencia de operaciones y operandos de un abanico de
programas reales.
Whetstone, Dhrystone

Programas reales tpicos con cargas de trabajo fijas


Actualmente la medida ms aceptada
SPEC2000 12 programas enteros y 14 en punto flotante

Otros

HPC:LINPACK, SPEChpc96, Nas Parallel Benchmark


Servidores: SPECweb
SPECweb, SPECSFS( File servers)
servers), TPC
TPC-C
C
Graficos: SPECviewperf(OpenGL), SPECapc( aplicaciones 3D)
Winbench, EEMBC

47

Rendimiento

48

ndice
1.
2.
3.
4.
5.
6.
7.

Introduccin. La asignatura
Perspectiva Histrica
Rendimiento, Coste y Potencia
Ley de Moore, Tendencias
Benchmarks
Ley de Ahmdal
Consumo

49

Un principio simple
Un principio bsico:
Hacer rpidas las funciones frecuentes
Gastar recursos donde se gasta el tiempo

Ley de Amdahl:
Ell porcentaje de
d mejora en ell rendimiento
d
de
d un procesador
d viene limitado
l
d
por el porcentaje del impacto global del elemento que se quiere modificar
Permite caracterizar este principio
Permite la evaluacin del speedup que se obtendr con una cierta mejora
Si la mejora solo acelera la ejecucin de un fraccin F de la tarea, el tiempo de
ejecucin del resto permanece sin modificacin. Por tanto es muy importante el
porcentaje de la tarea que es acelerada.

Medidas de Mejora Aceleracin o Speed-up y Eficiencia


Speedup(E) = TEj sin M / TEj con M
Eficiencia = Tiempo con N Procesadores /Tiempo con 1 procesador *N
N

50

Un principio simple

La Ley Amdahl

TEjnuevo = TEjantiguo x (1 - Fraccionmejora) + Fraccionmejora


Speedupmejora
TEjantiguo

Speeduptotal =

TEjnuevo

Un ejemplo:

1
=
((1 - Fraccionmejora) + Fractionmejora

Se mejora la implementacin de la operaciones PF


reduciendo su tiempo a la mitad.
El 10% de las instrucciones en mi programa son PF

Speedupmejora

TEjnuevo = TEjantiguo x (0.9 + 0.1/2) = 0.95 x TEjantiguo


1
Speeduptotall

=
0.9
5

1.053

Speedup de un 5%
51

ndice
1.
2.
3.
4.
5.
6.
7.

Introduccin. La asignatura
Perspectiva Histrica
Rendimiento, Coste y Potencia
Ley de Moore, Tendencias
Benchmarks
Ley de Ahmdal
Consumo

52

Por qu preocupacin sobre disipacin de potencia?

Parmetros trmicos
Potencia disipada por el transistor es especialmente crtico con la
temperatura
Instalacin de un radiador o aleta refrigeradora
no sobrepasar valores mximos que destruyan el dispositivo

Potencia disminuye a medida que aumenta la temperatura.


Coste, Empaquetamientos CI

Consumo elctrico
Duracin bateras

53

Disipacin de potencia
Fuentes de consumo de potencia:
Unidades
U id d de
d procesamiento
i t
Memorias
Interconexiones y Comunicaciones
SINGLE CORE

DUAL CORE

Wafer of Pentium 4 processors

Wafer of Intel Xeon processors

MULTI CORE

Wafer of Itanium processors

Futuras tecnologas de fabricacin de Intel


(65
(65nm, 45nm
45
y 32nm),
32 )
permitirn mltiples cores manteniendo el tamao de die y el consumo
dentro de los lmites actuales, proporcionando mejoras de rendimiento

54

Consumo potencia: Fundamentos


Potencia dinmica vs. Potencia esttica vs. Potencia cortocircuito
switching
switching power
leakage power
Potencia dinmica predomina, pero la potencia esttica incremento
importante

Potencia esttica:
En chip proporcional al n de transistores

Potencia
P
i dinmica:
di i
debido a la carga de capacidades durante las transiciones 01 y 10.
En chip, potencia disipacin proporcional rea

Potencia cortocircuito:
Debida a breve corriente de cortocircuito durante las transiciones.

55

Potencia dinmica CMOS

Pdyn
y CVAf
Edisipada (E) C*VCC
Icharge
Isc

Pdisipada C*VCC*f

Isc

Potencia
P t
i corto
t circuito
i it
Camino corriente
directa entre
VCC y GND cuando
d
ambos transistores
NMOS y PMOS estn
conduciendo
conduciendo.

Idischarge

CMOS

mejora todas caractersticas


tecnolgicas

Desventaja:

ITRS (International technology


roadmap for semiconductor)

aumenta capacidad
d d entrada
d
asociada a las puertas

Aumento en el tiempo
respuesta al cargar las salidas
56

Potencia esttica
Potencia esttica:

Corrientes
C
i t leakage
l k

Presente siempre (an inactivo)


Debida a la formacin de diodos parasitarios en CMOS
Ps es el producto del voltaje de la fuente de alimentacin por la corriente
esttica del circuito.
La corriente inversa de saturacin de los diodos crece exponencialmente con
el incremento de la temperatura y disminuye el voltaje umbral.
DSM (Deep Sub-Micron).(Mucha importancia diseos altas prestaciones).

Ps Ifugas.Vcc
Vcc

57

Mtricas
Energa (julios/instruccin), MIPS/W SPEC/W, CV2
reduciendo
d i d ell voltaje
lt j alimentacin
li
t i o capacidad
id d (transistores
(t
i t
de
d menor
tamao)(aumento retardo)
Reduccin de la frecuencia
Formas no adecuadas de medir porque influyen en el rendimiento.

Objetivo: buscar una mtrica de consumo en base a un rendimiento


dado.
Producto Retardo-Potencia (DP) (Julios) (DP=Tpropagacin*Pdisipacin)
Producto Energa-retardo (EDP). (MIPS2/W, Julio/SPEC
SPEC2/W)(Aumentar el rendimiento o reducir energa)
Producto Energa-retardo2 (ED2P). (MIPS3/W SPEC3/W)(utilizando
tecnologa mas pequea)

Tener en cuenta las corrientes de leakage y el HW adicional a la hora de


evaluar mejoras.

58

Bibliografa
Captulo 1 de [HePa06]
Semiconductor
S i
d t Industry
I d t A
Association.
i ti

http://public.itrs.net
Standard Performance Evaluation Corporation
Corporation.

http://www.spec.org
Transaction Processing Council.
Council

http://www.tpc.org
The Embedded Microprocessor Benchmark Consortium.

http://www.eembc.org
Historia de la Informtica y sus p
pioneros

Carlos A. Coello Coello

59

También podría gustarte