Está en la página 1de 47

PORTADA viernes, 26 de abril de 2013

NDICE
Indice ... Introduccin .... Procesadores .. Historia de los microprocesadores previos a la PC ... Especificaciones de procesadores . Administracin de energa Ejecucin superescalar .. Tecnologa MMX .. Streaming SIMD Extensions . 3DNow y Enhanced 3DNow . Ejecucin dinmica ... Arquitectura de Bus Dual .. Fabricacin del Procesador ... Encapsulamiento de procesadores PGA Conclusiones . Bibliografa

INTRODUCCIN
El estado cambiante del mundo moderno exige a la tecnologa una actualizacin constante, a tal grado de que el humano ha creado sistemas tan complejos como la inteligencia artificial, la cual es utilizada a su vez para crear tecnologa ms avanzada, por ello la razn de este documento, conocer el funcionamiento lgico de los pseudos cerebros electronicos, los microprocesadores. El mundo digital se mueve a travs de procesadores, desde gigantescas mquinas creadas hace dos o tres decadas hasta la actualidad, contenidos en menos de 1 cm3 con tecnologa de hasta 13 micras (1 micra = 1x10-6 mts millonesima parte de metro); de esta manera se han creado aparatos tan sofisticados y pequeos como camaras digitales contenidas dentro de un pequeo aparato del tamao de una mosca o telefonia mvil del tamao de un reloj de pulso (aunque se puede ms pequeos, pero seran incomodos de utilizar), cada uno de los apartatos que utilizamos hoy en da que nos devuelbe cualquier tipo de respuesta como un reloj de bajo costo que muestra el cronometro despus de pulsar un botn hasta una gran computadora al reproducir una pelcula es causado por un procesador. El presente documento se basa en los procesadores diseados para trabajar computadoras, ordenadores de informacin capaces de agilizar nuestro trabajo o hacer crecer a grandes empresas como simplemente entretenernos con una buena pelcula o disfrutar de nuestra msica favorita. Presentando aqu los tipos y especificaciones de procesadores tratando que el usuario interesado en la organizacin dichos aparatos entienda e identifique mejor el comportamiento de los sistemas actuales. Nivel de usuario: 7 1 Principiante 5 Intermedio 10 Experto

Tipos y especificaciones de procesadores Procesadores


El procesador tambin conocido como Unidad Central de Procesamiento, CPU, o microprocesador es el cerebro o motor de la PC. La CPU lleva a cabo todos los clculos y procesamientos del sistema. Este componente es el ms costoso del equipo entero, y su precio es cuatro veces mayor (o ms) al de la tarjeta madre en la que se conecta. Generalmente se reconoce a Intel como el creador del primer microprocesador; en 1971 introdujo el chip llamado 4004. En la actualidad, Intel mantiene el control del mercado de procesadores, por lo menos en el campo de las PCs. Esto implica que todos los sistemas compatibles con PC usan procesadores Intel, o compatibles producidos por un grupo de competidores (como AMD o Cyrix). El predominio de Intel en el mercado de los procesadores no ha sido siempre tan rotundo. Aunque se le reconoce como el inventor del procesador y por haber introducido el primer modelo al mercado, a finales de la dcada de los setenta, los dos procesadores ms populares para PC no eran Intel (aunque uno de ellos era un clon de Intel). Las computadoras personales de aquella poca usaban, sobre todo, el Z-80 de Zilog y el 6502 de MOS Technologies. El Z-80 sobresali por ser un clon mejorado y ms barato del Intel 8080, muy a la manera en que las compaas de la actualidad AMD, Cyrix, IDI y Rise Technologies han duplicado los Pentium de Intel. En el primer caso, sin embargo, el clon era ms popular que el original. El Z-80 era empleado por los sistemas de finales de los setenta y principios de los ochenta que corran el sistema operativo CP/M, mientras que el 6502 era conocido por su utilizacin en las primeras computadoras Apple (antes de la Mac). El destino tanto de Intel como de Microsoft cambi dramticamente en 1981, cuando IBM introdujo la PC IBM, la cual se basaba en un procesador Intel 8088 a 4.77 MHz, el cual usaba el Sistema Operativo de Disco de Microsoft (MS-DOS) 1.0. A partir de esa decisin trascendental, los sistemas compatibles con PC han usado procesadores Intel o compatibles con Intel, y cada nuevo modelo es capaz de ejecutar el software compatible con su antecesor, del 8088 al Pentium III/Celeron y Athlon/Duron. Las siguientes secciones se ocupan de los tipos de procesadores usados en computadoras personales desde la introduccin de la primera PC, hace casi dos dcadas. Esas secciones proporcionan descripciones muy detalladas de esos chips y explican por qu un tipo de procesador puede hacer ms que el antecesor en el mismo lapso.

Historia de los microprocesadores previos a la PC


Es interesante observar que el microprocesador existi durante slo diez aos antes de la creacin de la PC. El microprocesador fue inventado por Intel en 1971; la PC, por IBM, en 1981. Ahora, 25 aos despus, an usamos sistemas basados, ms o menos, en el diseo de esa primera PC (y la mayora compatibles con ella). Los procesadores que impulsan nuestras PCs siguen siendo compatibles, en machas maneras, con el 8088 seleccionado por IBM en 1981. El procesador 4004 fue introducido el 15 de noviembre de 1971 y corra originalmente a una velocidad de reloj de 108 KHz (108,000 ciclos por segundo, un poco ms de un dcimo de megahertz). El 4004 contena 2,300 transistores y fue construido mediante un proceso de 10 micras, es decir, cada lnea, trazo o transistor poda estar separado de los elementos contiguos alrededor de 10 micras (millonsima parte de un metro). Los datos eran transmitidos cuatro bits a la vez, y la memoria mxima direccionable era de slo 640 bytes. El 4004 fue diseado para una calculadora, pero result ser til para machas otras funciones gracias a su programabilidad inherente. 4

En abril de 1972, Intel liber el 8008, el cual corra a ana velocidad de reloj de 200 KHz (0.2 MHz). El 8008 contena 3,500 transistores bajo el mismo esquema de 10 micras de su antecesor. El gran cambio presentado por el 8008 era su bus de datos de 8 bits, lo cual implicaba su capacidad de transferir 8 bits a la vez, es decir, el doble que el procesador previo. Tambin poda direccionar ms memoria, hasta 16 KB. En principio, este chip fue usado en terminales tontas y calculadoras de propsito general. El siguiente chip de la lnea, el 8080, fue introducido en abril de 1974, con una frecuencia de reloj de 2 MHz. Debido sobre todo a su mayor velocidad, el 8080 ofreca un rendimiento 10 veces mayor al del 8008. El 8080 contena 6,000 transistores y fue construido con un proceso de 6 micras. Como su antecesor, el 8080 tena un bus de datos de 8 bits, y poda direccionar hasta 64 KB de memoria, significantemente ms que el chip previo. Fue, precisamente, el 8080 el que contribuy a desencadenar la revolucin PC, pues fue el usado en lo que generalmente se reconoce como la primera computadora personal, la Altair 8800. El sistema operativo CP/M fue escrito para el chip 8080. Microsoft fue fundada para desarrollar su primer producto: el Microsoft BASIC para la Altair. Estas herramientas iniciales constituyeron los cimientos de una revolucin de software ya que se escribieron miles de programas para esta plataforma. De hecho, el 8080 alcanz tal popularidad que fue clonado. Una compaa llamada Zilog, constituida a finales de 1975 por varios ex ingenieros del Intel 8080, liber en julio de 1976 el procesador Z-80, el cual era una versin bastante mejorada del 8080. No presentaba compatibilidad de pines, pero integraba funciones como interfaz de memoria y circuitos para actualizacin de RAM, las cuales permitan el diseo de sistemas ms simples y de menor costo. El Z-80 inclua tambin un superconjunto de instrucciones 8080, lo cual implicaba la capacidad de ejecutar todos los programas del 8080. Tambin agregaba nuevas instrucciones y nuevos registros internos, de manera que el software diseado para Z-80 no necesariamente corra en el 8080. El Z-80 funcionaba inicialmente a 2.5 MHz (las versiones posteriores lo hacan a 10 MHz), y contena 8,500 transistores. El Z-80 reconoca 64 KB de memoria. Radio Shack seleccion el Z-80 para el Modelo 1 TRS-80, su primera PC. Tambin fue el primer chip usado en machos sistemas pioneros como las mquinas Osborne y la Kaypro. Otras compaas se sumaron a esta tendencia y pronto el Z-80 fue el procesador estndar para mquinas con el sistema operativo CP/M y el software ms popular de la poca. Intel liber el 8085, el sucesor del 8080, en marzo de 1976. Aunque se estren varios meses antes que el Z-80, nunca igual su popularidad en sistemas de computacin personal. Fue popular, ms bien, como controlador incrustado, til en sistemas expandibles (o escalables) y otros equipos computarizados. El 8085 funcionaba a 5 MHz y contena 6,500 transistores, en un proceso de 3 micras, e incorporaba un bus de 8 bits. Con diferentes lineamientos arquitectnicos, MOS Technologies construy el 6502 en 1976. Este chip fue diseado por varios ingenieros que provenan de Motorola, quienes haban trabajado en el primer procesador de esa compaa, el 6800. El 6502 era un procesador de 8 bits como el 8080, pero costaba alrededor de 25 dlares, mientras que el 8080 costaba ms a menos 300 cuando salio a la venta. El precio atrajo la atencin de Steve Wozniak, quien coloc el chip en los diseos de sus Apple I y Apple II. El chip tambin fue empleado por sistemas Commodore y otros fabricantes. El 6502 y sus sucesores tambin llegaron a los juegos por computadora, incluyendo el Sistema de 5

Entretenimiento Nintendo (NES) original, entre otros. Motorola entonces se aboc a crear la serie 68000, cuyos procesadores se convirtieron en la base de la lnea de computadoras Apple Macintosh. En la actualidad, esos sistemas usan el PowerPC, de Motorola, y un sucesor de la serie 68000. Todos estos modelos prepararon el camino para los primeros chips de PC. En junio de 1978, Intel introdujo el 8086, el cual incluy el conjunto original de instrucciones x86, an presente en los chips compatibles con x86, como los Pentium III. El 8086 constitua un avance notable, pues presentaba un diseo integral de 16 bits con registros internos y bus de datos de 16 bits. Esto implicaba que poda trabajar internamente con nmeros y datos de 16 bits, y adems emitir y recibir 16 bits a la vez. El 8086 contena 29,000 transistores e inicialmente funcionaba a 5 MHz. Tambin usaba un direccionamiento de memoria de 20 bits, lo cual le permita reconocer directamente hasta 1 MB de memoria. Aunque no tena una compatibilidad hacia atrs directa con el 8080, el lenguaje y las instrucciones del 8086 eran muy similares y permitan la migracin sencilla de programas viejos a la nueva plataforma. Esto result de la mayor trascendencia para dar inicio a la revolucin del software de PC a travs de software CP/M (8080) reciclado. Aunque el 8086 era un microprocesador muy bueno, era bastante costoso y requera de un chip de soporte de 16 bits y un diseo de tarjeta may caros. Para bajar costos, en 1979, Intel liber una versin reducida del 8086 conocida como el 8088. El 8088 usaba el mismo ncleo del 8086, tenia los mismos registros de 16 bits y poda reconocer la misma cantidad de memoria: 1 MB; la diferencia era su bus de datos, de slo 8 bits. Esto permita el uso de los chips de soporte del viejo 8085 a 8 bits y, en consecuencia, la produccin de tarjetas y sistemas mucho ms econmicos. Por esas razones, IBM seleccion el chip de capacidades reducidas, el 8088, para la primera PC. Esta decisin afectara la historia de varias maneras. El 8088 presentaba completa compatibilidad de software con el 8086, de manera que poda ejecutar software de 16 bits. Adems, gracias a que el conjunto de instrucciones era muy similar al de los 8085 y 8080, los programas escritos para esos procesadores anteriores podan ser fcil y rpidamente modificados. Esto permiti la pronta publicacin de una gran cantidad de programas para la PC IBM, ayudndole a convertirse en todo un xito, el cual forz la conservacin de compatibilidad hacia atrs como factor para mantener el impulso logrado. Con este fin, Intel ha tenido que mantener compatibilidad hacia atrs con el 8088/8086 en la mayora de los procesadores introducidos al mercado desde entonces. En algunos sentidos, el xito de la PC, y su arquitectura de Intel, ha limitado el crecimiento de la computadora personal. Sin embargo, por otro lado, ha promovido la produccin de una enorme cantidad de programas, perifricos y accesorios; adems, se convirti en un estndar de facto de la industria. El procesador 8088 original usado en la primera PC contena cerca de 30,000 transistores y funcionaba a menos de 5 MHz. Intel acaba de presentar una versin del Pentium III Xeon con 140 millones de transistores, cantidad nunca antes vista en un procesador, y 2 MB de memoria cach integrada. Tanto AMP como Intel estn produciendo modelos que funcionan a 1 GHz (de hecho, AMD lleg a este punto dos das antes que Intel), y ambos han demostrado procesadores en la escala de los 2 GHz. Y el progreso no acaba ah; de acuerdo con la ley de Moore, la velocidad de procesamiento y la densidad de transistores se duplican cada ao y medio a dos aos.

Especificaciones de procesadores
A menudo, se hace referencia a especificaciones confusas cuando se habla de procesadores. Estas secciones analizan algunas de ellas incluyendo al bus de datos, el bus de direcciones y la velocidad. 6

La siguiente seccin incluye una tabla con las especificaciones de prcticamente todos los procesadores PC. Los procesadores pueden ser identificados a travs de dos parmetros principales: su anchara y su velocidad. La velocidad de un procesador es un concepto bastante simple: sta se cuenta en megahertz (MHz), es decir, millares de ciclos por segundo, y en este caso, entre ms rpida, mejor! la anchura de un procesador requiere de una explicacin un poco ms compleja, porque hay tres especificaciones principales en un procesador expresadas como anchuras. Ellas son: Registras internos Bus de entrada y salida de datos Bus de direccionamiento de memoria Los sistemas de menos de 16 MHz generalmente no cuentan con memoria cach; los de 16 MHz y superiores presentan memoria cach en tarjeta madre, porque la memoria principal de esa poca no poda funcionar a 16 MHz. Antes del procesador 486, la cach de tarjeta madre era la nica del sistema. A partir de la serie 486, los procesadores comenzaron a incluir lo que se conoce coma cach L1 (Primer Nivel) directamente en el procesador. Esto implic que la cach L1 funcionara siempre a la misma velocidad del procesador, lo cual cobr especial importancia cuando los 486 comenzaran a operar a velocidades ms altas que las correspondientes a las de las tarjetas madre en que estaban conectados. Durante este periodo, el cach de tarjeta madre se conoci como L2 (Segundo Nivel), y funcionaba a la velocidad, menor, de la tarjeta madre. A partir del Pentium Pro y el Pentium II, Intel comenz a incluir chips de memoria cach L2 directamente dentro del mismo paquete que contiene al procesador. Originalmente, esta cach L2 integrada fue instrumentada en forma de chips contenidos en el paquete del procesador, pero no dentro del circuito integrado del procesador. Dada que los chips de memoria cach comerciales no pudieron mantenerle el paso a la velocidad del procesador, la mayora de las cachs L2 de esos procesadores corran al 50 por ciento de la velocidad (en los Pentium II/III y Athlon AMD), y algunas a velocidades incluso menores, a dos quintos o un tercio de la velocidad del procesador (como en el Athlon de AMD). Los procesadores originales Pentium II, III, Celeron y Athlon (Modelos 1 y 2) usan 512 KB de cach L2 de la mitad, dos quintos o un tercio de la velocidad, como lo muestra la tabla 3.1. Tabla 3.1 Velocidades de cach L2 Procesador Velocidad Tamao L2 Pentium III 450 - 600 MHz 512 KB Athlon 550 - 700 MHz 512 KB Athlon 750 - 850 MHz 512 KB Athlon 900 - 1000 MHz 512 KB

Tipo L2 Externa Externa Externa Externa

Velocidad L2 (225 - 300 MHz) (275 - 350 MHz) 2/5 (300 - 340 MHz) 1/3 (300 - 333 MHz)

Los procesadores Pentium Pro, Pentium II/III Xeon, Pentium III ms recientes, Celeron, K6-3, Athlon (Modelo 4) y Duron incluyen cach L2 de la misma velocidad, como lo muestra la tabla 3.2.

Tabla 3.2 Cachs con velocidad igual a la del ncleo Procesador Velocidad Tamao L2 Pentium Pro 150 - 200 MHz 256 KB - 1 MB K6-3 350 - 450 MHz 256 KB Duron 550 - 700+ MHz 64 KB Celeron 300 - 600+ MHz 128 KB Pentium II Xeon 400 - 450 MHz 512 KB - 2MB Athlon 650 - 1000+ MHz 256 KB Pentium III 500 - 1000+ MHz 256 KB Pentium III Xeon 500 - 1000+ MHz 256 KB - 2 MB

Tipo L2 Externa En circuito integrado En circuito integrado En circuito integrado Externa En circuito integrado En circuito integrado En circuito integrado

Velocidad L2 Misma Misma Misma Misma Misma Misma Misma Misma

El problema que originalmente forzaba a la cach L2 a funcionar a una velocidad menor a la del procesador era simple: los chips de cach disponibles en el mercado simplemente no sostenan el paso. Intel fabric sus propios chips de memoria cach de alta velocidad para los procesadores Xeon, pero esto tambin los hacia ms costosos. La segunda generacin de Celeron marc un avance: Intel integr tanto la cach L1 como la L2 directamente en el circuito integrado del procesador, en donde ambas corren a la misma velocidad del ncleo. Este tipo de diseo fue adoptado rpidamente para la segunda generacin de Pentium III, as como en la fabricacin de los procesadores AMD K6-3, Athlon y Duron. De hecho, prcticamente todos los procesadores futuros de Intel y AMD han adoptado la cach L2 en circuito integrado o lo harn, pues es la nica forma rentable para aumentar al mximo la velocidad de la memoria cach. La tabla 3.3 presenta las especificaciones principales de la familia de procesadores Intel empleados en las PCs IBM y compatibles. La tabla 3.4 muestra los procesadores compatibles con Intel producidos por AMD, Cyrix, NexGen, IDT y Rise. Nota Observe que en la tabla 3.3, el Pentium Pro incluye 256 KB, 512 KB o 1 MB de cach L2 a velocidad completa en un circuito integrado separado dentro del chip. Los procesadores Pentium II/III incluyen 512 KB de cach L2 de velocidad a la mitad, en la tarjeta del procesador. Los Celeron, Pentium II PE y Pentium IIIE incluyen cach L2 a velocidad completa, integrada directamente dentro de la pastilla del procesador. El Celeron III usa el mismo circuito integrado que el Pentium IIIE, aunque la mitad de la cach en circuito integrado est inhabilitada, lo cual deja, 128 KB funcionales. Los totales de los transistores no incluyen los de la cach L2 externa (fuera del circuito integrado) de 256 KB, 512 KB, 1MB o 2 MB incluida en los cartuchos Pentium Pro, Pentium II/III, Xeon, o AMD Athlon. La cach L2 externa de esos procesadores contiene 15.5 (256 KB), 31 (512 KB), 62 (1 MB) o 124 (2 MB) millones de transistores en chips separados! Observe en la tabla 3.4 que el Athlon incluye cach L2 de 512 KB en chips separados, a la mitad, dos quintos o un tercio de la velocidad del ncleo del procesador; o 256 KB de L2 en circuito integrado a la misma velocidad del ncleo, dependiendo de la versin. Tasas de la velocidad de los procesadores Un malentendido comn, con respecto a los procesadores, son sus diferentes tasas de velocidad. Esta seccin analiza la velocidad del procesador en general, y proporciona informacin ms especifica acerca de los procesadores Intel. 8

La velocidad de reloj de un sistema de computacin se mide en trminos de frecuencia, por lo regular expresada como un nmero de ciclos por segundo. Un oscilador de cristal controla las velocidades de reloj mediante una delgada lmina de cuarzo, la cual reside a veces en lo que parece un pequeo contenedor de estao. Los sistemas nuevos incluyen la circuitera del oscilador en el conjunto de chips de la tarjeta madre, de manera que, en las tarjetas ms recientes, puede no ser un componente separado visible. Cuando se aplica voltaje al cuarzo, ste comienza a vibrar (oscilar) a una frecuencia armnica determinada por la forma y tamao del cristal. Las oscilaciones emanan del cristal en la forma de una corriente que se alterna de acuerdo con su frecuencia armnica. Esta corriente alterna es la seal de reloj, la cual forma la base de tiempo sobre la cual opera la computadora. Un sistema de computacin tpico corre a millones de esos ciclos por segundo, de manera que la velocidad se mide en megahertz (un hertz es igual a un ciclo por segundo). Una seal de corriente alterna es como la grafica del seno, una onda; el tiempo entre las crestas de cada onda define la frecuencia (vea la figura 3.1).

Ciclos de reloj Un ciclo

Voltaje

Tiempo

Figura 3.1

Seal de corriente alterna que muestra la temporizacin de un ciclo de reloj.

Nota Un hertz es una unidad denominada as en honor del fsico alemn Heinrich Rudolf Hertz, en 1885, Hertz confirm la teora electromagntica, segn la luz es una forma de radiacin electromagntica que se propaga en forma de ondas. Un ciclo individual es la mnima porcin de tiempo para el procesador. Cada accin requiere de por lo menos un ciclo y, generalmente, de varios. Por ejemplo, para transferir datos desde y hacia la memoria, un procesador moderno como el Pentium II necesita un mnimo de tres ciclos para preparar la primera transferencia de memoria y slo uno ms por transferencia para llevar a cabo las siguientes tres, cuatro, cinco o seis transferencias consecutivas. Los ciclos adicionales de la primera transferencia son conocidos como estados de espera. Un estado de espera es un tic de reloj en el cual nada sucede; esto asegura que el procesador no se adelante al resto de la computadora.

10

Tabla 3.3
Procesador

Especificaciones de procesadores Intel


Reloj del Procesador 1x 1x 1x 1x 1x 1x 1x 2x 1x 1x 1x 2x 2-3x 2.5x 1x 1.5-3x 1.5-4.5x 2-3x 3.5-4.5x 3.5-6x 3.5-4.5x 3.5-8x 4.5-9x 4-6x 4-9x 4-4.5x Voltaje Tamao de registro interno 16 bits 16 bits 16 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits Anchura de bus de datos 8 bits 16 bits 16 bits 16 bits 16 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits 64 bits 64 bits 64 bits 64 bits 64 bits 64 bits 64 bits 64 bits 64 bits 64 bits 64 bits 64 bits Memoria mxima 1 MB 1 MB 16 MB 16 MB 16 MB 4 GB 4 GB 4 GB 4 GB 4 GB 4 GB 4 GB 4 GB 4 GB 4 GB 4 GB 4 GB 64 GB 64 GB 64 GB 64 GB 64 GB 64 GB 64 GB 64 GB 64 GB Cach l1 Tipo de cach l1 --------WT --WT WT WT WT WT WT WT WB WB WB WB WB WB WB WB WB WB WB WB WB Cach l2 Velocidad de cach l2 ------Bus Bus Bus Bus Bus Bus Bus Bus Bus Bus Bus Bus Bus Bus Misma Ncleo ? Misma Ncleo Misma Ncleo3 --Misma Ncleo3 Misma Ncleo3 ? Misma Ncleo Misma Ncleo3 Misma Ncleo FPU integral Instrucciones multimedia --------------------------------MMX --MMX MMX MMX MMX SSE SSE SSE MMX No. De transistor es 29,000 29,000 134,000 275,000 855,000 275,000 1,185 M 1,185 M 1.2 M 1.2 M 1.4 M 1.2 M 1.6 M 3.1 M 3.1 M 3.3 M 4.5 M 5.5 M 7.5 M 27.4 M 7.5 M 19 M 28.1 M4 9.5 M 28.1 M 7.5 M Fecha de introduccin Junio de 1979 Junio de 1978 Feb. de 1982 Junio de 1988 Oct. de 1990 Oct. de 1985 Abril de 1991 Abril de 1994 Abril de 1991 Abril de 1989 Nov. de 1992 Marzo de 1992 Feb. de 1994 Enero de 1995 Marzo de 1993 Oct. de 1994 Enero de 1997 Nov. de 1995 Mayo de 1997 Enero de 1999 Abril de 1998 Agosto de 1998 Feb. del 2000 Feb. de 1999 Oct. de 1999 Abril de 1998

8088 8086 286 386SX 386Sl 386DX 486SX 486SX2 487SX 486DX 486Sl2 486DX2 486DX4 486Pentium OD Pentium 60/66 Pentium 75-200 Pentium MMX Pentium Pro Pentium II Pentium II PE Celeron Celeron A Celeron III Pentium III Pentium IIIE Pentium II Xeon

5v 5v 5v 5v 3.3 v 5v 5v 5v 5v 5v 3.3 v 5v 3.3 v 5v 5v 3.3-3.5 v 1.8-2.8 v 3.3 v 1.8-2.8 v 1.6 v 1.8-2.8 v 1.5-2 v 1.3-1.6 v 1.8-2 v 1.3-1.7 v 1.8-2.8 v

--------0 KB1 --8 KB 8 KB 8 KB 8 KB 8 KB 8 KB 16 KB 2x16 KB 2x8 KB 2x8 KB 2x16 KB 2x16 KB 2x16 KB 2x16 KB 2x16 KB 2x16 KB 2x16 KB 2x16 KB 2x16 KB 2x16 KB

Pentium III Xeon

5-6x

1.8-2.8 v

32 bits

64 bits

64 GB

2x16 KB

WB

Pentium IIIE Xeon

4.5-6.5x

1.65 v

32 bits

64 bits

64 GB

2x16 KB

WB

----------------------------------256 KB 512 KB 1 MB 512 KB 256 KB 0 KB 128 KB 128 KB 512 KB 1 MB 2MB 512 KB 1 MB 2 MB 256 KB 1 MB 2 MB

----------------S S Opc. S S S S S S S S S S S S S S S

Misma Ncleo Misma Ncleo3

SSE

9.5 M 28.1 M 84 M 140 M

Marzo de 1999 Oct. de 1999 Mayo del 2000

SSE

Tabla 3.4
Procesador

Procesadores AMD, Cyrix, NexGen, IDT y Rise


Reloj del Procesador 1.5-1.75x 2.5-4.5x 2.5-6x 3.5-4.5x 5-10x 5-10x 5-10x 2x 2-3.5x 2.5-7x 2x 3-4x 2.33-4x Voltaje Tamao de registro interno 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits 32 bits Anchura de bus de datos 64 bits 64 bits 64 bits 64 bits 64 bits 64 bits 64 bits 64 bits 64 bits 64 bits 64 bits 64 bits 64 bits Memoria mxima 4 GB 4 GB 4 GB 4 GB 8 GB 8 GB 8 GB 4 GB 4 GB 4 GB 4 GB 4 GB 4 GB Cach l1 Tipo de cach l1 WB WB WB WB WB WB WB WB WB WB WB WB WB Cach l2 Velocidad de cach l2 Bus Bus Bus Misma ncleo3 1/2 -1/3 M. ncleo Misma ncleo3 Misma ncleo3 Bus Bus Misma ncleo3 Bus Bus Bus FPU integral Instrucciones multimedia --MMX 3DNnow 3DNnow Enh. 3DNnow Enh. 3DNnow Enh. 3DNnow --MMX 3DNnow --MMX 3DNnow No. De transistor es 4.3 M 8.8 M 9.3 M 21.3 M 22 M 25 M 37 M 3M 6.5 M 22 M 3.5 M 5.4 M 5.9 M Fecha de introduccin Marzo de 1996 Abril de 1997 Mayo de 1998 Feb. De 1999 Junio de 1999 Junio 2000 Junio 2000 Feb. De 1996 Mayo de 2000 Feb. de 2000 Marzo de 1994 Octubre de 1997 Sept. de 1998

AMD K5 AMD K6 AMD K6-2 AMD K6-3 AMD Atthlon AMD Duron AMD Atthlon 4 (Thunderbird) Cyrix 6x86 Cyrix 6x86MX/MII Cyrix III NextGen Nx586 IDT Winchip IDT Winchip2/2

3.5v 2.2-3.2v 1.9-2.4v 1.8-2.4v 1.6-1.8v 1.5-1.8v 1.5-1.8v 2.5-3.5v 2.2-2.9v 2.2v 4v 3.3-3.5v 3.3-3.5v

16+8 KB 2x32 KB 2x32 KB 2x32 KB 2x64 KB 2x64 KB 2x64 KB 16 KB 64 KB 64 KB 2x16 KB 2x32 KB 2x32 KB

------256 KB 512 KB 64 KB 256 KB ----256 KB -------

S S S S S S S S S S S S S

11

Rise mp6

2-3.5x

2.8v

32 bits

64 bits

4 GB

2x8 KB

WB

---

Bus

MMX

3.6 M

Oct. de 1998

FPU = Unidad de punto flotante (coprocesador, matemtico interno). WT = Cach de escritura directa (slo de escritura). WB = Cach de reescritura (de escritura y lectura). Bus = Velocidad de bus externa del procesador (velocidad de tarjeta madre). Misma ncleo = Velocidad interna del ncleo del procesador (Velocidad de procesador). MMX = Extensiones multimedia, 57 instrucciones adicionales para procesamiento de grficos y sonido. 3DNow = MMX ms 21 instrucciones adicionales para procesamiento do grficos y sonido. Enh. 3DNow = 3DNow ms 24 instrucciones para procesamiento do grficos y sonido. SSE = Streaming SIMD (Instruccin nica, Datos Mltiples) Extensions, MMX ms 70 instrucciones adicionales para procesamiento de grficos y sonido. 1 El 386Sl contiene un controlador de cach integral, pero la memoria cach debe proporcionarse fuera del chip. 2 Intel comercializ posteriormente versiones Sl Enhanced de los SX, DX y DX2. Estos procesadores estaban disponibles tanto en versiones 5v como 3.3v, e incluan capacidades de administracin de energa. 3 Cach l2 integrada en el circuito integrado, corre a la misma velocidad del ncleo. 4 Cach l2 de 128 KB funcionales (256 KB totales, 128 KB inhabilitados), usa el mismo circuito integrado que el Pentium IIIE.

12

Tambin vara el tiempo requerido para ejecutar instrucciones: 8086 y 8088. A los procesadores originales 8086 y 8088 les toma un promedio de 12 ciclos ejecutar una sola instruccin. 286 y 386. Los procesadores 286 y 386 mejoraron esta velocidad alrededor do 4.5 ciclos por instruccin. 486. El 486 y la mayora de los otros procesadores compatibles con Intel de la cuarta generacin, como el AMD 5x86 aumentaron la velocidad an ms, hasta llegar a los dos ciclos por instruccin. Pentium, serie K6. La arquitectura del Pentium y de otros procesadores compatibles con Intel de la quinta generacin, como los de AMD y Cyrix incluyen canales dobles para instrucciones y otras mejoras que permiten el funcionamiento a una o dos instrucciones por ciclo. Pentium Pro, Pentium II/III/Celeron y Athlon/Duron. Esos procesadores de clase P6, as como otros de la sexta generacin como los AMD y Cyrix, pueden ejecutar hasta tres o ms instrucciones por ciclo. La diferencia en tiempos de ejecucin de instrucciones (en ciclos) dificulta la comparacin de sistemas con base solamente en la velocidad de reloj o en el nmero de ciclos por segundo. Cmo es pasible que dos procesadores con la misma frecuencia de reloj puedan tener rendimientos tan diferentes? la respuesta es simple: gracias a la eficiencia. La razn principal por la cual el 486 fue considerado rpido en comparacin con el 386, era su capacidad de ejecutar el doble de instrucciones en el mismo nmero de ciclos. Lo mismo sucedi con el Pentium: en un nmero dado de ciclos, procesa el doble de instrucciones que el 486. Esto significa que con la misma velocidad de reloj, un Pentium ser el doble de rpido qu un 486, y en consecuencia, un procesador de clase 486 a 133 MHz (como el AMD 5x86-133) no ser tan rpido como un Pentium a 75 MHz! Esto se debe a que un megahertz del Pentium vale cerca del doble de un megahertz del 486, en trminos de instrucciones ejecutadas por ciclo. Los Pentium II y III son alrededor de 50 por ciento ms rpidos que un Pentium equivalente a una velocidad de reloj dada, porque pueden ejecutar la misma cantidad de instrucciones en el mismo nmero de ciclos. Mediante la comparacin del rendimiento relativo de un procesador, se puede observar que un Pentium III a 1000 MHz es tan rpido como un Pentium hipottico a 1,500 MHz, el cual sera igual a un 486 de 3,000 MHz; ste, a su vez, seria comparable a un 286 386 de 6,000 MHz, los cuales serian iguales en rendimiento a un 8088 de 12,000 MHz. El 8088 original de la PC funcionaba a slo 4.77 MHz; en la actualidad, hay sistemas alrededor de 2,500 veces ms rpidos! Como puede darse cuenta, no es suficiente la comparacin de sistemas con base slo en la velocidad en MHz, porque hay machos otros factores que afectan el rendimiento del sistema. La evaluacin del rendimiento del CPU puede ser un tanto confusa. Debido a las diferentes arquitecturas internas de los procesadores, stos funcionan de manera diferente y pueden ser muy rpidos en unas tareas y lentos en otras. Para efectuar una comparacin justa entre procesadores diferentes con distintas velocidades de reloj, Intel ha establecido una serie de pruebas comparativas conocida coma el iCOMP (ndice Comparativo de Rendimiento de Microprocesadores Intel), que se puede ejecutar en procesadores para producir un criterio relativo de rendimiento. El ndice iCOMP ha experimentado dos actualizaciones, por ello se ha publicado en tres versiones: iCOMP, iCOMP 2.0 e iCOMP 3.0. La tabla 3.5 muestra la potencia relativa, o ndice iCOMP 2.0, para varios procesadores. 13

Tabla 3.5 Clasificaciones segn el ndice iCOMP 2.0 Procesador ndice iCOMP 2.0 Procesador ndice iCOMP 2.0 Pentium 75 67 Pentium Pro 200 220 Pentium 100 90 Celeron 300 226 Pentium 120 100 Pentium II 233 267 Pentium 133 111 Celeron 300 296 Pentium 150 114 Pentium II 266 303 Pentium 166 127 Celeron 333 318 Pentium 200 142 Pentium II 300 332 Pentium-MMX 166 160 Pentium II Overdrive 300 351 Pentium Pro 150 168 Pentium II 333 366 Pentium-MMX 200 182 Pentium II 350 386 Pentium Pro 180 197 Pentium II Overdrive 333 387 Pentium-MMX 233 203 Pentium II 400 440 Celeron 266 213 Pentium II 450 483 El ndice iCOMP 2.0 se deriva de varias pruebas comparativas independientes, y constituye un indicio confiable del rendimiento relativo del procesador. Las pruebas comparativas equilibran rendimiento en procesamiento de ntegros, nmeros de punto flotante y multimedia. Recientemente, Intel descontinu el iCOMP 2.0 y lanz el iCOMP 3.0. iCOMP 3.0 es una prueba comparativa actualizada que incorpora el uso en aumento de 3D, multimedia y tecnologa y software para Internet, as como el uso cada vez mayor de flujos ricos en datos y aplicaciones de procesamiento intensivo, incluyendo 3D, multimedia y tecnologa de Internet. iCOMP 3.0 combina seis pruebas comparativas: WinTune 98 Advanced CPU Integer, CPUmark 99, 3D WinBench 993D lighting and Transformation Test, MultimediaMark 99, Jmark 2.0 Procesador Test, y Win-Bench 99-FPU WinMark. Estas nuevas versiones aprovechan las SSE (Streaming SIMD Extensions), e instrucciones adicionales para grficos y de sonido integradas en el PIII. Sin esas nuevas instrucciones, el PIII rendira ms a menos lo mismo que un PII de la misma velocidad de reloj. Tabla 3.6 Procesador Pentium II 350 Pentium II 450 Pentium III 450 Pentium III 500 Pentium III 550 Pentium III 600 Pentium III 600E Clasificaciones segn el ndice iCOMP 3.0 ndice iCOMP 3.0 Procesador 1000 Pentium III 650 1240 Pentium III 700 1500 Pentium III 750 1650 Pentium III 800 1780 Pentium III 866 1930 Pentium III 1000 2110

ndice iCOMP 3.0 2270 2420 2540 2690 2890 3280

Consideraciones para interpretar los resultados iCOMP La calificacin de cada procesador es calculada al momento de su introduccin, mediante un sistema comercial bien configurado. Las calificaciones relativas del ndice iCOMP 3.0 y el rendimiento real del sistema pueden ser afectados por cambios futuros en el diseo y configuracin del software; pueden afectar tambin las diferencias en los componentes o ciertas caractersticas de los procesadores, como la cach L2, la velocidad del bus, instrucciones multimedia o para grficos extendidas, o mejoras en el servicio de fabricacin del procesador. Las diferencias en los componentes de hardware distintos al procesador utilizados en los sistemas de 14

prueba tambin pueden afectar la forma en que la calificacin iCOMP se relaciona con el rendimiento real del sistema, las calificaciones iCOMP 3.0 no pueden compararse con versiones anteriores del ndice iCOMP porque se utilizan diferentes ponderaciones y pruebas comparativas para calcular resultados.

Velocidades y marcajes de procesadores contra velocidad de tarjetas madre Otro factor de confusin implicado en la comparacin del rendimiento de procesadores es el hecho de que prcticamente todos los procesadores modernos, a partir del 486DX2, funcionan a algn mltiplo de la velocidad de la tarjeta madre. Por ejemplo, un Celeron 600 funciona a nueve veces la velocidad de 66 MHz de la tarjeta madre, mientras que un Pentium III de 1 GHz funciona a 7.5 veces la velocidad de 133 MHz de su tarjeta madre. Hasta a principios de 1998, la mayora de las tarjetas madre trabajaban a 66 MHz o menos, porque era la velocidad que en ese entonces soportaban los procesadores de Intel. En abril de 1998, Intel liber procesadores y conjuntos de chips de tarjeta madre diseados para funcionar a 100 MHz. Cyrix tiene algunos procesadores diseados para correr en tarjetas madre a 75 MHz, y varias tarjetas Pentium son capaces de trabajar a esa misma velocidad, aunque tcnicamente Intel nunca la soport. AMD tambin tiene versiones del K6-2 diseadas para funcionar en tarjetas madre de 100 MHz. A finales de 1999, se pusieron a la venta conjuntos de chips y tarjetas madre de 133 MHz para soportar los nuevos procesadores Pentium III. En ese ao, surgieron tambin tarjetas madre y conjuntas de chips Athlon AMD de 100 MHz, los cuales usaban una tcnica de doble transferencia para conseguir una velocidad de transferencia de datos de 200 MHz entre el Athlon y el chip principal North Bridge del conjunto de chips. Normalmente, se puede establecer la velocidad de la tarjeta madre y el parmetro del multiplicador mediante jumpers u otros mecanismos de configuracin (como el Setup del BIOS) en la tarjeta madre. Los sistemas modernos usan un sintetizador de frecuencia variable, el cual por lo regular se encuentra en el conjunto principal de chips de la tarjeta madre para controlar la velocidad de sta y del procesador. La mayora de las tarjetas madre Pentium tiene tres a cuatro configuraciones de velocidad. Los procesadores usados en la actualidad estn disponibles en una amplia variedad de versiones que corren a diferentes frecuencias con base en una velocidad dada de tarjeta madre; por ejemplo, la mayora de los procesadores Pentium funcionan a una velocidad que es un mltiplo de la velocidad real de la tarjeta madre. Consulte la tabla 3.7 para ver las velocidades de los procesadores y las tarjetas madre Pentium. Nota Para obtener informacin sobre un procesador AMD o Cyrix especfico, vea las secciones respectivas contenidas aqu mismo. Tabla 3.7 Tipo de CPU Pentium Pentium Pentium Pentium Pentium Velocidades de procesadores y tarjetas madre Intel Velocidad de Multiplicador Velocidad de tarjeta CPU (MHz) de reloj de CPU madre (MHz) 60 1x 60 66 1x 66 75 1.5x 50 90 1.5x 60 100 1.5x 66 15

Pentium Pentium Pentium Pentium/Pentium Pro/MMX Pentium/Pentium Pro Pentium/Pentium Pro/MMX Pentium-MMX/Pentium II Pentium-MMX(Mobile)/ PentiumII/Celeron Pentium II/Celeron Pentium II/Celeron Pentium II/Celeron Celeron Celeron Celeron Celeron Celeron Celeron Celeron Celeron Celeron Pentium II Pentium II/Xeon Pentium II/III/Xeon Pentium III/Xeon Pentium III/Xeon Pentium III/Xeon Pentium III/Xeon Pentium III/Xeon Pentium III/Xeon Pentium III/Xeon Pentium III/Xeon Pentium III/Xeon Pentium III/Xeon Pentium III/Xeon Pentium III/Xeon Pentium III/Xeon Pentium III/Xeon Pentium III/Xeon Pentium III/Xeon Pentium III/Xeon Pentium III/Xeon Pentium III/Xeon Pentium III/Xeon Pentium III/Xeon

120 133 150 166 180 200 233 266 300 333 366 400 433 466 500 533 566 600 633 667 350 400 450 500 550 600 650 700 750 800 850 533 600 667 733 800 866 933 1000 1066 1133 1200 1200 1333

2x 2x 2.5x 2.5x 3x 3x 3.5x 4x 4.5x 5x 5.5x 6x 6.5x 7x 7.5x 8x 8.5x 9x 9.5x 10x 3.5x 4x 4.5x 5x 5.5x 6x 6.5x 7x 7.5x 8x 8.5x 4x 4.5x 5x 5.5x 6x 6.5x 7x 7.5x 8x 8.5x 9x 9.5x 10x

60 66 60 66 60 66 66 66 66 66 66 66 66 66 66 66 66 66 66 66 100 100 100 100 100 100 100 100 100 100 100 133 133 133 133 133 133 133 133 133 133 133 133 133

16

Si el resto de las variables es el mismo, incluyendo el tipo de procesador, el nmero de estados de espera (ciclos vacos) agregados a los distintos tipos de accesos a memoria, y el ancho del bus de datos, usted podr comparar dos sistemas mediante sus respectivas velocidades de reloj. Sin embargo, la construccin y el diseo del controlador de memoria (contenido en el conjunto de chips de la tarjeta madre), adems del tipo y cantidad de memoria instalada, pueden tener un efecto importante en la velocidad final de ejecucin de un sistema. Durante la construccin de un procesador, el fabricante lo prueba a diferentes velocidades, temperaturas y presiones. Despus de esta fase de pruebas, recibe un sello en donde se indica la mxima velocidad a la cual puede funcionar seguramente la unidad bajo la extensa variacin de temperaturas y presiones producidas durante la operacin normal. Estas especificaciones se explicitan claramente en el empaque del procesador. En algunos sistemas es posible configurar la velocidad del procesador a una velocidad mayor que la especificada en el chip; a esto se llama Aumento de la velocidad del reloj (Overclocking). En machos casos, es posible aumentar la velocidad hasta cierto punto, dado que Intel, AMD y otros fabricantes a menudo incluyen mrgenes de seguridad en sus calificaciones. Es decir, un chip etiquetado con la velocidad de, digamos, 800 MHz, puede en realidad funcionar a 900 MHz o ms, pero se especifica una velocidad menor para dar un margen de confiabilidad. Al realizar esta maniobra, lo que usted hace es utilizar este margen y correr el procesador a una velocidad cercana a su velocidad mxima real. No lo recomiendo a los novatos, pero si se siente confiado manipulando su sistema, y es capaz de manejar las consecuencias potenciales, el aumento de velocidad le permitir obtener mayor rendimiento de su sistema. En cualquier caso, debe considerar varias cuestiones. Una es que la mayora de los procesadores Intel desde el Pentium II tienen bloqueado el multiplicador desde antes de salir de la fbrica. Esto implica que cualquier cambio a la configuracin del multiplicador de la tarjeta madre simplemente ser ignorado por el procesador. Tanto Intel como AMD bloquean los multiplicadores de la mayora de sus procesadores ms recientes. Aunque originalmente esta medida fue para evitar que los remarcadores falsificaran las etiquetas de los procesadores, ha tenido un impacto positivo en los entusiastas del rendimiento, dejando como la nica opcin para aumentar la velocidad de reloj ms all de la estndar, la manipulacin de la velocidad del bus de la tarjeta madre. Tambin es posible meterse en problemas al aumentar la velocidad del bus de la tarjeta madre. Por ejemplo, las tarjetas madre de Intel simplemente no aceptan velocidades de reloj distintas a las configuraciones estndar de 66 MHz, 100 MHz 133 MHz. Adems, todas sus tarjetas con configuracin por software (Setup del BIOS) leen las configuraciones adecuadas del procesador instalado y son las nicas permitidas. En otras palabras, usted simplemente conecta el procesador, y la tarjeta madre Intel slo permitir las configuraciones para las que fue diseado el procesador. Incluso si pudiera ingenirselas para que el procesador aceptara una configuracin diferente, el salto de 66 MHz a 100 MHz, o de 100 MHz a 133 MHz es muy grande, y muchos procesadores no son capaces de lograrlo de manera confiable. Por ejemplo, un Pentium III 800E funciona a una velocidad de bus de 100 MHz con un multiplicador 8x. Forzar la velocidad de la tarjeta madre a 133 MHz causara que el procesador intentara funcionar a 8 x 133, es decir, a 1066 MHz. Es altamente improbable que el chip corra a tal velocidad de manera confiable. De manera similar, un Celeron 600E corre a 9 x 66 MHz. Aumentar la velocidad del bus a 100 MHz causara que el procesador tratara de funcionar a 9 x 100 MHz 900 MHz, lo cual muy probablemente no funcionara. 17

Lo que se necesita es una tarjeta que acepte configuraciones de velocidad intermedia y que esta permita que la configuracin pueda modificarse en incrementos ms pequeos. Por ejemplo, la tarjeta madre Asus P3V4X soporta configuraciones de velocidad de bus de 66, 75, 83, 90, 95, 100, 103, 105, 110, 112, 115, 120, 124, 133, 140 y 150 MHz. Si se configura el Pentium IIIE de 800 MHz a incrementos superiores a 100 MHz, usted lograra: Multiplicador (fijo) Velocidad de bus Velocidad de procesador 8x 100 MHz 800 MHz 8x 103 MHz 824 MHz 8x 105 MHz 840 Mhz 8x 110 MHz 880 MHz 8x 112 Mhz 896 MHz 8x 115 Mhz 920 Mhz 8x 120 MHz 960 MHz 8x 124 MHz 992 MHz 8x 133 MHz 1066 MHz De manera similar, si usara esta tarjeta madre con un Celeron 600, podra intentar configuraciones por arriba de la velocidad estndar de bus de 66 MHz: Multiplicador (fijo) 9x 9x 9x 9x 9x 9x Velocidad de bus 66 MHz 75 MHz 83 MHz 90 MHz 95 MHz 100 MHz Velocidad de procesador 600 MHz 675 MHz 747 MHz 810 Mhz 855 Mhz 900 MHz

Normalmente, un incremento de 10 20 por ciento puede tener xito, de manera que con esta tarjeta madre usted podra lograr que su procesador trabajara a 100 MHz o ms rpido que lo establecido originalmente. Otro truco empleado para el aumento de velocidad del reloj es manipular las configuraciones de voltaje del procesador. Todos los procesadores de Ranura 1, Ranura A, Socket 8, Socket 370 y Socket A tienen deteccin automtica de voltaje, gracias a la cual el sistema detectar y establecer el voltaje correcto mediante la lectura de ciertos pines del procesador. Algunas tarjetas madre, como las fabricadas por Intel, no permiten cambios manuales a estas configuraciones. Otras, como la Asus P3V4X I mencionada anteriormente, permiten aumentar o disminuir las configuraciones de voltaje en dcimas de voltio. Algunos aficionados han descubierto que incrementando o disminuyendo el voltaje ligeramente, es posible lograr una velocidad mayor de sobreprocesamiento sin prdida de estabilidad en el sistema. Mi recomendacin es ser muy cuidadosos al modificar los voltajes, pues es posible daar el procesador con un voltaje inapropiado. Incluso sin cambiar el voltaje, es fcil y productivo lograr el sobreprocesamiento mediante la modificacin de la velocidad del bus de la tarjeta madre. Es conveniente usar una tarjeta madre de alta calidad, buena memoria y, sobre todo, un buen chasis de sistema con ventiladores adicionales y una fuente de poder de uso pesado. En el aumento de velocidad del reloj, es esencial que los componentes y, especialmente, el procesador del sistema estn apropiadamente ventilados. Tomar medidas extremas con el disipador de calor y ventiladores 18

adicionales del gabinete nunca hace dao y, en machos casos, ayuda macho para sacar el mayor provecho de un sistema. Nota El sitio http://www.tomshardware.com es una buena fuente de informacin sobre el aumento de la velocidad del reloj. Inluye entre otras cosas, una completa seccin de respuestas a preguntas frecuentes sobre el tema, y una encuesta actual de los usuarios que han realizado esta maniobra con xito (y algunos que han fallado) en sus CPUs. Observe que muchos de los procesadores Intel ms recientes incorporan velocidades fijas de multiplicador de bus, lo cual impide o reduce la posibilidad de aumentar la velocidad de reloj. Desafortunadamente esto puede ser pasado por alto con un simple arreglo de hardware, y muchos falsificadores siguen vendiendo chips sobreprocesados y remarcados. El disipador de calor del procesador podra alterar la especificacin La mayora de los procesadores tienen disipadores de calor encima y pueden impedir la lectura de la especificacin impresa en el chip Un disipador de calor es un dispositivo de metal que extrae el calor de un dispositivo electronico. La mayora de los procesadores de 50 MHz y ms deben de tener un disipador para evitar el sobrecalentamiento. Afortunadamente, la mayora de los fabricantes de procesadores estn rotulndolos tanto en la cara superior como en la inferior. Si es difcil quitar el disipador de calor, puede sacar el procesador de su socket, con todo y disipador, y leer la informacin en la cara inferior del procesador para identificarlo.

Clasificaciones P de Cyrix Los procesadores Cyrix/IBM 6x86 usan la escala PR (Clasificacin de Rendimiento), que no se expresa en la velocidad de reloj real en megahertz. Por ejemplo, el Cyrix 6x86MX/MII-PR366 de hecho funciona a slo 250 MHz (2.5 x 100 MHz). Esto puede ser un poco engaoso, pues usted debe configurar la tarjeta madre como si fuera a instalar un procesador de 250 MHz, y no el de 366 MHz que podra sospechar. Desafortunadamente, esto lleva a la gente a pensar que esos sistemas son ms rpidos de lo que realmente son. La tabla 3.8 muestra la relacin entre el Cyrix 6x86, 6x86MX, y las Clasificaciones P M-II comparadas con la velocidad real del chip en MHz. Tabla 3.8 MHz. Tipo de CPU 6x86 6x86 6x86 6x86 6x86 6x86 6x86MX 6x86MX Clasificacin P de Cyrix comparados con velocidades reales de chips en Clasificacin P PR90 PR120 PR133 PR150 PR166 PR200 PR133 PR133 Velocidad real del CPU 80 100 110 120 133 150 100 110 Multiplicador de reloj 2x 2x 2x 2x 2x 2x 2x 2x Velocidad de la tarjeta madre (MHz) 40 50 55 60 66 75 50 55 19

6x86MX 6x86MX 6x86MX 6x86MX 6x86MX 6x86MX 6x86MX 6x86MX 6x86MX 6x86MX 6x86MX 6x86MX 6x86MX 6x86MX 6x86MX 6x86MX M-II M-II M-II M-II M-II M-II Cyrix III Cyrix III Cyrix III Cyrix III Cyrix III

PR150 PR150 PR166 PR166 PR166 PR166 PR200 PR200 PR200 PR200 PR233 PR233 PR233 PR266 PR266 PR266 PR300 PR300 PR333 PR336 PR400 PR433 PR433 PR466 PR500 PR533 PR533

120 125 133 137.5 150 150 150 165 166 180 166 187.5 200 207.5 225 233 225 233 250 250 285 300 350 366 400 433 450

2x 2.5x 2x 2.5x 3x 2.5x 2x 3x 2.5x 3x 2x 2.5x 3x 2.5x 3x 3.5x 3x 3.5x 3x 2.5x 3x 3x 3.5x 3x 3x 3.5x 4.5x

60 50 66 55 50 60 75 55 66 60 83 75 66 83 75 66 75 66 83 100 95 100 100 122 133 124 100

Observe que una clasificacin P dada puede significar varias velocidades reales de CPU, por ejemplo, un Cyrix 6x86MX-PR200 puede correr a 150 MHz, 165 MHz, 166 MHz o 180 MHz, pero no a 200 MHz. Esta Clasificacin P indicaba, supuestamente, la velocidad en relacin con un procesador Intel Pentium, pero el procesador con el que ah estn comparando es el original sin capacidades MMX, con una versin pequea de cach L1 y montado en una plataforma antigua de tarjeta madre que tiene un viejo conjunto de chips y una tecnologa lenta de memoria. La Clasificacin P no es apropiadamente comparable con los Celeron, Pentium II o Pentium III. En esos casos, la comparacin con esos chips es ms realista en trminos de su velocidad real; en otras palabras, el MII-PR36 realmente funciona a slo 250 MHz y se campara bien con procesadores Intel cercanos a esa velocidad. Considero algo por lo menos engaoso llamar a un procesador MII-36 cuando en realidad funciona a slo 250 MHz.

Clasificaciones P de AMD Aunque tanto AMD como Cyrix elaboraron este engaoso sistema de Clasificacin P, por fortuna AMD lo us slo durante un corto periodo y exclusivamente para el procesador K5. An tienen el 20

sello de la designacin PR en sus chips ms recientes, pero todos los K6 y Athlon tienen nmeros PR que coinciden con su velocidad real en MHz. La tabla 3.9 muestra la clasificacin P y las velocidades reales para los procesadores AMD K5, K6 y Athlon. Tabla 3.9 Clasificaciones P AMD comparadas con velocidades reales Tipo de CPU Clasificacin P Velocidad real Multiplicador de Velocidad de la del CPU reloj tarjeta madre (MHz) K5 PR75 75 1.5x 50 K5 PR90 90 1.5x 60 K5 PR100 100 1.5x 66 K5 PR120 90 1.5x 60 K5 PR133 100 1.5x 66 K5 PR166 116.7 1.75x 66 K6 PR166 166 2.5x 66 K6 PR200 200 3x 66 K6 PR233 233 3.5x 66 K6 PR266 266 4x 66 K6 PR300 300 4.5x 66 K6-2 PR233 233 3.5x 66 K6-2 PR266 266 4x 66 K6-2 PR300 300 4.5x 66 K6-2 PR300 300 3x 100 K6-2 PR333 333 5x 66 K6-2 PR333 333 3.5x 95 K6-2 PR350 350 3.5x 100 K6-2 PR366 366 5.5x 66 K6-2 PR380 380 4x 95 K6-2 PR400 400 6x 66 K6-2 PR400 400 4x 100 K6-2 PR450 450 4.5x 100 K6-2 PR475 475 5x 95 K6-2 PR500 500 5x 100 K6-2 PR533 533 5.5x 97 K6-2 PR550 550 5.5x 100 K6-3 PR400 400 4x 100 K6-3 PR450 450 4.5x 100 Athlon PR500 500 5x 1001 Athlon PR550 550 5.5x 1001 Athlon PR600 600 6x 1001 Athlon PR650 650 6.5x 1001 Athlon PR700 700 7x 1001 Athlon PR750 750 7.5x 1001 Athlon PR800 800 8x 1001 Athlon PR850 850 8.5x 1001 Athlon PR900 900 9x 1001 Athlon PR950 950 9.5x 1001 Athlon PR1000 1000 10x 1001

21

Observe que los Athlon con bus de procesador North Bridge de hecho funciona a una velocidad doble de transferencia, lo cual es dos veces la seal de reloj de la tarjeta madre (200 MHz)

Bus de datos Tal vez la forma ms comn de describir un procesador es mediante la velocidad a la cual funciona, y la anchara de su bus externa de datos. Esto define el nmero de bits de datos que pueden ser transferidos hacia fuera o dentro del procesador en un ciclo. Un bus es una serie de conexiones que transportan seriales comunes. Imagine un por de cables que van de un extremo de un edificio al otro. Si conecta los cables a un generador de 110v AC, y le coloca salidas en puntos estratgicos, habr construido un bus de energa. Sin importar en cul salida conecte los cables, tendr acceso a la misma seal, que en este ejemplo es la energa de 110v AC. Cualquier medio de transmisin con ms de una salida en cada extremo puede ser considerado un bus. Un sistema tpico de computacin tiene varios buses internos y externos. El bus del procesador analizado con mas frecuencia es el bus externo de datos el paquete de alambres (a pines) usado para enviar y recibir datos. Entre ms seales puedan transferirse simultneamente, ms datos podrn enviarse en un intervalo especifico y, por la tanto, ms ancho y rpido ser el bus. Un bus de datos ms ancho es como tener una autopista con ms carriles, la cual permite un trnsito mayor. Los datos de una computadora son enviados como informacin digital consistente de un intervalo en el cual un alambre transfiere 5v para expresar un bit de datos 1, 0 v para expresar un bit de datos 0. Entre ms alambres tenga, ms bits individuales podr enviar en el mismo intervalo. Un chip como el 286 o el 386SX, con 16 cables para transmitir y recibir datos, tiene un bus de datos de 16 bits. Un chip de 32 bits, como el 386DX y el 486, tiene el doble de alambres dedicados a la transmisin simultnea de datos que uno de 16 bits; uno de 32 puede enviar enlaces el doble de informacin en el mismo intervalo. Los procesadores modernos, como los de la serie Pentium, tienen buses externos de datos de 64 bits. Esto significa que los procesadores Pentium, incluyendo Pentium original, Pentium Pro y Pentium II, pueden transferir 64 bits de datos a la vez desde y hacia la memoria del sistema. Una buena manera de entender este flujo de informacin es haciendo una analoga con una autopista y el trnsito que permite pasar. Si una autopista tiene un carril por cada sentido, slo puede pasar un auto en cierta direccin. Si deseara incrementar el flujo, tendra que agregar otro carril, de manera que pudiera pasar el doble de autos a la vez en un periodo especfico. Podramos imaginar a un chip de 8 bits como una autopista de un solo carril, porque slo un byte fluye a la vez (un byte equivale a ocho bits). El chip de 16 bits permite el paso de dos bytes a la vez, y es anlogo a una autopista de dos carriles. Podramos tener una autopista de cuatro carriles que permitiera el trnsito de un gran nmero de automviles; esta estructura corresponde a un bus de datos de 32 bits, el cual puede transferir cuatro bytes de informacin a la vez. Entonces un bus de datos de 64 bits es como tener una autopista de ocho carriles, que transfiere datos hacia fuera y hacia dentro del chip. De la misma forma en que es posible describir una autopista por su anchura en carriles, es posible describir un chip por el ancho de su bus de datos. Cuando usted lee un anuncio que describe un sistema de computacin de 32 64 bits, se refiere generalmente al bus de datos del CPU. Este nmero proporciona una idea general del potencial del rendimiento del chip (y, por lo tanto, del sistema). 22

Quiz la implicacin ms importante del bus de datos de un chip es que su anchura tambin define el tamao del banco de memoria. Esto significa que un procesador de 32 bits, como los de clase 486, lee y escribe en memoria 32 bits a la vez. Los procesadores de clase Pentium, incluyendo al Pentium III y Celeron, leen y escriben en memoria 64 bits a la vez. Debido a que los SIMMs (Mdulos Sencillos de Memoria en lnea) estndar de 72 pines tienen slo 32 bits de anchura, deben ser instalados uno a la vez en la mayora de los sistemas de clase 486, y de dos en dos en la mayora de los sistemas de clase Pentium. Los ms modernos DIMMs (Mdulos Duales de Memoria en lnea) tienen una anchura de 64 bits, de manera que pueden ser instalados uno a la vez en sistemas de clase Pentium. Cada DIMM es igual a un banco completo de memoria en los sistemas Pentium, lo cual facilita la configuracin del sistema, debido a que pueden ser instalados o retirados de uno en uno.

Registros internos (bus interno de datos) El tamao de los registros internos indican la cantidad de informacin sobre la cual puede operar el procesador al mismo tiempo; tambin determina cmo transfiere los datos dentro del chip. A esto se le conoce tambin como bus interno de datos. El tamao del registro es en esencia lo mismo que el tamao de bus interno de datos. Un registro es una celda de contencin dentro del procesador: por ejemplo, el procesador puede sumar los nmeros de dos registros y almacenar el resultado en un tercero. El tamao de registro determina el tamao de los datos que puede manejar el procesador. El tamao de registro describe tambin el tipo de software o comandos e instrucciones que puede ejecutar un chip. Esto es, los procesadores con registros internos de 32 bits pueden ejecutar instrucciones de 32 bits que procesan porciones de 32 bits de informacin, pero los procesadores con registros de 16 bits no. Los procesadores ms avanzados de la actualidad (del 386 al Pentium III) usan registros internos de 32 bits y, por tanto, ejecutan los mismos sistemas operativos y aplicaciones de 32 bits. Algunos procesadores tienen un bus interno de datos (constituido por rutas de datos y unidades de almacenamiento llamadas registros) el cual es ms grande que el bus externo. El 8088 y el 386SX son ejemplos de esta estructura. Cada chip tiene un bus interno del doble de anchura que el externo. Estos diseos, a veces conocidos como hbridos, generalmente son versiones de bajo costo de un chip de raza pura. Por ejemplo, el 386SX transfiere datos internamente con un registro de 32 bits; sin embargo, se comunica con el mundo exterior a travs de una ruta de datos de 16 bits de anchura. Este diseo permite la insercin de una tarjeta madre de produccin ms barata con un bus de 16 bits, y an as mantiene la compatibilidad de software y conjunto de instrucciones con el 386 de 32 bits completos. Los registros internos a menudo son ms grandes que el bus de datos, lo cual significa que el chip requiere de dos ciclos que llenan un registro para que ste pueda operar. Por ejemplo, tanto el 386SX como el 386DX tienen registros internos de 32 bits, pero el 386SX tiene que inhalar (hablando figurativamente) dos veces para llenarlos, mientras que el 386DX puede hacer el trabajo de un solo respiro. Lo mismo suceder cuando los datos sean devueltos al exterior, al bus de sistema. El Pentium es un ejemplo de este tipo de diseo. Todos los Pentium tienen un bus de datos de 64 bits y registros de 32 bits, una estructura que podra parecer problemtica si no se sabe que el Pentium tiene dos canales internos de 32 bits para procesar informacin. En muchas formas, el Pentium es como dos chips de 32 bits en uno. El bus de datos de 64 bits permite un llenado eficiente 23

de esos mltiples registros. Los canales mltiples se conocen como arquitectura superescalar, la cual fue introducida con el procesador Pentium. Los procesadores ms avanzados de la sexta generacin, tales como los Pentium Pro y Pentium II/III, tienen seis tuberas internas para ejecutar instrucciones. Aunque algunas de ellas estn dedicadas a funciones especiales, estos procesadores pueden ejecutar hasta tres instrucciones en un solo ciclo de reloj.

Bus de direcciones El bus de direcciones es el conjunto de alambres que transporta la informacin de direccionamiento usada para describir la ubicacin de memoria a la cual se est enviando la informacin o aquella de donde se est obteniendo, en un momento dado. Como en el caso del bus de datos, cada alambre de un bus de direccin transporta un solo bit de datos; ste es slo uno de los dgitos de la direccin. Entre ms alambres (dgitos) se usen para calcular estas direcciones, mayor ser el nmero total de ubicaciones de direcciones. El tamao (o ancho) del bus de direcciones indica el tamao mximo de RAM que un chip puede direccionar. Puede recurrirse nuevamente a la analoga con la autopista para mostrar dnde encaja el bus de direcciones. Si el bus de datos es la autopista y el tamao del bus de datos es equivalente al nmero de carriles, el bus de direcciones representa el nmero de la direccin de la casa. El tamao del bus de direcciones es equivalente al nmero de dgitos que constituyen el nmero de la casa. Por ejemplo, si usted vive en una calle en la cual el nmero de la direccin consta de slo dos dgitos (base 10), puede haber no ms de 100 (102) direcciones (de la 00 a la 99). Si se agrega otro digito, el nmero de direcciones disponibles aumenta a 1,000 (000 - 999), 103. Las computadoras usan el sistema de numeracin binaria (base 2), de manera que un nmero de dos dgitos puede proporcionar slo cuatro direcciones (00, 01, 10 y 11) 22. Un nmero de tres dgitos permite slo ocho direcciones (000 - 111), 23. Por ejemplo, los procesadores 8086 y 8088 usaban un bus de direcciones de 20 bits, capaz de calcular un mximo de 220 1,048,576 bytes (1 MB) de ubicaciones de memoria. La tabla 3.10 describe las capacidades de direccionamiento de memoria de los procesadores. Tabla 3.10 Familia de procesadores 8088/8086 286/386SX Clase 386DX/486/P5 Clase P6 Capacidad de direccionamiento de memoria de procesadores Bus de Bytes KB MB direcciones 20 bits 1,048,576 1,024 1 24 bits 16,777,216 16,384 16 32 bits 4,294,967,296 4,194,304 4,096 36 bits 68,719,476,736 67,108,864 65,536

GB ----4 64

El bus de datos y el de direcciones son independientes, y los diseadores pueden usar el tamao que deseen para cualquiera de ellos. Sin embargo, generalmente los chips con buses de datos ms grandes tienen buses de direcciones mayores. El tamao de los buses puede proporcionar informacin importante, con respecto a la potencia relativa de un chip, en dos formas muy importantes. El tamao del bus de datos es una indicacin de la capacidad de transferencia de informacin del chip; el del bus de direcciones, indica cuanta memoria puede manejar el chip. 24

Cach interna de nivel 1 (L1) Todos los procesadores modernos a partir de la familia del 486 incluyen un controlador y una cach L1 integrados. El tamao de la cach L1 integrada (o cach primaria) varia de un procesador a otro, de 8 KB para el 486DX original hasta 32 KB, 64 KB y ms en los ms recientes. Debido a que la cach primaria siempre est construida dentro del circuito integrado del procesador, corre a la velocidad de ncleo completa del mismo. Esto significa que la cach funciona a la velocidad interna del procesador multiplicada por el reloj ms rpido. Esta cach bsicamente es un rea de memoria muy rpida, integrada en el procesador, y es empleada para contener parte del conjunto de cdigo y datos sobre el cual trabaja el procesador en un momento dado. Es posible tener acceso a la memoria cach sin estados de espera, porque corre a la misma velocidad que el ncleo del procesador. El empleo de la memoria cach reduce el cuello de botella tradicional del sistema, porque la RAM a menudo es ms lenta que el procesador. Esto evita hacer esperar al procesador por cdigo y datos provenientes de la memoria principal mucho ms lenta, con lo cual se mejora el rendimiento. Sin cach L1, el procesador se vera forzado a esperar a la memoria del sistema. La cach primaria es ms importante aun en los procesadores modernos, pues a menudo es la nica memoria de todo el sistema capaz de mantener el paso del procesador. La mayora de los procesadores modernos son multiplicados por reloj, lo cual significa que funcionan a una velocidad mltiplo de la tarjeta madre a la cual estn conectados. Por ejemplo, el Pentium III a 1 GHz, corre a 7.5 veces la velocidad real de la tarjeta madre de 133 MHz. Debido a que la memoria principal est conectada con la tarjeta madre, puede funcionar a slo 133 MHz como mximo. La nica memoria de 1 GHz en tal sistema es la de cach L1 y L2, integradas en el procesador mismo. En este ejemplo, el procesador Pentium III a 1 GHz tiene 32 KB de cach L1 integrada, en dos bloques de 16 KB cada uno; y 256 KB de L2. Ambas funcionan a la misma velocidad del ncleo completa del procesador. Si los datos que el procesador necesita ya estn en la cach interna, no tiene que esperar; si no es as, el procesador debe obtenerlos de la cach de nivel 2 , en diseos de sistemas menos sofisticados, del bus del sistema, es decir, directamente de la memoria principal. Con el fin de entender la importancia de la cach, debe conocer las velocidades relativas de los procesadores y la memoria. El problema es que la velocidad del procesador se expresa normalmente en MHz (millones de ciclos por segundo), mientras que la de la memoria se expresa en nanosegundos (mil millonsimas de segundo por ciclo).

Funcionamiento de la cach Para entender el funcionamiento de la cach L1 y L2, utilice la siguiente analoga: Esta historia implica a una persona que come, de la misma forma en que el procesador se alimenta de datos, provenientes de la memoria, para procesarlos. La cocina donde se preparan los alimentos corresponde a la memoria principal RAM (SIMM/DIMM). El controlador de la cach es el mesero y 25

la cach L1 es la mesa a la que usted se sienta. La cach es el carrito de platillos, el cual se localiza entre su mesa y la cocina. Ahora viene la historia. Digamos que usted comienza a comer todos los das a la misma hora en un restaurante dado. Usted llega, se sienta y ordena un hot dog. Para mantener la historia en proporcin, digamos que usted come a una velocidad de una mordida (un byte?) cada cuatro segundos (233 MHz = ciclos de alrededor de 4 ns). A la cocina le lleva 60 segundos preparar cualquier platillo (memoria principal de 60 ns). De esta manera, despus de llegar, sentarse y ordenar un hot dog, deber esperar 60 segundos para que le preparen su orden. Una vez que el mesero se la sirve, usted comienza a comer a una velocidad normal. Pronto termina el hot dog, y llama al mesero para pedirle una hamburguesa. Nuevamente espera 60 segundos mientras su segunda orden es preparada. Cuando llega, usted se la come, nuevamente a toda velocidad. Una vez terminada, pide un plato de papas a la francesa. De nuevo espera, y despus de 60 segundos comienza a comerse las papas a toda velocidad. Al final, decide pedir un pay de queso como postre; despus de una espera de otros 60 segundos, se lo comer a la velocidad habitual. En panormica, su comida habr consistido de grandes periodos de espera seguidos por rfagas cortas de ingesta a toda velocidad. Despus de llegar al restaurante a las 18:00 horas en punto por dos tardes consecutivas y ordenar los mismos platillos, la tercera ocasin el mesero comienza a pensar; Ya s que este tipo llega a las 6 p.m., ordena un hot dog, una hamburguesa, papas a la francesa y un pay de queso. Voy a tener todos esos platillos preparados de antemano, para darle un mejor servicio y quiz esto me haga ganar una buena propina. De manera que la siguiente vez que usted entra al restaurante y ordena el hot dog, el mesero se lo lleva a su mesa inmediatamente! Usted termina su hot dog y despus de que pide su hamburguesa, el mesero la deposita en su mesa, sin hacerlo esperar un solo segundo. El resto de la cena transcurre de la misma forma y usted come a razn de una mordida cada cinco segundos, sin esperar un solo segundo a que la cocina prepare los platillos. Esta vez, su comida no tendr periodos de espera, gracias sobre todo a la inteligencia de su mesero. Esta analoga describe con exactitud la funcin de la cach L1 en el procesador, la cual est representada por la mesa donde se depositan uno o ms platillos. Sin un mesero, la mesa es un simple depsito de comida; cuando ste se llena, puede comer hasta vaciarlo, pero no habr nadie para llenarlo prudentemente. El mesero es el controlador de la cach y es quien toma la iniciativa para decidir cules platos deben ser depositados en la mesa, justo antes de que usted los necesite. Al igual que el controlador, el mesero usa su habilidad para literalmente adivinar cul platillo requerir a continuacin; si acierta, usted nunca tendr que esperar. Ahora digamos que la cuarta noche usted llega exactamente a la misma hora y comienza con su hot dog habitual; el mesero, totalmente confiado, lo tiene preparado y usted no tiene que esperar. Tan pronto como se termina su hot dog, y justo cuando el mesero est poniendo una hamburguesa en la mesa, usted dice: Caray, realmente lo que se me antoja ahora es una orden de tacos de pollo; no esta hamburguesa. El mesero se equivoc, y la consecuencia es que esta vez usted tendr que esperar los 60 segundos que la cocina tarda en preparar sus tacos. A esto se conoce como falla de la cach el controlador de cach no acert a llenarla con los datos que el procesador realmente necesitaba. El resultado es una espera, o en el caso del sistema Pentium a 233 MHz, la ocurrencia de un cuello de botella, al reducir momentneamente su velocidad de funcionamiento a 16 MHz (la de la RAM) cada vez que existe una falla de cach. De acuerdo con Intel, la cach L1 de la mayora de 26

sus procesadores tiene una frecuencia de aciertos de alrededor de 90 por ciento; es decir, esta cach tiene los datos correctos 90 de cada 100 veces y gracias a ello el procesador funciona a toda velocidad, 233 MHz en este ejemplo, el 90 por ciento del tiempo. Sin embargo, el controlador de la cach falla el 10 por ciento de las veces, y los datos deben obtenerse de la memoria principal, la cual es significativamente ms lenta, con la espera consecuente. Esto estrangula el funcionamiento del sistema y reduce su velocidad a la de la RAM, la cual en este ejemplo es de 60 ns o 16 MHz. La principal caracterstica de la cach L1 es que siempre ha estado integrada al ncleo del procesador, donde funciona a la misma velocidad del ncleo. Esto, combinado con una frecuencia de aciertos de 90 por ciento o mayor, convierte a la cach L1 en un elemento muy importante para el rendimiento del sistema.

Cach de Nivel 2 (L2) Es posible emplear una cach L2 (o secundaria) para mitigar el aletargamiento del sistema derivado de una falla de la cach L1. Continuando con la analoga del restaurante, la cach secundaria esta representada por un carrito de platillos adicionales colocado estratgicamente, de tal forma que el mesero pueda tomar un platillo en 15 segundos. En un sistema real de clase Pentium (Socket 7), la cach secundaria est montada en la tarjeta madre y, por tanto, corre a su misma velocidad: 66 MHz o 15 ns en este ejemplo. En estas condiciones, si usted pide un platillo que el mesero no tiene preparado en su mesa, en lugar de hacerlo esperar los 60 segundos habituales, primero revisa el carrito de los alimentos adicionales. Si el platillo se encuentra ah, usted slo tendr que esperar 15 segundos. El efecto en el sistema real es que, en lugar de reducir su velocidad de 233 a 16 MHz al esperar los datos desde la memoria principal de 60 ns, la informacin puede ser recuperada de la cach secundaria de 15 ns (66 MHz). El sistema, entonces, reduce su velocidad de 233 a 66 MHz. De la misma forma en que lo hace la cach primaria, la mayora de las cachs secundarias tienen una frecuencia de aciertos ubicada en la escala del 90 por ciento, lo cual implica que el sistema funcionar el 90 por ciento del tiempo a toda velocidad (233 MHz en este ejemplo) mediante la recuperacin de datos de la cach primaria; el 10 por ciento restante reducir su velocidad para recuperar datos de la cach secundaria. Noventa por ciento de las veces que el procesador recurra a la cach L2, los datos estarn disponibles y 10 por ciento tendr que solicitarlos de la lenta memoria principal, debido a una falla de la cach secundaria. De esta manera, al combinarse las dos cachs, el sistema de ejemplo correr a la velocidad del procesador (233 MHz) el 90 por ciento del tiempo; a velocidad de tarjeta madre (66 MHz) el nueve por ciento (90 de 10 por ciento), y a velocidad de RAM (16 MHz) alrededor de 1 por ciento del tiempo (es decir, el 10 por ciento del 10 por ciento). Ahora puede entender con claridad la importancia de las dos cachs (primaria y secundaria). Sin ellas el sistema se vera obligado a usar la memoria principal con mayor frecuencia, cuya velocidad es significativamente menor a la del procesador. Esto trae a colacin otros aspectos muy interesantes. Si usted tuviera presupuesto para duplicar el rendimiento de la memoria principal (RAM) o de la cach secundaria, en cul gastara? Considerando que la memoria principal slo es empleada alrededor del uno por ciento del tiempo, si la duplicara aumentara el rendimiento del sistema en slo uno por ciento del tiempo de uso! No parece una gran mejora para tanto gasto. Por el otro lado, si duplicara el rendimiento de la cach secundaria, aumentara la velocidad del sistema alrededor de nueve por ciento del tiempo, es decir, obtendra un rendimiento general mucho mayor. 27

Los diseadores del procesador y los sistemas de Intel y AMD saben esto y discurrieron mtodos para mejorar el rendimiento de la cach secundaria. En los sistemas de clase Pentium (PS), la cach L2 normalmente se encontraba en la tarjeta madre, y por tanto corra a la misma velocidad. Intel llev a cabo la primera mejora notable al reubicar la cach secundaria directamente en el procesador, y hacindola funcionar a la velocidad del mismo. En un principio, los chips de cach fueron fabricados por Intel y montados cerca del circuito integrado del procesador en un solo encapsulamiento. Esto result ser demasiado caro, de manera que en el Pentium II, Intel comenz a usar chips de cach de otros proveedores como Sony, Toshiba, NEC, Samsung, etctera. Como stos se producan en forma de chips terminados, y no como circuitos integrados sin cubrir, Intel los mont en una tarjeta junto con el procesador. sta es la razn de que el Pentium II haya sido diseado como un cartucho y no como algo que pareciera un chip. La velocidad de los chips de cach de otros fabricantes representaba un problema. Los ms rpidos del mercado eran de 3 ns o ms, es decir, de 333 MHz o menos. Dado que el procesador funcionaba a una velocidad superior, en el Pentium II y los primeros III, Intel tuvo que hacer funcionar la cach secundaria a la mitad de la velocidad del procesador, dado que era la mxima velocidad que la memoria cach disponible comercialmente poda manejar. AMD sigui la tendencia con el procesador Athlon, el cual deba reducir ms la velocidad de la cach L2: en algunos modelos hasta dos quintos o un tercio de la velocidad del procesador, esto con el fin de mantener la velocidad de la memoria cach a menos de los 333 MHz de los chips disponibles. Entonces surgi la innovacin, la cual se present por primera vez en el Celeron 300A y superiores. Estos modelos introdujeron 128 KB de cach secundaria, la cual no consista de chips externos; en su lugar, se haba integrado directamente al ncleo del procesador, tal como la cach primaria. Esto implicaba que, a partir de entonces, tanto la cach primaria como la secundaria correran a la misma velocidad del procesador; y lo ms importante, sus velocidades creceran a la par de la de los futuros procesadores. En los Pentium III ms recientes, as como en los modelos Xeon y Celeron, la cach secundaria corre a velocidad de procesador, lo cual evita los tiempos de espera y el aletargamiento a causa de una falla de cach primaria. AMD tambin alcanz velocidades de procesador para sus cachs asimiladas en el circuito integrado en sus procesadores Athlon y Duron. El uso de cach incorporada al circuito integrado del procesador mejora el rendimiento notablemente, gracias a que el nueve por ciento del tiempo que el sistema usa la cach L2, ste seguir funcionando a velocidad mxima, en lugar de reducirla a la mitad o menos o, peor incluso, a la de la tarjeta madre, como en los diseos de Socket 7. Otro beneficio de la cach secundaria incorporada en el circuito integrado es su costo ms econmico gracias al menor nmero de partes involucradas. Usemos nuevamente la analoga del restaurante, esta vez para un moderno Pentium III a 1 GHz. Ahora usted comer un bocado cada segundo (1 GHz = ciclo de 1 ns). La cach primaria correra a la misma velocidad, de manera que usted podra comer cualquier cosa dispuesta en su mesa a esa misma frecuencia (la mesa seria el equivalente de la cach primaria). El salto real en velocidad consiste en que cuando usted desee comer algo que no est listo en la mesa (falla de la cach primaria), el mesero correr al carrito y, nueve de diez veces, regresar a usted con el platillo deseado en slo un segundo (la velocidad de la cach secundaria es ahora de 1 GHz o un ciclo de 1 ns). Este sistema ms moderno correra a 1 GHz el 99 por ciento del tiempo (gracias a las frecuencias de aciertos de las cachs L1 y L2 combinadas), y slo bajara a velocidad de RAM (mientras espera por la preparacin de alimentos en la cocina) el uno por ciento del tiempo. Con una memoria de 133MHz (7.5 ns) slo tendramos que esperar 7.5 segundos para que la comida llegue desde la cocina. 28

Organizacin de la cach La organizacin de la memoria cach de las familias del 486 y el Pentium es conocida como cach de conjunto asociativa de cuatro vas, lo cual significa que la memoria cach est dividida en cuatro bloques, cada uno de los cuales est organizado en 128 o 256 lneas de 16 bytes cada una. Para entender el funcionamiento de una cach de conjunto asociativa de cuatro vas, consideremos el siguiente ejemplo. En el diseo ms simple de cach, sta es slo un bloque en el cual se carga el contenido de un bloque correspondiente de la memoria principal. Este procedimiento es similar al uso de un marcador para ubicar la pgina en donde se dej la lectura de un libro. Si equiparamos la memoria principal a la totalidad de las pginas, el marcador corresponde a las pginas contenidas en la memoria cach. Este procedimiento funciona si los datos requeridos se ubican dentro de las pginas sealadas por el marcador; pero si usted necesita otra pgina previamente leda, el marcador no tiene utilidad alguna. Un mtodo alternativo es mantener varios marcadores para sealar sendas partes del libro al mismo tiempo. Al uso de varios marcadores se asocia una carga de trabajo adicional en el hardware; lo cual se equipara al tiempo extra que usted debe dedicar a revisar todos los marcadores para saber cul corresponde a las pginas que necesita. Cada marcador adicional se suma a la carga de trabajo; pero tambin se incrementan las posibilidades de encontrar las pginas deseadas. Si marca cuatro pasajes del libro habr construido, esencialmente, una cach de conjunto asociativa de cuatro vas. Esta tcnica divide la memoria cach disponible en cuatro bloques, cada uno de los cuales almacena diferentes lneas de la memoria principal. Los ambientes multitarea, como Windows, son buenos ejemplos de ambientes en los cuales el procesador necesita operar sobre diferentes reas de la memoria en forma simultnea, y en los cuales una cach de cuatro vas mejorara significativamente el rendimiento. El contenido de la cach siempre debe estar sincronizado con el contenido de la memoria principal para asegurar que el procesador trabaje con datos actualizados. Por ello, la cach interna de la familia del 486 es una cach de escritura directa. Escritura directa significa que cuando el procesador escribe informacin hacia fuera de la cach, estos datos se escriben automticamente tambin en la memoria principal. En comparacin, el Pentium y chips posteriores tienen una cach interna de reescritura, lo cual significa que tanto las lecturas como las escrituras se almacenan en la cach, mejorando ms el rendimiento. Aunque la cach interna del 486 es de escritura directa, el sistema puede emplear una cach externa de reescritura para aumentar el rendimiento. Adems, el 486 puede almacenar en bfer hasta cuatro bytes antes de recurrir al almacenamiento de datos en RAM, lo cual mejora la eficiencia en caso de que el bus de memoria est ocupado. Otra caracterstica de los diseos avanzados de cach es que son de tipo no bloqueo. El no bloqueo es una tcnica para reducir u ocultar las demoras de memoria gracias a la explotacin del traslape de las operaciones del procesador mediante accesos a datos. Una cach de tipo no bloqueo permite la ejecucin de un programa y, al mismo tiempo, continuar con las faltas de cach, siempre y cuando se respeten ciertas restricciones de dependencia. En otras palabras, es posible manejar una falla de 29

cach de mucho mejor manera, y que el procesador continu con una operacin que no dependa de los datos faltantes. El controlador de la cach, integrado en el procesador, tambin es responsable de vigilar al bus de memoria (proceso conocido como monitoreo de bus) cuando algn procesador alternativo, conocido como busmaster, toma control del sistema. Si un dispositivo busmaster sobrescribe un rea de la memoria que tambin est almacenada en la cach del procesador en ese momento, los contenidos de la memoria y la cach dejan de concordar. El controlador de la cach marca entonces estos datos como invlidos y vuelve a cargar la cach durante el siguiente acceso a memoria con el fin de preservar la integridad del sistema. En la mayora de los sistemas 486 y Pentium se usan tambin unos chips de cach L2 secundaria externa basada en RAM esttica extremadamente rpida (SRAM). stos reducen la cantidad de tiempo que el procesador debe esperar por los datos de la memoria del sistema. La funcin de la cach L2 secundaria externa es similar a la de la cach de tarjeta: contener informacin en trnsito hacia la CPU para reducir el tiempo que el procesador pierde esperando, y aumentar el tiempo de procesamiento. Obtener informacin de esta cach adicional del procesador, en lugar de hacerlo de la memoria principal, es mucho ms rpido porque los chips SRAM corren a una velocidad mucho mayor: 15 nanosegundos o menos. Los sistemas Pentium incorporan la cach L2 secundaria externa en la tarjeta madre, mientras que los Pentium Pro y Pentium II la tienen dentro del paquete del procesador. Al cambiar la cach L2 al procesador, los sistemas son capaces de funcionar a velocidades mayores que la de la tarjeta madre, y tan rpido como el ncleo del procesador. A medida que aumenta la velocidad de reloj, disminuye el tiempo del ciclo. La mayora de la memoria SIMM empleada en los Pentium y anteriores era de 60 ns, que resultan en slo alrededor de 16 MHz! las velocidades de las tarjetas madre estndar son ahora de 66, 100 y 133 MHz, y hay procesadores disponibles a 600 MHz o ms. Los sistemas ms recientes han dejado de usar cach en la tarjeta madre, pues las SDRAM o RDRAM ms rpidas, usadas en los modernos sistemas Pentium II/III y Celeron pueden mantenerle el paso a la velocidad de la tarjeta madre. La tendencia actual es hacia la integracin de la cach L2 al acoplamiento del procesador, tal como se hizo con la cach L1. Esto permite a la L2 funcionar a la velocidad mxima del ncleo del procesador, porque ahora est incorporada al mismo. La velocidad de la cach siempre es ms importante que el tamao: la regla es que una cach ms pequea pero ms rpida siempre es mejor que una ms grande pero ms lenta. La tabla 3.11 ilustra la necesidad y el funcionamiento de las cachs L1 (interna) y L2 (externa) en los sistemas modernos. Tabla 3.11 Velocidades de procesador en comparacin con la cach, SIMM/DIMM y la tarjeta madre Tipo de CPU Pentium Pentium Pro Pentium II 333 K6-2 500 Vel. de la CPU 233 MHz 200 MHz 333 MHz 500 MHz Vel. Cach L1 4 ns (233 MHz) 5 ns (200 MHz) 3 ns (333 MHz) 2 ns (500 MHz) Vel. Cach L2 15 ns (66 MHz) 5 ns (200 MHz) 6 ns (167 MHz) 10 ns (100 MHz) Vel. Tarjeta madre 66 MHz 66 MHz 66 MHz 100 MHz Vel. SIMM/DIMM 60 ns (16 MHz) 60 ns (16 MHz) 15 ns (66 MHz) 10 ns (100 MHz) Tipo SIMM/DIMM FPM/EDO FPM/EDO SDRAM SDRAM Tipo de CPU Celeron 500 Pentium III 500 Athlon 1000 Pentium III 1000 Vel. de la CPU 500 MHz 500 MHz 1000 MHz 1000 MHz 30

Vel. Cach L1 Vel. Cach L2 Vel. tarjeta madre Vel. SIMM/DIMM Tipo SIMM/DIMM
1

2 ns (500 MHz) 2 ns (500 MHz) 66 MHz 15 ns (66 MHz) SDRAM

2 ns (500 MHz) 4 ns (500 MHz) 100 MHz 10 ns (100 MHz) SDRAM

1 ns (1000 MHz) 3 ns (333 MHz) 200 MHz 10 ns (100 MHz) SDRAM

1 ns (1000 MHz) 1 ns (1000 MHz) 133 MHz 5 ns (200 MHz)1 RDRAM

Observe que, en trminos tcnicos, la RDRAM funciona a 800 MHz, pero el canal es de solo 16 bits de anchura, lo cual produce un ancho de banda de 1.6 GB/s, equivalente a un funcionamiento de 200 MHz a la anchura de 64 bits de un bus de datos del procesador.

Los procesadores Celeron a 300 MHz y ms rpidos, as como los Pentium III a 600 MHz y ms rpidos tienen una cach L2 incorporada al circuito integrado que corre a la velocidad del ncleo del procesador. Los procesadores Athlon ms recientes y todos los Duron tienen la misma caracterstica. Los primeros Pentium II y III, as como los Athlon ms antiguos, usan cach L2 externa y la hacen funcionar a la mitad, dos quintos o un tercio de la velocidad del ncleo del procesador. Como se puede observar, tener dos niveles de cach (especialmente con L2 incorporada al circuito integrado), entre la muy rpida CPU y la muy lenta memoria principal, ayuda a minimizar la ocurrencia de estados de espera en el procesador y esto, desde luego, le permite mantenerse trabajando ms cerca de su velocidad real.

Modos de procesador Todos los procesadores Intel a 32 bits y posteriores, a partir del 386, pueden funcionar en varios modos. Los modos del procesador se relacionan con los distintos ambientes operativos, y afectan las instrucciones y capacidades del chip. El modo del procesador controla la manera en que ste percibe y maneja la memoria del sistema y las tareas que la usan. Los tres modos posibles de operacin son: Modo real (software de 16 bits) Modo protegido (software de 32 bits) Modo real virtual (programas de 16 bits dentro de un ambiente de 32 bits)

Modo real La PC IBM original inclua un procesador 8088 capaz de ejecutar instrucciones de 16 bits mediante el uso de registros internos de 16 bits, y era capaz de direccionar slo 1 MB de memoria usando 20 lneas de direcciones. Todo el software para la PC original fue creado para trabajar con este chip y diseado alrededor del conjunto de instrucciones de 16 bits y el modelo de memoria de 1 MB. Por ejemplo, DOS y todo el software de DOS, Windows 1.x a 3.x, y todas las aplicaciones Windows 1.x a 3.x fueron escritos usando instrucciones de 16 bits. Estos sistemas operativos y aplicaciones de 16 bits estn diseados para ejecutarse en un procesador 8088 original. Los procesadores posteriores, tales como el 286, tambin podan ejecutar las mismas instrucciones de 16 bits que el 8088, pero mucho ms rpidamente. En otras palabras, el 286 era completamente compatible con el 8088 original y poda correr todo el software de 16 bits creado para el 8088, pero, 31

por supuesto, a una velocidad mucho mayor. El modo de instrucciones de 16 bits del 8088 y el 286 se conoce como modo real. Todo el software de modo real debe usar exclusivamente instrucciones de 16 bits y vivir dentro de la arquitectura de memoria a 20 bits (1 MB) que admite. El software de este tipo es, normalmente, unitarea, lo cual significa que es posible correr slo un programa a la vez. No hay proteccin integrada para impedir a un programa sobrescribir a otro en memoria, o incluso al sistema operativo, lo cual implica que si se ejecuta ms de un programa, es posible que uno de ellos haga colapsar a todo el sistema.

Modo protegido (32 bits) Despus surgi el 386: el primer procesador a 32 bits de la industria de la PC. Este chip poda correr un conjunto de instrucciones de 32 bits totalmente nuevo. Para aprovechar al mximo este conjunto de instrucciones, era necesario un sistema operativo y una aplicacin a 32 bits. Este nuevo modo se conoci como modo protegido, ya que los programas que corren en este modo estn protegidos contra la sobrescritura de otros en la memoria. Tal proteccin ayuda a darle estabilidad al sistema (a evitar colapsos), gracias a que un programa errtico no puede daar fcilmente a otros o al sistema operativo. Adems, en este modo es posible terminar un programa sin afectar el funcionamiento del resto del sistema. En el entendido de que aprender el uso de estos nuevos sistemas operativos y sus aplicaciones (los cuales aprovechaban el modo protegido a 32 bits) tomara algn tiempo, Intel sabiamente integr un modo real en el 386 para compatibilidad hacia atrs, y esto le permiti la ejecucin de sistemas operativos y aplicaciones a 16 bits. Adems, los corra bastante bien y mucho ms rpidamente que los procesadores anteriores. Para la mayora de las personas, con eso bastaba: no necesitaban programas a 32 bits y slo queran que su software de 16 bits corriera ms aprisa. Desafortunadamente, eso implicaba que el chip nunca corriera en el modo protegido a 32 bits, y todas las funciones de esa capacidad eran ignoradas. Cuando un procesador de alto poder como el Pentium III ejecuta DOS (modo real), acta como un Turbo 8088. Turbo 8088 significa que el procesador tiene la ventaja de la velocidad en la ejecucin de cualquier programa a 16 bits, pero usa slo las instrucciones de 16 bits y el acceso a memoria dentro del mismo esquema de 1 MB del 8088 original. Entonces, si usted tiene un sistema Pentium III con 128 MB y lo usa para correr Windows 3.x o DOS, est usando eficientemente slo el primer megabyte de memoria, dejando casi sin emplear los otros 127 MB! Era necesario, pues, el advenimiento de nuevos sistemas operativos y aplicaciones de 32 bits capaces de correr en el modo protegido de los nuevos procesadores. Sin embargo, los usuarios nos resistimos a los intentos iniciales de cambiar a un ambiente de 32 bits. Como comunidad, los usuarios somos renuentes a los cambios y, lejos de adoptar nuevo software con ms funciones, nos contentamos con que nuestro viejo software corra ms rpido. Dada esta resistencia, los sistemas operativos a 32 bits como UNIX y sus variaciones (por ejemplo, linux), OS/2, e incluso Windows NT y Windows 2000 han tenido grandes dificultades para conseguir una parte importante del mercado de las PCs. De ellos, slo Windows 2000 tiene probabilidades de convertirse en un producto realmente difundido masivamente, y sobre todo porque Microsoft ha tenido gran influencia en este sentido sobre los usuarios con Windows 95, 98 y Me. Windows 3.x fue el ltimo de los sistemas operativos a 16 bits. De hecho, no era un sistema operativo completo porque corra sobre DOS. 32

Microsoft se dio cuenta de lo robusta que era la base instalada de usuarios de PC, de manera que desarroll Windows 95 a Windows Me como un puente hacia el mundo de los 32 bits. Windows 95, 98 y Me son sistemas operativos mayormente de 32 bits, aunque conservan suficiente capacidad de 16 bits para ejecutar las viejas aplicaciones de 16 bits. Windows 95 fue lanzado en agosto de 1995, 10 aos despus de la introduccin del primer procesador de PC a 32 bits! Se tomaron slo 10 aos cambiar a un software capaz de usar totalmente los procesadores que ya existan.

Modo real virtual La clave para la compatibilidad hacia atrs del ambiente Windows de 32 bits es el tercer modo del procesador: el modo real virtual. El modo real virtual es, esencialmente, un modo de 16 bits que corre dentro del modo protegido a 32 bits. Cuando usted abre una ventana DOS dentro de Windows, ha creado una sesin en modo real virtual. Dado que el modo protegido permite un funcionamiento multitareas verdadero, usted puede crear varias sesiones de modo real, tener en ejecucin y correr en cada una de ellas, un software distinto en una PC virtual. Estas sesiones pueden correr incluso junto a otras aplicaciones de 32 bits. Observe que cualquier programa que corra en una ventana de modo real virtual puede acceder a slo 1 MB de memoria, al cual el programa percibe como el primero y nico del sistema. En otras palabras, si ejecuta una aplicacin de DOS en modo virtual real, tendr un lmite de 640 KB para uso de memoria. Esto debido a que, en un ambiente de 16 bits, slo se reconoce 1 MB de RAM total, y los 384 KB superiores quedan reservados para uso del sistema. La ventana real virtual emula completamente un ambiente 8088, de manera que, adems de la velocidad, el software corre como si estuviera en el modo real original de la PC. Cada mquina virtual obtiene su propio espacio de direccionamiento de 1 MB, una imagen de las rutinas BIOS reales para hardware y una emulacin del resto de los registros y caractersticas propios del modo real. El modo real virtual se emplea cuando usted usa una ventana DOS para correr un programa de DOS o Windows 3.x a 16 bits. Cuando se inicia una aplicacin DOS, Windows crea una mquina virtual DOS bajo la cual puede correr. Otro aspecto interesante es que todos los procesadores Intel y compatibles (como los AMD y Cyrix) encienden en modo real. Slo cuando usted carga un sistema operativo a 32 bits, ste hace pasar al procesador, automticamente, al modo de 32 bits y asumir el control a partir de ese momento. Algunas aplicaciones de 16 bits (para DOS y Windows 3.x) tienen un mal comportamiento, es decir, comienzan a realizar cosas que incluso el modo real virtual no soportara. El software de diagnstico es un ejemplo perfecto de esto: este tipo de software no corre apropiadamente en una ventana de modo real virtual bajo Windows. Para estos casos, usted puede ejecutar su Pentium III en el austero modo real arrancando el sistema desde un disco flexible con DOS o, en el caso de Windows 9x, interrumpiendo el proceso de arranque y forzando el sistema a iniciar en DOS plano, mediante la opresin de la tecla F8 al ver el indicador Iniciando Windows..., o inmediatamente despus del bip que seala el fin de la POST (Autoprueba de Encendido). En este caso, ayuda un poco el oprimir la tecla F8 repetidamente para acortar el periodo de dos segundos durante el cual Windows 9x espera la tecla. Si tiene xito, podr ver el Men Inicio desde el cual puede seleccionar el comando que indica al sistema arrancar en modo real DOS de 16 bits. La ejecucin del comando Modo Seguro 33

con Smbolo del Sistema, es la apropiada para ejecutar programas para diagnsticos de hardware confiables, los cuales no corren en modo protegido y deben ser ejecutados con un mnimo de controladores y software cargados. Observe que aunque Windows Me (Millennium Edition) est basado en Windows 98, Microsoft quit la opcin del Men Inicio en un intento de alejarnos de cualquier tipo de operacin de 16 bits. Windows NT y 2000 tambin carecen de la capacidad de interrumpir el inicio de esta manera. Para esos sistemas operativos requerir de un disco flexible de arranque con DOS, el cual puede crear y usar para iniciar el sistema en modo real. Normalmente realizar esto para efectuar ciertos procedimientos, especialmente para llevar a cabo diagnsticos o editar directamente sectores del disco. Aunque el modo real es empleado por el DOS y aplicaciones estndar de 16 bits, hubo programas especiales que extendan al DOS y permitan el acceso a memoria extendida (es decir, ms all de 1 MB), conocidos como extensores de DOS. Generalmente se incluan con cualquier aplicacin para DOS o Windows 3.x capaz de usarlos. El protocolo que describe la manera de hacer trabajar a DOS en modo protegido se llama DPMI (Interfaz de Modo Protegido para DOS). La DPMI era usada por Windows 3.x para acceder a memoria extendida con el fin de usarla en sus aplicaciones, aunque fueran programas de 16 bits. Los extensores de DOS son especialmente populares para juegos de DOS, porque permiten acceder a mucho ms de la memoria del sistema que el megabyte que la mayora de los programas de modo real son capaces de direccionar. Estos extensores de DOS funcionan haciendo trabajar al procesador alternadamente en modo real, o en el caso de aquellos que corren bajo Windows, utilizan la DPMI integrada para permitir el uso de una porcin de la memoria extendida del sistema. Otra excepcin del modo real es que los primeros 64 KB de memoria extendida son accesibles a la PC en modo real, aunque se supone que no es posible. Esto es el resultado de un bug de la AT IBM original con respecto a la vigsimo primera lnea de direccionamiento de memoria, conocida como A20 (A0 es la primera lnea de direccionamiento de memoria). Mediante la manipulacin de la lnea A20, el software para modo real puede acceder a los primeros 64 KB de memoria extendida, es decir, los primeros 64 KB despus del primer megabyte. Esta rea de memoria es conocida como rea de memoria alta (HMA)

Administracin de energa
Impulsada originalmente por el objetivo de dotar a las laptop de procesadores ms potentes y rpidos, Intel cre una circuitera para administracin de energa, la cual permite a los procesadores ahorrar energa y prolongar la vida de una batera. Esta adicin fue presentada en el procesador Intel 486SL, el cual es una versin mejorada del 486DX. Subsecuentemente, las funciones para administracin de energa fueron universalizadas e incorporadas en todos los Pentium y posteriores. Esta caracterstica es conocida como SMM, siglas de Modo de Administracin del Sistema. La circuitera SMM est incorporada al chip fsico, pero opera independientemente para controlar el uso de energa del procesador considerando su nivel de actividad. La SMM permite al usuario especificar intervalos despus de los cuales el procesador ser parcial o totalmente apagado. Tambin presenta la funcin Suspender/Reanudar, la cual permite el encendido y el apagado instantneos utilizados en la mayora de las PCs laptop. Estas configuraciones son controladas normalmente a travs de la configuracin del BIOS del sistema. 34

Ejecucin superescalar
Los procesadores Pentium de quinta generacin y ms recientes presentan varios canales internos para ejecucin de instrucciones, los cuales permiten la ejecucin de varias instrucciones simultneamente (el 486 y los anteriores pueden efectuar slo una instruccin a la vez). Intel llama a esta capacidad tecnologa superescalar. Esta tecnologa ofrece un rendimiento superior al del 486. La arquitectura superescalar generalmente se asocia con chips RISC (Computadora con Conjunto Reducido de Instrucciones) de alto rendimiento. Un chip RISC tiene un conjunto de instrucciones menos complicado, menos instrucciones y ms sencillas. Aunque cada instruccin logra menos, a fin de cuentas, la velocidad de reloj puede ser ms alta, lo cual generalmente mejora el rendimiento. El Pentium es uno de los primeros chips CISC (Computadora con Conjunto Complejo de Instrucciones) en ser considerados superescalares. Un chip CISC emplea un conjunto ms rico y con ms funciones, el cual agrupa instrucciones ms complicadas. Para poner un ejemplo, digamos que usted desea instruir a un robot para colocar bombillas. Si empleara instrucciones CISC usted le dira: Recoge la bombilla. Instala en el socket. Dale vuelta, en el sentido de las manecillas del reloj, hasta que quede apretada. Mediante instrucciones RISC, usted tendra que pedrselo de la siguiente forma: Baja la mano. Toma la bombilla. Levanta la mano. Instala en el socket. Dale una vuelta en el sentido de las manecillas del reloj. Est apretada? Si no lo est, repite el paso 5. Fin. Para llevar a cabo una accin son necesarias muchas ms instrucciones RISC, porque cada una de ellas es ms simple (reducida) y hace menos. La ventaja reside en que el robot (o el procesador) tiene que lidiar con menos instrucciones, puede ejecutar los comandos con mayor rapidez y as, en muchos casos, lleva a cabo toda la tarea (o programa) mucho ms rpidamente. El debate consiste en si alguno de ambos mtodos (CISC o RISC) es realmente mejor que el otro. La cuestin es que en la prctica no existe ningn chip que sea RISC o CISC puro; todo es cuestin de definicin, y los lmites son, de alguna manera, arbitrarios. Los procesadores Intel y compatibles han sido considerados como CISC, aunque la quinta y sexta generaciones tienen muchos atributos RISC, e internamente descomponen cada instruccin CISC en versiones RISC.

Tecnologa MMX
Las siglas de la tecnologa MMX provinieron originalmente de eXtensiones MultiMedia, o de eXtensiones Matemticas de Matriz, todo depende a quin le pregunte. Intel afirma oficialmente que en 35

realidad no se trata de siglas (tal vez con el fin de registrar MMX como marca comercial, pues no es posible hacerlo con iniciales o siglas); sin embargo, el origen es alguno de los mencionados al principio. La tecnologa MMX fue introducida a finales de la quinta generacin de procesadores Pentium (vea la figura 3.2) como un agregado para mejorar la compresin y descompresin de video, manipulacin de imgenes, cifrado y procesamiento de E/S, todas ellas funciones usadas en una variedad de software actual.

Figura3.2 caras inferior y (mostrando el integrado) de un chip Intel Pentium MMX.

Las superior circuito

MMX consiste de dos mejoras arquitectnicas al procesador principal. La primera es muy elemental: todos los chips con MMX tiene una cach L1 interna ms grande que las versiones sin MMX. Esto mejora el rendimiento de cualquier software, use o no las instrucciones MMX especificas. La otra parte de MMX consiste en extender el conjunto de instrucciones del procesador con nuevos comandos o instrucciones, as como una nueva capacidad de instrucciones llamada Instruccin nica, Datos Mltiples (SIMD). 57

Las aplicaciones modernas de multimedia y comunicaciones usan, con mucha frecuencia, ciclos o bucles repetitivos que, aun ocupando 10 por ciento o menos de la extensin total del cdigo, pueden llevarse hasta el 90 por ciento del tiempo de ejecucin. SIMD permite que una instruccin efecte la misma funcin sobre varios segmentos de datos, de manera similar a la que un maestro dice a toda la clase tomen asiento, en lugar de dirigirse a cada uno de los estudiantes individualmente. SIMD permite al procesador reducir los ciclos que lo ocupan intensivamente con video, audio, grficos y animacin. Intel agreg adems 57 nuevas instrucciones diseadas en especfico para manipular y procesar video, audio y datos grficos con mayor eficiencia. Estas instrucciones estn orientadas a las secuencias altamente paralelas, y a menudo repetitivas, encontradas en las operaciones multimedia: altamente paralelas porque el mismo proceso es efectuado sobre muchos puntos de datos diferentes, como cuando se modifica una imagen. Los principales inconvenientes de las MMX eran que slo funcionaban sobre valores de ntegros y usaban la unidad de punto flotante para el procesamiento, lo cual implicaba una prdida de tiempo cuando se hacia necesario un cambio a operaciones de punto flotante. Estos inconvenientes fueron corregidos en las adiciones a MMX de Intel y AMD. Intel concedi la licencia de las capacidades MMX a competidores como AMD y Cyrix, quienes entonces pudieron actualizar sus procesadores compatibles con Intel a la tecnologa MMX.

36

Streaming SIMD Extensions


En febrero de 1999, Intel introdujo el Pentium III, en el cual incluy una actualizacin a MMX llamada Streaming SIMD Extensions (SSE); tambin se les llam Nuevas Instrucciones Katmai (KNI) hasta su debut, pues Katmai fue el nombre clave del Pentium III. El Celeron 533A y los Celeron superiores basados en el ncleo del Pentium III tambin presentan instrucciones SSE. Los anteriores Pentium II y Celeron 533 e inferiores (basados en el ncleo del Pentium II) no incluyen SSE. Las SSE incluyen 70 instrucciones nuevas para procesamiento de grficos y sonido, adems de las provistas por MMX. Las SSE son similares a las MMX; de hecho, adems de ser conocidas como KNI (Nuevas Instrucciones Katmai), se les llam tambin MMX-2 durante algn tiempo. Adems de agregar ms instrucciones al estilo de las MMX, las SSE permiten clculos de punto flotante, y usan una unidad separada dentro del procesador en lugar de compartir la unidad de punto flotante estndar, como lo hacan las MMX. Las Streaming SIMD Extensions consisten de 70 instrucciones entre las cuales se incluyen instrucciones SIMDs de punto flotante, SIMDs adicionales para ntegros, e instrucciones para manejo de cach. Entre las tecnologas que se benefician gracias a las Streaming SIMD Extensions figuran la produccin avanzada de imgenes, el video de aspecto tridimensional, audio y video fluidos (para reproduccin de DVD), y las aplicaciones de reconocimiento de voz. Los beneficios de las SSE incluyen: Despliegue con resolucin y calidad de imagen ms altas y manipulacin de software para grficos. Audio de alta calidad, video MPEG2, y codificacin y decodificacin MPEG2 simultneas para aplicaciones multimedia. Utilizacin reducida de la CPU para reconocimiento de voz, as como mayor exactitud y tiempos de respuesta ms cortos al ejecutar software para reconocimiento de voz. Las instrucciones SSE son particularmente tiles en la decodificacin de MPEG2, el esquema estndar de los DVDs. Esto significa que los procesadores equipados con SSE deben tener mejor capacidad para decodificar MPEG2 en software a toda velocidad, sin requerir los servicios de una tarjeta adicional decodificadora de MPEG2. Los procesadores con SSE son mucho mejores y ms rpidos que sus versiones previas tambin en lo concerniente a reconocimiento de voz.

Uno de los beneficios principales de las SSE sobre las MMX es que admiten operaciones SIMD de punto flotante y precisin sencilla, las cuales han representado un cuello de botella en el procesamiento de grficos tridimensionales. Al igual que las MMX, las instrucciones SIMD permiten llevar a cabo varias operaciones por instruccin de procesador. Especficamente, las SSE efectan hasta cuatro operaciones de punto flotante por ciclo; es decir, una sola instruccin puede operar sobre cuatro segmentos de datos simultneamente. Las instrucciones SSE de punto flotante pueden ser mezcladas con instrucciones MMX sin afectar el rendimiento. Las SSE tambin admiten la preobtencin de datos, el cual es un mecanismo para leer datos en la cach antes de que se les llame. Para que cualquiera de las instrucciones SSE impliquen un beneficio prctico y sea posible observar sus ventajas, stas deben estar codificadas en el software, lo cual implica el empleo de aplicaciones adaptadas al uso de SSE. La mayora de las compaas de software dedicadas en la actualidad a la 37

edicin de software relacionado con grficos y sonido, han actualizado sus aplicaciones al estndar SSE y usado sus funciones. Por ejemplo, las potentes aplicaciones para grficos como Adobe Photoshop soportan las instrucciones SSE para producir un mayor rendimiento en procesadores SSE. Microsoft incluy SSE en su DirectX 6.1 y controladores de video y sonido ms recientes, los cuales se incluyen en la segunda edicin de Windows 98, Windows Me, Windows NT 4.0 (con Service Pack 5 o posterior) y Windows 2000. Observe que las SSE son una extensin de MMX; es decir, los procesadores SSE tambin admiten las instrucciones MMX originales. Esto significa que las aplicaciones habilitadas para MMX estndar pueden funcionar como lo hacen en procesadores con slo MMX.

3DNow y Enhanced 3DNow


La tecnologa 3DNow es la alternativa de AMD a las instrucciones SSE de los procesadores Intel. De hecho, 3DNow se incorpor por primera vez a la serie K6 antes de que Intel liberara las SSE en el Pentium III; despus, AMD agregara Enhanced 3DNow a sus procesadores Athlon y Duron. AMD licenci MMX de Intel, y toda su serie K6, Athlon, Duron y procesadores superiores que incluyen soporte completo de las MMX. Para no solicitar tambin la licencia de las SSE, en ese entones en desarrollo, AMD cre un conjunto de extensiones diferentes superior a MMX: el 3DNow fue introducido en mayo de 1998 en el procesador K6-2; en junio de 1999, se present una versin mejorada, 3DNow Enhanced, en el Athlon. Las dos versiones de 3DNow son conjuntos de instrucciones que extienden las capacidades multimedia de los procesadores AMD de una manera superior a MMX. Esto permite un mejor rendimiento para grficos tridimensionales, multimedia y otras aplicaciones para PC con uso intensivo de clculos de punto flotante. La tecnologa 3DNow es un conjunto de 21 instrucciones que usan tcnicas SIMD (Instruccin nica, Datos Mltiples) para operar sobre matrices de datos y no sobre elementos aislados. Enhanced 3DNow agrega otras 24 instrucciones a las 21 originales, para totalizar 45. Como extensin de la tecnologa MMX, 3DNow es similar a las SSE (Streaming SIMD Extensions) de los procesadores Pentium III y Celeron. De acuerdo con AMD, 3DNow proporciona aproximadamente el mismo nivel de mejora a MMX que las SSE, pero con menos instrucciones y menor complejidad. Aunque la capacidad es similar, no son compatibles a nivel de instrucciones, de manera que el software diseado especficamente para aceptar las SSE no soporta las instrucciones 3DNow, y viceversa. Como las SSE, 3DNow tambin acepta operaciones SIMD de punto flotante y precisin sencilla, y permite hasta cuatro operaciones de punto flotante por ciclo. Las instrucciones de punto flotante 3DNow pueden mezclarse con instrucciones MMX sin detrimento del rendimiento. 3DNow soporta tambin la preobtencin de datos. Otra similitud con las SSE: 3DNow es bien aceptado por software como Microsoft Windows 9x, Windows NT 4.0 y todos los nuevos sistemas operativos de Microsoft. Las interfaces para programacin de aplicaciones como DirectX 6.x API de Microsoft y Open GE API de SGI, han sido optimizadas para interactuar con la tecnologa 3DNow, as como los controladores para muchos de los principales proveedores de aceleradoras de grficos tridimensionales, como 3Dfx, ATI, Matrox y nVidia. Mientras que muchos juegos y controladores de video admiten 3DNow, algunas de las mayores aplicaciones para grficos como Adobe Photoshop no soportan esta tecnologa. 38

Ejecucin dinmica
Usada por primera vez en la sexta generacin de procesadores, o P6, la ejecucin dinmica es una combinacin innovadora de tres tcnicas de procesamiento diseadas para ayudar al procesador a manipular datos con mayor eficiencia. Estas tcnicas son la prediccin de ramas mltiples, el anlisis de flujo de datos y la ejecucin especulativa. La ejecucin dinmica permite que el procesador sea ms eficiente en la manipulacin de datos, a travs de un mtodo ordenado de una manera ms lgica, en lugar de simplemente procesar una lista de instrucciones, y es uno de los sellos distintivos de los procesadores de sexta generacin. La manera en que el software es escrito tiene una influencia importantsima en el rendimiento del procesador. Por ejemplo, el rendimiento se ver afectado negativamente si se solicita al procesador interrumpir con frecuencia sus tareas y saltar, o bifurcarse, a otro punto del programa. Tambin se producirn demoras cuando el procesador no puede operar sobre una nueva instruccin hasta haber terminado la que est procesando en un momento dado. La ejecucin dinmica permite al procesador no slo predecir dinmicamente el orden de las instrucciones, sino ejecutarlas fuera de orden, si es necesario, para mejorar la velocidad. Prediccin de mltiples ramas La prediccin de mltiples ramas anticipa el flujo del programa a travs de varias ramas. Mediante el uso de un algoritmo especial, el procesador puede predecir saltos o bifurcaciones en el flujo de las instrucciones. Usa este modo para predecir dnde, en la memoria, pueden encontrarse las siguientes instrucciones con una precisin del 90 por ciento o ms. Esto es posible debido a que mientras el procesador obtiene instrucciones, tambin consulta las que se encuentran adelante en el programa.

Anlisis de flujo de datos El anlisis de flujo de datos consiste en estudiar y organizar las instrucciones para ser ejecutadas en una secuencia ptima, independientemente del orden original del programa. El procesador ve las instrucciones decodificadas del software y determina si estn disponibles para el procesamiento o si son dependientes de otras que deban ejecutarse primero. El procesador determina entonces la secuencia ptima y ejecuta las instrucciones en una forma ms eficiente.

Ejecucin especulativa La ejecucin especulativa incrementa el rendimiento mediante la consulta adelantada del contador del programa y la ejecucin de instrucciones que probablemente sean necesarias ms adelante. Debido a que las instrucciones del software en proceso estn basadas en ramas ya sealadas, los resultados son almacenados en un conjunto (pool) para referencia posterior. Si deben ser ejecutadas segn el flujo de programa resultante, son retiradas las instrucciones terminadas y los resultados son relacionados con los registros principales del procesador en el orden de ejecucin original del 39

programa. Esta tcnica permite al procesador completar instrucciones por adelantado y despus tomar los resultados terminados cuando sea necesario.

Arquitectura de Bus Dual Independiente


La arquitectura de Bus Dual Independiente (DIB) fue implementada por primera vez en los procesadores de sexta generacin de Intel y AMD. La arquitectura DIB fue creada para mejorar el ancho de banda y el rendimiento del bus del procesador. Contar con dos buses de E/S independientes permite al procesador acceder a datos de sus buses paralela y simultneamente, ms que hacerlo de manera secuencial sencilla (como en los sistemas de bus sencillo). El segundo bus o de apoyo de un procesador con DIB es utilizado para la cach L2, lo cual le permite funcionar a velocidades mucho mayores a las que podra operar si compartiera un solo bus. Dos buses constituyen la arquitectura DIB: el bus para la cach L2 y el que va del procesador a la memoria principal, o bus de sistema. Los procesadores de clase P6, del Pentium Pro al Celeron, Pentium II/III y Athlon/Duron, pueden usar ambos buses de manera simultnea, lo cual permite eliminar un cuello de botella. Por ejemplo, la arquitectura DIB permite a la cach L2 del Pentium III o Athlon a 1 GHz, funcionar 15 veces ms rpido que la de los procesadores Pentium o K6. Debido a que el bus de cach L2 o de apoyo est acoplado a la velocidad del ncleo del procesador, a medida que la velocidad del procesador aumenta, as lo hace la de la cach L2. La clave para implementar la DIB fue quitar la cach L2 de la tarjeta madre y colocarla en el paquete del procesador. La cach L1 siempre ha constituido parte del circuito integrado del procesador, pero la L2 era ms grande y tenia que ser externa. Al pasar la L2 al procesador, sta poda correr a velocidades similares a las de la cach primaria, es decir, mucho mayores a las de la tarjeta madre o del bus del procesador. Inicialmente, para colocar la cach secundaria en el procesador, debieron hacerse modificaciones al socket o ranura de la CPU. Hay dos soluciones de ranura y tres de socket que aceptan completamente la arquitectura DIB: Ranura 1 (Pentium II/III/Celeron), Ranura A (Athlon), Socket 8 (Pentium Pro), Socket 370 (Pentium III/Celeron) y Socket A (Athlon/Duron). La DIB tambin permite al bus de sistema efectuar varias transacciones simultneas (en lugar de transacciones secuenciales), lo cual acelera el flujo de informacin dentro del sistema y eleva el rendimiento. La arquitectura general DIB ofrece hasta tres veces el rendimiento de ancho de banda, en comparacin con un procesador con arquitectura de un solo bus.

Fabricacin del procesador


La materia prima de los procesadores es el silicio, el segundo elemento ms comn del planeta (slo el oxigeno es ms comn). El silicio es el ingrediente mayoritario de la arena de playa; sin embargo, en esa forma no es lo suficientemente puro como para emplearse en la creacin de circuitos integrados. La manera de fabricar silicio para circuitos integrados es un largo proceso que inicia por la produccin de cristales de silicio puro mediante el mtodo Czochralski (llamado as en honor al inventor del proceso). En este mtodo, un horno de arco elctrico transforma el material crudo (roca de cuarzo extrada por minera) en silicio de grado metalrgico. Despus, para eliminar las impurezas que pudieran haber quedado, el silicio es convertido en un lquido; se destila y se moldea en forma de barras con grado de pureza de semiconductor, las cuales son 99.999999 por ciento 40

puras. Estas barras son segmentadas mecnicamente y empacadas en crisoles de cuarzo, los cuales son cargados en hornos elctricos para pulido de cristales. Ah, las porciones de silicio son fundidas a ms de 1,370 C (2,500 F). Para evitar deformaciones, los hornos estn montados en cubos de concreto muy grueso, sobre un sistema de suspensin, para evitar cualquier vibracin que pudiera daar los cristales durante su formacin. Una vez que el silicio est fundido, se inserta un cristal germinal o cristal de inicio en el silicio derretido, y se hace girar muy lentamente (vea la figura 3.3). A medida que se va extrayendo el cristal germinal del recipiente de silicio fundido, algo de ste se va adhiriendo a su alrededor y endurecindose en una sola estructura de cristal. Mediante el control minucioso de la velocidad de extraccin (10 a 40 milmetros por hora) y la temperatura (1,370 C) el cristal va creciendo de una delgada barrita a un barra ms gruesa, hasta alcanzar el dimetro deseado. Dependiendo del tipo de chips a fabricar, cada lingote tiene un dimetro de aproximadamente 20 o 30 cm, una longitud de ms de metro y medio, y un peso de cientos de kilos.

Cristal Cristal de silicio, en una sola estructura Crisol de cuarzo Cmara enfriada por agua Escudo trmico Calentador de carbn Crisol de grafito

Soporte del crisol Charola pare derrames


Electrodo

puro El

Figura 3.3 Produccin de un lingote de silicio en un horno de alta presin y alta temperatura.

lingote se rectifica hasta obtener un cilindro perfecto de 200 300 mm de dimetro, normalmente con un corte plano en un extremo para posibilitar la precisin en el manejo y la colocacin. Cada lingote es cortado con una sierra de diamante de alta precisin en ms de mil obleas circulares, cada una con un grosor menor a un milmetro (vea la figura 3.4). Cada oblea se pule hasta producir una superficie con acabado especular (de espejo). Los chips se construyen a partir de las obleas mediante un proceso llamado fotolitografa. Este proceso fotogrfico crea transistores y rutas de seales y circuitos en semiconductores, mediante el depsito de diferentes capas de varios materiales en el chip, una sobre otra. Donde dos circuitos especficos se intersectan, se forma un transistor o un interruptor. El proceso fotolitogrfico inicia con la creacin, mediante deposicin de vapor, de una capa aislante de dixido de silicio sobre la oblea. Despus, se aplica un recubrimiento de material fotoendurecible 41

y se proyecta sobre la superficie, ahora sensibilizada a la luz, la imagen de una de las capas que se desean crear.

Disco de la sierra de diamante

Lecho Figura 3.4 Corte de un obleas, con una sierra de lingote de silicio en diamante.

Al proceso de agregar impurezas qumicas al silicio (el cual es no conductor por naturaleza), con el propsito de crear un material con propiedades semiconductoras, se le conoce como dopaje. El proyector utiliza una mscara creada especialmente, la cual es, en esencia, el negativo de esa capa del chip grabada en cromo en una placa de cuarzo. El Pentium III utiliza veinte mscaras o ms para crear seis capas de interconexiones de metal y semiconductoras. Al pasar a travs de la mscara, la luz es enfocada sobre la superficie de la oblea, imprimiendo en ella la imagen de la capa (se conoce como circuito terminado a la imagen de cada chip). Un dispositivo llamado stepper mueve la oblea un poco y la misma mscara se utiliza para imprimir una capa de circuito impreso contigua a la anterior. Despus de que toda la oblea queda impresa con la misma capa, una solucin custica se lleva todas las reas donde la luz toc la capa fotosensible, dejando la impresin de las vas del chip (interconexiones entre capas) y las rutas del circuito. Despus, se deposita otra capa de material semiconductor y otra de material fotosensible sobre la oblea, y se usa la siguiente mscara para producir la capa de circuitera correspondiente. Mediante este mtodo, las capas y componentes de cada chip se van construyendo unos sobre otros, hasta que stos son terminados. Las mscaras finales agregan las capas de metalizacin, las cuales constituyen las interconexiones de metal usadas para vincular todos los transistores y otros componentes. En la actualidad, la mayora de los chips usan interconexiones de aluminio, aunque algunos estn cambindolo por el cobre, el cual es un material ms promisorio a futuro. El primer chip comercial para PC interconectado con cobre es el Athlon, producido en la fbrica Dresden de AMD. El cobre es mejor conductor que el aluminio y permitir conexiones ms pequeas y de menor resistencia, lo cual implicar la posibilidad de fabricar chips ms pequeos y rpidos. No se haba usado porque es hasta ahora cuando comienzan a resolverse algunos arduos problemas de corrosin ocurrida durante el proceso de fabricacin, los cuales no presenta el aluminio. A medida que se retinen las soluciones de estos inconvenientes, habr ms y ms chips fabricados con interconexiones de cobre. Una oblea circular tendr todos los circuitos impresos que pueda contener. Dado que cada chip es, por lo general, cuadrado o rectangular, sobran algunas porciones de material en los bordes aun cuando se intenta usar cada milmetro cuadrado de la superficie. 42

Actualmente, el tamao de la oblea estndar en la industria es de 200 mm de dimetro y 31,416 mm de superficie. El Pentium II a 300 MHz, por ejemplo, contiene hasta 7.5 millones de transistores en un proceso de 0.35 micras (millonsima parte de un metro). Este mtodo produce un circuito integrado de exactamente 14.2 mm por lado, es decir, un cuadrado de 202 mm2 de rea. Por tanto, alrededor de 150 chips Pentium II a 300 MHz, construidos mediante el proceso de 0.35 micras, caben en una sola oblea de 200 mm de dimetro. La tendencia en la industria es tanto producir obleas ms grandes, como lograr un proceso para crear circuitos integrados ms pequeos a travs de la reduccin de los circuitos individuales y los transistores del chip. Por ejemplo, los procesadores Pentium II de 333 MHz a 450 MHz fueron creados con un proceso de 0.25 micras, el cual redujo el tamao del circuito integrado a slo 10.2 mm por lado, con un rea de 104 mm2. En la misma oblea de 200 mm, Intel puede producir 300 chips Pentium II empleando este proceso, es decir, el doble de los producidos con el proceso de 0.35 micras de la versin a 300 MHz. El Pentium III a 600 MHz o a mayor velocidad es construido con un proceso de 0.18 micras y el circuito integrado mide slo 104 mm2, con alrededor de 10.2 mm por lado. Es la misma medida del Pentium II a 333 MHz, slo que el PIII aloja 28.1 millones de transistores (incluyendo la cach L2 asimilada al circuito integrado); el Pentium II tenia slo 7.5 millones de ellos. En el futuro, los procesos aumentarn la tasa de reduccin de 0.18 a 0.13 micras, y las obleas crecern de 200 a 300 mm; las de 300 mm podran contener ms del doble de chips producidos en las de 200 mm que se usan en la actualidad. El proceso de 0.13 micras permitir la inclusin de ms transistores en un circuito integrado que mantendr un tamao razonable. Esto implica que continuar la tendencia a incorporar la cach L2 en el circuito integrado del procesador, y que el nmero de transistores crecer hasta los 200 millones por chip o ms. El rey actual en cuanto a el nmero de transistores es el Pentium III Xeon de Intel, introducido en mayo de 2000, con 2 MB de cach incorporada y 140 millones de transistores en un solo circuito integrado. El aumento de la superficie de las obleas, de 200 a 300 mm, permitir incrementar la produccin de circuitos integrados hasta alrededor de 675 chips por oblea. Intel y otros fabricantes esperan iniciar la produccin en serie de obleas de 300 mm durante el 2001; despus de esto, los precios de los procesadores continuarn bajando de manera significativa a medida que aumente la demanda. No todos los circuitos impresos de la oblea salen bien, sobre todo cuando se inicia una nueva lnea de produccin. A medida que se perfecciona el proceso de fabricacin de un chip dado, disminuye el nmero de chips desechados. El porcentaje de chips buenos es conocido como cosecha o produccin. Las producciones de menos de 50 por ciento son comunes al inicio de la fabricacin de un nuevo chip; para el fin de la vida comercial de un procesador dado, las producciones se estabilizan en la escala del 90 por ciento. La mayora de los fabricantes de chips guardan sus cifras de produccin con gran secreto, porque el conocimiento de problemas de produccin puede dar a sus competidores cierta ventaja. Una produccin deficiente puede causar problemas tanto en el costo por chip como en los tiempos de entrega a los clientes; si una compaa tiene conocimientos especficos sobre el mejoramiento de las producciones de sus competidores, puede establecer precios o programar la produccin en un punto crtico para abarcar una porcin mayor del mercado. Por ejemplo, AMD tuvo producciones deficientes durante 1997 y 1998, lo cual le cost perder una parte significativa del mercado. En la actualidad, esos problemas estn resueltos y parece ser que ahora es Intel quien batalla para poder cumplir con la demanda. 43

Cuando es terminada una oblea, un aparato especial prueba cada uno de los circuitos de la oblea y marca los defectuosos para separarlos posteriormente. Entonces, los circuitos son cortados con un lser de alta potencia o con una sierra de diamante. Una vez cortados, los circuitos son probados de nuevo, encapsulados y vueltos a probar. El proceso de encapsulamiento es conocido tambin como bonding (insercin de conexiones), debido a que el circuito integrado es colocado en una cpsula donde una mquina especial conecta finos alambres de oro entre el circuito integrado y los pines del chip. La cpsula es el recipiente para el circuito integrado y es el que lo asla del ambiente. Una vez interconectados con sus pines y encapsulados, se efecta una prueba final para determinar el correcto funcionamiento y la velocidad del chip armado. A menudo, los chips de un mismo lote corren a una velocidad diferente. En esta fase, unos aparatos especiales hacen funcionar a cada chip a diferentes presiones, temperaturas y velocidades, buscando un punto en el que el chip se detenga. En este punto, se anota la mxima velocidad funcional y los chips finalistas son puestos en depsitos, junto con los que presentaron una velocidad similar. Por ejemplo, los Pentium III 750, 866 y 1,000 son exactamente los mismos chips fabricados con el mismo circuito impreso, slo que al final del proceso de manufactura se clasificaron en diferentes niveles de acuerdo a su velocidad. Algo interesante al respecto es que, a medida que un fabricante acumula experiencia y perfecciona una lnea de ensamblaje para un chip en particular, incrementa significativamente la produccin de versiones ms veloces. Esto implica que, de una oblea de 150 chips, quiz ms de 100 de ellos terminan funcionando a 1,000 MHz, y slo algunos no alcanzan esa velocidad. La paradoja es que como generalmente Intel vende mucho ms chips a 933 y 866 MHz, por su precio comparativamente ms bajo, para cumplir con la demanda recurre al depsito de los chips de 1,000 MHz y los marca como de 933 y 866 MHz. La gente descubri que muchos de los chips corren a velocidades mucho mayores a las marcadas... y naci el negocio del aumento de la velocidad del reloj (es decir, operar un procesador a una velocidad mayor a la estipulada). En muchos casos, la gente logra sobreprocesar sin problemas porque, en realidad, tienen un procesador de mayor velocidad. Esto provoc el surgimiento de un problema interesante: algunos fabricantes sin escrpulos comenzaron a usar chips ms lentos y los remarcaron con velocidades ms altas para venderlos como versiones ms veloces y costosas. A menudo, el precio entre diferentes velocidades del mismo chip puede ser sustancial, en trminos de cientos de dlares, de manera que cambiar unos cuantos nmeros en la impresin de los chips puede producir ganancias enormes. Dado que la mayora de los procesadores Intel y AMD son producidos con un generoso margen de seguridad, gracias al cual funcionan bien ms all de la velocidad estipulada, la mayora de los chips fraudulentamente marcados operan sin problemas. Por supuesto, en muchos casos no lo hacen y el sistema se cae o se bloquea de cuando en cuando. Al principio, todo consista en borrar los nmeros originales y remarcar el chip con nmeros de aspecto genuino, pero estos procesadores eran fcilmente detectables. Los remarcadores recurrieron entonces a fabricar recipientes nuevos, especialmente en los casos de los procesadores de Ranura 1 y Ranura A de Intel y AMD, los cuales se encuentran dentro de un cartucho plstico. Aunque esta maniobra puede parecer poco prctica, las ganancias pueden ser bastante grandes. Este tipo de falsificacin es llevada a cabo por el crimen organizado y no se trata slo de una maniobra de un adolescente que trabaja en el stano de su casa con una lija y un sello de goma.

44

Intel y AMD han llevado a cabo acciones para detener estas maniobras en alguna medida. Para ello han integrado una proteccin contra el aumento de la velocidad del reloj en forma de un candado de multiplicador en la mayora de sus chips ms recientes. La proteccin se lleva a cabo durante el proceso de fabricacin del cartucho o el encapsulamiento, en el cual los chips son alterados intencionalmente de manera que no corran a velocidades mayores que las estipuladas. Por lo regular, esto involucra la modificacin de los pines de frecuencia de bus (BF) del chip, lo cual controla los multiplicadores internos que el procesador emplea. Aun as, algunos emprendedores han encontrado formas de hacer funcionar sus tarjetas madre a velocidades de bus superiores a la normal, de forma que aunque el chip no acepta un multiplicador ms alto, el usuario an puede correrlo a una velocidad mayor de aquella para la que fue marcado. En la actualidad, todos los Pentium II y III tienen un candado de multiplicador, lo cual significa que el multiplicador no puede ser controlado ya por la tarjeta madre, y que el aumento de la velocidad del reloj puede lograrse slo a travs de hacerla funcionar a una velocidad de bus mayor a aquella para la que el procesador fue diseado. Muchas nuevas tarjetas madre tienen configuracin de BIOS o jumpers que pueden ser usadas para aumentar la velocidad de bus de la tarjeta madre unos cuantos MHz arriba de lo normal, la cual es multiplicada internamente por el procesador para lograr velocidades todava mayores. Si cuenta con un equipo con el que pueda jugar, ser interesante hacerlo. El problema real de la proteccin contra el aumento de la velocidad del reloj, como la implement Intel y AMD, es que el falsificador profesional es capaz de saltrsela, insertando circuitera diseada a la medida dentro del cartucho plstico del procesador. Esto es particularmente cierto para los procesadores de ranura, dado que hacen uso de una cubierta ideal para esconder esta circuitera. Es bastante ms difcil falsificar un procesador de socket. Para evitar caer en la trampa, verifique los nmeros de especificacin y de serie con Intel y AMD antes de comprar el procesador. Tambin tenga cuidado de donde adquiere su hardware. Comprar en sitios Web de subastas puede representar un peligro ya que es ms fcil engaar al consumidor. Tambin son muy riesgosas las ferias de computacin itinerantes. Los procesadores no son los nicos componentes expuestos a la falsificacin; he visto memoria fraudulenta (SIMMs/DIMMs), ratones, tarjetas de video, memoria cach, sistemas operativos, aplicaciones e incluso, tarjetas madre falsificadas o piratas. El hardware pirata normalmente funciona, pero es de una calidad menor a la pagada. Por ejemplo, una de las piezas de hardware ms falsificadas es el ratn Microsoft. Ellos lo venden, en mayoreo, a 35 dlares, y an as es posible comprar uno producido por fabricantes extranjeros por 2.32. No cost mucho trabajo darse cuenta de que si fabrican un ratn de 2 dlares que se parece a uno Microsoft de 35, podran venderlo por 20 y la gente an creera obtener una ganga, mientras los falsificadores se quedan con una jugosa ganancia.

Encapsulamiento de procesadores PGA


El encapsulamiento PGA ha sido el tipo ms comn usado hasta ahora. Se comenz a emplear a partir del 286, en los ochenta, y se usa todava en procesadores Pentium y Pentium Pro. Se le asign el nombre de PGA (Arreglo de Malla de Pines) debido a que el chip tiene una rejilla o malla de 45

pines ubicada en la parte inferior del procesador. Los procesadores PGA son insertados en sockets, los cuales frecuentemente son del tipo ZIF (Cero Fuerza de Insercin). Los sockets ZIF presentan una palanca para permitir una instalacin y una extraccin ms sencillas. La mayora de los procesadores Pentium usan una variacin de PGA llamada SPGA (Arreglo de Malla de Pines Escalonado), donde los pines estn escalonados, en lugar de alinearse convencionalmente, en la parte inferior del chip. Esta disposicin tiene como fin concentrar los pines en una superficie menor para reducir el tamao del procesador. La figura 3.5 muestra un Pentium Pro que usa el patrn dual SPGA (a la derecha), junto con un Pentium 66 con PGA. Observe que la mitad superior del Pentium Pro (circuito de la derecha), tiene pines adicionales insertados entre las columnas y filas formadas por el resto de los pines.

Figura 3.5 PGA en el Pentium 66 (izquierda) y SPGA con patrn doble en el Pentium Pro (derecha)

CONCLUSIONES
Tras haber examinado desde una pequa historia hasta cada velocidad de diferentes fabricantes de procesadores, se puede entender que no se puede solo hacer referencia de cual marca o variante es mejor, sino hasta no analizar el uso que se vaya a dar, lo ms importante siempre es saber que necesitamos y para estar seguros de que lo tenemos, basta con estar conformes de que el sistema que utilizamos nos satisface en todo sentido respecto a hardware sin olvidar que el software juego un papel decisivo en el uso de un ordenador.

46

BIBLIOGRAFIA
Mueller, Scout. Reparacin y Mantenimiento de PC's. 2002. QUE Corporations. www.intel.com www.adm.com www.via-tech.com

47

También podría gustarte