Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Mapa Conceptual Unidad 04-Jocelyn Cuevas Velázquez
Mapa Conceptual Unidad 04-Jocelyn Cuevas Velázquez
Búsqueda de instrucciones En los procesadores no segmentados Es una técnica que nos permite el En un procesador SEGMENTADO cuando
las instrucciones se ejecutan paralelismo de instrucciones en un una instrucción termina por una etapa,
secuencialmente único proceso o un proceso mas corto esa etapa la ocupa la siguiente instrucción
Decodificación
Se producen cuando dos Hay situaciones en las que la siguiente Se producen al no conocerse la dirección
instrucciones tratan de instruccion de un segmento no se puede de bifurcación al ejecutar una instrucción
utilizar el mismo recurso ejecutar en el siguiente ciclo de reloj por que cambia el CP hasta que no la calcula
en el mismo ciclo que se puede presenter alguno de estos la propia instrucción
riesgos
No pueden ejecutarse al mismo Conflictos por uso de recursos del Mientras, se están ejecutando
tiempo por que hambas tienen procesador por varias instrucciones. otras instrucciones en paralelo
que acceder a datos de la
memoria. Varias etapas intentan usar a la Si hay que saltar, no sirven
vez un elemento de la ruta de datos.
Para solucionar este riesgo
es necesario atascar la Soluciones
instrucción 4 hasta seg 7 en Ej: La UAL no puede hacer 2 sumas a
el ciclo de reloj. la vez si no tiene 2 sumadores.
Atascamiento Predicción
Salto retardado
Es cuando la instrucción planificada no Se intenta predecir qué instrucción
puede ejecutarse en el ciclo de reloj se ejecutará según la historia anterior.
El hueco se rellena con instrucciones previsto porque la instrucción que fue
anteriores a la de salto. recuperada no es la que se necesita; es
Siempre se predice que el salto
decir, el flujo de direcciones de instrucción
no se realiza
Los saltos NO deben depender de no es el esperado por el procesador.
las instrucciones replanificadas Si la prediccion es incorreta, entonces
Se asume que se puede calcular la
se realiza el atascamiento
El hueco se rellena con instrucciones direccion de salto y actualizer el PC
a partir de la dirección de salto en elestado ID.
Consiste en llevar los datos a los registros Una forma específica de riesgo de dato, en la cual, Es posible insertar una o más paradas
de entrada de la UAL antes o al tiempo que el dato que es cargado por la instrucción load es en el pipeline que retardan la ejecución
se llevan al destino. requerido por la siguiente instrucción y aún no se de la instrucción actual hasta que el
ha hecho disponible. dato requerido sea escrito en el archivo
Hay una realimentación en la UAL de registros
Es necesario atascar una etapa
si hay un riesgo de dato load-use
El Hardware detecta que el resultado de
la operación anterior va a ser fuente de
la actual.
Proceso Variable Es posible definirlo como la ejecución Cualquiera puede iniciar y terminar
de diversas actividades simultáneamente en el momento que sea, y el resultado
en varios procesadores. de uno no afecta al otro.
Varios procesos componen Puede darse a nivel de variables
una tarea. Son bloques con ya que varias instrucciones pueden
funcionalidad definida. ser ejecutadas en paralelo siendo Existen cinco categorías de paralelismo
el punto en conflicto las variables con diferentes grados de granularidad.
en común.
Rutas de datos
Es
La forma de referenciar un archivo informático
o directorio en un sistema de archivos de un
Memoria de datos (RAM externa) sistema operativo determinado, una ruta señala
la localización exacta de un archivo o directorio
Es mediante una cadena de caracteres concreta CPU
Una memoria de acceso aleatorio, de Es
lectura y escritura, que se encuentra La que ejecuta una secuencia de instrucciones
fuera del chip. y procesa los datos de las mismas, estas
secuencias de instrucciones son las que realizan
los programas que tienes instalados en el ordenador.
Alumna: Jocelyn Cuevas Velázquez
Son
Se refiere al paralelismo en un programa El acceso secuencial significa que un grupo de
Circuitos combinacionales con varias entradas
secuencial constituido por instrucciones elementos es accedido en un predeterminado
y una única salida de datos. Están dotados de
de máquina. Intenta tener ocupadas con orden secuencial (un registro a la vez).
entradas de control capaces de seleccionar una,
instrucciones todas las partes del procesador.
y solo una, de las entradas de datos para permitir
su transmisión desde la entrada seleccionada
hacia dicha salida.
Pipeline
Es
Una cadena de procesos conectados de forma tal Paralelismo
que la salida de cada elemento de la cadena es la Es
entrada del próximo que permite la comunicación Una función que realiza el procesador para
y sincronización entre procesos y es común en el ejecutar varias tareas al mismo tiempo, es
uso de búfer de datos entre elementos consecutivos. decir, puede realizar varios cálculos
simultáneamente, basado en el principio de
dividir los problemas grandes para obtener
varios problemas pequeños, que son
posteriormente solucionados en paralelo
Alumna: Jocelyn Cuevas Velázquez
Es
Reduce la dificultad de crear Un modelo de arquitectura Se dificulta el paralelismo. Esto obliga
Permite reducir el costo a subsanar lo anterior mencionado con
compiladores total del sistema de computadora
microprocesadores que implementen
un sistema que convierte instrucciones
Tienen un conjunto de instrucciones que
Reduce los costos de Mejora la compactación complejas en varias instrucciones simples
se caracteriza por ser muy amplio y permitir
creación de software de código
operaciones complejas entre operandos
situados en la memoria o en los registros No llega a ser tan eficiente Utiliza más recursos
internos, como la arquitectura RISC que RISC
Facilita la depuración de errores.
IBM creó una serie de ordenadores en Inclusión de instrucciones La complejidad del conjunto que
torno a un conjunto de normas llamado que raramente se usan contiene las instrucciones es
System/360 . Esta fue la primera creciente
máquina CISC
RISC tiene una unidad de CISC tiene una unidad de RISC no requiere memoria CISC requiere memoria La expansión de código puede ser
programación cableada microprogramación. externa para los cálculos externa para los cálculos un problema en RISC mientras que,
en CISC, la expansión de código no
El tiempo de ejecución es El tiempo de ejecución es un problema
Estancamiento menor en RISC es muy alto en CISC.
El espacio se optimiza en
El estancamiento RISC se Los procesadores CISC a RISC mientras que en CISC
reduce principalmente en menudo se estancan se desperdicia espacio
los procesadores
Alumna: Jocelyn Cuevas Velázquez
Cada instrucción se ejecuta PROBLEMA: El tiempo de ciclo de *SUMA *RESTA *AND *OR *Comparación
en un ciclo de reloj ejecución de instrucción se debe de igualdad mediante resta
adaptar al de la instruc. más larga
Interconexión de la
2 salidas de datos de 32 Banco de registros Componentes de la ruta de datos ruta de datos
bits (b A us y b B us B)
Los 32 registros conforman un Será direccionable por bytes, pero
banco de registros. Dado que Memoria capaz de aceptar/ofrecer 4 bytes La ejecución secuencial de
1 entradas de datos de
las instrucciones de tipo R por acceso programas implica actualizar
32 bits (busW)
requieren acceso simultáneo a Estará dividida en dos para poder el contador de programa
3 entradas de 5 bits para la 3 registros hacer dos accesos a memoria en 1 entrada de dirección
identificación de los registros el mismo ciclo
PC PC + 4
(RA, RB y RW) 1 salida de datos de 32 bits.
Memoria de instrucciones
1 reloj que sólo actúa durante las 1 entrada de datos de 32 bits
operaciones de escritura, las de Memoria de datos (sólo en la de datos)
lectura son combinacionales
Tarea del controlador Señal intermedia ALU Del mismo modo para controlar qué
Todas las operaciones aritméticas
comparten el mismo código de dirección debe cargar el PC se utilizará
Seleccionar las operaciones a realizar operación y durante su ejecución 00 en operaciones con una señal Del mismo modo para controlar
por los módulos multifunción (ALU, etc.) acceso a memoria qué dirección debe cargar el PC se utilizará
una señal intermedia Branch
Un control principal para decodificar
Controlar el flujo de datos, activando la entrada 01 en operaciones de salto
el campo de código de operación (op)
de selección de los multiplexores y la señal de
y configurar globalmente la ruta de datos
carga de los registros. 10 en operaciones aritméticas
Un control local a la ALU que decodifique
el campo de operación aritmética (funct) y
seleccione la operación que debe realizar}.
Alumna: Jocelyn Cuevas Velázquez
Dividir la ejecución de la instrucción Cada instrucción usará el El reloj debe tener igual periodo
en varios ciclos más pequeños número de ciclos que que la instrucción más lenta
necesite
Con un periodo fijo las instrucciones
Un mismo elemento hardware puede ser rápidas desaprovechan tiempo
utilizado varias veces en la ejecución de
una instrucción si se hace en ciclos diferentes
En repertorios reales existen coexisten
instrucciones cortas con otras muy
largas: aritmética en punto flotante, modos
de direccionamiento complejos, etc
Ciclo de reloj Tipos de instrucción en una CPU Instrucciones Registros Tipos de registros
Es Es
Un pulso electrónico único de un CPU. Aritmeticas Se encuentran dentro de cada Registros de datos
La unidad mínima de un programa, la microprocesador y su función
Durante cada ciclo, una CPU puede Logicas Registros de direcciones
cual le indica a la CPU que ha de hacer es almacenar los valores de datos,
realizar una operación básica, cómo Manipulacion de bits Registros de estado
a través de una serie de instrucciones comandos, instrucciones o estados
obtener una instrucción, acceder a la Movimiento de datos Registros de proposito general
que se ejecutan de manera secuencial binarios que ordenan qué dato debe
memoria o escribir datos. Control de programa Registros de propósito específico
Salto procesarse, como la forma en la que Registros de datos de memoria
se debe hacer.
Es una especificación que detalla las Se refiere a los materiales y técnicas Es uno de los componentes más La comunicación de un microprocesador
instrucciones que una CPU de un utilizadas en la fabricación del importantes a la hora de determinar con el exterior, es decir, con la memoria
ordenador puede entender y ejecutar circuito integrado el rendimiento de un PC. principal y con las unidades de control
de los periféricos
Conjunto de todos los comandos Dependiendo de cómo el procesador
implementados por un diseño almacena los operandos de las Se realiza mediante señales de información
particular de una CPU. instrucciones de la CPU y señales de control que son enviadas a
través del patillaje del microprocesador
Tipos
Se utiliza en varios sistemas, como la Ordenadores de sobremesa y portátiles Estaciones de trabajo, servidores y supercomputadoras
mayoría de los sistemas basados en
Android, el iPhone y iPad de Apple, La arquitectura PowerPC de IBM se utilizó en las
Microsoft Windows Phone, dispositivos SPARC , de Oracle y Fujitsu
computadoras Macintosh de Apple desde 1994,
RIM, Nintendo Game Boy Advance, DS, cuando comenzaron un cambio de los procesadores
3DS y Switch, Raspberry Pi, etc. de la familia Motorola 68000 , cuando hicieron la IBM POWER arquitectura del conjunto de instrucciones,
transición a los procesadores Intel x86. PowerPC, y la ISA de energía fueron y son utilizados en
El PowerPC de IBM se utilizó en las consolas muchos de los superordenadores de IBM, servidores de
de juegos GameCube, Wii, PlayStation 3, Xbox Apple usa procesadores Apple Silicon de diseño gama media y estaciones de trabajo.
360 y Wii U. propio basados en la arquitectura ARM para su
línea de computadoras de escritorio y portátiles
desde su transición de los procesadores Intel
Alumna: Jocelyn Cuevas Velázquez
El procesador envía entonces el comando solicitado a El nanoprocesador ejecuta cada El acercamiento de CISC procura reducir al mínimo
una unidad que lo descodifica en instrucciones más una de las instrucciones del comando. el número de instrucciones por programa, sacrificando
pequeñas que podrán ser ejecutadas por un el número de ciclos por la instrucción
nanoprocesador
El desplazamiento por esta circuitería también
El RISC hace lo opuesto, reduciendo los
Y al no ser las instrucciones independientes, ralentiza el proceso. Para realizar una sola
ciclos por la instrucción en el coste del
pues son instrucciones menores procedentes instrucción un chip CISC requiere de cuatro a
número de instrucciones por programa
de la descodificación de una instrucción mayo diez ciclos de reloj
Ventajas
Características de la arquitectura
Desventajas
Aunque los procesadores CISC tienen
Las instrucciones que necesitan operandos
instrucciones que sólo utilizan registros
de registros pueden tener sólo dos bytes de *El usuario debe de encontrar un nivel óptimo en cuanto a calidad – precio
de procesador, la disponibilidad de otros
longitud, pero las instrucciones que necesitan *Se dificulta el paralelismo.
modos de operaciones tiende a simplificar
direcciones de memoria pueden necesitar cinco *No llega a ser tan eficiente como la arquitectura RISC
la compilación de lenguajes de alto nivel.
bytes para incluir todo el código de la instrucción *Utiliza más recursos que RISC.
*Inclusión de instrucciones que raramente se usan
*La complejidad del conjunto que contiene las instrucciones es creciente
Alumna: Jocelyn Cuevas Velázquez
Ejemplos Diagramas
Motorola 68000, 68010, Intel 8086, 8088, Una instrucción de máquina o instrucción-máquina
68020, 68030, 6840. 80286, 80386, 80486 es una operación elemental que un programa puede
solicitar a un procesador para que la ejecute
PC
Data Path
También llamado Puntero de instrucciones,
parte de la unidad central de proceso en
Una ruta de datos es una colección de unidades
algunas computadoras
funcionales como unidades lógicas aritméticas o
multiplicadores que realizan operaciones de CISC
Es
procesamiento de datos, registros y buses.
Un registro del procesador de un computador Fue popular en la década de 1970, dado
que indica la posición donde está el procesador que la memoria del programa (PM) era
Requiere una estructura de tres buses en su secuencia de instrucciones
internos un poco más complicada. lenta, los diseñadores intentaron mejorar
el rendimiento construyendo instrucciones
complejas
Muchas CPU relativamente simples tienen Data memory
un archivo de registro de 2 lecturas y 1
escritura conectado a las 2 entradas y 1 Cada instrucción compleja toma
La memoria de datos almacena varios ciclos de reloj, y las palabras
salida de la ALU
resultados y operandos de ALU de control de Datapath para cada
ciclo de reloj se almacenan en una
memoria de microprograma mucho
Program Memory
más rápida
Para crear una arquitectura de computación *Los clusters Representa la capacidad de procesar La base de los avances científicos,
de alto rendimiento, los servidores de *La computación paralela datos y realizar cálculos complejos a industriales y sociales.
computación se conectan en un clúster. *Los supercomputadores velocidades muy altas.
Ayudan
APLICACIONES
MEDIOS Y ENTRETENIMIENTO
2 SUM (R3,R4,R5)
Alumna: Jocelyn Cuevas Velázquez
VLIW EPIC
CARACTERÍSTICAS
Permitiría escalar el rendimiento más rápidamente
Aumentar la capacidad de los microprocesadores
*Cada grupo de instrucciones de software en los futuros diseños de procesadores, sin tener
para ejecutar instrucciones de software en paralelo.
múltiples recibe el nombre de paquete que recurrir a frecuencias de reloj cada vez más altas
La próxima generación de sistemas HPC sube Cuentan con una arquitectura equilibrada y optimizada
En el pasado, los sistemas de HPC se limitaban para muchos tipos de cargas de trabajo y niveles de
el listón del rendimiento de la informática y la
a la capacidad que la infraestructura de las rendimiento, todos con la arquitectura Intel abierta.
memoria, y se apoya en la nube para ofrecer
instalaciones les podía ofrecer.
un nuevo nivel de flexibilidad
Para validar los requisitos de rendimiento, garantiza Con esta tecnología se puede incrementar la velocidad de
que el sistema de clúster de la HPC esté intacto y La memoria, responsable del almacenamiento
implementación de sistemas complejos y ayudar a determinar de datos a corto plazo del sistema, puede ser
configurado para que ejecute aplicaciones en paralelo configuraciones óptimas modelando interacciones simuladas
con una portabilidad increíble para moverse entre los un factor limitante para el rendimiento de tu f
de hardware y software. lujo de trabajo.
sistemas en las instalaciones y en la nube de la HPC.