| Artículos | 01 JUN 2001

La CPU (y III): Pentium III y Pentium 4

Tags: Histórico
Conozca a fondo los procesadores Pentium III y Pentium 4
Felix Torán.
Este artículo culmina la trilogía dedicada a la CPU, presentando la arquitectura interna de los procesadores Pentium III y Pentium 4. Esto permitirá apreciar cómo se llevan a la práctica los conceptos y técnicas estudiados en anteriores entregas.

Tras haber estudiado con detalle la estructura de una CPU sencilla y una técnica de gran importancia (el pipelining), disponemos de los ingredientes fundamentales para comprender el funcionamiento de cualquier CPU moderna. No obstante, la arquitectura de los procesadores actuales es mucho más compleja que la que hemos presentado. Por ello, es conveniente mostrar algunos ejemplos reales para tener una idea clara de cómo se llevan a la práctica los conceptos abordados hasta la fecha. Este artículo se centra en dos procesadores de la firma Intel: Pentium III y Pentium 4. Su conocimiento no sólo refuerza al máximo el aprendizaje de la CPU, sino que proporciona información técnica valiosa acerca de dos procesadores muy actuales y presentes en la mayoría de PC de todo el mundo. En todo momento apreciará cómo, a pesar de tratarse de sistemas complejos, los ingredientes presentados en las anteriores entregas se hallan siempre presentes en el diseño y funcionamiento de estas CPU.

El procesador Pentium III
Antes de abordar el procesador Intel Pentium 4 es conveniente tener una idea de la estructura del procesador Pentium III, perteneciente a la generación inmediatamente anterior. Como se apreciará más adelante, el procesador Pentium 4 contiene un esqueleto similar al del Pentium III, aportando una serie de novedades que -en principio- contribuyen a una mejora del rendimiento.
La Figura 1 resume la estructura interna del procesador Pentium III en forma de diagrama de bloques. Se pueden apreciar algunas etapas comentadas en las anteriores entregas de esta serie. En concreto -y hablando a alto nivel- se distinguen grupos de bloques que se corresponden con las 4 etapas más básicas de una pipeline (búsqueda de instrucción, decodificación, ejecución y almacenamiento de resultados).
En primer lugar, se aprecia una etapa de búsqueda de instrucciones y una unidad de decodificación (que en realidad son tres, trabajando en paralelo).
Bajo la etapa denominada “estación de reserva” se alojan varias unidades de ejecución especializadas. Algunas de ellas se dedican a las operaciones con enteros, y otras a las operaciones en coma flotante, operaciones con direcciones de memoria, etc. También se distinguen unidades dedicadas a operaciones complejas, como la multiplicación y la división, y a otros grupos de instrucciones (como las extensiones multimedia MMX). Llama la atención una unidad de procesamiento dedicada al grupo de instrucciones SSE (Streaming SIMD Extension). Estas instrucciones son de tipo SIMD (Single Instruction Multiple Data), lo que significa que permiten ejecutar una misma instrucción sobre un conjunto de datos, lo cual proporciona muchas ventajas en aplicaciones científicas, multimedia, de ingeniería, etc. Por supuesto, en esta etapa destacan las ALU (introducidas en anteriores entregas). En el caso de las operaciones con direcciones de memoria, el elemento destacado recibe el nombre de AGU (Address Generation Unit, unidad de generación de direcciones).
Finalmente, en la parte inferior del esquema aparecen los bloques dedicados al almacenamiento de resultados. Nótese la presencia de conexiones que conducen los resultados de nuevo hacia las unidades de procesamiento, lo que recuerda totalmente la estructura básica de una CPU, tal y como la presentamos en la segunda entrega de la serie.
Por supuesto, no pueden faltar elementos ya conocidos, como las unidades de predicción de saltos, las memorias caché, los registros y la unidad de interfaz con el bus.
En cuanto a la memoria caché, se debe notar que está dividida en dos bloques. En primer lugar, aparece la caché denominada “de nivel 1” o “L1”. Ésta presenta un reducido tamaño y el acceso es rápido, siendo la primera que se consulta. Si la información no se encuentra allí, se recurre a la caché “de nivel 2” o “L2”, que presenta un tamaño mayor. El acceso es más lento, pero sigue siendo mucho más rápido que acceder a la memoria principal. El procesador Pentium III presenta 2 cachés de tipo L1 (una dedicada a datos y otra a instrucciones) de 16 kB, y una memoria caché de tipo L2 de 256 kB, donde se comparten instrucciones y datos. Se puede apreciar claramente la conexión existente entre las memorias caché L1 y caché L2, lo que permite el funcionamiento en dos niveles.
Otro elemento interesante es el secuenciador de micro-instrucciones, acompañado de una memoria de sólo lectura (ROM). Como ya comentamos, conviene desglosar las instrucciones más complejas en una secuencia de instrucciones que trabajan a nivel interno (denominadas micro-operaciones). Tan sumamente bajo es su nivel de operación, que los bits que conforman estas instrucciones operan directamente sobre elementos internos de la CPU. Cada secuencia de micro-instrucciones compone lo que se denomina un micro-programa. En la memoria ROM se almacenan los micro-programas relacionados con algunas instrucciones de alto nivel de complejidad.
No es el objetivo de este artículo convertir al lector en un experto en las interioridades de cada bloque interno a la CPU. En cambio, hemos ofrecido una visión general que permite observar cómo incorpora un procesador moderno y potente los elementos y técnicas presentados en las anteriores entregas. Los próximos apartados muestran una visión similar sobre el último procesador creado por Intel: el Pentium 4.

Introducción al Pentium 4
El nuevo procesador Pentium 4 aparece cubierto por un nuevo concepto: la micro-arquitectura NetBurst de Intel. Dicha arquitectura, según afirma el fabricante, proporciona una considerable ganancia en rendimiento en multitud de áreas de aplicación.
Dicho procesador fue introducido en noviembre de 2000 con una velocidad de reloj de 1,5 GHz. Según asegura Intel, la arquitectura NetBurst aporta un gran incremento de rendimiento en aplicaciones como la transmisión de audio y vídeo a través de Internet, procesamiento de imágenes, reconocimiento de voz, videoconferencia, etc.
El procesador se compone de 42 millones de transistores, con 6 niveles de interconexiones de aluminio. El tamaño del chip es de 217 mm2 y consume 55 vatios de potencia a 1,5 GHz. El bus de sistema permite trabajar a la llamativa velocidad de 3,2 GB/s (gracias al empleo de un tipo especial de memoria -particularmente cara- denominada RDRAM). Esto proporciona un claro beneficio en el rendimiento del procesador.
Otra característica interesante es la adición de 144 nuevas instrucciones de 128 bits, englobadas bajo el acrónimo SSE2 (Streaming SIMD Extension 2), que constituyen una evolución de las instrucciones SSE presentes en el Pentium III. Según afirma Intel, estas instrucciones mejoran el rendimiento en aplicaciones multimedia, científicas y de ingeniería.
Es un buen momento para indicar un detalle importante: es sencillo encontrar multitud de documentos técnicos en Internet que demuestran que el rendimiento del procesador Pentium 4 no es tan espectacular como afirma el fabricante, en multitud de áreas de aplicación. Este artículo no persigue realizar una valoración del rendimiento del Pentium 4 ni tampoco una comparativa con otros procesadores que parecen ofrecer mejores resultados. Tan sólo pre

Contenidos recomendados...

Comentar
Para comentar, es necesario iniciar sesión
Se muestran 0 comentarios
X

Uso de cookies

Esta web utiliza cookies técnicas, de personalización y análisis, propias y de terceros, para facilitarle la navegación de forma anónima y analizar estadísticas del uso de la web. Consideramos que si continúa navegando, acepta su uso. Obtener más información