SlideShare a Scribd company logo
1 of 26
IBM CELL  PROCESSOR Autores: 	Miguel Ángel Botija Ortega. 	Víctor Téllez Motilla. 	Iván Durango Blanco
Índice: Contexto histórico y evolución. Características generales. Arquitectura. Organización interna y flujo de datos. Soporte E/S. Pipeline: Etapas y características. Comparativa y rendimiento. Posibles usos.
Contexto histórico y evolución. Tras la unión de Sony, Toshiba e IBM (STI) en el año 2000, se comienza a pensar la base del procesador Cell. En el 2005 Sony incluye una unidad de propósito general, Power procces element ( PPE ) en el núcleo, junto con 8 unidades de propósito vectorial  Synergistic Processing Unit ( SPU ). Marzo de 2007, sale al mercado la versión de 65 nm. Febrero de 2008, se anuncia otra nueva versión de 45 nm. Posteriormente en Marzo de 2008,  surge una mejora en el rendimiento, PowerXCell 8i que introduce cálculo de PF doble precisión.
Características generales. Procesadores Multinúcleo con 8 SPUs ( Basadas en RISC con organización SIMD y almacenamiento local ). 1 PPE de 64 bits capaz de manejar 2 hilos de ejecución. Máxima frecuencia por encima 4GHz (Optimo). Memoria en el chip: 2,5MB (512 KB L2 y 8 * 256KB). 234 millones de transistores. Tamaño de la oblea de 221 mm² Gestión automática de energía. DMA para sostenimiento del ancho de banda.
Características generales.
Arquitectura. Esquema general de Cell.
Arquitectura. Power Processor Element ( PPE ) ,[object Object],doble núcleo. ,[object Object]
Contiene una PowerProcessingUnit ( PPU) y su propio sistema de almacenamiento (PPSS)
La PPU es la encargada de ejecutar el SO, puesto que, como la mayoría de procesadores modernos, soporta memoria virtual.
RISC, capaz de ejecutar dos instrucciones a la vez.
Unidad predictora de saltos, Branch processor unit (BPU).
Carece por completo de ejecución fuera de orden.,[object Object]
Arquitectura. Synergistic Processors Elements SPE (8) ,[object Object],rendimiento de cómputointensivo. ,[object Object]
 Tiene128 Registros de 128 bits cada uno(Permiten SIMD)
256   Kbytes de memoria local LS.
Arquitectura RISC superescalar.
Acceden a la memoria principal a través de DMA asíncrono.
 No disponen de caché, ni de instrucciones ni de datos,[object Object]
Organización interna y flujo de datos. Los elementos SPE y PPE están conectados al Element Interconnect Bus ( EIB ). Tiene un Anillo de 4 canalesunidireccionales, de 16 bytes cada uno. Todos los elementosconectados a él. (PPE, SPE’s,  I/O) La comunicaión a través de modelo de paso de mensajes (MPI message-parsing interface standar, en el que los procesos se comunican entre sí enviando mensajes). Los elementosconectados al bus pueden leer o escribir 8 bytes por ciclo de reloj.
Organización interna y flujo de datos.
Soporte E/S. Contiene un macro XIO de la empresa Rambus con doble canal de nueva generación, que interconecta con memoria XDR Rambus. El enlace XIO-XDR funciona 3,2 GB/s en cada pin (Dos canales de 32 bits pueden proporcionar un máximo teórico de 25,6 GB/s). El adaptador de sistema, también un diseño Rambus, es conocido como FlexIO. Organizada en 12 buses( Cada bus es un canal de 8 bits punto a punto). Cinco caminos de 8 bits de entrada al Cell. Y los siete restantes de salida
Pipeline: Etapas y características. La PPU es un microprocesador multithreading con dos threads en ejecución. El pipeline de la PPU está formado por 21 etapas ( el mismo número de etapas de la tubería como el Pentium 4 Northwood ). Una característica a destacar es que ejecuta instrucciones en orden.
Pipeline: Etapas y características. Synergistic Processor Element(SPE). Es un procesador de 32 bits y usa 	 instrucciones SIMD.  SPU es un procesador a medio camino entre los procesadores de propósito general y el hardware de propósito específico Tiene su propia memoria local, llamada Local Store (LS). Dispone de dos pipelines ( toman los nombres even o alineadas en posiciones de memoria pares y odd impares ) segmentados para poder ejecutar idealmente dos instrucciones por ciclo. Son de la misma longitud y están diferenciados en dos partes que funcionan independientemente, el front end y el back end.
Pipeline: Etapas y características. Pipeline PPE IC1-IC4: Estas etapas realizan la captación de instrucciones (Fetch), los saltos se predicen después de la etapa IC4. IB1-IB2: Buffer de instrucciones para ir introduciendo instrucciones a la cola de instrucciones. ID1-ID3: estas son las etapas principales para decodificar la instrucción. MC1-MC8: este es el camino descifrar micro código, y es muy lento.  IS: después de haber sido descifrado, las instrucciones de pasar a la unidad de control del PPE, donde son emitidas en el orden al núcleo de ejecución. DLY: Esta etapa sirve únicamente para frenar la velocidad de reloj y esperar a las cargas y almacenamientos. RF1-RF2: Se accede al archivo de registro en Load / Store. EX: La ejecución de la instrucción se lleva a cabo durante estas etapas, el número de ciclos dependerá de la tubería y en la instrucción. WB: Etapa write back.
Pipeline: Etapas y características. Pipeline PPE
Pipeline: Etapas y características. Pipeline SPE Front End El front end comprende las etapas de decode e issue. Recibe las instrucciones de fetch y gestiona los riesgos de datos. Si  existen riesgos de datos, es el front end el que bloquea la ejecución y resuelve (o espera a que se  resuelvan) los problemas mencionados.  Fetch:  Su funciónes gestionar dos buffers de instrucciones y un buffer llamado Predicted path buffer (PPB), tienen una capacidad de 32 instrucciones cada uno, y por lo tanto, de 128 bytes. Las instrucciones en estos buffers tienen PCs consecutivos (Se podría decir que no forma parte de cauce). Decode: Se encarga de decodificar las instrucciones obtenidas de fetch. Su tarea es extraer de la instrucción los datos necesarios para su ejecución.   Issue:  Se encarga de eliminar los riesgos de datos y pasar las instrucciones al back end. Issue es el encargado de bloquear la ejecución del front end si es necesario. Existen los siguientes escenarios problemáticos posibles: Una instrucción en issue quiere leer un registro bloqueado: la respuesta es bloquear el front end hasta que el back end desbloquee el registro causante del conflicto. La instrucción odd pretende leer un dato que escribirá la instrucción even: se pasa la instrucción even al back end y se bloquea el front end hasta que el registro de destino se desbloquee; así, la instrucción odd ya tendrá disponible el registro y podrá pasar a ejecutarse. Al terminar su trabajo la etapa de issue, las instrucciones que han pasado al back end están situadas en el pipeline que les corresponde y no se producirá ningún riesgo de datos.

More Related Content

What's hot

Microprocesadores y estructura
Microprocesadores y estructuraMicroprocesadores y estructura
Microprocesadores y estructurajaimeinformatica
 
Arquitectura del cpu
Arquitectura del cpuArquitectura del cpu
Arquitectura del cpuMedardoPerez
 
Capacidad de la unidad de procesamiento
Capacidad de la unidad de procesamientoCapacidad de la unidad de procesamiento
Capacidad de la unidad de procesamientoRosangelGarca
 
Unidad central de proceso
Unidad central de procesoUnidad central de proceso
Unidad central de procesoYajairaObaco01
 
Capacidad de la unidad de procesamiento
Capacidad de la unidad de procesamientoCapacidad de la unidad de procesamiento
Capacidad de la unidad de procesamientoRosannyGamardo
 
Examen Arquitectura de Computadoras
Examen Arquitectura de ComputadorasExamen Arquitectura de Computadoras
Examen Arquitectura de ComputadorasErika Santos Reyes
 

What's hot (13)

Microprocesadores y estructura
Microprocesadores y estructuraMicroprocesadores y estructura
Microprocesadores y estructura
 
Manual Pics
Manual PicsManual Pics
Manual Pics
 
Apuntes del pic 16f84
Apuntes del pic 16f84Apuntes del pic 16f84
Apuntes del pic 16f84
 
Microprocesador
Microprocesador Microprocesador
Microprocesador
 
Placabase alicia
Placabase aliciaPlacabase alicia
Placabase alicia
 
Placabase miriam
Placabase miriamPlacabase miriam
Placabase miriam
 
Microprocesadores ii
Microprocesadores iiMicroprocesadores ii
Microprocesadores ii
 
Arquitectura del cpu
Arquitectura del cpuArquitectura del cpu
Arquitectura del cpu
 
Capacidad de la unidad de procesamiento
Capacidad de la unidad de procesamientoCapacidad de la unidad de procesamiento
Capacidad de la unidad de procesamiento
 
Unidad central de proceso
Unidad central de procesoUnidad central de proceso
Unidad central de proceso
 
Capacidad de la unidad de procesamiento
Capacidad de la unidad de procesamientoCapacidad de la unidad de procesamiento
Capacidad de la unidad de procesamiento
 
Sistemas operativos ii
Sistemas operativos iiSistemas operativos ii
Sistemas operativos ii
 
Examen Arquitectura de Computadoras
Examen Arquitectura de ComputadorasExamen Arquitectura de Computadoras
Examen Arquitectura de Computadoras
 

Viewers also liked

Eat stop eat advantages compared with a diet
Eat stop eat advantages compared with a dietEat stop eat advantages compared with a diet
Eat stop eat advantages compared with a dietrida habib chorfa
 
NPL - Project work
NPL - Project workNPL - Project work
NPL - Project workMattia Lotti
 
Ivan durango presentacion_serviciodevisualizacionremota
Ivan durango presentacion_serviciodevisualizacionremotaIvan durango presentacion_serviciodevisualizacionremota
Ivan durango presentacion_serviciodevisualizacionremotaivydb
 
Camila . open office
Camila . open officeCamila . open office
Camila . open officeCamivb
 
Información sobre w3c
Información sobre w3cInformación sobre w3c
Información sobre w3crodolfo_palma
 
W3 c consorcio world wide web
W3 c   consorcio world wide webW3 c   consorcio world wide web
W3 c consorcio world wide webRhamyro Alcoser
 
Web 2.0, W3C y Software Social
Web 2.0, W3C y Software SocialWeb 2.0, W3C y Software Social
Web 2.0, W3C y Software SocialJuan Quemada
 
ESTANDARES W3C EN LA WEB
ESTANDARES W3C EN LA WEBESTANDARES W3C EN LA WEB
ESTANDARES W3C EN LA WEBDiana Luna
 
¿Qué es un spat? Materia: Sistemas puesta a tierra.
¿Qué es un spat? Materia: Sistemas puesta a tierra. ¿Qué es un spat? Materia: Sistemas puesta a tierra.
¿Qué es un spat? Materia: Sistemas puesta a tierra. Avelino de Sousa
 
Codigo procedimientos constituionales (proyecto)
Codigo procedimientos constituionales (proyecto)Codigo procedimientos constituionales (proyecto)
Codigo procedimientos constituionales (proyecto)Fernando Barrientos
 

Viewers also liked (20)

Eat stop eat advantages compared with a diet
Eat stop eat advantages compared with a dietEat stop eat advantages compared with a diet
Eat stop eat advantages compared with a diet
 
X windows and parc
X windows and parcX windows and parc
X windows and parc
 
NPL - Project work
NPL - Project workNPL - Project work
NPL - Project work
 
Mit license
Mit licenseMit license
Mit license
 
7s X Window 2
7s X Window 27s X Window 2
7s X Window 2
 
Ivan durango presentacion_serviciodevisualizacionremota
Ivan durango presentacion_serviciodevisualizacionremotaIvan durango presentacion_serviciodevisualizacionremota
Ivan durango presentacion_serviciodevisualizacionremota
 
Estandares W3C
Estandares W3CEstandares W3C
Estandares W3C
 
X men.v3.31.2012
X men.v3.31.2012X men.v3.31.2012
X men.v3.31.2012
 
Camila . open office
Camila . open officeCamila . open office
Camila . open office
 
Información sobre w3c
Información sobre w3cInformación sobre w3c
Información sobre w3c
 
Presentacio mpl
Presentacio mplPresentacio mpl
Presentacio mpl
 
Fundamentos de EFL
Fundamentos de EFLFundamentos de EFL
Fundamentos de EFL
 
W3 c consorcio world wide web
W3 c   consorcio world wide webW3 c   consorcio world wide web
W3 c consorcio world wide web
 
Que es un spat
Que es un spatQue es un spat
Que es un spat
 
Mpl parte 1
Mpl parte 1Mpl parte 1
Mpl parte 1
 
e-Seguridad (e-security)
e-Seguridad (e-security)e-Seguridad (e-security)
e-Seguridad (e-security)
 
Web 2.0, W3C y Software Social
Web 2.0, W3C y Software SocialWeb 2.0, W3C y Software Social
Web 2.0, W3C y Software Social
 
ESTANDARES W3C EN LA WEB
ESTANDARES W3C EN LA WEBESTANDARES W3C EN LA WEB
ESTANDARES W3C EN LA WEB
 
¿Qué es un spat? Materia: Sistemas puesta a tierra.
¿Qué es un spat? Materia: Sistemas puesta a tierra. ¿Qué es un spat? Materia: Sistemas puesta a tierra.
¿Qué es un spat? Materia: Sistemas puesta a tierra.
 
Codigo procedimientos constituionales (proyecto)
Codigo procedimientos constituionales (proyecto)Codigo procedimientos constituionales (proyecto)
Codigo procedimientos constituionales (proyecto)
 

Similar to Arquitectura de computadores: IBM Cell processor

Procesador
ProcesadorProcesador
Procesadoroscar859
 
Guía de arquitectura de computadoras II
Guía de arquitectura de computadoras IIGuía de arquitectura de computadoras II
Guía de arquitectura de computadoras IIMari Cruz
 
Arquitectura de Computadorasv
Arquitectura de ComputadorasvArquitectura de Computadorasv
Arquitectura de ComputadorasvJairo Anton
 
5 microprocesadores 2
5 microprocesadores 25 microprocesadores 2
5 microprocesadores 2conrado perea
 
⭐⭐⭐⭐⭐ DISEÑO DE SISTEMAS DIGITALES, LECCIÓN B RESUELTA 1er PARCIAL (2019 2do ...
⭐⭐⭐⭐⭐ DISEÑO DE SISTEMAS DIGITALES, LECCIÓN B RESUELTA 1er PARCIAL (2019 2do ...⭐⭐⭐⭐⭐ DISEÑO DE SISTEMAS DIGITALES, LECCIÓN B RESUELTA 1er PARCIAL (2019 2do ...
⭐⭐⭐⭐⭐ DISEÑO DE SISTEMAS DIGITALES, LECCIÓN B RESUELTA 1er PARCIAL (2019 2do ...Victor Asanza
 
Mauro fernando churata
Mauro fernando churataMauro fernando churata
Mauro fernando churataMauro Churata
 
Arquitectura de la computadora
Arquitectura de la computadoraArquitectura de la computadora
Arquitectura de la computadoraMauricio Hernandez
 
UNIDAD I - A - ARQUITECTURA BASICA DE LAS COMPUTADORAS-2021-II.pptx
UNIDAD I - A - ARQUITECTURA BASICA DE LAS COMPUTADORAS-2021-II.pptxUNIDAD I - A - ARQUITECTURA BASICA DE LAS COMPUTADORAS-2021-II.pptx
UNIDAD I - A - ARQUITECTURA BASICA DE LAS COMPUTADORAS-2021-II.pptxSamAladoVz1
 
Mauro fernando churata
Mauro fernando churataMauro fernando churata
Mauro fernando churataMauro Churata
 
Miguel angel pastor moreno
Miguel angel pastor morenoMiguel angel pastor moreno
Miguel angel pastor morenoSam Gutierrez M
 
El Procesador o CPU 2
El Procesador o CPU 2El Procesador o CPU 2
El Procesador o CPU 2Jorge Pulido
 
51342904 1
51342904 151342904 1
51342904 1willyfd
 

Similar to Arquitectura de computadores: IBM Cell processor (20)

Grupo 3
Grupo 3Grupo 3
Grupo 3
 
Micropro
MicroproMicropro
Micropro
 
Tics expoo
Tics expooTics expoo
Tics expoo
 
Procesador
ProcesadorProcesador
Procesador
 
Guía de arquitectura de computadoras II
Guía de arquitectura de computadoras IIGuía de arquitectura de computadoras II
Guía de arquitectura de computadoras II
 
Procesadores
Procesadores Procesadores
Procesadores
 
El procesador o microprocesador
El procesador o microprocesadorEl procesador o microprocesador
El procesador o microprocesador
 
Arquitectura de Computadorasv
Arquitectura de ComputadorasvArquitectura de Computadorasv
Arquitectura de Computadorasv
 
Fase1 103380 43
Fase1 103380 43Fase1 103380 43
Fase1 103380 43
 
Unidad de control
Unidad de controlUnidad de control
Unidad de control
 
Microprocesador
MicroprocesadorMicroprocesador
Microprocesador
 
5 microprocesadores 2
5 microprocesadores 25 microprocesadores 2
5 microprocesadores 2
 
⭐⭐⭐⭐⭐ DISEÑO DE SISTEMAS DIGITALES, LECCIÓN B RESUELTA 1er PARCIAL (2019 2do ...
⭐⭐⭐⭐⭐ DISEÑO DE SISTEMAS DIGITALES, LECCIÓN B RESUELTA 1er PARCIAL (2019 2do ...⭐⭐⭐⭐⭐ DISEÑO DE SISTEMAS DIGITALES, LECCIÓN B RESUELTA 1er PARCIAL (2019 2do ...
⭐⭐⭐⭐⭐ DISEÑO DE SISTEMAS DIGITALES, LECCIÓN B RESUELTA 1er PARCIAL (2019 2do ...
 
Mauro fernando churata
Mauro fernando churataMauro fernando churata
Mauro fernando churata
 
Arquitectura de la computadora
Arquitectura de la computadoraArquitectura de la computadora
Arquitectura de la computadora
 
UNIDAD I - A - ARQUITECTURA BASICA DE LAS COMPUTADORAS-2021-II.pptx
UNIDAD I - A - ARQUITECTURA BASICA DE LAS COMPUTADORAS-2021-II.pptxUNIDAD I - A - ARQUITECTURA BASICA DE LAS COMPUTADORAS-2021-II.pptx
UNIDAD I - A - ARQUITECTURA BASICA DE LAS COMPUTADORAS-2021-II.pptx
 
Mauro fernando churata
Mauro fernando churataMauro fernando churata
Mauro fernando churata
 
Miguel angel pastor moreno
Miguel angel pastor morenoMiguel angel pastor moreno
Miguel angel pastor moreno
 
El Procesador o CPU 2
El Procesador o CPU 2El Procesador o CPU 2
El Procesador o CPU 2
 
51342904 1
51342904 151342904 1
51342904 1
 

Recently uploaded

Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...JohnRamos830530
 
Buenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptxBuenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptxFederico Castellari
 
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptxEVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptxJorgeParada26
 
Guia Basica para bachillerato de Circuitos Basicos
Guia Basica para bachillerato de Circuitos BasicosGuia Basica para bachillerato de Circuitos Basicos
Guia Basica para bachillerato de Circuitos BasicosJhonJairoRodriguezCe
 
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxAlan779941
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanamcerpam
 
investigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXIinvestigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXIhmpuellon
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21mariacbr99
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estossgonzalezp1
 
redes informaticas en una oficina administrativa
redes informaticas en una oficina administrativaredes informaticas en una oficina administrativa
redes informaticas en una oficina administrativanicho110
 
How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.FlorenciaCattelani
 

Recently uploaded (11)

Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
 
Buenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptxBuenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptx
 
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptxEVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
 
Guia Basica para bachillerato de Circuitos Basicos
Guia Basica para bachillerato de Circuitos BasicosGuia Basica para bachillerato de Circuitos Basicos
Guia Basica para bachillerato de Circuitos Basicos
 
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvana
 
investigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXIinvestigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXI
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estos
 
redes informaticas en una oficina administrativa
redes informaticas en una oficina administrativaredes informaticas en una oficina administrativa
redes informaticas en una oficina administrativa
 
How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.
 

Arquitectura de computadores: IBM Cell processor

  • 1. IBM CELL PROCESSOR Autores: Miguel Ángel Botija Ortega. Víctor Téllez Motilla. Iván Durango Blanco
  • 2. Índice: Contexto histórico y evolución. Características generales. Arquitectura. Organización interna y flujo de datos. Soporte E/S. Pipeline: Etapas y características. Comparativa y rendimiento. Posibles usos.
  • 3. Contexto histórico y evolución. Tras la unión de Sony, Toshiba e IBM (STI) en el año 2000, se comienza a pensar la base del procesador Cell. En el 2005 Sony incluye una unidad de propósito general, Power procces element ( PPE ) en el núcleo, junto con 8 unidades de propósito vectorial Synergistic Processing Unit ( SPU ). Marzo de 2007, sale al mercado la versión de 65 nm. Febrero de 2008, se anuncia otra nueva versión de 45 nm. Posteriormente en Marzo de 2008, surge una mejora en el rendimiento, PowerXCell 8i que introduce cálculo de PF doble precisión.
  • 4. Características generales. Procesadores Multinúcleo con 8 SPUs ( Basadas en RISC con organización SIMD y almacenamiento local ). 1 PPE de 64 bits capaz de manejar 2 hilos de ejecución. Máxima frecuencia por encima 4GHz (Optimo). Memoria en el chip: 2,5MB (512 KB L2 y 8 * 256KB). 234 millones de transistores. Tamaño de la oblea de 221 mm² Gestión automática de energía. DMA para sostenimiento del ancho de banda.
  • 7.
  • 8. Contiene una PowerProcessingUnit ( PPU) y su propio sistema de almacenamiento (PPSS)
  • 9. La PPU es la encargada de ejecutar el SO, puesto que, como la mayoría de procesadores modernos, soporta memoria virtual.
  • 10. RISC, capaz de ejecutar dos instrucciones a la vez.
  • 11. Unidad predictora de saltos, Branch processor unit (BPU).
  • 12.
  • 13.
  • 14. Tiene128 Registros de 128 bits cada uno(Permiten SIMD)
  • 15. 256 Kbytes de memoria local LS.
  • 17. Acceden a la memoria principal a través de DMA asíncrono.
  • 18.
  • 19. Organización interna y flujo de datos. Los elementos SPE y PPE están conectados al Element Interconnect Bus ( EIB ). Tiene un Anillo de 4 canalesunidireccionales, de 16 bytes cada uno. Todos los elementosconectados a él. (PPE, SPE’s, I/O) La comunicaión a través de modelo de paso de mensajes (MPI message-parsing interface standar, en el que los procesos se comunican entre sí enviando mensajes). Los elementosconectados al bus pueden leer o escribir 8 bytes por ciclo de reloj.
  • 20. Organización interna y flujo de datos.
  • 21. Soporte E/S. Contiene un macro XIO de la empresa Rambus con doble canal de nueva generación, que interconecta con memoria XDR Rambus. El enlace XIO-XDR funciona 3,2 GB/s en cada pin (Dos canales de 32 bits pueden proporcionar un máximo teórico de 25,6 GB/s). El adaptador de sistema, también un diseño Rambus, es conocido como FlexIO. Organizada en 12 buses( Cada bus es un canal de 8 bits punto a punto). Cinco caminos de 8 bits de entrada al Cell. Y los siete restantes de salida
  • 22. Pipeline: Etapas y características. La PPU es un microprocesador multithreading con dos threads en ejecución. El pipeline de la PPU está formado por 21 etapas ( el mismo número de etapas de la tubería como el Pentium 4 Northwood ). Una característica a destacar es que ejecuta instrucciones en orden.
  • 23. Pipeline: Etapas y características. Synergistic Processor Element(SPE). Es un procesador de 32 bits y usa instrucciones SIMD. SPU es un procesador a medio camino entre los procesadores de propósito general y el hardware de propósito específico Tiene su propia memoria local, llamada Local Store (LS). Dispone de dos pipelines ( toman los nombres even o alineadas en posiciones de memoria pares y odd impares ) segmentados para poder ejecutar idealmente dos instrucciones por ciclo. Son de la misma longitud y están diferenciados en dos partes que funcionan independientemente, el front end y el back end.
  • 24. Pipeline: Etapas y características. Pipeline PPE IC1-IC4: Estas etapas realizan la captación de instrucciones (Fetch), los saltos se predicen después de la etapa IC4. IB1-IB2: Buffer de instrucciones para ir introduciendo instrucciones a la cola de instrucciones. ID1-ID3: estas son las etapas principales para decodificar la instrucción. MC1-MC8: este es el camino descifrar micro código, y es muy lento. IS: después de haber sido descifrado, las instrucciones de pasar a la unidad de control del PPE, donde son emitidas en el orden al núcleo de ejecución. DLY: Esta etapa sirve únicamente para frenar la velocidad de reloj y esperar a las cargas y almacenamientos. RF1-RF2: Se accede al archivo de registro en Load / Store. EX: La ejecución de la instrucción se lleva a cabo durante estas etapas, el número de ciclos dependerá de la tubería y en la instrucción. WB: Etapa write back.
  • 25. Pipeline: Etapas y características. Pipeline PPE
  • 26. Pipeline: Etapas y características. Pipeline SPE Front End El front end comprende las etapas de decode e issue. Recibe las instrucciones de fetch y gestiona los riesgos de datos. Si existen riesgos de datos, es el front end el que bloquea la ejecución y resuelve (o espera a que se resuelvan) los problemas mencionados. Fetch: Su funciónes gestionar dos buffers de instrucciones y un buffer llamado Predicted path buffer (PPB), tienen una capacidad de 32 instrucciones cada uno, y por lo tanto, de 128 bytes. Las instrucciones en estos buffers tienen PCs consecutivos (Se podría decir que no forma parte de cauce). Decode: Se encarga de decodificar las instrucciones obtenidas de fetch. Su tarea es extraer de la instrucción los datos necesarios para su ejecución.   Issue: Se encarga de eliminar los riesgos de datos y pasar las instrucciones al back end. Issue es el encargado de bloquear la ejecución del front end si es necesario. Existen los siguientes escenarios problemáticos posibles: Una instrucción en issue quiere leer un registro bloqueado: la respuesta es bloquear el front end hasta que el back end desbloquee el registro causante del conflicto. La instrucción odd pretende leer un dato que escribirá la instrucción even: se pasa la instrucción even al back end y se bloquea el front end hasta que el registro de destino se desbloquee; así, la instrucción odd ya tendrá disponible el registro y podrá pasar a ejecutarse. Al terminar su trabajo la etapa de issue, las instrucciones que han pasado al back end están situadas en el pipeline que les corresponde y no se producirá ningún riesgo de datos.
  • 27. Pipeline: Etapas y características. Back End En el back end se encuentran las unidades funcionales de la SPU, donde se ejecutan las operaciones. El último ciclo de todas las unidades funcionales es siempre de escritura en el banco de registros (excepto en el caso de instrucciones de store o salto, que no escriben en el banco de registros).  Las instrucciones en el back end nunca verán alterado su camino de ejecución ni serán bloqueadas.   Las unidades funcionales en el back end son suficientes para ejecutar siempre las dos instrucciones por ciclo. Cada unidad funcional corresponde al pipeline even u odd. Gracias a esta restricción, nunca tendremos, por ejemplo dos instrucciones FP ejecutándose en el mismo ciclo, y por lo tanto, en esta arquitectura no hay riesgos estructurales.
  • 28. Pipeline: Etapas y características. Pipeline SPE
  • 30. Comparativa Xenon vs Cell Para simplificar la gran diferencia entre ambos procesadores, el cell (PS3) es como un cirujano que está dotado de todos los conocimientos y que tiene a su disposición a 8residentes. Y el Xenon (360) es como 3 médicos generales trabajando al mismo nivel.
  • 31. Comparativa de rendimiento. Comparison of SPE and hardware performance results with 1kx1k matrix.
  • 32. Comparativa de rendimiento. Performance of parallelized matrix multiplication for different sized matrices.
  • 33. Posibles usos Servidor Blade : BladeCenter QS21. Generando unos 1,05 GFLOPS medidos por vatio, con un rendimiento máximo de aproximadamente 460 GFLOPS, es una de las plataformas de computación más eficientes en consumo hasta el día de hoy. Un chasis de BladeCenter puede alcanzar 6,4 TFLOPS y alrededor de 25,8 TFLOPS en un armario 42U estándar. Consolas de videojuegos   Cine en casa Posibilidad de producir televisores de alta definición (HDTV’s) haciendo uso del Cell ). Supercomputación (IBM Roadrunner ). Un híbrido entre procesadores de propósito general CISC y procesadores Cell. Esta combinación producirá el primer computador capaz de operar a la velocidad del pentaflop. Usará una versión actualizada del procesador Cell, fabricada con tecnología de 65 nm y con SPU’s mejoradas que puedan manejar cálculos en doble precisión en los registros de 128 bits, alcanzando los 100 GFLOPS en doble precisión. Computación en clúster  Los clústeres de consolas PlayStation 3 son una atractiva alternativa a los sistemas de gama alta basados en Blades Cell. clústeres de PlayStation 3 de 8 o 32 nodos, con YellowDog Linux preinstalado.
  • 34. PREGUNTAS, DUDAS O INQUIETUDES…