0
A Organização da Unidade Central de Processamento . As unidades físicas . O ciclo da informação(fluxo) . A tecnologia OC_A...
Organização da Unidade de Processamento Central <ul><li>Diagrama funcional </li></ul>Unidade de Controle Barram. de Endere...
Execução de um programa <ul><li>Ciclo de execução de uma instrução </li></ul>Início Busca da Instrução Execução da Instruç...
Paralelismo no Nível das Instruções <ul><li>Conceito </li></ul><ul><li>Arquitetos sempre desafiando para melhorar a perfor...
Paralelismo no Nível das Instruções <ul><li>Conceito </li></ul><ul><li>No nível da instrução  - o paralelismo é explorado ...
Execução em Pipeline <ul><li>Conceito </li></ul><ul><ul><li>cada estágio possui um componente de hardware dedicado exclusi...
Execução em Pipeline <ul><li>Pipeline de 5 estágios </li></ul>Unidade de busca da Instrução Unidade de decodificação da in...
Arquiteturas Superescalares <ul><li>Conceito </li></ul><ul><li>Se um pipeline é bom, com certeza dois serão ainda melhor. ...
Arquiteturas Superescalares <ul><li>Conceito </li></ul><ul><li>O compilador precisa garantir que essas situações não venha...
Arquiteturas Superescalares <ul><li>Processador com dois pipelines </li></ul>Unidade de busca da Instrução Unidade de deco...
Arquiteturas Superescalares <ul><li>Arquitetura Superescalar </li></ul><ul><li>A existência de quatro pipelines, apesar de...
Arquiteturas Superescalares <ul><li>Arquitetura Superescalar </li></ul><ul><li>Se o estágio S3 distribui uma instrução a c...
Arquiteturas Superescalares <ul><li>Processador superescalar com quatro unidades funcionais </li></ul>Unidade de busca da ...
Paralelismo no nível do processador <ul><li>Conceito </li></ul><ul><li>A demanda de computadores mais rápidos parece não t...
Paralelismo no nível do processador <ul><li>Computadores Matriciais </li></ul><ul><li>A maioria dos problemas científicos ...
Paralelismo no nível do processador <ul><li>Processadores Matriciais </li></ul><ul><li>Composto de um grande número de pro...
Paralelismo no nível do processador <ul><li>Computadores Matriciais </li></ul>Unidade de Controle Processador Memória Grad...
Paralelismo no nível do processador <ul><li>Processador Vertical </li></ul><ul><li>Se parece muito com um processador matr...
<ul><li>Computadores Vetoriais </li></ul>Paralelismo no nível do processador Registradores vetorias ULA
Paralelismo no nível do processador <ul><li>Multiprocessadores </li></ul><ul><li>É composto de vários processadores indepe...
Paralelismo no nível do processador <ul><li>Multiprocessadores </li></ul>Proc.1 Proc.2 Proc.3 Proc.4 Memória Compartilhada...
Paralelismo no nível do processador <ul><li>Multicomputadores </li></ul><ul><li>Embora os sistemas Multiprocessadores, com...
Paralelismo no nível do processador <ul><li>Multicomputadores </li></ul>C1 C2 C3 C4 C5
<ul><li>F I M </li></ul>
Upcoming SlideShare
Loading in...5
×

F oc aula_04

342

Published on

Published in: Technology, Business
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
342
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
10
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Transcript of "F oc aula_04"

  1. 1. A Organização da Unidade Central de Processamento . As unidades físicas . O ciclo da informação(fluxo) . A tecnologia OC_Aula_04
  2. 2. Organização da Unidade de Processamento Central <ul><li>Diagrama funcional </li></ul>Unidade de Controle Barram. de Endereços Barram. de Dados Barramento Interno Barramento de Controle UC Decodificador de Instruções IR REM RDM Clock Memória Principal PC ACC REGs ULA
  3. 3. Execução de um programa <ul><li>Ciclo de execução de uma instrução </li></ul>Início Busca da Instrução Execução da Instrução Parada
  4. 4. Paralelismo no Nível das Instruções <ul><li>Conceito </li></ul><ul><li>Arquitetos sempre desafiando para melhorar a performance das máquinas que eles projetam. </li></ul><ul><li>Uma delas: fazer com que os chips rodem cada vez mais rápido, aumentando a velocidade do clock. </li></ul><ul><li>As limitações tecnológicas, em parte, impedem este avanço. </li></ul><ul><li>Projetistas utilizam o paralelismo, que consiste em executar duas ou mais operações ao mesmo tempo. </li></ul><ul><li>O paralelismo se manifesta de duas maneiras: </li></ul><ul><ul><li>No nível das instruções </li></ul></ul><ul><ul><li>No nível do processador </li></ul></ul>
  5. 5. Paralelismo no Nível das Instruções <ul><li>Conceito </li></ul><ul><li>No nível da instrução - o paralelismo é explorado dentro das instruções individuais, de maneira a conseguir que a máquina execute mais instruções individuais, de maneira a conseguir que a máquina execute mais instruções por segundo. </li></ul><ul><li>No nível do processador - vários processadores trabalham juntos na solução do mesmo problema. </li></ul><ul><li>Cada uma das metodologias tem seus próprios méritos. </li></ul>
  6. 6. Execução em Pipeline <ul><li>Conceito </li></ul><ul><ul><li>cada estágio possui um componente de hardware dedicado exclusivamente a ele </li></ul></ul><ul><ul><li>todos os estágios trabalham ao mesmo tempo </li></ul></ul><ul><li>Latência </li></ul><ul><ul><li>quanto uma instrução demora para ser executada </li></ul></ul><ul><li>Banda passante </li></ul><ul><ul><li>quantos MIPS (milhões de instruções por segundo) o processador executa </li></ul></ul>
  7. 7. Execução em Pipeline <ul><li>Pipeline de 5 estágios </li></ul>Unidade de busca da Instrução Unidade de decodificação da instrução Unidade de busca de operando Unidade de execução da instrução Unidade de escrita E1 E2 E3 E4 E5 1 2 3 4 5 6 1 2 3 4 5 1 2 3 4 1 2 3 1 2 E1 E2 E3 E4 E5 1 2 3 4 5 6 ...
  8. 8. Arquiteturas Superescalares <ul><li>Conceito </li></ul><ul><li>Se um pipeline é bom, com certeza dois serão ainda melhor. </li></ul><ul><li>É possível projetar um processador com dois pipelines. </li></ul><ul><li>Neste caso, uma única unidade de busca de instrução busca pares de instruções juntas e coloca cada uma delas em seu próprio pipeline, permitindo, portanto, a execução de instruções em paralelo. </li></ul><ul><li>Para que seja possível a execução em paralelo dessas instruções, não pode haver conflito pela utilização de recursos durante a execução (os registradores são um exemplo desse tipo de recurso), e, além disso, o resultado de uma das instruções não pode depender da execução da outra. </li></ul>
  9. 9. Arquiteturas Superescalares <ul><li>Conceito </li></ul><ul><li>O compilador precisa garantir que essas situações não venham a ocorrer (ou seja, o hardware não faz qualquer verificação de conflitos, dando resultados errados se as instruções executadas em paralelo não forem compatíveis), ou os conflitos são detectados e eliminados durante a execução das instruções usando um hardware específico para isso. </li></ul><ul><li>Apesar das máquinas RISC já utilizarem o processamento em pipeline, a partir do 486 a Intel já passou a aplicar esta tecnologia em seus processadores. </li></ul>
  10. 10. Arquiteturas Superescalares <ul><li>Processador com dois pipelines </li></ul>Unidade de busca da Instrução Unidade de decodificação da instrução Unidade de busca de operando Unidade de execução da instrução Unidade de escrita E1 E2 E3 E4 E5 Unidade de decodificação da instrução Unidade de busca de operando Unidade de execução da instrução Unidade de escrita
  11. 11. Arquiteturas Superescalares <ul><li>Arquitetura Superescalar </li></ul><ul><li>A existência de quatro pipelines, apesar de conceituamente possível, duplica o hardware necessário à sua implementação. </li></ul><ul><li>Em vez de quatro pipelines, as máquinas de alta performance usam outra metodologia. </li></ul><ul><li>A idéia básica é ter um único pipeline, com diversas unidades funcionais. </li></ul><ul><li>Ela traz implícito o fato de o estágio S3 poder distribuir instruções a uma velocidade considerávelmente mais alta que a capacidade do estágio S4 de executa-las. </li></ul>
  12. 12. Arquiteturas Superescalares <ul><li>Arquitetura Superescalar </li></ul><ul><li>Se o estágio S3 distribui uma instrução a cada 10 ns, não mais que uma unidade funcional poderia estar ocupada ao mesmo tempo, impedindo portanto a implementação do processamento superescalar. </li></ul>
  13. 13. Arquiteturas Superescalares <ul><li>Processador superescalar com quatro unidades funcionais </li></ul>Unidade de busca da Instrução Unidade de decodificação da instrução Unidade de busca de operando ULA Unidade de escrita E1 E2 E3 E4 E5 LOAD STORE Ponto flutuante
  14. 14. Paralelismo no nível do processador <ul><li>Conceito </li></ul><ul><li>A demanda de computadores mais rápidos parece não ter fim. </li></ul><ul><li>Ex: astrônomos calculando o big-bang; economistas calculando a economia mundial; adolescentes com jogos interativos em três dimensões, etc. </li></ul><ul><li>Velocidade da luz em fios de cobre ou em fibra óptica da ordem de 20 cm/ns, uma limitação. </li></ul><ul><li>O paralelismo de processador ajuda a aumentar a velocidade de execução. </li></ul><ul><li>Pipelines aumentam em 5 a 10 vezes o processamento. </li></ul><ul><li>Para obter 50 a 100 vezes, é preciso colocar vários processadores em paralelo . </li></ul>
  15. 15. Paralelismo no nível do processador <ul><li>Computadores Matriciais </li></ul><ul><li>A maioria dos problemas científicos trata com matrizes ou alguma outra estrutura regular de dados. </li></ul><ul><li>A regularidade e a estrutura de tais programas fazem deles candidatos potenciais a ter sua performance aumentada por meio da execução paralela. </li></ul><ul><li>Há dois esquemas para implementação: </li></ul><ul><li>(1) máquinas projetadas com extensão de processador </li></ul><ul><li>(2) máquinas paralelas. </li></ul>
  16. 16. Paralelismo no nível do processador <ul><li>Processadores Matriciais </li></ul><ul><li>Composto de um grande número de processadores idênticos, que executam a mesma seqüência de instruções sobre diferentes conjunto de dados. </li></ul><ul><li>O primeiro projeto foi o ILLIAC IV, fig. Próxima página. </li></ul><ul><li>O plano original era produzir uma máquina composta de quatro quadrantes, cada um dos quais com uma estrutura de 8 x 8 elementos processador/memória. </li></ul><ul><li>Cada quadrante tinha uma única unidade de controle que enviava instruções em broadcast para os processadores, instruções essas que eram executadas por todos os processadores junto de dados armazenados em sua memória local. </li></ul>
  17. 17. Paralelismo no nível do processador <ul><li>Computadores Matriciais </li></ul>Unidade de Controle Processador Memória Grade processador/memória 8x8 Instruções enviadas em broadcast
  18. 18. Paralelismo no nível do processador <ul><li>Processador Vertical </li></ul><ul><li>Se parece muito com um processador matricial. </li></ul><ul><li>É muito eficiente na execução de uma seqüência de operações em pares de elementos de dados. </li></ul><ul><li>Todas as operações aritméticas são realizadas em uma única UAL, que opera em pipeline. </li></ul><ul><li>A Cray produz ainda hoje computadores com processadores verticais. </li></ul>
  19. 19. <ul><li>Computadores Vetoriais </li></ul>Paralelismo no nível do processador Registradores vetorias ULA
  20. 20. Paralelismo no nível do processador <ul><li>Multiprocessadores </li></ul><ul><li>É composto de vários processadores independentes, compartilhando a mesma memória, a exemplo de várias pessoas em uma sala de aula compartilhando o mesmo quadro-negro. </li></ul><ul><li>Considerando que cada processador pode ler ou gravar em qualquer parte da memória, é necessário que as atividades dos vários processadores sejam coordenadas (por software), para evitar que a atividade de um processador interfira na atividade de outro. </li></ul><ul><li>O esquema mais simples é o de barramento único com vários processadores e uma memória pendurados nele. </li></ul>
  21. 21. Paralelismo no nível do processador <ul><li>Multiprocessadores </li></ul>Proc.1 Proc.2 Proc.3 Proc.4 Memória Compartilhada Proc.1 Proc.2 Proc.3 Proc.4 Memória Compartilhada Mem.local Mem.local Mem.local Mem.local
  22. 22. Paralelismo no nível do processador <ul><li>Multicomputadores </li></ul><ul><li>Embora os sistemas Multiprocessadores, com um pequeno número de processadores (<= 64) sejam muito fáceis de serem construídos, os sistemas com mais processadores são de difícil implementação. </li></ul><ul><li>A dificuldade está na conexão do processador à memória. </li></ul><ul><li>Para resolver esse problema, os projetistas simplesmente abandonaram a idéia da memória compartilhada e construíram sistemas com um grande número de computadores interconectados, sem qualquer tipo de memória comum. </li></ul><ul><li>Os processadores de um sistema deste comunicam-se por meio do mecanismo de troca de mensagens, mais ou menos como no sistema de correio eletrônico. </li></ul>
  23. 23. Paralelismo no nível do processador <ul><li>Multicomputadores </li></ul>C1 C2 C3 C4 C5
  24. 24. <ul><li>F I M </li></ul>
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×