SlideShare a Scribd company logo
Введение в
архитектуру
персональных
компьютеров

   Особенности микропроцессоров


            Лекция
            доцента кафедры ИВТ ГрГУ
            к.т.н
            Ливак Е.Н.
Процессоры отличаются:

• Внутренней архитектурой
• Системой команд


• Внешним видом (корпусом)




                             2
Набор команд
Архитектуры CISC и RISC

• Две основные архитектуры набора
  команд - CISC и RISC

• CISC – Complete Instruction Set Computer
  Архитектура с полным набором команд
  Микропроцессоры Intel

• RISC – Reduced Instruction Set Computer
  Архитектура с сокращенным набором команд
  Популярны во всем мире, т.к. на такой архитектуре работают
  рабочие станции и серверы под управлением ОС Unix



                                                  3
Принципы RISC-архитектуры

• Каждая команда выполняется за один такт (должен
  быть максимально коротким)
• Все команды имеют одинаковую длину и формат
  (упрощение логики управления процессором)
• Обработка данных происходит только в регистрах
  процессора, обращение к памяти только при
  операциях чтения и записи
• Система команд должна обеспечивать поддержку языка
  высокого уровня

          50 инструкций в архитектурах 1 поколения
         Около 150 инструкций в современных RISC-
                        процессорах
                                              4
Особенности СISC-архитектуры

• В систему команд добавлены «удобные» для
  программиста команды (маленькие подпрограммы)
⇒ Ускорение разработки программ
⇒ Команды CISC-процессора имеют разную длину и
  время выполнения
⇒ Некоторые команды выполняются за несколько тактов


⇒ Производительность ниже




                                        5
•   CISC и RISC – принципы и технологии.
• «Архитектура каждого конкретного процессора
  представляет собой результат множества
  компромиссов» (Хамахер и др.)

• CISC-процессоры – персональные
  компьютеры



• RISC-процессоры –
  высокопроизводительные серверы и
  рабочие станции

                                           6
Основные игроки на рынке
          процессоров

• Корпорация Intel
• Фирма AMD
    (Advanced Micro Devices)




•   Cyrix
•   Sun
•   Motorola

                               7
Intel 8086

• 1978 год


• 16-разрядный!!!
(внутренняя архитектура)


• 20-разрядная шина адреса
  (1 Мб ОП)
• 16-разрядная шина данных


                             8
Intel 80186 и 80286 (1982 год)

• 80186 – для встроенных
  интеллектуальных устройств


• 80286 – для ПК
  – Новые команды в системе команд
  – Защищенный режим (поддержка
    многозадачности)
  – Механизм переключения задач
  – Поддержка виртуальной памяти
  – 4-уровневая система защиты


• 24-разрядная шина адреса (16 Мб ОП)
• 16-разрядная шина данных
                                9
Intel 80386 – 1985 год

• В 1985 году фирма Intel выпустила
  первый 32-разрядный
  микропроцессор, ставший
  родоначальником семейства IA-32

• 32-разрядная арифметика!!!
• Регистры блока обработки чисел с фиксированной
  точкой стали 32-разрядными.
• К каждому из них можно обращаться как к одному
  двойному слову (32 разряда).

                                        10
Intel 80386

Архитектура 32-разрядного микропроцессора
  существенно отличается от архитектуры 16-разрядного

• Увеличение разрядности шины данных и шины адреса
  до 32 бит (4 Гб ОП)

• Впервые на кристалле микропроцессора кэш-память 1
  уровня (L1) – для временного хранения команд и
  данных
(Основной кэш (L2) – на системной плате)

• К используемым в реальном режиме четырем
  регистрам CS, DS, SS и ES добавлены еще два: FS и GS

                                          11
Intel 80386

• Кэширование – способ увеличения
    быстродействия системы за счет хранения
    часто используемых данных и кодов в «кэш-
    памяти 1-го уровня» (быстрой памяти),
    находящейся внутри микропроцессора.
•   Кэш-память – очень быстрое запоминающее устройство (время выборки
    из ОЗУ ≈ 60-70 нс; из кэша – 10-20 нс, т.е. в 3-4 раза быстрее)



       ОП                    Кэш-
                            память        Процессор




                                                      12
Кэширование
Идея
• Команды из ОП выбираются и пересылаются в
  процессор, а их копии помещаются в кэш.

• Данные из основной памяти также пересылаются в
  процессор, а их копии помещаются в кэш.

• Если команда или данные понадобятся еще раз, они
  будут прочитаны не из памяти, а из кэша (например,
  циклы).

• Внутренняя скорость выполнения команд,
  прочитанных из такого кэша (на одном кристалле с
  процессором) выше, чем скорость выборки команд и
  данных из ОП.

                                         13
Иерархия памяти
Обычно в компьютере имеется два уровня
кэш-памяти.

•   Первичный кэш располагается на микросхеме
    процесcора, называется кэшем первого уровня
    (L1)

•   Вторичный кэш располагается между
    первичным кэшем и остальной памятью,
    имеет больший объем и называется кэшем
    второго уровня (L2).

                                    14
Иерархия памяти
                                         Увеличение
                        Процессор        быстродействия и
                                         стоимости хранения
                                         одного бита
                        Регистры

                    Первичный кэш (L1)




                    Вторичный кэш (L2)


                    Основная память

Увеличение объема
                    Внешняя память
                                             15
Иерархия памяти
1. Быстрее всего осуществляется доступ к
   данным, хранящимся в регистрах процессора
  (самый маленький объем)
2. Кэш процессора (L1) – небольшой объем
3. Вторичный кэш (L2) – объем больше
4. Основная память (ОП) – значительно больше
   и намного медленнее кэша
  (в типичном компьютере время доступа к ОП в 10 раз
      дольше времени доступа к кэшу L1).
5. Дисковая память – огромный объем недорогой
   памяти. Очень медленные операции.


                                         16
Управление иерархией памяти

«Идея управления иерархической системой памяти
    состоит в том, чтобы переместить команды и данные ,
    которые будут использоваться в ближайшее время,
как можно ближе к процессору.»

Каждый элемент, к которому обращается процессор
   помещается в кэш и остается там (локализация по
   времени).
Копируется не только сам элемент программы или
   данных, но несколько близлежащих (локализация в
   пространстве).

«Когда кэш полон и обращение происходит к
   отсутствующему слову памяти, принимается решение
   какой из блоков удалить из кэша, чтобы добавить
   новый блок, содержащий требуемое слово.»17
Intel 80386

Упрощенные модели i386

• Intel 386 SX (поддержка только 16-разр.)
• Intel 386 DX (32-разр.)




                                   18
Intel 80486 – 1989 год
• В состав кристалла микропроцессора входит блок
  обработки чисел с плавающей запятой (сопроцессор)

• На кристалле микропроцессора располагается также
  внутренняя кэш-память.
• Объем кэш-памяти составляет 8 Кбайт (для
  кэширования и кодов, и данных)


• Архитектура = ядро + периферийные блоки
• Ядро работает на повышенной частоте

• Упрощенная модель - i486 SX
• Intel 486 DX 2 – удвоенная частота для ядра
• Intel 486 DX 4 – утроенная частота для ядра
                                            19
Скалярная архитектура
Intel 80486
В микропроцессоре i486 появился важный элемент
  архитектуры – конвейер.


КОНВЕЙЕР – специальное устройство, реализующее
  такой метод обработки команд внутри
  микропроцессора, при котором исполнение
  команды разбивается на несколько этапов.




                                   20
Скалярная архитектура
Intel 80486
 i486 имеет 5-ступенчатый конвейер:
1) выборка команды из кэш-памяти или ОП;
2) декодирование команды;
3) генерация адреса (определение операндов в памяти);
4) выполнение операции с помощью арифметико-логического
     устройства;
5) запись результата.

     Таким образом, на конвейере может находиться одновременно
   пять команд на различной стадии выполнения ⇒ существенно
   возрастает скорость вычислений.


    Микропроцессоры, имеющие один конвейер,
   называются скалярными
                                               21
Длительность выполнения команд
      при последовательной и конвейерной обработке



Количество    Время
команд
              при последовательной   при конвейерной
              обработке              обработке
1             100                    150

2             200                    240

10            1000                   420

100           10000                  3120




                                            22
Одновременно с Intel 80486

• Более дешевые и
  высокопроизводительные по
  сравнению с Intel 486 DX 4
  процессоры фирм AMD и Cyrix
•   AMD – K5
•   Am5x86-P75
•   Cyrix 5x86
•   (на данном этапе чуть обогнали)




                                      23
Intel Pentium (586) – 1993 год

Суперскалярная архитектура
Микропроцессоры, имеющие более одного
  конвейера,                             называются
  суперскалярными.
• Pentium - 2 конвейера (+ 1 для вещественных чисел)

Усовершенствованный блок вычислений с
   плавающей точкой
В Pentium обычные математические функции вычислений с
   плавающей точкой (+, *, / ) реализованы аппаратно
   (целочисленная конвейеризация дополнена 8-тактовыми
   конвейерными командами вычислений с плавающей точкой).

Итого 3 конвейера – 2 для целочисленных операций (5-тактовые),
                                               24
Intel Pentium (586)

Раздельное кэширование кода и данных
Pentium содержит уже 2 блока кэш-памяти:
один для кода, один для данных (по 8 Кб) ⇒
   увеличивается скорость работы компьютера за
   счет одновременного быстрого доступа к коду и
   данным.

Расширенная 64-битовая шина данных
⇒ Ускорение работы с памятью (за один такт
   считывается/записывается сразу несколько 8-байтных
   команд/данных )
Расширенная 64-битовая шина адреса
(объем ОП памяти)

32-разрядная внутренняя архитектура!!! 25
Intel Pentium (586)

Предсказание правильного адреса
  перехода
Под переходом понимается запланированное алгоритмом
  изменение последовательного характера выполнения
  программы.

Типичная программа на каждые 6-8 команд содержит 1
  команду перехода (условные операторы, операторы цикла,
  оператор безусловного перехода и т.д.)
⇒ через каждые 6-8 команд необходимо очищать и
 заполнять заново конвейер ⇒ теряются преимущества
 конвейеризации.

                                           26
Механизм предсказания
перехода

Вводится специальный буфер адресов перехода,
который   хранит       информацию            о последних
  переходах (для Pentium – о 256 переходах).

Для команды, управляющей ветвлением, в буфере
  запоминаются сама команда, адрес перехода и
  предположение о том, какая ветвь программы
  будет выполнена следующей.

Блок предсказания адреса перехода прогнозирует
  решение программы.
Он основывается на предположении, что ветвь,
  которая была пройдена, будет использоваться
  снова (т.е. прогнозируется переход на начало
  цикла).
Если предсказание верно, переход осуществляется
  без задержки ⇒ увеличение скорости работы.
                                     27
Архитектурные особенности
процессоров
Pentium

• Суперскалярная архитектура


• Раздельное кэширование кода и данных


• Предсказание правильного адреса
  перехода


• Усовершенствованный блок вычислений
  с плавающей точкой


• Расширенная 64-битовая шина данных и
  шина адреса                  28
Pentium Pro – 1995 год
• Кэш-память использует собственную шину,
   независимую от системной
= архитектура с двумя независимыми шинами
Увеличение пропускной способности каналов передачи
   данных

⇒   3 конвейера по 14 ступеней
⇒   64-разрядная шина данных, 36-разрядная шина адреса
⇒   16 Кб внутренней кэш-памяти (8+8)
⇒   256 Кб - кэш второго уровня (в одном модуле с
    микропроцессором, но на отдельной микросхеме)

                                           29
Pentium MMX – 1997 год

• Ускорение 2D- и 3D-графики за счет
  дополнительных регистров и типов данных
• + 57 команд команд для эффективной
  обработки звука, видео, графики.
(операции, для которых Pentium требовалось выполнить десятки или
   сотни команд закодированы одной инструкцией)




• !!! Под конкретное ПО – ОС Windows 95.


                                                  30
Pentium II – 1997 год

• Улучшенные технические характеристики
(Pentium Pro + средства MMX)
• Рост тактовой частоты

• Кэш-память L1 – 32 Кб (16+16)
• Кэш-память L2 – 32 Кб




                                  31
Pentium III – 1999 год

•   Усовершенствовано ядро процессора
•   Улучшена работа кэша L2 (объем 256 Кб)
•   10-ступенчатый конвейер




                                     32
Pentium 4 – 2000 год
(7 поколение компьютеров)

• По-прежнему, 32-разрядная внутренняя архитектура!!!
• Улучшенные характеристики традиционных блоков и
  технологий
• Новые технологии
   – Данные считываются 4 раза за 1 такт
   – Гиперконвейерная обработка данных
   – 20-ступенчатый конвейер (не очень хорошо)
   – Блок быстрого выполнения команд работает на удвоенной
     частоте ядра
   – Кэш-память с отслеживанием выполнения команд
   – Кэш-память L2 (256 Кб) интегрирована в микросхему.
   – Кэши l1, L2 соединены и обеспечивается быстрая передача
     данных между ними


                                                 33
Процессоры Intel Celeron

Упрощенная версия
процессоров Pentium II, III и 4 (для дешевых ПК)

•   уменьшен объем кэша L2 в 2 раза
•   Уменьшена разрядность шин
•   Отсутствует ряд расширенных функций




                                      34
Процессоры AMD
• Более 20 лет конкурентной борьбы с корпорацией
  Intel
• 7 поколение компьютеров в 2000 году
  представлено AMD K7 (Athlon)


Первыми наладили производство
 процессора 8 поколения – с 64-разрядной
 внутренней архитектурой!!!
Сперва для промышленного применения –
AMD Opteron
Затем для настольных ПК – AMD64
!!! Требуется новая ОС, новое прикладное ПО
Athlon64 – одновременная поддержка и 32- и 64-разрядного ПО
                                                35
МНОГОЯДЕРНЫЕ процессоры


• Новая эра началась в 2005 году
(появилась информация о производстве
9-ядерных процессоров корпорации IBM для
  игровой приставки Play Station 3)

⇒ AMD и Intel начали производство
 двухъядерных процессоров




                                    36
Многоядерные процессоры Intel


• Intel Pentium D
• Intel Pentium 4 Extreme Edition
  – На кристалле формируется 2 стандартных
    процессора Pentium,
  – добавляются схемы для синхронизации их работы
• (ГРЕЕТСЯ!!!)


• Intel Core 2
  – Интегрирует 2 ядра вместе
  – (снижение энергопотребления)
                                       37
Семейство Intel Core 2

2006 год
• Intel Core 2 Duo
• Intel Core 2 Extreme – 4-ядерный
   – для серверов и игровых ПК
2007 год
• Intel Core 2 Quad
   – для настольных ПК массового спроса


«Представленные летом 2006 года х86-процессоры Intel с новой
  микроархитектурой Сore впервые за последние годы резко
  опередили процессоры AMD по производительности, обладая при
  этом более низким энергопотреблением» (Кузьминский)
                                               38
Семейство Intel Core 2
               Тактовая частота в 2 раза меньше,
               маленькое тепловыделение.


В 2 раза выше производительность по сравнению с Pentium 4.
Усовершенствования:
• 14-ступенчатый (целочисленный) конвейер ⇒
   4 команды одновременно выполняются за каждый такт
• Кэш L2 на кристалле двухядерного процессора – один
  на 2 ядра
  «Применение общего кэша позволяет динамически распределять
  его емкость между ядрами. При этом исчезает необходимость
  дублировать общие для обоих ядер данные, как это происходит
  при использовании каждым ядром собственного кэша второго
  уровня.» (Кузьмицкий)
                                                   39
Новое в технологии Core
Предсказание переходов
Кроме традиционных средств предсказания переходов для Pentium 4
   (буфер «целей» перехода BTB, калькулятор адресов перехода BAC и стек адресов
       возврата RAS)
в Core имеется еще два предсказателя.

1. Детектор циклов - служит для правильного
   предсказания выхода из цикла.
   Обычное предсказание переходов на основе
   предыстории будет предсказывать очередное
   выполнение цикла. Чтобы предсказать выход из
   цикла, специальные счетчики отслеживают число
   итераций цикла до его завершения и используют
   эти данные в будущем для предсказания, когда
   из этого цикла следует выйти.
                                                             40
Новое в технологии Core
Предсказание переходов
Кроме традиционных средств предсказания переходов для Pentium 4
   (буфер «целей» перехода BTB, калькулятор адресов перехода BAC и стек адресов
       возврата RAS)
в Core имеется еще два предсказателя.

2. Предсказатель косвенных переходов - относится к
    переходам, адрес которых не кодируется в команде
    непосредственно, а задается содержимым регистра
    (такие переходы предсказывать сложнее).
   Этот предсказатель содержит таблицу, в которую заносятся
   вероятные адреса косвенных переходов. Когда фронтальная часть
   процессора обнаруживает косвенный переход и предсказывает,
   что он произойдет, он запрашивает эту таблицу, выбирая из нее
   соответствующий целевой адрес перехода


                                                             41
Процессор Intel® Core™2 Duo

• высокая производительность
• энергоэкономичность




• изготовлены по 45-нанометровой производственной
  технологии с использованием соединений гафния.
• общая кэш-память второго уровня объёмом до 6 МБ
• системная шина с частотой до 1333 МГц (для
  настольных ПК) и до 800 МГц (для портативных ПК)



                                        42
Двухъядерный процессор
Intel® Core™2 Extreme
• «Двухъядерные процессоры Intel Core 2 Extreme
  обеспечивают энергосбережение и высокую
  производительность в играх, а также потрясающее
  качество видео и звука.» [www.intel.ru]




                                         43
4-ядерный процессор
Intel® Core™2 Extreme

• обеспечивает еще более высокую производительность
  и пониженное энергопотребление
• Процессор Intel Core 2 Extreme QX9650
   – частота 3,0 ГГц
   – 12 МБ общей кэш-памяти второго уровня
   – системная шина с частотой 1333 МГц




                                             44
Четырехъядерный процессор
Intel® Core™2 Quad

«обеспечивает высочайшую скорость
выполнения ресурсоемких задач
в многозадачных средах и
максимальную производительность
многопоточных приложений»


• Четыре ядра,
• до 12 МБ общей кэш-памяти второго уровня
   (до 6 МБ на каждые 2 ядра),
• системная шина с частотой до 1333 МГц


                                    45
Многоядерные процессоры AMD


2006 год
AMD Athlon 64 X2 Dual Core
(два 64-разрядных процессора на 1 кристалле)
• 2 ядра, у каждого свой кэш L2

Ядра сильнее интегрированы, чем у Intel, меньше
  нагрев процессора




                                     46
Прогноз

«Многоядерные микропроцессоры предоставляют
  большую вычислительную мощность
  посредством параллелизма, предлагают
  лучшую системную организацию, работают на
  меньших тактовых частотах»



«Основной путь развития
 микропроцессоров – рост числа
 ядер в микросхеме» (Кузьминский)

                                 47
2007 год
• Был продемонстрирован прототип микропроцессора
  Intel, имеющего производительность уровня небольших
  суперкомпьютеров — 1 TFLOPS.
• Довольно крупная микросхема прототипа состоит из 80
  процессорных ядер на одном кристалле, работающих
  на частоте 3,1 ГГц.
• Подобный процессор позволил бы компьютеру
  выполнять, например, автоматический перевод
  с одного языка на другой в реальном времени.



                                         48

More Related Content

What's hot

Лекция №9 Организация ЭВМ и систем
Лекция №9 Организация ЭВМ и системЛекция №9 Организация ЭВМ и систем
Лекция №9 Организация ЭВМ и системpianist2317
 
Лекция № 2 Организация ЭВМ и систем
Лекция № 2 Организация ЭВМ и системЛекция № 2 Организация ЭВМ и систем
Лекция № 2 Организация ЭВМ и систем
Александр Силантьев
 
Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)
Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)
Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)
Ontico
 
процессоры
процессорыпроцессоры
процессорыttku
 
029
029029
029JIuc
 
030
030030
030JIuc
 
Строение компьютера
Строение компьютераСтроение компьютера
Строение компьютера
Ronny_Rosenberg
 
034
034034
034JIuc
 
Лекция №5 Организация ЭВМ и систем
Лекция №5 Организация ЭВМ и системЛекция №5 Организация ЭВМ и систем
Лекция №5 Организация ЭВМ и систем
Александр Силантьев
 
Лекция 3: Векторизация кода (Code vectorization, SIMD, SSE, AVX)
Лекция 3: Векторизация кода (Code vectorization, SIMD, SSE, AVX)Лекция 3: Векторизация кода (Code vectorization, SIMD, SSE, AVX)
Лекция 3: Векторизация кода (Code vectorization, SIMD, SSE, AVX)Mikhail Kurnosov
 
Oracle exa2 biz_summit
Oracle exa2 biz_summitOracle exa2 biz_summit
Oracle exa2 biz_summitNick Turunov
 
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...
Mikhail Kurnosov
 
1. Sartakov. Virtualization. June 01, 2013
1. Sartakov. Virtualization. June 01, 20131. Sartakov. Virtualization. June 01, 2013
1. Sartakov. Virtualization. June 01, 2013
ru-fedora-moscow-2013
 
Операционные системы
Операционные системыОперационные системы
Операционные системыyaevents
 
[DD] 10. Memory
[DD] 10. Memory[DD] 10. Memory
[DD] 10. Memory
Gabit Altybaev
 
Архитектура AMD64 (EM64T)
Архитектура AMD64 (EM64T)Архитектура AMD64 (EM64T)
Архитектура AMD64 (EM64T)
Tatyanazaxarova
 
Лекция №1 Организация ЭВМ и систем
Лекция №1 Организация ЭВМ и системЛекция №1 Организация ЭВМ и систем
Лекция №1 Организация ЭВМ и систем
Александр Силантьев
 
Лекция №2 Организация ЭВМ и систем
Лекция №2 Организация ЭВМ и системЛекция №2 Организация ЭВМ и систем
Лекция №2 Организация ЭВМ и системpianist2317
 

What's hot (20)

Лекция №9 Организация ЭВМ и систем
Лекция №9 Организация ЭВМ и системЛекция №9 Организация ЭВМ и систем
Лекция №9 Организация ЭВМ и систем
 
Лекция № 2 Организация ЭВМ и систем
Лекция № 2 Организация ЭВМ и системЛекция № 2 Организация ЭВМ и систем
Лекция № 2 Организация ЭВМ и систем
 
Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)
Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)
Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)
 
процессоры
процессорыпроцессоры
процессоры
 
029
029029
029
 
030
030030
030
 
Строение компьютера
Строение компьютераСтроение компьютера
Строение компьютера
 
034
034034
034
 
Лекция №5 Организация ЭВМ и систем
Лекция №5 Организация ЭВМ и системЛекция №5 Организация ЭВМ и систем
Лекция №5 Организация ЭВМ и систем
 
Лекция 3: Векторизация кода (Code vectorization, SIMD, SSE, AVX)
Лекция 3: Векторизация кода (Code vectorization, SIMD, SSE, AVX)Лекция 3: Векторизация кода (Code vectorization, SIMD, SSE, AVX)
Лекция 3: Векторизация кода (Code vectorization, SIMD, SSE, AVX)
 
4
44
4
 
Oracle exa2 biz_summit
Oracle exa2 biz_summitOracle exa2 biz_summit
Oracle exa2 biz_summit
 
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...
 
1. Sartakov. Virtualization. June 01, 2013
1. Sartakov. Virtualization. June 01, 20131. Sartakov. Virtualization. June 01, 2013
1. Sartakov. Virtualization. June 01, 2013
 
Операционные системы
Операционные системыОперационные системы
Операционные системы
 
[DD] 10. Memory
[DD] 10. Memory[DD] 10. Memory
[DD] 10. Memory
 
Архитектура AMD64 (EM64T)
Архитектура AMD64 (EM64T)Архитектура AMD64 (EM64T)
Архитектура AMD64 (EM64T)
 
2
22
2
 
Лекция №1 Организация ЭВМ и систем
Лекция №1 Организация ЭВМ и системЛекция №1 Организация ЭВМ и систем
Лекция №1 Организация ЭВМ и систем
 
Лекция №2 Организация ЭВМ и систем
Лекция №2 Организация ЭВМ и системЛекция №2 Организация ЭВМ и систем
Лекция №2 Организация ЭВМ и систем
 

Viewers also liked

033
033033
033JIuc
 
Материнская плата
Материнская платаМатеринская плата
Материнская плата
Meshkov Anton
 
Materinskaya plata ppt
Materinskaya plata pptMaterinskaya plata ppt
Materinskaya plata ppt
KozinskaIS
 
архитектура компьютера
архитектура компьютераархитектура компьютера
архитектура компьютераfacalitsy
 
34
3434
34JIuc
 
It
ItIt
It
PGPU
 
архитектура компьютера
архитектура компьютераархитектура компьютера
архитектура компьютераManiaks_Doll
 
Лекция №8 Организация ЭВМ и систем
Лекция №8 Организация ЭВМ и системЛекция №8 Организация ЭВМ и систем
Лекция №8 Организация ЭВМ и системpianist2317
 
Лекция №11 Организация ЭВМ и систем
Лекция №11 Организация ЭВМ и системЛекция №11 Организация ЭВМ и систем
Лекция №11 Организация ЭВМ и системpianist2317
 
36арл
36арл36арл
36арл
KaminAngel
 
материнская плата
материнская платаматеринская плата
материнская платаAnnKar16
 
35
3535
35JIuc
 
39
3939
39JIuc
 
системный блок матплата
системный блок матплатасистемный блок матплата
системный блок матплата
HATALY-p
 
арихектура копьютера
арихектура копьютераарихектура копьютера
арихектура копьютера
IAMURBAN
 
схема компьютера
схема компьютерасхема компьютера
схема компьютера
v123a321
 
презентация по информатике
презентация по информатикепрезентация по информатике
презентация по информатике
SEZY216
 

Viewers also liked (20)

033
033033
033
 
Материнская плата
Материнская платаМатеринская плата
Материнская плата
 
Materinskaya plata ppt
Materinskaya plata pptMaterinskaya plata ppt
Materinskaya plata ppt
 
архитектура компьютера
архитектура компьютераархитектура компьютера
архитектура компьютера
 
34
3434
34
 
3
33
3
 
It
ItIt
It
 
архитектура компьютера
архитектура компьютераархитектура компьютера
архитектура компьютера
 
Лекция №8 Организация ЭВМ и систем
Лекция №8 Организация ЭВМ и системЛекция №8 Организация ЭВМ и систем
Лекция №8 Организация ЭВМ и систем
 
Лекция №11 Организация ЭВМ и систем
Лекция №11 Организация ЭВМ и системЛекция №11 Организация ЭВМ и систем
Лекция №11 Организация ЭВМ и систем
 
36арл
36арл36арл
36арл
 
материнская плата
материнская платаматеринская плата
материнская плата
 
35
3535
35
 
39
3939
39
 
системный блок матплата
системный блок матплатасистемный блок матплата
системный блок матплата
 
арихектура копьютера
арихектура копьютераарихектура копьютера
арихектура копьютера
 
схема компьютера
схема компьютерасхема компьютера
схема компьютера
 
презентация по информатике
презентация по информатикепрезентация по информатике
презентация по информатике
 
материнская плата
материнская платаматеринская плата
материнская плата
 
пк
пкпк
пк
 

Similar to Prez osob mikroproc

prezlec_Історія.ppt
prezlec_Історія.pptprezlec_Історія.ppt
prezlec_Історія.ppt
ssusere2bc36
 
Обзор современных микроконтроллеров и их архитектур
Обзор современных микроконтроллеров и их архитектурОбзор современных микроконтроллеров и их архитектур
Обзор современных микроконтроллеров и их архитектур
IoT Community
 
Лекция 4: Оптимизация доступа к памяти (Memory access optimization, caches)
Лекция 4: Оптимизация доступа к памяти (Memory access optimization, caches)Лекция 4: Оптимизация доступа к памяти (Memory access optimization, caches)
Лекция 4: Оптимизация доступа к памяти (Memory access optimization, caches)Mikhail Kurnosov
 
презентация ученика юляя
презентация ученика юляяпрезентация ученика юляя
презентация ученика юляяSergeysitchov
 
тема 2 2.техническое обеспечение компьютера
тема 2 2.техническое обеспечение компьютератема 2 2.техническое обеспечение компьютера
тема 2 2.техническое обеспечение компьютераmrprizrak
 
supercluster
superclustersupercluster
процессор и оперативная память
процессор и оперативная памятьпроцессор и оперативная память
процессор и оперативная памятьvitaminiya
 
Процессоры и составляющие системного блока
Процессоры и составляющие системного блокаПроцессоры и составляющие системного блока
Процессоры и составляющие системного блока
Wewillneversleep
 
40
4040
40JIuc
 
Оптимизация программ для современных процессоров и Linux, Александр Крижановс...
Оптимизация программ для современных процессоров и Linux, Александр Крижановс...Оптимизация программ для современных процессоров и Linux, Александр Крижановс...
Оптимизация программ для современных процессоров и Linux, Александр Крижановс...
Ontico
 
Архитектура и программирование потоковых многоядерных процессоров для научных...
Архитектура и программирование потоковых многоядерных процессоров для научных...Архитектура и программирование потоковых многоядерных процессоров для научных...
Архитектура и программирование потоковых многоядерных процессоров для научных...
a15464321646213
 
Аппаратная реализация персонального компьютера
Аппаратная реализация персонального компьютераАппаратная реализация персонального компьютера
Аппаратная реализация персонального компьютераstudent_SSGA
 
Лекция 2 Разработка программно-аппаратного обеспечения информационных и автом...
Лекция 2 Разработка программно-аппаратного обеспечения информационных и автом...Лекция 2 Разработка программно-аппаратного обеспечения информационных и автом...
Лекция 2 Разработка программно-аппаратного обеспечения информационных и автом...
VThn18
 
Презентация 5
Презентация 5Презентация 5
Презентация 5
Nikita Zablotskiy
 
Лекция №7 Организация ЭВМ и систем
Лекция №7 Организация ЭВМ и системЛекция №7 Организация ЭВМ и систем
Лекция №7 Организация ЭВМ и системpianist2317
 
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуре
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуреСХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуре
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуреDEPO Computers
 
Вячеслав Бирюков - Linux инструменты системного администратора
Вячеслав Бирюков - Linux инструменты системного администратора Вячеслав Бирюков - Linux инструменты системного администратора
Вячеслав Бирюков - Linux инструменты системного администратора Yandex
 
Технические средства реализации информационных процессов
Технические средства реализации информационных процессовТехнические средства реализации информационных процессов
Технические средства реализации информационных процессовstudent_SSGA
 

Similar to Prez osob mikroproc (20)

prezlec_Історія.ppt
prezlec_Історія.pptprezlec_Історія.ppt
prezlec_Історія.ppt
 
Обзор современных микроконтроллеров и их архитектур
Обзор современных микроконтроллеров и их архитектурОбзор современных микроконтроллеров и их архитектур
Обзор современных микроконтроллеров и их архитектур
 
Лекция 4: Оптимизация доступа к памяти (Memory access optimization, caches)
Лекция 4: Оптимизация доступа к памяти (Memory access optimization, caches)Лекция 4: Оптимизация доступа к памяти (Memory access optimization, caches)
Лекция 4: Оптимизация доступа к памяти (Memory access optimization, caches)
 
презентация ученика юляя
презентация ученика юляяпрезентация ученика юляя
презентация ученика юляя
 
тема 2 2.техническое обеспечение компьютера
тема 2 2.техническое обеспечение компьютератема 2 2.техническое обеспечение компьютера
тема 2 2.техническое обеспечение компьютера
 
Platov
PlatovPlatov
Platov
 
supercluster
superclustersupercluster
supercluster
 
процессор и оперативная память
процессор и оперативная памятьпроцессор и оперативная память
процессор и оперативная память
 
дәріс №8
дәріс №8дәріс №8
дәріс №8
 
Процессоры и составляющие системного блока
Процессоры и составляющие системного блокаПроцессоры и составляющие системного блока
Процессоры и составляющие системного блока
 
40
4040
40
 
Оптимизация программ для современных процессоров и Linux, Александр Крижановс...
Оптимизация программ для современных процессоров и Linux, Александр Крижановс...Оптимизация программ для современных процессоров и Linux, Александр Крижановс...
Оптимизация программ для современных процессоров и Linux, Александр Крижановс...
 
Архитектура и программирование потоковых многоядерных процессоров для научных...
Архитектура и программирование потоковых многоядерных процессоров для научных...Архитектура и программирование потоковых многоядерных процессоров для научных...
Архитектура и программирование потоковых многоядерных процессоров для научных...
 
Аппаратная реализация персонального компьютера
Аппаратная реализация персонального компьютераАппаратная реализация персонального компьютера
Аппаратная реализация персонального компьютера
 
Лекция 2 Разработка программно-аппаратного обеспечения информационных и автом...
Лекция 2 Разработка программно-аппаратного обеспечения информационных и автом...Лекция 2 Разработка программно-аппаратного обеспечения информационных и автом...
Лекция 2 Разработка программно-аппаратного обеспечения информационных и автом...
 
Презентация 5
Презентация 5Презентация 5
Презентация 5
 
Лекция №7 Организация ЭВМ и систем
Лекция №7 Организация ЭВМ и системЛекция №7 Организация ЭВМ и систем
Лекция №7 Организация ЭВМ и систем
 
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуре
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуреСХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуре
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуре
 
Вячеслав Бирюков - Linux инструменты системного администратора
Вячеслав Бирюков - Linux инструменты системного администратора Вячеслав Бирюков - Linux инструменты системного администратора
Вячеслав Бирюков - Linux инструменты системного администратора
 
Технические средства реализации информационных процессов
Технические средства реализации информационных процессовТехнические средства реализации информационных процессов
Технические средства реализации информационных процессов
 

Prez osob mikroproc

  • 1. Введение в архитектуру персональных компьютеров Особенности микропроцессоров Лекция доцента кафедры ИВТ ГрГУ к.т.н Ливак Е.Н.
  • 2. Процессоры отличаются: • Внутренней архитектурой • Системой команд • Внешним видом (корпусом) 2
  • 3. Набор команд Архитектуры CISC и RISC • Две основные архитектуры набора команд - CISC и RISC • CISC – Complete Instruction Set Computer Архитектура с полным набором команд Микропроцессоры Intel • RISC – Reduced Instruction Set Computer Архитектура с сокращенным набором команд Популярны во всем мире, т.к. на такой архитектуре работают рабочие станции и серверы под управлением ОС Unix 3
  • 4. Принципы RISC-архитектуры • Каждая команда выполняется за один такт (должен быть максимально коротким) • Все команды имеют одинаковую длину и формат (упрощение логики управления процессором) • Обработка данных происходит только в регистрах процессора, обращение к памяти только при операциях чтения и записи • Система команд должна обеспечивать поддержку языка высокого уровня 50 инструкций в архитектурах 1 поколения Около 150 инструкций в современных RISC- процессорах 4
  • 5. Особенности СISC-архитектуры • В систему команд добавлены «удобные» для программиста команды (маленькие подпрограммы) ⇒ Ускорение разработки программ ⇒ Команды CISC-процессора имеют разную длину и время выполнения ⇒ Некоторые команды выполняются за несколько тактов ⇒ Производительность ниже 5
  • 6. CISC и RISC – принципы и технологии. • «Архитектура каждого конкретного процессора представляет собой результат множества компромиссов» (Хамахер и др.) • CISC-процессоры – персональные компьютеры • RISC-процессоры – высокопроизводительные серверы и рабочие станции 6
  • 7. Основные игроки на рынке процессоров • Корпорация Intel • Фирма AMD (Advanced Micro Devices) • Cyrix • Sun • Motorola 7
  • 8. Intel 8086 • 1978 год • 16-разрядный!!! (внутренняя архитектура) • 20-разрядная шина адреса (1 Мб ОП) • 16-разрядная шина данных 8
  • 9. Intel 80186 и 80286 (1982 год) • 80186 – для встроенных интеллектуальных устройств • 80286 – для ПК – Новые команды в системе команд – Защищенный режим (поддержка многозадачности) – Механизм переключения задач – Поддержка виртуальной памяти – 4-уровневая система защиты • 24-разрядная шина адреса (16 Мб ОП) • 16-разрядная шина данных 9
  • 10. Intel 80386 – 1985 год • В 1985 году фирма Intel выпустила первый 32-разрядный микропроцессор, ставший родоначальником семейства IA-32 • 32-разрядная арифметика!!! • Регистры блока обработки чисел с фиксированной точкой стали 32-разрядными. • К каждому из них можно обращаться как к одному двойному слову (32 разряда). 10
  • 11. Intel 80386 Архитектура 32-разрядного микропроцессора существенно отличается от архитектуры 16-разрядного • Увеличение разрядности шины данных и шины адреса до 32 бит (4 Гб ОП) • Впервые на кристалле микропроцессора кэш-память 1 уровня (L1) – для временного хранения команд и данных (Основной кэш (L2) – на системной плате) • К используемым в реальном режиме четырем регистрам CS, DS, SS и ES добавлены еще два: FS и GS 11
  • 12. Intel 80386 • Кэширование – способ увеличения быстродействия системы за счет хранения часто используемых данных и кодов в «кэш- памяти 1-го уровня» (быстрой памяти), находящейся внутри микропроцессора. • Кэш-память – очень быстрое запоминающее устройство (время выборки из ОЗУ ≈ 60-70 нс; из кэша – 10-20 нс, т.е. в 3-4 раза быстрее) ОП Кэш- память Процессор 12
  • 13. Кэширование Идея • Команды из ОП выбираются и пересылаются в процессор, а их копии помещаются в кэш. • Данные из основной памяти также пересылаются в процессор, а их копии помещаются в кэш. • Если команда или данные понадобятся еще раз, они будут прочитаны не из памяти, а из кэша (например, циклы). • Внутренняя скорость выполнения команд, прочитанных из такого кэша (на одном кристалле с процессором) выше, чем скорость выборки команд и данных из ОП. 13
  • 14. Иерархия памяти Обычно в компьютере имеется два уровня кэш-памяти. • Первичный кэш располагается на микросхеме процесcора, называется кэшем первого уровня (L1) • Вторичный кэш располагается между первичным кэшем и остальной памятью, имеет больший объем и называется кэшем второго уровня (L2). 14
  • 15. Иерархия памяти Увеличение Процессор быстродействия и стоимости хранения одного бита Регистры Первичный кэш (L1) Вторичный кэш (L2) Основная память Увеличение объема Внешняя память 15
  • 16. Иерархия памяти 1. Быстрее всего осуществляется доступ к данным, хранящимся в регистрах процессора (самый маленький объем) 2. Кэш процессора (L1) – небольшой объем 3. Вторичный кэш (L2) – объем больше 4. Основная память (ОП) – значительно больше и намного медленнее кэша (в типичном компьютере время доступа к ОП в 10 раз дольше времени доступа к кэшу L1). 5. Дисковая память – огромный объем недорогой памяти. Очень медленные операции. 16
  • 17. Управление иерархией памяти «Идея управления иерархической системой памяти состоит в том, чтобы переместить команды и данные , которые будут использоваться в ближайшее время, как можно ближе к процессору.» Каждый элемент, к которому обращается процессор помещается в кэш и остается там (локализация по времени). Копируется не только сам элемент программы или данных, но несколько близлежащих (локализация в пространстве). «Когда кэш полон и обращение происходит к отсутствующему слову памяти, принимается решение какой из блоков удалить из кэша, чтобы добавить новый блок, содержащий требуемое слово.»17
  • 18. Intel 80386 Упрощенные модели i386 • Intel 386 SX (поддержка только 16-разр.) • Intel 386 DX (32-разр.) 18
  • 19. Intel 80486 – 1989 год • В состав кристалла микропроцессора входит блок обработки чисел с плавающей запятой (сопроцессор) • На кристалле микропроцессора располагается также внутренняя кэш-память. • Объем кэш-памяти составляет 8 Кбайт (для кэширования и кодов, и данных) • Архитектура = ядро + периферийные блоки • Ядро работает на повышенной частоте • Упрощенная модель - i486 SX • Intel 486 DX 2 – удвоенная частота для ядра • Intel 486 DX 4 – утроенная частота для ядра 19
  • 20. Скалярная архитектура Intel 80486 В микропроцессоре i486 появился важный элемент архитектуры – конвейер. КОНВЕЙЕР – специальное устройство, реализующее такой метод обработки команд внутри микропроцессора, при котором исполнение команды разбивается на несколько этапов. 20
  • 21. Скалярная архитектура Intel 80486 i486 имеет 5-ступенчатый конвейер: 1) выборка команды из кэш-памяти или ОП; 2) декодирование команды; 3) генерация адреса (определение операндов в памяти); 4) выполнение операции с помощью арифметико-логического устройства; 5) запись результата. Таким образом, на конвейере может находиться одновременно пять команд на различной стадии выполнения ⇒ существенно возрастает скорость вычислений. Микропроцессоры, имеющие один конвейер, называются скалярными 21
  • 22. Длительность выполнения команд при последовательной и конвейерной обработке Количество Время команд при последовательной при конвейерной обработке обработке 1 100 150 2 200 240 10 1000 420 100 10000 3120 22
  • 23. Одновременно с Intel 80486 • Более дешевые и высокопроизводительные по сравнению с Intel 486 DX 4 процессоры фирм AMD и Cyrix • AMD – K5 • Am5x86-P75 • Cyrix 5x86 • (на данном этапе чуть обогнали) 23
  • 24. Intel Pentium (586) – 1993 год Суперскалярная архитектура Микропроцессоры, имеющие более одного конвейера, называются суперскалярными. • Pentium - 2 конвейера (+ 1 для вещественных чисел) Усовершенствованный блок вычислений с плавающей точкой В Pentium обычные математические функции вычислений с плавающей точкой (+, *, / ) реализованы аппаратно (целочисленная конвейеризация дополнена 8-тактовыми конвейерными командами вычислений с плавающей точкой). Итого 3 конвейера – 2 для целочисленных операций (5-тактовые), 24
  • 25. Intel Pentium (586) Раздельное кэширование кода и данных Pentium содержит уже 2 блока кэш-памяти: один для кода, один для данных (по 8 Кб) ⇒ увеличивается скорость работы компьютера за счет одновременного быстрого доступа к коду и данным. Расширенная 64-битовая шина данных ⇒ Ускорение работы с памятью (за один такт считывается/записывается сразу несколько 8-байтных команд/данных ) Расширенная 64-битовая шина адреса (объем ОП памяти) 32-разрядная внутренняя архитектура!!! 25
  • 26. Intel Pentium (586) Предсказание правильного адреса перехода Под переходом понимается запланированное алгоритмом изменение последовательного характера выполнения программы. Типичная программа на каждые 6-8 команд содержит 1 команду перехода (условные операторы, операторы цикла, оператор безусловного перехода и т.д.) ⇒ через каждые 6-8 команд необходимо очищать и заполнять заново конвейер ⇒ теряются преимущества конвейеризации. 26
  • 27. Механизм предсказания перехода Вводится специальный буфер адресов перехода, который хранит информацию о последних переходах (для Pentium – о 256 переходах). Для команды, управляющей ветвлением, в буфере запоминаются сама команда, адрес перехода и предположение о том, какая ветвь программы будет выполнена следующей. Блок предсказания адреса перехода прогнозирует решение программы. Он основывается на предположении, что ветвь, которая была пройдена, будет использоваться снова (т.е. прогнозируется переход на начало цикла). Если предсказание верно, переход осуществляется без задержки ⇒ увеличение скорости работы. 27
  • 28. Архитектурные особенности процессоров Pentium • Суперскалярная архитектура • Раздельное кэширование кода и данных • Предсказание правильного адреса перехода • Усовершенствованный блок вычислений с плавающей точкой • Расширенная 64-битовая шина данных и шина адреса 28
  • 29. Pentium Pro – 1995 год • Кэш-память использует собственную шину, независимую от системной = архитектура с двумя независимыми шинами Увеличение пропускной способности каналов передачи данных ⇒ 3 конвейера по 14 ступеней ⇒ 64-разрядная шина данных, 36-разрядная шина адреса ⇒ 16 Кб внутренней кэш-памяти (8+8) ⇒ 256 Кб - кэш второго уровня (в одном модуле с микропроцессором, но на отдельной микросхеме) 29
  • 30. Pentium MMX – 1997 год • Ускорение 2D- и 3D-графики за счет дополнительных регистров и типов данных • + 57 команд команд для эффективной обработки звука, видео, графики. (операции, для которых Pentium требовалось выполнить десятки или сотни команд закодированы одной инструкцией) • !!! Под конкретное ПО – ОС Windows 95. 30
  • 31. Pentium II – 1997 год • Улучшенные технические характеристики (Pentium Pro + средства MMX) • Рост тактовой частоты • Кэш-память L1 – 32 Кб (16+16) • Кэш-память L2 – 32 Кб 31
  • 32. Pentium III – 1999 год • Усовершенствовано ядро процессора • Улучшена работа кэша L2 (объем 256 Кб) • 10-ступенчатый конвейер 32
  • 33. Pentium 4 – 2000 год (7 поколение компьютеров) • По-прежнему, 32-разрядная внутренняя архитектура!!! • Улучшенные характеристики традиционных блоков и технологий • Новые технологии – Данные считываются 4 раза за 1 такт – Гиперконвейерная обработка данных – 20-ступенчатый конвейер (не очень хорошо) – Блок быстрого выполнения команд работает на удвоенной частоте ядра – Кэш-память с отслеживанием выполнения команд – Кэш-память L2 (256 Кб) интегрирована в микросхему. – Кэши l1, L2 соединены и обеспечивается быстрая передача данных между ними 33
  • 34. Процессоры Intel Celeron Упрощенная версия процессоров Pentium II, III и 4 (для дешевых ПК) • уменьшен объем кэша L2 в 2 раза • Уменьшена разрядность шин • Отсутствует ряд расширенных функций 34
  • 35. Процессоры AMD • Более 20 лет конкурентной борьбы с корпорацией Intel • 7 поколение компьютеров в 2000 году представлено AMD K7 (Athlon) Первыми наладили производство процессора 8 поколения – с 64-разрядной внутренней архитектурой!!! Сперва для промышленного применения – AMD Opteron Затем для настольных ПК – AMD64 !!! Требуется новая ОС, новое прикладное ПО Athlon64 – одновременная поддержка и 32- и 64-разрядного ПО 35
  • 36. МНОГОЯДЕРНЫЕ процессоры • Новая эра началась в 2005 году (появилась информация о производстве 9-ядерных процессоров корпорации IBM для игровой приставки Play Station 3) ⇒ AMD и Intel начали производство двухъядерных процессоров 36
  • 37. Многоядерные процессоры Intel • Intel Pentium D • Intel Pentium 4 Extreme Edition – На кристалле формируется 2 стандартных процессора Pentium, – добавляются схемы для синхронизации их работы • (ГРЕЕТСЯ!!!) • Intel Core 2 – Интегрирует 2 ядра вместе – (снижение энергопотребления) 37
  • 38. Семейство Intel Core 2 2006 год • Intel Core 2 Duo • Intel Core 2 Extreme – 4-ядерный – для серверов и игровых ПК 2007 год • Intel Core 2 Quad – для настольных ПК массового спроса «Представленные летом 2006 года х86-процессоры Intel с новой микроархитектурой Сore впервые за последние годы резко опередили процессоры AMD по производительности, обладая при этом более низким энергопотреблением» (Кузьминский) 38
  • 39. Семейство Intel Core 2 Тактовая частота в 2 раза меньше, маленькое тепловыделение. В 2 раза выше производительность по сравнению с Pentium 4. Усовершенствования: • 14-ступенчатый (целочисленный) конвейер ⇒ 4 команды одновременно выполняются за каждый такт • Кэш L2 на кристалле двухядерного процессора – один на 2 ядра «Применение общего кэша позволяет динамически распределять его емкость между ядрами. При этом исчезает необходимость дублировать общие для обоих ядер данные, как это происходит при использовании каждым ядром собственного кэша второго уровня.» (Кузьмицкий) 39
  • 40. Новое в технологии Core Предсказание переходов Кроме традиционных средств предсказания переходов для Pentium 4 (буфер «целей» перехода BTB, калькулятор адресов перехода BAC и стек адресов возврата RAS) в Core имеется еще два предсказателя. 1. Детектор циклов - служит для правильного предсказания выхода из цикла. Обычное предсказание переходов на основе предыстории будет предсказывать очередное выполнение цикла. Чтобы предсказать выход из цикла, специальные счетчики отслеживают число итераций цикла до его завершения и используют эти данные в будущем для предсказания, когда из этого цикла следует выйти. 40
  • 41. Новое в технологии Core Предсказание переходов Кроме традиционных средств предсказания переходов для Pentium 4 (буфер «целей» перехода BTB, калькулятор адресов перехода BAC и стек адресов возврата RAS) в Core имеется еще два предсказателя. 2. Предсказатель косвенных переходов - относится к переходам, адрес которых не кодируется в команде непосредственно, а задается содержимым регистра (такие переходы предсказывать сложнее). Этот предсказатель содержит таблицу, в которую заносятся вероятные адреса косвенных переходов. Когда фронтальная часть процессора обнаруживает косвенный переход и предсказывает, что он произойдет, он запрашивает эту таблицу, выбирая из нее соответствующий целевой адрес перехода 41
  • 42. Процессор Intel® Core™2 Duo • высокая производительность • энергоэкономичность • изготовлены по 45-нанометровой производственной технологии с использованием соединений гафния. • общая кэш-память второго уровня объёмом до 6 МБ • системная шина с частотой до 1333 МГц (для настольных ПК) и до 800 МГц (для портативных ПК) 42
  • 43. Двухъядерный процессор Intel® Core™2 Extreme • «Двухъядерные процессоры Intel Core 2 Extreme обеспечивают энергосбережение и высокую производительность в играх, а также потрясающее качество видео и звука.» [www.intel.ru] 43
  • 44. 4-ядерный процессор Intel® Core™2 Extreme • обеспечивает еще более высокую производительность и пониженное энергопотребление • Процессор Intel Core 2 Extreme QX9650 – частота 3,0 ГГц – 12 МБ общей кэш-памяти второго уровня – системная шина с частотой 1333 МГц 44
  • 45. Четырехъядерный процессор Intel® Core™2 Quad «обеспечивает высочайшую скорость выполнения ресурсоемких задач в многозадачных средах и максимальную производительность многопоточных приложений» • Четыре ядра, • до 12 МБ общей кэш-памяти второго уровня (до 6 МБ на каждые 2 ядра), • системная шина с частотой до 1333 МГц 45
  • 46. Многоядерные процессоры AMD 2006 год AMD Athlon 64 X2 Dual Core (два 64-разрядных процессора на 1 кристалле) • 2 ядра, у каждого свой кэш L2 Ядра сильнее интегрированы, чем у Intel, меньше нагрев процессора 46
  • 47. Прогноз «Многоядерные микропроцессоры предоставляют большую вычислительную мощность посредством параллелизма, предлагают лучшую системную организацию, работают на меньших тактовых частотах» «Основной путь развития микропроцессоров – рост числа ядер в микросхеме» (Кузьминский) 47
  • 48. 2007 год • Был продемонстрирован прототип микропроцессора Intel, имеющего производительность уровня небольших суперкомпьютеров — 1 TFLOPS. • Довольно крупная микросхема прототипа состоит из 80 процессорных ядер на одном кристалле, работающих на частоте 3,1 ГГц. • Подобный процессор позволил бы компьютеру выполнять, например, автоматический перевод с одного языка на другой в реальном времени. 48