SlideShare a Scribd company logo
1 of 28
ARM против Intel:
 мобильная эра
   Крюков Илья
План
•   Введение
•   Терминология
•   ARM
•   Intel
•   Противостояние
ВВЕДЕНИЕ
ARM
•   Год основания: 1990
•   Расположение: Англия
•   Число сотрудников: 1500 (2008)
•   Продукция :
    • IP-блоки (лицензии)
Intel
•   Год основания 1968
•   Расположение: США
•   Число сотрудников: 100000 (2012)
•   Продукция:
    •   x86 процессоры,
    •   Чипсеты,
    •   SSD-накопители,
    •   Сетевое оборудование,
    •   ...
Мобильная эра
Устройства
• Микро-серверы
• Телевизоры
• Ноутбуки
• Ультрабуки
• Планшеты
• Телефоны
Тенденции
• Снижение потребления
   энергии
• Уменьшение габаритов и   Интернет
   веса
• Активное использование
   сетей
ТЕРМИНОЛОГИЯ
Архитектура и микроархитектура
Вычислительный конвейер




•   IF (Instruction Fetch) — получение инструкции,
•   ID (Instruction Decode) — раскодирование инструкции,
•   EX (Execute) — выполнение,
•   MEM (Memory access) — доступ к памяти,
•   WB (Register write back) — запись в регистр.
ARM
Архитектура ARM
• RISC
• 32bit, 64bit*
• Cortex семейство:
    – A – application
    – M – microcontroller
    – R – realtime
•   ISA: ARMV5, ARMV7..
•   Расширения:
•   Thumb1-2, Jazelle, NEON, vFP
•   Условное исполнение
Условное исполнение
Операция выполняется или нет в зависимости от текущих флагов
процессора

С код                              ARM assembler
while (i != j) {                   loop CMP Ri, Rj;
 if (i > j)                        SUBGT Ri, Ri, Rj ;
     i -= j;                       SUBLT Rj, Rj, Ri ;
 else                              BNE loop ;
     j -= i;
}
Thumb1,2
• Особенности
  – 36 инструкций
  – 16 битные
  – Используется лишь половина регистров
  – Меньший объем кода
  – В версии Thumb 2 добавлены 32 инструкции
Jazelle
• Jazelle – технология выполнения java байт
  кода без трансляции
• Jazelle DBX (Dynamic Bytecode eXecution —
  динамическое выполнение байт-кодов)
  поставляется как сопроцессор
• Jazelle RCT (Runtime Compiler Target —
  поддержка динамических компиляторов)
  переводит 1 байт-код в 1 машинную
  инструкцию
Cortex A15
•   32bit
•   ARMv7-A ISA
•   28nm* техпроцесс
•   1,2 - 2,5GHz
•   Улучшенный предсказатель переходов
•   Большее число OOO инструкций
•   NEON инструкции за 1 такт*
•   Поддержка виртуализации
•   Security Extensions
Cortex A15
ARM Cortex A15 vs A9
big.LITTLE
• LITTLE: A53
• Энергоэффективный
• Простой, in-order, 8 стадий



• Big: A57
• Производительный
• Сложный, OOO, много* стадий
big.LITTLE
INTEL
Архитектура х86
•   1978
•   CISC*
•   Обратная совместимость
•   Расширения:
    – MMX, SSE - SSE4.2, AVX, AVX2,…
    – AES
    – x64
    – Intel VT
    – NX
Tick-Tock
Atom
Особенности:
• 32bit
• x86 ISA
• 32nm – 14nm* техпроцесс, 25mm2, ~50 млн транзисторов
• 0,6 – 2,13 GHz
• 32Kb L1 I-cache и D-cache
• 1-2 ядра (2-4 потока - HyperThreading)
• 0.65W - 13W Max TDP

Сферы применения и требования:
• Мобильные устройства, Netbook
     – Потребление энергии важнее, чем производительность
     – Производительность достаточная для серфинга Интернета
•   Совместимость с x86
     – Огромное число программ и ОС
     – «x86 во всем»
Микроархитектура Atom
        Правило BigCore: 1% производительности ~ 2% потреблению энергии
        Правило Atom: 1% производительности ~ 1% потреблению энергии

• Суперскалярная архитектура
• In-order
• Совместимость с x86
     Инструкции произвольной длины
       (CISC)
     2 декодера
• Функциональные модули
     Минимум модулей для снижение
       потребления энергии
     2 целочисленных АЛУ (jmp, shift)
     Нет целочисленных умножений и
       делений
     2 модуля вещественной арифметики
Декодер
  ADD             SIN




    uOP


        uOP
   uOP      uOP
         uOP
SSE
• SSE – Streaming SIMD Extensions
Intel vs ARM
Intel                      ARM
• х86 код является         • Энергопотребление
   стандартом              • Распространение на
• Техпроцесс                 рынке
• Производительность       • Стоимость



                       ?
СПАСИБО ЗА ВНИМАНИЕ!

More Related Content

What's hot

SETCON'18 - Aliaksander Stsepaniuk - Effective CPU
SETCON'18 - Aliaksander Stsepaniuk - Effective CPUSETCON'18 - Aliaksander Stsepaniuk - Effective CPU
SETCON'18 - Aliaksander Stsepaniuk - Effective CPUNadzeya Pus
 
17. Индикация
17. Индикация17. Индикация
17. ИндикацияKamlachPV
 
07. Работа с битами и невыровненными данными
07. Работа с битами и невыровненными данными07. Работа с битами и невыровненными данными
07. Работа с битами и невыровненными даннымиKamlachPV
 
14. SPI STM32
14. SPI  STM3214. SPI  STM32
14. SPI STM32KamlachPV
 
13. I2C STM32
13. I2C STM3213. I2C STM32
13. I2C STM32KamlachPV
 
Аппаратные и программные средства управления
Аппаратные и программные средства управленияАппаратные и программные средства управления
Аппаратные и программные средства управленияMaxim Gubin
 
Аппаратные и программные средства управления
Аппаратные и программные средства управленияАппаратные и программные средства управления
Аппаратные и программные средства управленияMaxim Gubin
 
Лекция 2: Оптимизация ветвлений и циклов (Branch prediction and loops optimiz...
Лекция 2: Оптимизация ветвлений и циклов (Branch prediction and loops optimiz...Лекция 2: Оптимизация ветвлений и циклов (Branch prediction and loops optimiz...
Лекция 2: Оптимизация ветвлений и циклов (Branch prediction and loops optimiz...Mikhail Kurnosov
 
Лекция №9 Организация ЭВМ и систем
Лекция №9 Организация ЭВМ и системЛекция №9 Организация ЭВМ и систем
Лекция №9 Организация ЭВМ и системpianist2317
 
процессоры презентация
процессоры   презентацияпроцессоры   презентация
процессоры презентацияИван Иванов
 
08. АЦП STM32(1)
08.  АЦП STM32(1)08.  АЦП STM32(1)
08. АЦП STM32(1)KamlachPV
 
Павел Курочкин - STeameR
Павел Курочкин - STeameRПавел Курочкин - STeameR
Павел Курочкин - STeameROksana Kurysheva
 
динамическое управление частотой выборки ацп с помощью фапч
динамическое управление частотой выборки ацп с помощью фапчдинамическое управление частотой выборки ацп с помощью фапч
динамическое управление частотой выборки ацп с помощью фапчAndrey Skladchikov
 
06. Память Cortex-M3(4)
06. Память Cortex-M3(4)06. Память Cortex-M3(4)
06. Память Cortex-M3(4)KamlachPV
 
11. ЦАП STM32
11. ЦАП STM3211. ЦАП STM32
11. ЦАП STM32KamlachPV
 
02. Порты ввода вывода микроконтроллеров
02. Порты ввода вывода микроконтроллеров02. Порты ввода вывода микроконтроллеров
02. Порты ввода вывода микроконтроллеровKamlachPV
 
Лекция 2. Оптимизация ветвлений и циклов (Branch prediction and loop optimiz...
Лекция 2. Оптимизация ветвлений и циклов (Branch prediction and loop optimiz...Лекция 2. Оптимизация ветвлений и циклов (Branch prediction and loop optimiz...
Лекция 2. Оптимизация ветвлений и циклов (Branch prediction and loop optimiz...Mikhail Kurnosov
 
12. usart STM32
12. usart STM3212. usart STM32
12. usart STM32KamlachPV
 

What's hot (20)

SETCON'18 - Aliaksander Stsepaniuk - Effective CPU
SETCON'18 - Aliaksander Stsepaniuk - Effective CPUSETCON'18 - Aliaksander Stsepaniuk - Effective CPU
SETCON'18 - Aliaksander Stsepaniuk - Effective CPU
 
17. Индикация
17. Индикация17. Индикация
17. Индикация
 
07. Работа с битами и невыровненными данными
07. Работа с битами и невыровненными данными07. Работа с битами и невыровненными данными
07. Работа с битами и невыровненными данными
 
14. SPI STM32
14. SPI  STM3214. SPI  STM32
14. SPI STM32
 
13. I2C STM32
13. I2C STM3213. I2C STM32
13. I2C STM32
 
Аппаратные и программные средства управления
Аппаратные и программные средства управленияАппаратные и программные средства управления
Аппаратные и программные средства управления
 
Аппаратные и программные средства управления
Аппаратные и программные средства управленияАппаратные и программные средства управления
Аппаратные и программные средства управления
 
Лекция 2: Оптимизация ветвлений и циклов (Branch prediction and loops optimiz...
Лекция 2: Оптимизация ветвлений и циклов (Branch prediction and loops optimiz...Лекция 2: Оптимизация ветвлений и циклов (Branch prediction and loops optimiz...
Лекция 2: Оптимизация ветвлений и циклов (Branch prediction and loops optimiz...
 
Лекция №9 Организация ЭВМ и систем
Лекция №9 Организация ЭВМ и системЛекция №9 Организация ЭВМ и систем
Лекция №9 Организация ЭВМ и систем
 
процессоры презентация
процессоры   презентацияпроцессоры   презентация
процессоры презентация
 
Процессор
ПроцессорПроцессор
Процессор
 
08. АЦП STM32(1)
08.  АЦП STM32(1)08.  АЦП STM32(1)
08. АЦП STM32(1)
 
Павел Курочкин - STeameR
Павел Курочкин - STeameRПавел Курочкин - STeameR
Павел Курочкин - STeameR
 
динамическое управление частотой выборки ацп с помощью фапч
динамическое управление частотой выборки ацп с помощью фапчдинамическое управление частотой выборки ацп с помощью фапч
динамическое управление частотой выборки ацп с помощью фапч
 
06. Память Cortex-M3(4)
06. Память Cortex-M3(4)06. Память Cortex-M3(4)
06. Память Cortex-M3(4)
 
12. spi
12. spi12. spi
12. spi
 
11. ЦАП STM32
11. ЦАП STM3211. ЦАП STM32
11. ЦАП STM32
 
02. Порты ввода вывода микроконтроллеров
02. Порты ввода вывода микроконтроллеров02. Порты ввода вывода микроконтроллеров
02. Порты ввода вывода микроконтроллеров
 
Лекция 2. Оптимизация ветвлений и циклов (Branch prediction and loop optimiz...
Лекция 2. Оптимизация ветвлений и циклов (Branch prediction and loop optimiz...Лекция 2. Оптимизация ветвлений и циклов (Branch prediction and loop optimiz...
Лекция 2. Оптимизация ветвлений и циклов (Branch prediction and loop optimiz...
 
12. usart STM32
12. usart STM3212. usart STM32
12. usart STM32
 

Similar to ARM vs Intel microarchitecture

Обзор современных микроконтроллеров и их архитектур
Обзор современных микроконтроллеров и их архитектурОбзор современных микроконтроллеров и их архитектур
Обзор современных микроконтроллеров и их архитектурIoT Community
 
Лекция 3: Векторизация кода (Code vectorization, SIMD, SSE, AVX)
Лекция 3: Векторизация кода (Code vectorization, SIMD, SSE, AVX)Лекция 3: Векторизация кода (Code vectorization, SIMD, SSE, AVX)
Лекция 3: Векторизация кода (Code vectorization, SIMD, SSE, AVX)Mikhail Kurnosov
 
Константин Трушкин. Использование платформы Эльбрус в информационно-защищённы...
Константин Трушкин. Использование платформы Эльбрус в информационно-защищённы...Константин Трушкин. Использование платформы Эльбрус в информационно-защищённы...
Константин Трушкин. Использование платформы Эльбрус в информационно-защищённы...Kaspersky
 
Лекция 2 Разработка программно-аппаратного обеспечения информационных и автом...
Лекция 2 Разработка программно-аппаратного обеспечения информационных и автом...Лекция 2 Разработка программно-аппаратного обеспечения информационных и автом...
Лекция 2 Разработка программно-аппаратного обеспечения информационных и автом...VThn18
 
Presentation Amd Cpu
Presentation Amd CpuPresentation Amd Cpu
Presentation Amd Cpuandrei145
 
TMPA-2013 Smirnov
TMPA-2013 SmirnovTMPA-2013 Smirnov
TMPA-2013 SmirnovIosif Itkin
 
20100314 virtualization igotti_lecture06
20100314 virtualization igotti_lecture0620100314 virtualization igotti_lecture06
20100314 virtualization igotti_lecture06Computer Science Club
 
Лекция 4. Векторизация кода (Code vectorization: SSE, AVX)
Лекция 4. Векторизация кода (Code vectorization: SSE, AVX)Лекция 4. Векторизация кода (Code vectorization: SSE, AVX)
Лекция 4. Векторизация кода (Code vectorization: SSE, AVX)Mikhail Kurnosov
 
16 процессоры и память эвм лекция
16 процессоры и память эвм лекция16 процессоры и память эвм лекция
16 процессоры и память эвм лекцияSergey Lomakin
 
Эффективное использование x86-совместимых CPU (Алексей Тутубалин)
Эффективное использование x86-совместимых CPU (Алексей Тутубалин)Эффективное использование x86-совместимых CPU (Алексей Тутубалин)
Эффективное использование x86-совместимых CPU (Алексей Тутубалин)Ontico
 
Смарт - Технологии, Взгляд Со Стороны Разработчика
Смарт - Технологии, Взгляд Со Стороны РазработчикаСмарт - Технологии, Взгляд Со Стороны Разработчика
Смарт - Технологии, Взгляд Со Стороны РазработчикаPositive Hack Days
 
Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...
Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...
Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...Ontico
 
Доклад в Mail.ru 01.11.12
Доклад в Mail.ru 01.11.12Доклад в Mail.ru 01.11.12
Доклад в Mail.ru 01.11.12Alex Tutubalin
 
Обзор и новинки продуктовой линейки маршрутизаторов Cisco ASR 1000. Архитекту...
Обзор и новинки продуктовой линейки маршрутизаторов Cisco ASR 1000. Архитекту...Обзор и новинки продуктовой линейки маршрутизаторов Cisco ASR 1000. Архитекту...
Обзор и новинки продуктовой линейки маршрутизаторов Cisco ASR 1000. Архитекту...Cisco Russia
 
Лекция 3. Векторизация кода (Code vectorization: SSE, AVX)
Лекция 3. Векторизация кода (Code vectorization: SSE, AVX)Лекция 3. Векторизация кода (Code vectorization: SSE, AVX)
Лекция 3. Векторизация кода (Code vectorization: SSE, AVX)Mikhail Kurnosov
 
prezlec_Історія.ppt
prezlec_Історія.pptprezlec_Історія.ppt
prezlec_Історія.pptssusere2bc36
 
HighLoad++ 2018 Высоконагруженная распределенная система управления современн...
HighLoad++ 2018 Высоконагруженная распределенная система управления современн...HighLoad++ 2018 Высоконагруженная распределенная система управления современн...
HighLoad++ 2018 Высоконагруженная распределенная система управления современн...Vadim Podolniy
 
Дмитрий Рыжков. Intel Android x86.
Дмитрий Рыжков. Intel Android x86.Дмитрий Рыжков. Intel Android x86.
Дмитрий Рыжков. Intel Android x86.Leonid Bogolubov
 

Similar to ARM vs Intel microarchitecture (20)

Обзор современных микроконтроллеров и их архитектур
Обзор современных микроконтроллеров и их архитектурОбзор современных микроконтроллеров и их архитектур
Обзор современных микроконтроллеров и их архитектур
 
Лекция 3: Векторизация кода (Code vectorization, SIMD, SSE, AVX)
Лекция 3: Векторизация кода (Code vectorization, SIMD, SSE, AVX)Лекция 3: Векторизация кода (Code vectorization, SIMD, SSE, AVX)
Лекция 3: Векторизация кода (Code vectorization, SIMD, SSE, AVX)
 
Константин Трушкин. Использование платформы Эльбрус в информационно-защищённы...
Константин Трушкин. Использование платформы Эльбрус в информационно-защищённы...Константин Трушкин. Использование платформы Эльбрус в информационно-защищённы...
Константин Трушкин. Использование платформы Эльбрус в информационно-защищённы...
 
Лекция 2 Разработка программно-аппаратного обеспечения информационных и автом...
Лекция 2 Разработка программно-аппаратного обеспечения информационных и автом...Лекция 2 Разработка программно-аппаратного обеспечения информационных и автом...
Лекция 2 Разработка программно-аппаратного обеспечения информационных и автом...
 
Presentation Amd Cpu
Presentation Amd CpuPresentation Amd Cpu
Presentation Amd Cpu
 
TMPA-2013 Smirnov
TMPA-2013 SmirnovTMPA-2013 Smirnov
TMPA-2013 Smirnov
 
20100314 virtualization igotti_lecture06
20100314 virtualization igotti_lecture0620100314 virtualization igotti_lecture06
20100314 virtualization igotti_lecture06
 
Лекция 4. Векторизация кода (Code vectorization: SSE, AVX)
Лекция 4. Векторизация кода (Code vectorization: SSE, AVX)Лекция 4. Векторизация кода (Code vectorization: SSE, AVX)
Лекция 4. Векторизация кода (Code vectorization: SSE, AVX)
 
16 процессоры и память эвм лекция
16 процессоры и память эвм лекция16 процессоры и память эвм лекция
16 процессоры и память эвм лекция
 
Эффективное использование x86-совместимых CPU (Алексей Тутубалин)
Эффективное использование x86-совместимых CPU (Алексей Тутубалин)Эффективное использование x86-совместимых CPU (Алексей Тутубалин)
Эффективное использование x86-совместимых CPU (Алексей Тутубалин)
 
Prez osob mikroproc
Prez osob mikroprocPrez osob mikroproc
Prez osob mikroproc
 
Смарт - Технологии, Взгляд Со Стороны Разработчика
Смарт - Технологии, Взгляд Со Стороны РазработчикаСмарт - Технологии, Взгляд Со Стороны Разработчика
Смарт - Технологии, Взгляд Со Стороны Разработчика
 
Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...
Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...
Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...
 
Доклад в Mail.ru 01.11.12
Доклад в Mail.ru 01.11.12Доклад в Mail.ru 01.11.12
Доклад в Mail.ru 01.11.12
 
Обзор и новинки продуктовой линейки маршрутизаторов Cisco ASR 1000. Архитекту...
Обзор и новинки продуктовой линейки маршрутизаторов Cisco ASR 1000. Архитекту...Обзор и новинки продуктовой линейки маршрутизаторов Cisco ASR 1000. Архитекту...
Обзор и новинки продуктовой линейки маршрутизаторов Cisco ASR 1000. Архитекту...
 
Лекция 3. Векторизация кода (Code vectorization: SSE, AVX)
Лекция 3. Векторизация кода (Code vectorization: SSE, AVX)Лекция 3. Векторизация кода (Code vectorization: SSE, AVX)
Лекция 3. Векторизация кода (Code vectorization: SSE, AVX)
 
PC2_Lec7_PP.pptx
PC2_Lec7_PP.pptxPC2_Lec7_PP.pptx
PC2_Lec7_PP.pptx
 
prezlec_Історія.ppt
prezlec_Історія.pptprezlec_Історія.ppt
prezlec_Історія.ppt
 
HighLoad++ 2018 Высоконагруженная распределенная система управления современн...
HighLoad++ 2018 Высоконагруженная распределенная система управления современн...HighLoad++ 2018 Высоконагруженная распределенная система управления современн...
HighLoad++ 2018 Высоконагруженная распределенная система управления современн...
 
Дмитрий Рыжков. Intel Android x86.
Дмитрий Рыжков. Intel Android x86.Дмитрий Рыжков. Intel Android x86.
Дмитрий Рыжков. Intel Android x86.
 

ARM vs Intel microarchitecture

  • 1. ARM против Intel: мобильная эра Крюков Илья
  • 2. План • Введение • Терминология • ARM • Intel • Противостояние
  • 4. ARM • Год основания: 1990 • Расположение: Англия • Число сотрудников: 1500 (2008) • Продукция : • IP-блоки (лицензии)
  • 5. Intel • Год основания 1968 • Расположение: США • Число сотрудников: 100000 (2012) • Продукция: • x86 процессоры, • Чипсеты, • SSD-накопители, • Сетевое оборудование, • ...
  • 6. Мобильная эра Устройства • Микро-серверы • Телевизоры • Ноутбуки • Ультрабуки • Планшеты • Телефоны Тенденции • Снижение потребления энергии • Уменьшение габаритов и Интернет веса • Активное использование сетей
  • 9. Вычислительный конвейер • IF (Instruction Fetch) — получение инструкции, • ID (Instruction Decode) — раскодирование инструкции, • EX (Execute) — выполнение, • MEM (Memory access) — доступ к памяти, • WB (Register write back) — запись в регистр.
  • 10. ARM
  • 11. Архитектура ARM • RISC • 32bit, 64bit* • Cortex семейство: – A – application – M – microcontroller – R – realtime • ISA: ARMV5, ARMV7.. • Расширения: • Thumb1-2, Jazelle, NEON, vFP • Условное исполнение
  • 12. Условное исполнение Операция выполняется или нет в зависимости от текущих флагов процессора С код ARM assembler while (i != j) { loop CMP Ri, Rj; if (i > j) SUBGT Ri, Ri, Rj ; i -= j; SUBLT Rj, Rj, Ri ; else BNE loop ; j -= i; }
  • 13. Thumb1,2 • Особенности – 36 инструкций – 16 битные – Используется лишь половина регистров – Меньший объем кода – В версии Thumb 2 добавлены 32 инструкции
  • 14. Jazelle • Jazelle – технология выполнения java байт кода без трансляции • Jazelle DBX (Dynamic Bytecode eXecution — динамическое выполнение байт-кодов) поставляется как сопроцессор • Jazelle RCT (Runtime Compiler Target — поддержка динамических компиляторов) переводит 1 байт-код в 1 машинную инструкцию
  • 15. Cortex A15 • 32bit • ARMv7-A ISA • 28nm* техпроцесс • 1,2 - 2,5GHz • Улучшенный предсказатель переходов • Большее число OOO инструкций • NEON инструкции за 1 такт* • Поддержка виртуализации • Security Extensions
  • 17. ARM Cortex A15 vs A9
  • 18. big.LITTLE • LITTLE: A53 • Энергоэффективный • Простой, in-order, 8 стадий • Big: A57 • Производительный • Сложный, OOO, много* стадий
  • 20. INTEL
  • 21. Архитектура х86 • 1978 • CISC* • Обратная совместимость • Расширения: – MMX, SSE - SSE4.2, AVX, AVX2,… – AES – x64 – Intel VT – NX
  • 23. Atom Особенности: • 32bit • x86 ISA • 32nm – 14nm* техпроцесс, 25mm2, ~50 млн транзисторов • 0,6 – 2,13 GHz • 32Kb L1 I-cache и D-cache • 1-2 ядра (2-4 потока - HyperThreading) • 0.65W - 13W Max TDP Сферы применения и требования: • Мобильные устройства, Netbook – Потребление энергии важнее, чем производительность – Производительность достаточная для серфинга Интернета • Совместимость с x86 – Огромное число программ и ОС – «x86 во всем»
  • 24. Микроархитектура Atom Правило BigCore: 1% производительности ~ 2% потреблению энергии Правило Atom: 1% производительности ~ 1% потреблению энергии • Суперскалярная архитектура • In-order • Совместимость с x86  Инструкции произвольной длины (CISC)  2 декодера • Функциональные модули  Минимум модулей для снижение потребления энергии  2 целочисленных АЛУ (jmp, shift)  Нет целочисленных умножений и делений  2 модуля вещественной арифметики
  • 25. Декодер ADD SIN uOP uOP uOP uOP uOP
  • 26. SSE • SSE – Streaming SIMD Extensions
  • 27. Intel vs ARM Intel ARM • х86 код является • Энергопотребление стандартом • Распространение на • Техпроцесс рынке • Производительность • Стоимость ?

Editor's Notes

  1. Чтение инструкции и её декодированиеПоиск всех связанных данных, необходимых для обработки инструкцииОбработка инструкцииДоступ в память (2 тактовая инструкция)Запись результатов
  2. 32 битные инструкции: ветвления и условного выполнения
  3. Состаяние процессора переключается спец битом (24й)ARM CPSR (Current Program Status Register). The 'T'-bit must be cleared and the 'J'-bit set.
  4. Первый арм проц с поддержкой виртуализации
  5. The introduction of Large Physical Address Extensions (LPAE) enables the processor to access up to 1TB of memoryPerformance and power optimized L1 caches combine minimal access latency techniques to maximize performance and minimize power consumption. Caches are 32KB for instruction and 32KB for data. Also providing the option for cache coherence for enhanced inter-processor communication or support of rich SMP capable OS for simplified multicore software developmenCoreLink CCN-504 extends the capabilities of your SoC. Up to 16 cores on the same silicon die are possible with this fully-coherent, high-performance many-core solution. With up to 1TB/s of system bandwidth, and support for large L3 caches, SoC designers can address the needs of networking, server, and other enterprise-class devices.
  6. Pipeline depth:A15 15A9 8
  7. A53 – 64bit A7A57 – 64bit A15
  8. In-order processor
  9. Стратегия, поддержание закона Мура
  10. Front-end:32KB, 8-way set associative, first-level instruction cache,Branch prediction units and ITLB,Two instruction decoders, each can decode up to one instruction per cycle.JEU – jump execution unitAGU - Address Generation UnitTLB – Translation Lookup Buffer (Для перевода виртуальных адресов в физические.Физические адреса затем используются для обращения в кэш данных)PMH - Page Miss Handler (Virtual->Physical Translation)BIU — Bus Interface Unit контроллеры шины и L2;The memory execution sub-system (MEU) can support 48-bit linear address for Intel64 Architecture, either 32-bit or 36-bit physical addressing modes. The MEUprovides:• 24KB first level data cache,• Hardware prefetching for L1 data cache,• Two levels of DTLB for 4KByte and larger paging structure.• Hardware pagewalker to service DTLB and ITLB misses.• Two address generation units (port 0 supports loads and stores, port 1 supportsLEA and stack operations)• Store-forwarding support for integer operations• 8 write combining buffers.The bus logic sub-system provides• 512KB, 8-way set associative, unified L2 cache,• Hardware prefetching for L2 and interface logic to the front side bus.
  11. Большинство инструкций переводятся в 1 мюопс5% инструкций требуют разбивки на мюопсыРазбивка на мюопсы не дает особых преимуществ на in order